viii ABSTRAK
Pengelompokan dokumen berdasarkan karakteristik kata yang ada pada dokumen dilakukan untuk memudahkan mengorganisir dokumen pada kebutuhan lebih lanjut. Algoritma K-Means clustering merupakan salah satu algoritma pengelompokan yang melakukan pengelompokan secara iteratif dengan melakukan partisi set data ke dalam sejumlah K cluster. Namun hasil pada K-Means clustering tersebut sangat ditentukan pada penentuan pusat cluster awal yang pada umumnya ditentukan secara random. Pada penelitian ini dilakukan penentuan pusat cluster awal K-Means untuk masalah pengelompokan dokumen dengan memanfaatkan algoritma genetika sebagai algoritma yang mengoptimasi pusat cluster awal K-Means tersebut. Pada hasil pengujian pengelompokan dokumen berita yang dilakukan sebanyak 5 kali untuk pusat cluster awal secara random tingkat keberhasilan mencapai 26.66 % sedangkan untuk pusat cluster awal dengan algoritma genetika tingkat keberhasilan mencapai 46.66 %.
Kata Kunci : Pengelompokan, K-Means Clustering, Pusat Cluster Awal, Algoritma Genetika, Optimasi, Dokumen
ix
OPTIMIZATION OF INITIAL CLUSTER CENTER K-MEANS WITH
GENETIC ALGORITHM IN DOCUMENTS CLUSTERING
ABSTRACT
Clustering a data set of documents based on certain data points in documents are an easy way to organize document for extension to work. K-Means clustering algorithm is one of iterative cluster algorithm to partition a set of entities into K cluster. Unfortunately, resulting in K Means cluster is depending on the initial cluster center that generally assigned randomly. In this reserach, determining initial cluster center K-Means for documents clustering are investigated by using genetic algorithm as an algorithm which optimize initial cluster center of K-Means. Based on the result of this test, clustering news document with 5 times for initial cluster center randomly has 26.66% for level of success, meanwhile for initial cluster center by using genetic algorithm has 46.66% for level of success.
Keyword : Clustering, K-Means Clustering, Initial Cluster Center, Genetic Algorithm, Optimization, Document