FUZZY C-MEANS
TESIS
Oleh
EDRIAN HADINATA 127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA MEDAN
FUZZY C-MEANS
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika
EDRIAN HADINATA 127038076
PROGRAM MAGISTER S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA MEDAN
PERSETUJUAN
Judul : PENGEMBANGAN ALGORITMA PENENTUAN
TITIK AWAL DALAM METODE CLUSTERING ALGORITMA FUZZY C-MEANS
Kategori : Tesis
Nama : Edrian Hadinata
Nomor Induk Mahasiwa : 127038076
Program Studi : Magister S2 Teknik Informatika
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA UTARA
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. Zakarias Situmorang Prof. Dr. Herman Mawengkang
Diketahui/disetujui oleh
Program Studi Magister Teknik Informatika Ketua,
PERNYATAAN
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL
DALAM METODE CLUSTERING ALGORITMA
FUZZY C-MEANS
T E S I S
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 15 Mei 2015
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di
bawah ini:
Nama : Edrian Hadinata
NIM : 127038076
Program Studi : Magister S2 Teknik Informatika
Jenis Karya Ilmiah : Tesis
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
Free Right) atas tesis saya yang berjudul:
PENGEMBANGAN ALGORITMA PENENTUAN TITIK AWAL DALAM METODE CLUSTERING ALGORITMA FUZZY C-MEANS
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 15 Mei 2015
Telah diuji pada
Tanggal: 15 Mei 2015
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Herman Mawengkang
Anggota : 1. Dr. Zakarias Situmorang
2. Prof. Dr. Saib Suwilo, M.Sc
3. Rahmat W. Sembiring, M.Sc.IT, Ph.D
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar : Edrian Hadinata, S.Kom.
Tempat dan Tanggal Lahir : Sei Semayang, 3 Mei 1983
Alamat Rumah : Jl. Binjai Km. 15 Diski Gg. Jambu No. 135
Telepon/HP : 081265536325
e-mail : edrianhadinata@gmail.com
Instansi Tempat Bekerja : Sekolah Tinggi Teknologi Harapan Medan
Alamat Kantor : Jl. H.M. Joni Medan
Telepon : 061-4515661
DATA PENDIDIKAN
SD : SD Tamansiswa Diski Tamat : 1995
SLTP : SMP Taman Siswa Diski Tamat : 1998
SMK : SMK Swasta Immanuel Medan Tamat : 2001
Diploma 3 : Statistik FMIPA USU Tamat : 2005
Strata-1 : Ilmu Komputer USU Tamat : 2011
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kepada Allah SWT atas segala
limpahan rahmat dan karunia-Nya sehingga tesis ini dapat diselesaikan. Juga tak lupa
kami kirimkan shalawat beserta salam kepada junjungan kami Rasulullah Muhammad
SAW yang telah membawa cahaya kebenaran dalam hidup di dunia ini.
Dengan selesainya tesis ini, perkenankanlah kami mengucapkan terima kasih
kepada: Pejabat Rektor Universitas Sumatera Utara Prof. Subhilhar, Ph.D atas
kesempatan yang diberikan kepada kami untuk mengikuti dan menyelesaikan
pendidikan Program Magister.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi dan juga Ketua
Program Studi Magister Teknik Informatika FASILKOM-TI Universitas Sumatera
Utara, Prof. Dr. Muhammad Zarlis, M.Sc, Sekretaris Program Studi Magister Teknik
Informatika FASILKOM-TI Universitas Sumatera Utara M. Andri Budiman, S.T.,
M.Comp.Sc, MEM beserta seluruh staf pengajar dan pegawai pada Program Studi
Magister Teknik Informatika FASILKOM-TI Universitas Sumatera Utara. Terima
kasih tak terhingga dan penghargaan yang setingi-tingginya kami ucapkan kepada
Prof. Dr. Herman Mawengkang, selaku Pembimbing Utama yang dengan penuh
perhatian dan telah memberikan dorongan,bimbingan dan juga arahan, demikian juga
kepada Dr. Zakarias Situmorang selaku Pembimbing Anggota yang dengan penuh
kesabaran menuntun dan membimbing kami hingga selesainya penelitian ini.
Kepada ayahanda Alm Edi Siswanto dan ibunda Alm Suarni serta Kakek dan
Nenek, bapak mertua M. Rusdan Sadar dan mamak beserta seluruh keluargaku terima
kasih atas segala pengorbanan kalian baik berupa moril maupun materil, budi baik ini
tidak bisa dibalas hanya diserahkan kepada Allah SWT.
Untuk Maitri Rahmadhani, SS,M.Hum istriku yang ku cintai, terima kasih atas
segala dukungan dan motivasi yang sudah tercurah selama ini, tanpa mu tak kan kuat
Terima kasih juga kami sampaikan kepada Ketua STT Harapan Medan yang
telah memberikan ijin kepada kami untuk melanjutkan studi, serta teman-teman dosen
di STT Harapan yang banyak mendukung dan memberikan dorongan mulai dari
kuliah awal sampai selesainya studi ini, hal yang sama juga saya ucapkan kepada
seluruh teman-teman mahasiswa di Program Studi Magister Teknik Informatika
FASILKOM-TI USU atas kerja samanya selama ini.
Medan, 15 Mei 2015
Edrian Hadinata
ABSTRAK
Penentuan titik awal dalam algoritma fuzzy c-means (FCM) diambil dengan cara
random. Hal ini dapat menghasilkan perulangan yang berhingga. Untuk itu
dikembangkan algoritma penentuan titik awal dengan pendekatan hierarchical
agglomerative clustering sebagai pengganti proses randomisasi derajat keanggotaan
pada iterasi awal. Diharapkan nantinya proses clustering menghasilkan iterasi yang
lebih sedikit. Nilai-nilai yang dihasilkan pada algoritma ini merupakan penggabungan
sejumlah pusat cluster dari variabel-variabel berdasarkan perhitungan pendekatan
yang terdapat pada complete linkage. Kemudian menghitung selisih fungsi objektif
disetiap iterasi setelah dilakukan proses clustering pada FCM. Proses iterasi berhenti
setelah selisih fungsi objektif lebih kecil dari batas yang ditentukan.
THE EXPANSION OF STARTING POINT ALGORITHM ON
CLUSTERING METHOD WITH FUZZY C-MEANS
ALGORITHM
ABSTRACT
Determining the starting point from fuzzy c-means(FCM) produced by random values.
The algorithm would produce limited looping. Therefore the expansion of starting
point algorithm approach by hierarchical agglomerative clustering as alternate step
from random process of membership degree in early iteration. Clustering process that
expected produce fewer iteration. Values that produce by this algorithm is merging of
cluster center from all variables based of complete linkage algorithm. Then calculate
the difference of objective function in the each iteration. Iteration process stopped
after the differences objective function is smaller than prescribed limit.
DAFTAR ISI
Halaman
PERSETUJUAN ... ii
PERNYATAAN ... iii
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPERLUAN AKADEMIS ... iv
DAFTAR GAMBAR ... xiii
DAFTAR TABEL ... xv
2.2 Clustering Dengan Pendekatan Partisi ... 4
2.2.1 K-Means ... 4
2.2.2 Mixture Modelling (Mixture Modeling) ... 5
2.3 Clustering dengan Pendekatan Hirarki ... 6
2.3.1 Agglomerative Clustering ... 6
2.3.2 Divisive Clustering ... 11
2.4 Clustering Dengan Pendekatan Automatic Mapping... 11
2.4.1 Self-Organising Map (SOM) ... 11
2.5.1 Fuzzy Clustering Means (Fuzzy C-Means) ... 13
2.5.2 Langkah Algoritma Fuzzy Clustering Means (FCM) ... 14
2.6 Cluster Analysis ... 18
BAB 3 METODOLOGI PENELITIAN ... 19
3.1 Pendahuluan ... 19
3.2 Diagram Kerja Tahapan Penelitian ... 22
3.3 Penentuan Titik Awal ... 25
3.3.1 Penentuan Titik Awal Pusat Cluster Menggunakan Metode Hierarki Clustering Agglomeratif Complete Linkage ... 25
3.3.2 Pengembangan Algoritma ... 26
3.3.3 Uji Akurasi ... 26
3.4 Data Set Uji Coba ... 27
BAB 4 HASIL DAN PEMBAHASAN ... 29
4.1 Pendahuluan ... 29
4.2 Kinerja Fuzzy C-Means ... 29
4.3 Pengujian untuk Fuzzy C-Means ... 30
4.4 Pendekatan Complete Linkage Dalam Pencarian Pusat Cluster ... 36
4.5 Inisialisasi titik awal Fuzzy C-Means ... 49
4.6 Pembuatan Algoritma ... 52
4.7 Pengujian Keakuratan ... 53
4.8 Hasil Akhir Analisis ... 57
BAB 5 KESIMPULAN DAN SARAN ... 58
5.1 Kesimpulan ... 58
5.2 Saran ... 58
DAFTAR GAMBAR
Halaman
Gambar 2.1 Flowchart Fuzzy C-Means ... 8
Gambar 2.2 Grafik Fluktuasi Nilai Fungsi Objektif ... 8
Gambar 2.3 Flowchart algoritma Agglomerative Clustering Complete Linkage. ... 9
Gambar 2.4 Perbandingan pencarian pusat cluster, kiri Complete Linkage dan kanan Persamaan (2.3). ... 10
Gambar 2.5 Flowchart Fuzzy C-Means ... 17
Gambar 3.1 Grafik Fluktuasi Nilai Fungsi Objektif ... 19
Gambar 3.2 Grafik Selisih Fungsi Objektif Ke-22 ... 21
Gambar 3.3 Perbandingan Grafik Sebaran pada Fuzzy C-Means 5 Cluster pada setiap iterasi ... 22
Gambar 3.4 Diagram alir Metodologi Penelitian ... 24
Gambar 3.5 Perbandingan Perbedaan Pusat Cluster iterasi ke-1 dan ke-5 ... 25
Gambar 4.1 Grafik selisih fungsi objektif hingga t=11 ... 33
Gambar 4.2 Grafik sebaran pada iterasi ke-11, untuk jumlah data sebanyak 4716 baris dan 250 kolom... 34
Gambar 4.3 Grafik Sebaran data 0x ... 38
Gambar 4.4 Sebaran data dengan 3 cluster kolom 0x. ... 42
Gambar 4.5 Dendogram Hierarchical Clustering dengan menggunakan Complete Linkage kolom 0x ... 43
Gambar 4.7 Dendogram Hierarchical Clustering dengan menggunakan Complete
Linkage kolom 2x ... 45
Gambar 4.8 Dendogram Hierarchical Clustering dengan menggunakan Complete Linkage kolom 3x ... 46
Gambar 4.9 Titik pusat kolom 0x ... 47
Gambar 4.10 Titik pusat kolom 1x ... 48
Gambar 4.11 Titik pusat kolom 2x ... 48
Gambar 4.12 Titik pusat kolom 3x ... 48
Gambar 4.13 Grafik Fungsi Objektif hingga t=5 ... 51
DAFTAR TABEL
Halaman
Tabel 3.1 Nilai Fungsi Objektif dan Selisih |P[t]-P[t-1]| ... 20
Table 3.2 Daftar Atribut Rekaman Microsoft Kinect Sensor ... 28
Tabel 4.1 Data Affirmative ... 30
Tabel 4.2 Data u random dengan jumlah cluster c = 3 ... 31
Tabel 4.3 Data pusat cluster Vjk ... 31
Tabel 4.4 Selisih fungsi objektif ... 32
Tabel 4.5 Pusat cluster Vik untuk t=11 ... 33
Tabel 4.6 Perhitungan Pusat Cluster dan Fungsi Objektif dimana t=1 ... 35
Tabel 4.7 Perhitungan jarak Xi dengan Xj ... 37
Tabel 4.8 Level 1 Pencarian pusat klaster menggunakan complete linkage ... 41
Tabel 4.9 Level 5 Pencarian pusat klaster... 41
Tabel 4.10 Top Level algoritma Complete Linkage kolom 0x ... 42
Tabel 4.11 Pusat cluster ... 47
Tabel 4.12 Perhitungan jarak pusat cluster dengan data observasi ... 50
Tabel 4.13 Fungsi Objektif pada iterasi 5 ... 50
Tabel 4.14 Selisih Fungsi Objektif ... 51
Tabel 4.15 Tabel Cluster ... 54
Tabel 4.16 Proses perhitungan grand total dan rata-rata setiap kelompok ... 55
Tabel 4.17 Perhitungan harga awal untuk analisis variansi ... 55
Tabel 4.18 Perbandingan Between Group dan Within Group dengan titik awal ... 57