i
PENGELOMPOKAN PEMAKAI ALAT KONTRASEPSI MENGGUNAKAN METODE FUZZY C-MEANS CLUSTERING ( Studi Kasus : Desa Pong Welak, Desa Robo, Desa Racang dan Desa Rehak )
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer
Program Studi Informatika
Oleh :
Nicodemus Septinos Pati 165314061
PROGRAM STUDI INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKATA
2021
ii
GROUPING CONTRACEPTION TOOLS USERS USING THE FUZZY C-MEANS CLUSTERING METHOD
(Case Study: Pong Welak Village, Robo Village, Racang Village and Rehak Village)
THESIS
Presented as Partial Fullfillment of the Requirements To Obtain Sarjana Komputer Degree
in Informatics Study Program
Created By :
Nicodemus Septinos Pati 165314061
INFORMATICS STUDY PROGRAM INFORMATICS DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY
YOGYAKARTA 2021
vii
ABSTRAK
Program pemerintah untuk membentuk keluarga yang sejahtera dengan membatasi jumlah kelahiran anak yaitu program KB (keluarga berencana). Program keluarga berencana dirancang untuk meyeimbangkan antara kebutuhan dan jumlah penduduk yang ada dengan memakai alat kontasepsi. Namun program keluarga berencana yang telah dirancang oleh pemerintah ada beberapa masalah yaitu para akseptor cenderung lebih memilih alat kontasepsi tersebut dengan dasar coba-coba ataupun mendengar masukkan dari orang lain yang disebabkan oleh kekurangan pemahamannya mereka terhadap alat kontasepsi serta kekurangannya biaya.
Penelitian ini bermaksud mencoba untuk membantu BKKBN dalam memberikan informasi kepada pemakai tentang pemilihan alat kontrasepsi yang sesuai berdasarkan umur,jumlah anak, pendidikan,pekerjaan, jenis alat kontasepsi dengan menggunakan algoritma Fuzzy C-Means Clustering. Data yang dipakai dalam penelitian adalah data pemakai alat kontasepsi dari 4 desa di Kabupaten Manggarai Barat dengan jumlah data yang didapat sekitar 724 data. Akurasi dari penelitian ini diukur menggunakan Silhouette Index.
Hasil dari penelitian ini berupa sistem yang mampu menghasilkan pengelompokan / clustering data pemakai alat kontrasepsi serta keakuratan dari data di setiap cluster/kelompok tersebut.
Kata kunci : Fuzzy C- Means Clustering, Silhouette Index, Cluster, KB.
viii
ABSTRACT
The government program to form a prosperous family by limiting the number of child births is the family planning program. The family planning program is designed to balance the needs and the existing population using contraceptives. However, the family planning program that has been designed by the government has a number of problems, namely acceptors tend to prefer contraceptives based on trial and error or hearing input from other people due to their lack of understanding of contraceptives and lack of costs.
This study intends to try to assist BKKBN in providing information to users about the selection of appropriate contraceptives based on age, number of children, education, occupation, type of contraception using the Fuzzy C-Means Clustering algorithm. The data used in the study were data on contraceptive users from 4 villages in West Manggarai Regency with the amount of data obtained around 724 data. The accuracy of this research is measured using the Silhouette Index.
The result of this research is a system capable of clustering data on contraceptive users and the accuracy of the data in each of these clusters.
Keywords: Fuzzy C- Means Clustering, Silhouette Index, luster, KB.
xi
DAFTAR ISI
HALAMAN JUDUL ………...i
HALAMAN JUDUL (BAHASA INGGRIS)………ii
HALAMAN PERSETUJUAN……….iii
HALAMAN PENGESAHAN………..iv
HALAMAN KEASLIAN KARYA………..v
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS……….vi
ABSTRAK ... vvii
ABSTRACK………...viii
KATA PENGANTAR………..ix
DAFTAR ISI ... xi
DAFTAR GAMBAR ... xixiv
DAFTAR TABEL ... xxv
DAFTAR RUMUS ... xvii
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 2
1.3 Tujuan Penelitian ... 2
1.4 Batasan Masalah ... 2
1.5 Manfaat Penelitian ... 3
1.6 Sistematika Penulisan ... 3
BAB II LANDASAN TEORI ... 4
2.1 Data Mining ... 4
2.2 Alat Kontrasepsi ... 5
2.3 Clustering ... 7
2.4 Fuzzy C-Means (FCM) ... 7
2.5 Silhouette Index ... 10
BAB III METODOLOGI PENELITIAN………13
xii
3.1 Data………13
3.2 Tahapan Penelitian……….13
3.2.1 Data Selection……….13
3.2.2 Transformasi Data………...14
3.3 Pengolahan Data………...17
3.3.1 Input Data………17
3.3.2 Menentukan Nilai Awal Perhitungan………..19
3.3.3 Bangkitkan Nilai Random………...19
3.3.4 Menghitung Pusat Cluster………...20
3.3.5 Menghitung Nilai Fungsi Objektif………..23
3.3.6 Menghitung Perubahan Matriks Partisi U………...24
3.3.7 Mengecek Kondisi Berhenti ... 25
3.3.8 Silhouette Index... 27
3.4 Spesifikasi Alat ... 30
3.5 Desain User Interface ... 31
BAB IV ANALISIS DAN HASIL ... 32
4.1.1 Implementasi Hasil ... 32
4.1.1.1 Halaman Utama ... 32
4.1.1.2 Bagian Data... 33
4.1.1.3 Bagian Fuzzy C-Means Clustering ... 34
4.1.2 Implementasi Program... 36
4.1.2.1 Implementasi Function Tampilkan Data... 36
4.1.2.2 Implementasi Function Fuzzy C-Means Clustering... 36
4.1.2.3 Implementasi Silhouette Index ... 47
4.2 Analisis Hasil ... 54
4.2.1 Pengujian Algoritma FCM dan Hasil Silhouette Index pada Sistem ... 55
4.2.2 Pengujian Hasil Akurasi Menggunakan 5 Atribut dan 8 Atribut... 62
4.2.3 Pengujian Perubahan jumlah cluster dan pangkat terhadap akurasi ... 65
BAB V KESIMPULAN DAN SARAN ... 79
xiii
5.1 Kesimpulan ... 79 5.2 Saran ... 79 DAFTAR PUSTAKA ... 80
xiv
DAFTAR GAMBAR
Gambar 3. 1 Tahapan Penelitian ... 12
Gambar 3. 2 User Interface ... 30
Gambar 4. 1 Halaman Utama ... 32
Gambar 4. 2 Bagian Data ... 33
Gambar 4. 3 Hasil Inputan Data ... 33
Gambar 4. 4 Bagian Fuzzy C-Means Clustering ... 34
Gambar 4. 5 Penyimpanan Hasil Cluster ... 35
Gambar 4. 6 Penyimpanan Hasil Silhouette Index ... 35
Gambar 4. 7 Pengujian Program Algoritma FCM ... 55
Gambar 4. 8 Hasil Pengecekan Atribut Menggunakan Weka ... 62
Gambar 4. 9 Grafik error = 0.01 dan maksimal iterasi = 10………...74
Gambar 4.10 Grafik error = 0.0001 dan maksimal iterasi = 10………..74
Gambar 4.11 Grafik error = 0.01 dan maksimal iterasi = 20………..75
Gambar 4.12 Grafik error = 0.0001 dan maksimal iterasi = 20………..75
Gambar 4.13 Grafik error = 0.01 dan maksimal iterasi = 50………..76
Gambar 4.14 Grafik error = 0.0001 dan maksimal iterasi = 50………..76
Gambar 4.15 Grafik error = 0.01 dan maksimal iterasi = 100………77
Gambar 4.16 Grafik error = 0.0001 dan maksimal iterasi = 100………77
xv
DAFTAR TABEL
Tabel 3.1 Atribut yang dipakai ... 13
Tabel 3.2 Data Jenis Alat Kontasepsi ... 15
Tabel 3.3 Data Pendidikan Istri... 15
Tabel 3.4 Data Pekerjaan Isri ... 16
Tabel 3. 5 Data Umur Anak Terakhir ... 16
Tabel 3.6 Data Pendidikan Suami ... 16
Tabel 3.7 Data Pekerjaan Suami ... 17
Tabel 3.8 Input Data ... 17
Tabel 3.9 Nilai Awal Perhitungan... 18
Tabel 3.10 Nilai Random ... 19
Tabel 3.11 Miu Kuadrat ... 20
Tabel 3.12 Miu Kuadrat X1 ... 21
Tabel 3.13 Miu Kuadrat X2……….21
Tabel 3.14 Miu Kuadrat X3……….22
Tabel 3.15 Miu Kuadrat X4……….22
Tabel 3.16 Pusat Klaster ... 23
Tabel 3.17 X_V ... 23
Tabel 3.18 L dan Total ... 24
Tabel 3.19 Fungsi Objektif ... 24
Tabel 3.20 Matriks Partisi U dan Totalnya ... 25
Tabel 3.21 Hasil Error...………. 25
Tabel 3.22 Hasil Perhitungan ... 26
Tabel 3.23 Hasil Cluster………...26
Tabel 3.24 Inisial………..27
Tabel 3.25 Mencari Nilai 𝑎𝑖 ………...28
Tabel 3.26 Mencari Nilai 𝑏𝑖 ……….. ………28
Tabel 3.23 Hasil Perhitungan Silhouette Index………29
xvi
Tabel 4. 1 Hasil Cluster 1 ... 56
Tabel 4. 2 Hasil Cluster 2 ... 57
Tabel 4. 3 Hasil Cluster 3 ... 57
Tabel 4. 4 Hasil Cluster 4 ... 58
Tabel 4. 5 Hasil Cluster 1 Perbaikan Atribut ... 59
Tabel 4. 6 Hasil Cluster 2 Perbaikan Atribut ... 60
Tabel 4. 7 Hasil Cluster 3 Perbaikan Atribut ... 61
Tabel 4. 8 Hasil Cluster 4 Perbaikan Atribut ... 61
Tabel 4. 9 Pengujian Akurasi Menggunakan 5 Atribut... 63
Tabel 4. 10 Pengujian Akurasi Dengan Menggunakan 8 Atribut ... 64
Tabel 4. 11 Uji pengujian perubahan jumlah cluster dan pangka terhadap akurasi dengan error = 0.01 dan maksimal iterasi = 10……….65
Tabel 4.12 Uji pengujian perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.0001 dan maksimal iterasi = 10………67
Tabel 4.13 Uji pengujian perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.01 dan maksimal iterasi = 20………..68
Tabel 4.14 Uji Pengujian Perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.0001 dan maksimal iterasi = 20………...69
Tabel 4.15 Uji pengujian perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.01 dan maksimal iterasi = 50………...70
Tabel 4.16 Uji pengujian perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.0001 dan maksimal iterasi = 50………..…………71
Tabel 4. 17 Uji pengujian perubahan jumlah cluster dan pangkat terhadap akurasi dengan error = 0.01 dan maksimal iterasi = 100………...72
Tabel 4.18 Uji Pengujian Perubahan jumlah cluster dan pangkat terhadap akutasi dengan Error = 0.0001 dan maksimal iterasi = 100………...73
xvii
DAFTAR RUMUS
Rumus 2.1 Bangkitkan nilai random ………...8
Rumus 2.3 Pusat Cluster ………......9
Rumus 2.4 Fungsi Objektif ………..9
Rumus 2.5 Perubuhan Matriks Partisi U ……….10
Rumus 2.6 Rumus Menghitung 𝑎𝑖 ………..11
Rumus 2.7 Rumus Menghitung 𝑏𝑖……….11
Rumus 2. 8 Rumus Silhouette Index………11
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Keluarga Berencana ( KB ) adalah program pemerintah untuk membentuk keluarga yang sejahtera dengan membatasi jumlah kelahiran anak. Adanya kebijakan dari pemerintah tersebut didukung dengan terbentuknya Badan Koordinasi Keluarga Berencana Nasional (BKKBN) berdasarkan Keppres No.8 Tahun 1970. Program Keluarga Berencana dirancang oleh pemerintah untuk menyeimbangkan antara kebutuhan dan jumlah penduduk yang ada dengan memakai alat kontrasepsi.
Namun program KB ini belum sepenuhnya berhasil. Beberapa pasangan tidak mengikuti program keluarga berencana yang direncanakan oleh pemerintah, karena kurangannya pengetahuan tentang keluarga berencana maupun biaya pemasangan alat kontrasepsi. Faktor lain yang mempengaruhi ketidakberhasilan KB adalah efek yang ditimbulkan dari penggunaan program KB tersebut, diantaranya apabila pengguna tidak cocok pada alat kontrasepsi yang dipakainya.Hal tersebut mungkin juga di pengaruhi oleh hormon seseorang, apabila semakin bertambah umur orang tersebut maka makin berubah juga hormon yang ada pada tubuhnya, sehingga dapat menggunakan alat kontasepsi jenis lainnya (Wati, dkk, 2019).
Desa Pong Welak, Desa Robo, Desa Racang dan Desa Rehak merupakan desa yang ada di Manggarai Barat. Desa-desa tersebut merupakan desa yang menggunakan program keluarga berencana. Semua warga yang menggunakan program keluarga berencana didata, disimpan dan dikelola oleh Badan Koordinasi Keluarga Berencana. Masalahnya tidak sedikit para akseptor cenderung lebih memilih alat kontrasepsi dengan dasar coba-coba ataupun hanya dengar masukkan dari orang lain. Hal ini disebabkan oleh kekurangan pemahaman dan pengetahuan mereka terhadap alat kontasepsi.
Peneliti mencoba untuk membantu menyelesaikan masalah pemilihan alat kontrasepsi dengan cara melakukan pengelompokan pemakai alat kontrasepsi menggunakan metode Fuzzy C-Means Clustering. Teknik ini pertama kali di kenalkan oleh Jim Bezdek (1981), kelebihan atau keunggulan dari Fuzzy C-Means adalah dapat melakukan clustering lebih dari satu variabel secara sekaligus dan dapat memberikan hasil pengelompokan bagi objek-objek yang tersebar tidak teratur (Kusumadewi,2010).
1.2 Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah :
a. Bagaimana mengelompokkan pemakai alat kontrasepsi menggunakan Fuzzy C-Means Clustering ?
b. Berapa akurasi dari penerapan metode fuzzy c-means Clustering dalam data pemakai alat kontrasepsi ?
1.3 Tujuan Penelitian
Tujuan penelitian ini adalah :
a. Mengelompokkan pemakai alat kontrasepsi menggunakan Fuzzy C-Means Clustering.
b. Menghitung akurasi dari penerapan metode fuzzy c-means Clustering dalam data pemakai alat kontrasepsi
1.4 Batasan Masalah
a. Atribut yang digunakan dalam pengelompokkan pemakai alat kontrasepsi adalah umur Istri, jumlah anak, pendidikan istri , pekerjaan istri, jenis alat kontrasepsi, umur anak terakhir, pekerjaan suami, pendidikan suami yang didapat dari data BKKBN Desa Pong Welak, Desa Robo, Desa Racang dan Desa Rehak.
b. Keluaran dari sistem ini adalah akurasi dan pengelompokkan pemakai alat kontrasepsi berdasarkan umur istri, jumlah anak, pendidikan istri, pekerjaan istri, jenis alat kontrasepsi, umur anak terakhir, Pekerjaan suami, Pendidikan suami.
1.5 Manfaat Penelitian
a. Membantu BKKBN dalam memberikan informasi kepada pemakai tentang pemilihan alat kontrasepsi yang sesuai dengan umur istri, jumlah anak, pendidikan Istri, pekerjaan Istri, jenis alat kontasepsi, umur anak terakhir, Pekerjaan suami, Pendidikan suami.
1.6 Sistematika Penulisan
 Bab 1 Pendahuluan
Berisi tentang latar belakang, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian serta sistematika penulisan.
 Bab II Landasan Teori
Berisi tentang landasan teori yang mendukung penelitian ini.
 Bab III Metodologi Penelitian
Berisi tentang data, tahapan penelitian, pengolahan data, spesifikasi alat serta desain user interface.
 Bab IV Analisis dan Hasil
Berisikan tentang implementasi dan melakukan analisis dari pengelompokan pemakai alat kontrasepsi menggunakan metode fuzzy c-means clustering.
 Bab V Penutup
Berisi tentang kesimpulan hasil penelitian dan saran dalam pengembangan serta penyempurnaan penelitian yang dilakukan.
4
BAB II
LANDASAN TEORI
2.1 Data Mining
Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban,E dan Liang,2005). Istilah data mining memiliki hakikat sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki.
Data mining, sering juga disebut sebagai Knowledge Discovery in Database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar (Santosa,2007). KDD dapat dibagi menjadi beberapa tahapan proses sebagai berikut :
 Data Cleaning / Pembersihan Data
Pembersih data merupakan proses untuk menghilangkan noise dan juga data yang tidak konsisten atau yang yag tidak relevan.
 Data integration / Integrasi Data
Pada intergasi data ini dimana merupakan proses penggabungan data dari berbagai database ke dalam database baru.
 Data Selection / Seleksi Data
pada dasarnya semua data yang berada pada database sering kali tidak semua dipakai, oleh karena itu data yang sesuai untuk dianalisis saja yang akan diambil dari database
 Data Transformation / Transformasi Data
tranformasi data ini dimana data yang sudah ada diubah atau di gabungkan kedalam format yang sesuai untuk proses dalam data mining.
 Proses Mining
Proses Mining merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.
 Pattern Evaluation / Evaluasi pola
Evaluasi Pola biasa digunakan untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan.
 Knowledge Presentation / Presentasi Pengetahuan
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.
2.2 Alat Kontrasepsi
Alat kontrasepsi adalah alat untuk menghindari atau mencegah terjadinya kehamilan sebagai suatu akibat adanya pertemuan antara sel telur dan sel sperma. Macam – macam alat kontrasepsi dibagi menjadi 2 bagian yaitu :
1. MKJP ( Metode kontrasepsi jangka panjang ) dimana yang termaksud dalam kategori ini adalah jenis susuk/implant, MOW, IUD, MOP.
- Implant
Alat kontrasepsi berbentuk batang kecil (40mm) yang dipasang di lengan bagian atas dan berfungsi untuk mencegah kehamilan dengan perlahan melepaskan hormon progestin.
- IUD
IUD atau yang masyarakat kenal dengan spiral, merupakan alat kontraspesi berbentuk huruf T yang dipasang di dalam rahim. IUD ada yang terbuat dari tembaga (seperti Paragard yang bertahan selama 10 tahun) dan bahan lain yang mengandung hormon (seperti Mirena yang bertahan selama 5 tahun).
- MOW
MOW (Metode operasi wanita) adalah tindakan penutupan terhadap kedua saluran telur kanan dan kiri, yang menyebabkan sel telur tidak dapat melewati sel telur, dengan demikian sel telur tidak dapat bertemu dengan sperma laki- laki sehingga tidak terjadi kahamilan
- MOP
MOP merupakan alat kontrasepsi mantap pada laki-laki yaitu dengan memotong saluran mani (vasdeverens) kemudian kedua ujungnya di ikat,sehingga sel sperma tidak dapat mengalir keluar penis (urethra).
2. Non MKJP ( Non metode kontrasepsi jangka panjang ) dimana yang termaksud dalam kategori ini adalah kondom, pil, suntik dan metode-metode lain selain metode MKJB.
- Kondom
Alat kontrasepsi ini merupakan sarung berbahan lateks atau non lateks yang dipasang pada penis selama hubungan seksual. Manfaat lain dari kondom untuk mencegah kehamilan.
- Pil
Pil merupakan alat kontrasepsi yang paling umum digunakan dan mengandung hormon progestin dan estrogen untuk mencegah ovulasi.
- Suntik
Terdapat dua jenis suntik KB. Suntik KB yang bekerja selama tiga bulan untuk mencegah kehamilan, dan suntik KB yang bekerja selama 1 bulan.
2.3 Clustering
Clustering merupakan proses pengelompokan data dalam kelas- kelas atau cluster-cluster sehingga data dalam suatu cluster memiliki tingkat kesamaan yang tinggi antara data satu dengan yang lainnya tetapi sangat berbeda dengan data pada cluster lain (Sowmya dan Rani,2010). Clustering juga dapat dianggap sebagai bentuk kompresi data, dimana sejumlah besar sampel diubah menjadi sejumlah kecil perwakilan prototipe atau cluster. Tergantung pada data dan apli-kasi, berbagai jenis ukuran kesamaan dapat digunakan untuk mengidentifikasi kelas, dimana ukuran kesamaan mengontrol bagaimana cluster terbentuk. Beberapa contoh nilai-nilai yang dapat digunakan sebagai parameter kesamaan termasuk jarak, konektivitas dan intensitas
2.4 Fuzzy C-Means (FCM)
Fuzzy C-Means (FCM) merupakan algoritma yang digunakan untuk melakukan clustering data berdasarkan keberadaan tiap-tiap titik data sesuai dengan derajat keanggotaannya.. Berikut ini adalah algoritma Fuzzy C-Means (Simbolon dkk,2013) :
1. Input data yang akan di-cluster X, berupa matrik berukuran n x m (n = jumlah sample data, m = atribut setiap data), dimana Xij adalah data sample ke-i (i=1,2,3,..,n), atribut ke-j (j=1,2,..,m).
2. Selanjutnya, tentukan nilai-nilai awal perhitungan seperti, jumlah cluster, pangkat, iterasi maksimal, error terkecil yang diharapkan (֗𝜀), fungsi objektif awal dan iterasi awalnya.
3. Bangkitkan bilangan random (μik, i=1,2,..,n; k=1,2,..,c) sebagai elemen - elemen matriks partisi awal U, kemudian hitunglah jumlah setiap kolom dengan persamaan sebagai berikut :
𝑄𝑖 = ∑ µ𝑖𝑘 … … … . (2.1)
𝑐
𝑘=1
Dengan i = 1,2, …….n.
Kemudian hitung : µ𝑖𝑘 = µ𝑖𝑘
𝑄𝑖 … . . . … . … … … (2.2)
Keterangan :
𝑄𝑖 = jumlah setiap kolom dari nilai random sebuah matriks
µ𝑖𝑘 = data partisi pada cluster ke-i dan data ke-k
4. Hitung pusat cluster ke-k; Vkj, dimana k=1,2,...,c; dan j=1,2,...,m, dengan persamaan sebagai berikut :
𝑉𝑘𝑗 =∑𝑛𝑖=1((µ𝑖𝑘)𝑤 ∗ 𝑋𝑖𝑗
∑𝑛𝑖=1((µ𝑖𝑘)𝑤 … … … . . (2.3)
Keterangan :
𝑉𝑘𝑗 = pusat cluster pada cluster ke-k dan atribut ke-j
µ𝑖𝑘 = data partisi (pada matriks U) pada cluster ke-i dan data ke-k
𝑋𝑖𝑗 = data ( pada matriks U ) pada atribut ke-j dan data ke-k w = pembobotan
5. Selanjutnya, lakukan perhitungan nilai fungsi objektif pada iterasi ke-t (𝑃𝑡), dengan persamaan berikut :
𝑃𝑡= ∑ ∑ ([∑(𝑋𝑖𝑗∗ 𝑉𝑘𝑗)²
𝑚
𝑗=1
] (µ𝑖𝑘)ᵂ)
𝑐
𝑘=1 𝑛
𝑖=1
… … … (2.4)
Keterangan :
𝑃𝑡 = fungsi objektif pada iterasi ke-t
𝑋𝑖𝑗 = data ( pada matriks U ) pada atribut ke-j dan data ke-k 𝑉𝑘𝑗 = pusat cluster pada cluster ke-k dan atribut ke-j
µ𝑖𝑘 = data partisi (pada matriks U) pada cluster ke-i dan data ke-k
w = pembobotan
6. Hitung perubahan matriks partisi U, dengan persamaan sebagai berikut :
µ𝑖𝑘 = [∑𝑚𝑗=1(𝑋𝑖𝑗− 𝑉𝑘𝑗)2] 𝑤−1−1
∑𝑐𝑘=1[∑𝑚𝑗=1(𝑋𝑖𝑗− 𝑉𝑘𝑗)²] 𝑤−1−1
… … … (2.5)
Keterangan :
µ𝑖𝑘 = data partisi (pada matriks U) pada cluster ke-i dan data ke-k
𝑋𝑖𝑗 = data ( pada matriks U ) pada atribut ke-j dan data ke-k 𝑉𝑘𝑗 = pusat cluster pada cluster ke-k dan atribut ke-j
w = pembobotan
7. Langkah terakhir adalah dengan mengecek kondisi berhenti, dengan ketentuan sebagai berikut :
a. Jika |𝑃𝑡 – 𝑃𝑡−1| < 𝑒𝑟𝑜𝑟 𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙 (𝜀) atau (t > iterasi maksimal) maka berhenti
b. Jika tidak, maka t= t+1 kemudian ulangi langkah ke-4
2.5 Silhouette Index
Silhouette index merupakan metode yang digunakan untuk menguji kualitas dari hasil cluster. Validasi cluster dilakukan untuk mengukur seberapa baik hasil pengelompokkan yang didapat. Untuk menghitung nilai dari Silhouette Index (SI) dari sebuah data ke-i, ada dua komponen yaitu 𝑎𝑖 dan 𝑏𝑖. Dengan 𝑎𝑖 adalah rata-rata jarak data ke-I terhadap semua data lainnya dalam satu cluster , sedangkan 𝑏𝑖 diperoleh dari perhitungan rata- rata jarak data ke-i terhadap semua data dari cluster lain yang tidak dalam satu cluster dengan data ke-i yang diambil nilai minimalnya (Desgtaupes, 2013), (Petrovic, 2003). Berikut ini adalah rumus untuk menghitung 𝑎𝑖 , 𝑏𝑖, dan SI.
Rumus untuk 𝑎𝑖 : 𝑎𝑖𝑗 = 1
𝑚𝑗− 1∑ 𝑑(𝑥𝑖 𝑗, 𝑥𝑟𝑗), 𝑖 = 1,2, … , 𝑚𝑗
𝑚𝑗 𝑟=1
𝑟≠𝑖
… … … . (2.6) Keterangan :
𝑎𝑖𝑗 = Rata-rata jarak data ke-i terhadap semua data dalam satu klaster
𝑑(𝑥𝑖𝑗, 𝑥𝑟𝑗) = Jarak data ke-i dengan data ke-r dalam satu klaster j, 𝑚𝑗 = Jumlah data dalam klaster ke-j.
𝑖 = Index data Rumus untuk 𝑏𝑖 :
𝑏𝑖𝑗 = min
𝑛=1,…,𝑘 𝑛≠1
{ 1
𝑚𝑛∑𝑚𝑟=1𝑛 𝑑(𝑥𝑖𝑗, 𝑥𝑟𝑛)
𝑟≠𝑖
} , 𝑖 = 1,2, … , 𝑚𝑛… … … (2.7) Keterangan :
𝑏𝑖𝑗 = Rata-rata jarak data ke-i terhadap semua data yang tidak dalam satu klaster dengan data ke-i
𝑑(𝑥𝑖𝑗, 𝑥𝑟𝑛) = Jarak data ke-i dengan data ke-j dalam satu klaster n.
𝑚𝑛 = Jumlah data dalam klaster ke-n.
𝑖 = Index data
Untuk mendapatkan Silhouette Index ( SI ) data ke-i menggunakan persamaan berikut :
𝑆𝐼𝑖𝑗 = 𝑏𝑖𝑗− 𝑎𝑖𝑗
𝑚𝑎𝑥{𝑎𝑖𝑗, 𝑏𝑖𝑗}… … … (2.8) Keterangan :
𝑆𝐼𝑖𝑗 = Silhouette Index data ke-i dalam satu klaster
𝑏𝑖𝑗 = Rata-rata jarak data ke-i terhadap semua data yang tidak dalam satu klaster dengan data ke-i
𝑎𝑖𝑗 = Rata-rata jarak data ke-i terhadap semua data dalam satu klaster
Nilai 𝑎𝑖 merupakan jarak rata-rata antar vector ke – i dalam cluster Cj maupun vector lain yang berada dalam cluster Cj . Dengan nilai yang dihasilkan semakin kecil menandakan semakin tepatnya data tersebut berada dalam cluster tersebut. Lalu nilai 𝑏𝑖 merupakan jarak minimum dari vector ke-i dalam cluster Cj dan semua vector di luar cluster Cj. Nilai SI yang didapatkan dalam rentang [ -1, +1 ]. Jika nilai SI mendekati 1 menandakan bahwa data tersebut semakin tepat berada didalam cluster tersebut. Nilai SI negative ( 𝑎𝑖 > 𝑏𝑖) menandakan data tersebut tidak tepat berada dalam cluster tersebut ( karena lebih dekat ke cluster yang lain ).
Sedangkan jika SI bernilai 0 ( mendekati 0 ) berarti data tersebut berada di perbatasan di antara dua cluster(Petrovic, 2003). Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata-rata nilai SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut :
𝑆𝐼𝑗 = 1
𝑚𝑗∑ 𝑆𝐼𝑖𝑗
𝑚𝑗
𝑖=1
Keterangan :
𝑆𝐼𝑗 = Rata-rata Sillhouette Index klaster j 𝑚𝑗 = Jumlah data dalam klaster ke-j
𝑆𝐼𝑖𝑗 = Silhoutte Index data ke-i dalam satu klaster 𝑖 = Index data
13
BAB III
METODOLOGI PENELITIAN
3.1 Data
Data yang didapatkan dari BKKBN Desa Manggarai Barat tahun 2015 dalam bentuk pdf. Data yang didapatkan ada 10 atribut yaitu Nama, Tanggal Lahir, Hubungan dengan KK, Jenis Kelamin, Pendidikan,Pekerjaan, Agama, Status Kawin, Jenis Alat Kontasepsi, JKN. Data-data tersebut yang akan nanti diubah kedalam bentuk Excel dengan cara manual. Jumlah data yang didapatkan dari BKKBN Desa Manggarai 724 data.
3.2 . Tahapan Penelitian
Gambar 3. 1 Tahapan Penelitian 3.2.1 Data Selection
Setelah melihat data dari 10 atribut itu, maka diambil yang paling relevan untuk dianalisi yaitu menggunakan 8 atribut, atribut-atribut tersebut meliputi usia/umur istri, jumlah anak, pendidikan istri, pekerjaan istri, jenis alat kontasepsi, umur anak terakhir, pekerjaan suami dan pendidikan suami
Data Data Selection
Fuzzy C-means Clustering Cluster
dan Akurasi
Tranformasi Data Mulai
Selesai Silhouette
Index
dengan menggunakan 452 data karena data tersebut yang tadi 724 data pada beberapa atribut tidak ada nilainya.
Tabel 3. 1 Atribut yang dipakai Nama Atribut Keterangan Usia / Umur Istri Usia dari tiap istri yang
menggunakan program KB
Jumlah Anak Jumlah anak yang dimiliki oleh
istri pengguna KB Pendidikan Istri Pendidikan akhir istri Pekerjaan Istri Pekerjaan istri saat ini Jenis alat kontrasepsi Jenis alat kontasepsi yang
digunakan oleh ibu pengguna KB
Umur anak terakhir Umur anak terakhir dalam keluarga.
Pekerjaan Suami Pekerjaan suami saat ini Pendidikan Suami Pendidikan akhir suami.
3.2.2 Transformasi Data
Atribut Jenis Alat Kontrasepsi data masih berupa teks maka harus dilakukan inisialisasi terlebih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungannya.
Tabel 3. 2 Data Jenis Alat Kontrasepsi
Atribut pendidikan istri data masih berupa teks maka harus dilakukan inisialisasi terlibih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungannya.
Tabel 3. 3 Data Pendidikan Istri
Atribut pekerjaan istri data masih berupa teks maka harus dilakukan inisialisasi terlibih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungannya.
Kriteria Nilai
MOW 1
Pil 2
Suntik 3
IUD 4
Implan 5
Kriteria Nilai
SD 1
SLTP 2
SLTA 3
Perguruan Tinggi 4
Tabel 3. 4 Data Pekerjaan Istri
Kriteria Nilai
Tidak Bekerja 0
Petani 1
Pegawai Swasta 2
Polri 3
Atribut umur anak terakhir data masih berupa teks maka harus dilakukan inisialisasi terlibih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungan.
Tabel 3. 5 Data Umur Anak Terakhir Kriteria Nilai
Umur ≤ 5 tahun 1 Umur ˃ 5 tahun 2
Pada atribut Pendidikan Suami masih berupa teks maka harus dilakukan inisialisasi terlibih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungannya.
Tabel 3. 6 Data Pendidikan Suami Kriteria Nilai
SD 1
SLTP 2
SLTA 3
Perguruan Tinggi 4
Atribut pekerjaan suami data masih berupa teks maka harus dilakukan inisialisasi terlebih dahulu, yaitu merubah isi data menjadi numerik agar dapat mempermudah dalam proses perhitungannya.
Tabel 3. 7 Data Pekerjaan Suami
Kriteria Nilai
Tidak Bekerja 0
Petani 1
Pegawai Swasta 2
Polri 3
3.3 Pengolahan Data
Setelah semua data yang dipakai telah ditransformasikan kedalam bentuk numerik/ angka maka data- data tersebut dapat dikelompokkan menggunakan algoritma Fuzzy C-Means seperti berikut ini :
3.3.1 Input Data
Data yang di inputkan berisikan Atribut-atribut yang akan digunakan beserta nilainya.
Tabel 3.8 Input Data
Nama
umur istri
Jumlah anak
Pendidikan Istri
Pekerjaan Istri
Jenis alat kontasepsi
Umur Anak Terakhir
Pekerjaan Suami
Pendidikan Suami
Yasinta S. Usur 35 3 2 1 3 1 1 3
Marselina Irma 45 5 3 1 2 2 1 1
maria y. bahagia 31 2 3 1 3 1 1 3
magdalena bumbung 40 4 1 1 5 2
1 1
elisabet suryani 27 2 1 1 3 2 1 1
maria amut 31 3 1 1 3 2 1 1
rensiana jemamun 43 5 1 1 3 2 1 1
densiana sanul 27 1 1 1 3 1 1 1
maria margareta jaya 41 4 1 1 4 2 1 2
benedikta daut 45 4 1 1 4 2 1 1
3.3.2 Menentuan Nilai Awal Perhitungan
Dalam menentukan nilai awal dapat kita masukkan jumlah nilai cluster, max iterasi, pembobotan, error terkecil, iterasi awal serta fungsi objektif yang akan digunakan dalam proses perhitungan.
Tabel 3. 9 Nilai Awal Perhitungan
Jumlah Cluster 4
max iterasi 100
pembobotan/pangkat 2
Epsilon/ error terkecil 0.01
Iterasi Awal 1
Fungsi Objektif Awal 0
3.3.3 Bangkitkan Nilai Random
Pada saat memasukkan nilai random ke dalam 4 cluster nilai random tersebut harus memiliki nilai lebih dari 0 dan kurang dari 1 kemudian jika nilai dari tiap cluster dijumlahkan maka hasilnya harus menghasilkan nilai 1.
Tabel 3. 10 Nilai Random
Nama C1 C2 C3 C4 Jumlah
Yasinta S. Usur 0.2 0.2 0.4 0.2 1
Marselina Irma 0.3 0.2 0.2 0.3 1
Maria Y. Bahagia 0.1 0.2 0.2 0.5 1 Magdalena
Bumbung 0.2 0.4 0.3 0.1 1
Elisabet Suryani 0.2 0.2 0.2 0.4 1
Maria Amut 0.1 0.1 0.4 0.4 1
Rensiana Jemamun 0.2 0.4 0.3 0.1 1
Densiana Sanul 0.6 0.1 0.2 0.1 1
Maria Margareta
Jaya 0.7 0.1 0.1 0.1 1
Benedikta daut 0.1 0.1 0.1 0.7 1
3.3.4 Menghitung Pusat Cluster
Perhitungan nilai dari pusat cluster didapatkan dari total miu kuadrat X1, X2, X3, X4 dibagikan dengan nilai total miu kuadrat yang didapatkan dari nilai ke anggotaan cluster dikal pembobotan, maka mendapatkan hasil seperti berikut ini:
Tabel 3. 11 Miu Kuadrat miu kuadrat
0.04 0.04 0.16 0.04
0.09 0.04 0.04 0.09
0.01 0.04 0.04 0.25
0.04 0.16 0.09 0.01
0.04 0.04 0.04 0.16
0.01 0.01 0.16 0.16
0.04 0.16 0.09 0.01
0.36 0.01 0.04 0.01
0.49 0.01 0.01 0.01
0.01 0.01 0.01 0.49
Total miu kuadrat 1.13 0.52 0.68 1.23
Tabel 3. 12 Miu Kuadrat X1
Tabel 3. 13 Miu Kudrat X2 Miu Kuadrat X1
1.4 0.12 0.08 0.04 0.12 0.04 0.04 0.12
4.05 0.45 0.27 0.09 0.18 0.18 0.09 0.09
0.31 0.02 0.03 0.01 0.03 0.01 0.01 0.03
1.6 0.16 0.04 0.04 0.2 0.08 0.04 0.04
1.08 0.08 0.04 0.04 0.12 0.08 0.04 0.04
0.31 0.03 0.01 0.01 0.03 0.02 0.01 0.01
1.72 0.2 0.04 0.04 0.12 0.08 0.04 0.04
9.72 0.36 0.36 0.36 1.08 0.36 0.36 0.36
20.09 1.96 0.49 0.49 1.96 0.98 0.49 0.98
0.45 0.04 0.01 0.01 0.04 0.02 0.01 0.01
Total MiuKuadrat x 40.73 3.42 1.37 1.13 3.88 1.85 1.13 1.72
Miu Kuadrat X2
1.4 0.12 0.08 0.04 0.12 0.04 0.04 0.12
1.8 0.2 0.12 0.04 0.08 0.08 0.04 0.04
1.24 0.08 0.12 0.04 0.12 0.04 0.04 0.12
6.4 0.64 0.16 0.16 0.8 0.32 0.16 0.16
1.08 0.08 0.04 0.04 0.12 0.08 0.04 0.04
0.31 0.03 0.01 0.01 0.03 0.02 0.01 0.01
6.88 0.8 0.16 0.16 0.48 0.32 0.16 0.16
0.27 0.01 0.01 0.01 0.03 0.01 0.01 0.01
0.41 0.04 0.01 0.01 0.04 0.02 0.01 0.02
0.45 0.04 0.01 0.01 0.04 0.02 0.01 0.01
Total MiuKuadrat x 20.24 2.04 0.72 0.52 1.86 0.95 0.52 0.69
Tabel 3.14 Miu Kuadrat X3
Tabel 3. 15 Miu Kuadrat X4 Miu Kuadrat X3
5.6 0.48 0.32 0.16 0.48 0.16 0.16 0.48
1.8 0.2 0.12 0.04 0.08 0.08 0.04 0.04
1.24 0.08 0.12 0.04 0.12 0.04 0.04 0.12
3.6 0.36 0.09 0.09 0.45 0.18 0.09 0.09
1.08 0.08 0.04 0.04 0.12 0.08 0.04 0.04
4.96 0.48 0.16 0.16 0.48 0.32 0.16 0.16
3.87 0.45 0.09 0.09 0.27 0.18 0.09 0.09
1.08 0.04 0.04 0.04 0.12 0.04 0.04 0.04
0.41 0.04 0.01 0.01 0.04 0.02 0.01 0.02
0.45 0.04 0.01 0.01 0.04 0.02 0.01 0.01
Total MiuKuadrat x 24.09 2.25 1 0.68 2.2 1.12 0.68 1.09
Miu Kuadrat X4
1.4 0.12 0.08 0.04 0.12 0.04 0.04 0.12
4.05 0.45 0.27 0.09 0.18 0.18 0.09 0.09
7.75 0.5 0.75 0.25 0.75 0.25 0.25 0.75
0.4 0.04 0.01 0.01 0.05 0.02 0.01 0.01
4.32 0.32 0.16 0.16 0.48 0.32 0.16 0.16
4.96 0.48 0.16 0.16 0.48 0.32 0.16 0.16
0.43 0.05 0.01 0.01 0.03 0.02 0.01 0.01
0.27 0.01 0.01 0.01 0.03 0.01 0.01 0.01
0.41 0.04 0.01 0.01 0.04 0.02 0.01 0.02
22.05 1.96 0.49 0.49 1.96 0.98 0.49 0.49
Total MiuKuadrat x 46.04 3.97 1.95 1.23 4.12 2.16 1.23 1.82
Tabel 3.16 Pusat Klaster
Pusat Klaster 1 36.04424 3.02654 1.21238 1 3.43362 1.63716 1 1.52212 Pusat Klaster 2 38.92307 3.92307 1.38461 1 3.57692 1.82692 1 1.32692 Pusat Klaster 3 35.42647 3.30882 1.47058 1 3.23529 1.64705 1 1.60294 Pusat Klaster 4 37.43089 3.22764 1.58536 1 3.34959 1.75609 1 1.47967
3.3.5 Menghitung Nilai Fungsi Objektif
pada saat sebelum mendapatkan atau menghitungan nilai fungsi objektif, terlebih dahulu mencari nilai dari X_V dimana nilai dari X_V tersebut didapatkan dari data dikurang pusat cluster dipangkat dua lalu ditambahkan dengan data yang lain, dan nilai dari L dimana di dapatkan dari nilai X_V dikalikan dengan nilai mui kuadrat, selanjutnya nilai dari L tersebut ditotalkan kemudian dijumlahkan nilai dari total L untuk mendapatkan nilai dari fungsi objektif.
Tabel 3.17 X_V X_V
4.489623306 20.43713 2.983347751 9.13827748 89.75511003 43.321746 98.86570069 64.54478155 32.47192419 72.898669 26.07158304 47.8699848 19.49847286 3.4755917 25.21864187 10.55291163 83.48962331 146.47559 73.48334775 111.0651067 26.08254366 64.244822 20.45393599 42.16266772 52.91440207 18.398669 60.98334775 34.9106352 86.81705693 151.97559 77.39511246 115.0325864 26.23298614 5.1294379 32.63040657 14.43096041 81.92325163 37.398669 93.42452422 58.94315553
Tabel 3. 18 L dan Total
L total L
0.179584932 0.8174852 0.47733564 0.365531099 1.839936879 8.077959903 1.7328698 3.95462803 5.809030339 19.57448809 0.324719242 2.9159467 1.04286332 11.9674962 16.25102551 0.779938915 0.5560947 2.26967777 0.105529116 3.711240474 3.339584932 5.8590237 2.93933391 17.77041708 29.90835959 0.260825437 0.6424482 3.27262976 6.746026836 10.92193026 2.116576083 2.943787 5.4885013 0.349106352 10.89797071 31.2541405 1.5197559 3.0958045 1.150325864 37.02002678 12.85416321 0.0512944 0.32630407 0.144309604 13.37607126 0.819232516 0.3739867 0.93424524 28.88214621 31.00961065
Tabel 3. 19 Fungsi Objektif fungsi objective
174.5106602
3.3.6 Menghitung Perubahan Matriks Partisi U
Pada perhitungan matriks partisi U ini dimana menggunakan X_V, min 1 yang dibagi dengan pembobotan dikurangi 1 kemudian menjumlahkan total dari LTnya.
Tabel 3. 20 Matriks Partisi U dan Totalnya
LT T.LT
0.222735836 0.0489305 0.335193911 0.10942981 0.716290109 0.011141427 0.0230831 0.010114731 0.01549312 0.059832373 0.030795834 0.0137177 0.038355937 0.02088992 0.10375936 0.051286068 0.2877208 0.039653206 0.09476058 0.473420643 0.011977536 0.0068271 0.013608525 0.00900373 0.041416866 0.038339819 0.0155655 0.048890346 0.02371766 0.126513286 0.018898447 0.0543518 0.016397919 0.02864457 0.118292691 0.011518474 0.00658 0.012920713 0.00869319 0.039712379 0.038119945 0.1949531 0.030646262 0.06929546 0.333014801 0.012206547 0.0267389 0.010703828 0.0169655 0.066614792
3.3.7 Mengecek Kondisi Berhenti
Pada saat melakukan perhitungan kita mendapatkan nilai fungsi objektif, dimana nilai tersebut akan dikelola atau dikurangi dengan nilai fungsi objektif awal jika hasilnya belum kurang dari nilai error terkecil (epsilon) maka pencarian atau perhitungan akan terus berlanjut lagi mulai dari menghitung pusat cluster. Setelah melakukan perhitungan dan mendapat nilai kurang dari nilai error terkecil ( Epsilon) maka didapatkan hasil seperti berikut :
Tabel 3.21 Hasil Error Hasil Error
0.009011708
Tabel 3. 22 Hasil Perhitungan
Tabel 3.23 Hasil Cluster DATA
Derajat Keanggotaan Pada Cluster
Jumlah tiap cluster
1 2 3 4
Yasinta S. Usur 0.6619045 0.0678821 0.094644652 0.175568751 1
Marselina Irma 0.0153359 0.8888474 0.008191457 0.087625171 1
Maria Y. Bahagia 0.8695245 0.0116601 0.096921214 0.02189411 1 Magdalena Bumbung 0.0104312 0.0315482 0.004388003 0.953632511 1 Elisabet Suryani 0.0163182 0.0014981 0.979707882 0.002475769 1
Maria Amut 0.7451869 0.0188242 0.198991915 0.036996976 1
Rensiana Jemamun 0.0156272 0.7638791 0.007754942 0.212738734 1
Densiana Sanul 0.0181559 0.0017307 0.977276429 0.002836861 1
Maria Margareta Jaya 0.0076736 0.0453386 0.003303271 0.943684544 1
Benedikta Daut 0.0113476 0.8865329 0.006124854 0.095994565 1
DATA
Derajat Keanggotaan Pada Cluster
Derajat Keanggotaan Maksimum
Hasil Cluster
1 2 3 4
Yasinta S. Usur 0.6619045 0.0678821 0.0946446 0.1755687 0.6619044 1 Maria Y. Bahagia 0.8695245 0.0116601 0.0969212 0.0218941 0.8695244 1 Maria Amut 0.7451869 0.0188242 0.1989919 0.0369969 0.7451868 1 Marselina Irma 0.0153359 0.8888474 0.0081914 0.0876251 0.8888474 2 Rensiana Jemamun 0.0156272 0.7638791 0.0077549 0.2127387 0.7638791 2 Benedikta Daut 0.0113476 0.8865329 0.0061248 0.0959945 0.8865329 2 Elisabet Suryani 0.0163182 0.0014981 0.9797078 0.0024757 0.9797078 3 Densiana Sanul 0.0181559 0.0017307 0.9772764 0.0028368 0.9772764 3 Magdalena Bumbung 0.0104312 0.0315482 0.0043880 0.9536325 0.9536325 4 Maria Margareta Jaya 0.0076736 0.0453386 0.0033032 0.9436845 0.9436845 4
3.3.8 Silhouette Index
Sebelum proses perhitugan manual silhouette index dilakukan ada dibuat inisial nama menggunakan x1 sampai x10. Dimana inisial tersebut sebagai berikut :
Tabel 3.24 Inisial
Kemudian masuk dalam proses perhitungan silhouette index secara manual. Tahapan-tahapan prosesnya sebagai berikut :
 Mencari nilai 𝑎𝑖
Pada tabel 3.22 dimana untuk melihat rata – rata jarak tiap data terhadap semua data yang ada dalam satu cluster. Kemudian data yang sudah di dapatkan rata-rata jaraknya di jumlahkan, selanjutnya dimasukkan kedalam rumus dari 𝑎𝑖 dimana 1 dibagi dengan jumlah data dalam cluser dikurangi 1 dan dikalikan jumlah rata rata
Inisial Nama
x1 Yasinta S. Usur
x2 Maria Y. Bahagia
x3 Maria Amut
x4 Marselina Irma
x5 Rensiana Jemamun
x6 Benedikta Daut
x7 Elisabet Suryani
x8 Densiana Sanul
x9 Magdalena Bumbung
x10 Maria Margareta Jaya
jarak data. Dilakukan sampai semua data yang berada pada cluster tersebut telah bandingkan.
Tabel 3. 25 Mencari Nilai 𝑎𝑖
 Mencari nilai 𝑏𝑖
Nilai 𝑏𝑖 diperoleh dari perhitungan rata-rata jarak data ke-i terhadap semua data dari cluster lain yang tidak dalam satu cluster dengan data ke-i yang diambil nilai minimalnya.
Tabel 3.26 Mencari Nilai 𝑏𝑖
Jarak X1 terhadap x2,x3
Data Cluster Rata-rata Jarak Cluster
x1 0.661904 0
x2 0.869524 0.207620
x3 0.745187 0.083282
Jumlah 0.290902
𝑎𝑖 0.145451
jarak x1 terhadap x4,x5,x6,x7,x8,x9,x10 Data Cluster Rata-rata Jarak Cluster
x1 0.661904 0
x4 0.888847 0.226943
x5 0.763879 0.101917
x6 0.886533 0.224629
Jumlah 0.553546
𝑏𝑖 0.184515
x7 0.979708 0.317803
x8 0.977276 0.315372
Jumlah 0.633175
𝑏𝑖 0.316588
x9 0.963633 0.291728
x10 0.943685 0.28178
Jumlah 0.573508
𝑏𝑖 0.286754
Tabel 3.23 untuk menghitung nilai 𝑏𝑖 dengan membagi menjadi 3 bagian berdasarkan cluser-clusternya lalu dihitung rata-rata jarak kemudian menggunakan rumus dimana 1 dibagi jumlah data masing- masing cluster dikalikan dengan jumlah rata- ratanya lalu di lihat nilai yang minimum yang diambil atau dipakai.
 Mendapatkan Nilai Silhouette Index ( SI )
Bagian ini dimana tinggal dimasukan nilai yang telah didapatkan dari 𝑎𝑖 dan 𝑏𝑖 dengan menggunakan rumus yang telah di sediakan dengan mengurangi antara 𝑏𝑖 dan 𝑎𝑖 lalu dibagikan dengan nilai max dari 𝑎𝑖 dan 𝑏𝑖. Maka didapatkan hasil perhitungan Silhouette Index ( SI ) dari data yang dapat dilihat pada tabel hasil perhitungan Silhouette Index di bawah ini :
Tabel 3.27 Hasil Perhitungan Silhouette Index
ai bi sij kluster keterangan
x1 0.145451 0.184515393 0.211712 1 sesuai x2 0.165979 0.398179 0.583155 1 sesuai x3 0.10381 0.392515 0.735526 1 sesuai
ai bi sij kluster keterangan
x4 0.063641 0.129975558 0.510358 2 sesuai x5 0.123811 0.075437427 -0.39071 2 tidak sesuai x6 0.062484 0.127661038 0.510546 2 sesuai
ai bi sij kluster Keterangan x7 0.002431 0.031049354 0.921691 3 sesuai x8 0.002431 0.028617901 0.915037 3 sesuai
ai bi sij kluster
x9 0.009948 0.024859644 0.599835 4 sesuai x10 0.009948 0.034807611 0.714201 4 sesuai
Tabel 3.23 terdapat sebuah keterangan dimana jika nilai mendekati 1 maka dapat dikatakan sesuai atau tepat berada di cluster tersebut, jika mendekati -1 maka nilai tersebut di katakana tidak tepat berada dicluster tersebut. Dilihat dari hasil percobaan pada 10 data diatas didapatkan akurasi sebesar 90 % dari data yang sesuai dibagi jumlah seluruh data dikali 100%
3.4 Spesifikasi Alat
Sistem ini mempunyai kebutuhan perangkat keras dan lunak untuk mendapatkan suatu hasil yang maksimal.
1. Kebutuhan Perangkat Lunak :
 Matlab R2016a
 Microsoft Excel 2013
 Microsoft Windows 8.1 2. Kebutuhan Perangkat Keras :
 Processor : AMD A8-7410 APU with AMD Radeon R5 Graphics 2.20 GHz
 Memory : 4GB
 Harddisk : 500GB
3.5 Desain User Interface
Gambar 3. 2 User Interface
Bagian User Interface diatas terdapat button “Tampilkan Data” untuk menampilkan data yang akan diolah. Data awal sebelum diolah akan ditampilkan dalam tabel, dan masuk kedalam kolom Umur Istri, Jumlah Anak, Pendidikan Istri, Pekerjaan Istri, Jenis Alat Kontrasepsi, Umur Anak Terakhir, Pekerjaan Suami, Pendidikan Suami. Selanjutnya, user mengisikan jumlah cluster, memilih pemangkatan / pembobotan, maksimum iterasi, dan error terkecilnya. Setelah user mengisikan bagian- bagian tersebut, user dapat menekan tombol button “Proses” untuk dapat mengolah data dengan algoritma Fuzzy C-Means Clustering sehingga hasil cluster akan keluar di bagian kolom cluster yang berada disebelah kolom pendidikan suami dan hasil dari shilloute index untuk akurasinya akan keluar dibagian ( Hasil ) kemudian bisa menyimpan hasil cluster dengan menekan button simpan di pojok kanan di bagian data dan untuk menyimpan hasil dari shilloute index bisa menekan button simpan yang berada di bagian fuzzy c-means. Data yang disimpan dalam bentuk excel dan txt.
32
BAB IV
ANALISIS DAN HASIL
4.1.1 Implementasi Hasil 4.1.1.1 Halaman Utama
Halaman utama merupakan halaman yang akan muncul pertama kali ketika program dijalankan. Tampilannya dapat dilihat gambar 4.1 berikut.
Gambar 4. 1 Halaman Utama
Halaman utama terdapat dua bagian yaitu bagian data dan bagian fuzzy C-Means clustering.
4.1.1.2 Bagian Data
Bagian data digunakan untuk meng-inputkan data berupa xls atau xlxs. Data yang dimasukkan atau dipakai berformat angka atau numerik, agar dapat di kelompokkan ( clustering ). Bagian Data ditunjukan dalam gambar 4.2 berikut.
Gambar 4. 2 Bagian Data
Pengguna menekan tombol “ tampilkan data” terlihat pada gambar 4.2 yang
berguna untuk menampilkan berkas atau file dalam bentuk xls atau xlxs.
Kemudian hasil dari inputan berkas atau data ditunjukan seperti pada gambar 4.3 berikut.
Gambar 4. 3 Hasil Inputan Data
bagian kolom cluster tersebut akan muncul ketika kita selesai mengisikan bagian fuzzy c-means clustering nanti.
4.1.1.3 Bagian Fuzzy C-Means Clustering
Bagian ini merupakan bagian yang harus di isikan oleh pengguna untuk bisa mendapatkan hasil dari pengelompokan dan juga hasil dari silhouette index. Pengguna harus mengisikan jumlah cluster, memilih pangkat / pembobotan, mengisikan maksimal iterasi, error terkecil / epsilon. Setelah mengisikan parameter-parameter tersebut, pengguna menekan tombol proses untuk mendapatkan hasil clusteringnya dan juga hasil silhouette index yang muncul di bagian hasil dan di bagian cluster yang berada disebelah kolom pendidikan suami. Implementasi ditunjukan pada gambar 4.4 berikut
Gambar 4. 4 Bagian Fuzzy C-Means Clustering
Pengguna dapat menyimpan hasil cluster dalam bentuk excel dengan menekan button simpan pada pojok kanan bagian seperti yang di tunjukan pada gambar 4.5 berikut:
Gambar 4. 5 Penyimpanan Hasil Cluster
Bagian ini jika pengguna ingin menyimpan hasil dari silhouette index, maka pengguna hanya perlu menekan button simpan pada bagian fuzzy c-means clustering yang ada pada pojok kanan sehingga dapat menyimpan hasilnya dalam bentuk txt. Seperti yang di tunjukkan pada gambar 4.6 berikut
Gambar 4. 6 Penyimpanan Hasil Silhouette Index
4.1.2 Implementasi Program
4.1.2.1 Implementasi Function Tampilkan Data
Program 4.1 Tampilkan Data
Program diatas ini pengguna di arahkan untuk menginputkan file yang ingin dipakai. Dimana pertama-tama function pushbuttonTampilkanData ini mendeklarasikan data sebagai variable global agar semua fungsi yang ada di dalamnya bisa mengakses nilai dari variable tersebut. Kemudian menggunakan filename,pathname untuk membaca file dari direktori yang dipilih. Kemudian ada uigetfile dimana untuk mengambil file dalam direktori yang mana file tersebut berformat xls dan xlsx. Lalu menggunakan xlsread untuk membaca file excel tersebut. Kemudian menampilkan data excel tersebut pada table dengan menggunakan fungsi set (handles.tabledata,’data’,data).
4.1.2.2 Implementasi Function Fuzzy C-Means Clustering
Implementasi fuzzy c-means clustering ini ada beberapa langka yang harus dibuat, langka pertama dimana membuat sebuah baris dan kolom matriks seperti dibawah ini:
function pushbuttonTampilkanData_Callback(hObject, eventdata,handles)
global data;
[filename,pathname]=uigetfile([{'*.xlsx','XLSX
Only'};{'* .xls','XLS Only'}],'Select Excel Input File');
data = xlsread(strcat(pathname,filename));
set(handles.tableData,'data', data);