i
PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA
SKRIPSI
Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta
Sebagai Salah Satu Persyaratan Guna Memperoleh Gelar Sarjana Sains
Disusun oleh: Aziza Ratna Kumala
12305144038
PROGRAM STUDI MATEMATIKA JURUSAN PENDIDIKAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA
ii
PERSETUJUAN
Skripsi yang berjudul
PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA
Oleh:
Aziza Ratna Kumala NIM 12305144038
Telah disetujui pada tanggal ... Untuk diujikan di hadapan dewan penguji Skripsi
Program Studi Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta
Yogyakarta, 8 Juni 2016 Dosen Pembimbing
Dr. Dhoriva Urwatul Wutsqa NIP. 19660331 199303 2 001
iii
HALAMAN PENGESAHAN Skripsi yang berjudul
“PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA”
Yang disusun oleh: Nama : Aziza Ratna Kumala NIM : 12305144038
Prodi : Matematika
Skripsi ini telah diujikan di depan Dewan Penguji Skripsi pada tanggal 16 Juni 2016 dan dinyatakan LULUS.
DEWAN PENGUJI
Nama Jabatan Tanda Tangan Tanggal
Dr. Dhoriva Urwatul W. Ketua Penguji ... ... 196603311993032001
Husna „Arifah, S.Si. M.Sc. Sekretaris Penguji ... ... 197810152002122001
Dr. Agus Maman Abadi Penguji Utama ... ... 197008281995021001
Retno Subekti, M.Sc. Penguji Pendamping ... ... 198111162005012002
Yogyakarta, 2016 Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Yogyakarta Dekan,
Dr. Hartono
iv
HALAMAN PERNYATAAN
Yang bertanda tangan di bawah ini, saya:
Nama : Aziza Ratna Kumala
NIM : 12305144038
Program Studi : Matematika
Fakultas : Matematika dan Ilmu Pengetahuan Alam
Judul Skripsi : PERBANDINGAN K-MEANS DAN FUZZY C-MEANS
CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA
Menyatakan bahwa skripsi ini benar-benar karya saya sendiri dan sepanjang pengetahuan saya, tidak terdapat karya atau materi yang ditulis atau digunakan sebagai persyaratan penyelesaian studi di perguruan tinggi, kecuali pada bagian-bagian tertentu yang diambil sebagai acuan atau kutipan dengan mengikuti tata penulisan karya ilmiah yang telah lazim. Apabila ternyata terbukti pernyataan saya tidak benar, maka sepenuhnya menjadi tanggung jawab saya, dan saya bersedia menerima sanksi sesuai ketentuan yang berlaku.
Yogyakarta, 7 Juni 2016 Yang Menyatakan,
Aziza Ratna Kumala NIM 12305144038
v MOTTO
Karena sesungguhnya sesudah kesulitan itu ada kemudahan. Sesungguhnya sesudah kesulitan itu ada kemudahan.
(QS. Al-Insyirah: 5-6)
Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa usahanya akan kelihatan nantinya.
(Q.S. An Najm ayat 39-40)
If plan A didn't work, the alphabet has 25 more letters. Stay cool and don’t give up!
vi
HALAMAN PERSEMBAHAN
Alhamdulillah, puji syukur kehadirat Allah SWT, akhirnya saya dapat menyelesaikan skripsi ini. Karya sederhana ini saya persembahkan untuk:
Kedua orang tuaku, Bapak Sukijan dan Ibu Wiwik Sri Wahyuni, bapak dan mama tercinta yang memberiku semangat, bimbingan, dukungan dan doa yang tak pernah putus siang dan malam sehingga aku dapat menyelesaikan karya ini
dengan baik.
Kakak dan adik-adikku, Mas Jati, Ayin, dan Aya yang selalu memberi semangat dan dukungan serta bersedia mendengarkan keluh kesahku.
Sepingpingku. Dek Epi dan Dek Ami, ‘partners in crime’ yang selalu ada disaat aku butuh bantuan. Mbak Sari, Mbak Tami, Dek Ilham sepingping seperjuangan,
semangat! Kita pasti bisa!
Mada, Ratih, dan Marwah sesama pejuang skripsi, akhirnya kita bisa melalui semua masalah dan menyelesaikan skripsi ini.
Anita, Septi, Zen, Lela, Rini, Dinda, teman-teman main dan nonton, yang telah memberikan banyak kenangan indah dan tak terlupakan selama ini.
Teman-teman Matematika Swadana 2012 yang memberikan kenangan, ilmu, pengalaman dan kebersamaan selama 4 tahun ini. Semoga silaturahmi kita semua
vii
PERBANDINGAN K-MEANS DAN FUZZY C-MEANS CLUSTERING PADA MODEL RADIAL BASIS FUNCTION NEURAL NETWORK (RBFNN) UNTUK KLASIFIKASI STADIUM KANKER PAYUDARA
Oleh:
Aziza Ratna Kumala 12305144038
ABSTRAK
Kanker payudara adalah kanker yang paling sering terjadi pada wanita baik di negara maju dan berkembang. Oleh karena itu, pemeriksaan deteksi dini perlu dilakukan agar kanker payudara dapat disembuhkan. Radial Basis Function Neural Network (RBFNN) merupakan salah satu model Neural Network (NN) yang dapat digunakan untuk mendiagnosa kanker payudara. Penelitian ini bertujuan untuk menjelaskan prosedur dan membandingan hasil klasifikasi stadium kanker payudara menggunakan model RBFNN dengan metode K-Means dan Fuzzy C-Means clustering.
Prosedur awal klasifikasi kanker payudara menggunakan RBFNN adalah melakukan preprocessing citra berupa cropping dan penghilangan background hitam pada citra mammogram payudara. Setelah itu dilakukan ekstraksi citra mammogram untuk mendapatkan parameter statistik, yaitu energi, kontras, korelasi, sum of squares, inverse difference moment, sum average, sum variance, sum entropy, entropi, difference variance, difference entropy, probabilitas maksimum, homogenitas dan dissimilarity. Variabel input yang digunakan adalah parameter-parameter hasil ekstraksi citra menggunakan Gray Level Co-occurance Matrix (GLCM), sedangkan target dan variabel output berupa vektor yang mewakili masing-masing stadium kanker payudara. Pembagian data menjadi dua, yaitu 80% data training dan 20% data testing. Sebelum dilakukan pembelajaran, input dinormalisasi. Pembentukan model terbaik dilakukan dengan menentukan banyaknya neuron terbaik pada lapisan tersembunyi yang menghasilkan nilai akurasi tertinggi dari kedua metode clustering yang digunakan dan menentukan bobot-bobotnya menggunakan kriteria GCV (Generalised Cross-Validation) pada Global Ridge Regression. Fungsi aktivasi yang digunakan adalah fungsi Gaussian pada lapisan tersembunyi.
Klasifikasi stadium kanker payudara menggunakan model RBFNN menghasilkan jaringan terbaik dengan 14 neuron input, lapisan tersembunyi dengan 11 neuron, dan 2 neuron output. Pengujian ketepatan model RBFNN untuk klasifikasi diukur melalui nilai sensitivitas, spesifisitas, dan akurasi. Hasil metode K-Means clustering dengan nilai sensitivitas, spesifisitas, dan akurasi secara berurutan adalah 75%, 93,75%, dan 80,21% untuk data training dan 81,25%, 75%, dan 79,17% untuk data testing, lebih baik daripada hasil metode Fuzzy C-Means (FCM) clustering yaitu 67,19%, 90,62%, dan 75% untuk data training dan 75%, 75%, dan 75% untuk data testing.
Kata Kunci : Radial Basis Function Neural Nework (RBFNN), K-Means cluster, Fuzzy C-Means cluster, klasifikasi, kanker payudara
viii
KATA PENGANTAR
Alhamdulillah, puji syukur kehadirat Allah SWT atas segala nikmat-Nya, akhirnya penulis mampu menyelesaikan penulisan Skripsi dengan judul “Perbandingan K-Means dan Fuzzy C-Means Clustering pada Model Radial Basis Function Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara”. Terima kasih penulis sampaikan kepada Ibu Dr. Dhoriva U. W., selaku dosen pembimbing yang telah sangat sabar memberikan bimbingan, pengarahan, dan semangat dalam penyusunan skripsi ini. Skripsi ini disusun untuk memenuhi persyaratan guna memperoleh gelar Sarjana Sains Program Studi Matematika di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta.
Penyusunan skripsi ini tidak lepas dari dukungan, motivasi, kerjasama maupun bimbingan dari berbagai pihak secara langsung maupun tidak langsung. Oleh karena itu, penulis menyampaikan terima kasih kepada:
1. Bapak Dr. Hartono, selaku Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam yang telah memberikan kelancaran dalam urusan akademik di tingkat fakultas.
2. Bapak Dr. Ali Mahmudi, selaku Ketua Jurusan Pendidikan Matematika yang telah memberikan kelancaran dalam pelayanan akademik di tingkat jurusan. 3. Bapak Dr. Agus Maman Abadi, selaku Ketua Program Studi Matematika
Universitas Negeri Yogyakarta atas bimbingan dan pengarahan dalam penulisan skripsi ini, serta dukungan akademik kepada penulis.
ix
4. Ibu Nur Insani, M.Sc, selaku Dosen Pembimbing Akademik yang telah memberikan pengarahan dan bimbingan selama proses studi.
5. Seluruh Dosen Jurusan Pendidikan Matematika yang telah memberikan arahan dan ilmu yang bermanfaat bagi penulis.
6. Seluruh pihak yang telah membantu dan memberikan dukungan dalam penulisan skripsi ini hingga akhir.
Penulis menyadari bahwa masih banyak kekurangan dan kesalahan dalam skripsi ini. Oleh karena itu, kritik dan saran yang membangun penulis harapkan sebagai sebuah koreksi dan untuk perbaikan skripsi ini. Demikian skripsi ini penulis susun, semoga dapat memberikan manfaat bagi penulis dan pembaca.
Yogyakarta, 7 Juni 2016 Penulis,
x DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERNYATAAN ... iv
MOTTO... v
HALAMAN PERSEMBAHAN ... vi
ABSTRAK ... vii
KATA PENGANTAR ... viii
DAFTAR ISI ... x
DAFTAR TABEL ... xiv
DAFTAR GAMBAR ... xvi
DAFTAR LAMPIRAN ... xvii
BAB I PENDAHULUAN A. Latar Belakang ... 1 B. Pembatasan Masalah ... 8 C. Rumusan Masalah ... 9 D. Tujuan Penelitian ... 9 E. Manfaat Penelitian ... 10
BAB II KAJIAN TEORI A. Kanker Payudara (Breast Cancer) ... 11
1. Pengertian Kanker Payudara ... 11
2. Gejala Kanker Payudara ... 11
xi
4. Klasifikasi Kanker Payudara ... 17
5. Cara Pendeteksian Kanker Payudara ... 17
B. Pengolahan Citra Digital ... 20
1. Citra Biner ... 21 2. Citra Grayscale ... 21 3. Citra Warna ... 22 C. Ekstraksi Citra ... 22 D. Neural Network (NN) ... 29 1. Arsitektur ... 32 2. Fungsi Aktivasi ... 34 3. Algoritma Pembelajaran ... 36 E. Metode Clustering ... 37 1. K-Means Clustering ... 37
2.Fuzzy C-Means Clustering ... 39
F. Ridge Regression ... 43
G. Ketepatan Hasil Klasifikasi ... 47
BAB III PEMBAHASAN A. Arsitektur dan Model Radial Basis Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara ... 51
1. Arsitektur Radial Basis Function Neural Network ... 51
2. Model Radial Basis Function Neural Network ... 53
3. Algoritma Pembelajaran Radial Basis Function Neural Network ... 54
B. Prosedur Pemodelan Radial Basis Function Neural Network (RBFNN) untuk Klasifikasi Stadium Kanker Payudara ... 72
xii
1. Preprocessing Citra ... 72
2. Ekstraksi Citra ... 72
3. Pendefinisian Variabel Input dan Target ... 73
4. Pembagian Data Input ... 73
5. Normalisasi Data ... 73
6. Pembelajaran Radial Basis Function Neural Network... 75
7. Menentukan Jaringan Optimum ... 76
8. Klasifikasi ... 77
C. Hasil Model Radial Basis Function Neural Network untuk Klasifikasi Kanker Payudara ... 78
1. Preprocessing Citra ... 78
a. Proses Pemotongan Citra ... 78
b. Proses Penghilangan Background ... 79
2. Ekstraksi Citra ... 80
3. Pendefinisian Variabel Input dan Target ... 82
4. Pembagian Data Input ... 82
5. Normalisasi Data ... 83
6. Pembelajaran Radial Basis Function Neural Network... 84
7. Menentukan Jaringan Optimum ... 85
D. Hasil Klasifikasi ... 89
1. K-Means Clustering ... 89
2. Fuzzy C-Means Clustering ... 97
E. Ketepatan Hasil Klasifikasi ... 111
1. K-Means Clustering ... 111
xiii BAB IV PENUTUP A. Kesimpulan ... 116 B. Saran ... 118 DAFTAR PUSTAKA ... 119 LAMPIRAN ... 125
xiv
DAFTAR TABEL
Tabel 2.1. Fungsi Aktivasi Neural Network ... 34
Tabel 2.2. Hasil Klasifikasi Uji Diagnosa ... 48
Tabel 3.1. Data Pengamatan ... 56
Tabel 3.2. Koordinat Pusat Cluster partisi pertama ... 56
Tabel 3.3. Koordinat Pusat Cluster Partisi Kedua ... 58
Tabel 3.4. Pusat cluster pertama yang dihasilkan pada iterasi ke-1 ... 60
Tabel 3.5. Pusat cluster kedua yang dihasilkan pada iterasi ke-1 ... 60
Tabel 3.6. Perhitungan Fungsi Objektif pada iterasi ke-1 ... 61
Tabel 3.7. Perhitungan matriks partisi pada iterasi ke-1 ... 61
Tabel 3.8. Pusat cluster pertama yang dihasilkan pada iterasi ke-2 ... 62
Tabel 3.9. Pusat cluster kedua yang dihasilkan pada iterasi ke-2 ... 62
Tabel 3.10. Perhitungan Fungsi Objektif pada iterasi ke-2 ... 63
Tabel 3.11. Perhitungan matriks partisi pada iterasi ke-2 ... 64
Tabel 3.12. Derajat Keanggotaan Setiap Objek pada Iterasi Terakhir ... 65
Tabel 3.13. Hasil Ekstraksi Citra mdb004.png... 81
Tabel 3.14. Pola Target Vektor Klasifikasi Stadium Kanker Payudara ... 82
Tabel 3.15. Hasil Normalisasi Citra mdb004.png ... 83
Tabel 3.16. Hasil Jarak dan Pusat Cluster ... 84
Tabel 3.17. Persentase Akurasi Data Training dan Data Testing ... 86
xv
Tabel 3.19. Performance Measure Model RBFNN Metode K-Means
clustering ... 111 Tabel 3.20. Performance Measure Model RBFNN Metode C-Means
xvi
DAFTAR GAMBAR
Gambar 2.1. Syaraf Secara Biologi ... 30
Gambar 2.2. Neural Network Sederhana ... 30
Gambar 2.3. Jaringan Layar Tunggal ... 32
Gambar 2.4. Jaringan Layar Jamak ... 33
Gambar 2.5. Jaringan Layar Kompetitif ... 34
Gambar 3.1. Arsitektur Radial Basis Function ... 52
Gambar 3.2. Diagram Alir Prosedur Pemodelan RBFNN... 77
Gambar 3.3. Pemotongan citra mammogram payudara; (a) mdb004 sebelum dipotong, (b) mdb004 setelah dipotong ... 79
Gambar 3.4. Proses menghilangkan background citra mammogram payudara;(a) mdb004 dengan background hitam, (b) mdb004 dengan background putih ... 80
Gambar 3.5. Arsitektur RBFNN untuk klasifikasi stadium kanker payudara dengan 11 cluster ... 88
xvii
DAFTAR LAMPIRAN
Lampiran 1. Citra Mammogram pada Data Latih (Training) ... 126
Lampiran 2. Citra Mammogram pada Data Uji (Testing) ... 135
Lampiran 3. Script M-file GLCM Ekstraksi Gambar ... 138
Lampiran 4. Hasil Ekstraksi Citra pada Data Latih (Training) ... 144
Lampiran 5. Hasil Ekstraksi Citra pada Data Uji (Testing) ... 149
Lampiran 6. Hasil Normalisasi Citra pada Data Latih (Training) ... 151
Lampiran 7. Hasil Normalisasi Citra pada Data Uji (Testing) ... 156
Lampiran 8. Program RbfDesign ... 158
Lampiran 9. Program GlobalRidge ... 161
Lampiran 10.Script MATLAB untuk klasifikasi kanker payudara menggunakan metode RBFNN ... 168
Lampiran 11.Nilai pusat dan jarak 11 cluster metode K-Means clustering ... 170
Lampiran 12. Nilai pusat dan jarak 11 cluster metode Fuzzy C-Means clustering ... 171
Lampiran 13.Hasil Perhitungan fungsi Gaussian 11 cluster dengan metode K-Means clustering ... 172
Lampiran 14. Hasil Perhitungan fungsi Gaussian 11 cluster dengan metode Fuzzy C-Means clustering ... 176
Lampiran 15.Hasil perhitungan RBFNN menggunakan metode K-Means clustering 11 cluster ... 180
xviii
Lampiran 16.Hasil perhitungan RBFNN menggunakan metode Fuzzy
C-Means clustering 11 cluster ... 182 Lampiran 17.Pembulatan hasil perhitugan dan klasifikasi stadium kanker
payudara menggunakan metode K-Means clustering 11
cluster model RBFNN ... 184 Lampiran 18.Pembulatan hasil perhitugan dan klasifikasi stadium kanker
payudara menggunakan metode Fuzzy C-Means clustering 11