Identifikasi Kanker Serviks Dari Citra Papsmear Berbasis Kecerdasan Buatan
Winda Dwi Tanti1, Endah Purwanti2, Adri Supardi3
1,2,3 Program Studi S1 Teknobiomedik, Departemen Fisika, Fakultas Sains Dan Teknologi, Universitas Airlangga, Surabaya
Abstract
The purpose of this research is to identify cervical cancer with shape features and statistical features extraction using artificial intelligence system. The methods used in this research are clustering fuzzy c – means and k – means into two groups, cluster 1 and cluster
2, followed by classifications of backpropagation into two classes, normal and abnormal. A
whole data images those used are 130 data abnormal and 65 data normal. Processing image conducted include image pre-processing to improve the quality of the image, for the next segmentation nucleus area. As many as 11 features consisted of two types has been extracted from cervical cell binary images. The results showed from train processing that the identification of cervical cancer by FCM – backpropagation methods provide better accuracy than backpropagation methods, with value of accuracy 100% to 97%. Optimal accuracy of classification system from this research is 84,44% with the parameter value of neurons number in hidden layer 10 and learning rate 0,2.
Keywords: Single cervical cell images, cervical cancer, pap smear test, fuzzy c – means, backpropagation
Abstrak
Penelitian ini bertujuan untuk identifikasi kanker serviks dengan ekstraksi fitur bentuk dan histogram menggunakan sistem kecerdasan buatan. Metode yang digunakan yaitu pengelompokan fuzzy c – means dan k – means menjadi dua kelompok, cluster 1 dan cluster 2, yang dilanjutkan dengan klasifikasi backpropagation menjadi 2 kelas, normal dan abnormal. Keseluruhan data citra yang digunakan sebanyak 130 data abnormal dan 65 data normal. Pengolahan citra yang dilakukan meliputi pengolahan awal sebagai langkah meningkatkan kualitas citra yang diproses, untuk selanjutnya dilakukan segmentasi area nukleusnya. Sebanyak 11 fitur yang terdiri atas 2 jenis diekstraksi dari citra biner sel serviks. Hasil penelitian menunjukkan bahwa identifikasi kanker serviks dengan metode FCM –
bacpropagation memberikan nilai akurasi pelatihan yang lebih baik daripada metode backpropagation, dengan nilai akurasi 100% banding 97%. Tingkat akurasi optimal sistem
klasifikasi yang dihasilkan dari penelitian ini yaitu 84,44% dengan nilai parameter jumlah neuron pada hidden layer 10 dan nilai laju pembelajaran 0,2.
Kata kunci: Citra tunggal sel serviks, kanker serviks, tes papsmear, fuzzy c – means, backpropagation
1. Pendahuluan
Kanker serviks merupakan penyakit yang menyerang organ reproduksi wanita yaitu serviks atau leher rahim. Tahun 2013, diperoleh data kasus kanker serviks di seluruh dunia sebanyak 453 ribu (13,1%) yang menjadikan kanker serviks penyebab kematian kedua pada wanita [1]. Banyaknya kasus kanker serviks dikarenakan tidak dijumpainya gejala – gejala yang spesifik seperti pada jenis kanker lain. Oleh sebab itu, dibutuhkan prosedur deteksi dini dengan harapan dapat menekan jumlah penderita dan jumlah kematian karena kanker serviks.
Salah satu jenis metode yang paling efektif untuk pemeriksaan sel serviks yaitu melalui tes Papanicolau (Papsmear). Metode ini dilakukan dengan cara mengambil sampel dari sel serviks pasien. Sampel sel tersebut kemudian dilakukan preparasi dan observasi dengan bantuan mikroskop. Durasi pemeriksaan yang cukup lama, kurangnya sumber daya ahli sitologi, kurangnya fasilitas lab, serta resiko terjadinya human error merupakan beberapa kekurangan pada metode Papsmear [2]. Oleh sebab itu dibutuhkan suatu sistem otomasi berbasis kecerdasan buatan yang dapat mengklasifikasikan sel serviks menjadi sel normal atau sel abnormal dengan waktu yang relatif singkat.
Penelitian – penelitian yang memanfaatkan sistem kecerdasan buatan untuk deteksi dini telah banyak dilakukan oleh peneliti sebelumnya. Jeremiah [3] menggunakan tiga macam fitur sebagai data masukan klasifikasi tiga jenis metode yang berbeda sehingga menyebabkan program memberikan respon yang lambat. Erlinda [4] menggunakan 7 fitur dari sel serviks tunggal sebagai data input dalam sistem klasifikasi Learning Vector
Quantization (LVQ), dimana dihasilkan akurasi sebesar 93,33%. Atta [5] menggunakan tiga
jenis fitur untuk diagnosis penyakit katup jantung, dimana klasifikasi backpropagation memberikan rata – rata hasil akurasi sebesar 93,75%.
Berdasarkan beberapa penelitian tersebut, maka dilakukan penelitian deteksi dini kanker serviks dengan upaya meningkatkan hasil akurasi menggunakan sistem kecerdasan buatan. Program yang dibuat meliputi segmentasi area nukleus, ekstraksi fitur bentuk dan fitur histogram, dan klasifikasi menggunakan sistem kecerdasan buatan. Sistem kecerdasan buatan yang digunakan yaitu clustering fuzzy c – means dan k – means menjadi 2 cluster, dan klasifikasi backpropagation menjadi data normal dan data abnormal.
2. Dasar Teori 2.1 Median Filtering
Median filtering merupakan teknik perbaikan citra yang digunakan untuk mengurangi
adanya noise pada citra. Filter ini sangat efektif untuk menghilangkan noise jenis salt and
peper serta dapat mempertahankan detail citra karena tidak tergantung pada nilai – nilai yang
berbeda dengan nilai – nilai yang umum dalam lingkungannya [6].
2.2 Contrast Stretching
Teknik contrast stretching digunakan untuk memperbaiki kontras citra dengan cara melebarkan intensitas pixel pada citra masukan, sedemikian sehingga dihasilkan citra dengan rentang intensitas pixel yang lebih lebar [7].
2.3 Morphological Processing
Tujuan secara umum dari operasi morfologi pada citra biner adalah untuk memperbaiki bentuk obyek, agar dapat menghasilkan fitur yang lebih akurat saat analisis obyek dilakukan. Operasi dasar dalam morfologi citra yaitu dilasi dan erosi. Kedua operasi dasar tersebut menjadi basis untuk membuat berbagai operasi morfologi yang sangat berguna untuk pengolahan citra digital seperti opening, closing, hit and miss transform, thinning, dan
thickening [8].
2.4 Thresholding
Thresholding merupakan salah satu metode sederhana dari segmentasi citra yang
memiliki tujuan untuk membagi suatu citra menjadi beberapa daerah tertentu. Metode ini membagi daerah citra berwarna atau grayscale menjadi citra dengan dua nilai tingkat keabuan, yaitu hitam dan putih [8].
2.5 K – means
Teknik clustering (unsupervised learning) merupakan seni atau teknik mengelompokkan data (obyek), ke dalam beberapa kluster (kelompok) yang belum diketahui. Penelitian ini menggunakan dua jenis teknik clustering, diantaranya adalah metode k – means dan fuzzy
c-means. Tujuan dari proses clustering k-means ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering. Umumnya nilai objective function berusaha
meminimalkan variasi di dalam suatu kluster dan memaksimalkan variasi antar kluster [9]. Metode k-means akan mencari pusat kluster dan batas – batas kluster melalui proses perulangan (iterasi). Kedekatan atau kemiripan suatu obyek dengan obyek yang lain atau dengan pusat kluster dihitung dengan menggunakan fungsi jarak [8]. Fungsi jarak tersebut dihitung menggunakan persamaan 1.
𝐽𝑗= ∑ ‖𝑥 − 𝑧𝑗(𝑘 + 1)‖ 2
, 𝑗 = 1, 2, … , 𝐾
𝑥∈𝑆𝑗(𝑘)
Sj(k) menyatakan himpunan sampel, zj(k+1) menyatakan nilai pusat kluster baru dalam kluster ke – j, sedangkan x menyatakan nilai – nilai pada sampel data. Adapun pusat kluster baru dihitung menggunakan persamaan 2, dengan 𝑁𝑗 menyatakan jumlah sampel 𝑆𝑗(𝑘)
𝑧𝑗(𝑘 + 1) = 1 𝑁𝑗 ∑ 𝑥 𝑥∈𝑆𝑗(𝑘) , 𝑗 = 1, 2, … , 𝐾 2.6 Fuzzy C – Means (FCM)
Metode fuzzy c – means memanfaatkan teori fuzzy untuk mengalokasikan data dalam beberapa kelompok yang sesuai. Logika ini memberikan konsep yang berbeda, yaitu konsep tingkat kebenaran. Suatu nilai dalam logika fuzzy bisa bernilai benar dan salah secara bersamaan. Besarnya keberadaan dan kesalahan bergantung pada bobot keanggotaan yang dimilikinya, yaitu dalam rentang 0 hingga 1 [10].
Fuzzy C-Means memiliki konsep memperbaiki pusat cluster serta derajat keanggotaan
pada tiap – tiap titik secara berulang. Selama proses tersebut pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan dilakukan berdasarkan pada minimisasi fungsi obyektif [9]. Nilai fungsi obyektif didapatkan melalui perhitungan dari persamaan 3.
𝐽(𝑈, 𝑉; 𝑋) = ∑ ∑(𝜇𝑖𝑘)𝑤(𝑑𝑖𝑘)2 𝐶 𝑖=1 𝑛 𝑘=1 Dengan
𝑤𝜖[1, ∞],
(1) (2) (3)𝑑𝑖𝑘 = 𝑑(𝑥𝑘 − 𝑣𝑖) = [∑(𝑥𝑘𝑗− 𝑣𝑖𝑗) 𝑚
𝑗=1
]
1/2
Adapun x adalah data yang dikelompokkan yang berukuran n x m, dengan n = jumlah data yang akan di cluster; dan m = jumlah variabel, sedangkan v adalah matriks pusat cluster.
2.7 Backpropagation
Backpropagation merupakan salah satu algoritma pembelajaran dalam jaringan saraf
tiruan dan termasuk sistem pembelajaran terawasi (supervised learning). Sistem ini biasanya menggunakan perceptron dengan banyak lapisan untuk mengubah nilai bobot. Jaringan saraf tiruan terdiri atas kumpulan node (neuron), dan relasi. Ada tiga tipe lapisan neuron yang terdapat pada jaringan backpropagation, yaitu lapisan input (x), lapisan tersembunyi (z), dan lapisan output (y).
Gambar 1. Arsitektur jaringan backpropagation
Algoritma backpropagation menggunakan error output untuk mengubah nilai bobot – bobotnya dalam arah mundur (backward). Nilai error didapatkan melalui perhitungan pada tahap perambatan maju (forward propagation).
3. Metode Penelitian 3.1 Data Penelitian
Data citra yang digunakan dalam penelitian merupakan citra digital dari mikroskop digital dari database yang dibangun oleh Departement of Pathology, Herlev University
Hospital, Denmark. Jumlah citra sel serviks tunggal yang digunakan sebanyak 50 citra sel
normal dan 100 citra sel abnormal untuk pelatihan sistem, serta sebanyak 15 citra sel normal dan 30 citra sel abnormal untuk pengujian sistem.
1 V12 X1 X2 X3 Z1 Z2 1 y b11 b12 W1 W2 b2 V11 V21 V22 V31 V32 (4)
3.2 Perancangan Software
Perancangan software secara garis besar terdiri atas beberapa proses pengolahan citra digital, segmentasi nukleus, ekstraksi fitur bentuk dan statistik, serta klasifikasi data citra menjadi sel normal dan abnormal.
Gambar 2. Diagram Alir Perancangan Software
Tahapan dalam kotak bergaris putus – putus telah dilakukan pada penelitian sebelumnya oleh Dewi (2013).
Data citra sel serviks tunggal terlebih dahulu melewati serangkaian proses pengolahan citra sebelum dilakukan ekstraksi fitur. Penelitian ini mengambil dua nilai fitur, yaitu fitur bentuk dan fitur histogram dari hasil segmentasi citra nukleus. Nilai – nilai fitur tersebut yang selanjutnya digunakan sebagai input sistem kecerdasan buatan untuk mengklasifikasi data menjadi sel normal atau sel abnormal.
3.3 Pengolahan Citra Digital
Citra digital sel serviks tunggal berwarna diubah menjadi citra abu – abu yang memiliki satu derajat keabuan dengan itensitas 0 – 255. Sebelum disegmentasi, citra digital sel serviks tunggal diolah menggunakan beberapa jenis teknik olah citra. Pengolahan citra yang
Clustering data citra sel serviks menggunakan fuzzy c – means dan k - means
Klasifikasi data citra sel serviks menggunakan backpropagation
Data citra terklasifikasi Data Citra Sel Serviks Tunggal
Grayscalling
Pengolahan Citra Digital
Ekstraksi Fitur Bentuk
Histogram Citra
dilakukan antara lain median filtering, contrast stretching, morphologi processing. Teknik
median filtering digunakan untuk menghilangkan noise pada citra grayscale sel serviks.
Selanjutnya citra digital tersebut diperbaiki kontrasnya menggunakan teknik contrast
stretching. Citra hasil contrast stretching kemudian diolah kembali menggunakan morphological processing, yaitu teknik opening dan closing. Pengolahan ini dilakukan untuk
menghilangkan adanya daerah – daerah kecil berwarna gelap atau terang (small bright or
dark regions) yang dapat mengganggu proses segmentasi.
3.4 Segmentasi Nukleus
Proses segmentasi area nukleus pada citra dilakukan dalam dua tahap yaitu dengan teknik thresholding dan teknik clearing. Pada teknik thresholding digunakan nilai level intensitas sebesar 0,2 sebagai nilai ambang, agar area nukleus dapat disegmentasi secara utuh. Hasil segmentasi kemudian diproses kembali menggunakan teknik clearing. Tahap ini dilakukan untuk menghilangkan daerah selain area nukleus yang ikut tersegmentasi. Hasil segmentasi merupakan citra biner nukleus sel serviks.
3.5 Ekstraksi Fitur
Sebanyak 11 jenis fitur digunakan dalam penelitian ini, yang terdiri atas fitur bentuk dan fitur statistik. Fitur bentuk diekstraksi dari citra hasil segmentasi, sedangkan fitur histogram diekstraksi dari hasil histogram citra. Berikut ini beberapa fitur yang digunakan:
1. Fitur bentuk [8]
a. Area nukleus: nilai skalar dari jumlah keseluruhan pixel di wilayah nukleus. b. Perimeter nukleus: nilai skalar dari jumlah keseluruhan pixel pada batas (outline)
dari bentuk nukleus.
c. Faktor bentuk nukleus: nilai skalar yang didefinisikan dalam persamaan 5.
𝑆ℎ𝑎𝑝𝑒𝑁𝑢𝑘𝑙𝑒𝑢𝑠 =𝑃𝑒𝑟𝑖𝑚𝑒𝑡𝑒𝑟𝑁𝑢𝑘𝑙𝑒𝑢𝑠
2
𝐴𝑟𝑒𝑎𝑁𝑢𝑘𝑙𝑒𝑢𝑠
d. Faktor kebundaran nukleus: nilai skalar yang didefinisikan dalam persamaan 6.
𝑅𝑜𝑢𝑛𝑑𝑁𝑢𝑘𝑙𝑒𝑢𝑠 = 4 𝑥𝜋𝑥𝐴𝑟𝑒𝑎𝑁𝑢𝑘𝑙𝑒𝑢𝑠 𝑃𝑒𝑟𝑖𝑚𝑒𝑡𝑒𝑟𝑁𝑢𝑘𝑙𝑒𝑢𝑠2
2. Fitur histogram [11]
a. Mean: nilai skalar yang menggambarkan rerata nilai pixel pada masing – masing intensitas warna citra.
b. Standard deviation: nilai skalar yang menggambarkan penyebaran intensitas pada citra, serta sebagai indikator kontras pada citra.
(5)
c. Entropy: nilai skalar yang menggambarkan kehalusan (smoothness) dari citra
dalam hal distribusi derajat keabuannya.
d. Means square: nilai skalar yang didefinisikan dalam persamaan 7.
𝑚2= ∑ 𝑥2𝑝(𝑥) 𝐿
𝑥=0
e. Variansi: nilai skalar yang didefinisikan dalam persamaan 8.
𝜇2= ∑(𝑥 − 𝑚1)2𝑝(𝑥) 𝐿
𝑥=0
f. Skewness: nilai skalar yang menunjukkan derajat ketidaksimetrisan kurva histogram terkait distribusi intensitas dalam suatu citra.
g. Kurtosis: nilai skalar yang menunjukkan tingkat keruncingan relatif kurva histogram citra terkait distribusi intensitas dalam suatu citra.
3.6 Clustering Data Menggunakan Fuzzy C – Means dan K – Means
Nilai skalar hasil ekstraksi fitur selanjutnya digunakan untuk input sistem clustering
fuzzy c – means dan k – means. Metode ini digunakan untuk mengelompokkan data masukan
sesuai dengan kesamaan ciri. Data input akan dikelompokkan menjadi dua kelompok, yaitu cluster 1 dan cluster 2.
Proses clustering menggunakan data pelatihan sebanyak 150, yang terdiri atas 100 data sel abnormal dan 50 data sel normal. Data tersebut diolah terlebih dahulu menggunakan proses oleh citra, segmentasi nukleus, dan dilanjutkan dengan ekstraksi fitur. Nilai – nilai fitur tersebut dibagi menjadi 10 komposisi fitur yang berbeda. Masing – masing komposisi selanjutnya digunakan sebagai input clustering fuzzy c – means dan k – means. Hasil dari proses clustering ini yaitu salah satu set fitur dengan hasil terbaik. Dipilih juga metode
clustering yang memberikan hasil terbaik diantara keduanya. Hasil tersebut selanjutnya
digunakan sebagai data masukan pada tahap klasifikasi backpropagation.
3.7 Klasifikasi Data Menggunakan Sistem Jaringan Backpropagation
Hasil clustering yang telah diseleksi akan menjadi input untuk sistem jaringan saraf tiruan. Implementasi dalam klasifikasi data ini terdiri atas dua tahap yaitu pelatihan dan pengujian. Tahap pelatihan menggunakan data hasil clustering sebanyak 90, yang terdiri atas 16 data pada cluster 1 dan 74 pada cluster 2. Adapun parameter yang digunakan dalam pelatihan yaitu maksimum iterasi, laju pembelajaran (learning rate), dan jumlah neuron pada (7)
hidden layer. Parameter nilai eror yang digunakan sebagai kriteria penghentian iterasi pada
penelitian ini sebesar 10-5. Nilai parameter dan bobot akhir yang menghasilkan akurasi terbaik digunakan untuk proses pengujian.
Tahap pengujian menggunakan data uji sebanyak 45, yang terdiri atas 30 data sel abnormal dan 15 data sel abnormal. Dalam proses ini digunakan nilai parameter dan bobot akhir yang menghasilkan akurasi terbaik dari tahap pelatihan.
4. Hasil Dan Pembahasan 4.1 Segmentasi Nukleus
Gambar 3. Serangkaian proses pengolahan citra hingga segmentasi nukleus (a) citra RGB (b) citra grayscale (c) citra hasil median filtering (d) citra hasil contrast stretching
(e) citra hasil opening (f) citra hasil closing (g) citra hasil thresholding (h) citra hasil
clearing
(Keterangan: obyek di dalam kotak merah merupakan obyek selain area nukleus yang dihilangkan)
Keseluruhan data sel serviks tunggal melalui proses segmentasi nukleus dan beberapa tahapan pengolahan citra. Beberapa tahapan tersebut yaitu grayscalling,
median filtering, contrast stretching, dan metode morphological processing yang terdiri
atas teknik opening dan teknik closing.
Citra sel serviks tunggal selanjutnya disegmentasi area nukleusnya menggunakan teknik thresholding. Proses segmentasi pada penelitian ini menggunakan nilai level
thresholding pada masing – masing citra sebesar 0,2 (rentang 0 – 1). Nilai ini didapatkan
berdasarkan analisis histogram yang dilakukan pada sampel citra sel serviks. Obyek selain area nukleus yang terdapat pada citra hasil segmentasi selanjutnya dihilangkan menggunakan teknik clearing.
(e) (f) (g) (h) (a) (b) (c) (d)
4.2 Ekstraksi Fitur Citra
Hasil ekstraksi fitur ditampilkan dalam bentuk plot yang disajikan pada gambar 4.
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Area Nukleus Abnormal Normal 0 50 100 150 200 250 300 350 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Perimeter Nukleus Abnormal Normal 0 5 10 15 20 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ia li F it u r
Data Train
ke-Faktor Bentuk Nukleus
Abnormal Normal 0 0.5 1 1.5 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Kebundaran Nukleus Abnormal Normal 0 50 100 150 200 250 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Mean Abnormal Normal 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i Fi tu r
Data Train
ke-Standard Deviation Abnormal Normal 4.5 6.0 7.5 9.0 0 50 100 150 N ila i F it u r
Data Train
ke-Entropy Abnormal Normal 0 20 40 60 80 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Standard Deviation Abnormal Normal 0.00E+00 5.00E+06 1.00E+07 1.50E+07 2.00E+07 2.50E+07 3.00E+07 0 50 100 150 N ila i F ir u r
Data Train
ke-Kurtosis Abnormal Normal -200000 -100000 0 100000 200000 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Skewness
4.3 Clustering Data K-means dan Fuzzy c-means (FCM)
Clustering k – means dan fuzzy c – means dilakukan dengan mengelompokkan nilai
dari 10 macam komposisi fitur yang telah dibuat. Data input merupakan data latih, yaitu sebanyak 100 data sel abnormal dan 50 sel data normal. Komposisi 8 fitur yaitu area, perimeter, shape factor, roundness, mean, standard deviation, entropy, dan variansi memberikan hasil perbandingan yang terbaik diantara kesepuluh komposisi fitur.
Clustering metode fuzzy c – means memberikan hasil dengan tingkat kecocokan yang
lebih baik, dimana c1 sebanyak 16 dan c2 sebanyak 74. Metode k – means menghasilkan perbandingan tingkat kecocokan sebesar 22 untuk c1 dan 41 untuk c2. Data hasil
clustering terbaik selanjutnya digunakan sebagai data masukan pada sistem pelatihan backpropagation.
4.4 Hasil Pelatihan Backpropagation
Terdapat beberapa parameter yang digunakan dalam proses pelatihan, yaitu maksimum iterasi, laju pembelajaran (learning rate), dan jumlah neuron pada hidden
layer. Selain itu digunakan kriteria penghentian iterasi yaitu nilai eror sebesar 10-5. Bobot akhir pelatihan yang menghasilkan akurasi terbaik selanjutnya digunakan untuk tahap pengujian. Dalam penelitian ini akurasi terbaik dihasilkan dari jumlah neuron hidden layer sebanyak 10, nilai laju pembelajaran 0,2, dan maksimal epoh 300.
Tabel 1. Nilai akurasi hasil training (kriteria berhenti maksimum epoh)
Max epoh Jumlah Neuron Hidden
Layer Laju Pembelajaran Akurasi 100 10 0,2 80% 200 10 0,2 82% 300 10 0,2 100%
4.5 Hasil Pengujian Backpropagation
5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 N ila i F it u r
Data Train
ke-Means Square
Tahap pengujian dilakukan pada data uji sebanyak 45, yang terdiri atas 30 data sel abnormal dan 15 data sel normal. Set data selanjutnya diujikan menggunakan nilai bobot akhir dari proses pelatihan. Akurasi yang dihasilkan dari proses pengujian sebesar 84,44, dengan jumlah 38 data yang sesuai dan 7 data yang tidak sesuai dengan hasil diagnosis ahli. Ketidaksesuaian beberapa data dengan target klasifikasi (hasil klasifikasi dari ahli sitologi atau dokter) ditampilkan pada Gambar 5.
Gambar 5. Grafik perbandingan target dan output pengujian backpropagation (Keterangan: kotak merah menunjukan ketidaksesuaian antara target dan output ) Gambar 5 memberikan informasi sejumlah 38 data sesuai dengan target, sedangkan 7 data yaitu data ke 9, 10, 11, 12, 13, 14, dan 33 tidak sesuai dengan target hasil diagnosis ahli. Kesalahan klasifikasi yang terjadi pada kedua data tersebut diduga karena kesalahan interpretasi data. Citra tersebut masih berada pada awal transformasi dari sel normal menjadi sel abnormal, sehingga nilai fitur area dan perimeter dari kedua sel berada pada rentang nilai sel normal. Area sitoplasma pada citra sel serviks memiliki perbedaan yang signifikan antara sel normal dan sel abnormal. Area sitoplasma didapatkan melalui teknik segmentasi dengan nilai threshold lebih dari satu, karena area tersebut sulit
di-threshold dari area background. Langkah tersebut dapat dilakukan menggunakan teknik
pengolahan citra lain, seperti deteksi kontur atau adaptive tresholding dengan nilai
threshold lebih dari satu. Teknik ini dapat menghasilkan citra hasil segmentasi akan
mengikuti kondisi citra. Teknik segmentasi lain juga diharapkan dapat mengatasi masalah pada area nukleus yang tidak tersegmentasi secara utuh, ataupun area bukan nukleus yang ikut tersegmentasi.
Penyempurnaan program ini dapat dilakukan dengan langkah memilih fitur, dan menambah data latih. Pemilihan fitur yang dapat mewakili ciri masing – masing data dapat meningkatkan hasil akurasi. Fitur – fitur tersebut digunakan untuk memaksimalkan persamaan ciri antara anggota dalam satu kelompok, dan meminimumkan kemiripan antara satu kelompok dan kelompok yang lainnya.
0 1 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 Ta rg e t/ O u tp u t B ac kp ro p ag at io n Data ke -Series1 Series2
5. Kesimpulan
Berdasarkan hasil penelitian ini, dapat disimpulkan bahwa:
1. Fitur citra sel serviks yang digunakan sebagai input identifikasi pada penelitian ini terdiri atas fitur bentuk dan histogram. Fitur bentuk meliputi area, perimeter (keliling), faktor bentuk, dan kebundaran, serta fitur statistik histogram meliputi
mean, standard deviation, entropy, dan variansi.
2. Metode backpropagation menghasilkan tingkat kecocokan sebanyak 38 data, dari data pengujian sebanyak 45.
3. Tingkat akurasi optimal yang dihasilkan melalui proses pengujian sistem jaringan saraf tiruan backpropagation sebesar 84,44% dengan nilai parameter jumlah neuron pada hidden layer 10 dan nilai laju pembelajaran 0,2.
4. Hasil penelitian yang didapatkan memiliki nilai akurasi yang lebih rendah dibandingkan dengan penelitian yang telah dilakukan oleh Dewi pada tahun 2013, sebesar 93,33%.
Daftar Pustaka
[1] American Cancer Society, 2013, Guide: Cervical Cancer,
http://www.cancer.org/docroot/CRI/content.html, 21 November 2013.
[2] Rosidi, B., Jalil, N., Pista, N.M., Ismail, L.H., Supriyanto, E., Mengko, T.L, 2011,
Classification of Cervical Cells Based on Labeled Colour Intensitiy Distribution, International Journal
of Biology and Biomedical Engineering.
[3] Suryatenggara, Jeremiah, 2009, Cervix Cancer Detection Based On Pattern Recognition
In Cervical Cytological Slide Images, Fakultas Life Science, Program Studi Biomedical Engineering, Swiss Germany University (SGU).
[4] Dewi, E.M, 2013, Ekstraksi Fitur dan Klasifikasi Sel Serviks dengan Metode Learning
Vector Quantization (LVQ) Untuk Deteksi Dini
Kanker Serviks, Program Studi S1 Teknobiomedik, Fakultas Sains dan Teknologi, Universitas Airlangga.
[5] Elalfi, Atta., Eisa, Mohamed., Ahmed, Hosnia, 2013, Artificial Neural Networks in
Medical Images for Diagnosis Heart Valve Diseases, International Journal of Computer
Science Issues, Vol. 10, Issue 5, No 1, Egypt. [6] FF, Setiawan, 2010, Filter Bandpass dan Bandstop Untuk Menurunkan Noise Pada Citra
Menggunakan Delphi 7.0, Program Studi Matematika Ekstensi, Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Diponegoro Semarang.
[7] Solomon, C., Breckon, T, 2011, Fundamental of Digital Image Processing: A Practical
Approach with Examples in Matlab, John Willey &
Sons, Ltd, United Kingdom.
[8] Putra, Darma, 2009, Pengolahan Citra Digital, Penerbit Andi, Yogyakarta.
[9] Luthfi, E.T, 2007, Fuzzy C – Means Untuk Clustering Data (Studi Kasus: Data Performance Mengajar Dosen), Yogyakarta.
[10] Nasution, Helfi, 2012, Implementasi Logika Fuzzy pada Sistem Kecerdasan Buatan, Program Studi Teknik Informatika, Jurusan Teknik Elektro, Fakultas Teknik, Universitas Tanjungpura. [11] Gonzalez, R.C.,Woods, Richard E, 2002, Digital Image Processing, Pearson Education,
Inc, New Jersey.
Disetujui oleh:
Pembimbing I,
Drs. Adri Supardi, M. Sc NIP. 195603031986011002
Pembimbing II,
Endah Purwanti, S. Si., M. T NIP. 1977103120091220003