IMPLEMENTASI METODE SIMILARITY UNTUK PENDUKUNG
KEPUTUSAN DIAGNOSIS KANKER SERVIKS
SKRIPSI
Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu
Jurusan Informatika
Disusun Oleh:
Upi Rianantika
M0508073
JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
commit to user
MOTTO
“Anda lebih dari yang anda p ikirkan, dan anda bisa mera ih leb ih dari yang
sudah anda capai sekarang”
- tiya, sa marpan –
“Do what you can, with what you have, wh ere you a re”
“It is hard to fail, but it is worse never to have tried to succeed”
-Th eodore Roosevelt-
“Untuk mendapatkan hal-hal yang besar, jangan meremeh kan hal-hal yang
sederhana ”
PERSEMBAHAN
Karya ini penulis persembahkan kepada :
- Ayah, ibu dan keluarga tercinta.
- Teman-teman S1 informatika angkatan 2008.
- Saudari-saudariku di Kost Mint.
commit to user
IMPLEMENTASI METODE SIMILARITY UNTUK PENDUKUNG
KEPUTUSAN DIAGNOSIS KANKER SERVIKS
UPI RIANANTIKA
Jurusan Infromatika. Fakultas MIPA. Universitas Sebelas Maret
ABSTRAK
Similarity merupakan salah satu metode yang digunakan untuk
menghitung kemiripan dua objek. Similarity banyak digunakan dalam perhitungan
klasifikasi, pengelompokan, dll. Untuk menghindari kesalahan diagnosis, metode similarity jaccard dan similarity cosine digunakan untuk mendukung diagnosis
kanker serviks. Data yang digunakan berupa data matriks gejala penya kit kanker,
data matriks gejala non kanker, dan data matriks gejala pasien.
Perhitungan similarity dilakukan dengan cara membandingkan data
matriks gejala pasien dengan data matriks gejala penyakit kanker. Data matriks
gejala pasien dengan data matriks gejala penyakit non kanker. Kemudian dihitung nilai similaritynya. Nilai similarity terbesar menjadi kesimpulan hasil diagnosis.
Hasil diagnosis dibandingkan dengan data sekunder kemudian dihitung akurasinya.
Similarity Jaccard memiliki jumlah rekomendasi paling banyak yaitu 4 buah rekomendasi sedangkan similarity Cosine memiliki jumlah rekomendasi
paling banyak yaitu 3 buah rekomendasi. Akurasi hasil pengujian sistem pada 54
data uji untuk similarity Jaccard di urutan pertama adalah 96,69%, dan di urutan kedua adalah 3,17%. Akurasi hasil pengujian untuk similarity Cosine di urutan
pertama adalah 96,69%, dan di urutan kedua adalah 3,17%.
IMPLEMENTATION OF SIMILARITY METHOD FOR CERVICAL
CANCER DIAGNOSIS
UPI RIANANTIKA
Department of Informatics. Mathematic and Natural Science Faculty. Sebelas Maret University
ABSTRACT
Similarity is one of a methods used to calculate the similarity of two
objects. Similarity is widely used in classification, clustering, etc. Jaccard and Cosine sim ilarity method is used to support the diagnosis of cervical ca ncer and
avoid misdiagnosis. The data are cancer symptoms matrix data, non-cancerous
symptoms matrix data, and patients’ symptoms matrix data.
The calculation is done by comparing the similarity between cancer
symptoms matrix data and patients’ symptoms matrix data. Then, compare
patients’ s ymptoms matrix data and non-cancerous symptoms matrix data. Then, we calculated value of similarity. The greatest value of similarity became the
conclusion of diagnosis. The conclusion of diagnosis is compared with secondary data for accuracy calculation.
Jaccard similarity has 4 recommendations while Cosine similarity has 3 recommendations. Accuracy of the results of testing the system on 54 test data for
Jaccard similarity in the first place was 96.69%, and the second was 3.17%. The
accuracy of the test results for Cosine similarity in the first place was 96.69%, and the second was 3.17%.
commit to user
KATA PENGANTAR
Puji syukur kehadirat Allah SWT karena dengan ridho dan rahmat-Nya,
penulis dapat menyelesaikan Tugas Akhir yang berjudul ”Implementasi Metode
Similarity untuk Pendukung Keputusan Diagnosis Kanker Serviks”. Telah banyak hambatan dan tantangan yang penulis hadapi dalam menyusun Tugas Akhir ini.
Namun berkat bimbingan, dukungan, dan saran dari berbagai pihak, penulis dapat menyelesaikannya dengan lancar.
Penulis mengucapkan terima kasih kepada berbagai pihak yang tela h
memberikan bimbingan, dukungan dan saran dalam pembuatan laporan ini, terutama kepada:
1. Bapak Ristu Saptono, S.Si, M.T selaku Dosen Pembimbing I
yang telah memberikan pengarahan dan bimbingan selama proses penyusunan Tugas Akhir ini.
2. Ibu Umi Salamah, S.Si, M.Kom selaku Dosen Pembimbing II
sekaligus Ketua Jurusan Informatika yang telah memberikan pengarahan dan bimbingan selama proses penyusunan Tugas Akhir ini.
3. Bapak Wiharto, S.T, M .Kom selaku Pembimbing Akademik yang telah memberikan pengarahan dan bimbingan selama proses menuntut ilmu di
jurusan Informatika.
4. Orangtua tercinta yang selalu memberi dukungan moral dan
material selama proses penyusunan Tugas Akhir ini.
5. Pihak-pihak lain yang telah membantu pelaksanaan dan pembuatan laporan Tugas Akhir ini.
Semoga skripsi ini dapat bermanfaat bagi pihak yang berkepentingan.
Surakarta, Januari 2013
DAFTAR ISI
HALAM AN JUDUL ... i
HALAM AN PERSETUJUAN ... ii
HALAM AN PENGESAHAN ... iii
HALAM AN MOTTO ... iv
HALAM AN PERSEMBAHAN ... v
ABSTRAK ... vi
ABSTRACT ... vii
KATA PENGANTAR ... viii
DAFTAR ISI ... ix
DAFTAR TABEL ... x
DAFTAR GAM BAR ... xi
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan M asalah ... 1
1.3 Batasan Masalah ... 1
1.4 Tujuan Penelitian ... 2
1.5 M anfaat Penelitian ... 2
1.6 Sistematika Penelitian ... 2
BAB II TINJAUAN PUSTAKA ... 4
2.1 Landasan Teori ... 4
2.1.1 Kanker... 4
2.1.2 Kanker Serviks ... 4
2.1.3 Pap Smear ... 6
2.1.4 Similarity ... 7
2.2 Penelitian Terkait ... 11
2.3 Rencana Penelitian ... 13
BAB III METODE PENELITIAN ... 14
3.1 Pengumpulan Data ... 14
commit to user
3.3 Implementasi Sistem ... 15
3.4 Pengujian dan Validasi Sistem... 17
3.5 Penulisan Laporan Penelitian... 18
BAB IV PEM BAHASAN ... 19
4.1 Gambaran Umum Sistem... 19
4.2 Perancangan Database ... 20
4.3 Hasil Implementasi Sistem ... 20
4.4 Hasil Pengujian ... 20
BAB V KESIM PULAN DAN SARAN... 31
5.1 Kesimpulan ... 31
5.2 Saran ... 31
DAFTAR PUSTAKA ... 32
DAFTAR TABEL
Tabel 2.1 Matriks gejala penyakit carcinoma epidermoid, carcinoma sel
skuamus, dan pasien P01 ... 9
Tabel 4.1 Nilai sim ilarity Cosine pasien P31 dan P33 untuk penyakit suspek kanker, polip serviks, dan radang kronis ... 21
Tabel 4.2 Nilai similarity Jaccard pasien P31 dan P33 untuk penyakit suspek kanker, polip serviks, dan radang kronis ... 21
Tabel 4.3 Nilai sim ilarity Jaccard dan Cosine hasil pengujian 54 data ... 22
Tabel 4.4 Hasil perhitungan akurasi similarity Jaccard dan Cosine ... 30
Tabel 4.5 Jumlah hasil rekomendasi ... 30
commit to user
DAFTAR GAMBAR
Gambar 3.1 Alur Rancangan Penelitian ... 14
Gambar 3.2 Flowchart rule menampilkan pertanya an ... 16
DAFTAR LAMPIRAN
LAMPIRAN A ... 34
LAMPIRAN B ... 39
LAMPIRAN C ... 43
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kanker serviks merupakan jenis kanker terbanyak kedua pada wanita
setelah kanker payudara. Pada tahun 2005, lebih dari 250.000 kematian disebabkan oleh kanker serviks (Rasjidi, 2008). Terdapat lebih dari 440.000.000
individu yang terinfeksi Human Papilloma Virus (HPV). Hampir 80% kanker serviks terjadi di Negara berkembang termasuk Indonesia (Torpy, Burke, dan
Glass, 2007). Di Indonesia, setiap hari ditemuka n 41 kasus baru dan 20 kematian
akibat kanker serviks. Diperkirakan 40.000 kasus baru kanker serviks ditemukan setiap tahunnya (M arianda, 2004).
Perhitungan similarity banyak digunakan dalam perhitungan klasifikasi,
pengelompokan, dll. sebagai contoh yaitu perhitungan similarity jaccard digunakan untuk pengelompokan spesies ekologi. Sesudah itu, perhitungan
similarity diterapkan pada ilmu biologi, taksonomi, pencarian gambar, dan
masalah identifikasi biometrik seperti sidik jari (Cha, Tappert, dan Choi, 2010). Menurut Ahmed (2011), penggunaan sim ilarity dengan metode cased-based
rea soning untuk diagnosis memiliki keuntungan yang lebih baik dan mudah diterima petugas kesehatan dalam mendiagnosis suatu penyakit. Pada penelitian
yang dilakukan oleh Ahmed et al (2008), mereka melakukan perhitungan cosine similarity dan metode cased-based reasoning untuk mendiagnosis stress dengan
sensor suhu tubuh. Dari kasus tersebut, perhitungan similarity dapat diterapkan
pada diagnosis penyakit kanker serviks untuk membantu dan mendukung dokter dalam mendiagnosis kanker serviks.
1.2 Rumusan Masalah
Permasalahan yang akan dibahas dalam penelitian ini yaitu bagaim ana akurasi penggunaan perhitungan Similarity untuk pendukung keputusan dokter
dalam menentukan diagnosis kanker serviks.
1.3 Batasan Masalah
Batasan permasalahan yang akan dibahas dalam penelitian adalah:
commit to user
b. Inputan geja la yaitu data sekunder berupa tanda mikroskopis yang didapat
dari hasil tes pap smear. Data yang digunakan berupa data biner: 0 untuk tidak dan 1 untuk ya.
c. Tanda gejala yang dimasukan hanya tanda gejala carcin oma epid ermoid,
adenocarsinoma papilifer, polip serviks, radang kronis serviks, dan serviks normal.
d. Penelitian dilakukan pada sisi ginekologi sehingga besar sedikit jumlah inputan data geja la dari sisi patologi diabaikan.
e. Perhitungan similarity yang digunakan yaitu ja cca rd similarity dan cosin e
similarity.
1.4 Tujuan Penelitian
Tujuan penelitian ini adalah menerapkan metode Similarity dalam
perhitungan untuk pendukung keputusan dokter dalam menentukan diagnosis kanker serviks.
1.5 Manfaat Penelitian
Manfaat yang didapat dari penelitian ini adalah memudahkan dokter dan tenaga kesehatan dalam mendukung keputusan dalam penentuan diagnosis kanker
serviks.
1.6Sistematika Penulisan
Sistematika penulisan laporan tugas akhir ini adalah sebagai berikut:
BAB 1 : PENDAHULUAN
Bab Pendahuluan memuat tentang latar belakang masalah, perumusan masalah,
tujuan dan manfaat, metodologi dan sistematika penyusunan laporan.
BAB 2 : TINJAUAN PUSTAKA
Bab tinjauan pustaka menjelaskan tentang dasar teori yang digunakan untuk
melakukan penelitian tugas akhir.
BAB 3 : METODE PENELITIAN
Bab metode penelitian memuat penjelasan tentang langkah-la ngkah yang harus
BAB 4 : PEMBAHASAN
Bab Pembahasan memuat pembahasan permasalahan yang telah dirumuskan dengan menggunakan landasan teori yang mendukung. Teori tersebut harus
mengacu pada pustaka yang digunakan. Pembaha san dilakukan pada metode
penyelesaian permasalahan.
BAB 5 : KESIMPULAN DAN SARAN
commit to user
BAB II
TINJAUAN PUSTAKA
2.1 Landasan Teori
2.1.1 Kanker
Kanker merupakan kumpulan sel abnormal yang terbentuk oleh sel-sel yang tumbuh secara terus-menerus, tidak terbatas, tidak terkoordinasi dengan
jaringan sekitarnya dan tidak berfungsi fisiologis (M ardiana, 2004). Kanker terjadi karena timbul dan berkembang biaknya jaringan sekitarnya (infiltratif) sambil
merusaknya (dekstrutif), dapat menyebar kebagian lain tubuh, dan umumnya fatal
jika dibiarkan (Dalimartha, 2004).
Pertumbuhan sel-sel kanker akan menyebabkan jaringan menjadi besar dan
disebut sebagai tumor. Tumor merupakan istilah yang dipakai untuk semua
bentuk pembengkakan atau benjolan dalam tubuh. Sel-sel kanker yang tumbuh cepat dan menyebar melalui pembuluh darah dan pembuluh getah bening.
Penja larannya kejaringan lain disebut sebagai metastasis. Ka nker mempunyai
karakteristik yang berbeda-beda. Ada yang tumbuh secara cepat, ada yang tumbuh tidak terlalu cepat, seperti kanker payudara (Bustan, 1997).
2.1.2 Kanker Serviks
Kanker Serviks ataupun lebih dikenali sebagai kanker leher rahim adalah
tumor ganas yang tumbuh di dalam leher rahim /serviks yang merupakan bagian terendah dari rahim yang menempel pada puncak vagina. Pada penderita kanker
serviks terdapat sekelompok jaringan yang tumbuh secara terus-menerus yang
tidak terbatas, tidak terkoordinasi dan tidak berguna bagi tubuh, sehingga jaringan disekitarnya tidak dapat berfungsi dengan baik. 90% dari kanker serviks berasal
dari sel skuamosa yang melapisi serviks dan 10% sisanya berasa l dari sel kelenjar
penghasil lendir pada saluran servikal yang menuju ke dalam rahim. Kanker serviks terjadi jika sel-sel serviks m enjadi abnormal dan membelah secara tak
terkendali (Rasjidi, 2008). Jika sel serviks terus membelah maka akan terbentuk
suatu massa jaringan yang disebut tumor yang bisa bersifat jinak atau ganas. Jika tumor tersebut ganas, maka keadaannya disebut kanker serviks. Kanker serviks
Secara histopatologis karsinoma serviks terdiri dari beberapa jenis. Dua
bentuk yang sering dijumpai adalah karsinoma epidermoid dan adenokarsinoma. Sekitar 70% merupakan karsinoma serviks jenis epidermoid, 15% jenis
adenokarsinoma dan 8% - 10% jenis adenoskuamosa 30. Karsinoma epidermoid
merupakan perubahan patologik yang terjadi di daerah sambungan skuamo -kolumner. Sel-sel epitel mengalami mutasi dan kemudian berkembang menjadi
karsinoma invasif. Sel kanker cenderung berbentuk oval atau poligonal denga n batas yang jelas, sitoplasma eosinofilik, inti sel pleimorfik dengan kromatin
bergranuler dan sering terlihat gambaran mitosis (Crum, Lester, dan Cotran,
2007).
a. Polip serviks
Polip serviks merupakan jenis tumor jinak yang umumnya
bertangkai, berasal dari mucosa intracervical tapi kadang-kadang dapat pula tumbuh dari daerah portio. Banyak polip serviks yang menunjukan
metaplasia yang luas diserta i infeksi, menyerupai permulaan dari
carcinoma. Ca ep idermoid kadang-kadang berasal dari polip. (Padjadjaran, 1981).
b. Carsinoma Epidermoid
Carsinoma Epidermo id merupakan jenis tumor ganas yang tumbuh
di daerah portio (cervix pars vaginalis). Pada stadium preklinis, Carsinoma Epidermoid tidak dapat dibedakan dengan cervicitis chronic
biasa. Pada stadium awal, sering tampak sebagai lesi di sekitar ostium
externu m, pada batas kedua jenis epitel. Tampaknya sebagai daerah yang
granuler, keras, lebih tinggi dari sekitarnya dan mudah berdarah. Pada
stadium setengah lanjut, telah mengenai sebagian besar atau seluruh bibir
portio. Bentuknya seperti bunga kol. Pada stadium lanjut, terjadi
pengrusakan dari jaringan cervix, sehingga tampaknya seperti ulcu s
dengan jaringan yang rapuh dan mudah berdarah. Selanjutnya jaringan
commit to user
c. Adenocarsinoma Papillifer
Ad enocarsinoma Papillifer merupakan jenis tumor ganas yang
tumbuh dari daerah canalis cervicalis. Kadang-kadang mulai dekat ostium
externu m, untuk kemudian tumbuh menonjol keluar. Anehnya
pertumbuhan sering membengkakkan cervix dan jaringan sekitarnya tanpa ada metastase ke vagina. Tanda mikroskopisnya yaitu tampak gambar
kelenjar yang atypis. Epitel kelenjarnya terdiri dari satu lapisan sedang pada sediaan lain ditemukan kelenjar yang berlapis-lapis (Padjadjaran,
1981).
2.1.3 Pap Smear
Tes Pap Smear adalah pemeriksaa n sitologi dari serviks dan porsio untuk
melihat adanya perubahan atau keganasan pada epitel serviks atau porsio
(displasia) sebagai tanda awal keganasan serviks atau prakanker (Rasjidi, Irwanto, dan Sulistyanto, 2008). Pap Smear merupakan suatu metode pemeriksaan sel-sel
yang diambil dari leher rahim dan kemudian diperiksa di bawah mikroskop. Pap
Smear merupakan tes yang aman dan murah dan telah dipakai bertahun-tahun lamanya untuk mendeteksi kelainan-kelainan yang terjadi pada sel-sel leher rahim
(Diananda, 2009).
Pemeriksaan Pap Smear berguna sebagai pemeriksaan penyaring
(skrining) dan pelacak adanya perubahan sel ke arah keganasan secara dini sehingga kelainan prakanker dapat terdeteksi serta pengobatannya menjadi lebih
murah dan mudah (Dalimartha, 2004). Pap Smear mampu mendeteksi lesi
prekursor pada stadium awal sehingga lesi dapat ditemukan saat terapi masih mungkin bersifat kuratif (Crum, Lester, dan Cotran, 2007).
Manfaat Pap Smear secara rinci dapat dijabarkan sebagai berikut
(Manuaba, 2005):
a. Pap Smear berguna dalam mendeteksi dini kanker serviks, kanker korpus
endometrium, keganasan tuba fallopi, dan mungkin keganasan ovarium.
c. Pap Smear bertujuan untuk mengikuti siklus menstruasi dengan ovulasi atau
tanpa ovulasi, menentukan maturitas kehamilan, dan menentukan kemungkunan keguguran pada hamil muda.
d. Pap Smear berguna untuk menentukan proses peradangan pad a berbagai
infeksi bakteri dan jamur.
2.1.4 Similarity (Karhendana, 2008)
Fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek tersebut berupa
bilangan riil. Umumnya, nilai yang dihasilkan oleh fungsi similarity berkisar pada
interval [0….1]. Namun, ada juga beberapa fungsi similarity yang menghasilka n nilai yang berada di luar interval tersebut. Semakin besar hasil fungsi similarity,
maka kedua objek yang dievaluasi dianggap mirip. Sebaliknya, semakin kecil
hasil fungsi similarity, maka kedua objek tersebut dianggap semakin berbeda. Pada fungsi yang menghasilkan nilai pada jangkauan [0….1], nilai 1
melambangkan kedua objek persis sama, sedangkan nilai 0 melambangkan kedua
objek sama sekali berbeda.
2.1.4.1Pengukuran Similarity (Karhendana, 2008)
Seperti telah dipaparkan pada bagian sebelumnya, analisis cluster merupakan proses identifikasi kelompok-kelompok objek yang m irip (similar)
satu sama lain. Oleh karena itu, pengukuran similarity memegang peranan yang amat penting pada algoritma clu stering, sebab kualitas hasil analisis cluster sangat
tergantung pada fungsi similarity yang digunakan. Saat ini telah dikembangkan
banyak metode pengukuran similarity yang dapat digunakan untuk berbagai keperluan. Pada bagian ini hanya akan dibahas beberapa pengukuran similarity
yang terkait.
Secara umum, fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek tersebut
berupa bilangan riil. Umumnya, nilai yang dihasilkan oleh fungsi similarity
berkisar pada interval [0 . . . 1]. Namun, ada juga beberapa fungsi similarity yang menghasilkan nila i yang berada di luar interval tersebut. Untuk memetakan hasil
commit to user
Semakin besar hasil fungsi similarity, maka kedua objek yang die valuasi
dianggap semakin mirip. Sebaliknya, semakin kecil hasil fungsi similarity, maka kedua objek tersebut dianggap semakin berbeda. Pada fungsi yang menghasilkan
nilai pada jangkauan [0 . . . 1], nilai 1 melambangkan kedua objek persis sama,
sedangkan nilai 0 melambangkan kedua objek sama sekali berbeda.
Sebenarnya, selain pengukuran similarity, dikenal juga fungsi pengukuran
jarak (distance) atau perbedaan (dissimilarity) antar objek. Namun, fungsi distance lebih jarang digunakan. Sifat fungsi distance berkebalikan dengan fungsi
similarity. Jika hasil fungsi distance semakin besar, maka kedua objek yang
dievaluasi dianggap semakin berbeda. Namun, semakin kecil hasil fungsi distance, maka kedua objek tersebut dianggap semakin mirip (Datar dkk, 2004).
2.1.4.2Pengukuran Similarity Berbasis Himpunan
Pengukuran similarity yang berbasis himpunan disebut juga koefisien asosiasi karena fungsi ini mengukur persamaan dan perbedaan antara dua objek
pada himpunan atribut masing-masing objek. Beberapa fungsi similarity yang
berbasis himpunan adalah sebagai berikut (Kim dan Choi, 1998): a. Koefisien Jaccard
, =
b. Koefisien Cosine
, =
| | .
dengan :
, = similarity antara Oi terhadap Oj
|Oi| = jumlah nilai anggota himpunan Oi
|Oj| = jumlah nilai anggota himpunan Oj
Fungsi-fungsi similarity tersebut hanya berlaku untuk data matriks yang
atributnya berjenis biner (0 atau 1). Untuk diterapkan pada atribut data kontinyu
yang bernilai riil, fungsi-fungsi tersebut harus digeneralisasi. Hasil generalisasi fungsi dapat digunakan pada perhitungan similarity data geometrik. Beberapa
berikut (Kim dan Choi, 1998):
a. Koefisien Jaccard
, =
( ) (2.1)
b. Koefisien Cosine
, =
.
(2.2)
dengan:
, = similarity antara Oi terhadap Oj
Oin = nilai anggota himpunan ke-n dari himpunan Oi
Ojn = nilai anggota himpunan ke-n dari himpunan Oj
Contoh perhitungan similarity
a. Disajikan matriks data gejala penyakit pasien P01, data penyakit ca rcinoma epidermoid, dan data peyakit ca rcinoma sel skuamus. G01
sampai dengan G38 merupakan id gejala penyakit.
Tabel 2.1 Matriks gejala penyakit carcinoma epidermoid, carcinoma sel
skuamus, dan pasien P01
id_gjl Ca epidermoid P01 Ca Sel Skuamus
G01 0 0 0
G02 1 1 0
G03 0 0 0
G04 0 0 0
G05 1 0 0
G06 1 1 0
G07 0 0 0
G08 0 0 1
G09 1 0 0
G10 1 1 1
commit to user
id_gjl Ca epidermoid P01 Ca Sel Skuamus
G12 0 0 0
G13 0 0 1
G14 0 0 1
G15 0 0 0
G16 0 0 0
G17 0 0 0
G18 0 0 0
G19 0 0 0
G20 0 0 0
G21 0 0 0
G22 0 0 0
G23 0 0 0
G24 0 0 0
G25 0 0 0
G26 0 0 0
G27 0 0 0
G28 0 0 0
G29 0 0 0
G30 0 0 0
G31 0 0 0
G32 0 0 0
G33 0 0 0
G34 0 0 1
G37 0 0 0
G36 0 0 0
G35 0 0 0
G38 0 0 0
b. Membandingkan matriks pasien P01 dengan matriks carcinoma
yaitu n = 4. Kemudian menghitung gabungan anggota matriks yang
bernilai 1, yaitu n P01 = 4 dan n ca ep idermoid = 6.
c. Menghitung similarity yang digunakan yaitu similarity Jaccard seperti
pada persamaan 2.1
, =
+
( 01, ) = 4
(4 + 6 4)= 0,66667
Nilai Jaccard untuk (P01,ca epidermoid) adalah 0,66667
d. Membandingkan matriks pasien P01 dengan matriks ca rsino ma sel sku amus. Kemudian menghitung irisan anggota matriks yang bernila i 1,
yaitu n = 2. Menghitung gabungan anggota matriks yang bernilai 1, yaitu n P01 =4 dan n ca sel skuamus = 6.
e. Menghitung similarity Jaccard dengan persamaan 2.1
, =
+
( 01, ) = 2
(4 + 6 2)= 0,25
Nilai Jaccard untuk (P01,ca sel skuamus) adalah 0,66667
f. Nilai similarity terbesar menjadi kesimpulan. Jadi, diagnosis pasien P01
adalah carcinoma epidermoid dengan nilai similarity 0,66667.
2.2 Penelitian Terkait
Penelitian ini mengacu pada beberapa penelitian dan studi sejenis yang
telah dilakukan sebelumnya. Penelitian dan studi tersebut akan diuraikan sebagai berikut:
a) “Sistem Pakar Diagnosis Awal Kanker Serviks Dengan Metode
Certainty Factor (Rumaisa, Rijayana, Nurafianti, 2010)”
Pada penelitian ini, peneliti menggunakan metode certain ty factor untuk
menghitung persentase hasil diagnosis kanker serviks. Data yang digunakan
commit to user
menggunakan metode kepastian nilai (berdasarkan pengetahuan pakar) yang
diharapkan memberikan kepercayaan terhadap diagnosis tentang penyakit yang dideritanya.
b) “Efficient Algorithms for Similarity Measures Over Sequential Data: A
look Beyond Kernels (Rieck, Laskov, Muller, 2006)”
Pada penelitian ini, peneliti menggunakan perhitungan komputasi fungsi
distance yang efisien dan koefisien similarity untuk data sekuensial. Dua
algoritma tersebut menggunakan struktur data yang berbeda untuk perhitungan
yang efisien dan menghasilkan run time linear sepanjang urutan. Peneliti
menyimpulkan bahwa kemiripan pada kernel, sejumlah besar distance dan koefisien similarity dapat dihitung secara efektif untuk data sekuensia l.
Penggunaan perhitunga n similarity mengijinkan satu untuk menyelidiki matriks
yang tidak biasa untuk aplikasi pembelajaran pada area kasus tertentu. Sebagai contoh, pada eksperimen yang dilakukan peneliti, pada pembelajaran tidak
terawasi pada deteksi intrusi jaringan diperoleh n-grams muatan koneksi denga n
koefisien Kulczynski. Jadi penerapan distance pada data sekuensial lebih menguntungkan daripada penggunaan implisit jarak Euclidean yang diinduksi
oleh kernel. Terutama sangat menjanjikan adalah aplikasi lebih lanjut dari algoritma yang diusulkan dalam lingkup keamanan jaringan dan bioinformatika.
c) “Case-based Reasoning for Diagnosis of Stress using Enhanced Cosine
and Fuzzy Similarity(Ahmed, Begum, Funk, Xiong, Scheele,2008)”
Pada penelitian ini, peneliti menggunakan metode cosine similarity, fuzzy
similarity, metode Case-based Reasoning(CBR) untuk mendiagnosis stress. Data yang digunakan adalah data hasil interpretasi sinyal deteksi suhu jari. Peneliti
menggunakan suhu jari untuk mendeteksi dinigejala stress. Metode yang
digunakan peneliti adalah fuzzy similarity dan Cosin e Simila rity. Fuzzy simila rity digunakan untuk menampung dan menangkap ketidaktepatan pada perhitungan
sensor. Cosine similarity direlasikan dengan onto logy kemudian digunakan untuk
2.3 Rencana Penelitian
Penelitian yang akan dilakukan yaitu melakukan penerapan metode similarity untuk mendukung keputusan dokter terhadap diagnosis kanker serviks.
Tanda gejala yang didapat dari hasil pemeriksaan pap smear digunakan untuk
inputan data uji. Inputan dibandingkan dengan tabel gejala yang ada pada database kemudian dihitung menggunakan Sim ilarity. Hasil dari perhitunga n
commit to user
BAB III
METODE PENELITIAN
Penelitian akan dilaksanakan berdasarkan rancangan penelitian seperti
yang ditunjukkan pada Gambar 3.1.
Gambar 3.1 Alur Rancangan Penelitian
Uraian rancangan penelitian adalah sebagai berikut:
3.1 Pengumpulan Data
Tahap pengumpulan data dilakukan dengan studi literatur dan wawancara
dengan dokter spesialis obstetric dan ginekologi. Studi literatur dila kukan untuk mempelajari masalah kanker serviks, gejala klinis kanker serviks, metode
similarity, dan pengukuran distance dari jurnal, penelitian dan literatur lain yang berkaitan dan telah terakreditasi.
Wawancara dengan dokter spesialis obstetric dan ginekologi dan studi
literature untuk mendapatkan data gejala. Data gejala yang diperoleh sebanyak 38
gejala yang terdiri dari gejala ca rcinoma epidermoid, adenoca rsinoma, carcinoma
squamous cell, polip serviks, radang kronis kelas 2, dan normal smear. Data
mendapatkan data pengujian. Data pengujian sebanyak 54 pasien yang mengikuti
pap smear dengan hasil diagnosis yang berbeda-beda.
3.2 Analisis dan Perancangan Sistem
Tahap analisis dan perancangan sistem dilakukan dengan kegiatan berikut:
a. Mendefinisikan permasalahan. Permasalahan yang akan dibahas dalam penelitian ini adalah penggunaan similarity untuk menentukan
diagnosis kanker serviks. b. Menentukan scope.
c. Merancang database sistem. Menentukan tabel geja la carcinoma
ep idermoid, adenocarsinoma, carcino ma squamous cell, polip serviks,
radang kronis, dan normal smear. Menentukan tabel pasien yang ikut
pap smear. 55 data gejala pasien dirandom untuk data uji.
d. Mendefinisikan solusi dari permasalahan. Solusi dari permasalahan tersebut adalah menerapkan metode jaccard similarity untuk
menentukan diagnosis kanker serviks dari data-data pap smear yang
dilakukan oleh pasien.
e. Melakukan pengujian. Pengujian dilakukan dengan menginputkan
data pasien pada sistem kemudian hasil output sistem dibandingka n dengan data asli(data sekunder).
3.3 Implementasi Sistem
Implementasi sistem dilakukan dengan menulis kode program sesuai
dengan algoritma metode similarity menggunakan bahasa pemrograman PHP.
Sebelum masuk perhitungan similarity diperlukan aturan penyusunan pertanyaan yg bisa mengarahkan ke hasil. Oleh karena itu, halaman-halaman yang memuat
pertanyaan gejala penyakit seperti pada Gambar 3.2.
Pada halaman pertama diambil 4 poin pertanyaan. Untuk poin pertanyaan 1 sampai 3 merupakan pertanyaan gejala unik dari penyakit kanker yaitu
carcinoma epidermoid, adenocarsinoma papilifer, dan carcinoma skuamus.
commit to user
Gambar 3.2 Flowchart aturan menampilkan pertanyaan.
Jika poin pertanyaan 1 dipilih maka masuk ke halaman yang mengarah ke pertanyaan gejala umum dari penyakit carcinoma epidermoid. Jika poin
pertanyaan 2 dipilih maka masuk ke halaman yang mengarah pada pertanyaan
gejala umum dari penyakit adenocarsinoma papilifer. Jika poin pertanyaan 3 dipilih maka masuk ke halaman yang mengarah ke halaman pertanyaan gejala
umum dari penyakit carcinoma sel skuamus. Setelah menjawab pertanyaan dari
gejala umum, jika diproses akan langsung keluar hasilnya. Jika pertanyaan poin 4 yang dipilih maka masuk ke halaman kedua yang mengarah ke pertanyaan gejala
la ngsung keluar hasilnya. Aturan pertanyaan di atas dapat diperjelas melalui
Gambar 3.2.
Data yang digunakan akan disimpan dalam database. Implementasi sistem
akan menghasilkan prototype sistem.
3.4 Pengujian dan Validasi Sistem
Pada tahap pengujian sistem, dilakukan pengujian terhadap sistem dengan
sejumlah sampel tertentu. Sedangkan tahap validasi sistem m erupakan tahap dimana hasil implementasi metode Similarity akan dibandingkan dengan data
hasil observasi. Tujuan pengujian untuk mendapatkan akurasi hasil pengujian dan
banyaknya hasil rekomendasi. Tahap pengujian dilakukan dengan kegiatan berikut:
1. M enginputkan secara random data gejala pasien yang mengikuti pap smear.
Pasien-pasien dengan gejala yang berbeda-beda diinputkan secara acak sehingga data-data yang diinputkan tidak urut sesuai dengan penyakit yang
diteliti.
2. M enghitung besar kemiripan antara data gejala pasien dengan data gejala pada database dengan menggunakan jaccard similarity.
3. M embandingkan hasil perhitungan dengan similarity dengan hasil data sekunder. Bila hasil sesuai dengan hasil observasi maka dapat dikatakan
sistem berhasil.
4. M enentukan nilai threshold. Penentuan nilai threshold dengan cara sebagai
berikut.
a. Melakukan pengujian awal untuk mendapatkan nilai threshold. Untuk menentukan nilai threshold, diambil data yang memiliki hasil diagnosis
suspek kanker, polip serviks, dan radang kronis.
b. Menghitung nila i similarity suspek kanker, polip serviks, dan radang kronis.
c. Menghitung selisih nilai similarity antara suspek kanker dengan polip
commit to user
5. M enghitung akurasi pengujian. Akurasi pengujian dihitung dengan rumus
sebagai berikut.
= × %
3.5 Penulisan Laporan Penelitian
Penulisan laporan penelitian merupakan tahap akhir proses penelitian.
Laporan penelitian ditulis berdasarkan ha sil implementasi penelitian yang telah dilakukan. Laporan penelitian mencakup beberapa bagian, yaitu: pendahuluan,
BAB IV
PEMBAHASAN
4.1 Gambaran Umum Sistem
Sistem pendukung diagnosis kanker serviks merupakan sistem yang
membantu mengingat gejala-gejala penyakit kanker serviks dan gejala-gejala penyakit non kanker ya ng terdapat pada pap smear untuk menghindari kesalahan
diagnosis. Sistem pendukung diagnosis kanker serviks menggunakan metode jaccard similarity dan cosine similarity untuk mengolah data yang diinputkan
sehingga menghasilkan nilai similarity untuk membantu mendukung keputusan
diagnosis kanker serviks.
Sistem pendukung diagnosis kanker serviks dibangun dengan bahasa
pemrograman PHP dan dengan basis data MySQL.
Gambar 4.1 Gambaran umum sistem
Gambaran umum sistem dapat dilihat pada gambar 3. User memberikan inputan pada sistem. Kemudian sistem akan menyimpan inputan ke
commit to user
user. Bila user memilih metode jaccard similarity, maka sistem akan m engolah
inputan dengan metode jaccard similarity. Bila user memilih cosine sim ilarity maka sistem akan mengolah inputan dengan metode tersebut. Hasil dari proses
penghitungan dengan metode similarity disimpan kembali ke database dan
ditampilkan pada user. Keputusan akhir diserahkan pada dokter.
4.2 Perancangan Database
Database yang digunakan untuk sistem ini terdiri dari 5 tabel antara lain tabel pasien, tabel pasien 2, tabel gejala, tabel penyakit, dan tabel user. Tabel
pasie n digunakan untuk menyimpan inputan yang dihitung dengan jaccard
similarity sedangkan tabel pasien2 diguna kan untuk me nyimpan inputan yang dihitung dengan cosine similarity.
Tabel pasien berisi id_pasien, Nama, gejala G01 sampai dengan gejala
G38, hasil perhitungan jaccard similarity tiap penyakit yaitu jacc1 sampai dengan jacc7, similarity terbesar yaitu similarity, dan Hasil. Tabel pasien2 berisi
id_pasien, Nama, gejala G01 sampai dengan gejala G38, hasil perhitungan cosine
similarity tiap penyakit yaitu cos1 sampai dengan cos7, similarity terbesar yaitu similarity, dan Hasil. Tabel gejala berisi id_gejala dan gejala. Tabel penyakit
berisi id_pnykit, penyakit, dan gejala G01 sampai dengan G38. Tabel user berisi username dan password.
4.3 Hasil Implementasi Sistem
Implementasi sistem menggunakan jaccard similarity dan cosine
similarity menghasilka n prototype sistem. Prototype sistem dapat dilihat pada
lampiran C.
4.4 Hasil Pengujian
Proses pengujian dilakukan dengan menginputkan data pasien. Data pasien
yang diujikan berjumlah 54 data kasus dengan hasil diagnosis yang berbeda-beda. Data sebanyak 54 buah sudah cukup untuk memodelkan sim ilarity karena
sekalipun data ditambah, nilai similarity-nya tidak terpengaruh. Nilai similarity
dipengaruhi oleh banyak sedikitnya gejala pasien yang diinputkan.
Nilai threshold digunakan untuk menentukan banyak sedikitnya rekomendasi
nilai threshold yaitu data pasien P31 dan pasien P33. Pasien P31 memiliki
rekomendasi pertama yaitu polip serviks dan rekomendasi kedua yaitu suspek kanker. pasien P33 memiliki rekomendasi pertama yaitu radang kronis dan
rekomendasi kedua yaitu suspek kanker. Dari kedua pasien tersebut, maka
ditetapkan nilai threshold sebagai berikut.
Tabel 4.1 Nilai similarity Jaccard pasien P31 dan P33 untuk penyakit suspek
kanker, polip serviks, dan radang kronis
Jaccard Suspek kanker Polip Radang
P31 0.278 0.385 0.187
P33 0.333 0.056 0.428
Tabel 4.2 Nilai similarity Cosine pasien P31 dan P33 untuk penyakit suspek
kanker, polip serviks, dan radang kronis
Cosine Suspek kanker Polip Radang
P31 0.495 0.589 0.339
P33 0.550 0.109 0.628
Dari Tabel 4.1 dan Tabel 4.2, didapatkan nilai selisih antara suspek kanker
dengan polip serviks, suspek kanker dengan radang kronis, dan polip serviks
dengan radang kronis. Penetapan nilai threshold didapatkan dari rata-rata selisih nilai similarity antara suspek kanker dengan polip serviks, polip serviks dengan radang kronis, dan antara suspek kanker dengan radang kronis. Pengambilan nilai
thresho ld hanya dari ketiga penya kit tersebut dikarenakan ketiga penyakit tersebut
memiliki gejala penyakit yang hampir mirip sehingga nilai similarity ya ng
diperoleh memiliki selisih yang sedikit. Perhitungan Threshold sebagai berikut.
a. Thresho ld untuk Jaccard
= 0,106 + 0,197 + 0,090 + 0,095 + 0,373 + 0,277
6 = 0,189
b. Thresho ld untuk Cosine
= 0,094 + 0,249 + 0,155 + 0,078 + 0,519 + 0,440
commit to user
Jadi, th reshold yang ditetapkan untuk similarity Jaccard yaitu 0,189 dan
thresho ld untuk similarity Cosine yaitu 0,255. Untuk menampilkan rekomendasi,
nilai sim ilarity tertinggi dikurangi dengan nilai thresho ld sehingga didapatkan
batas nilai-nya (misal nilai x). Jika nilai similarity tiap penyakit lebih dari batas
(nilai x) maka pada halaman hasil ditampilkan sebagai rekomendasi kedua dan jika lebih dari satu maka akan ditampilkan sebagai rekomendasi ketiga dan
seterusnya.
Jumlah data pasien denga n hasil normal sebanyak 5 orang. Jumlah pasien
dengan hasil radang kronis sebanyak 26 orang. Jumlah pasien dengan hasil polip
serviks sebanyak 14 orang. Jumlah pasie n dengan hasil carcinoma epid ermoid sebanyak 4 orang. Jum lah pasien dengan hasil adenocarsinoma papilifer sebanya k
2 orang. Jumlah pasien dengan hasil carcino ma sel skuamus sebanyak 1 orang.
Jumlah pasien dengan hasil suspek kanker sebanyak 2 orang. Hasil pengujian dapat dilihat pada Tabel 4.3
Tabel 4.3 Nilai similarity Jaccard dan Cosine hasil pengujian 54 data
Pasien Diagnosis
P01 Polip serviks
1. polip serviks
P02 Polip serviks
1. polip serviks
P04 Polip serviks
1. polip serviks
P05 radang kronis
Pasien Diagnosis
P06 radang kronis
1. radang kronis
P07 radang kronis
1. radang kronis
P08 radang kronis
1. radang kronis
P09 radang kronis
1. radang kronis
P10 radang kronis 1. radang kronis (0.308)
1. radang kronis (0.555)
P11 radang kronis
1. radang kronis
P12 radang kronis
1. radang kronis
P13 radang kronis
1. radang kronis
P14 radang kronis
1. radang kronis
P15 radang kronis 1. radang kronis (0.385)
1. radang kronis (0.620)
P16 radang kronis 1. radang kronis (0.385)
commit to user
P17 radang kronis
1. radang kronis
P18 radang kronis
1. radang kronis
P19 radang kronis 1. radang kronis (0.538)
1. radang kronis (0.734)
P20 radang kronis
1. radang kronis
P21 radang kronis
1. radang kronis
P22 radang kronis
1. radang kronis
P23 radang kronis 1. radang kronis (0.308)
1. radang kronis (0.555)
P24 radang kronis
1. radang kronis
P25 radang kronis
Pasien Diagnosis
P26 radang kronis
1. radang kronis
P27 radang kronis
1. radang kronis
P28 radang kronis
1. radang kronis
P29 radang kronis
1. radang kronis
P31 suspek kanker
1. polip serviks
P32 suspek kanker
1. suspek kanker
P33 suspek kanker
commit to user
P39 carsinoma sel skuamus
1. carsinoma sel skuamus (0.833)
1. carsinoma sel skuamus (0.913)
P40 Adenocarsinoma papilifer 1.papilifer (1) Adenocarsinoma 1.papilifer (1) Adenocarsinoma
P41 Adenocarsinoma papilifer 1.papilifer (1) Adenocarsinoma 1.papilifer (1) Adenocarsinoma
P42 carsinoma
P46 Polip serviks 1. polip serviks (0.417)
1. polip serviks (0.645)
P47 Polip serviks
1. polip serviks
P48 Polip serviks
1. polip serviks
P49 Polip serviks
1. polip serviks
P50 Polip serviks 1. polip serviks (0.5)
1. polip serviks (0.707)
P51 Polip serviks
Pasien Diagnosis
P52 Polip serviks
1. polip serviks
P53 Polip serviks 1. polip serviks (0.417)
1. polip serviks (0.645)
P54 Polip serviks
1. polip serviks
Akurasi perhitungan sim ilarity Jaccard dan similarity Cosine untuk
rekomendasi di urutan pertama, kedua, ketiga, dan keempat ditunjukan pada Tabel
4.4. Dari hasil akurasi tersebut menunjukan bahwa rekomendasi pertama memiliki tingkat akurasi ya ng tinggi. Rekomendasi kedua diberikan jika terdapat nilai
similarity yang sama dan jika rekomendasi pertama dan rekomendasi kedua
memiliki thresho ld sebesar 0,189 untuk similarity Jaccard dan thresho ld sebesar 0,255 untuk similarity Cosine.
Pada similarity Jaccard, jika rekomendasi kedua menjadi hasil diagnosis maka besar akurasi menjadi 100%. Pada similarit y Cosine, jika rekomendasi
kedua menjadi hasil diagnosis maka besar akurasi menjadi 100%.
Tabel 4.4 Hasil perhitungan akurasi similarity Jaccard dan similarity Cosine
Metode Jumlah data Benar di urutan
1 2 3 4
commit to user
orang pasien dengan 1 buah rekomendasi. Sedangkan untuk similarity Cosine
didapatkan 12 orang pasien dengan 3 buah rekomendasi, 22 orang dengan 2 buah rekomendasi, dan 20 orang pasien dengan 1 buah rekomendasi. Jumlah hasil
rekomendasi dari pengujian sistem untuk similarity Jaccard dan sim ilarity Cosine
ditunjukan pada Tabel 4.5
Tabel 4.5 Jumlah hasil rekomendasi
Metode Jumlah
radang kronis dan normal memiliki gejala-gejala yang mirip atau beririsan
sehingga nilai sim ilarity yang dihasilkan memiliki selisih yang kecil antara keempatnya. Karena memiliki nilai selisih yang kecil maka pada sistem,
rekomendasi yang diberikan pada pasien yang menderita penyakit non kanker dimungkinkan sebanyak 4 rekomendasi yaitu suspek kanker, polip serviks, radang
kronis dan normal. Tabel 4.6 merupakan tabel hasil rekomendasi yang diberikan
pada pasien penyakit non kanker.
Pada Tabel 4.6 similarity Jaccard menghasilkan jumlah rekomendasi paling
banyak 4 buah rekomendasi, sedangkan pada sim ilarity Cosine menghasilkan
jumlah rekomendasi paling banyak 3 buah rekomendasi. Hal ini menunjukan bahwa similarity Cosine memiliki jumlah rekomendasi yang lebih sedikit daripada
similarity Jaccard. Hasil rekomendasi yang sedikit tersebut mengakibatkan
referensi pilihan user semakin kecil se hingga user lebih terbantu dalam menentukan kemungkinan penyakit yang diderita pasien karena similarity Cosine
mengurangi satu kemungkinan penyakit yang diderita pasien sedangkan sim ilarit y Jaccard tidak mengurangi kemungkinan penyakit yang diderita pasien tetapi hanya
Tabel 4.6 Hasil rekomendasi pasien P20, pasien P21, pasien P22,
P20 radang kronis
1. radang kronis
P21 radang kronis
1. radang kronis
P22 radang kronis
1. radang kronis
P28 radang kronis
commit to user
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Akurasi hasil pengujian sistem pada 54 data uji untuk sim ilarity Jaccard
dan similarity Cosine relatif sama dimana urutan pertama adalah 96,69%, dan di urutan kedua adalah 3,17%. Berdasarkan pembahasan dapat disimpulkan bahwa
metode sim ilarity dapat digunakan untuk m endukung keputusan dokter dalam mendiagnosis kanker serviks. Pada kasus penyakit non kanker, similarity Jaccard
memiliki jumlah rekomendasi paling banyak yaitu 4 buah rekomendasi sedangkan
similarity Cosine memiliki jumlah rekomendasi paling banyak yaitu 3 buah rekomendasi. Hal ini menunjukan bahwa similarity Cosine memiliki jumlah
rekomendasi yang lebih sedikit daripada similarity Jaccard sehingga referensi user
menjadi lebih kecil.
5.2 Saran
Saran yang dapat digunakan untuk pengembangan selanjutnya yaitu a. M engaplikasikan metode similarity ya ng lain untuk mendukung keputusan
diagnosis kanker serviks, seperti metode dice similarity dan overlap similarity.
b. M enambah data kolposkopi untuk menambah matriks ge jala sehingga diperoleh hasil yang lebih akurat. Data kolposkopi merupakan data hasil
peneropongan mulut rahim/serviks dengan kaca pembesar agar kelainan
serviks dapat dilihat dan dapat dilakukan biopsi.
c. M engaplikasikan sistem pendukung diagnosis kanker ini dalam bentuk