Fakultas Ilmu Komputer
1912
Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary
Decision Tree Support Vector Machine (BDTSVM)
(Studi Kasus: Puskesmas Dinoyo Kota Malang)
Dyan Dyanmita Putri1, M.Tanzil Furqon2, Rizal Setya Perdana3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1dyan2mp@gmail.com, 2m.tanzil.furqon@ub.ac.id, 3rizalespe@ub.ac.id
Abstrak
Kulit merupakan organ tubuh pada manusia yang sangat penting karena terletak pada bagian luar tubuh yang berfungsi untuk menerima rangsangan seperti sentuhan, rasa sakit dan pengaruh lainnya dari luar. Penyakit kulit salah satu penyakit yang sering dijumpai pada negara beriklim tropis seperti Indonesia. Kurangnya pengetahuan tentang jenis penyakit kulit serta tidak mengetahui cara pencegahannya mengakibatkan sesorang dapat terkena penyakit kulit tingkat akut. Sehingga dengan adanya bantuan teknologi komputer diharapkan penyakit yang menyerang kulit tubuh manusia dapat diketahui secara dini dan hal tersebut dapat memperkecil terjadinya penyakit yang lebih berbahaya. Penelitian ini bertujuan untuk menentukan klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Berdasarkan hasil pengujian didapatkan nilai akurasi terbaik sebesar 97,14% dengan pengujian parameter SVM yaitu nilai λ (lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
Kata kunci: Penyakit Kulit, Klasifikasi, Binary Decision Tree, Support Vector Machine
Abstract
The skin is an organ in the human body is very important because it lies on the outside of the body that serves to receive stimuli such as touch, pain and other influences from the outside. Skin disease is one of the most common diseases in tropical countries such as Indonesia. The lack of knowledge about the type of skin disease and do not know how to prevent it cause a person can get acute skin disease. So with the help of computer technology is expected to attack the skin of the human body can be detected early and it can minimize the occurrence of more dangerous diseases. This research aims to determine the classification of skin diseases in humans using the method of Binary Decision Tree Support Vector Machine (BDTSVM) Based on the test results obtained the best accuracy of 97.14% with SVM parameter test that is the value of λ (lambda) = 0,5, C (complexity) = 1, constant γ (gamma) = 0,01, and itermax = 10.
Keywords: Skin Disease, Classification, Binary Decision Tree, Support Vector Machine
1. PENDAHULUAN
Kulit merupakan organ tubuh pada manusia yang sangat penting karena terletak pada bagian luar tubuh yang berfungsi untuk menerima rangsangan seperti sentuhan, rasa sakit dan pengaruh lainnya dari luar (Nuraeni, 2016). Kulit yang tidak terjaga kesehatannya dapat menimbulkan berbagai penyakit kulit sehingga perlu menjaga kesehatan kulit sejak dini agar terhindar dari penyakit. Kulit tubuh seseorang yang terkena penyakit sangat mengganggu penampilan dan aktifitas orang tersebut. Penyakit kulit sering dianggap remeh karena
sifatnya yang cenderung tidak berbahaya dan tidak menyebabkan kematian. Hal tersebut sangat salah karena jika penyakit kulit terus menerus dibiarkan dapat menyebabkan penyakit tersebut semakin menyebar dan sulit untuk mengobatinya.
dirumah sakit seIndonesia (Kemenkes, 2010). Kejadian penyakit kulit di Indonesia masih tergolong tinggi dan menjadi permasalahan yang cukup berarti. Hal tersebut karena kurangnya kesadaran dan ketidakpedulian masyarakat terhadap lingkungan sekitar yang menyebabkan penularan penyakit kulit sangat cepat. Berbagai penyakit kulit dapat disebabkan oleh beberapa faktor seperti lingkungan dan kebiasaan sehari-hari yang buruk, perubahan iklim, virus, bakteri, alergi, daya tahan tubuh dan lain-lain (Pardiansyah, 2015).
Kurangnya pengetahuan tentang jenis penyakit kulit serta tidak mengetahui cara pencegahannya mengakibatkan sesorang dapat terkena penyakit kulit tingkat akut. Sehingga dengan adanya bantuan teknologi komputer diharapkan penyakit yang menyerang kulit tubuh manusia dapat diketahui secara dini dan hal tersebut dapat memperkecil terjadinya penyakit yang lebih berbahaya. Penggunaan teknologi komputer dapat membantu berbagai praktisi di segala bidang, karena dapat menyimpan data hingga mengolahnya menjadi suatu hasil yang diinginkan pembuatnya (Mahardika, 2013). Banyak manfaat yang didapat dengan adanya teknologi komputer dalam mendeteksi penyakit kulit diantaranya meningkatkan efisiensi pekerjaan, penghematan waktu dalam menyelesaikan masalah, serta pengetahuan pakar dapat didokumentasikan tanpa ada batas waktu
.
Metode SVM adalah salah satu metode klasifikasi yang prinsip nya mencari hyperplane pemisah antara kelas positif dan kelas negatif. Kelebihan dari SVM adalah mampu menangani masalah dengan input space yang berdimensi tinggi. SVM juga memiliki kelemahan yaitu masalah komputasi yang lama untuk proses klasifikasi. Kemudian muncul pengembangan dari metode SVM untuk masalah klasifikasi multi class yaitu One-Against-All (OAA), One-Against-One (OAO), dan Directed Acyclic Graph SVM (DAGSVM). Metode OAA memiliki kelemahan pada tahap pelatihan dan pengujian yang sangat lambat. Sedangkan OAO memiliki kelemahan pengujian yang lambat karena melakukan klasifikasi untuk setiap pasangan kelas harus satu per satu. Sehingga muncul metode DAGSVM yang dapat melakukan pengujian lebih cepat daripada OAO (Meshram et al., 2014). Namun pada tahun 2009 metode BDTSVM dikenalkan oleh Madzarov untuk dapat menyelesaikan masalah
klasifikasi multi class. Hasil yang diperoleh bahwa metode BDTSVM memiliki nilai error rate dan training time yang lebih baik dibandingkan DAGSVM. Kelebihan dari metode BDTSVM adalah mendapatkan penentuan kelas yang lebih dinamis dengan didasarkan pada jarak Euclidean dan dalam hal efektifitas komputasi serta tingkat akurasi yang tinggi.
Berdasarkan permasalahan tersebut maka dirancang sebuah sistem untuk klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Sistem ini bekerja dengan cara menerima masukan gejala dari pengguna dan akan dilakukan proses perhitungan menggunakan algoritme Binary Decision Tree Support Vector Machine (BDTSVM). Hasil dari proses tersebut berupa klasifikasi penyakit kulit pada manusia dengan harapan dapat memberikan informasi kepada pengguna sehingga memperkecil terjadinya penyakit kulit yang lebih berbahaya.
2. DASAR TEORI
2.1. Penyakit Kulit Pada Manusia
Penyakit kulit adalah kelainan kulit akibat adanya jamur, kuman, parasit, virus maupun infeksi yang dapat menyerang siapa saja dari segala umur. Penyakit kulit dapat menyerang seluruh maupun sebagian tubuh tertentu dan dapat memperburuk kondisi kesehatan penderita jika tidak ditangani secara serius. Gangguan pada kulit sering terjadi karena adanya faktor-faktor penyebabnya seperti iklim, lingkungan, tempat tinggal, kebiasaan hidap yang kurang sehat, alergi dan lain-lain.
2.1.1 Dermatitis
2.1.2 Abses
Abses merupakan sebuah penimbunan nanah yang terakumulasi di sebuah kabitas jaringan karena akibat infeksi bakteri atau karena adanya benda asing seperti serpihan, luka peluru, atau jarum suntik. Gejala yang dirasakan biasanya gatal pada bagian kulit tertentu, timbul benjolan kecil dengan warna kemerahan, keluar nanah, nyeri tekan, nyeri kepala, kulit meradang, bengkak dan demam. Penyebab penyakit abses antara lain infeksi bakteri melalui cara bakteri masuk ke bawah kulit akibat luka yang berasal dari tusukan jarum yang tidak steril.
2.1.3 Scabies
Scabies merupakan penyakit infeksi kulit menular dengan adanya rasa gatal pada lesi ketika malah hari yang disebabkan oleh tungau sarcoptes scabiei var hominis (Prativi et al., 2013). Gejala yang sering dirasakan adalah gatal terutama malam hari, bentol/bintik merah seperti jerawat, kulit meradang, panas pada area tersebut, perih, dan keluar nanah. Faktor berkembangnya penyakit scabies antara lain penyakit tersebut banyak diderita oleh masyarakat dengan higiene buruk, sosial ekonomi yang rendah, hubungan seksual dengan bergonta-ganti pasangan, kesalahan dalam mendiagnosis dan perkembangan demografi serta ekologi.
2.1.4 Herpes
Herpes merupakan penyakit radang kulit yang disebabkan oleh virus dengan ditandai munculnya bintik yang berisi cairan pada bagian kulit tertentu. World Health Organization (WHO) melaporkan prevalensi herpes di Negara berkembang seperti Indonesia lebih tinggi dibandingan dengan di negara maju. Gejala yang dirasakan pada penderita herpes biasanya gatal, demam, nyeri kepala, nyeri tekan, kulit meradang, kulit melepuh, perih dan muncul gelembung air.
2.1.5 Urtikaria
Urtikaria merupakan penyakit yang ditandai dengan adanya edema kulit superfisial setempat dengan ukuran yang bervariasi dikelilingi oleh halo eritem disertai rasa gatal atau panas dan terkadang perut terasa mulas serta demam. Pada bagian tengah bintul tampak kepucatan yang biasanya kelainan ini bersifat sementara, gatal, dan dapat terjadi dimanapun di seluruh permukaan kulit. Ruam urtikaria
cepat timbul dan hilang perlahan-lahan sekitar dalam waktu 1-24 jam (Fitria, 2013). Gejala yang dirasakan pada penderita urtikaria biasanya gatal, demam, muncul ruam merah, alergi, bengkak, dan panas pada area tersebut.
2.1.6 Pioderma
Pioderma merupakan penyakit infeksi bakterial kulit. Penyebab utama pioderma adalah bakteri staphylococcus aureus maupun streptococcus sp. Pioderma merupakan infeksi bakteri pada kulit yang sering dijumpai. Penyakit ini dapat menyerang laki-laki maupun perempuan pada semua kalangan usia. Gejala pada penyakit pioderma biasanya gatal, terdapat benjolan merah pada kulit, membesar dan kemudian menjadi nanah, kulit meradang, serta demam. Terjadinya pioderma dipengaruhi oleh gizi, kondisi imunologis, integritas kuit, serta faktor lingkungan seperti panas, lembab, kurangnya sanitasi dan higieni.
2.2 Support Vector Machine
Support Vector Machine (SVM) merupakan salah satu teknik baru yang memiliki performansi yang lebih baik di berbagai bidang aplikasi seperti pengenalan tulisan tangan, bioinformatika, klasifikasi teks, klasifikasi diagnosis penyakit dan sebagainya (Feng-Chia, 2009). Tujuan dari SVM yaitu menemukan fungsi pemisah (classifier hyperplane) terbaik untuk memisahkan dua buah kelas pada input space. Untuk dapat menemukan hyperplane terbaik antara dua kelas dengan mengukur margin hyperplane yang diperoleh dari mengukur margin yang maksimal antara ruang input non-linear dengan ruang ciri menggunakan kaidah kernel (Putri et al., 2015). Prinsip nya SVM bekerja secara linear, tetapi dapat berkerja juga pada masalah non-linear dengan memasukkan metode kernel trick. Fungsi klasifikasi Support Vector Machine Linear digunakan untuk memisahkan data pelatihan terbagi menjadi dua kelas dengan memisahkan hyperplane. Misal diketahui 𝑥𝑖 = {𝑥1, … , 𝑥𝑛} adalah titik pada dataset, dan 𝑦𝑖 =
Gambar 1. Alternatif bidang pemisah (kiri) dan bidang pemisah terbaik dengan margin (m) terbesar
(kanan)
Sumber: Sembiring (2007)
Data yang berada pada bidang pembatas disebut support vector. Pada Gambar 1, dua kelas dapat dipisahkan oleh sepasang bidang pembatas yang sejajar. Class pertama dibatasi bidang pemisah pertama sedangkan class kedua dibatasi bidang pemisah kedua. Bidang pemisah untuk setiap kelas ditunjukkan pada Persamaan 1 dan Persamaan 2.
(𝒘. 𝑥𝑖+ 𝑏) ≥ +1, untuk 𝑦𝑖= +1 (1) (𝒘. 𝑥𝑖+ 𝑏) ≤ −1, untuk 𝑦𝑖= -1 (2) Keterangan:
𝑥𝑖 = data ke-i
𝑤 = bidang normal antara bidang pemisah terhadap pusat koordinat
𝑏 = posisi bidang relatif terhadap pusat koordinat
𝑦𝑖 = kelas data ke-i
SVM dapat digunakan untuk mengatasi masalah linear dan non-linear. Masalah linear dapat diatasi dengan cara mendapatkan hyperplane dengan fungsi sebagai berikut:
𝑓(𝑥) = (𝑤. 𝑥 + 𝑏) (3)
𝑤 = ∑
𝑛𝑖=1𝛼
𝑖, 𝑦
𝑖, 𝑥
𝑖(4) dan
𝑏 = −12 (𝑤. 𝑥++ 𝑤. 𝑥−) (5)
Nilai 𝑥+adalah nilai dari salah satu support vector dari class positive dan 𝑥−adalah nilai dari salah satu support vector dari class negative.
Untuk mendapatkan klasifikasi yang optimal data testing 𝑥 digunakan Persamaan 6 dan untuk hasil klasifikasi dapat dilihat pada Persamaan 7.
𝑓(𝑥) = ∑𝑚𝑖=1𝛼𝑖𝑦𝑖𝐾(𝑥𝑖, 𝑥) + 𝑏 (6) Fungsi klasifikasi = 𝑠𝑖𝑔𝑛 (𝑓(𝑥)) (7)
Variabel 𝑚 adalah jumlah support vector atau suatu titik data yang memiliki 𝛼𝑖 > 0, dan notasi 𝑥 adalah data yang akan diklasifikasikan.
Metode yang digunakan untuk mengklasifikasikan data yang tidak dapat diklasifikasikan secara linear adalah dengan mentransformasikan data ke dalam ruang fitur yang berdimensi tinggi sehingga dapat dipisah secara linear pada fitur space. Pada proses feature space biasanya memiliki dimensi yang lebih tinggi dari vektor input (input space) yang mengakibatkan komputasi pada feature space menjadi sangat besar, karena kemungkinan feature space memiliki jumlah feature yang tidak terhingga. Untuk mengetahui fungsi transformasi yang tepat sangat lah sulit. Sehingga pada SVM menggunakan kernel trick. Data yang tidak dapat dipisah secara linear ditunjukkan pada Gambar 2.
Gambar 2. Data non-linear
Sumber: Muis (2015)
Metode kernel trick digunakan untuk mencari hyperplane dengan cara mentransformasi dataset ke ruang vektor yang berdimensi lebih tinggi (feature space), kemudian proses klasifikasi dilakukan pada feature space. Pada permasalahan ini menggunakan kernel Gaussian RBF yang didefiniskan dengan Persamaan 8.
K(𝑥𝑖, 𝑥𝑗) = exp (−𝛾‖𝑥𝑖− 𝑥𝑗‖2) (8)
Penentuan fungsi kernel yang digunakan sangat berpengaruh terhadapa hasil prediksi (Muis, 2015).
2.3 Sequential Training SVM
Metode sequential training SVM adalah metode
alternatif sederhana untuk menemukan bidang hyperplane yang optimal. Metode ini lebih baik
dibandingkan dengan metode Quadric Programming
(QP) yang penyelesaiannya cukup kompleks,
1. Inisialisasi nilai parameter, λ = 2, 𝛾 (learning rate) = 5, 𝐶 = 1, Iterasi Max = 10, dan 𝜀 = 0.0001.
2. Set nilai 𝑎𝑖 = 0, kemudian menghitung matriks
Hessian dengan menggunakan Persamaan 9.
𝐷𝑖𝑗 = 𝑦𝑖𝑦𝑗(𝐾(𝑥𝑖, 𝑥𝑗)+ 𝜆2) untuk 𝑖, 𝑗= 1,.,N (9)
Keterangan:
𝑥𝑖 = data ke-i
𝑥𝑗 = data ke-j
𝑦𝑖 = kelas data ke-i
𝑦𝑗 = kelas data ke-j
N = jumlah data
𝐾(𝑥𝑖, 𝑥𝑗) = fungsi kernel yang digunakan
3. Melakukan proses iterasi dari data ke-i sampai
data ke-j dengan i=1 sampai N menggunakan
Persamaan 10, 11 dan 12.
𝐸𝑖 =
∑
𝑁𝑗=1𝛼𝑖𝐷𝑖𝑗 (10)𝛿𝛼𝑖 = min {max[𝛾(1 − 𝐸𝑖), −𝛼𝑖], 𝐶 − 𝛼𝑖} (11)
𝛼𝑖 = 𝛼𝑖+ 𝛿𝛼𝑖 (12)
Keterangan: 𝛾 = 𝑙𝑒𝑎𝑟𝑛𝑖𝑛𝑔 𝑟𝑎𝑡𝑒
4. Kembali pada langkah ke 3 hingga kondisi iterasi
max telah tercapai atau max(|𝛿𝛼𝑖|)< 𝜀.
5. Kemudian didapatkan nilai Support Vector (SV)
= 𝛼𝑖> 𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑. Nilai thresholdSV ditentukan dari beberapa percobaan yang biasa digunakan 𝑡ℎ𝑟𝑒𝑠ℎ𝑜𝑙𝑑 ≥ 0.
2.4 Binary Decision Tree Support Vector Machine
Metode Binary Decision Tree Support Vector Machine (BDTSVM) digunakan untuk memecahkan permasalahan klasifikasi multi kelas menggunakan pohon biner. Metode ini dapat diterapakan untuk menangani masalah komputasi yang lama untuk proses klasifikasi yang merupakan kelemahan dari SVM. Sehingga metode ini memiliki kelebihan dalam hal efektifitas komputasi dan nilai akurasi yang tinggi.
Prinsip dari metode ini dengan membagi N kelas yang ada menjadi dua kelompok besar dan memisahkannya dengan menempatkan ke anak kanan dan anak kiri dari pohon biner. Pembagian kelas dalam metode ini dilakukan secara rekursif hingga didapatkan pada setiap node hanya terdapat satu kelas yang mempresentasikan kategori tersebut. Pada proses training SVM dilakukan untuk menentukan kemana data dikelompokkan menurut kelasnya. Dalam membagi N kelas ke dalam dua buah kelompok terdapat banyak cara. Pemilihan cara yang tepat dapat
mempengaruhi kualitas dari pohon biner. Berikut ini ilustrasi Binary Decision Tree Support Vector Machine (BDTSVM) dalam mengklasifikasikan N-kelas yang ditunjukkan pada Gambar 3.
Gambar 3. Ilustrasi BDTSVM
Sumber: Sembiring (2007)
Berikut adalah langkah-langkah untuk mendapatkan struktur dari tree:
1. Menghitung nilai gravity center dari setiap kelas.
2. Menghitung jarak Euclidean distance dari masing-masing kelas.
3. Mencari jarak terjauh dari matriks hasil perhitungan jarak Euclidean distance, kemudian memisahkan kedua kelas yang memiliki jarak terjauh masing-masing ke anak kanan dan anak kiri.
4. Kelas yang tersisa dicari jarak terdekatnya dengan kelas yang telah dipisahkan. Kelas dengan jarak terdekat terhadap kelas yang dipisahkan akan digabungkan dengan kelas tersebut.
5. Selanjutnya ulangi langkah 4 hingga seluruh kelas yang tersisa telah dikelompokkan. Pada langkah ini telah menyelesaikan struktur tree pada level 1.
6. Kemudian ulangi langkah 3 dan 4 hingga masing-masing node hanya terdiri dari 1 kelas.
2.4.1 Gravity Center
Gravity Center adalah titik pusat dari setiap kelas. Untuk mendapatkan titik pusat dari setiap kelas, dapat dihitung dengan mencari rata-rata setiap parameter dari masing-masing kelas.
SVM
SVM
SVM
SVM
SVM SVM
6
2 3 4 7 1 5
1,2,3,4,5,6,7
2,3,4,7 1,5,6
1,5
Nilai rata-rata dari masing-masing kelas dapat dilihat pada Persamaan 13.
𝐺𝐶𝐶𝑖 𝐹𝑗= ∑ 𝑥𝑚 𝑛 𝑚=1
𝑛 (13)
Keterangan:
𝐺𝐶𝐶𝑖 𝐹𝑗 = Gravity Center kelas ke-I parameter
ke-j, dimana i=1,…,jumlah kelas 𝑥𝑚 = Nilai data ke-m pada kelas ke-I
parameter ke-j
𝑛 = jumlah data pada setiap kelas
2.4.2 Euclidean Distance
Euclidean Distance adalah nilai jarak yang memisahkan antara dua buah kelas. Ukuran jarak ini yang paling umum digunakan. Untuk menentukan nilai jarak dapat digunakan Persamaan 14.
𝑑𝑖𝑗 =
√∑
𝑛𝑚=1(𝑓𝑚𝑖− 𝑓𝑚𝑗)2 (14)Keterangan:
𝑑𝑖𝑗 = Jarak antara kelas I dan kelas j
𝑓𝑚𝑖 = Rata-rata fitur ke-m pada kelas ke-i,
dimana i = 1,…,jumlah kelas
𝑓𝑚𝑗 = Rata-rata fitur ke-m pada kelas ke-j,
dimana j = 1,…,jumlah kelas 𝑛 = Jumlah fitur
3. METODOLOGI PENELITIAN
Metodologi penelitian untuk klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM) ditunjukkan pada Gambar 4. Studi literatur difokuskan pada pencarian referensi relevan yang berkaitan dengan permasalahan yang sedang di teliti oleh penulis. Hal ini dilakukan agar peneliti mampu meningkatkan pemahaman dan pengetahuan teori tentang permasalahan yang sedang diteliti. Referensi berupa teori yang didapatkan berkaitan dengan Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary Decision Tree Support Vector Machine (BDTSVM).
Lokasi penelitian di Puskesmas Dinoyo Kota Malang. Analisis kasus dilakukan dengan cara mengumpulkan data melalui observasi dan wawancara secara langsung dengan tujuan mendapatkan informasi lebih dari pihak yang bersangkutan. Data yang diperoleh berupa data
gejala-gejala pada penyakit kulit pada manusia beserta diagnosanya sebanyak 150 data. Data gejala yang digunakan ada 14 gejala dengan 6 jenis penyakit yang sering ditangani yaitu dermatitis, abses, scabies, herpes, urtikaria, serta pioderma.
Gambar 4. Diagram Alir Metodologi Penelitian
4. PERANCANGAN SISTEM
Pada bagian perancangan menjelaskan mengenai langkah penyelesaian masalah klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM). Gambar 5 merupakan diagram alir proses klasifikasi menggunakan metode Binary Decision Tree Support Vector Machine.
Proses klasifikasi penyakit kulit diawali dengan memberikan masukan berupa data gejala penyakit kulit pada manusia yang diperoleh dari Puskesmas Dinoyo Kota Malang. Proses pembentukan kelas positif dan negatif menggunakan metode Binary Decision Tree yang diawali dengan menghitung gravity center kemudian menghitung jarak Euclidean distance setelah terbentuk matriks Euclidean Distance selanjutnya membuat pohon biner yaitu dengan mencari jarak terjauh dari hasil matriks Euclidean. Kemudian memisahkan kedua kelas yang memiliki jarak terjauh dimana kelas yang kecil akan mengarah ke kiri yang bernilai
Studi Literatur
Analisa Kebutuhan Sistem
Pengumpulan Data
Perancangan Sistem
Implementasi Sistem
Pengujian Sistem
positif dan kelas yang lebih besar mengarah ke kanan yang bernilai negatif. Kemudian kelas yang tersisa akan dicari jarak terdekatnya antara kedua kelas yang memiliki jarak terjauh. Proses tersebut akan terus diulang sampai level terakhir dan masing-masing node hanya terdiri dari 1 kelas. Kemudian untuk proses klasifikasi menggunakan metode Support Vector Machine dari proses training hingga testing dengan menggunakan metode sequential training SVM. Keluaran yang dihasilkan berupa klasifikasi penyakit kulit pada manusia terdiri dari 6 jenis yaitu dermatitis, abses, scabies, herpes, urtikaria dan pioderma.
Gambar 5. Diagram Alir Proses Klasifikasi Menggunakan Metode BDTSVM
5. PENGUJIAN DAN ANALISIS
Pengujian yang dilakukan pada sistem klasifikasi penyakit kulit pada manusia menggunakan metode Binary Decision Tree Support Vector Machine (BDTSVM) menggunakan data training. Pengujian yang dilakukan terdiri dari pengujian terhadap jumlah iterasi, pengujian parameter λ (lambda), pengujian parameter 𝐶 (Complexity), dan pengujian parameter 𝛾 (gamma).
5.1 Hasil dan Analisis Pengujian Nilai Iterasi Maksimal
Pengujian nilai iterasi maksimal untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian
pada nilai iterasi maksimal digunakan beberapa nilai yaitu 2, 10, 50, 100 dan 150. Pada pengujian nilai parameter sequential training
SVM yang digunakan adalah λ (lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
Gambar 6. Grafik Tingkat Akurasi Hasil Pengujian Iterasi Maksimal
Berdasarkan hasil grafik pada Gambar 6 bahwa rerata dengan akurasi tertinggi sebesar 97,14% pada nilai iterasi maksimal yaitu 10. Sehingga untuk pengujian selanjutnya digunakan nilai iterasi maksimal yaitu 10.
Hasil pengujian nilai iterasi maksimal dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai iterasi maksimal yang semakin besar maka akurasi semakin baik. Pengujian iterasi maksimal berpengaruh pada perubahan nilai alpha dan bias. Pada hasil pengujian untuk jumlah iterasi maksimal 10, 50, 100 dan 150 akurasi cenderung stabil. Namun pada iterasi 4 akurasi sudah tinggi sehingga tidak membutuhkan waktu yang lama untuk mencapai akurasi yang tinggi.
5.2 Hasil dan Analisis Pengujian Parameter λ (Lambda)
Pengujian nilai parameter λ (lambda) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter lambda digunakan beberapa nilai yaitu 0,5, 100, 1000, 10000, dan 100000. Pada pengujian nilai parameter sequential training SVM yang digunakan
adalah λ (lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
91,43
97,14 97,14 97,14 97,14
85 90 95 100
2 10 50 100 150
A
kur
a
si
(
%
)
Nilai Iterasi Maksimal
Pengujian Akurasi Iterasi Maksimal
Mulai
Data Penyakit Kulit
Binary Decision Tree
Support Vector Machine
Hasil Klasifikasi
Gambar 7. Grafik Tingkat Akurasi Hasil Pengujian Nilai λ (lambda)
Berdasarkan hasil grafik pada Gambar 7 bahwa rerata dengan akurasi tertinggi sebesar
97,14% pada nilai λ (lambda) yaitu 0,5. Sehingga untuk pengujian selanjutnya
digunakan nilai λ (lambda) yaitu 0,5.
Hasil pengujian parameter λ (lambda) dengan rerata akurasi tertinggi sebesar 97,14%
menunjukkan bahwa semakin besar nilai λ
(lambda) maka akurasi cenderung menurun.
Sebaliknya semakin kecil nilai λ (lambda) maka akurasi semakin besar, hal tersebut dikarenakan saat nilai λ (lambda) kecil maka membuat lebar margin mengecil dan titik bergerak dari dalam margin menuju luar margin dan akan mendapatkan hyperplane yang baik.
5.3 Hasil dan Analisis Pengujian Parameter
𝑪 (Complexity)
Pengujian nilai parameter C (Complexity) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter C (Complexity) digunakan beberapa nilai yaitu 0,0001, 0,001, 0,01, 0,1 dan 1. Pada pengujian nilai parameter sequential training SVM yang digunakan
adalah λ (lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
Gambar 8. Grafik Tingkat Akurasi Hasil Pengujian
Nilai C (Complexity)
Berdasarkan hasil grafik pada Gambar 8 bahwa rerata dengan akurasi tertinggi sebesar
97,14% pada nilai C (Complexity) yaitu 1. Sehingga untuk pengujian selanjutnya digunakan nilai C (Complexity) yaitu 1.
Hasil pengujian parameter C (Complexity) dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai parameter C (Complexity) yang mendekati nilai 0 maka akurasi cenderung menurun. Nilai parameter C semakin besar membuat waktu komputasi semakin lama untuk proses training data tetapi nilai akurasi semakin baik. Nilai parameter C memberikan penalti yang besar pada titik data yang melewati bidang pemisah, sehingga dapat menghindari kesalahan klasifikasi.
5.4 Hasil dan Analisis Pengujian Parameter
𝜸(Gamma)
Pengujian nilai parameter 𝛾(Gamma) untuk mengetahui pengaruh tingkat akurasi pada sequential training SVM. Untuk pengujian pada nilai parameter 𝛾 (Gamma) digunakan beberapa nilai yaitu 0,001, 0,01, 0,1, 1 dan 10. Pada pengujian nilai parameter sequential training SVM yang digunakan adalah λ (lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
Gambar 9. Grafik Tingkat Akurasi Hasil Pengujian
Nilai 𝜸 (Gamma)
Berdasarkan hasil grafik pada Gambar 9 bahwa rerata dengan akurasi tertinggi sebesar 97,14% pada nilai 𝛾 (Gamma) yaitu 0,01. Sehingga untuk pengujian selanjutnya digunakan nilai 𝛾 (Gamma) yaitu 0,01.
Hasil pengujian parameter 𝛾 (Gamma) dengan rerata akurasi tertinggi sebesar 97,14% menunjukkan bahwa nilai konstanta 𝛾 (Gamma) yang semakin besar maka nilai learning rate semakin besar dimana learning rate merupakan laju pembelajaran sehingga jika proses pembelajaran semakin cepat maka ketelitian sistem semakin berkurang dan akurasi cenderung menurun. Sebaliknya jika nilai learning rate semakin kecil maka ketelitian sistem semakin besar dan akurasi semakin baik.
97,14 90
Pengujian Akurasi Nilai λ(lambda)
90 90 90
0,0001 0,001 0,01 0,1 1
A Pengujian Akurasi Nilai 𝑪
(Complexity)
6. KESIMPULAN
Berdasarkan pada hasil perancangan, implementasi, pengujian dan analisis yang telah dilakukan pada sistem Klasifikasi Penyakit Kulit Pada Manusia Menggunakan Metode Binary Decision Tree Support Vector Machine (BDTSVM). Sehingga dapat disimpulkan sebagai berikut ini:
1. Metode Binary Decision Tree Support Vector Machine dapat diimplementasikan dengan baik untuk menyelesaikan masalah klasifikasi penyakit kulit pada manusia. Banyaknya jumlah data dapat mempengaruhi hasil akurasi pada proses klasifikasi.
2. Pada permasalahan klasifikasi penyakit kulit pada manusia menggunakan metode BDTSVM digunakan data sebanyak 150 data. Perubahan nilai 𝛼𝑖, nilai bias dan akurasi dipengaruhi pada pemilihan parameter λ (lambda), C (complexity), konstanta 𝛾 (gamma), 𝜀 (epsilon) pada metode sequential training SVM. Berdasarkan hasil pengujian didapatkan nilai akurasi terbaik sebesar 97,14% dengan
pengujian parameter SVM yaitu nilai λ
(lambda) = 0,5, C (complexity) = 1, konstanta 𝛾 (gamma) = 0,01, dan itermax = 10.
7. DAFTAR PUSTAKA
Cholissodin, I., Maya Kurniawati., Indriati., dan Issa Arwani., 2014. Classification of campus e-complaint documents using Directed Acyclic Graph Multi-class SVM based on analytic hierarchy process. Universitas Brawijaya, Malang.
Feng-Chia, L., 2009. Comparison Of The Primitive Classifiers Without Features Selection in Credit Scoring. Management and Service Science. Fitria., 2013. Aspek Etiologi dan Klinis Pada
Urtikaria dan Angioedema. Fakultas Kedokteran Universitas Syiah Kuala. Kementerian Kesehatan Indonesia, 2010. Profil
Kesehatan Indonesia Tahun 2009. Jakarta: Kementerian Kesehatan RI.
Mahardika, A.P., 2013. Sistem Pakar Mendeteksi Penyakit Dalam Dengan
Metode Backward Chaining
Menggunakan Visual Basic 2010. Teknik Informatika Universitas Semarang.
Maryunani, A., 2010. Kamus Perawat: Definisi Istilah dan Singkatan Kata-Kata dalam Keperawatan. Jakarta: CV.Trans Info Media.
Meshram, A., Roopam, G dan Sanjeev, S., 2014. Advance Probabilistic Binary Decision Tree using SVM. School of Information Technology UTD, RGPV, Bhopal, M.P., India.
Muis, I.A., 2015. Penerapan Metode Support Vector Machine (SVM) Menggunakan Kernel Radial Basis Function (RBF) Pada Klasifikasi Tweet. Jurusan teknik Informatika, Fakultas Sains dan Teknologi, UIN Sultan Syarif Kasim Riau.
Nuraeni, F., 2016. Aplikasi Pakar Untuk Diagnosa Penyakit Kulit Menggunakan Metode Forward Chaining Di Al Arif Skin Care Kabupaten Ciamis. Teknik Informatika STMIK Tasikmalaya. Pardiansyah, R., 2015. Association Between
Personal Protective Equipment With the Irritant Contact Dermatitis in Scavengers. Faculty of Medicine, Lampung University.
Prativi, G.S., M. Yunita, I dan Linda, S.B., 2013. Hubungan Pengetahuan Dengan Sikap Keluarga Dalam Mencegah Kejadian Skabies Di Desa Laksana Mekar.