• Tidak ada hasil yang ditemukan

Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Autism Spectrum Disorder

N/A
N/A
Protected

Academic year: 2023

Membagikan "Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Autism Spectrum Disorder "

Copied!
5
0
0

Teks penuh

(1)

Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Autism Spectrum Disorder

Febriyanti Ramadhany e-mail: febriyantirmdy@gmail.com

Universitas BSI Bandung

Jl. Sekolah Internasional No. 1 – 6 Bandung http://universitas.bsi.ac.id

Abstrak

ASD (Autism Spectrum Disorder) merupakan gangguan perkembangan fungsi otak yang kompleks dan sangat beragam. Gangguan perkembangan ini meliputi bidang komunikasi, interaksi, perilaku, emosi dan sensoris. Penderita ASD mempunyai karakteristik berbeda dengan penderita lainnya, maka memerlukan waktu yang cukup lama untuk mendiagnosis penderita ASD. Untuk mengurangi kesalahan deteksi dan mengurangi tingkat keterlambatan dalam diagnosis penderita ASD, dapat dilakukan penerapan klasifikasi teknik data mining. Salah satu metode yang dapat digunakan untuk klasifikasi adalah algoritma K-Nearest Neighbor (K-NN).

Pada penelitian ini, algoritma klasifikasi K-NN diterapkan pada Autistic Spectrum Disorder Screening Data for Adult. Data yang diperoleh sebanyak 608 record yang kemudian dibagi kedalam 2 kelompok data yaitu data training sejumlah 364 record dan data testing sejumlah 244 record. Data tersebut kemudian diolah menggunakan software rapidminer dengan model yang sudah ditentukan sebelumnya. Dari hasil pengolahan data menggunakan metode Split Validation dengan pembagian data training dan data testing sebesar 60-40 persen menghasilkan nilai akurasi klasifikasi sebesar 98,77% dan menghasilkan nilai AUC sebesar 0,997 yang termasuk kategori Excellent Classification.

Kata Kunci: Autism Spectrum Disorder, Data Mining, Klasifikasi, K-Nearest Neighbor

Abstrack

ASD (Autism Spectrum Disorder) is a complex and very diverse developmental function of brain function. These developmental disorders include the fields of communication, interaction, behavior, emotions and sensory. ASD sufferers have different characteristics from other patients, so it takes a long time to diagnose ASD sufferers. To reduce detection errors and the level of delay in the diagnosis of ASD sufferers, the application of data mining techniques can be applied and used. One method that can be used for classification is the K-Nearest Neighbor (K-NN) algorithm. In this study, the K-NN classification algorithm was applied to the Autistic Spectrum Disorder Screening Data for Adult. The data obtained are 608 records which are then divided into 2 groups of data namely training data totaling 364 records and testing data totaling 244 records. The data is then processed using rapidminer software with a predetermined model. From the results of data processing using the Split Validation method with the distribution of training data and testing data of 60-40 percent resulted in a classification accuracy value of 98.77% and produced an AUC value of 0.997 which belonged to the Excellent Classification category.

Keywords: Autism Spectrum Disorder, Data Mining, Classification, K-Nearest Neighbor

1. Pendahuluan

Autisme berasal dari kata autos yang berarti segala sesuatu yang mengarah pada diri sendiri (Hasanah et al., 2009). Dalam dunia medis atau psikolog, gangguan autisme atau biasa disebut dengan ASD (Autism Spectrum Disorder) merupakan gangguan perkembangan fungsi otak yang

kompleks dan sangat beragam. Umumnya gangguan perkembangan ini meliputi bidang komunikasi, interaksi, perilaku, emosi dan sensoris. Berdasarkan data para ahli diketahui bahwa penyandang ASD lebih banyak diderita oleh pria dibandingkan wanita dengan rasio 4 : 1 (Aprilia et al., 2014).

(2)

Penderita ASD mempunyai karakteristik berbeda dengan penderita lainnya, maka memerlukan waktu yang cukup lama untuk mendiagnosis penderita ASD (Agustina, 2017). Kecepatan dan ketepatan sangat dibutuhkan agar dampak yang kurang baik bagi penderita dapat terkontrol. Kurangnya pengetahuan dan pengalaman mengakibatkan peningkatan jumlah penderita ASD. Untuk mengurangi kesalahan deteksi dan mengurangi tingkat keterlambatan dalam diagnosis penderita ASD, dapat dilakukan penerapan teknik data mining (Putri et al., 2017).

Kegunaan teknik data mining telah diketahui dan dimanfaatkan di dunia medis.

Pemanfaatan ini terjadi karena data mining medis bisa menemukan pola tersembunyi yang biasanya tidak ditemukan. Teknik data mining yang telah diterapkan pada data medis meliputi association rule untuk menemukan pola berulang, prediksi, klasifikasi dan klastering. Hal ini mengakibatkan pengembangan sistem kecerdasan dan penunjang keputusan dalam bidang kesehatan untuk mendiagnosis keakuratan suatu penyakit, memprediksi tingkat keparahan berbagai jenis penyakit dan pengawasan kesehatan dari jauh (Khaleel et al., 2013).

Dalam teknik data mining, klasifikasi data adalah proses pembentukan model atau pengklasifikasi untuk memprediksi label kategori yaitu label kelas data yang dibedakan. Model yang dibuat ini digunakan untuk menggambarkan label data input baru atau data yang label kelasnya tidak diketahui (Agarwal, 2013).

Algoritma K-Nearest Neighbor (K-NN) merupakan salah satu metode pada klasifikasi data mining. Algoritma K-NN menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru. Algoritma metode K-NN sangatlah sederhana, bekerja berdasarkan jarak terdekat dari query instance ke training sample untuk menentukan kelasnya. Tujuan dari Algoritma ini ialah mengklasifikasikan objek baru berdasarkan atribut dan training sample (Lestari, 2014).

Dalam beberapa penelitian yang dilakukan oleh penelitian sebelumnya, penggunaan algoritma K-NN untuk mendiagnosis Autism Spectrum Disorder pada anak usia 4-11 tahun (Altay & Ulas, 2018). Dalam penelitian klasifikasi kelainan gaya berjalan yang menggunakan fitur seleksi Stepwise Discriminant Analysis

(SWDA) dan klasifikasi model K-Nearest Neighbor (Zawiyah et al., 2017). Dan dalam penelitian klasifikasi untuk deteksi Autistic Spectrum Disorder Screenning Data for Adult menggunakan algoritma Naïve Bayes dan Naïve Bayes dengan Particle Swarm Optimization (Agustina, 2017).

Berdasarkan penelitian sebelumnya yang telah diuraikan, penulis memutuskan menggunakan Dataset dengan judul Autistic Spectrum Disorder Screening Data for Adult yang diungguh di University of California Irvine machine learning data repository.

Maka dalam penelitian ini, data yang didapatkan akan diolah menggunakan teknik klasifikasi data mining algoritma K- Nearest Neighbor dengan judul “Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Autism Spectrum Disorder”.

2. Metode Penelitian

Penelitian yang dilakukan dengan dataset yang diperoleh dari University of California Irvine machine learning data repository dengan judul Autistic Spectrum Disorder Screening Data for Adult. Data yang berhasil dikumpulkan berjumlah 704 record. Data mempunyai 20 attribut dengan 10 attribut data perilaku dan 10 karakteristik seseorang.

Tabel 2.3.

Fitur dan Deskripsi Dataset Autism Spectrum Disorder

Atribut Tipe Deskripsi Umur Number Usia subjek di

tahun ini Jenis Kelamin String Wanita atau Pria Etnis String Daftar etnis umum

dalam format teks Terlahir

Kuning

Boolea n (ya atau tidak)

Apakah subjek terlahir dengan kondisi kuning Anggota

keluarga dengan PDD

Boolea n (ya atau tidak)

Apakah keluarga terdekat subjek memiliki kelainan PDD

Siapa yang melakukan tes

String Siapa yang melakukan tes ini, orang tua, diri sendiri, perawat, staf medis, staf klinik ,etc.

Negara asal String Daftar negara dalam format teks Pernah

menggunaka n aplikasi screening sebelumnya

Boolea n (ya atau tidak)

Apakah pengguna pernah

menggunakan aplikasi ini

(3)

Tipe metode screening

Integer (0,1,2,3 )

Tipe metode screening

berdasarkan grup usia (0=balita, 1=anak-anak, 2=

remaja, 3=

dewasa) Pertanyaan 1

Jawaban

Binary (0, 1)

Subjek sering memperhatikan suara kecil saat orang lain tidak mendengarnya Pertanyaan 2

Jawaban

Binary (0, 1)

Subjek lebih fokus pada gambaran besar, daripada detail kecil Pertanyaan 3

Jawaban

Binary (0, 1)

Subjek merasa mudah untuk melakukan banyak hal secara bersamaan Pertanyaan 4

Jawaban

Binary (0, 1)

Jika ada

gangguan, subjek bisa kembali lagi pada apa yang sedang dikerjakan secara cepat Pertanyaan 5

Jawaban

Binary (0, 1)

Subjek mudah mengartikan perkataan yang tersirat saat orang lain berbicara pada subjek Pertanyaan 6

Jawaban

Binary (0, 1)

Subjek bisa tahu saat seseorang yang sedang mendengarkanny a merasa bosan Pertanyaan 7

Jawaban

Binary (0, 1)

Saat subjek sedang membaca cerita, subjek sulit untuk mengetahui maksud dan tujuan dari karakter ceritanya Pertanyaan 8

Jawaban

Binary (0, 1)

Subjek suka mengoleksi informasi tentang kategori banyak hal (contoh, jenis mobil, kereta, tumbuhan, dll) Pertanyaan 9

Jawaban

Binary (0, 1)

Subjek merasa mudah

mengetahui apa yang dipikirkan orang lain dengan hanya melihat wajah mereka Pertanyaan

10 Jawaban

Binary (0, 1)

Subjek merasa sulit mengetahui maksud dan niat seseorang

Skor screening

Integer Hasil akhir dari algoritma metode screening.

Dihitung secara otomatis

3. Tahapan Penelitian

Gambar 3.1. Desain Penelitian

4. Hasil dan Pembahasan

Eksperimen terhadap algoritma K- Nearest Neighbor akan dilakukan dalam dua tahap, eksperimen tahap pertama adalah eksperimen terhadap algoritma K-Nearest Neighbor dengan menggunakan metode K- Fold Cross Validation dan cara kedua adalah eksperimen terhadap algoritma K- Nearest Neighbor dengan menggunakan metode Split Validation.

4.1. Hasil Eksperimen K-NN dengan metode K-Fold Cross Validation Eksperimen ini menggunakan Autism Spectrum Disorder for Adult Dataset yang telah disiapkan untuk diimplementasikan pada proses uji model kemudian diujikan pada algoritma K-Nearest Neighbor dengan metode validasi K-Fold Cross Validation.

Setelah dilakukan uji model maka diperoleh hasil seperti pada tabel 4.1.

Tabel 4.1.

Hasil Akurasi Algoritma K-NN Menggunakan K-Fold Cross Validation

Hasil Akurasi menggunakan K-Fold Cross Validation Model

Algorit ma

Jumlah Fold Cross Validati on

Parameter K (Jumlah Ketetanggan)

K=1 K=3 K=5 K=7 K=9

KNN 10 96.06

% 96.55

% 97.53

% 97.86

% 98.35

%

KNN 5 95.72

% 96.21

% 97.37

% 97.86

% 98.02

% Pengumpulan Data

Data Cleaning

Data Testing Data Training

K-Fold Cross Validation

Validasi K-Nearest Neighbor

Split Validation

Komparasi

Hasil Evaluasi Persiapan Data Awal

Pemodelan

(4)

Gambar 4.1. Hasil Akurasi Algoritma K- NN Menggunakan 5-Fold Cross

Validation

Gambar 4.2. AUC Algoritma K-NN Menggunakan 5-Fold Cross Validation

Pada tabel 4.1 menunjukkan hasil akurasi untuk klasifikasi deteksi Autism Spectrum Disorder for Adult Dataset diperoleh dengan penerapan metode K- Nearest Neighbor menggunakan teknik validasi K-Fold Cross Validation. Pada eksperimen ini diperoleh hasil yang paling tinggi menggunakan teknik validasi 10-Fold Cross Validation dengan K=9 yaitu, akurasi mencapai 98,35%. Pada Gambar 4.2 menghasilkan nilai AUC sebesar 0,998 yang termasuk kategori Excellent Classification.

4.2. Hasil Eksperimen K-NN dengan Split Validation

Autism Spectrum Disorder for Adult Dataset dibagi menjadi beberapa ukuran pembagian training data dan testing data.

Dataset yang telah disiapkan untuk diimplementasikan pada proses uji model kemudian diujikan pada Algoritma K- Nearest Neighbor dengan metode validasi Split Validation. Setelah dilakukan uji model maka diperoleh hasil seperti pada tabel 4.2.

Tabel 4.2.

Hasil Akurasi Model K-NN menggunakan Split Validation

Hasil Akurasi menggunakan Split Validation Ukura

n Traini

ng

Parameter K (Jumlah Ketetanggan) K=1 K=3 K=5 K=7 K=9 90-10 95.08

%

93.44

%

93.44

%

93.44

%

95.08

% 80-20 94.26

%

95.90

%

96.72

%

96.72

%

98.36

% 70-30 95.60

%

95.05

%

97.25

%

97.80

%

98.35

% 60-40 94.65

%

95.47

%

95.88

%

97.12

%

98.77

% 50-50 95.72

%

96.38

%

96.71

%

96.71

%

96.05

%

Gambar 4.3. Hasil Akurasi Algoritma K- NN Menggunakan Split Validation

Gambar 4.4. AUC Algoritma K-NN Menggunakan Split Validation

Pada tabel 4.2 menunjukkan hasil akurasi untuk klasifikasi deteksi Autism Spectrum Disorder for Adult Dataset diperoleh dengan penerapan metode K- Nearest Neighbor menggunakan teknik validasi Split Validation. Pada eksperimen yang kedua ini diperoleh hasil yang paling tinggi dengan ukuran Training 60-40 pada K=9 yaitu, nilai akurasi 98,77%. Hasil yang diperoleh dari pengolahan curve ROC seperti yang terlihat pada gambar 4.4 menghasilkan nilai AUC sebesar 0,997 yang termasuk kategori Excellent Classification.

5. Kesimpulan

(5)

Pada penelitian ini dilakukan eksperimen terhadap algoritma K-Nearest Neighbor untuk mengklasifikasi Autism Spectrum Disorder for Adult Dataset. Untuk mencari hasil optimal dari klasifikasi, dilakukan dua metode dalam evaluasi performa klasifikasi. Yang pertama menggunakan metode K-Fold Cross Validation dan yang kedua menggunakan metode Split Validation dengan pembagian training data dan testing data.

1. Telah diterapkan klasifikasi pada Autism Spectrum Disorder for Adult Dataset menggunakan algoritma K- Nearest Neighbor dengan 2 metode validasi K-Fold Cross Validation dan Split Validation.

2. Telah diketahui hasil akurasi dari algoritma K-Nearest Neighbor untuk klasifikasi Autism Spectrum Disorder for Adult Dataset dengan hasil akurasi optimal sebesar 98,77%

menggunakan Split Validation dengan rasio 60-40.

Referensi

Agarwal, S. (2013). Data Mining: Data Mining Concepts and Techniques.

2013 International Conference on Machine Intelligence and Research

Advancement, 203–207.

https://doi.org/10.1109/ICMIRA.2013.4 5

Agustina, C. (2017). Optimasi Naive Bayes Menggunakan Particle Swarm Optimization Untuk Meningkatkan Akurasi Deteksi Autisme Spectrum Disorder, 10(2), 1–5.

Altay, O., & Ulas, M. (2018). Prediction of the autism spectrum disorder diagnosis with linear discriminant analysis classifier and K-nearest neighbor in children. In 2018 6th International Symposium on Digital Forensic and Security (ISDFS) (pp. 1–4). IEEE.

https://doi.org/10.1109/ISDFS.2018.83 55354

Aprilia, D., Johar, A., & Pudji Hartuti. (2014).

Sitem Pakar Diagnosa Autisme pada Anak. Rekursif, 2(Sistem Pakar), 92–

98.

Hasanah, D., Budiarti, M., & Rachmasari, Y.

(2009). Peran Pekerja Sosial Dalam Penanganan Anak Autis.

Khaleel, M. A., Kumar, S., & Dash, P. G. N.

(2013). A Survey of Data Mining Techniques on Medical Data for Finding Locally Frequent Diseases.

International Journal of Advanced Research in Computer Science and Software Engineering, 3(8), 2277–128.

Lestari, M. E. I. (2014). Penerapan Algoritma Klasifikasi Nearest Neighbor (K-NN) untuk Mendeteksi Penyakit Jantung.

Faktor Exacta, 7(4), 366–371.

Putri, Z. S., Putri, R. R. M., & Indriati. (2017).

Deteksi Autisme pada Anak Menggunakan Metode Modified K- Nearest Neighbor (MKNN), 1(9), 241–

248.

Zawiyah, C., Hasan, C., Jailani, R., Tahir, N.,

& Sahak, R. (2017). Autism Spectrum Disorders Gait Identification Using Ground Reaction Forces, 15(2).

https://doi.org/10.12928/TELKOMNIK A.v15i2.6143

Referensi

Dokumen terkait

Oleh karena itu Penulis akan membuat suatu metode pendekatan berdasarkan deteksi wajah dengan algoritma K-Nearest Neighbor atau sering disebut dengan algoritma K-NN yaitu suatu