METODE PENELITIAN

Penelitian ini melalui beberapa tahapan proses untuk mengetahui akurasi yang diperoleh algoritma VFI5 dalam mendiagnosa penyakit Demam Berdarah Dengue (DBD). Tahapan- tahapan proses tersebut dapat dilihat pada Gambar 1.

Data

Data yang digunakan dalam penelitian ini adalah data penyakit Demam Berdarah Dengue (DBD) pada penelitian Syafii (2006). Sampel terdiri dari data pasien yang menderita penyakit DBD dan Demam Dengue (DD). Menurut International Classification of Deseases tenth revision (ICD 10) penyakit DBD diberi kode A.91 dan penyakit DD dengan kode A.90.

Persyaratan catatan medis yang dijadikan sampel adalah apabila di dalam catatan medis terdapat 4 (empat) catatan tentang kriteria klinis yaitu : demam (panas), bercak-bercak (petekia), tanda pendarahan spontan (mimisan, gusi berdarah, muntah berdarah dan tinja berwarna hitam) dan hasil uji tornikuet. Dicatat juga kriteria laboratoris hasil pemeriksaan darah trombosit. Penyakit DD digunakan sebagai pembanding dalam penelitian ini karena

yang ada pada feature kelas yang sedang diamati.

Setelah nilai end point untuk setiap feature linier didapatkan maka langkah selanjutnya adalah mengurutkan nilai-nilai end point tersebut. Hasil pengurutan tersebut akan membentuk suatu interval bagi feature f. Jika feature tersebut merupakan feature linier yang memiliki nilai kontinu maka akan dibentuk dua interval yaitu point interval dan range interval. Jika suatu feature merupakan feature nominal maka hanya akan dibentuk point interval.

Batas bawah pada range interval (ujung paling kiri) adalah -∞ sedangkan batas atas range interval (ujung paling kanan) adalah +∞. Jumlah maksimum end point pada feature linier adalah 2k, sedangkan jumlah maksimum intervalnya adalah 4k+1, dengan k adalah jumlah kelas yang diamati.

Langkah selanjutnya adalah menghitung jumlah instances pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i dan direpresentasikan sebagai interval_class_count [f,i,c]. Untuk setiap instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i

merupakan point interval dan nilai ef sama

dengan nilai pada batas bawah atau batas atas maka jumlah kelas instances tersebut (ef) pada

interval i ditambah 1. Jika interval i merupakan range interval dan nilai ef jatuh pada interval

tersebut maka jumlah kelas instances ef pada

interval i ditambah 1. Hasil dari proses tersebut merupakan jumlah vote kelas c pada interval i.

Untuk menghilangkan efek perbedaan distribusi setiap kelas, maka jumlah vote kelas c untuk feature f pada interval i dinormalisasi dengan cara membagi vote tersebut dengan jumlah instances kelas c yang direpresentasikan dengan class_count[c]. Hasil normalisasi ini dinotasikan sebagai interval_class_vote[f,i,c]. Kemudian nilai-nilai interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature f sama dengan 1. Normalisasi ini bertujuan agar setiap feature memiliki kekuatan voting yang sama pada proses klasifikasi yang tidak dipengaruhi oleh ukurannya.

2 Prediksi (klasifikasi)

Tahap klasifikasi pada algoritma VFI5 diawali dengan proses inisialisasi awal nilai vote masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari interval i dimana nilai ef

jatuh, dengan ef merupakan nilai feature f dari

instances tes e. Jika ef tidak diketahui (hilang),

maka feature tersebut tidak diikutsertakan dalam voting (memberi vote 0 untuk masing- masing kelas). Oleh karena itu, feature yang memiliki nilai tidak diketahui diabaikan.

Jika ef diketahui maka interval tersebut

dapat ditemukan. Interval tersebut dapat menyimpan instances pelatihan dari beberapa kelas. Kelas-kelas dalam sebuah interval direpresentasikan oleh vote kelas-kelas tersebut pada interval itu. Untuk setiap kelas c, feature f memberikan vote yang sama dengan interval_class_vote[f,i,c]. Notasi tersebut merepresentasikan vote feature f yang diberikan untuk kelas c.

Setiap feature f mengumpulkan vote- votenya dalam sebuah vektor

(feature_vote[f,C1],..., feature_vote[f,Cj], ...,

feature_vote[f,Ck]), dimana feature_vote[f,Cj]

merupakan vote feature f untuk kelas Cj dan k

adalah jumlah kelas. Kemudian d vektor vote, dimana d merupakan jumlah feature, dijumlahkan untuk memperoleh total vektor vote (vote[C1], ..., vote[Ck]). Kelas dengan

jumlah vote terbesar diprediksi sebagai kelas dari instances tes e. Pseudocode algoritma pelatihan dan klasifikasi VFI5 dapat dilihat pada Lampiran 1 dan Lampiran 2.

Data

pertimbangan adanya catatan 4 kriteria klinis dan 1 kriteria laboratoris (Syafii 2006).

Gambar 1 Tahapan proses klasifikasi data Jumlah penderita DBD 120 orang sedang jumlah penderita DD 111 orang. Berdasarkan daftar penderita ini maka dilakukan pencarian catatan medisnya. Dari pencarian terhadap 231 catatan medis, ditemukan 205 catatan medis. 26 catatan medis tidak ditemukan karena sedang digunakan dan juga karena kasusnya bukan rawat inap. Dari 205 catatan medis yang ditemukan, catatan medis yang memenuhi persyaratan hanya 64, yang terdiri dari 32 kasus DBD dan 32 kasus DD (Syafii 2006).

Seleksi Data

Pada penelitian ini akan dilakukan seleksi terhadap keseluruhan data baik sebelum maupun setelah validasi. Seleksi ini dilakukan untuk menentukan data mana yang digunakan sebagai data latih dan data uji.

Data Latih dan Data Uji

Dengan metode 3-fold cross validation, seluruh data dibagi menjadi beberapa subset. Masing-masing subset memiliki ukuran contoh yang hampir sama. Subset-subset tersebut akan digunakan sebagai data pelatihan dan data pengujian. Masing-masing data memuat informasi tentang data input berupa demam, bercak, pendarahan, hasil uji tornikuet dan data output berupa diagnosa (DBD atau DD).

Algoritma VFI5

Pada penelitian ini digunakan algoritma klasifikasi VFI5 dengan bobot setiap feature diasumsikan sama, yaitu satu. Tahapan ini terdiri dari dua proses yaitu pelatihan dan prediksi (klasifikasi) kelas instances baru. Data

Pada tahap pelatihan, data yang telah dibagi- bagi menjadi beberapa subset menjadi input algoritma klasifikasi VFI5. Selanjutnya akan ditentukan nilai end point untuk setiap fitur. Dari nilai end point tersebut akan dibentuk interval-interval dari setiap fitur yang ada. Setelah semua interval terbentuk, langkah selanjutnya adalah menghitung jumlah instances setiap kelas yang berada pada setiap interval tersebut dan dilakukan normalisasi. Hasil dari tahap pelatihan berupa interval setiap fitur merupakan suatu model dari VFI5.

Seleksi data

Pada tahap klasifikasi, setiap nilai feature dari suatu instances baru diperiksa letak interval nilai feature tersebut. Vote-vote setiap kelas untuk setiap feature pada setiap interval yang bersesuaian diambil dan kemudian dijumlahkan. Kelas dengan nilai total vote tertinggi akan menjadi kelas prediksi instances baru tersebut.

Analisis

Pada tahapan ini dilakukan proses penghitungan akurasi. Akurasi diperoleh dengan perhitungan :

Selain itu juga dilakukan pengamatan terhadap hasil diagnosa penyakit DBD dengan menggunakan VFI5. Hasil diagnosa diperoleh dari kelas dengan jumlah vote terbesar.

Spesifikasi Aplikasi

Aplikasi dirancang dan dibangun dengan hardware dan software sebagai berikut : Hardware berupa komputer personal dengan spesifikasi :

1 Prosesor Intel Pentium 4 2 Memori 512 MB 3 Harddisk 80 GB 4 Monitor 15”

5 Alat input mouse dan keyboard Software :

1. Sistem Operasi : Microsoft Windows XP 2. Microsoft Visual Basic 6.0

∑ ∑ = uji data total asi diklasifik benar uji data akurasi Data uji Klasifikasi Pelatihan Data latih Model VFI5 Akurasi

HASIL DAN PEMBAHASAN

Dalam dokumen Diagnosis Penyakit Demam Berdarah Dengue Menggunakan Voting Feature Intervals 5 (Halaman 51-54)