Probabilistic Neural Network (PNN) diperkenalkan oleh Donal F. Spect tahun 1990 dalam tulisannya berjudul “Probabilistic Neural Network” yang merupakan penyempurnaan ide-ide sebelumnya yang telah dilakukannya sejak 1966 (Fausett 1994).
Probabilistic Neural Network dirancang menggunakan ide dari teori probabilitas klasik
yaitu Bayesian dan estimator
pengklasifikasian Parzen untuk Probability Density Function. Dengan menggunakan pengklasifikasian Bayesian dapat ditentukan bagaimana sebuah data masukkan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut (Fausett 1994).
Struktur PNN terdiri dari empat layer yaitu
input layer, pattern layer, summation layer, decision layer. Struktur tersebut dapat dilihat pada Gambar 1.
PENDAHULUAN
Latar BelakangDiagnosa untuk membedakan penyakit- penyakit erythemato-squamous merupakan masalah dalam ilmu tentang kesehatan kulit (dermatologi). Penyakit-penyakit yang termasuk ke dalam kelompok tersebut adalah
psoriasis, seboreic dermatitis, lichen planus, pityriasis rosea, cronic dermatitis dan
pityriasis rubra pilaris. Pada pengamatan awal, penyakit tersebut memiliki ciri-ciri klinis erythema dan scaling dengan perbedaan yang sangat kecil (Merz dan Murphy 1996, diacu dalam Kustiyo 2004).
Dalam dunia kedokteran, langkah-langkah yang dilakukan untuk menentukan jenis penyakit tersebut terdiri atas dua tahap yaitu pemeriksaan secara klinis dan histopatologis. Nilai yang diberikan untuk hasil pemeriksaan histopatologis ditentukan melalui analisis terhadap sampel yang diamati menggunakan mikroskop. Kesulitan yang timbul pada evaluasi tersebut adalah satu penyakit dapat menunjukkan ciri-ciri histopatologis penyakit lain pada tahap permulaan dan baru menunjukkan karakteristik yang sebenarnya pada tahap berikutnya (Merz dan Murphy 1996, diacu dalam Kustiyo 2004).
Beberapa penelitian telah dilakukan untuk memprediksi jenis penyakit tersebut, antara lain menggunakan algoritma nearest neighbor classifier, naïve bayesian classifier, voting feature intervals-5, algoritma genetika, dan jaringan syaraf tiruan (JST) dengan algoritma propagasi balik.
Penelitian yang menggunakan JST dilakukan oleh Lay (1999) dengan menggunakan algoritma propagasi balik dan algoritma apriori, yang menghasilkan ketepatan prediksi sebesar 68.00%. Algoritma propagasi balik digunakan Kustiyo (2004) dengan inisialisasi pembobot awal menggunakan regresi logistik biner yang menghasilkan ketepatan prediksi sebesar 94.40%, serta menggunakan inisialisasi pembobot acak yang menghasilkan ketepatan prediksi sebesar 76.02% sedangkan pada Fajriyati (2005) dilakukan penelitian menggunakan JST propagasi balik dengan insialisasi bobot awal acak dan Nguyen- Widrow, dengan ketepatan masing-masing 96.65 % dan 94.42 %
Ketepatan prediksi menggunakan model JST tersebut masih lebih rendah dibandingkan
dengan ketepatan prediksi menggunakan algoritma lainnya yang mencapai 99.20%, yaitu menggunakan voting feature interval-5 (Güvenir et al 1998).
Semua penelitian yang telah dilakukan belum mencakup pembedaan faktor family history dan selang umur (anak, dewasa, dan tua). Oleh karena itu pada penelitian ini akan digunakan algoritma Probilistic Neural Network (PNN) untuk menganalisis data. Tujuan Penelitian
Tujuan dari penelitian ini ialah menganalisa ketepatan hasil pengklasifikasian penyakit erythemato-squamous menggunakan PNN yang dikelompokan berdasarkan family history dan umur.
Ruang Lingkup
Penelitian ini menggunakan data asli dari hasil diagnosa terhadap pasien. Teknik pembelajaran yang digunakan adalah teknik PNN. Nilai smoothing parameter (h) yang digunakan yaitu 0.25, 0.5, 0.75 dan 1. Selang umur yang digunakan yaitu anak (0 sampai 17), dewasa (18 sampai 40) dan tua (41 sampai 75).
Manfaat Penelitian
Manfaat dari penelitian ini ialah sistem dapat mengetahui ketepatan hasil diagnosa pasien.
TINJAUAN PUSTAKA
Probabilistic Neural Network (PNN)Probabilistic Neural Network (PNN) diperkenalkan oleh Donal F. Spect tahun 1990 dalam tulisannya berjudul “Probabilistic Neural Network” yang merupakan penyempurnaan ide-ide sebelumnya yang telah dilakukannya sejak 1966 (Fausett 1994).
Probabilistic Neural Network dirancang menggunakan ide dari teori probabilitas klasik
yaitu Bayesian dan estimator
pengklasifikasian Parzen untuk Probability Density Function. Dengan menggunakan pengklasifikasian Bayesian dapat ditentukan bagaimana sebuah data masukkan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut (Fausett 1994).
Struktur PNN terdiri dari empat layer yaitu
input layer, pattern layer, summation layer, decision layer. Struktur tersebut dapat dilihat pada Gambar 1.
Gambar 1 Struktur Probabilistic Neural Network (Ganchev 2005).
Sistem menerima sebuah masukkan vektor tes x dari input layer. Keluaran dari pattern layer dapat dihitung melalui persamaan sebagai berikut:
( )
−
=
∏
= j ij j d jh
x
x
k
x
f
1 , dengan d :dimensi vektor k(x) : 2 2 ze
−xj :vektor input kolom ke-j
xij :vektor bobot baris ke-i kolom ke-j
hj :2.24 x (standar deviasi ke-j) x n-1/5
(Silverman 1985)
Summation layer dihitung melalui persamaan:
( ) ( )
∑ ∏
= =
−
=
n i d j j ij j d dh
x
x
k
n
h
h
h
x
p
1 1 2 1 2...
2
1
π
dengan n adalah banyaknya observasi. Suatu vektor tes x diklasifikasikan pada decision
layer sebagai kelas Y jika nilai PY(x) paling
besar untuk kelas Y. Validasi Silang
Sebelum digunakan, suatu sistem berbasis komputer harus dievaluasi dalam beberapa aspek. Validasi kinerja merupakan aspek yang paling penting. Validasi bertujuan menentukan kinerja sistem yang dapat diterima dalam hal akurasi dan efisiensi atau tidak (Fu 1994).
Sejumlah teknik telah dikembangkan untuk validasi sistem cerdas. Salah satu teknik yang dikembangkan ialah cross validation. Cross validation (validasi silang) merupakan salah satu teknik pendugaan error rate. Beberapa teknik lain ialah holdout, leave one out dan boostrapping (Weiss dan Kapouleas 1989, diacu dalam Fu 1994). K- fold cross validation melakukan pengulangan sebanyak k kali untuk sample yang dibagi secara acak ke dalam k himpunan bagian yang terpisah. Setiap pengulangan terdapat satu bagian untuk proses testing dan sisanya (k-1
bagian) sebagai data training sehingga terdapat sebanyak k pengulangan.
Teknik validasi silang digunakan karena teknik ini sesuai diterapkan untuk data yang berukuran kecil maupun besar. Teknik leave one out dan bootstrapping sesuai digunakan pada data berukuran kecil sedangkan teknik
holdout sesuai untuk data berukuran besar (Fu 1994).
Dalam dunia kedokteran, seringkali tersedia sedikit data untuk melakukan pelatihan terhadap model. Kasus baru untuk melakukan pengujian data jarang ditemukan. Karena alasan tersebut, prosedur validasi dengan teknik resampling biasanya digunakan. Pada teknik tersebut digunakan sebagian data untuk pelatihan dan sisanya untuk validasi (Kustiyo 2004).