Ramadhana Dio Gradianta | 1310 100 076
Seminar Hasil Tugas Akhir
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode Hybrid Analisis Diskriminan dan Algoritma Genetika
Dosen pembimbing : Dr. Irhamah, S.Si.,M.Si.
AGENDA
Pendahuluan Tinjauan Pustaka
Metodologi Penelitian
Analisis dan Pembahasan
Kesimpulan dan Saran
Daftar Pustaka
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 2
Pendahuluan
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode
Hybrid
Analisis Diskriminan dan Algoritma GenetikaLatar belakang
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 4
Latar belakang
11.1 10.8
8.9 8.4
Jumlah Penderita Diabetes Melitus Dunia (dalam juta)
Latar belakang
6
Tipe 1 Tipe 2 Tipe Lain
Tipe 1 8%
Tipe 2 90%
Tipe Lain 2%
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Latar belakang
Gula darah teregulasi Gula darah
belum teregulasi
ANALISIS DISKRIMINAN HYBRID
&
ALGORITMA GENETIKA
Penelitian Sebelumnya
8
Implementasi Algoritma Genetika Pada Struktur Backpropagation Neural Network Untuk Klasifikasi Kanker Payudara
Zamani (2013)
• Neural Network yang dioptimalkan parameternya menggunakan algoritma genetika terbukti mampu menghasilkan nilai rata-rata akurasi yang tinggi
Classification Rule Discovery for Diabetes Patients by Using Genetic Programming
Raj dan Rajesh (2012)
• Menggunakan algoritma genetika, akurasi yang diperoleh dari hasil klasifikasi lebih tinggi dibandingkan dengan metode konvensional.
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Penelitian Sebelumnya
Komparasi Hasil Klasifikasi Penyakit Diabetes Mellitus Menggunakan
Jaringan Syaraf Tiruan Backpropagation dan Learning Vector Quantization Agus Nurkhozin (2011)
• Klasifikasi menggunakan LVQ memberikan tingkat akurasi yang lebih tinggi dibandingkan dengan jaringan Backpropagation
Boosting Neural Network dan Boosting CART Pada Klasifikasi Diabetes Melitus Tipe II
Jehri Wahyu (2012)
• Boosting CART menghasilkan akurasi yang lebih tinggi dibandingkan dengan Boosting Neural Network
Perumusan masalah
1
• Bagaimana ketepatan klasifikasi penderita diabetes melitus tipe dua dengan menggunakan analisis diskriminan?
2
• Bagaimana ketepatan klasifikasi penderita diabetes melitus tipe dua dengan menggunakan metode hybrid analisis diskriminan dan algoritma genetika?
3
• Bagaimana perbandingan ketepatan klasifikasi menggunakan metode analisis diskriminan dan hybrid diskriminan-algoritma genetika?
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 10
Tujuan Penelitian
1
• Mendapatkan nilai ketepatan klasifikasi penderita diabetes melitus tipe dua dengan menggunakan analisis diskriminan
2
• Mendapatkan nilai ketepatan klasifikasi penderita diabetes me-litus tipe dua dengan menggunakan metode hybrid analisis dis-kriminan-algoritma genetika.
3
• Membandingan ketepatan klasifikasi dengan menggunakan metode analisis diskriminan dan hybrid diskriminan-algoritma genetika
Manfaat Penelitian
1
• Sebagai informasi tambahan untuk mengambil suatu tindakan pada pasien diabetes melitus berdasarkan pengklasifikasian.
2
• Menjadi informasi tambahan bagi Dinas Kesehatan dalam membuat kebijakan- kebijakan untuk menekan angka penderita diabetes melitus di Indonesia
3
• Hasil perbandingan metode dapat digunakan sebagai dasar untuk menentukan klasifikasi pasien penyakit lain dengan akurasi yang lebih tinggi.
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 12
Batasan Masalah
1
• Penelitian tugas akhir hanya difokuskan pada
pasien penderita diabetes melitus di klinik penyakit dalam dr. Ipung Puruhito Sp.PD.
2
• Pasien yang menjadi responden diasumsikan hanya
menderita diabetes melitus tanpa komplikasi.
TINJAUAN PUSTAKA
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode
Hybrid
Analisis Diskriminan dan Algoritma GenetikaUji Distribusi Normal Multivariat
Hipotesis :
• H0: Data pengamatan berdistribusi normal multivariat
• H1: Data pengamatan tidak berdistribusi normal multivariat Statistik Uji :
Jika terdapat sekitar 50% ≤ ; maka dapat dikatakan bahwa variabel random x berdistribusi normal multivariat.
j jj
x x
d
2 1Uji Kesamaan Varian-Kovarian
Hipotesis :
• H0 : 0 = 1 = 2 = ....k = .
• H1 : Sedikitnya ada dua kelompok yang berbeda.
Statistik uji Box’s M (Johnson & Wichern, 2007) :
H0 ditolak jika C > χ2 p(p+1)(k-1)/2,α dan dapat disimpulkan bahwa antar kelompok mempunyai matriks varian - kovarian yang berbeda
16
jk
j
j pooled
k
j
j S n S
n
M 2ln * ( 1) ln 1 ln
1
1
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Uji Perbedaan Rata-rata
Hipotesis :
• H0 : µ1 = µ2 = … = µk
• H1 : µi ≠ µj (minimal terdapat 2 kelompok yang berbeda) Statistik Uji Wilks’Lambda (Johnson & Wichern, 2007):
Wilks’ Lambda mendekati nilai nol, maka H0 ditolak, artinya terdapat perbedaan kelompok di antara individu.
2 /
ˆ 0
ˆ n
Analisis Diskriminan
• Suatu teknik analisa statistik untuk
mengklasifikasikan objek ke dalam suatu kelompok tertentu berdasarkan peubah bebasnya
Dillon and
Goldstein (1984)
• Suatu metode yang dapat menghasilkan pemisahan yang terbaik antara berbagai macam populasi berdasarkan kombinasi linear dari peubah-peubah bebasnya
Johnson
Wichern (2007)
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 18
Analisis Diskriminan
Persamaan umum dari fungsi diskriminan untuk setiap objek sebagai berikut.
Nilai prediksi dari fungsi diskriminan merupakan skor diskriminan (Z).
Skor diskriminan dikalkulasi untuk setiap objek di dalam analisis (Hair, 2009)
nk n
k k
jk
a w x w x w x
Z
1 1
2 2 ...
Membentuk Klasifikasi
Klasifikasi
Grup A
jika Z
k< Z
ctGrup B
jika Z
k> Z
ct20
Actual Predict
Negatif Positif
Negatif TN FP
Positif FN TP
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Algoritma Genetika
• Algoritma genetika adalah metode untuk memecahkan masalah optimasi yang
didasarkan pada seleksi alam dan proses yang mendorong evolusi biologis.
Holland
(1975)
Langkah-langkah algoritma genetika :
22
Membuat populasi awal secara acak.
Menciptakan urutan populasi baru.
Algoritma berhenti ketika salah satu
kriteria telah terpenuhi.
0 1 0 1 1 1 0
1 1 0 0 1 1 1
1 0 0 1 0 1 1
PINDAH SILANG
Elitisme
SELEKSI ORANG TUA SELEKSI ORANG TUA
K1
K2 K3
K4
PINDAH SILANG
1 0 0 0 1 1 1
1 1 0 0 1 1 1
1 1 0 1 0 0 0
Orang Tua
Anak
1 0 0 1 0 0 0
Elitisme
1 1 1 1 0 0
1 1 1 1 0 1
Fitness = a
Fitness = b
1 1 1 1 0 1 Fitness = z
NILAI FITNESS
KONVERGEN
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Diabetes Melitus
• Diabetes melitus (kencing manis) adalah kelainan yang disebabkan metabolik oleh banyak faktor dengan simtoma berupa hiperglikemia kronis dan gangguan
metabolisme karbohidrat, lemak, dan protein.
• Berbagai penyakit dan sindrom dapat terpicu oleh diabetes melitus, antara
lain: sindom Down, penyakit Hungtinton, penyakit Parkinson, leukoaraiosis,
Tipe-Tipe Diabetes Melitus
Tipe 1
• Terjadi karena
berkurangnya rasio insulin dalam sirkulasi darah akibat
hilangnya sel beta penghasil insulin
Tipe 2
• Terjadi bukan
disebabkan oleh rasio insulin di dalam
sirkulasi darah,
melainkan merupakan kelainan metabolisme yang disebabkan oleh mutasi pada banyak gen
Tipe lain
• Terjadi hanya selama kehamilan dan pulih setelah melahirkan, dengan keterlibatan interleukin-6 dan
protein reaktif C pada lintasan
patogenesisnya
24
Tipe 2
90%
Pasien diabetes melitus tipe dua
Kondisi pasca pemberian obat
Gula darah teregulasi
Gula darah belum teregulasi
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
METODOLOGI PENELITIAN
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode
Hybrid
Analisis Diskriminan dan Algoritma GenetikaSumber Data
26
DATA PASIEN 2012-2013 TEMPAT
PRAKTEK dR. IPUNG PARUHITO
Sp.PD DATA
SEKUNDER
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Variabel Penelitian
Variabel Dependen
1 : Gula darah pasien telah teregulasi
2 : Gula darah pasien belum teregulasi
Variabel Penelitian
Variabel Independen
Gula darah 2 jam post prandial (mg/dl) Tekanan darah sistolic (mmHg)
Tekanan darah diastolic (mmHg) Gula darah puasa (mg/dl)
Usia (tahun)
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 28
Langkah Penelitian
Studi Literatur Menentukan Variabel Penelitian
Mengumpulkan Data Penelitian
Melakukan pengolahan data dengan analisis
diskriminan dan algoritma genetika Membandingkan hasil
analisis kedua metode Menarik kesimpulan
ANALISIS & PEMBAHASAN
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode
Hybrid
Analisis Diskriminan dan Algoritma GenetikaKarakteristik Pasien DM Tipe 2
Variabel
Prediktor Rata-rata Simpangan
baku Max Min
Gula darah 2jpp 219,10 113,50 609 72
Sistolic 132,16 19,74 190 90
Diastolic 81,635 9,86 120 50
Gula darah
puasa 159,06 80,89 445 38
GD2JPP > 200 mg/dl
GDP > 140 mg/dl
Variabel prediktor
Rata-rata Simpangan baku Max Min
T BT T BT T BT T BT
Gula darah
2jpp 147,54 320,70 47,23 101,90 242 609 72 127
Sistolic 127,95 138,14 17,16 21,74 180 190 90 110
Diastolic 79,18 85,12 8,81 10,32 90 120 50 70
Gula darah
puasa 109,74 229,00 28,94 79,40 171 445 38 102
Usia 59,56 52,37 10,98 8,28 90 73 37 36
Karakteristik Pasien DM Tipe 2
32
Rata-rata = 128,64 mg/dl
< 140 mg/dl
Rata-rata = 275,85 mg/dl
> 140 mg/dl
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Uji asumsi analisis diskriminan
Uji Distribusi Normal Multivariat Hipotesis :
• H0: Data pengamatan berdistribusi normal multivariat
• H1: Data pengamatan tidak berdistribusi normal multivariat
Statistik Uji : Proporsi nilai ≤ ; = 4,351 sebesar 59,6%
Kesimpulan : Gagal tolak H0, karena proporsi di sekitar 50%.
20 15
10 5
0 15
10
5
0
dd
q
Data berdistribusi normal multivariat
Uji asumsi analisis diskriminan
34
Uji Kesamaan Matriks Varian-Kovarian Hipotesis :
• H0 : 0 = 1 = 2 = ....k = .
• H1 : Sedikitnya ada dua kelompok yang berbeda.
Statistik Uji : Box’s M = 36,510 χ215;0,05 = 24,996
Kesimpulan : Tolak H0, karena statistik uji Box’s M > χ215;0,05
Varian-kovarian kedua kelompok tidak homogen
Analisis fungsi diskriminan tetap robust walaupun asumsi kesamaan varian- kovarian tidak terpenuhi (Gozhali, 2006)
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Uji asumsi analisis diskriminan
Uji Perbedaan Rata-Rata Antar Kelompok Hipotesis :
• H0 : µ1 = µ2 = … = µk
• H1 : µi ≠ µj (minimal terdapat 2 kelompok yang berbeda)
Kesimpulan : Tolak H0, terdapat 3 variabel yang mengandung statistik uji wilk’s lambda yang menjauhi 1.
Data memiliki rata-rata yang berbeda antar kelompok Variabel
prediktor
Wilks'
Lambda Pvalue
GD2JPP 0,430 0,000
Sistolic 0,935 0,009
Diastolic 0,911 0,002
GDP 0,467 0,000
Usia 0,886 0,000
Statistik Uji :
Pemilihan model terbaik
36
Berhenti ketika tidak ada lagi Fhitung > Ftabel = 3,84
Variabel pembentuk fungsi diskriminan :
Gula darah 2 jam past prandial
Usia
Tekanan darah diastolic
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Pembentukan Model Diskriminan
Grup Centroid Kelompok 1 = -1,100
) (
042 ,
0 )
( 031 ,
0 )
2 (
013 ,
0 912
,
2 gd jpp diastolic usia
Z
Grup Centroid Kelompok 2 = 1,560
Critical Cutting Score = 0,23
Histogram Z
score38
Domain antara -3,125 hingga 1,25 Domain antara -0,625 hingga 6,125
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Membentuk klasifikasi
Prediksi
Total Kelompok 1 Kelompok 2
Aktual
Kelompok 1 13 2 15
Kelompok 2 2 9 11
Ketepatan klasifikasi = 0,846 84,6% 9
2 3
12
9
13
Inisialisasi Kromosom
40
2.5876 0.2888 0.0310 -1.2583
2.2628 0.2888 0.0310 -1.2583 2.6658 0.7728 0.0310 -1.2583
1.6770 -0.0001 -0.4974 -1.6428 2.1292 0.6543 -0.0389 -0.8600 2.9085 0.3652 0.0310 -1.2583 3.7282 -0.1814 0.0310 -1.2583
2.3456 1.0421 0.0310 -1.2583 1.8639 -0.1228 0.3764 -0.8600 1
2
3 4
50
51 52
53 54
100
-2,192 0,013 0,031 -0,042
0.0769 0.5385
0. 154 0.4231
0.0769
0.4231 0.1923
0.1538 0.5769
0.0769
KROMOSOM FITNESS KROMOSOM
2.5876 0.2888 0.0310 -1.2583
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Roulette Wheel
Populasi
ke- Fitness Fitness Relatif (rk)
Fitness Komulatif
(kk) Bilangan Random
1 0,0769 0,002731464 0,002731464 0,499084
2 0,4231 0,01502838 0,017759844 0,009868
100 0,5769 0,020491308 1 0,051255
Populasi ke-dua terpilih sebagai induk untuk proses crossover
Crossover
42
Kedua kromosom telah berpindahsilang
2.5876 0.2888 0.0310 -1.2583 -1.9739 0.4648 -0.3903 -1.2483
INDUK ANAK
2.5876 0.2888 0.0310 -1.2583 -1.9739 0.4648 -0.3903 -1.2483
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Elitisme
2.5876 0.2888 0.0310 -1.2583 2.6658 0.7728 0.0310 -1.2583
1.6770 -0.0001 -0.4974 -1.6428 2.1292 0.6543 -0.0389 -0.8600 2.9085 0.3652 0.0310 -1.2583 3.7282 -0.1814 0.0310 -1.2583
2.3456 1.0421 0.0310 -1.2583 1.8639 -0.1228 0.3764 -0.8600 1
2
3 4
50
51 52
53 54
100
0.0769 0.5385
0.5769 0.4231
0.0769
0.4231 0.1923
0.1538 0.5769
2.2628 0.2888 0.0310 -1.2583 0.0769
KROMOSOM FITNESS KROMOSOM
2.5876 0.2888 0.0310 -1.2583
Generasi PertamaGenerasi Kedua
2
3 4
50
51
52 53 54
Hasil Algoritma Genetika
44
) (
033 ,
1 )
( 016 ,
0 )
2 (
273 ,
0 639
,
2 gd jpp diastolic usia
Z
Ketepatan Klasifikasi = 92,31%
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Perbandingan
Hybrid analisis diskriminan-algoritma genetika memberikan akurasi yang lebih tinggi
Metode Parameter Ketepatan Klasifikasi
Analisis diskriminan
a = -2,912 w1 = 0,013 w3 = 0,031 w5 = -0,042
84,6%
Hybrid analisis diskriminan dan algoritma genetika
a = -2,6393 w1 = 0,2739 w3 = -0,0169 w5 = -1,0334
92,31%
Kesimpulan
46
1
• Akurasi dengan analisis diskriminan sebesar 84,6% dengan
parameter fungsi diskriminan antara lain a=-2,912; w1 = 0,013; w3 = 0,031; dan w5 = -0,042.
2
• Akurasi dengan hybrid analisis diskriminan dan algoritma genetika sebesar 92,31%. Parameter fungsi diskriminan yang diperoleh
antara lain a = -2,6393; w1 = 0,2739; w3 = -0,0169; dan w5 = -1,0334.
3
• Hybrid diskriminan-algoritma genetika menghasilkan ketepatan klasifikasi yang lebih tinggi dibandingkan analisis diskriminan.
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014
Saran
1
• Menambah jumlah variabel penelitian yang berhubungan dengan kondisi gula darah pada pasien diabetes melitus tipe dua
2
• Mengambil sampel dengan jumlah yang lebih banyak karena pada analisis diskriminan,
semakin banyak sampel yang diambil semakin baik analisis yang akan dihasilkan.
Daftar Pustaka
Darmanto, E. 2010. Implementasi Algoritma Genetika Pada Pelatihan Jaringan Syaraf Tiruan Untuk Klasifikasi Skala Sentra Industri: Studi Kasus Skala Industri Di Kabupaten Kudus. Yogyakarta: UGM.
Engelbrecht, A.P. 2002. Computaional Intelligence. South Africa: John Wiley & Sons. Inc.
Fernanda, J. W. 2012. Boosting Neural Network dan Boosting Cart Pada Klasifkasi Diabetes Militus Tipe II. Surabaya: ITS.
Ghozali, Imam. 2006. Aplikasi Analisis Multivariate dengan Program SPSS. Semarang : Badan Penerbit Universitas Diponegoro
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. 2010. Multivariate Data Analysis (7th Edition ed.). New Jersey: Pearson Prentice Hall.
Johnson, N. & Wichern, D. 2002. Applied Multivariate Statistical Analysis, 6th Edition. New Jersey: Prentice Hall, Englewood Cliffs.
Kumar, R. & Verma, R. 2012. Classification Rule Discovery for Diabetes Patients by Using Genetic Programming. India : International Journal of Soft Computing and Engineering (IJSCE).
Seminar Hasil Tugas Akhir|Selasa, 23 Juni 2014 48
MathWorks. 2013. Diakses 23 Oktober 2013, dari How The Genetic Algorithm Works:
http://www.mathworks.com/help/gads/how-the-genetic-algorithm-works.html
Nurkhozin, A. 2011. Komparasi Hasil Klasifikasi Penyakit Diabetes Mellitus Menggunakan Jaringan Syaraf Tiruan Backpropa-gation Dan Learning Vector Quantization. Surabaya: ITS.
Suyanto. 2005. Algoritma Genetika dalam Matlab. Yogyakarta : Andi Offset.
Tjokronegoro,A & Utama, H. 1996. Ilmu Penyakit Dalam. Jakarta: Gaya Baru.
Widodo, T.S. 2012. Komputasi Evolusioner. Yogyakarta: Graha Ilmu.
Wikipedia, 2013. Diakses 23 Oktober 2013, dari Diabetes Melitus:
http://id.wikipedia.org/wiki/Diabetes_melitus
Zamani. 2013. Implementasi Algoritma Genetika Pada Struktur Backpropagation Neural Network Untuk Klasifikasi Kanker Payudara. Surabaya: ITS.
Daftar Pustaka
Selasa, 24 Juni 2014|Ruang Sidang Lantai 4 Ramadhana Dio Gradianta | 1310 100 076
Proposal Tugas Akhir
Klasifikasi Pasien Penderita Diabetes Melitus Menggunakan Metode Hybrid Analisis Diskriminan dan Algoritma Genetika
Dosen pembimbing : Dr. Irhamah, S.Si.,M.Si.