DENGAN ALGORITMA QUEST Nur Azni Tahir
Mahasiswa Prodi Matematika, FST- UINAM
Wahidah Alwi
Prodi Matematika, FST- UINAM
Info:
Jurnal MSA Vol. 3 No. 2 Edisi: Januari – Juni 2014 Artikel No.: 3
Halaman: 14 - 24 ISSN: 2355-083X
Prodi Matematika UINAM
ABSTRAK
Pada artikel ini dijelaskan bagaimana menentukan factor-faktor yang mempengaruhi seseorang menderita penyakit kencing manis dengan menggunakan Algoritma QUEST. Data yang disajikan diambil dari Rumah Sakit Plamonia Makassar yang terdiri dari 250 sampel atau jumlah pengamatan dengan 12 variabel bebas dimana 5 variabel bebas kategorik dan 7 variabel bebas numerik. Berdasarkan hasil penelitian faktor yang mempengaruhi penderita penyakit kencing manis seseorang yaitu kadar gula darah, hipertensi, dan umur.
Kata Kunci: Algoritma Quest, Kencing Manis
1. PENDAHULUAN LatarBelakang
Kencing Manis adalah suatu keadaan dimana terjadi peningkatan kadar gula darah (glukosa) dalam darah yang berlebihan dan terjadi secara menahun. Hal ini terjadi karena tidak bisa memproduksi insulin dalam jumlah yang cukup atau tubuh tidak mampu menggunakan insulin secara efektif. Disebut penyakit Kencing Manis, karena dalam urin penderita penyakit tersebut dapat ditemukan zat gula yang mana seharusnya tidak ditemukan.
Dalam Al-Qur’an Surah Al-Anbiya ayat 83 telah dijelaskan bahwa
Terjemahnya: “Dan (ingatlah kisah) Ayyub, ketika ia menyeru Tuhannya: “(Ya Tuhanku), Sesungguhnya aku telah ditimpa penyakit dan Engkauadalah Tuhan yang Maha Penyayang diantara semua Penyayang”.
Maksud dari ayat al-qur’an tersebut adalah, Allah swtmengingatkan Rasul-Nya dan umat Muslimin kepada kisah Nabi Ayub a.s. yang ditimpa suatu penyakit yang berat sehingga berdoa memohon pertolongan Tuhannya untuk melenyapkan penyakitnya itu, karena ia yakin bahwa Allah SWT. adalah yang amat penyayang. Walaupun berbeda-beda riwayat yang diperoleh tentang Nabi Ayub, baik mengenai pribadinya, masa
hidupnya dan macam penyakit yang dideritanya, namun ada hal-hal yang dapat dipastikan tentang dirinya, yaitu bahwa dialah seorang hamba Allah yang saleh, telah mendapat cobaan dari Allah, baik mengenai harta benda, keluarga, dan anak-anaknya, maupun cobaan yang menimpa dirinya sendiri. Dan penyakit yang dideritanya adalah berat. Meskipun demikian semua cobaan itu dihadapinya dengan sabar dan tawakal serta memohon pertolongan dari Allah SWT. dan sedikitpun tidak mengurangi keimanan dan ibadahnya kepada Allah SWT.
Allah memberikan penyakit kepada setiap umatnya dan tentu Allah juga memberikan obat bagi segala penyakit yg telah ditimpakannya kepada umatnya, sesuai dengan hadits berikut:
َذِإَف ،ٌءاَوَد ٍءاَد ِّلُكِل
َأَرَب ِءاَّدلا ُءاَوَد َبْيِصُأ ا
َّلَجَو َّزَع ِالله ِنْذِإِب
Terjemahnya: “Setiap penyakit ada obatnya. Maka bila obat itu mengenai penyakit akan sembuh dengan izin Allah Azza wa Jalla.” (HR. Muslim no. 5705)Salah satu penyakit yang akan dibahas pada penelitian kali ini adalah Kencing Manis (Diabetes Mellitus) dengan menggunakan metode Klasifikasi berstruktur pohon yang diaplikasikan dalam algoritma quest.
Masalah klasifikasi (pengelompokan) sering dijumpai pada kehidupan sehari-hari, baik dibidang pendidikan, sosial, industri, kesehatan maupun perbankan. Contoh masalah klasifikasi dalam bidang pendidikan adalah klasifikasi sekolah berdasarkan akreditasi sekolah. Dalam bidang kesehatan dilakukan pengklasifikasian penyakit berdasarkan tingkat keseriusan dan bahaya yang ditimbulkan.
Dalam statistika, dikenal berbagai metode untuk mengklasifikasikan objek. Klasifikasi dapat dilakukan dengan menggunakan pendekatan parametric maupun pendekatan nonparametrik. Pendekatan parametric biasanya sangat tergantung dari asumsi-asumsi mengenai sebaran data sehingga bila asumsi tersebut tidak terpenuhi, maka hasil yang diperoleh menjadi tidak valid. Pendekatan nonparametric digunakan untuk mengatasi keterbatasan dari pendekatan parametrik. Pendekatan ini tidak bergantung pada asumsi tertentu sehingga memberikan kemudahan dalam menganalisa data tetapi tetap mempunyai tingkat akurasi yang tinggi. Untuk mendapatkan klasifikasi yang tepat, perlu diperhatikan metode klasifikasi yang tepat.
Metode klasifikasi berstruktur pohon adalah salah satu metode klasifikasi nonparametrik yang sering digunakan. Metode ini pertama kali diperkenalkan oleh Breiman,et. al pada tahun 1984. Klasifikasi pada metode ini dilakukan dengan membangun sebuah pohon klasifikasi yang diperoleh melalui penyekatan berulang terhadap sebuah himpunan data (dalam hal ini diistilahkan sebagai simpul) menjadi dua atau lebih simpul baru.
Metode klasifikasi berstruktur pohon dapat dibagi menjadi dua kelompok. Kelompok pertama menghasilkan pohon biner, yaitu sebuah pohon yang setiap simpul disekat menjadi dua simpul yang saling terpisah. CART (Classification and Regression Trees) merupakan algoritma yang diperkenalkan oleh Breiman, et.al (1984), sedangkan QUEST (Quick, Unbiased, Efficient Statistical Trees) merupakan algoritma yang diperkenalkan oleh Loh dan Shih (1997). CART dan QUEST merupakan contoh metode yang menghasilkan pohon seperti ini. Kelompok kedua adalah
kelompok yang menghasilkan pohon non-biner, yaitu sebuah pohon yang setiap simpul disekat menjadi dua atau lebih simpul yang terpisah. CHAID (Chi-squared Automatic Interaction Detector) merupakansalahsatualgoritma yang diperkenalkanolehKass (1980), sedangkan CRUISE (Classification Rule with Unbiased Interaction Selection and Estimation) merupakanalgoritma yang diperkenalkanoleh Kim danLoh (2001). CHAID dan CRUISE merupakancontohmetodeklasifikasi yang menghasilkanpohon non- biner.
Pada penelitian ini, akan dibahas metode klasifikasi berstruktur pohon menngunakan algoritma QUEST yang masih relatif baru untuk diketahui bagaimana menerapkannya pada data pasien penderita penyakit kencing manis.
Berdasarkan hal tersebut maka akan dikaji metode klasifikasi berstruktur pohon dan menuangkan dalam karya ilmiah dengan judul:“Metode Klasifikasi Berstruktur Pohon Dengan Algoritma Quest (Studi Kasus: Faktor-Faktor Yang Mempengauhi Penderita Penyakit Kencing Manis)”
RumusanMasalah
Rumusan Masalah adalah faktor-faktor apa yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon ?
TujuanPenelitian
Tujuan penelitian ini adalah untuk mengetahui faktor-faktor yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon
2. TINJAUAN PUSTAKA Uji Levene
Uji Levene digunakan untuk menguji kesamaan ragam peubah dari dua kelompok atau lebih. Untuk mendapatkan statistik uji ini, data ditransformasikan dulu menjadi simpangan mutlaknya terhadap nilai tengah data, yaitu 𝑦𝑘𝑖 =
|𝑥𝑘𝑖− 𝑥̅𝑘|,
i = 1, 2, ..., 𝑛𝑘 k = 1, 2, ..., K
𝑥̅𝑘: nilai tengah contoh kelompok ke-k
𝑦𝑘𝑖: hasil transformasi data pengamatan ke-i
dari kelompok ke-k
𝑥𝑘𝑖: pengamatan ke-i dari kelompok ke-k
Lakukan statistik uji ANOVA pada data yang telah ditransformasi untuk mendapatkan nilai statistik uji Levene .
Dalam pengambilan keputusan, 𝐻0 ditolak pada
taraf nyata 𝛼 jika nilai statistik uji Lavene hasil perhitungan lebih besar daripada nilai 𝐹𝛼,𝐾−1,𝑁−𝐾.
Analisis Diskriminan Kuadratik
Analisis diskriminan bertujuan untuk membentuk fungsi diskriminan yang mampu membedakan kelompok. Analisis ini dilakukan berdasarkan suatu perhitungan statistik terhadap objek-objek yang telah diketahui dengan jelas dan mantap pengelompokannya.
Fungsi diskriminan dapat disebut dengan fungsi pembeda. Fungsi diskriminan yang dibangun dengan asumsi bahwa kelompok-kelompok memiliki matriks ragam peragam yang sama dinamakan fungsi diskriminan linier, sedangkan fungsi yang dibangun tanpa asumsi tersebut dinamakan fungsi diskriminan kuadratik.
Metode Klasifikasi Berstruktur Pohon
Dalam statistika, terdapat berbagai metode yang dapat digunakan dalam menarik kesimpulan mengenai hubungan antara suatu peubah respon dengan beberapa peubah bebas. Jika peubah respon berupa data kuantitatif maka analisa mengenai hubungan peubah bebas dan respon biasanya dilakukan melalui analisis regresi biasa. Namun, bila peubah respon merupakan data kualitatif maka analisa mengenai hubungan peubah bebas dan respon salah satunya dapat dilakukan melalui teknik klasifikasi.
Metode klasifikasi berstruktur pohon merupakan metode statistika yang digunakan untuk memperkirakan keanggotaan amatan atau objek dalam kelas- kelas peubah respon kategorik, yang keanggotaannya diduga berdasarkan
pengukuran terhadap satu peubah bebas atau lebih. Metode ini menghasilkan sebuah pohon klasifikasi (classification tree) yang dibentuk melalui penyekatan data secara berulang (rekursif) terhadap suatu himpunana data, di mana pengelompokan dan nilai-nilai peubah bebas setiap amatan padadata contoh sudah diketahui. Setiap himpunan data dinyatakan sebagai simpul dalam pohon yang terbentuk Pohon klasifikasi disajikan dalam gambar berikut:
Gambar 2.1. Pohon Klasifikasi
Dalam pohon klasifikasi sepeti pada gambar 1, himpunan data awal disebut simpul induk, dinotasikan sebagai 𝑡0. Pada simpul 𝑡0, dilakukan penyekatan sehingga terbentuk simpul 𝑡1 dan 𝑡2. Penyekatan dilakukan secara berulang sampai diperoleh sebuah simpul yang tidak dapat disekat lagi, yang disebut simpul akhir. Simpul yang tidak termasuk pada simpul induk dan simpul akhir disebut simpul dalam. Dapat dilihat bahwa 𝑡1 dan 𝑡4 adalah simpul dalam sedangkan 𝑡2, 𝑡3, 𝑡5 𝑑𝑎𝑛 𝑡6 adalah simpul akhir. Pada simpul-simpul akhir ini dilakukan pendugaan respon.
Penyekatan terhadap sebuah simpul dilakukan berdasarkan nilai suatu peubah bebas (titik penyekat). Peubah bebas yang digunakan untuk menyekat sebuah simpul dinamakan sebagai peubah penyekat. Peubah penyekat dapat berupa peubah kategorik maupun peubah kontinu. Pada gambar 1 terlihat bahwa simpul 𝑡0 disekat berdasarkan peubah 𝑥1 menjadi simpul 𝑡1 bila 𝑥1 ≤ 0,05 dan simpul 𝑡2 bila 𝑥1 > 0,05. Simpul dalam 𝑡1 disekat lagi berdasarkan peubah 𝑥2 menjadi simpul 𝑡3 bila 𝑥2 ∈ {1}dan 𝑡4 bila
𝑥2 ∈ {2,3}. Simpul dalam 𝑡4 disekat lagi berdasarkan peubah 𝑥3 menjadi simpul 𝑡5 bila 𝑥3 ≤ 6 dan 𝑡6 bila 𝑥3 > 6. Dalam menyekat suatu simpul, setiap peubah bebas memiliki kesempatan untuk terpilih sebagai peubah penyekat, meskipun peubah tersebut telah terpilih sebelumnya sebagai peubah penyekat simpul lain.
Proses penyekatan terhadap simpul dilakukan secara berulang sampai ditemukan salah satu dari tiga hal berikut:
1. respon di semua simpul sudah homogen nilainya
2. tidak ada lagi peubah bebas yang bisa digunakan
3. jumlah objek di dalam simpul sudah terlalu sedikit untuk menghasilkan pemisahan yang memuaskan.
Dalam pembentukan pohon klasifikasi, proses penyekatan terhadap suatu simpul dapat bersifat biner atau non biner. Pada penyekatan biner, setiap simpul hanya boleh disekat menjadi dua simpul baru, sedangkan pada penyekatan non biner setiap simpul dapat menghasilkan lebih dari dua simpul baru. Gambar 1 merupakan pohon klasifikasi dengan penyekatan biner. Pohon yang dibentuk dari proses penyekatan tersebut dapat berukuran sangat besar. Bila pohon berukuran besar, biasanya penduga respon cenderung lebih tepat, tapi sulit diinterpretasi. Bila pohon kecil, pohon mudah diinterpretasi namun penduga respon cenderung tidak tepat. Pohon terbaik yaitu pohon yang memiliki keseimbangan antara ukuran pohon dan ketepatan penduga respon. Untuk menghasilkan pohon terbaik dilakukan pemangkasan pohon yang sudah terbentuk.
3. PEMBAHASAN
Penerapan metode quest ini akan diperlihatkan melalui kasus pengkajian faktor-faktor apa saja yag mempengaruhi seseorang menderita penyakit Kencing Manis.Penyakit kencing manis (Diabetes Mellitus) adalah salah satu keadaan dimana terdapat kadar gula darah yang berlebihan dalam peredaran darah. Ini terjadi karena badan kekurangan hormon yang disebut
insulin yang diperlukan untuk membakar gula menjadi tenaga dalam tubuh.
Berikut ini disajikan data yang diperoleh untuk mengkaji faktor-faktor yang mempengaruhi seseorang penderita Kencing Manis.variabel terikat Y merupakan peubah kategorik dengan dua kategori yaitu penderita Kencing Manis dan 0 bila tidak menderita penyakit Kencing Manis. Data ini diperoleh dari Rumah Sakit Pelamonia Makassar yang terdiri dari 12 variabel bebas dengan 5 variabel bebas kategorik dan 7 variabel bebas numerikdan jumlah pengamatan sebanyak 250 sampel .
Sebelum itu perlu disusun beberapa hipotesis dalam pemilihan variabel penyekat yakni seagai berikut:
0
H variabel tidak dapat dipilih sebagai variabel penyekat dan
1
H variabel dapat dipilih sebagai variabel penyekat
Selanjutnya akan diilustrasikan pembentukan pohon dengan menggunakan metode QUEST untuk data penyakit Kencing Manis. Simpul awal
0
t atau variabel terikat Y terdiri dari 250 pengamatan dari dua kategori pengamatan yaitu pasien yang berpenyakit kencing manis(81 pengamatan) dan pasien yang tidak berpenyakit Kencing Manis (169 pengamatan).Untuk pemilihan variabel penyekat dipilih dengan menggunakan uji ANOVA satu faktor untuk variabel bebas numerik dan uji 2
untuk variabel bebas kategorik.
Berikut ini adalah tabel hasil uji statistik pemilihan variabel penyekat simpul t0:
Tabel 4.1. Hasil uji statistik pemilihan variabel penyekat simpul t0 Variabel bebas Nilai statistik uji Nilai p 1 X 2 0,11 p0,739 2 X F 6,924 p0,009
Variabel bebas Nilai statistik uji Nilai p 3 X F 10,997 p0,001 4 X F 1,451 p0,230 5 X 2 0,158 p0,691 6 X 2 11,663 p0,001 7 X F 14,968 p0,000 8 X F 2,380 p0,124 9 X F 6,417 p0,012 10 X F 5,307 p0,022 11 X 2 74,936 p0,000 12 X 2 25,701 p0,000
Selanjutnya untuk daerah kritis yang digunakan adalah menerima H0ketika p/jumlah variabel dan menolak H0ketika p/jumlah variabel. Bila digunakan a0,05 akan didapatkan a/M10,05/12 0,0042 .
Berdasarkan tabel 4.1 terihat bahwa yang memiliki nilai p terkecil adalah variabel X7,
11
X ,X dengan nilai 12 p0.000. Nilai p terkecil dapat diperoleh pada variabel dengan nilai statistik uji ANOVA dengan F terbesar atau uji chi square dengan 2terbesar. Karena variabel X memiliki 11 2
terbesar maka dianggap 11
X memiliki nilai pyang terkecil . Selanjutnya terlihat bahwa X memilik 11 nilai
0042 . 0 000 . 0
p sehingga dalam hal ini H0
ditolak atau X dapat digunakan sebagai 11 variabel penyekat.
Berikut ini adalah hasil uji statistik pemilihan variabel penyekat simpul t : 1
Tabel 4.2. Hasil uji statistik pemilihan variabel penyekat simpul t 1 Variabel bebas Nilai statistik uji Nilai p 1 X 2 3,518 p0,061 2 X F 1,037 p0,310 3 X F2,267 p0,134 4 X F 0,619 p0,433 5 X 2 0,025 p0,874 6 X 2 5,815 p0,016 7 X F 0,238 p0,626 8 X F 0,380 p0,539 9 X F 7,148 p0,008 10 X F 13,560 p0,000 12 X 2 4,052 p0,044
Selanjutnya untuk daerah kritis yang digunakan adalah menerima H0ketika p/jumlah variabel dan menolak H0ketika p/jumlah variabel. Bila digunakan a0,05didapat
0,0042 0,05/12
/M1
a .
Berdasarkan Tabel 4.2 terlihat bahwa X10
memilik nilai p0.0000.0042sehingga dalam hal ini H0ditolak atau X10dapat
digunakan sebagai variabel penyekat. Variabel
10
X adalah variabel numerik sehingga diperlukan analisis diskriminan kuadratik untuk memperoleh titik penyekat, dari data diperoleh:
979 , 43 0 x x133,733 290 , 110 2 0 s s12 46,924 502 , 10 0 s s1 6,850 896 , 0 ) | 0 ( t P P(1|t)0,104
Titik penyekat adalah akar dari persamaan
0 2 c bx ax Dimana 366 , 63 924 , 46 290 , 110 2 1 2 0 s s a ) ( 2 x0s12 x1s02 b )) 290 , 110 733 , 33 ( ) 924 , 46 979 , 43 (( 2 ) 3720.41257 -6 2063,67059 ( 2 -3313.484 2 0 2 1 2 1 2 0 2 1 0 2 0 1 ) | 1 ( ) | 0 ( ln 2 ) ( ) ( s t P s t P s s s x s x c
290 , 110 104 , 0 924 , 46 896 , 0 ln 924 , 46 290 , 110 2 850 , 6 979 , 43 502 , 10 733 , 33 2 2 1.299) ( 10350.496 90755.268 -125502.958 48192.632 Dengan demikian diperoleh persamaan
0 632 , 48192 484 , 3313 366 , 63 x2 x
Akar dari persamaan diatas adalah:
a ac b b d 2 4 2 ) 366 , 63 ( 2 ) 632 , 48192 )( 366 , 63 ( 4 ) 484 , 3313 ( 484 , 3313 2 732 , 126 1235920 -484 , 3313
Karena akarnya imajiner sehingga tidak dapat dilanjutkan untuk membuat titik penyekat.Oleh karena itu simpul t tidak dapat disekat lagi 1 sehingga pada simpul t penyekatan dihentikan. 1 Selanjutnya dilakukan langkah yang sama untuk memilih variabel penyekat pada simpul t2
dimulai dari variabel bebas X yang merupakan 1 variabel kategorik sehingga dalam hal ini dlakukan uji 2terhadap Y. Untuk memudahkan, dilakukan perhitungan dengan menggunakan SPSS. Berdasarkan Tabel 34(lihat lampiran halaman 91), diperoleh nilai statistik uji sebesar 2 0,915 dan p0,339.
Berikut ini hasil uji statistik pemilihan variabel penyekat simpul t2:
Tabel 4.3. Hasil uji statistik pemilihan variabel penyekat simpul t 2
Variabel bebas
Nilai statistik uji Nilai p
1 X 2 0,915 p0,339 2 X F 6,142 p0,015 3 X F 0,070 p0,792 4 X F1,742 p0,190 5 X 2 1,571 p0,210 6 X 2 3,805 p0,001 7 X F 13,237 p0,000 8 X F 0,002 p0,962 9 X F 0,533 p0,467 10 X F1,429 p0,235 12 X 2 16,571 p0,051
Selanjutnya untuk daerah kritis yang digunakan adalah menerima H0ketikap/
jumlah variabel dan menolak H0ketikap/
jumlah variabel. Bila digunakan a0,05
Berdasarkan Tabel 4.3 terihat bahwa yang memiliki nilai pterkecil adalah variabel X7 ,
12
X dengan nilai p0.000. Nilai p terkecil dapat diperoleh pada variabel dengan nilai statistik uji ANOVA dengan F terbesar atau uji chi square dengan 2terbesar . Karena variabel
11
X memiliki 2
terbesar maka dianggap X 12 memiliki nilai pyang terkecil . Selanjutnya terlihat bahwa X memilik 12 nilai
0042 . 0 000 . 0
p sehingga dalam hal ini H0 ditolak atau X dapat digunakan sebagai 12 variabel penyekat.
Variabel X adalah variabel kategorik dengan 12 banyak kategori sama dengan dua sehinggga titik penyekat dapat diperoleh langsung. Dengan demikian simpul t dibagi menjadi dua simpul 2 yaitu simpul t3dan t . Dimana simpul 4 t3dengan
0 12
X dan simpul t dengan 4 X121. Simpul t3
terdiri dari 29 pengamatan dari dua kategori yaitu 20 orang yang tidak menderita Kencing Manis dan 9 orang yang menderita Kencing Manis. Simpul t terdiri dari 77 pengamatan dari dua 4 kategori yaitu 20 orang yang tidak menderita Kencing Manis dan 57 orang yang menderita Kencing Manis.
Karena simpul t3tidak memungkinkan lagi untuk
melakukan penyekatan karena banyaknya pengamatan pada simpul dalam paling sedikit 50 dan simpul akhir paling sedikit 20 sehingga simpul t3menjadi simpul akhir.
Selanjutnya dilakukan langkah yang sama untuk memilih variabel penyekat pada simpul t4 dimulai dari variabel bebas X yang merupakan 1 variabel kategorik sehingga dalamhal ini dlakukan uji 2terhadap Y. Untuk memudahkan, dilakukan perhitungan dengan menggunakan SPSS.Berdasarkan Tabel 49(lihat lampiran halaman 97),diperoleh nilai statistik uji sebesar 2 0,068
dan p0,795.
Berikut ini adalah Hasil uji statistik pemilihan variabel penyekat simpul t3
Tabel 4.62. Hasil uji statistik pemilihan variabel penyekat simpul t3
Variabel bebas
Nilai statistik uji Nilai p
1 X 2 0,068 p0,795 2 X F 4,166 p0,045 3 X F0,006 p0,939 4 X F 0,213 p0,646 5 X 2 0,495 p0,482 6 X 2 2,357 p0,111 7 X F 3,014 p0,087 8 X F 0,144 p0,706 9 X F 0,026 p0,871 10 X F 7,038 p0,010
Selanjutnya untuk daerah kritis yang digunakan adalah menerima H0ketika p/jumlah variabel dan menolak H0ketika p/jumlah variabel. Bila digunakan a0,05didapat
0,0042 0,05/12
/M1
a .
Berdasarkan Tabel 4.61 dapat terlihat bahwa variabel bebas X10memiliki nilai pterkecil,
yang Selanjutnya terlihat bahwa X10memilik
nilai p0.0100.0042 sehingga dalam hal ini
0
H diterima atau X10 tidak dapat digunakan sebagai variabel penyekat.
Dari hasil tabulasi diatas, Karena H0diterima
oleh karena itu perlu dilakukan uji Levene atau uji homogenitas pada setiap variabel numerik m untuk menguji bahwa data sudah homogen atau belum. Dengan menggunakan cara SPSS didapatkan nilai levene sebagai berikut:
Berdasarkan Tabel 61(lihat lampiran halaman 102),Untuk variabel X diperoleh nilai levene 2
182 ,
8 dengan nilai p0,005. Selanjutnya berdasarkan tabel 62(lihat lampiran halaman 102),Untuk variabel X3diperoleh nilai levene
594 ,
5 dengan nilai p0,021.Selanjutnya berdasarkan tabel 63(lihat lampiran halaman 103),Untuk variabel X diperoleh nilai levene 4
518 ,
1 dengan nilai p0,222.
Berdasarkan Tabel 64(lihat lampiran halaman 103),Untuk variabel X7diperoleh nilai levene
398 ,
1 dengan nilai p0,241. Selanjutnya Berdasarkan Tabel 65(lihat lampiran halaman 103),Untuk variabel X8diperoleh nilai levene
803 ,
1 dengan nilai p0,183. Selanjutnya berdasarkan tabel 66(lihat lampiran halaman 104),Untuk variabel X9diperoleh nilai levene
105 ,
4 dengan nilai p0,046. Selanjutnya Untuk tabel 67 (lihat lampiran halaman 104), untuk variabel X10diperoleh nilai levene 0,075
dengan nilai p0,785
Dari berbagai uji beberapa variabel diatas diperoleh tabel sebagai berikut:
Tabel 4.4. Hasil uji statistik Levene variabel numerik simpul t 4
Variabel bebas Uji Levene Nilai p
2 X 8,182 p0,005 3 X 5,594 p0,021 4 X 1,518 p0,222 7 X 1,398 p0,241 8 X 1,803 p0,183 9 X 4,105 p0,046 10 X 0,075 p0,785
Berdasarkan Tabel 4.4 diperoleh variabel 2
X memiliki uji levene terkecil yaitu 8,182
dengan nilai p0,005kemudian dibandingkan dengan /70,0071 . Berdasarkan uji levene yang digunakan diperlihatkan nilai
0071 . 0 005 , 0
p . Sehingga dalam hal ini H0
ditolak atau X2 dapat digunakan sebagai variabel
penyekat. Variabel X adalah variabel numerik 2 sehingga diperlukan analisis diskriminan kuadratik untuk memperoleh titik penyekat, dari data diperoleh: 900 , 52 0 x x1 57,825 411 , 18 2 0 s s12 109,183 291 , 4 0 s s1 10,449 260 , 0 ) | 0 ( t P P(1|t)0,740
Titik penyekat adalah akar dari persamaan
0 2 c bx ax Dimana -90.772 183 , 109 411 , 18 2 1 2 0 s s a ) ( 2 x0s12 x1s02 b )) 411 , 18 825 , 57 ( ) 183 , 109 9 , 52 (( 2 5) 1064.61607 -5775.7807 ( 2 9422.330 2 0 2 1 2 1 2 0 2 1 0 2 0 1 ) | 1 ( ) | 0 ( ln 2 ) ( ) ( s t P s t P s s s x s x c
2 257,825 4, 291
52,900 10, 449
0, 260 109,183
2 18, 411 109,183 ln
0, 740 18, 411
2951.363 1 305534.884 -61567.045 6 -241016.47 Dengan demikian diperoleh persamaan
0 241016.476 9422.330
90.772
- x2 x
a ac b b d 2 4 2 ) 772 . 90 ( 2 ) 476 , 241016 )( 772 , 90 ( 4 ) 9422,330 ( 9422,330 - 2 181.444 -10 1.31831 330 , 9422 6 677 , 45 181.444 -10 1.31831 330 , 9422 6 1 d 354 , 58 181.444 -10 1.31831 330 , 9422 6 2 d
Dari dua akar persamaan ini, diambil akar yang paling mendekati x0 52,9sehingga diperoleh
354 , 58 2
d . Dapat disimpulkan bahwa X2 memotong di titik d258,354. dengan demikian simpul t disekat menjadi 2 simpul yaitu simpul 4
5
t dengan d58,354dan simpul t6dengan
354 , 58
d . Simpul t5terdiri dari 54
pengamatan dari dua kategori yaitu bukan penderita kencing manis sebanyak 20 pengamatan dan penderita kencing manis sebanyak 34 pengamatan. Simpul t6terdiri dari
bukan penderita kencing manis sebanyak 0 pengamatan dan penderita kencing manis sebanyak 23 pengamatan.Selanjutnya tidak dilakukan penyekatan lagi pada simpul t5dan t6 karena pengamatan sudah terlalu kecil untuk dilakukan penyekatan.
Selanjutnya untuk menduga variabel terikat Y yakni dengan mengelompokkan berdasarkan banyaknya simpul akhir. Dalam hal ini terdapat 4 kelompok yaitu:
1. Kelompok pertama
Kelompok pertama menyatakan bahwa seseorang yang memiliki kadar gula darah <120 mg .seseorang yang termasuk pada kelompok ini seseorang rata-rata tidak menderita penyakit Kencing Manis.
2. Kelompok kedua
Kelompok kedua merupakan seseorang yang memiliki kadar gula > 120 mg dan tidak terserang penyakit diabetes. Pada kelompok ini juga cenderung tidak menderita penyakit Kencing Manis.
3. Kelompok ketiga
Kelompok ketiga merupakan seseorang yang memiliki kadar gula >120 dan terserang penyakit hipertensikemudian memiliki umur dibawah 58,35 tahun cenderung menderita penyakit Kencing Manis.
4. Kelompok keempat
Kelompok keempat merupakan seseorang yang memiliki kadar gula >120 dan terserang penyakit hipertensi kemudian memiliki umur diatas 58,35 tahun semuanya menderita penyakit Kencing Manis
Berdasarkan kelompok diatas dapat digunakan untuk mengambil kesimpulan untuk menduga nilai dari variabel terikat Y atau penyakit Kencing Manis yaitu dimana faktor yang mempengaruhi seseorang menderita penyakit Kencing Manis yaitu faktor kadar gula, keadaan hipertensi, dan umur .
Sehingga variabel-variabel seperti jenis kelamin, umur, tinggi badan, berat badan, kolestrol, HDL, LDL, tekanan darah dan rokok bisa dikatakan memiliki pengaruh terhadap penyakit kencing manis walaupun pengaruhnya tidak terlalu signifikan. Selanjutnya berdasarkan langkah-langkah sebelumnya diperoleh pohon klasifikasi sebagai berikut:
Gambar 4.1. Pohon klasifikasi data penyakit Kencing Manis
Keterangan:
Y Keadaan diabetes seseorang yang diamati
0 Tidak terserang penyakit Kencing Manis
1 terserang penyakit diabetes
11
X kadar gula darah pasien
0 untuk gula darah < 120 mg dan
1 untuk gula darah > 120 mg.
12
X merupakan keadaan hipertensi seseorang
0 tidak terserang penyakit hipertensi
1 terserang penyakit hipertensi.
2
X merupakan umur pasien
4. KESIMPULAN
Dari hasil penelitian ini dapat disimpulkan bahwa faktor-faktor yang paling berpengaruh terhadap pasien penderita penyakit kencing manis melalui penerapan algoritma quest dengan metode klasifikasi berstruktur pohon adalah factor kadar gula darah, keadaan hipertensi, dan umur. Faktor kadar gula merupakan faktor yang memberikan pengaruh yang besar disbanding faktor yang lainnya.
5. DAFTAR PUSTAKA
Analisis regresi. http://id.m.wikipedia. org/wiki/Analisis_regresi, diakses (29 Mei 2014).
Breiman L, Friedman, JH, Olshen, dll. (1984). Classification and regression trees. Newyork.
Cox, David. (1984). Analysis of survival Data. Newyork: Chapman and hall.
David W, Nathan. (2002). Menaklukkan Diabetes Mellitus. Jakarta: Gramedia.
Endang, Lanywati.(2002). Diabetes Mellitus Penyakit Kencing Manis. Yogyakarta: Kanisius.
Hipertensi pada diabetes~ Klik medicine.htm, diakses tanggal 05 november 2014 http://sunniy.wordpress.com/2013/10/27/setiap- penyakit-ada-obatnya-dan-setiap- masalah-ada-cara-mengatasinya/comment-page-1/ Kadir,Abdul. (2005). Algoritma Pemrograman. Yogyakarta:Penerbit Andi.
Maizurrahm. Penyakit Kencing Manis.
[online]. Tersedia
http://us.geocities.com/maizurrahm. [16 Mei 2014].
Merokok Menyebabkan dan Memperparah Diabetes Melitus ~ ARZHI 94 BLOG KESEHATAN.htm, diakses tanggal 05 november 2014
National Cardiovascular Center Harapan Kita - Kolesterol dan Diabetes (Kencing Manis).htm, diakses tanggal 05 november 2014
Pengertian regresi dan korelasi. widyago.wordpress.com/2011/04/03/pen gertian _regresi_dan_ korelasi/, diakses (29 Mei 2014).
Shihab, Qurays. (2002). Tafsir Al Misbah. Jakarta: Lentera Hati.
Scalable linear regression tree algorithm. (2002). [online]. Tersedia http://www.cs.unc.edu/courses/comp290 -90-f03/secret_pres.pdf. [16 Mei 2014]. Suarga.(2006). Algoritma Pemrograman.
Yogyakarta: Penerbit Andi.
Tiro, M Arif. (2002). Analisis Korelasi Regresi Edisi 2. Makassar: Badan Penerbit Universitas Negeri Makassar.
Tim Redaksi Vitahealth.2004.
Total kesehatan anda. (2010). Diabetes I.
[online]. Tersedia
http://www.totalkesehatananda.com/diab etesI.html. [19 Mei 2014].
Wei Yin Loh. (2002). Guide regression tree (version 4) user manual. [online]. Tersedia
http://www.stat.wisc.edu/~loh/treeprogs/ guide/guideman.pdf. [16 Mei 2014]. Wei Yin Loh. (2002). Regression Trees with
unbiased variable selection and interaction detection. [online]. Tersedia http://www.stat.wisc.edu/~loh/treeprogs/ guide/guide02.pdf. [16 Mei 2014].