Pendekatan CART Untuk Mendapatkan Faktor yang
Mempengaruhi Terjangkitnya Penyakit Demam
p
g
j
g
y
y
Tifoid di Aceh Utara
OLEH
OLEH :
DINA YUANITA 1306 100 O56
DOSEN PEMBIMBING :
M. SYAHID AKBAR, S.Si, M,Si
Demam Tifoid atau Typhoid fever, yang biasa juga disebut typhus atau types oleh orang awam, merupakan penyakit yang disebabkan bakteri Salmonella Enterica, khususnya turunannya yaitu Salmonella Typhi (S. Typhi) yang menyerang bagian saluran pencernaan.
http://mangsholeh.wordpress.com
Data World Health Organization (WHO) tahun 2003 memperkirakan terdapat sekitar 17 juta kasus demam tifoid di seluruh dunia denganp j g kejadian 600.000 kasus kematian tiap tahun.
http://koaskamar13.‐wordpress.com).
Di Indonesia, demam tifoid merupakan masalah kesehatan masyarakat dengan kejadian antara 350 ‐ 810 kasus per 100.000 penduduk setiap tahunnya
Hidayati (2001)
Kepadatan penduduk, prosentase cakupan penduduk pemakai air bersih, prosentase cakupan pembuangan sampah sementara yang memenuhi syarat, prosentase
k t t l h k hi
cakupan tempat pengolahan makanan yang memenuhi syarat, dan prosentase cakupan penduduk pemakai sarana pembuangan air limbah.
Lubis (2007) Higiene perorangan dan kualitas air minum.
Tjipto (2009)
Buang air besar ditempat yang baik (jamban) dan mencuci
tangan dengan benar tangan dengan benar
Permasalahan yang akan diselesaikan dalam penelitian ini adalah sebagai berikut.
1. Bagaimana karakteristik anggota rumah tangga (ART) yang terjangkit 1. Bagaimana karakteristik anggota rumah tangga (ART) yang terjangkit
demam tifoid di Aceh Utara?
2. Mencari faktor yang berpengaruh terhadap terjangkitnya demam tifoid di Aceh Utara?
tifoid di Aceh Utara?
Berdasarkan latar belakang dan permasalahan yang telah dirumuskan di atas, maka tujuan penelitian ini adalah sebagai berikut.
1. Mengetahui karakteristik anggota rumah tangganya (ART) yang terjangkit demam tifoid di Aceh Utara.
2 M d k f k b h h d j ki
2. Mendapatkan faktor yang berpengaruh terhadap terjangkitnya demam tifoid di Aceh Utara.
• Memberikan gambaran mengenai penyakit demam tifoid di Aceh Utara • Didapatkan faktor yang mempengaruhi penyakit demam tifoid di Aceh Utara, sehingga diharapkan adanya peningkatan perilaku hidup sehat yang dapat mengurangi terjadinya penyakit demam tifoid.
l d l h d k d d l h d
Data penelitian adalah data sekunder yang diperoleh dari Riset Kesehatan Dasar (Riskesdas) dan Survei Sosial Ekonomi Nasional (Susenas) tahun 2007. Data yang dianalis Riskesdas dan Susenas
k b t A h Ut U it liti d l h t h
kabupaten Aceh Utara. Unit penelitian adalah semua anggota rumah tangga sampel Riskesdas dan Susenas tahun 2007. Diambil responden yang berumur lebih dari 10 tahun.
CART merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi baik untuk peubah dikembangkan untuk topik analisis klasifikasi, baik untuk peubah
respon kategorik maupun kontinu (Breiman et al.,1993).
•Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian.
•Dalam klasifikasi pohon melibatkan 4 komponen, yaitu variablep p , y respon, variable prediktor, data learning, dan data testing.
PEMBENTUKAN POHON KLASIFIKASI MAKSIMAL
PEMBENTUKAN POHON KLASIFIKASI MAKSIMAL
Menurut Breiman et al. (1993) proses pembentukan pohon klasifikasi Menurut Breiman et al. (1993) proses pembentukan pohon klasifikasi terdiri atas 3 tahapan sebagai berikut :
1. PEMILAH‐PEMILAH
a Mendefinisikan fungsi keheterogenan simpul a. Mendefinisikan fungsi keheterogenan simpul
Tujuan : mengurangi keheterogenan pada simpul utama dan memaksimumkan kehomogenan pada setiap simpul anak
setiap simpul anak. Fungsi keheterogenen Indeks Gini :
dengan : p(j|t) adalah proporsi kelas j pada simpul t p(i|t) adalah proporsi kelas i pada simpul t
Continu…
PEMBENTUKAN POHON KLASIFIKASI
1. PEMILAH‐PEMILAH 1. PEMILAH PEMILAH
b. Proses pemilahan simpul
Mencari semua kemungkinan pemilah pada variabe independen Nominal:
2
L‐1‐1
Ordinal : L‐1 Kontinu : n‐1c. Menentukan kriteria goodness‐of‐split
Goodness‐of‐Split (s,t) yang didefinisikan sebagai penurunan kehete‐ rogenan :
rogenan :
Pengembangan pohon dilakukan dengan mencari semua kemungkinan pemilah pada simpul sehingga memberikan nilai penurunan keheterogenan tertinggi yaitu.
Continu…
PEMBENTUKAN POHON KLASIFIKASI
2. PENENTUAN SIMPUL TERMINAL
Si l t k j di i l t i l bil
Simpul t akan menjadi simpul terminal apabila :
a. Pada simpul t tidak terdapat penurunan keheterogenan yang berarti. b. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanya
batasan minimum n. Menurut Breiman et al, 1993, pengembangan pohon berhenti apabila pada simpul terdapat n< 5, namun ada juga yang membatasi pengembangan pohon apabila pada simpul terdapat
< 10 n< 10.
c. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal. 3 PENANDAAN LABEL KELAS
3. PENANDAAN LABEL KELAS
Penentuan label kelas pada simpul terminal berdasarkan aturan jumlah terbanyak, Yaitu,
PENGHENTIAN PEMBENTUKAN POHON KLASIFIKASI
Menurut Lewis (2000) penghentian pembentukan pohon klasifikasi dilakukan jika tidak memungkinkan lagi untuk dilanjutkan., proses tersebut berhenti pada saat :
a. Terdapat hanya satu pengamatan dalam tiap simpul anak atau adanya batasan minimum n.
b. Semua pengamatan dalam tiap simpul anak mempunyai variabelp g p p p y independen dengan distribusi yang sama atau identik sehingga tidak mungkin terjadi pemilahan.
PEMANGKASAN POHON KLASIFIKASI (PRUNNING)
PEMANGKASAN POHON KLASIFIKASI (PRUNNING)
Pemangkasan adalah suatu penilaian ukuran sebuah pohon tanpa mengorbankan kebaikan ketepatan melalui pengurangan simpul pohon yang mengorbankan kebaikan ketepatan melalui pengurangan simpul pohon yang pada akhirnya diperoleh ukuran pohon yang layak dan berdasarkan cost complexity minimum.
cost complexity minimum :
Dimana :
R (T) = Resubstitution Estimate
α = Parameter Cost Complexity bagi penambahan satu simpul akhir pada pohon T.
׀T׀ = Banyaknya simpul terminal pohon T ׀T׀ = Banyaknya simpul terminal pohon T.
POHON KLASIFIKASI OPTIMAL
Pohon optimal adalah pohon yang berukuran sederhana dan memberikan nilai penduga pengganti cukup kecil. Untuk mendapatkan pohon klasifikasi optimum ada dua macam penduga pengganti yaitu:
1. Penduga sampel uji (test sample estimate)
Data yang digunakan bersumber pada data sekunder yang diambil dari data Riset Kesehatan Dasar (Riskesdas) tahun 2007 dan Survei Sosial Ekonomi Nasional (Susenas) tahun 2007.Objek diteliti adalahj semua anggota rumah tangga yang berumur > 10 tahun di Aceh Utara baik yang dinyatakan menderita penyakit demam tifoid maupun tidak.
Y=1 Æ Terjangkit demam tifoid Asal Daerah (x1)
Jenis Kelamin (x2)
Y=1 ‐‐Æ Terjangkit demam tifoid
Y=2 ‐‐Æ Tidak terjangkit demam tifoid
Tempat buang air besar (x8) Jenis Kelamin (x2)
Status Sosial Ekonomi (x3) Kualitas fisik air minum. (x4)
Tempat penampungan air minum (x5)
p g ( 8)
Kebiasaan cuci tangan pakai sabun setelah BAB (x9)
Kebiasaan cuci tangan pakai sabun
p p p g ( 5)
Tempat pembuangan sampah (x6) Tempat penampungan air limbah (x7)
sebelum makan (x10)
1. Analisis deskriptif.
2. Analisis klasifikasi pohon (Classification Tree) menggunakan software CART (Classification And Regression Trees) versi 4.0 dan dilakukan dengan (Classification And Regression Trees) versi 4.0 dan dilakukan dengan tahapan sebagai berikut :
•Membagi 1.816 data anggota rumah tangga menjadi 2 yaitu data learning dan data
testing. Terdapat 5 kombinasi proporsi data learning dan testing, yaitu 95%:5%,
90%:10%, 85%:15%, 80%:20%, dan 75%:25%. Selanjutnya dipilih satu kombinasi proporsi data learning dan testing yang memiliki ketepatan klasifikasi data testing terbesar untuk langkah analisis selanjutnya.
•Menentukan kemungkinan pemilah pada setiap 11 variabel prediktor mencari pemilahMenentukan kemungkinan pemilah pada setiap 11 variabel prediktor, mencari pemilah terbaik berdasarkan kriteria Goodness of Split,dan selanjutnya memilah data learning yang masih heterogen menjadi bagian yang lebih homogen dengan indeks gini.
•Penentuan simpul terminal (penghentian pohon). •Penandaan label kelas.
•Melakukan pemangkasan pada pohon yang telah terbentuk berdasarkan cost
complexity minimum.
•Memilih pohon terbaik.Memilih pohon terbaik.
•Menguji ketepatan klasifikasi yang berasal dari data learning dengan memasukkan data
l
h
J
i K l
i
i
Tempat Penampungan Air
Tempat Penampungan
Kebiasaan Cuci Tangan
Pakai Sabun Setelah BAB
Kebiasaan Cuci Tangan Pakai
Sabun Sebelum Makan
P
l h
K
h t
Penyuluhan Kesehatan
Kombinasi Data Ketepatan Klasifikasi Data Klasifikasi Data Testing (%) Learning Testing 95% 5% 80,20% 90% 10% 83,50% 85% 15% 80 90% 85% 15% 80,90% 80% 20% 82,10% 75% 25% 85,70%
Pembentukan Pohon Klasifikasi Maksimal
Pembentukan Pohon Klasifikasi Maksimal
PEMILAH‐PEMILAH
learning 75% (1.362 data) dan testing 25% (454 data) learning 75% (1.362 data) dan testing 25% (454 data)
Perhitungan pemilah pada setiap variabel prediktor diperoleh hasil sebagai berikut. • Asal daerah(2 kategori nominal) Æ 22‐1‐1 = 1 pemilahan
• Jenis kelamin(2 kategori nominal)Æ 2Jenis kelamin(2 kategori nominal)Æ 22‐1‐1 = 1 pemilahan1 1 pemilahan
• Status sosial ekonomi(2 kategori nominal) Æ 22‐1‐1 = 1 pemilahan • Kualitas air minum(2 kategori nominal)Æ 22‐1‐1 = 1 pemilahan
• Kondisi penampungan air minum(3 kategori nominal) Æ 2Kondisi penampungan air minum(3 kategori nominal) Æ 23‐1‐1 = 3 pemilahan1 3 pemilahan • Kondisi tempat pembuangan sampah(3 kategori nominal) Æ 23‐1‐1 = 3 pemilahan • Kondisi penampungan air limbah(5 kategori nominal) Æ 25‐1‐1 = 15 pemilahan • Tempat buang air besar(2 kategori nominal) Æ 2Tempat buang air besar(2 kategori nominal) Æ 22‐1‐1 = 1 pemilahan1 1 pemilahan
• Kebiasaan cuci tangan pakai sabun setelah BAB(2 kategori nominal) Æ 22‐1‐1 = 1 • Kebiasaan cuci tangan pakai sabun sebelum makan(2 kategori nominal)Æ 22‐1‐1 =1 • Keikutsertaan penyuluhan(2 kategori nominal) Æ 2Keikutsertaan penyuluhan(2 kategori nominal) Æ 22‐1‐1 = 1 pemilahan1 = 1 pemilahan
Pembentukan Pohon Klasifikasi Maksimal
Pembentukan Pohon Klasifikasi Maksimal
Ketepatan Klasifikasi Pohon
Maksimal
Pohon Klasifikasi Optimal
Pohon Klasifikasi Optimal
Pohon Klasifikasi Optimal
Pohon Klasifikasi Optimal
Skor Variabel Penting
Skor Variabel Penting
Pohon Klasifikasi Optimal
Pohon Klasifikasi Optimal
Kesimpulan
Kesimpulan
• Karakteristik dari masing‐masing variabel prediktor yang terjangkit demam tifoid terbesar adalah anggota rumah tangga dari pedesaan, status sosial ekonomi miskin, kualitas fisik air minum tidak keruh, tidak ada tandon untuk menampung air minum, tempat sampah terbuka,penampungan limbah terbuka di pekarangan, tempat buang air besar tidak di jamban, mempunyai kebiasaan cuci tangan pakai tempat buang air besar tidak di jamban, mempunyai kebiasaan cuci tangan pakai sabun setelah buang air besar, mempunyai kebiasaan cuci tangan pakai sabun sebelum makan, dan tidak pernah mengikuti penyuluhan kesehatan.
• Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat penampungan air limbah dengan skor 70.61, kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48 12 variabel tempat buang air besar sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan skor 33.80 dan status sosial ekonomi dengan skor 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan
l h k h d k b l d b h penyuluhan kesehatan dengan skor variabel penting dibawah 20.
Anonim_a. 2009. Penyakit Demam Tifoid. www.mangsholeh.wordpress.com-/2009/02/06/-penyakit-demam-tifoid/ (tanggal akses : 26 September 2009) Anonim_b. 2008. Metode Diagnostik Demam Tifoid pada
Anak.www.koas-kamar13.word-press.com/metode-diagnostik-demam-tifoid-pada-anak/ (tanggal akses : 26 September 2009)
Anonim_c. 2007. Demam Tifoid. www.ummusalma.wordpress.com/2007/01-/22/hello-world/ (tanggal akses : 27 September 2009)
/22/hello world/ (tanggal akses : 27 September 2009)
Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J. 1993. Classification And
Regression Trees. Chapman And Hall. New York
Hidayati, N. 2001. “Analisis Regresi Poisson Terhadap Faktor-Faktor yang
M hi P kit D T h id di P i i J Ti ” Sk i i
Mempengaruhi Penyakit Demam Typhoid di Provinsi Jawa Timur”. Skripsi,
Mahasiswa Jurusan Statistika FMIPA ITS. Surabaya
Jevuska. 2008. Demam Tifoid (Typhoid Fever). www.jevuska.com-/2008/05/10/demam-tifoid-typhoid-fever (tanggal akses: 26 September /2008/05/10/demam tifoid typhoid fever (tanggal akses: 26 September 2009)