KAJIAN METODA CHAlD DAN CHAlD EXHAUSTIVE
SEBAGAI ANALISA POHON BERSTRUKTUR
Studi Kasus Frekwensi Serangan Asma pada Murid
Sekolah Dasar
Kecamatan Cipayung
-
Jakarta Timur
Oleh:
SASKYA MARY SOEMARTOJO
PROGRAM PASCASARJANA
INSTITUT PERTANIAN BOGOR
ABSTRAK
SASKYA MARY SOEMARTOJO. Kajian Metoda CHAlD dan CHAID
Exhaustive Sebagai Analisa Pohon Berstruktur. Dibawah birnbingan AUNUDDIN
sebagai ketua, ASEP SAEFUDDIN dan BUD1 SUSETYO sebagai anggota.
Metoda CHAlD adalah salah satu tipe rnetoda AID ( Automatic Interaction
Detection ) yang diajukan oleh Kass (1980 ) rnerupakan rnetoda eksplorasi data
yang rnenangani data kategorik. CHAlD exhaustive diajukan oleh Biggs et a1 (1991),
rnengernukakan algoritrna penyekatan alternatip atas rnetoda CHAID atas peubah
dengan jurnlah kategori banyak dan peubah dengan kategori rnengarnbang
( floating ) .
Tujuan penelitian ini adalah rnernbandingkan hasil analisa dari kedua
rnetoda dalarn rnenentukan faktor penciri fisik dari tingkat frekuensi serangan asrna.
Data yang dianalisa adalah data frekwensi serangan asrna hasil survey Bantas
(1998 ). Setiap pengarnatan diukur terhadap peubah respon tingkat frekuensi
serangan asrna dan peubah
-
peubah penjelas berupa peubah faktor yangdiperkirakan rnernberi kontribusi terhadap rneningkatnya frekuensi serangan asrna.
Hasil analisa rnen~lnjukkan adanya kesarnaan struktur hubungan diantara
peubah peubahnya. Tingkat signifikansi rnenolak Ho pada rnetoda CHAlD dan
rnetoda CHAlD exhaustive sarna untuk peubah penjelas atopic dan sex, tetapi untuk
peubah jeni s lantai tingkat signifikansi hasil CHAlD lebih tinggi. Dengan dipilih
a
=
0,3 pada CHAlD rnuncul peubah hewan peliharaan yang berinteraksi denganpeubah kelarnin laki
-
laki pada a=
0,2984 , sedang peubah usia kasurPerbedaan hasil yang dipaparkan diatas rnenunjukkan harus dipilih rnetoda
yang tepat dalarn eksplorasi data rnenentukan faktor penciri fisik . Untuk peubah
berkategori dua atau tiga rnetoda CHAlD lebih tepat digunakan, sedang peubah
berkategori ernpat atau lebih sebaiknya digunakan rnetoda CHAlD exhaustive.
Pernaparan diskriptif klasik dari data diperlukan sebagai tahap awal eksplorasi
untuk rnelihat kecukupan penyebaran dari data. Kondisi data yang tak mernadai
PERNYATAAN
Saya yang bertanda tangan dibawah ini, sebagai penulis rnenyatakan
bahwa
:
Kajian dan analisa dalarn karya ilrniah ini adalah asli.
Jika dikernudian hari ada pihak -pihak yang keberatan dengan
keaslian karya ilmiah ini, saya sebagai penulis bersedia digugat.
Penulis
KAJIAN METODA CHAlD DAN CHAlD EXHAUSTIVE
SEBAGAI ANALISA POHON BERSTRUKTUR
Studi Kasus Frekwensi Serangan Asma pada Murid
Sekolah Dasar
Kecamatan Cipayung
-
Jakarta Timur
Oleh:
SASKYA MARY SOEMARTOJO
Tesis
sebagai salah satu syarat untuk rnernperoleh gelar
Magister Sains pada
Program Studi Statistika
PROGRAM PASCASARJANA
INSTITUT PERTANIAN BOGOR
Judul tesis : Kajian Metoda CHAlD dan CHAlD exhaustive sebagai analisa pohon berstruktur, Studi Kasus Frekwensi serangan Asrna pada rnurid Sekolah Dasar Kecamatan Cipayung
-
Jakarta Tirnur. Narna : Saskya Mary SoemartojoNRP : 95110 Program Studi : Statistika
Menyetujui,
1, Kornisi Pembimbing
Dr. Ir. Aunuddin.
Dr.lr. Asep Saefuddin,M.S Anggota
2. Ketua Program Studi Statistika
mu^
Dr. Ir. AunuddinAnggota
Mengetahui,
rida Manuwoto,MSc
Penulis dilahirkan di Bandung pada tanggal 21 September 1957 sebagai
anak sulung dari pasangan drs Soemartojo H. Apt dan Prof Noeniek
Soemartojo.
Tahun 1975 penulis lulus SMA Negri IV
-
Jakarta, melanjutkan pendidikan dijurusan Maternatik pada Fakultas llrnu Pengetahuan Alam Universitas lndonesia
dan lulus Sarjana Muda tahun 1980. Pada program studi yang sama penulis
melanjutkan pendidikan dan menamatkannya pada tahun 1985.
Selama mengikuti perkuliahan tingkat sarjana, penulis diangkat sebagai
Pegawai Negri Sipil golongan 2b di Fakultas Matematik llmu Pengetahuan Alam
Universitas Indonesia pada tahun 1983. Tahun 1987 diangkat sebagai staf
pengajar tetap di Jurusan Matematika, Fakultas Matematika llmu Pengetahuan
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SVVT atas segala karuniaNya,
sehingga karya ilrniah ini berhasil diselesaikan. Terna yang dipilih dalarn penalitian
adalah rnetoda eksplorasi, dilasksanakan sejak Januari 1998. Judul yang dipilih
adalah Kajian Metoda CHAlD dan CHAlD exhaustive Sebagai Analisa Pohon
Berstruktur.
Terirna kasih penulis ucapkan kepada Bapak Dr Ir Aunuddin, Bapak Dr Ir Asep
Saefuddin MS dan Bapak DR lr Budi Susetyo selaku pernbirnbing yang telah
memberi birnbingan dan saran-saran. Terima kasih pula saya ucapkan kepada
Proyek Dana Beasiswa TMPD yang selarna ini telah rnernberikan bantuan dana
belajar pada penulis.
Saya ucapkan pula terirna kasih kepada lbu dr Krisnawaty Bantas, Sp KM yang
memperkenankan saya untuk rnelakukan penelitian lanjut atas data tugas akhirnya
sekaligus rnernberikan inforrnasi pendukung dalarn bidang kedokteran yang
berkaitar~ dengan data tersebut
Ungkapan terirna kasih juga saya sarnpaikan kepada ayah, ibu tersayang,
suarni tercinta serta anak
-
anak terkasih, atas segala bantuan material, doa dan pengertiannya hingga selesainya karya ilrniah ini:Sernoga karya ilrniah ini berrnanfaat.
DAFTAR IS1
Halaman
DAFTAR TABEL . . . vi DAFTAR GAMBARAN . . . vii
... DAFTAR LAMPIRAN . . . VIII
BAB I PENDAHULUAN . . . 1 1.1 LatarBelakang . . . 1
1.2 Tujuan Penelitian . . . 3
BAB II METODA CHAlD DAN CHAID EXHAUSTIVE . . . 4
BAB Ill SUMBER DATA DAN METODA ANALISA . . . 9
111.1 Sumber Data . . . 9
DAFTAR TABEL
Halaman
1 . Kategori dan kode kategori peubah . . . 10
2 . Koefisien Bonferonni untuk CHAlD dan CHAlD exhaustive . . . 13
DAFTAR GAMBAR
1 . Diagram analisa CHAlD
. . .
2 . Diagram analisa CHAlD exhaustive . . .
Halaman
15
DAFTAR
LAMPIRAN
Halaman
1 Diagram pohon metoda CHAID dengan SPSS
.
. . . 22BAB
I
PENDAHULUAN
1.1 LATAR BELAKANG
Pada umurnnya analisis statistika didahului dengan tahapan eksplorasi data.
Tahapan ini bertujuan untuk menggambarkan karakteristik penyebaran data.
Histogram, tabuiasi silang, box plot (diagram kotak) merupakan metoda eksplorasi
yang bertujuan menggambarkan karakteristik penyebaran data.
Tahun 1964 Morgan dan Sonquist (Fielding 1977) rnemperkenalkan suatu
rnetoda eksplorasi data yang bertujuan untuk rnenggambarkan struktur interaksi
antar peubah
-
peubah penjelas terhadap peubah respon, rnetoda ini diberi namaAutomatic Interaction Detection (AID). Metoda AID melakukan penyekatan data
rnenjadi dua sub data atas peubah penjelas dengan jurnlah kuadrat antar sekatan
maksimurn, selanjutnya penyekatan dilanjutkan pada sub-sub data hingga diperoleh
sub-sub data dengan tingkat kehornogenan yang makin tinggi. Penyekatan data
secara bertahap rnenghasilkan diagram pohon yang selain memberikan garnbaran
pengelompokan data yang homogen secara berstruktur juga rnenginformasikan
struktur asosiasi antar peubah penjelasnya. Metoda AID diperuntukkan bagi data
dengan peubah penjelas berskala ratio atau interval.
Messenger dan Mandell (1972) mengembangkan metoda AID bagi peubah
respon berskala nominal dan peubah bebas kategorik. Metoda ini dinamakan THAlD
yang merupakan perbandingan maksimum jumlah observasi terhadap setiap modal kategori.
Kass (1980) melakukan pengembangan atas metoda THAlD dalam ha1 uji signifikansi penyekatan. Metoda ini dinamakan CHAID (Chi-square AID). Pada metoda CHAID prosedur penyekatan data berdasarkan pengujian Chi-kuadrat, sehingga gugus data tersekat sesuai kategori dalam peubah penjelas yang memberikan hubungan terbesar pada peubah respon. Prosedur penyekatan pada sub-sub gugus data dilanjutkan hingga tak ada lagi peubah
-
peubah penjelas yang berhubungan secara nyata.Biggs et a1 (1991) mengemukakan alternatip algoritma penyekatan atas metoda CHAID melalui algoritmanya yang diberi narna Knowledge Seeker, dan selanjutnya untuk memberi penekanan bahwa algoritma ini merupakan pengembangan atas CHAID maka metoda ini dinamakan CHAID Exchaustive.
Penerapan metoda analisis statistika banyak digunakan didalam penelitian berbagai disiplin ilmu, seperti pertanian, sosial, kedokteran. Dalam ilmu kedokteran, asma merupakan penyakit yang cukup rnenarik untuk diamati, karena pendapat awam memperkirakan bahwa faktor lingkungan hidup penderita diperkirakan sebagai penyebab terjadinya serangan asma.
Menurut ilmu kedokteran, asma merupakan penyakit sesak napas kambuhan yang disebabkan menyempitnya saluran udara dalam paru-paru akibat dari reaksi perubahan cuaca atau udara (Bantas 1998). Munculnya asma pada anak-anak dapat disebabkan infeksi saluran pernafasan sejak bayi atau latar belakang atopic
Faktor lingkungan antara lain debu, kutu tungau, bulu-bulu hewan diperkirakan
sebagai faktor pemicu tingginya frekuensi serangan (Mills 1993).
Bantas (1998) rnelakukan penelitian kohor mengenai "Resiko kasur kapuk
terhadap jenis alas tidur lain pada tingkat frekuensi serangan asma" dengan
populasi murid penderita asrna di 58 sekolah dasar kecamatan Cipayung. Jakarta
Timur. Dalarn penelitian ini rnetoda analisis yang digunakan adalah regresi logistik
linier. Hasil analisis regresi logistik linier mernaparkan bahwa tak ada beda nyata
pengaruh kasur kapuk dengan jenis kasur lain terhadap resiko tingkat frekuensi
serangan asrna.
Munculnya peubah penjelas dalam model menunjukkan bahwa peubah penjelas
tersebut rnernpengaruhi secara nyata terhadap respon, walaupun demikian
hubungan (asosiasi) secara terurut diantara peubah tak rnudah teridentifikasi melalui
regresi logistik, oleh karena itu perlu dilakukan eksplorasi data sebagai pendukung
analisis regresi logistik atau analisis konfirmatif lainnya.
1.2 TUJUAN PENELlTlAN
Tujuan penelitian ini adalah melakukan eksplorasi data terhadap penelitian
Bantas (1998), dengan menggunakan metoda CHAID dan CHAID Exhaustive untuk
rnelihat hubungan dan interaksi berstruktur antar penjelas terhadap respon. Hasil
eksplorasi data yang diperoleh melalui kedua rnetoda kemudian dibandingkan
BAB II
METODE CHAID DAN CHAID EXHAUSTIVE
Sekumpulan data {(Xi,Yi); i
=
1,2,....,
n) dengan X=
(X,,
X2,
..., Xq) E Rqmerupakan vector peubah penjelas dan Y E R' adalah peubah respon dikatakan
kategorik bila peubah-peubah pengamatan berskala ordinal atau nominal.
Pengamatan dengan peubah kategorik banyak dlumpai dalam penelitian bidang
ilmu sosial dan kedokteran. Pada eksplorasi data histogram digunakan untuk melihat
penyebaran data terhadap suatu peubah yang ditentukan, sedang tabulasi silang
digunakan untuk rnelihat penyebaran data atas dasar dua peubah.
Pada tahun 1964 Morgan dan Sonquist (Fielding 1977) memperkenalkan metoda
eksplorasi data yang memberikan gambaran hubungan terstruktur antara peubah,
interaksi antar peubah dan pengelompokan data-data yang hornogen. Sesuai
dengan tujuan eksplorasi, metoda ini dinamakan Automatic Interaction Detection
(AID). Dalam prosedurnya AID melakukan penyekatan gugus data yang
memaksimumkan jarak antar sub gugus data dan meminimumkan jarak dalam
gugus data. Berkat perkembangan program kornputer dan publikasi yang dilakukan
Sonquist dan Morgan, maka metoda ini banyak digunakan dalam eksplorasi data
peubah banyak seperti analisa kependudukan, pemasaran dan ilmu sosial, namun
demikian tak ada uji signifikansi yang mendukung metoda tersebut. Berbagai
penelitian dikernbangkan untuk menentukan uji signifikansi pendukung metoda AID.
Messenger dan Mandell (1972) mengemukakan THAlD sebagai pengembangan
AID dalam ha1 uji signifikansi guna menangani peubah respon Y yang berskala
ordinal atau nominal. Kass (1980) rnengembangkan metoda eksplorasi untuk
peubah penjelas dan peubah respon kategorik. Metoda
ini
dinamakan CHAlD (Chi-square AID) sebagai penekaan bahwa algoritma yang digunakan didasarkan pada
uji Chi-kuadrat. Pada metoda ini Kass memperkenalkan kategori mengambang
(floating), yaitu kategori dalam skala ordinal yang kurang yakin posisi urutan
tingkatnya. Contoh peubah mengarnbang adalah tingkat pendidikan dengan
kategori: pendidikan SLB.
Prosedur kerja CHAlD dapat diuraikan sebagai berikut :
Perhatikan hirnpunan data {(X,,Yi);i= 1,2 ,...., n) dengan X
=
(X,, X2, ..., Xq) E Rq rnerupakan vektor penjelas dengan Xq dalam c kategori dan Y adalah peubahrespon dalarn j kategori. Pada peubah penjelas Xq dengan kategori lebih dari dua,
dipilih kategori yang nyata dengan cara melakukan tabulasi silang antar j kategori
peubah respon dan setiap dua kategori pada peubah penjelas. Jika nilai uji tidak
nyata maka kedua kategori peubah penjelas digabungkan, uji dilakukan pada setiap
pasangan kategori yang mungkin hingga semua kategori nyata. Dengan uji Chi-
kuadrat (X2 ), peubah penjelas yang mempunyai hubungan paling nyata terhadap
respon memilah data berdasarkan kategori dalam peubah penjelas tersebut.
Pemilahan ini berlanjut pada sub gugus data hingga tak ada lagi peubah yang
berpengaruh pada peubah respon sub gugus data. Penggabungan kategori tidak
nyata pada peubah penjelas rnenyebabkan tingkat kesalahan (ao) pada uji
hubungan peubah respon dan penjelas merupakan kesalahan individu dari bentuk
tipe I (a) dari penjelas tersebut adalah kesalahan individu dikalikan banyak cara
penggabungan yang rnungkin.
Metoda CHAlD rnengernukakan cara penggabungan kategori tak nyata dengan
rnelihat sernua cara pengelornpokkan yang rnungkin. Melalui cara tersebut Kass
(1990) menyarnpaikan tiga bentuk koefisien Bonferroni sesuai skala dari peubah
penjelas sbb:
Peubah Monotonic ( kategori berskala ordinal ). Dengan penggabungan r
kategori, rnaka jurnlah cara gabungan yang mungkin adalah C,,, , menurut
identitas cornbinatorial
C,,,
=C,.t,,, + C,.,,,.
Pada skala ordinal penggabungan hanya dirnungkinkan dengan kategori terdekat, sehingga dari hubungan identitastersebut diperoleh koefisien Bonferroni sbb:
B
monolanrc = Cn-1.r-I* Peubah bebas, bila kategori berskala nominal:
'-'
(- 1)' ( r-
i)'
=
C
i = o i ! ( r
-
i ) !"
Peubah rnengambang.
Peubah ini perluasan dari skala ordinal dirnana letakurutan kategori rnengarnbang diragukan, sehingga cara rnenghitung koefisien
Bonferroni adalah rnengeluarkan sernentara kategori rnengarnbang dan
rnenggabungkannya kernbali. Untuk prosedur diatas diperoleh koefisien
Bonferroni sbb :
B float= C-2.r-z + r Ccz.r.1
Mernpertirnbangkan bahwa rnetoda CHAD yang dikernukakan Kass
rnembandingkan sernua kernungkinan gabung yang ada, rnaka bertarnbahnya
jurnlah kategori dalarn peubah rnengakibatkan koefisien Bonferroni mernbesar
dengan cepat. Hal ini baru terungkap karena dalarn penelitiannya, Kass hanya
rnenggunakan peubah dengan jurnlah kategori hingga ernpat.
Dengan pertirnbangan tersebut. Biggs et a/ (1991) rnelakukan evaluasi atas
rnetode CHAlD (Kass 1980) dalarn ha1 prosedur penyekatan dan penanganan yang
berbeda untuk penjelas berskala rnengarnbang.
Prosedur CHAlD exhaustive dapat diuraikan sebagai berikut :
CHAlD exhaustive dirnulai dengan rnereduksi c kategori rnenjadi c-I kategori
dengan cara rnenggabungkan kategori yang paling tak nyata. Reduksi terus
dilanjutkan hingga tersisa dua kategori. Prosedur ini rnenjarnin bahwa kategori yang
tersisa rnerupakan gabungan kategori yang paling nyata ( Biggs 1991). Pada
peubah penjelas rnengarnbang, kategori rnengarnbang dikeluarkan sernentara
selarna proses reduksi kategori. Selanjutnya kategori rnengarnbang digabungkan
dengan salah satu gabungan kategori serupa, bila tidak serupa kategori
rnengarnbang dianggap salah (mising) dan dikeluarkan. Prosedur penyekatan
CHAID exhaustive rnernberikan koefisien Bonferoni sebagai berikut:
* Penjelas tipe nominal atau ordinal :
Dalarn rnetoda ini penggabungan dilakukan bertahap sejak langkah ke k = l
c-2
hingga tersisa dua kategori pada k
=
c-
2, rnakaN,Jc) = l + C N ( c - k + l , c - k ) .
k=l
Peubah ordinal
:
langkah k=2, dihitung cara gabung c-2 dari c-1 kategori
=
N(c-1,c-2) c-?)-l-
=
C ] ) ]-
c-
2langkah k, dihitung cara gabung c-k dari c-k+l kategori
=
N(c-k+l,c-k)=
c-
k sehingga untuk peubah ordinal N(c-k+l,c-k)=
c-
kPeubah nominal :
langkah k=l, dihitung cara gabung c-I dari c kategori
=
N(c,c-I)dengan cara yang sama dihitung cara gabung saat langkah k sebagai
berikut, cara gabung (c-k ) dari (c-k+l) kategori
=
N (c-k+l, c-k) (e-k)-l {(c - k ) - j ) ~ - ~ + '=
-y(-l)j
i=o
i ! { ( c
-
k )
-i}!
Peubah tipe mengambang :
Jika kategori mengambang tak dapatdigabung maka koefisien Bonferroni
sama dengan penyesuaian Bonferroni pada skala ordinal dengan jumlah
kaiegori c-I
Jika kategori mengambang dapat digabung maka koefisien Bonferroni
Untuk tipe ini sama dengan koefisien Bonferroni tanpa kategori mengambang
( c-I kategori ) untuk skala ordinal ditambah jumlah gabungan bila kategori
mengambang disertakan.
BAB Ill
SUMBER DATA DAN METODA ANALISA
111.1 SUMBER DATA
Data yang digunakan merupakan data sekunder dari hasil penelitian Bantas
(1998) dengan populasi murid Sekolah Dasar kelas 1 hingga 5 penderita asma,
kecamatan Cipayung, wilayah Jakarta Tirnur. Tahap pertama seluruh siswa dari 58
sekolah ditentukan kondisi berpenyakit asma pada setiap anak, melalui responden
yang diberikan pada orang tua 1 wali anak. Hasil tersebut menjaring populasi 879
anak penderita asma yang terdiri dari 479 laki-laki dan 400 perempuan. Data contoh
acak ukuran 334 anak dipilih secara acak sempurna.
Pengamatan terhadap frekuensi serangan asma diamati selama 6 bulan berjaian
kedepan dengan melakukan pemeriksaan terjadinya serangan pada tiap
minggunya. Frekuensi serangan asma dihitung jumlahnya selama 6 bulan , dan
dikategorikan dalam 3 kelompok yaitu :
1. Frekuensi ringan (0
-
1 kali serangan dalam 6 bulan ). 2. Frekuensi sedang ( 2-
4 kali serangan dalam 6 bulan ). 3. Frekuensi sering ( lebih dari 4 kali serangan dalam 6 bulan ). .
Peubah penjelas yang diperkirakan mempengaruhi terjadinya serangan asma
ditetapkan sebanyak 12 peubah
.
Pengamatan untuk peubah penjelas dilakukanrnelalui wawancara pada wali murid. Tabel dibawah adalah daftar peubah penjelas
Tabel
Frekuensi serangan
Peubah penjelas : Tipe kasur
Perokok dikeluarga
Hewan peliharaan
Tipe lantai rumah
Usia Kasur
Frekuensi jemur kasur 1 bulan
Olahraga
Jenis kelamin
Atopic dikeluarga
Frekwensi ganti sprei I minggu
Bahan bakar masak
Karpet
Ringan Sedang Berat
1. Kategori dan kode kategori peubah
I
Bukan kapuk 1
Kapuk
I
KATEGORI
Ordinal
Nominal
I
I
KODE
Tak ada Burung / anjingt
kucing Lebih dari 1 jenis
hewan
TlPE
Ubin Semen
Tanah
< I tahun
1
- 5 tahun
> 5 tahun
> 2x lbulan
1-2
x
bulan< I 1 bulan
Ordinal
Ordinal
Ordinal
Ordinal
Ya 1
I
Nominal tidakI
Nominal Perempuan
Laki-laki
1
2
Bukan kayu bakar Kayu bakar
> 4 x I bulan 2 - 4 x / bulan
< 2 x I bulan
[image:67.608.77.522.103.799.2]111.2 METODA ANALISA
Dalarn penelitian ini digunakan program demo Knowledge Seeker IV (1997) yang
dirancang khusus untuk eksplorasi data dengan rnenggunakan rnetoda CHAlD dan
CHAlD exhaustive. Program demo hanya dapat rnenganalisa 10 peubah. Mengatasi
ha1 tersebut dilakukan reduksi peubah tak signifikan rnenggunakan uji Chi-kuadrat.
Peubah yang dikeluarkan adalah "frekwensi ganti sprel', "olahraga" dan "bahan
bakar masak". Berikut dibawah uraian algoritma untuk masing-masing rnetoda.
Algoritma CHAlD :
1. Pilih peubah penjelas Xq dengan kategori c lebih dari dua .
2. Buat sub tabulasi silang ( 2 x d )
,
d = jurnlah kategori peubah respon. Jika statistik uji bernilai lebih kecil dari nilai kritis ( X 2 (d.l:.) ), kedua kategoridigabungkan. Ulangi langkah ini hingga sernua subtabel ( 2 x d ) rnernpunyai
statistik uji rnelarnpaui nilai kritis ( X2(d.,: : ) . Keadaan ini rnereduksi c kategori
peubah penjelas rnenjadi r kategori.
3. Pada setiap peubah penjelas dengan tabulasi silang ukuran r x d atau c x d
(penjelas tak tereduksi ), tentukan tingkat kesalahan tipe I
[a,
j.4. Bila kategori direduksi rnenjadi r kategori, tingkat signifikan peubah penjelas Xq
adalah
a?
= a, dikalikan koefisien Bonferroni sesuai dengan skala peubahpenjelas tersebut.
5. Peubah penjelas signifikan adalah penjelas dengan tingkat signifikan
a*
=
rnin,
(a:)
6. Lakukan pernisahan biner pada gugus data atas dasar kategori dalarn peubah
I I
pada kategori serupa, jika tidak ada kategori yang serupa maka kategori
tersebut dikeluarkan dari peubah penjelas sebagai data missing.
7. Nilai penyesuaian Bonferroni yang digunakan adalah koefisien Bonferroni untuk
penjelas ordinal tetapi jika kategori mengambang digabungkan, gunakan
penyesuaian Bonferroni untuk kategori mengambang.
8. Lakukan prosedur diatas pada sub gugus data, dan lanjutkan prosedur diatas
pada sub-sub gugus data hingga tak ada peubah yang signifikan sebagai
penyekat lagi.
Perhitungan koefisien Bonferroni ditentukan oleh pengguna program sesuai
dengan rumus diberikan pada masing
-
masing prosedur dan dihitung menurut tipepeubah dan jumlah kategori masing-masing. Hasil perhitungan koefisien
Bonferonni untuk masing-masing metoda disajikan pada tabel dibawah :
Tabel 2. Koefisien Bonferonni untuk CHAlD dan CHAlD exhaustive
tipe
1
jumlah1
CHAlD]
CHAlDI
nominal
Ir'MI.:
BAB IV
HASIL DAN PEMBAHASAN
Sebagai langkah awal disajikan garnbaran diskriptif klasik dari data berdasarkan
peubah peubah nyata untuk mengetahui penyebaran data.
Tabel 3. diskriptif klasik jurnlah respon berdasarkan peubah signifikan
Hasil analisa diskriptf diatas hanya memberikan gambaran penyebaran data, tetapi
tak memberikan gambaran interaksi antar peubah yang diperlukan. e
u
b
In
-
Lebihdariljenis Tak ada Kucinglanjinglburung Lebihdariljenis 2 1 8 7 1 6 7 1 4 4
-
3 4 5 14 15 11 7 6 4 7 2 2 2 1 3 1 9 8 - 2
Tahap analisa selanjutnya adalah eksplorasi data untuk melihat gambaran
hubungan dan interaksi antar peubah. Berikut akan disajikan hasil eksplorasi deteksi
interaksi :
334 pendcrita asma : 104 tingkat ringan 139 tingkat sedang 91 cinpkat bcrat
284 respon alopic. 85 % : 29 tingkat ringan (58 %) 7 1 lingkal ringan (26.4 %) 13 tingkal sedang (26 %) 126 tingkat scdang (44.4 %)
83 tingkat berat (29.2 %)
a=o,W
\.128 rcspon percmpuan, 38.3 %: I56 respon laki laki ,46.7 %: 23 tingkat ringan (18 %) 52 tingkat ringan (33.3 %) 60 tingkat sedang (46.9 %) 66 tingkat sedang (42.3 %)
45 lingkat bcrat (35,2 %) 38 tingkat beral (24.4 %)
4 tingkat ringan ( 12,9 %) 19 :tingkal ringan (19.6 %) 10 tingkat sedang ( 32.3 %) 50 tingkal sedan; ( 5 1.5 %) 17 tingkat beral (54.8 %) 28 lingkat bcrat (28.9 %)
46 respon lebih dari 1 jenis. 13.8 %
52 respon 1 jenis hewan pelihara , 32.9 %: 9 tingkat ringan (19.6 ) 43 tingkat ringan (39,l %) 22 tingkat sedang (47.8 %)
44 tingkat sedang (40 %)
38 usia kasur 5 5 tahun
.
11.4 %: 8 usia kasur > 5 tahun. 2.4 % :5 tingkat ringan ( 13.2 %) 4 tingkat ringan ( 50 %)
[image:72.599.79.541.165.600.2]19tingkat sedang ( 50 %) 3 tingkat sedang ( 37.5 %)
Gambar I. Diagram analisa CHAlD
Hasil analisis diatas menggambarkan bahwa peubah penjelas yang sangat nyata
85 % penderita asrna rnernpunyai atopic dalarn keluarga, dan cenderung rnernpunyai tingkat serangan sedang atau berat. Peubah kedua yang rnernpunyai
tingkat signifikan tertinggi adalah jenis kelarnin. Faktor jenis kelarnin rnernpengaruhi
respon beratopic. Penderita asrna perernpuan dengan atopic cenderung dalarn
tingkat frekuensi serangan sedang atau berat, sebaliknya pada laki-laki cenderung
dalarn tingkat frekuensi serangan sedang atau ringan. Selanjutnya faktor lingkungan
"jenis lantai" rnernpengaruhi respon perernpuan beratopic, sedang faktor "hewan
peliharaan" berpengaruh pada respon laki-laki beratopic. Peubah usia kasur
rnernpengaruhi respon atopic dengan jenis kelarnin laki-laki dan rnernpunyai lebih
dari satu jenis hewan peliharaan. Pada kelornpok usia kasur berurnur lebih kecil
sarna dengan lirna tahun cenderung rnernpunyai frekwensi serangan sedang atau
berat, sebaliknya pada kelornpok usia kasur lebih besar lirna tahun cenderung
334 pcnderita asnla :: 104 tingkat ringan I39 tingkat sedang 91 tingkat bcrat
29 tingkat ringan ( 58 %)
I3 tingknt sedang ( 26 %)
8 lingkat berat (16 %)
75 tingkat ringan (26.4 %)
126 lingka sedang (44.4 %)
83 tingkat sedang (29.2 %)
Garnbar 2. Diagram analisa CHAID exhaustive
128 respon perempuan : 38.3 %:
23 tingkat risgan (18 %)
60 tingkal scdang (46.9 %)
45 tingkat berat (35.2 %)
Hasil analisa CHAID exhaustive rnenunjukkan bahwa tak ada beda urutan struktur
156 respon laki-laki ; 46.7 %:
52 tingkat ringan (33.3 %)
66 itngkat sedang (42.3 %)
3 8 tingkat berat (24,4 %)
peubah penjelas dengan hasil yang diperoleh rnelalui metoda CHAID. Tingkat a = O P
5 respon (anal,. 26 semen : 9.3 %:
'
7
97 respon "bin / kcramik ; 29 % :
4 tingkat ringan ( 12;9 %) 19 tingkat ringan (19.6 %)
10 tingkat sedang (32.3 %) 50 ringkat sedang (51;s %)
17 ringkat bera (54,8 %) 28 tingkat berat (28,9 %)
signifikansi yang diperoleh rnelalui rnetoda CHAID exhaustive sama untuk peubah
dengan jumlah kategori dua. Koefisien Bonferoni'pada rnetoda CHAlD exhaustive
lebih besar daripada rnetoda CHAID untuk jumlah kategori tiga pada peubah
nominal sehingga rnenghasilkan tingkat signifikan yang lebih rendah. Hal ini
berakibat pada tingkat signifikansi a = 0,05 peubah factor hewan peliharaan dan
Kedua hasil analisa CHAID diatas memaparkan bahwa peubah yang sangat
signifikan mempengaruhi tingkat frekuensi adalah atopic, diikuti dengan peubah jenis
kelamin yang berasosiasi dengan respon atopic dan peubah tipe lantai rumah
berasosiasi dengan jenis kelamin perempuan beratopic.
Pada kedua hasil analisa CHAID terpapar adanya pengaruh lingkungan seperti
jenis lantai, hewan peliharaan dan usia kasur dalam tingkat signifikan rendah ( a
3
0,15). Hasil sementara menyimpulkan bahwa asma adalah penyakit yang timbul
akibat keturunan, tetapi jika ditinjau kembali tabel analisa diskriptif terlihat banyak
sel
-
sel yang kosong. Dari sini dapat diperkirakan bahwa tak adanya penyekatanpada sub-gugus data belum tentu karena tak adanya asosiasi peubah tetapi dapat
juga disebabkan oleh adanya sel kosong. Banyaknya sel kosong dapat disebabkan
kurangnya jumlah sampel atau sampel cenderung homogen. Alasan ini dapat
diterima karena beberapa respon dicurigai berasal dari keluarga yang sama (kakak-
adik).
Data diatas juga dianalisa dengan program Answer tree 2.0 -SPSS ( hasil
analisa lihat lampiran 1 dan 2). Secara urutan peubah signifikan, tak ada beda hasil
antara kedua program. Perbedaan terlihat pada nilai signifikansi penyekatan
(a
),hasil SPSS memberikan nilai a yang lebih kecil, sehingga dengan menetapkan a
=
BAB
V
KESIMPULAN
1. Metoda CHAID dan CHAID exhaustive rnerupakan rnetoda analisa pohon
berstruktur yang rnenentukan penyekatan berdasarkan uji Chi-kuadrat.
2. Pada kondisi peubah penjelas berkategori kurang dari ernpat, rnetoda CHAID
lebih baik digunakan untuk rnenarnpakkan lebih banyak peubah penjelas.
3. Jurnlah sarnpel bergantung pada banyaknya peubah penjelas, tak sesuainya
jurnlah sarnpel terhadap jurnlah peubah penjelas rnengakibatkan tak rnunculnya
beberapa peubah penjelas yang signifikan sebagai pernisah biner.
4. Asrna rnerupakan penyakit keturunan sehingga riwayat atopic dalarn keluarga
rnernberikan kontribusi yang sangat kuat terhadap tingkat frekuensi serangan,
disarnping jenis kelarnin juga rnernberi darnpak yang cukup kuat.
5. Pada hasil analisa diatas diperkirakan rendahnya tingkat signifikansi bukan
sernata-rnata disebabkan asosiasi yang lemah terhadap rnasing
-
masingsubgugus data tetapi karena jurnlah sarnpel dalarn sub gugus data kurang.
6. Perlu dilakukan rancangan pengarnatan yang lebih baik untuk rnelihat pengaruh
faktor lingkungan.
7. Eksplorasi data dengan CHAID dan CHAID exhaustive tanpa didahului dengan
DAFTAR PUSTAKA
Agresti A
.
1990 . Categorical Data Analisis. John Wiley & Sons. New York.Alamudi A
.
1996. Eksplorasi Penciri Fisik Status Keamanan Pangan RumahTangga dengan Metoda CHAID. Tesis S2. Program Pascasarjana lnstitut
Pertanian Bogor.
Bantas K
.
1998. Kapok or Barn Mattres As a Risk Faktor of Asthma Attack:A Cohort Study in Asthmatic School Childern Age Between 5-13 Years in District
of Cipayung of East Jakarta. ( S2 Thesis, Gajah Mada University ).
Biggs D
,
Ville B de, Suen ED. 1991. A method of choosing multiway partitions forclassification and decision trees. Journal of App Statist. 18 : 49-62.
Fielding A . 1977. Binary Segmentation : The Automatic lnteraction Detector and
Related Tecnique for Exploring Data Structure ( O'Muircheartaigh C A. Payne C
1977. The Analysis of Survey Data Vol.1. Exploring Data Structures). John Wiley
& sons. New York.
Hosmer DW, Lemeshow S. 1989. Applied Logistic Regression. John Wiley &sons.
Jackson BB. 1983. An Introduction Multivariate Data Analysis. Richard D & Iiwin, Inc.
Kass GV. 1974. Significance Testing in Automatic Interaction Detection ( A . I . D ).
App Statist, 24 : 178
-
189.Kass GV. 1980. An Exploratory Technique for Investigating Large Quantities of
Categorical Data. App Statist., 29 : 119-1 27.
Messenger R
,
Mandell L. 1972. A Modal Search Technique for Predictive NominalScale Multivariate Analysis. JASA, 67: 768-772
Mills JMD
,
1993. Current Emergency Diagnosis & treatment (Gawat Darurat Paru-Paru) Alih bahasa : dr Sonny Samsudin. Penerbit Buku Kedokteran EGC.
Larnpiran 1 : Diagram analisa CHAlD dengan SPSS
334 penderita asma :
I04 tingkat ringan I39 tingkat sedang
29 tingkat ringan (58 %) 75 tingkat ringan (26.4 %)
129 resoon ocrcrnouan. 38.3 %:
. .
. .23 tingkat ringan (18 %) 60 tingkat scdang (46.9 %)
45 tingkat berat (35.2 %) I57 respon laki laki .46.7 %: 52 1ingk)t ringan (33;: %) 66 tingkar scdang (42.3 %)
-
-
38 tingkat berat (24.4 %)espon semen 9,3 % 97 rcspon lantai ubin I kerarnik. 29 % : 19 :tingkat ringan (19.6 %) tingkar ringan ( 12.9 %)
ringkat sedans ( 32,3 %) 50 tingkat scdang ( 5 1.5 %) tingkat berat (54.8 %) 28 tingkat bcrat ( 28,9 %)
58 respon tak mernelihara hewan. 46 respon lebih dari I jenis.13.8 % :
52 respon 1 jenis hewan pelihara
.
32.9 %: 9 tingkat ringan (19.6 ) 43 tingkat ringan (39.1 %) 22 tingkat sedang (47.8 %) 44 tingkat sedang ( 4 0 %) 15 tingkat berat ( 32.6 %) 23 tingkat berat ( 20.9 %)38 usia kasur 5 5 tahun , 11.4 %: 8 usia kasur > 5 tahun, 2,4 % :
5 tingkat rlngan ( 13.2 %) 4 tingkat ringan ( 50 %)
19 tingkat sedang ( 50 %) 3 tingkat sedang ( 37,5 %) 1 tingkat berat ( 12.5 "a)
/
1
14 t i ~ e bukan kasur. 4.2%: 0 tkngkat rangan ( 0 % ) 6 t r g k a l sedang (42.86 %) 8 lingnal berat (57.14%)24 tipe kasur. 7.2%:
5 tingkat ringan (20.83%) 13 tingkat sedang (54.16%) 6 tingkat berat (2501%)
Larnpiran 2. Diagram pohon rnetoda CHAlD exhaustive dengan SPSS
334 pendcrita asma ::
104 tingkat ringan 139 tingkat sedang
91 tingkat bcrat
a
=
0,0001
29 tingkat ringan ( 58 %)I3 tingkat sedang ( 26 %) 8 tingkat berat (16 %)
284 respon atopic: 85 % : 75 tingkar ringan (26,4 $4) 126 tingkat scdang (44.4 %)
129 respon perempuan ; 38.3 %: 23 tingkat ringan (18 %) 60 tingkat sedang (46.9 %) 45 tingkat bcral (35.2 %)
I57 rerpon laki-laki : 36.7 % : 52 lingkat ringan (33.3 %) 66 tingkat sedang (42.3 %) 38 tingkat berat ( 24.4 %)
3 ringkat ring!, (12.9 %) 19 tingkat ringan (19,6%) 10 tingkat scdass (32.3 %) 50 tingkat scdang (5l:j %)
58 respon tak memelihara hewan. 46 respon lebih dari 1 jenis
43 tingkat ringan (39.1 %) 9 tingkat ringan (19.6 %) 44 tingkat sedang (40 %) 22 tingkat sedang (47.8%)
38 usia kasurz 5 tahun, 11.4 %:
5 tingkat ringan (13.2 %)
19 tingkat sedang (50 %) 4 tingkat ringan (50 % )
14 tingkat berat (36.8 56) 3 tingkat sedang (37.5 %)