• Tidak ada hasil yang ditemukan

ANALISIS FAKTOR RISIKO PENYAKIT JANTUNG KORONER DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK DAN CHAID: KASUS DI RSUP DR. WAHIDIN SUDIROHUSODO MAKASSAR

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS FAKTOR RISIKO PENYAKIT JANTUNG KORONER DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK DAN CHAID: KASUS DI RSUP DR. WAHIDIN SUDIROHUSODO MAKASSAR"

Copied!
37
0
0

Teks penuh

(1)

ANALISIS FAKTOR RISIKO PENYAKIT JANTUNG

KORONER DENGAN MENGGUNAKAN METODE

REGRESI LOGISTIK DAN CHAID:

KASUS DI RSUP

DR. WAHIDIN SUDIROHUSODO MAKASSAR

ASTRI ATTI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008

(2)

and UTAMI DYAH SYAFITRI.

Coronary heart disease (CHD) is an anomaly that caused by constriction of artery. CHD is influenced by hypercholesterol, hypertension, diabetes mellitus, smoking, obesity, sport less, genetic, stress, age, and even sex.

Logistic regression and CHAID methods were used for describing association between dependent variable and independent variables to categorical data. There are 827 respondents consist of 52% CHD patient and 48% non CHD patient. The goal of this research are to investigate risk factor that influences CHD by logistic regression method, also to know structural association in segmentation observation based on CHD patient or not by CHAID method. And comparing result of classification between them.

The result of logistic regression method shows that CHD status are influenced by hypercholesterol, diabetes, body mass index (BMI) and age. CHAID method results that hypercholesterol have the strongest association to CHD, with three segmentations or groups for CHAID. The first group is hypercholesterol sufferer and obese, second is hypercholesterol sufferer with normal or thin body and non hypertension, and the last is non hypercholesterol but suffer diabetes mellitus and male. Total misclassification rate for logistic regression is about 32,8% while CHAID method is about 30,7%.

(3)

RINGKASAN

ASTRI ATTI. Analisis Faktor Risiko Penyakit Jantung Koroner dengan Menggunakan Metode Regresi Logistik dan CHAID. Dibimbing oleh BUNAWAN SUNARLIM dan UTAMI DYAH SYAFITRI.

Penyakit jantung koroner (PJK) adalah suatu kelainan yang disebabkan oleh penyempitan atau penghambatan pembuluh arteri. PJK dipengaruhi oleh beberapa faktor di antaranya hipertensi, hiperkolesterol, diabetes mellitus, merokok, obesitas, kurang olah raga, riwayat keluarga, stres, umur, dan bahkan kelamin.

Metode regresi logistik dan CHAID merupakan metode yang dapat digunakan untuk mengungkapakan asosiasi antara peubah respon dan peubah penjelas untuk data-data kategorik. Penelitian ini menggunakan 827 responden terdiri atas 52% penderita PJK dan 48% bukan penderita PJK. Tujuan penelitian ini yaitu, untuk menelusuri faktor risiko yang mempengaruhi PJK dengan menggunakan metode regresi logistik, melihat asosiasi berstruktur dalam pengelompokan pengamatan menurut peubah respon dengan menggunakan metode CHAID, serta membandingkan hasil klasifikasi antara kedua metode.

Hasil metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi PJK adalah hiperkolesterol, diabetes, Indeks Massa Tubuh (IMT) dan umur. Sedangkan berdasarkan metode CHAID, faktor yang mempunyai asosiasi paling kuat dengan PJK adalah hiperkolesterol. Dari hasil segmentasi CHAID, diketahui bahwa penderita PJK pada umumnya adalah penderita hiperkolesterol dan tergolong gemuk, juga pada penderita hiperkolesterol yang tergolong normal atau kurus dan tidak menderita hipertensi. Penderita PJK yang lain adalah bukan penderita hiperkolesterol namun menderita diabetes dan berjenis kelamin laki-laki. Total kesalahan klasifikasi untuk metode regresi logistik sekitar 32,8% sedangkan metode CHAID sekitar 30,7%.

Kata kunci : regresi logistik, chaid, penyakit jantung koroner, kesalahan klasifikasi

(4)

DR. WAHIDIN SUDIROHUSODO MAKASSAR

ASTRI ATTI

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Program Studi Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2008

(5)

Judul Tesis : Analisis Faktor Risiko Penyakit Jantung Koroner dengan Menggunakan Metode Regresi Logistik dan CHAID : Kasus di RSUP Dr. Wahidin Sudirohusodo Makassar

NAMA : Astri atti

NRP : G151050011

Disetujui Komisi Pembimbing

Ir. Bunawan Sunarlim, M.S Utami Dyah Syafitri, M.Si Ketua Anggota

Diketahui

Ketua Program Studi Statistika Dekan Sekolah Pascasarjana

Dr. Ir. Aji Hamim Wigena, M.Sc Prof. Dr. Ir . Khairil A. Notodiputro, MS

(6)

Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul penelitian ini adalah analisis faktor risiko penyakit jantung koroner dengan menggunakan metode regresi logistik dan CHAID.

Terima kasih penulis ucapkan kepada Bapak Ir. Bunawan Sunarlim, M.S dan Ibu Utami Dyah Syafitri, M.Si selaku pembimbing yang telah banyak memberi masukan. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, kakak dan adik, atas segala doa dan kasih sayangnya. Tidak lupa penulis ucapkan terima kasih kepada teman-teman Program Studi Statistika IPB atas dukungannya selama pembuatan karya ilmiah ini.

Semoga karya ilmiah ini bermanfaat.

Bogor, Mei 2008

(7)

RIWAYAT HIDUP

Penulis dilahirkan di Makassar pada tanggal 1 Mei 1979 dari ayah Haeruddin dan ibu Ramlah. Penulis merupakan putri ke tiga dari lima bersaudara.

Tahun 1998 penulis lulus dari SMA Negeri 16 Makassar, dan pada tahun yang sama lulus seleksi UMPTN. Penulis menyelesaikan program S1 di Program Studi Statistika Jurusan Matematika Fakultas MIPA Universitas Hasanuddin Makassar pada tahun 2002. Penulis terdaftar pada Program Studi Statistika Sekolah Pascasarjana IPB pada tahun 2005. Sejak tahun 2003, penulis bekerja sebagai staf pengajar pada Jurusan Matematika Fakultas Sains dan Teknologi Universitas Nusa Cendana Kupang.

(8)

DAFTAR TABEL viii

I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Tujuan Penelitian ... 2

II TINJAUAN PUSTAKA ... 3

2.1 Penyakit Jantung Koroner ... 3

2.2 Analisis Regresi Logistik ... 4

2.2.1 Pengujian Kesesuaian Model ... 6

2.2.2 Pereduksian Peubah ... 7

2.2.3 Interpretasi Koefisien ... 8

2.2.4 Selang kepercayaan (1-α)100% bagi π(x) ... 9

2.3 Metode CHAID ... 10

2.4 Ketepatan dan Kesalahan Klasifikasi ... 12

III DATA DAN METODE ... 14

3.1 Sumber Data ... 14

3.2 Metode Analisis ... 15

IV HASIL DAN PEMBAHASAN ... 16

4.1 Deskripsi Data ... 16

4.2 Metode Regresi Logistik ... 17

4.2.1 Dugaan Identifikasi Orang-orang yang Berpeluang Terkena PJK ... 21

4.3 Metode CHAID ... 23

4.4 Perbandingan Hasil Klasifikasi Regresi Logistik dan Metode CHAID ... 25

V SIMPULAN ... 26

(9)

DAFTAR TABEL

Halaman

1 Model logistik dengan satu peubah dikotom ... 8

2 Klasifikasi respon ... 13

3 Pengkodean peubah penjelas kategorik ... 14

4 Frekuensi dan persentase responden ... 16

5 Hasil analisis regresi logistik model penuh ... 17

6 Hasil analisis regresi logistik model Backward Elimination tahap I ... 18

7 Hasil analisis regresi logistik model Backward Elimination tahap II ... 19

8 Hasil analisis regresi logistik model Backward Elimination tahap III ... 19

9 Matriks kovarian ... 21

10 Dugaan peluang terkena PJK berdasarkan peubah penjelas nyata ... 22

11 Segmentasi CHAID ... 24

(10)

I. PENDAHULUAN

1.1. Latar Belakang

Menurut Rosnah (1999), salah satu penyakit yang cenderung meningkat di masyarakat modern adalah penyakit jantung koroner (PJK). Penyakit jantung koroner merupakan salah satu penyakit degeneratif yang banyak dipengaruhi oleh gaya hidup suatu masyarakat. Penyakit jantung koroner cukup berbahaya tetapi dapat dicegah dengan upaya–upaya pencegahan mengenai perubahan gaya hidup (Bustan 1997).

Badan Kesehatan Dunia (WHO), mencatat lebih dari 7 juta orang meninggal akibat penyakit jantung koroner di seluruh dunia pada tahun 2002. Angka ini diperkirakan akan meningkat hingga 11 juta orang pada tahun 2020. Badan Kesehatan Dunia memperkirakan bahwa penyakit jantung koroner dan stroke pada tahun 2020 akan menjadi penyebab terbanyak kasus kematian di seluruh dunia, seiring dengan perubahan pola hidup masyarakat (Fitriani 2007).

Pada tahun 2000 kasus penyakit jantung koroner di Rumah Sakit Medistra sebanyak 1173 kasus, tahun 2001 terdapat 1158 kasus, sedangkan tahun 2002 jumlah kasus PJK sebanyak 1213 kasus. Selanjutnya, data penyakit jantung koroner di Rumah Sakit Dr. Wahidin Sudirohusodo tahun 2004 sebanyak 336 kasus, tahun 2005 sebanyak 311 kasus dan tahun 2006 sebanyak 332 kasus (Data morbiditas rekam medik rawat inap dalam Fitriani (2007). Menurut Palilati (2003), berbagai faktor dapat menjadi penyebab penyakit jantung koroner di antaranya hipertensi, hiperkolesterol, diabetes mellitus, merokok, obesitas, kurang olah raga, riwayat keluarga, stres, umur dan bahkan jenis kelamin.

Permasalahan yang kadang dihadapi para peneliti dalam bidang kesehatan maupun dalam bidang penelitian lain yaitu bagaimana seorang peneliti bisa mengungkapkan keterkaitan atau hubungan antara dua kelompok peubah, yaitu peubah respon dengan sekelompok peubah penjelas termasuk untuk data-data kategorik. Penerapan metode analisis statistika banyak digunakan dalam penelitian berbagai disiplin ilmu seperti pertanian, sosial, dan kesehatan/kedokteran. Regresi logistik dan metode CHAID adalah sebagian dari metode analisis statistika yang ada.

(11)

2

Dengan adanya berbagai faktor risiko dalam penelitian suatu kasus maka seringkali peneliti ingin mengetahui faktor-faktor apa saja yang mempengaruhi secara nyata kasus tersebut. Untuk mengungkapkan adanya asosiasi antara peubah respon dan peubah penjelas pada data kategorik, dapat digunakan metode regresi logistik dan metode CHAID.

Ture et al. (2006) melakukan penelitian dengan menggunakan metode regresi logistik dan metode CHAID pada kasus “prestasi akademik” yang menyimpulkan bahwa metode CHAID mempunyai kesalahan klasifikasi (misclassification rate) yang lebih kecil (32,3%) dibandingkan metode regresi logistik (35,71%). Penelitian lain dalam membandingkan metode regresi logistik dan CHAID juga dilakukan oleh Gonzales (2003) untuk kasus “pendengar stasiun radio” dan diketahui bahwa kedua metode yang digunakan menghasilkan nilai kesalahan klasifikasi yang hampir sama yaitu untuk metode regresi logistik sebesar 37,92% sedangkan metode CHAID sekitar 38,23%. Dalam penelitian ini akan digunakan metode regresi logistik dan metode CHAID untuk kasus PJK. 1.2. Tujuan Penelitian

1. Menelusuri faktor risiko yang secara nyata mempengaruhi penyakit jantung koroner dengan menggunakan metode regresi logistik.

2. Melihat asosiasi berstruktur dalam pengelompokan pengamatan menurut peubah respon dengan menggunakan metode CHAID.

3. Membandingkan hasil klasifikasi antara metode regresi logistik dengan metode CHAID.

(12)

II. TINJAUAN PUSTAKA

2.1. Penyakit Jantung Koroner

Menurut Soeharto (2004), penyakit jantung koroner (PJK) adalah suatu kelainan yang disebabkan oleh penyempitan atau penghambatan pembuluh arteri koronaria yang mengalirkan darah ke otot jantung. Segala macam gangguan penyaluran darah melalui pembuluh darah koronaria yang kurang mencukupi kebutuhan otot jantung dapat terjadi secara mendadak atau menahun. Aliran darah koroner tidak cukup memadai menghantarkan oksigen ke otot jantung karena terjadi gangguan keseimbangan antara “oxygen demand” dengan “oxygen

supply”. Adanya gangguan keseimbangan kebutuhan oksigen otot jantung adalah

salah satu akibat utama atherosklerosis. Pada keadaan ini pembuluh darah nadi koroner menyempit karena terjadi endapan-endapan lemak pada dindingnya (Selwyn & Braunwald dalam Palilati 2003). Penyempitan ini terutama disebabkan oleh menempelnya kolesterol dan lemak pada pembuluh darah jantung dan akibatnya menjadi kaku sebagaimana pembuluh darah di daerah-daerah lainnya. Akibat dari penyempitan ini timbul kekurangan zat pembakar dan zat makanan pada jantung. Penyempitan pembuluh darah koroner ini berkaitan dengan usia sehingga bertambahnya usia maka mulailah terjadi perubahan-perubahan pada lapisan pembuluh darah yang berfungsi membawa darah ke jantung.

Menurut Bustan (1997), timbulnya penyakit jantung koroner walaupun nampak mendadak, sebenarnya melalui perlangsungan lama (khronik). Terjadinya penyakit jantung koroner berkaitan dengan suatu gangguan mengenai pembuluh darah yang disebut atherosklerosis. Hal ini berarti menyebabkan gangguan atau kekurangan suplai darah untuk otot jantung. Keadaan ini akan menimbulkan apa yang disebut iskemia miokard atau penyakit jantung koroner.

Penyakit jantung koroner sudah meluas di seluruh dunia bukan saja terjadi pada golongan tua tetapi juga pada golongan umur yang relatif muda. Atherosklerosis tidak timbul secara spontan, melainkan berlangsung sejak masa kanak-kanak. Akan tetapi, proses degeneratif berlangsung secara terus menerus setelah 20-40 tahun dan plak yang semakin besar dapat menginfasi saluran arteri

(13)

4

dan menghambat suplai darah. Akibat dari suplai darah arteri ke arteri koronaria yang terhambat dapat menimbulkan serangan jantung (Soeharto 2004).

Berbagai penelitian mengenai penyakit jantung telah dilakukan. Di antaranya adalah penelitian oleh Djanggan Sargowo di RSUD. Saiful Anwar Malang terhadap 120 pasien yang menyimpulkan bahwa hiperkolesterol bermakna terhadap kejadian PJK yaitu sekitar 42,5%. Fauziah meneliti 100 pasien di RSUP. Dr. Wahidin Sudirohusodo Makassar dan menghasilkan kesimpulan bahwa kolesterol HDL (High Density Lipoprotein) yang rendah dan kurang olahraga berisiko terhadap kejadian PJK sedangkan obesitas tidak berisiko terhadap PJK. Penelitian yang dilakukan oleh Lam Yi dan Khor GL tahun 1997 terhadap 105 pasien penyakit jantung di Institut Jantung Negara Kuala Lumpur Malaysia memberikan hasil bahwa sebagian besar (92,4%) pasien adalah berumur di atas 45 tahun, hiperkolesterol sebanyak 75%, IMT ≥ 25 sebanyak 58,1%, setengah dari jumlah pasien (49,6 %) pernah merokok, kebanyakan dari pasien hanya jalan sebagai aktivitas olahraga dan ada hubungan yang signifikan antara pengetahuan dan sikap terhadap kejadian PJK. Hasil penelitian yang dilakukan oleh Arfah terhadap 136 pasien di RSUD. Samarinda tahun 2003 yaitu pasien yang obesitas berisiko 1,845 kali, hiperkolesterol berisiko 1,064 kali, merokok berisiko 1,064 kali dan kurang olahraga berisiko 2,185 kali terhadap kejadian PJK. Penelitian lain juga dilakukan oleh Herianto di RSUP. Dr.Wahidin Sudirohusodo Makassar pada tahun 2002 yang menghasilkan penelitian bahwa hipertensi, hiperkolesterol dan merokok merupakan faktor risiko terhadap PJK (Fitriani 2007).

2.2. Analisis Regresi Logistik

Analisis regresi logistik adalah analisis yang digunakan untuk melihat hubungan antara peubah respon berupa data kualitatif dengan peubah-peubah penjelas yang berupa data kualitatif maupun data kuantitatif. Peubah respon dalam regresi logistik dapat dalam bentuk dikotom (biner) maupun polikotom (ordinal atau nominal).

Model logistik atau model logit telah digunakan secara luas dalam berbagai analisis statistika terutama di bidang kesehatan. Model analisis ini pertama kali

(14)

digunakan oleh Truett, Cornfield dan Kannel pada tahun 1967 (Hosmer & Lemeshow 2000).

Jika data hasil pengamatan memiliki p peubah penjelas yang ditunjukkan oleh vektor x’= (X1,X2,…,Xp) yang berpasangan dengan peubah respon Y yang

bernilai 1 dan 0, di mana y = 1 menyatakan bahwa respon memiliki kriteria yang ditentukan dan y = 0 tidak memiliki kriteria yang ditentukan, maka peubah respon Y mengikuti sebaran Bernoulli dengan parameter π(x) dengan fungsi sebaran peluang : f (yi) i i yi y i x x −π − π = ( ) [1 ( )]1 (1)

Fungsi regresi logistik antara π(x) dan x adalah :

( )

[

[

]

]

) ( exp 1 ) ( exp x g x g x + = π (2) Fungsi regresi di atas berbentuk curvilinear sehingga untuk membuatnya menjadi fungsi linier dilakukan transformasi logit sebagai berikut (Agresti 1990) :

logit = ⎦ ⎤ ⎢ ⎣ ⎡ π − π = π ) ( 1 ) ( ln )] ( [ x x x g(x) (3) dengan g(x)=β0+β1X1+β2X2+...+βpXp (4)

merupakan logit (Hosmer & Lemeshow 2000). Selanjutnya pendugaan parameter β012,...,βp dilakukan dengan metode

Kemungkinan Maksimum dengan mengasumsikan yi saling bebas, maka :

) 6 ( ) 1 ln( 1 ln y ) 1 ln( ) y 1 ( ln y ) 1 ( ln )] ( ln[ ) ( L ) 5 ( n ,..., 2 , 1 i ; 1 , 0 y , ) 1 ( ) y ( f ) y ,..., y , y ( f ) ( n 1 i i n 1 i i i i n 1 i n 1 i i i i i n 1 i y 1 i y i i n 1 i y 1 i y i n 1 i i n 2 1 i i i i

− = = = = − = − = π − + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ π − π = π − − + π = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ π π = β = β = = π − π = = = β l l

(15)

6

Fungsi L(β) di atas kemudian diturunkan terhadap β0,β1,β2,...,βp. Selanjutnya

solusi dari persamaan diferensial ini bisa diperoleh dengan cara iterasi (Ryan1997).

Setelah diperoleh nilai dugaan βi di mana i = 0, 1,…,p maka dapat diketahui

penduga dari π(x) yaitu

)] ( ˆ exp[ 1 )] ( ˆ exp[ ) ( ˆ x g x g x + = π (7) di mana ĝ(x)=βˆ0+βˆ1X1+...+βˆpXp (8) adalah penduga logit sebagai fungsi linier dari peubah penjelas (Hosmer & Lemeshow 2000). Dengan diperolehnya nilai dugaan parameter maka dapat dilakukan pengujian model.

2.2.1. Pengujian Kesesuaian Model

Pengujian kesesuaian model dilakukan untuk memeriksa peranan peubah penjelas terhadap peubah respon dalam model. Pengujian tersebut dilakukan secara simultan dan secara parsial.

Menurut Hosmer dan Lemeshow (2000), pengujian secara simultan dilakukan dengan menggunakan uji nisbah kemungkinan (likelihood ratio test) yang merupakan pengujian terhadap parameter βi dengan hipotesis sebagai

berikut :

H0 : β1 =…= βp = 0

Hi : ada βi ≠ 0 ; i = 1,…,p

Statistik uji yang digunakan adalah statistik G : ⎦ ⎤ ⎢ ⎣ ⎡ − = 1 0 L L ln 2 G (9) L : likelihood tanpa peubah penjelas 0

L1 : likelihood dengan peubah penjelas

Statistik G akan mengikuti sebaran χ dengan derajat bebas p. Kriteria Keputusan 2

(16)

Sedangkan pengujian parameter βi secara parsial dilakukan dengan uji Wald

dengan cara merasiokan βi dugaan dengan galat baku-nya. Statistik uji W yaitu :

) ˆ ( E Sˆ ˆ W i i i β β = (10) Hipotesis yang akan diuji adalah :

H0 : βi = 0 H1 : βi ≠ 0 ; i = 1,…,p

H0 ditolak jika nilai statistik uji |W| ≥ Zα/2 atau nilai-p ≤ α.

2.2.2. Pereduksian Peubah

Setelah melakukan pengujian, kadang ada peubah penjelas yang tidak nyata sehingga harus dikeluarkan dari model. Analisis regresi logistik bertatar (stepwise

logistic regression) membangun model langkah demi langkah dengan cara

menambah atau menghilangkan peubah-peubah penjelas satu persatu dari model sampai diperoleh peubah-peubah yang berpengaruh nyata terhadap model (Hosmer & Lemeshow 2000).

Stepwise logistic regression terdiri atas metode forward selection dan backward elimination yang merupakan uji secara bertahap terhadap

peubah-peubah yang akan dimasukkan ke dalam model. Kedua metode menggunakan uji Khi-kuadrat sebagai uji signifikansi peubah untuk menentukan peubah-peubah yang masuk atau yang akan hilang dari model.

Pada metode forward selection, model diawali hanya dengan intersep, tidak ada peubah penjelas yang masuk, kemudian peubah penjelas dimasukkan satu persatu ke dalam model dan diuji dengan menggunakan uji Khi-kuadrat. Jika peubah yang diuji tidak signifikan atau tidak nyata pada nilai α yang ditentukan maka peubah tersebut dikeluarkan dari model dan sebaliknya peubah yang nyata akan dimasukkan ke dalam model. Sedangkan pada metode backward elimination prosedur diawali dengan semua peubah penjelas dimasukkan ke dalam model kemudian peubah akan diuji satu persatu. Jika ditemukan peubah yang tidak nyata pada pada nilai α yang ditentukan maka peubah tersebut dikeluarkan dari model dan jika peubah yang diuji nyata maka akan tetap berada dalam model (Gonzales 2003).

(17)

8

2.2.3. Interpretasi Koefisien

Interpretasi koefisien pada model regresi logistik dapat dilakukan dengan melihat nilai rasio oddsnya atau selang kepercayaan untuk rasio odds. Rasio odds adalah ukuran untuk melihat seberapa besar kecenderungan pengaruh peubah-peubah penjelas terhadap peubah-peubah respon (Hosmer & Lemeshow 2000).

Jika suatu peubah penjelas mempunyai tanda koefisien positif, maka nilai rasio odds akan lebih besar dari satu, sebaliknya jika tanda koefisien negatif maka nilai rasio odds-nya akan lebih kecil dari satu. Menurut Hosmer dan Lemeshow (2000) koefisien model logit adalah βi = g(x+1) – g(x) yang menunjukkan

perubahan nilai logit g(x) untuk setiap perubahan satu unit peubah penjelas X yang disebut log odds. Log odds merupakan beda antara dua penduga logit yang dihitung pada dua nilai (misal x = a dan x = b) yang dinotasikan sebagai :

ln[ψ(a,b)] = g(x = a) - g(x = b)

= βi(a - b) (11)

sedangkan penduga rasio odds adalah :

ψ(a,b) = exp[βi(a - b)] (12)

sehingga jika a-b = 1 maka ψ(a,b) = exp(βi). Rasio odds ini dapat diinterpretasikan

sebagai kecenderungan y = 1 pada x = 1 sebesar ψ kali dibandingkan pada x = 0. Untuk model regresi logistik dengan satu peubah penjelas dikotom dapat diilustrasikan seperti pada Tabel 1 :

Tabel 1 Model logistik dengan satu peubah dikotom Peubah Respon Peubah Penjelas x =1 x =0 y =1 ) exp( 1 ) exp( ) 1 ( 1 0 1 0 β β β β π + + + = ) exp( 1 ) exp( ) 0 ( 0 0 β β π + = y = 0 1 (1) 1 exp(1 ) 1 0 β β π + + = − ) exp( 1 1 ) 0 ( 1 0 β π + = − Jumlah 1 1

(18)

Nilai odds antara y =1 dengan y = 0 untuk x = 1 adalah ⎦ ⎤ ⎢ ⎣ ⎡ π − π ) 1 ( 1 ) 1 ( ,

sedangkan untuk x = 0 adalah ⎦ ⎤ ⎢ ⎣ ⎡ π − π ) 0 ( 1 ) 0 (

. Log dari kedua odds tersebut didefinisikan sebagai g(1) dan g(0). Rasio odds (ψ) didefinisikan sebagai rasio dari odds untuk x =1 dengan x = 0 sehingga :

exp( ) )}] 0 ( 1 /{ ) 0 ( [ )}] 1 ( 1 /{ ) 1 ( [ 1 β = π − π π − π = ψ (13) )}] 0 ( 1 /{ ) 0 ( [ )}] 1 ( 1 /{ ) 1 ( [ ln ln π − π π − π = ψ = g(1) – g(0) = β1 = beda logit (14)

Dengan demikian, pada model logistik dengan satu peubah penjelas dikotom, koefisien β1 adalah beda logit, sedangkan exp(β1) adalah nilai rasio odds

(Hosmer & Lemeshow 2000).

Rasio odds memiliki selang kepercayaan (1-α)100% sebagai berikut :

exp[βˆi±Z1α/2SˆE(βˆi)] (15)

2.2.4. Selang kepercayaan (1-α)100% bagi π(x) untuk Regresi Logistik Berganda

Selain menduga selang kepercayaan bagi rasio odds, dapat juga diduga selang kepercayaan (1-α)100% bagi π(x) yaitu sebagai berikut :

)] x ( gˆ [ E Sˆ Z ) x ( gˆ )] x ( gˆ [ E Sˆ Z ) x ( gˆ 2 / 1 2 / 1 e 1 e α − α − ± ± + (16) di mana SˆE

[

gˆ(x)

]

= Vaˆrgˆ(x) (17) Vâr[ĝ(x)] p x Vaˆr(ˆ ) 2x x Coˆv(ˆjk) 0 j p 0 j p 1 j k k j j 2 j β + β β =

∑ ∑

= = =+ (18) atau dalam penulisan matriks Vâr[ĝ(x)] = x’(X’VX)-1x (19)

di mana X = ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ np 2 n 1 n p 2 22 21 p 1 12 11 x x x 1 x x x 1 x x x 1 L M L M M M L L dan V = ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ π − π π − π π − π ) ˆ 1 ( ˆ 0 0 0 0 ) ˆ 1 ( ˆ 0 0 0 ) ˆ 1 ( ˆ n n 2 2 1 1 L M O M L L

(19)

10

2.3. Metode CHAID

Metode CHAID (Chi-square Automatic Interaction Detection) adalah salah

satu tipe dari metode AID (Automatic Interaction Detection), yaitu metode yang

digunakan untuk menganalisis keterkaitan struktural antara peubah dalam segugus data (Fielding 1977). Hasil CHAID adalah pohon keputusan atau dendogram yang didasari oleh uji Khi-kuadrat yang dibangun oleh pemisahan kelompok bagian secara berulang-ulang menjadi dua atau lebih anak cabang. Untuk memperoleh pemisahan terbaik pada semua cabang, pasangan kategori peubah penjelas dapat digabung sampai tidak ada lagi kategori yang tidak nyata. CHAID hanya dapat menganalisis data jika peubah respon dan peubah penjelasnya berskala nominal atau ordinal. Metode CHAID merupakan teknik eksplorasi nonparametrik untuk menganalisis sekumpulan data yang berukuran besar dan cukup efisien untuk menduga peubah penjelas yang paling nyata terhadap peubah respon. (Du Toit et al. 1986). Ada dua tipe peubah penjelas yang dikenal dalam hal ini, yaitu peubah “monotonik” yang nilai-nilainya ordinal dan peubah “bebas” yang nilai-nilainya nominal (Kass 1980).

Kata Chi-square adalah bagian dari kepanjangan CHAID yang mana teknik

pada dasarnya menyangkut pembuatan tabulasi silang secara otomatis dan menghasilkan ukuran asosiasi yang nyata secara statistik. Asosiasi yang paling nyata, digunakan untuk mengontrol susunan dari diagram pohon. Pohon klasifikasi cukup luas penerapannya dalam berbagai bidang di antaranya kedokteran, ilmu komputer, pertanian dan psikologi (Hoare 2004).

Metode CHAID menganalisis suatu gugus data dengan cara memisahkannya menjadi beberapa kelompok secara bertahap (Fielding 1977). Tahap pertama, seluruh data dibagi menjadi beberapa anak gugus berdasarkan salah satu peubah penjelas yang dipilih sedemikian rupa dengan memaksimumkan kriteria tertentu. Masing-masing anak gugus kemudian diperiksa kembali secara terpisah dan dibagi lagi berdasarkan peubah lainnya, dan demikian seterusnya sampai tercapai kriteria tertentu untuk berhenti. Dengan cara ini maka diperoleh kelompok-kelompok pengamatan yang mempunyai ciri respon dan penjelas tertentu sehingga keterkaitan di antara peubah-peubah tersebut menjadi jelas. Metode CHAID menggunakan kriteria khi-kuadrat dalam pengoperasiannya (Kass 1980).

(20)

Proses pemisahan dilakukan secara iteratif dimulai dari peubah penjelas yang mempunyai asosiasi paling kuat dengan peubah respon yang digambarkan

oleh besarnya nilai-p (p-value) berdasarkan uji Khi-kuadrat. Dalam proses ini

akan dilakukan juga penggabungan kategori-kategori dalam satu peubah penjelas yang tidak memiliki asosiasi yang nyata dengan peubah respon. Peubah penjelas kategori yang memenuhi syarat dapat digabung sesuai tipe skala yang ditentukan. Beberapa kategori peubah penjelas berskala nominal dapat digabung. Untuk peubah berskala ordinal, kategori yang dapat digabung adalah yang saling berdekatan (Magidson & Vermunt 2006).

Algoritma asli CHAID telah diperkenalkan oleh Kass (1980) untuk peubah respon nominal. Namun CHAID telah diperluas untuk peubah respon ordinal (Magidson dalam Magidson &Vermunt 2006). Untuk lebih jelasnya tahapan-tahapan dalam metode CHAID dijelaskan pada algoritma berikut:

Tahapan analisis metode CHAID adalah sebagai berikut (Kass 1980) :

1. Untuk setiap peubah penjelas, dibuat tabulasi silang antara

kategori-kategori peubah penjelas dengan kategori-kategori-kategori-kategori peubah respon.

2. Dari setiap tabulasi silang yang diperoleh, susun sub tabel berukuran 2xd

yang mungkin, d adalah banyaknya kategori peubah respon. Dari tabel tersebut cari pasangan kategori peubah penjelas yang memiliki angka uji paling kecil. Jika tidak nyata, gabungkan kedua kategori ini menjadi satu kategori campuran. Jika banyaknya kategori hanya dua dan hasil ujinya tidak nyata maka variabel tersebut tidak perlu dilibatkan lagi dalam model. Ulangi tahap ini sehingga angka uji terkecil sub tabel 2xd pasangan kategori (kategori campuran) peubah penjelas melampaui nilai kritis.

3. Untuk setiap kategori campuran yang berisi tiga atau lebih kategori asal,

cari pemisahan biner yang memiliki angka uji paling besar. Jika ada buatlah pemisahan tersebut dan kembali ke tahap 2.

4. Hitung taraf nyata untuk masing-masing tabulasi silang yang baru dan

perhatikan di antaranya yang memiliki angka uji paling besar, sebut sebagai tabulasi dengan taraf nyata terbaik. Jika angka ini lebih besar dari nilai kritis, bagilah data menurut kategori tersebut.

(21)

12

5. Kembali ke tahap-1 untuk melakukan pembagian berdasarkan peubah

yang belum terpilih.

Angka uji dan nilai kritis yang dimaksudkan pada tahap analisis di atas adalah statistik dan kriteria uji Khi-kuadrat apabila tidak terjadi pengurangan tabel kontingensi dari tabel asal. Apabila terjadi pengurangan dari tabel kontingensi asal, yaitu dari c kategori peubah penjelas menjadi r kategori (r<c), maka nilai kritis tersebut dikalikan dengan nilai pengganda Bonferroni (B) sesuai dengan tipe peubahnya:

1. Peubah monotonik yaitu bila kategori berskala ordinal Bmonotonik = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − 1 r 1 c

2. Peubah bebas yaitu bila kategori berskala nominal Bbebas =

− = − − − 1 r 0 i c i )! i r ( !i ) i r ( ) 1 (

2.4. Ketepatan dan Kesalahan Klasifikasi

Menurut Hosmer dan Lemeshow (2000) salah satu ukuran kebaikan model dalam regresi logistik adalah jika memiliki peluang salah klasifikasi yang minimal. Ketepatan dan kesalahan klasifikasi dari model dapat diketahui dengan

mengunakan tabel klasifikasi (classification table). Tabel klasifikasi untuk peubah

respon dikotom terdiri atas dua kolom nilai dugaan dan dua baris nilai amatan.

Untuk memperoleh ketepatan klasifikasi (correct classification) terhadap amatan

harus menentukan nilai cutpoint (c) dan dibandingkan dengan peluang dugaan

π(x). Jika π(x) lebih besar atau sama dengan c maka nilai dugaan termasuk pada

respon y = 1 dan selain itu y = 0.

Seperti halnya pada metode regresi logistik, pada metode CHAID ketepatan dan kesalahan klasifikasi juga dapat diketahui dari tabel klasifikasi. Cabang

(node) yang digunakan dalam pengklasifikasian respon adalah cabang-cabang

yang mengakhiri pengelompokan atau cabang-cabang terakhir. Jika respon berada

pada cabang yang mempunyai peluang dugaan lebih besar atau sama dengan

(22)

sebaliknya maka respon termasuk kriteria yang tidak ditentukan. Nilai c yang biasa digunakan adalah 0,5.

Ketepatan klasifikasi (correct classification) terbagi atas dua yaitu

specificity dan sensitivity. Specificity atau ketepatan klasifikasi dalam menduga

kejadian bahwa respon tidak memiliki kriteria yang ditentukan (y = 0) dinyatakan

sebagai (d/n0.)100%, persentase dari dugaan terkoreksi atau nilai dugaan yang

sama dengan nilai amatan pada kategori nilai amatan y = 0. Pengertian yang sama juga berlaku untuk mengevaluasi ketepatan klasifikasi dalam menduga kejadian

bahwa respon memiliki kriteria yang ditentukan (y = 1) atau disebut juga

sensitivity (a/n1.)100%, sedangkan total correct classification yaitu ketepatan

klasifikasi dalam menduga kejadian secara keseluruhan yang dinyatakan sebagai persentase nilai amatan yang secara tepat dapat diduga oleh model ((a+d)/n)100%. Selain ketepatan klasifikasi dapat pula diketahui besarnya kesalahan

klasifikasi (misclassification rate). Kesalahan klasifikasi dalam menduga kejadian

respon terdiri atas kesalahan positif dan kesalahan negatif. Kesalahan positif

(c/n.1)100% dinyatakan sebagai persentase besarnya kesalahan ketika respon

diduga memiliki kriteria yang ditentukan (y = 1) tapi amatan sebenarnya bernilai

y = 0 dan sebaliknya kesalahan negatif (b/n.0)100% dinyatakan sebagai persentase

besarnya kesalahan ketika respon diduga tidak memiliki kriteria yang ditentukan

(y = 0) namun amatan sebenarnya bernilai y = 1. Total misclassification rate

diartikan sebagai besarnya kesalahan klasifikasi terhadap keseluruhan kejadian yang dapat diperoleh dengan cara merasiokan total klasifikasi yang tidak terkoreksi dengan jumlah keseluruhan data yaitu ((b+c)/n)100%.

Tabel 2 Klasifikasi respon

Amatan Dugaan Total Ketepatan

1 0

1 a b (a + b) = n1. a/n1.

0 c d (c + d) = n0. d/n0.

Total (a + c) = n.1 (b + d) = n.0 (a + b + c + d) = n (a + d)/n

(23)

14

III. DATA DAN METODE

3.1. Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder dari hasil penelitian yang dilakukan di Rumah Sakit Umum Dr. Wahidin Sudirohusodo Makassar tahun 2004-2007 oleh Kamar (2004) dan Fitriani (2007) terhadap semua pasien yang dirawat di Rumah Sakit Umum Pusat Dr. Wahidin Sudirohusodo yang datang berobat ke poliklinik penyakit dalam yang dinyatakan menderita penyakit jantung koroner (PJK) dan yang tidak menderita PJK dengan jumlah pasien sebanyak 827 orang. Peubah respon yang diamati adalah pasien yang menderita penyakit jantung koroner (y = 1) dan yang tidak (y = 0) menurut kartu rekam medik pasien.

Peubah-peubah penjelasnya adalah :

Tabel 3 Pengkodean peubah penjelas kategorik

Peubah penjelas Kategori D1 D2 D3 D4 Pembanding

Hipertensi Ya Tidak 1 0 9 Hiperkolesterol Ya Tidak 1 0 9 Diabetes Ya Tidak 1 0 9

IMT (Indeks Massa Tubuh) Kurus Normal Gemuk 1 0 0 0 0 1 9 Umur < 40 40-49 50-59 60-69 > 69 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 9

Jenis kelamin Laki-laki

Perempuan 1 0 9 Keterangan : D : Peubah dummy 9 : Sebagai pembanding

(24)

3.2. Metode Analisis

Melakukan analisis dengan menggunakan regresi logistik terhadap semua peubah yang ada

Mengumpulkan dan menyeleksi/screening data. Dari data yang diperoleh dilakukan pemeriksaan. Jika terdapat data yang tidak lengkap maka observasi tersebut tidak digunakan dalam pemodelan.

Eksplorasi/deskripsi data. Dibuat tabulasi silang dengan cara menyajikan frekuensi dan persentase responden untuk setiap peubah penjelas yang diamati

Membandingkan hasil klasifikasi antara metode regresi logistik dengan metode CHAID

Selesai Mulai

Melakukan analisis klasifikasi dengan menggunakan metode CHAID pada semua peubah yang ada

Interpretasi hasil Interpretasi hasil

Menentukan nilai klasifikasi Menentukan nilai klasifikasi

Pengolahan data untuk regresi logistik menggunakan program SAS 9.0, sedangkan untuk metode CHAID menggunakan program SPSS versi 15.

(25)

16

IV. HASIL DAN PEMBAHASAN

4.1. Deskripsi Data

Tabel 4 Frekuensi dan persentase responden PEUBAH

Penyakit Jantung

Koroner(PJK) Jumlah Persentase

Ya (1) Tidak (0) Respon 430 397 827 100,00 Hipertensi Ya Tidak 174 256 164 233 338 489 40,87 59,13 Hiperkolesterol Ya Tidak 327 103 161 236 488 339 59,01 40,99 Diabetes Ya Tidak 139 291 104 293 243 584 29,38 70,62 Indeks Massa Kurus

Tubuh (IMT) Normal Gemuk 5 105 320 9 164 224 14 269 544 1,69 32,53 65,78 Umur <40 40-49 50-59 60-69 >69 21 103 154 113 39 54 92 117 100 34 75 195 271 213 73 9,07 23,58 32,77 25,75 8,83 Jenis Kelamin Laki-laki

Perempuan 203 227 211 186 414 413 50,06 49,94

Dari 827 responden (Tabel 4) menunjukkan bahwa terdapat 430 responden penderita PJK atau sekitar 52%, sedangkan yang bukan penderita PJK sekitar 397 (48%) responden. Penderita hipertensi lebih sedikit (40,87%) dibanding yang tidak menderita hipertensi (59,13%), sebaliknya penderita hiperkolesterol lebih banyak (59,01%) dibandingkan yang tidak hiperkolesterol (40,99%). Sebagian besar responden tidak menderita diabetes yaitu sekitar 70,62%. Persentase terbesar pertama untuk peubah IMT adalah kategori gemuk yaitu sekitar 65,78%, persentase terbesar kedua adalah normal (32,53%) dan hanya 1,69% yang tergolong kurus. Dari sisi umur, sebagian besar responden berumur sekitar 40-69

(26)

tahun, sedangkan yang berumur <40 tahun dan >69 tahun masing-masing hanya sekitar 9,07% dan 8,83%. Berdasarkan jenis kelamin, frekuensi antara laki-laki dan perempuan relatif seimbang.

4.2. Metode Regresi Logistik

Model yang dihasilkan dengan melibatkan semua peubah penjelas dapat dilihat pada Tabel 5. Secara umum nilai dugaan parameternya bernilai positif, hanya peubah hipertensi, IMT(kurus) dan jenis kelamin yang bernilai negatif. Pengujian secara simultan menunjukkan bahwa model nyata pada α = 5%. Hal ini dapat dilihat dari statistik-G sebesar 147,400 dengan nilai-p sebesar 0,000.

Berdasarkan uji Wald terlihat bahwa peubah hipertensi, IMT(kurus) dan jenis kelamin tidak nyata pada model sehingga akan dilakukan pereduksian terhadap peubah-peubah tersebut. Pereduksian model dilakukan dengan membuang peubah yang mempunyai nilai-p terbesar secara bertahap berdasarkan

prosedur backward elimination sampai diperoleh model reduksi terbaik.

Tabel 5 Hasil analisis regresi logistik model penuh Peubah

Penjelas βi SE Wald Nilai-p Rasio Odds SK 95% untuk Rasio Odds

Intersep -2,091 0,330 -6,336 0,000 0,000 - - Hipertensi -0,163 0,159 -1,025 0,306 0,850 0,623 1,160 Hiperkolesterol 1,380 0,159 8,679 0,000* 3,975 2,910 5,430 Diabetes 0,461 0,171 2,696 0,007* 1,586 1,134 2,216 IMT(Gemuk) 0,780 0,168 4,643 0,000* 2,182 1,570 3,033 IMT(Kurus) -0,014 0,604 -0,023 0,982 0,986 0,302 3,219 Umur(>69) 1,101 0,387 2,845 0,004* 3,007 1,409 6,416 Umur(60-69) 0,953 0,325 2,932 0,003* 2,593 1,371 4,905 Umur(50-59) 0,995 0,315 3,159 0,002* 2,703 1,457 5,016 Umur(40-49) 0,897 0,322 2,786 0,005* 2,453 1,305 4,611 Jenis Kelamin -0,222 0,154 -1,442 0,150 0,801 0,593 1,084

Statistik-G = 147,400 * Nyata pada α = 5% Nilai-p = 0,000

(27)

18

Berdasarkan Tabel 5 diperoleh tiga tahap pereduksian yaitu tahap pertama dengan menghilangkan IMT(kurus) yang mempunyai nilai-p terbesar, tahap kedua dengan menghilangkan peubah hipertensi dan tahap ketiga dengan menghilangkan peubah jenis kelamin. Tahap ketiga adalah tahap terakhir yang merupakan model terbaik yang diperoleh dari hasil pereduksian. Tahapan pereduksian dapat dilihat pada Tabel 6, Tabel 7 dan Tabel 8.

Tabel 6 Hasil analisis regresi logistik model Backward Elimination tahap I Peubah

Penjelas βi SE Wald Nilai-p Rasio Odds SK 95% untuk Rasio Odds

Intersep -2,092 0,328 -6,378 0,000 0,000 - - Hipertensi -0,163 0,159 -1,025 0,305 0,850 0,623 1,160 Hiperkolesterol 1,380 0,159 8,679 0,000* 3,975 2,910 5,430 Diabetes 0,461 0,171 2,696 0,007* 1,586 1,135 2,216 IMT(Gemuk) 0,781 0,165 4,733 0,000* 2,184 1,580 3,019 Umur(>69) 1,101 0,386 2,852 0,004* 3,008 1,410 6,416 Umur(60-69) 0,953 0,325 2,932 0,003* 2,593 1,371 4,903 Umur(50-59) 0,995 0,315 3,159 0,002* 2,703 1,457 5,016 Umur(40-49) 0,897 0,322 2,786 0,005* 2,453 1,305 4,611 Jenis Kelamin -0,222 0,154 -1,442 0,150 0,801 0,593 1,083

Statistik-G = 147,400 * Nyata pada α = 5% Nilai-p = 0,000

(28)

Tabel 7Hasil analisis regresi logistik model Backward Elimination tahap II Peubah

Penjelas βi SE Wald Nilai-p

Rasio Odds SK 95% untuk Rasio Odds Intersep -2,118 0,328 -6,457 0,000 0,000 - - Hiperkolesterol 1,378 0,159 8,667 0,000* 3,965 2,904 5,414 Diabetes 0,450 0,170 2,647 0,008* 1,567 1,123 2,189 IMT(Gemuk) 0,783 0,165 4,745 0,000* 2,188 1,583 3,024 Umur(>69) 1,057 0,384 2,753 0,006* 2,877 1,356 6,100 Umur(60-69) 0,900 0,321 2,804 0,005* 2,460 1,312 4,613 Umur(50-59) 0,960 0,313 3,067 0,002* 2,611 1,413 4,825 Umur(40-49) 0,874 0,321 2,723 0,007* 2,396 1,277 4,493 Jenis Kelamin -0,228 0,154 -1,481 0,138 0,796 0,589 1,076

Statistik-G = 146,345 * Nyata pada α = 5% Nilai-p = 0,000

Tabel 8Hasil analisis regresi logistik model Backward Elimination tahap III

Peubah Penjelas βi SE Wald Nilai-p Rasio Odds SK 95% untuk Rasio Odds

Intersep -2,203 0,323 -6,820 0,000 0,000 - - Hiperkolesterol 1,392 0,158 8,755 0,000* 4,024 2,949 5,490 Diabetes 0,435 0,170 2,559 0,011* 1,544 1,106 2,156 IMT(Gemuk) 0,781 0,165 4,733 0,000* 2,183 1,580 3,017 Umur(>69) 1,023 0,382 2,678 0,007* 2,782 1,315 5,885 Umur(60-69) 0,860 0,319 2,696 0,007* 2,364 1,265 4,418 Umur(50-59) 0,929 0,312 2,978 0,003* 2,531 1,373 4,666 Umur(40-49) 0,839 0,319 2,630 0,009* 2,314 1,238 4,327

Statistik-G = 144,142 * Nyata pada α = 5% Nilai-p = 0,000

(29)

20

Model reduksi (Tabel 8) yang diperoleh dengan menghilangkan peubah IMT(kurus), hipertensi dan jenis kelamin dari model penuh menghasilkan statistik-G sebesar 144,142 dengan nilai-p sebesar 0,000 yang berarti secara simultan menunjukkan bahwa model nyata pada α = 5%. Hasil pengujian secara parsial yaitu berdasarkan uji Wald menunjukkan bahwa peubah penyakit jantung koroner (PJK) dipengaruhi oleh faktor hiperkolesterol, diabetes, IMT, Umur pada α = 5%.

Pada model reduksi, semua peubah penjelas yang masuk dalam model mempunyai nilai dugaan parameter yang positif. Dengan demikian semua peubah penjelas jika dibandingkan dengan pembandingnya masing-masing akan menaikkan risiko menderita PJK. Berdasarkan nilai selang kepercayaan 95% bagi rasio odds menunjukkan bahwa penderita hiperkolesterol dibandingkan yang tidak hiperkolesterol berisiko paling rendah 2,949 kali dan paling tinggi 5,49 kali untuk menderita PJK. Penderita diabetes berisiko antara 1,106 kali sampai 2,156 kali untuk menderita PJK dibandingkan yang bukan penderita diabetes. Untuk pasien yang tergolong gemuk, risiko terkena PJK dibandingkan yang tidak gemuk sebesar 1,58 kali sampai 3,017 kali. Pasien yang berumur >69 tahun berisiko antara 1,315 kali sampai 5,885 kali untuk terkena PJK, sedangkan yang berumur 60-69 tahun berisiko antara 1,265 kali sampai 4,418 kali. Untuk umur 50-59 tahun berisiko paling rendah 1,373 kali dan paling tinggi 4,666 kali, dan pasien yang berumur 40-49 tahun berisiko antara 1,238 kali sampai 4,327 kali untuk menderita PJK. Semua kategori umur dibandingkan dengan umur <40 tahun.

(30)

4.2.1. Dugaan Identifikasi Orang-orang yang Berpeluang Terkena PJK Untuk menduga peluang orang-orang akan terkena PJK diperlukan matriks kovarian dugaan seperti yang ditunjukkan dalam Tabel 9. Setelah dianalisis dengan menggunakan persamaan (8), persamaan (16), persamaan (17) dan persamaan (18) maka diperoleh nilai selang kepercayaan (SK) 95% bagi π(x) yang merupakan nilai dugaan peluang terkena PJK. Pada Tabel 10 terdapat 40 kombinasi kategori penderita PJK berdasarkan peubah penjelas yang nyata. Berdasarkan kasus yang terjadi di RSUP Dr. Wahidin Sudirohusodo Makassar dapat diduga bahwa seseorang yang menderita hiperkolesterol, diabetes, berbadan gemuk dan berusia di atas 69 tahun berpeluang menderita PJK sebesar 69,64% sampai 88,35%, sedangkan yang tidak menderita hiperkolesterol dan tidak diabetes dengan berat badan yang tergolong kurus atau normal dan mempunyai umur di bawah 40 tahun akan berpeluang sangat kecil untuk menderita PJK yaitu antara 5,54% sampai 17,22%. Untuk kombinasi kategori yang lain dapat dilihat pada Tabel 10.

Tabel 9 Matriks kovarian

Parameter Intercept Kol Dbts IMT1 Um1 Um2 Um3 Um4

Intercept 0.1043 -0.0086 -0.0107 -0.0250 -0.0831 -0.0801 -0.0794 -0.0792 Kol -0.0086 0.0251 0.0023 -0.0020 -0.0050 -0.0061 -0.0075 -0.0058 Dbts -0.0107 0.0023 0.0289 0.0031 -0.0011 -0.0024 -0.0016 0.0003 IMT1 -0.0250 -0.0020 0.0031 0.0272 0.0108 0.0084 0.0080 0.0065 Um1 -0.0831 -0.0050 -0.0011 0.0108 0.1461 0.0798 0.0799 0.0789 Um2 -0.0801 -0.0061 -0.0024 0.0084 0.0798 0.1018 0.0796 0.0786 Um3 -0.0794 -0.0075 -0.0016 0.0080 0.0799 0.0796 0.0974 0.0788 Um4 -0.0792 -0.0058 0.0003 0.0065 0.0789 0.0786 0.0788 0.1020 Keterangan : Kol : Hiperkolesterol Dbts : Diabetes IMT1: Gemuk Um1 : >69 tahun Um2 : 60-69 tahun Um3 : 50-59 tahun Um4 : 40-49 tahun

(31)

22

Tabel 10 Dugaan peluang terkena PJK berdasarkan peubah penjelas nyata

No Hiperkolesterol Diabetes IMT Umur πˆ(x)

SK 95% bagi π(x) Batas Bawah Batas Atas 1 Ya Tidak Gemuk 60-69 0,6964 0,6183 0,7646

2 Ya Tidak Tidak gemuk 60-69 0,5122 0,4133 0,6103

3 Ya Tidak Tidak gemuk 40-49 0,5070 0,4051 0,6083

4 Ya Tidak Gemuk 50-59 0,7107 0,6432 0,7701

5 Ya Tidak Gemuk >69 0,7297 0,6105 0,8230

6 Ya Tidak Tidak gemuk 50-59 0,5295 0,4372 0,6197

7 Ya Tidak Gemuk 40-49 0,6919 0,6146 0,7598

8 Ya Ya Gemuk 40-49 0,7763 0,6917 0,8429

9 Ya Tidak Tidak gemuk >69 0,5528 0,4134 0,6843

10 Ya Ya Gemuk 60-69 0,7799 0,7004 0,8430 11 Ya Tidak Gemuk <40 0,4925 0,3536 0,6325 12 Ya Ya Gemuk >69 0,8066 0,6964 0,8835 13 Ya Ya Gemuk 50-59 0,7915 0,7195 0,8489 14 Ya Ya Tidak gemuk >69 0,6563 0,5130 0,7759 15 Ya Ya Tidak gemuk 60-69 0,6187 0,5126 0,7145 16 Ya Ya Tidak gemuk 50-59 0,6348 0,5347 0,7245 17 Ya Ya Tidak gemuk 40-49 0,6137 0,4987 0,7174 18 Ya Ya Tidak gemuk <40 0,4071 0,2559 0,5782 19 Ya Ya Gemuk <40 0,5999 0,4436 0,7382

20 Ya Tidak Tidak gemuk <40 0,3077 0,1873 0,4615

21 Tidak Tidak Gemuk 40-49 0,3582 0,2758 0,4500

22 Tidak Tidak Gemuk 50-59 0,3792 0,2962 0,4699

23 Tidak Tidak Gemuk <40 0,1943 0,1211 0,2968

24 Tidak Tidak Tidak gemuk <40 0,0995 0,0554 0,1722

25 Tidak Tidak Gemuk 60-69 0,3631 0,2783 0,4574

26 Tidak Tidak Tidak gemuk >69 0,2351 0,1482 0,3518

27 Tidak Tidak Tidak gemuk 50-59 0,2186 0,1572 0,2956

28 Tidak Tidak Tidak gemuk 40-49 0,2036 0,1428 0,2818

29 Tidak Ya Gemuk >69 0,5090 0,3620 0,6544

30 Tidak Ya Gemuk 60-69 0,4683 0,3636 0,5758

31 Tidak Ya Gemuk 50-59 0,4855 0,3821 0,5902

32 Tidak Ya Gemuk 40-49 0,4631 0,3551 0,5747

33 Tidak Ya Gemuk <40 0,2715 0,1691 0,4056

34 Tidak Ya Tidak gemuk >69 0,3219 0,2089 0,4605

35 Tidak Ya Tidak gemuk 60-69 0,2874 0,2075 0,3833

36 Tidak Ya Tidak gemuk 50-59 0,3017 0,2202 0,3981

37 Tidak Ya Tidak gemuk 40-49 0,2831 0,1989 0,3859

38 Tidak Ya Tidak gemuk <40 0,1458 0,0814 0,2474

39 Tidak Tidak Gemuk >69 0,4016 0,2761 0,5413

(32)

Node 0 Category % n 48 .0 397 Tidak 52 .0 430 Ya Total 100 .0 827 Hiperkolesterol Adj. P-value=0.000,

Chi-square=107.502, df=1 PJK Node 1 Category % n 33 .0 161 Tidak 67 .0 327 Ya Total 59 .0 488 IMT

Adj. P-value=0.001, Chi-square=12. 551, df=1 Ya Node 2 Category % n 69 .6 236 Tidak 30 .4 103 Ya Total 41 .0 339 Diabetes Adj. P-value=0.004, Chi-square=8.

524, df=1 Tidak Node 3 Category % n 45 .2 61 Tidak 54 .8 74 Ya Total 16 .3 135 Hipertensi Adj. P-value=0.008, Chi-square=7.

141, df=1 Normal; Kurus Node 4 Category % n 28 .3 100 Tidak 71 .7 253 Ya Total 42 .7 353 Gemuk Node 5 Category % n 58 .7 61 Tidak 41 .3 43 Ya Total 12 .6 104 JenisKelamin Adj. P-value=0.043, Chi-square=4.

105, df=1 Ya Node 6 Category % n 74 .5 175 Tidak 25 .5 60 Ya Total 28 .4 235 Tidak Node 7 Category % n 56 .7 38 Tidak 43 .3 29 Ya Total 8.1 67 Ya Node 8 Category % n 33 .8 23 Tidak 66 .2 45 Ya Total 8.2 68 Tidak Node 9 Category % n 68 .6 35 Tidak 31 .4 16 Ya Total 6.2 51 Perempuan Node 10 Category % n 49 .1 26 Tidak 50 .9 27 Ya Total 6.4 53 Laki-laki Tidak Ya 4.3. Metode CHAID

Gambar 1 Dendogram CHAID status PJK

Dendogram hasil pemisahan analisis CHAID dapat dilihat pada Gambar 1 dengan nilai α yang digunakan sebesar 5%. Pada tahap pertama pemisahan CHAID, peubah yang mempunyai asosiasi paling kuat dengan PJK adalah peubah hiperkolesterol. Dari 827 responden sekitar 59% merupakan kelompok penderita

(33)

24

hiperkolesterol dan 67% di antaranya adalah penderita PJK. Sedangkan pada pasien yang tidak hiperkolesterol, hanya 30,4% yang menderita PJK.

Pada penderita hiperkolesterol, peubah IMT berasosiasi dengan PJK. Dari keseluruhan penderita hiperkolesterol, 72,3% termasuk kategori gemuk dan sisanya tergolong normal atau kurus. Pada penderita hiperkolesterol yang gemuk, sekitar 71,7% merupakan penderita PJK, sedangkan pada penderita hiperkolesterol dengan berat badan normal atau kurus, penderita PJK sekitar 54,8%.

Selanjutnya pada penderita hiperkolesterol dengan IMT yang tergolong

normal atau kurus, peubah yang mempunyai asosiasi dengan PJK adalah hipertensi. Sekitar 43,3% dari total penderita hipertensi adalah penderita PJK sedangkan penderita PJK pada pasien yang tidak hipertensi sekitar 66,2%.

Pada pasien yang tidak menderita hiperkolesterol, peubah yang berasosiasi dengan PJK adalah diabetes. Pada penderita diabetes, sekitar 41,3% adalah penderita PJK sedangkan pada pasien yang tidak diabetes hanya sekitar 25,5%.

Pada pasien yang bukan penderita hiperkolesterol namun menderita diabetes, jenis kelamin berasosiasi dengan PJK. Penderita PJK pada pasien yang diabetes dan berjenis kelamin perempuan adalah sekitar 31,4% sedangkan yang berjenis kelamin laki-laki sekitar 50,9%. Ringkasan dendogram CHAID dapat dilihat pada Tabel 11.

Tabel 11 Segmentasi CHAID

Penderita PJK Bukan penderita PJK

• Hiperkolesterol, gemuk (Node 4)

• Hiperkolesterol, normal atau

kurus, tidak hipertensi (Node 8)

• Tidak hiperkolesterol, diabetes,

laki-laki (Node 10)

• Hiperkolesterol, normal atau kurus,

hipertensi (Node 7)

• Tidak hiperkolesterol, diabetes,

perempuan (Node 9)

• Tidak hiperkolesterol, tidak diabetes

(34)

4.4. Perbandingan Hasil Klasifikasi Regresi Logistik dan Metode CHAID Tabel 12 Klasifikasi metode regresi logistik dan CHAID

Amatan (PJK) Dugaan Total (%) Correct

classification Ya Tidak Logistik Ya 321 109 430 74,7 Tidak 162 235 397 59,2 Total 483 344 827 67,2 (%) Misclassification rate 33,5 31,7 32,8 CHAID Ya 325 105 430 75,6 Tidak 149 248 397 62,5 Total 474 353 827 69,3 (%) Misclassification rate 31,4 29,7 30,7

Tabel 12 menunjukkan bahwa dengan menggunakan nilai cutpoint sebesar

0,5 maka berdasarkan metode regresi logistik diperoleh nilai sensitivity sebesar

74,7% dan nilai specificity sebesar 59,2% dengan nilai kesalahan positif dan

kesalahan negatif masing-masing sebesar 33,5% dan 31,7%. Sedangkan nilai total

correct classification adalah sebesar 67,2%.

Pada metode CHAID, nilai sensitivity dan specificity masing-masing

sebesar 75,6% dan 62,5% dengan nilai total correct classification sebesar 69,3%,

sedangkan nilai kesalahan positif sebesar 31,4% dan nilai kesalahan negatifnya

sebesar 29,7%. Total misclassification rate untuk metode regresi logistik sebesar

(35)

26

V. SIMPULAN

Hasil yang diperoleh dari metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi seseorang menderita PJK adalah hiperkolesterol, diabetes, IMT dan umur. Berdasarkan nilai rasio odds, diketahui bahwa penderita hiperkolesterol lebih berisiko terkena PJK dibandingkan yang tidak hiperkolesterol, begitu pula pada penderita diabetes dibandingkan yang tidak diabetes. Pasien yang mempunyai IMT gemuk lebih berisiko terkena PJK dibandingkan yang tidak gemuk, dan pasien yang umurnya >=40 tahun juga lebih berisiko terkena PJK dibandingkan yang berumur <40.

Dendogram CHAID menunjukkan bahwa peubah yang mempunyai asosiasi paling kuat dengan PJK adalah peubah hiperkolesterol. Berdasarkan hasil segmentasi CHAID, penderita PJK adalah penderita hiperkolesterol yang tergolong gemuk, juga pada penderita hiperkolesterol yang tergolong normal atau kurus dan tidak menderita hipertensi. Penderita PJK yang lain adalah bukan penderita hiperkolesterol namun menderita diabetes dan berjenis kelamin laki-laki

Pada dasarnya, proses metode regresi logistik berbeda dengan metode CHAID. Pada regresi logistik, proses analisis dari akhir sampai awal melibatakan populasi. Sedangkan pada metode CHAID, proses awal yang melibatkan populasi, secara bertahap akan membentuk segmen-segmen sehingga proses sampai analisis akhir akan dilakukan menurut besarnya sampel berdasarkan segmen yang ada. Dengan adanya perbedaan proses antara metode regresi logistik dengan metode CHAID maka dalam penentuan nilai kesalahan dan ketepatan klasifikasi antara

kedua metode juga berbeda. Berdasarkan metode regresi logistik, nilai sensitivity

sebesar 74,7% dan nilai specificity sebesar 59,2% dengan nilai kesalahan positif

dan kesalahan negatif masing-masing sebesar 33,5% dan 31,7%. Sedangkan pada

metode CHAID nilai sensitivity dan specificity masing-masing sebesar 75,6% dan

62,5% dengan nilai kesalahan positif sebesar 31,4% dan nilai kesalahan

negatifnya sebesar 29,7%. Pada metode regresi logistik, nilai total correct

classification adalah sebesar 67,2%, sedangkan pada metode CHAID sebesar

69,3% sehingga dapat diketahui bahwa total misclassification rate untuk metode

(36)

DAFTAR PUSTAKA

Agresti A. 1990. Categorical Data Analysis. New York: John Wiley & Sons.

Bustan MN. 1997. Epidemologi Penyakit Tidak Menular. Jakarta: Rineka Cipta.

Du Toit SHC, Steyn AGW, Steyn RH, Stumph RH. 1986. Graphical Exploratory

Data Analysis. New York: Springer-Verlag.

Fielding A. 1977. Binary Segmentation: The Automatic Interaction Detector and

Related Tecnique for Exploring Data Structure (dalam O’Muircheartaigh,

C. A., dan C. Payne. 1977. The Analysis of Survey Data Vol. I. Exploring

Data Structure). London, New York, Sidney, Toronto: John Wiley &

Sons.

Fitriani. 2007. Analisis Faktor Risiko Kejadian Penyakit Jantung Koroner di

Rumah Sakit Dr.Wahidin Sudirohusodo Makassar. [Tesis]. Makassar:

Program Pascasarjana, UNHAS.

Gonzales MP. 2003. A Model for Profiling Radio Station Listeners using Logistic

Regression, CART and CHAID for a given data set. University of the

Philippines.

Hoare R Dr. 2004. Using CHAID for Classification Problems. Wellington: Paper

presented at the New Zealand Statistical Assosiation 2004 Confrence.

Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. New York: John

Wiley & Sons.

Kamar N. 2004. Beberapa Faktor yang Berhubungan dengan Penyakit Jantung

Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo

Makassar. [Skripsi]. Makassar: Program Sarjana, UNHAS.

Kass GV. 1980. An Exploratory Technique for Investigating Large Quantities of

Categorical Data. App. Statist 29(2):119-127.

Magidson J, Vermunt JK. 2006. An Extension of CHAID Tree-based

Segmentation Algoritma to Multiple Dependent Variables. Departement of

(37)

28

Palilati H. 2003. Beberapa Faktor Risiko Penyakit Jantung Koroner pada Pasien

Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar. [Skripsi].

Makassar: Program Sarjana, UNHAS.

Rosnah. 1999. Tinjauan Kebiasaan Hidup Sehari-hari Sebelum Penderita

Dirawat di RSUP Dr. Wahidin Sudirohusodo Makassar. [Skripsi]:

Program Sarjana, UNHAS.

Ryan T P. 1997. Modern Regression Method. New York: John Wiley & Sons.

Soeharto I. 2004. Pencegahan dan Penyembuhan Penyakit Jatung Koroner.

Jakarta: PT. Gramedia Pustaka Utama.

Ture M, Akturk Z, Kurt I, Dagdeviren N. 2006. The effect of Health Status,

Nutrition and Some Other Factors on Low School Performance Using

Gambar

Tabel 3 Pengkodean peubah penjelas kategorik
Tabel 4 Frekuensi dan persentase responden
Tabel 5 Hasil analisis regresi logistik model penuh  Peubah
Tabel 6 Hasil analisis regresi logistik model Backward Elimination tahap I  Peubah
+7

Referensi

Dokumen terkait

Berdasarkan tabel 4 menunjukkan perbedaan rerata kadar MDA plasma antara kelompok kontrol positif dan perlakuan 2 sebesar 4,85 nmol/ml, sedangkan antara

Kriteria diagnostik untuk gangguan skizoafektif yaitu terdapat gejala skizofrenia dan gejala gangguan afektif sama-sama menonjol pada saat yang bersamaan atau dalam beberapa

Wawancara merupakan sebuah percakapan antara dua orang atau lebih, yang pertanyaan nya diajukan oleh peneliti kepada subyek atau sekelompok subyek penelitian untuk

a) Laporkan jumlah pemasok yang harus menjalani asesmen terkait dampak hak asasi manusia. b) Laporkan jumlah pemasok yang diidentifikasi memiliki dampak yang benar-benar

(2) Dengan menggunakan Metode Role Playing dapat meningkatkan prestasi belajar siswa dalam memahami Hadits tentang menuntut ilmu dan menghargai waktu di kelas IX-F

Penambahan minyak/lemak dalam produk sosis masih diperlukan karena lemak pada daging kurang dapat membentuk produk sosis dengan palatabilitas yang baik, sehingga

Hasil penelitian menunjukkan bahwa pengembangan media pembelajaran melalui beberapa tahap, yaitu (1) Fase investigasi awal tentang perangkat pembelajaran dan