TINJAUAN PUSTAKA
4. Pelayanan Kesehatan Neonatal
2.7 Pengertian Regresi Logistik
Regresi logistik ( multiple regression logistic ) merupakan jenis regresi yang mempunyai ciri khusus, yaitu variabel dependennya berbentuk variabel kategorik ( terutama yang dikotomus, artinya terdiri dari dua kelompok, misalnya sehat/sakit, baik/kurang baik, dll ) (Riyanto, 2009). Dengan demikian, analisis regresi logistik digunakan untuk melihat hubungan antara banyak variabel independen dengan variabel dependen yang bersifat dikotomus (Ariawan, 2008).
Regresi logistik terbagi menjadi 2 yaitu : 1. Regresi logistik sederhana
Digunakan bila ingin mempelajari hubungan antara satu variabel independen dengan satu variabel dependen yang bersifat dikotomus
2. Regresi logistik ganda
Digunakan bila ingin mempelajari hubungan antara beberapa variabel independen dengan satu variabel dependen yang bersifat dikotomus.
Tujuan dari analisis regresi logistik adalah untuk mendapatkan model yang paling baik ( fit ) dan sederhana ( parsinomy ) yang dapat menggambarkan hubungan variabel independen dengan variabel dependen.
2.7.1 Fungsi Logistik
Fungsi logistik merupakan fungsi matematik dengan rumus : ( )
F(z) merupakan probabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu. Pada saat nilai z = -∞ maka f(z)=0 dan pada saat nilai z=+∞ maka f(z)=1. Jadi nilai f(z) akan berkisar antara 0 dan 1. Sifat ini yang membuat fungsi logistik populer, model logistik dapat digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0 dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya sakit. Jadi dengan menggunakan fungsi logistik, kita pasti akan memperoleh perkiraan risiko antara 0 dan 1 (Ariawan, 2008).
2.7.2 Model Regresi Logistik
Model regresi logistik dituliskan dalam bentuk penjumlahan linier :
Di mana x1, x2 dan x3 merupakan variabel dependen. Jadi z merupakan indeks yang menggabungkan x. Bila z dimasukkan ke pada fungsi logistik, maka rumus fungsi logistik sebagai berikut (Ariawan, 2008) :
( )
model regresi logistik dapat digunakan pada data yang dikumpulkan melalui rancangan kohort, case control maupun cross sectional.
Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko individual. Sedangkan pada rancangan case control dan cross sectional tidak dapat digunakan untuk menghitung risikoindividual karena β0 pada rancangan ini tidak shahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi yang disampel diketahui, kondisi ini hanya terjadi pada rancangan kohort (Riyanto, 2009).
Namun, dengan memperlakukan rancangan case control dan cross sectional sebagai follow up, maka dapat dihitung OR ( Odds Ratio ), yang merupakan perhitungan RR yang indirek. Nilai OR yang merupakan perhitungan eksponential β dari persamaan garis regresi logistik (Ariawan, 2008).
( ) ( ) ( )
Dengan demikian dapat disimpulkan bahwa individual risk (risiko individu) hanya dapat diperoleh dari rancangan kohort prospektif. Sedangkan pada rancangan case control, cross sectional tidak dapat melakukan prediksi risiko individu. Pada rancangan case control dan cross sectional dan kohort dapat dihitung nilai Odds Ratio (OR), yang merupakan RR indirect (Riyanto, 2009).
Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal) berdasarkan nilai-nilai sejumlah variabel yang diukur. Prediksi dapt digunakan dengan model (Riyanto, 2009) :
( )
( )
2.7.3 Regresi Logistik Ganda
Keuntungan regresi logistik ganda adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model. Pada regresi logistik ganda, variabel independennya dapat berupa campuran antara variabel kategori dan numerik. Fungsi regresi logistik ganda adalah :
a. Menetapkan model matematik yang paling baik untuk menggambarkan hubungan variabel independen dengan variabel dependen.
b. Menggambarkan hubungan kuantitatif antara variabel independen (x) dengan variabel dependen (y) setelah dikontrol variabel lain.
c. Mengetahui variabel independen (x) mana yang penting (dominan) dalam memprediksi variabel dependen
d. Mengetahui adanya interaksi pada dua atau lebih variabel independen terhadap variabel dependen.
Kegunaan analisis regresi logistik ganda mencakup 2 hal, yaitu (Riyanto, 2009) : a. Model faktor prediksi
Model faktor prediksi yaitu pemodelan dengan tujuan untuk memperoleh model yang terdiri beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen.
Prosedur analisis regresi logistik model faktor prediksi :
1) Melakukan seleksi, analisis bivariat antara masing-masing variabel independen dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p-value > 0,25 tetap ikut ke multivariat bila variabel tersebut secara substansi penting.
2) Memilih variabel yang dianggap penting yang masuk ke dalam model, dengan cara mempertahankan variabel yang mempunyai p-value < 0,05 dan mengeluarkan variabel yang p-value > 0,05. Pengeluaran variabel tidak dilakukan secara serentak, tapi dilakukan secara bertahap dimulai dari variabel yang mempunyai p-value terbesar. Bila variabel yang dikeluarkan tersebut mengakibatkan perubahan koefisien (nilai OR) variabel-variabel yang masih ada (berubah > 10%), maka variabel tersebut dimasukkan kembali ke dalam model.
3) Identifikasi linieritas variabel numerik dengan tujuan untuk menentukan apakah variabel numerik dijadikan variabel kategori atau tetap variabel numerik.
4) Setelah memperoleh model yang memuat variabel-variabel penting, maka langkan selanjutnya adalah memeriksa kemungkinan interaksi variabel ke dalam model.
b. Model faktor risiko
Pemodelan regresi logistik dengan menggunakan model faktor risiko bertujuan untuk mengestimasi secara valid hubungan satu variabel dependen dengan mengontrol beberapa variabel confounding.
Tahapan pemodelan faktor risiko :
1) Melakukan seleksi, analisis bivariat antara masingmasing variabel confounding dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,21, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p-value > 0,25 tetap ikut ke multivariat bila variabel tersebut secara substansi penting.
2) Lakukan pemodelan lengkap, mencakup variabel independen utama, semua kandidat confounding dan kandidat interaksi (interaksi dibuat antara variabel utama dengan semua variabel confounding).
3) Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi yang nilai p-value tidak signifikan dikeluarkan dari model secara berurutan satu persatu dari p-value yang terbesar.
4) Lakukan penilaian confounding, dengan cara mengeluarkan variabel kovariat/confounding satu persatu dimulai dari variabel yang mempunyai p-value terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor (variabel utama) antara sebelum dan sesudah variabel kovariat dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai confounding dan tetap harus masuk ke dalam model.