PENERAPAN SYNTHETIC MINORITY OVERSAMPLING
TECHNIQUE PADA PEMODELAN REGRESI LOGISTIK
ORDINAL BERAT LAHIR BAYI DI PROVINSI JAWA TIMUR
RISQIN NI’MA FATHARANI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan Synthetic
Minority Oversampling Technique pada Pemodelan Regresi Logistik Ordinal Berat
Lahir Bayi di Provinsi Jawa Timur adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Agustus 2016
Risqin Ni’ma Fatharani
NIM G14120030
ABSTRAK
RISQIN NI’MA FATHARANI. Penerapan Synthetic Minority Oversampling
Technique pada Pemodelan Regresi Logistik Ordinal Berat Lahir Bayi di Provinsi
Jawa Timur. Dibimbing oleh ITASIA DINA S dan AKBAR RIZKI.
Berat lahir bayi yang rendah sering dihubungkan dengan meningkatnya resiko terserang penyakit, terhambatnya pertumbuhan dan perkembangan kognitif, serta kematian pada bayi. Prediksi berat lahir bayi sejak dini diharapkan dapat menekan angka berat lahir bayi rendah, sehingga diperlukan pemodelan berat lahir bayi. Berat lahir bayi diklasifikasikan menjadi empat kategori yaitu Bayi Berat Lahir Normal, Bayi Berat Lahir Rendah (BBLR), Bayi Berat Lahir Sangat Rendah (BBLSR), dan Bayi Berat Lahir Ekstrim Rendah (BBLER). Pemodelan klasifikasi berat lahir bayi menggunakan regresi logistik ordinal. Data yang digunakan adalah data berat lahir bayi di Jawa Timur hasil Survei Demografi dan Kesehatan Indonesia tahun 2012. Data tersebut banyak mengumpul di kategori bayi berat lahir normal yaitu sebesar 82.19%. Banyaknya data yang tidak seimbang pada kategori respon memengaruhi tingkat akurasi model dalam memprediksi klasifikasi respon.
Synthetic Minority Oversampling Technique (SMOTE) digunakan untuk
menyeimbangkan banyaknya data dengan cara membuat data sintetis secara acak. Pembangkitan nilai acak menggunakan set.seed(9). Hasil penelitian menunjukkan bahwa pemodelan klasifikasi berat lahir bayi dengan SMOTE menghasilkan nilai
Multiclass Extension of AUC (MAUC) lebih besar dibandingkan dengan tanpa
SMOTE, yaitu dari 0.854 menjadi 0.905. Selain itu nilai R2 Nagelkerke juga lebih besar, yaitu dari 46.8% menjadi 72.6%. Penggunaan SMOTE pada data tidak seimbang menghasilkan model yang lebih baik dan lebih akurat dalam memprediksi klasifikasi berat lahir bayi.
ABSTRACT
RISQIN NI’MA FATHARANI. Applied Synthetic Minority Oversampling Technique on Ordinal Logistic Regression Birth Weight Babies Modelling in East Java Province. Advised by ITASIA DINA S and AKBAR RIZKI.
Low birth weight babies are often associated by increasing the risk of disease, poor growth and cognitive development, as well as infant mortality. Prediction of birth weight babies early is expected to reduce the number of low birth weight babies, so that birth weight baby modelling is needed. Birth weight baby are classified into four categories: Normal Birth Weight Babies, Low Birth Weight Babies (LBW), Very Low Birth Weight Babies (VLBW), and Extreme Low Birth Weight Babies (ELBW). Birth weight classification modelling use ordinal logistic regression. The data is birth weight baby data in East Java of the result of Indonesia Demographic and Health Survey in 2012. The data more accumulates in normal birth weight categories is 82.19%. The imbalanced data on response category affects model's accuracy in predicting the response classification. Synthetic Minority Oversampling Technique (SMOTE) is used to balance the amount of data in each category with creating synthetic data randomly. Generating the random values use set.seed(9). The results show that modelling birth weight babies classification with SMOTE produce Multiclass Extension of AUC (MAUC) is greater than without SMOTE, from 0.854 to 0.905. In addition the value of R2 Nagelkerke is also greater, from 46.8% to 72.6%. Application of SMOTE in imbalanced data produce better models and more accurate in predicting the birth weight classification.
PENERAPAN SYNTHETIC MINORITY OVERSAMPLING
TECHNIQUE PADA PEMODELAN REGRESI LOGISTIK
ORDINAL BERAT LAHIR BAYI DI PROVINSI JAWA TIMUR
RISQIN NI’MA FATHARANI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya penulis dapat menyelesaikan karya ilmiah ini yang berjudul Penerapan Synthetic Minority Oversampling Technique pada Pemodelan Regresi Logistik Ordinal Berat Lahir Bayi di Provinsi Jawa Timur.
Terima kasih penulis ucapkan kepada Ibu Dra Itasia Dina S, MSi dan Ibu Akbar Rizki, MSi selaku pembimbing, serta Bapak Dr Ir I Made Sumertajaya, MS selaku penguji skripsi. Di samping itu, penghargaan penulis sampaikan kepada seluruh dosen Statistika IPB atas ilmu yang bermanfaat bagi penulis, Staf Tata Usaha Departemen Statistika atas bantuannya dalam kelancaran administrasi, serta teman-teman Statistika angkatan 49 khususnya kepada Arikmadi, teman-teman Shofura dan DNT, serta teman-teman sebimbingan (Anis, Bella, Nadya, Yes) atas semangat dan dukungannya selama penulis mengerjakan skripsi. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya sehingga penulis dapat menyelesaikan kuliah di Statistika IPB.
Penulis mengharapkan kritik dan saran yang membangun dari pembaca demi kesempurnaan karya ilmiah ini. Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2016
DAFTAR ISI
DAFTAR TABEL vi DAFTAR GAMBAR vi PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 1 TINJAUAN PUSTAKA 2Berat Lahir Bayi Rendah 2
Regresi Logistik Ordinal 2
Synthetic Minority Oversampling Technique (SMOTE) 4
Evaluasi Model 5
METODOLOGI 6
Data 6
Prosedur Analisis Data 7
HASIL DAN PEMBAHASAN 8
Analisis Deskriptif 8
Karakteristik Berat Lahir Bayi di Provinsi Jawa Timur 8
Analisis Regresi Logistik Ordinal 13
Synthetic Minority Oversampling Technique (SMOTE) 15
Perbandingan Model 16
Model Klasifikasi Berat Lahir Bayi 16
KESIMPULAN 19
DAFTAR TABEL
1 Peubah penjelas yang diamati 6
2 Dugaan parameter model penuh 13
3 Dugaan parameter model reduksi 14
4 Tabel klasifikasi model tanpa SMOTE 14
5 Dugaan parameter model dengan SMOTE 15
6 Tabel klasifikasi model tanpa SMOTE 16
7 Perbandingan model 16
DAFTAR GAMBAR
1 Diagram kue persentase kategori berat lahir bayi 8
2 Diagram batang peubah umur ibu saat melahirkan 9
3 Diagram batang peubah pendidikan terakhir ibu 9
4 Diagram batang peubah daerah tempat tinggal ibu 10
5 Diagram batang peubah status bekerja bagi ibu 10
6 Diagram batang peubah status ekonomi bagi ibu 11
7 Diagram batang peubah frekuensi periksa kehamilan 11
8 Diagram batang peubah status merokok bagi ibu 12
1
PENDAHULUAN
Latar Belakang
Bayi yang memiliki berat lahir kurang dari 2500 gram dapat mengakibatkan terjadinya mortalitas, morbiditas, disabilitas, serta memberikan dampak jangka panjang terhadap kehidupannya di masa depan (WHO 2012). Perilaku seorang ibu selama hamil seperti kelelahan, kebiasaan merokok, dan menerima perawatan atau pengobatan dapat sangat memengaruhi kesehatan bayi dalam kandungan, sehingga berakibat melahirkan bayi dengan berat lahir rendah. Sampai saat ini bayi dengan berat lahir rendah masih merupakan salah satu masalah kesehatan yang menjadi perhatian di negara berkembang. Sebuah laporan dari WHO menyebutkan bahwa persentase bayi dengan berat lahir rendah di Indonesia adalah sekitar 11.1% pada tahun 2012. Sementara itu di Provinsi Jawa Timur persentase tersebut meningkat dari 10% pada tahun 2010 menjadi 11.6% pada tahun 2013, bahkan Jawa Timur merupakan provinsi terbanyak kejadian bayi dengan berat lahir rendah di Pulau Jawa (Kemkes RI 2013). Oleh karena itu diperlukan suatu upaya untuk menekan kejadian bayi dengan berat lahir rendah di Jawa Timur. Salah satu upaya yang dapat dilakukan adalah membangun model klasifikasi berat lahir bayi yang dapat memprediksi berat lahir bayi secara dini.
Pemodelan dalam penelitian ini menggunakan regresi logistik ordinal yang peubah responnya berupa skala ordinal (kategorik). Penggunaan metode ini menghasilkan model klasifikasi. Model klasifikasi yang baik dilihat dari tingkat akurasi sebuah model dalam memprediksi klasifikasi respon. Keseimbangan data pada setiap kategori respon memengaruhi akurasi prediksi dari model. Hal ini dikarenakan model klasifikasi yang diperoleh lebih condong memprediksi respon yang memiliki ukuran kategori (banyak amatan) besar. Pada umumnya data hasil survei memberikan data apa adanya yang banyaknya data pada setiap kategori tidak dapat dikendalikan, sehingga ada kemungkinan diperoleh data yang tidak seimbang. Salah satu alternatif untuk menyeimbangkan banyaknya data pada setiap kategori respon adalah Synthetic Minority Oversampling Technique (SMOTE). SMOTE adalah metode oversampling yang digunakan untuk menciptakan data
synthetic dengan konsep k-tetangga terdekat pada data yang tidak seimbang
(Chawla et al. 2002).
Tujuan Penelitian
Tujuan penelitian ini adalah:
1. Membentuk model klasifikasi berat lahir bayi menurut karakteristik demografi dan sosial ekonomi di Provinsi Jawa Timur.
2. Membandingkan model yang dihasilkan antara tanpa SMOTE dan dengan SMOTE.
2
TINJAUAN PUSTAKA
Berat Lahir Bayi Rendah
Berat badan adalah suatu indikator kesehatan bayi baru lahir. WHO (2012) menyatakan bahwa bayi yang memiliki berat lahir kurang dari 2500 gram dikategorikan ke dalam bayi berat lahir rendah. Bayi berat lahir rendah merupakan masalah global yang berdampak pada peningkatan terjadinya infeksi, kesukaran mengatur nafas sehingga mudah untuk menderita hipotermia. Selain itu bayi dengan berat lahir rendah mudah terserang komplikasi yang dapat menyebabkan kematian. Bayi yang memiliki berat lahir rendah memiliki persentase yang kecil untuk bertahan hidup. Menurut Mathews et al. (2015) berat lahir bayi rendah diklasifikasikan menjadi:
1. Bayi Berat Lahir Rendah (BBLR) adalah bayi yang memiliki berat lahir 1500-2500 gram. Pada tahun 2013, angka kematian bayi BBLR adalah 25 kali dibandingkan dengan bayi berat lahir normal, yaitu 50.26 per 1000 kelahiran bayi
2. Bayi Berat Lahir Sangat Rendah (BBLSR) adalah bayi yang memiliki berat lahir 1000-1500 gram. Angka kematian bayi BBLSR adalah 219.56 per 1000 kelahiran. Angka ini lebih besar 100 kali dari kematian bayi normal.
3. Bayi Berat Lahir Ekstrem Rendah (BBLER) adalah bayi dengan berat lahir <1000 gram. Bayi dengan berat lahir <1000 gram 85% dilaporkan meninggal dalam selang waktu satu tahun setelah kelahiran.
Regresi Logistik Ordinal
Regresi logistik dapat digunakan untuk menggambarkan hubungan antara beberapa peubah penjelas X dengan peubah respon Y yang berskala kategorik. Regresi logistik dengan peubah respon memiliki sifat terurut dinamakan regresi logistik ordinal. Model yang dapat dipakai untuk regresi logistik ordinal adalah model logit. Model tersebut adalah cumulative logit models. Nilai peluang kumulatif ke j adalah (Agresti 2002):
𝑃(𝑌 ≤ 𝑗) = exp(𝑔𝑗(𝑥)) 1 + exp(𝑔𝑗(𝑥)) = exp(𝛽0𝑗+ ∑ 𝛽𝑖𝑥𝑖) 𝑝 𝑖=1 1 + exp(𝛽0𝑗+ ∑𝑝𝑖=1𝛽𝑖𝑥𝑖)
Bentuk transformasi logit menjadi model regresi logistik ordinal atau logit kumulatif (Agresti 2002): 𝐿𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 𝑗|𝑥)] = 𝑙𝑜𝑔 ( 𝑃(𝑌 ≤ 𝑗|𝑥) 1 − 𝑃(𝑌 ≤ 𝑗|𝑥)) = 𝑙𝑜𝑔 ( exp(𝛽0𝑗 + ∑𝑝𝑖=1𝛽𝑖𝑥𝑖) 1 + exp(𝛽0𝑗+ ∑𝑝𝑖=1𝛽𝑖𝑥𝑖) ⁄ 1 1 + exp(𝛽0𝑗+ ∑𝑝𝑖=1𝛽𝑖𝑥𝑖) ⁄ )
3 =𝑙𝑜𝑔(exp(𝛽0𝑗 + ∑𝑝𝑖=1𝛽𝑖𝑥𝑖))
= 𝛽0𝑗+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝, dengan
j =1,2,..,J-1
J : banyaknya kategori respon 𝑝 : banyaknya peubah bebas
Pendugaan Parameter
Pada model regresi logistik, penduga parameter 𝛽diperoleh melalui metode
Maximum Likelihood (Hosmer dan Lemeshow 2000). Pendugaan untuk setiap
parameter yang ingin diketahui pada regresi logistik ordinal diperoleh dengan menjadikan turunan pertama L(β) terhadap βk = 0.
𝑙(𝛽) = ∏ 𝜋1(𝑥)𝑦1𝜋 2(𝑥)𝑦2… 𝜋𝑗(𝑥)𝑦𝑗 𝑛 𝑖=1 𝐿(𝛽) = ln(𝑙(𝛽)) dengan k =1,2,...,p i =1,2,...,n j =1,2,...,J n : banyaknya data
𝑦𝑗 : banyaknya data pada kategori respon ke-j
𝜋𝑗 : peluang untuk kategori respon ke j
Pengujian Parameter
1. Pengujian Parameter secara Simultan
Pengujian parameter secara simultan dilakukan untuk mengetahui pengaruh peubah penjelas terhadap peubah respon secara bersama-sama. Hipotesis pengujiannya sebagai berikut (Hosmer dan Lemeshow 2000): H0: 𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑝 = 0, (peubah penjelas tidak memengaruhi
peubah respon secara simultan)
H1: minimal ada satu 𝛽𝑖 ≠ 0, (minimal ada satu peubah penjelas yang
memengaruhi peubah respon); i=1,2,...,p Statistik uji:
𝐺 = −2𝑙𝑛 (𝐿0 𝐿𝑝
), dengan
𝐿0 : model likelihood tanpa peubah penjelas 𝐿𝑝 : model likelihood dengan peubah penjelas
H0 akan ditolak jika statistik uji G>𝑋2(𝑝,𝛼) atau nilai-p<α, berarti
peubah penjelas secara bersama-sama memengaruhi peubah respon pada taraf nyata α.
4
2. Pengujian Parameter secara Parsial
Pengujian parameter secara parsial dilakukan untuk mengetahui pengaruh masing-masing peubah penjelas terhadap peubah respon. Pengujian ini dilakukan secara satu per satu. Hipotesis pengujiannya sebagai berikut (Hosmer dan Lemeshow 2000):
H0: 𝛽𝑖 = 0, (peubah penjelas ke-i tidak memengaruhi respon)
H1:𝛽𝑖 ≠ 0, (peubah penjelas ke-i memengaruhi respon);
Statistik uji: 𝑊𝑎𝑙𝑑 = [ 𝛽̂𝑖 𝑆𝐸̂𝛽̂𝑖 ] 2 , dengan i =1,2,...,p
𝛽̂𝑖 : dugaan koefisien parameter ke-i
𝑆𝐸̂𝛽̂𝑖 : dugaan galat baku dari 𝛽̂𝑖.
H0 akan ditolak jika statistik uji W>𝑋2(1,𝛼) atau nilai-p<α, berarti
peubah penjelas ke-i memengaruhi peubah respon pada taraf nyata α.
Interpretasi Koefisien
Interpretasi model regresi logistik dilakukan dengan menggunakan nilai rasio oddsnya. Nilai rasio odds pada regresi logistik ordinal menunjukkan perbandingan tingkat kecenderungan dari 𝑌 ≤ 𝑗 kategori dalam satu peubah penjelas dengan salah satu kategorinya dijadikan pembanding atau kategori dasar (Sari JM dan Kusrini DE, 2007). Misalkan untuk peubah 𝑥1 yang terdiri dari dua kategori, 𝑥1(1) dan 𝑥1(2),
𝑥1(2) dijadikan kategori dasar atau pembanding maka perhitungan rasio oddsnya adalah sebagai berikut (Agresti 2002):
𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 𝑗|𝑥1(1))] − 𝑙𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 𝑗|𝑥1(2))] = 𝑙𝑜𝑔 [ 𝑃(𝑌 ≤ 𝑗|𝑥1(1)) 𝑃(𝑌 > 𝑗|𝑥1(1)) ⁄ 𝑃(𝑌 ≤ 𝑗|𝑥1(2)) 𝑃(𝑌 > 𝑗|𝑥1(2)) ⁄ ] = 𝛽𝑖(𝑥1(1)− 𝑥1(2))
Rasio odds dari peluang kumulatif disebut rasi odds kumulatif. Nilai odds pada kategori respon ≤ 𝑗 pada 𝑥1(1) sebesar exp[𝛽𝑖(𝑥1(1)− 𝑥1(2))] kali dari odds pada 𝑥1(2).
Synthetic Minority Oversampling Technique (SMOTE)
Pada suatu data set, seringnya keseimbangan data tidak terjadi. Jika pada salah satu kategori memiliki banyak amatan yang lebih besar dibandingkan dengan kategori lain, maka kategori tersebut disebut dengan kategori mayor sedangkan kategori lain adalah kategori minor. Pengaruh ketidakseimbangan banyaknya data pada setiap kategori berdampak pada pemodelan yang didapat. Proses analisis akan menghiraukan kategori minor dan cenderung mengarah ke kategori mayor saja.
5 Menurut Chawla et al. (2002), masalah ini dapat diatasi dengan metode
Synthetic Minority Oversampling Technique (SMOTE), yakni metode oversampling dengan membuat data sintetis (data buatan secara acak). Metode
SMOTE bekerja dengan mencari k-tetangga terdekat untuk setiap data di kategori minor, setelah itu dibentuk data sintesis sebanyak persentase duplikasi yang diinginkan antara data minoritas dan k-tetangga terdekat yang dipilih secara acak. Pembangkitan data buatan yang berskala numerik diukur dengan jarak Euclidean sedangkan data kategorik dengan rumus Value Difference Metric (VDM) yaitu (Cost dan Salzberg 1993):
∆(𝑃, 𝑄) = 𝑤𝑃𝑤𝑄∑ 𝛿(𝑣1𝑖, 𝑣2𝑖)𝑟 𝑝
𝑖=1
, dengan
∆(𝑃, 𝑄) : jarak antara amatan P dan Q 𝑤𝑃𝑤𝑄 : bobot amatan (dapat diabaikan) p : banyaknya peubah penjelas
r : bernilai 1 (jarak Manhattan) atau 2 (jarak Euclidean)
𝛿(𝑣1𝑖, 𝑣2𝑖) : jarak antar amatan 1 dan 2 untuk setiap setiap peubah penjelas, dengan rumus: 𝛿(𝑣1𝑖, 𝑣2𝑖) = ∑ |𝐶1ℎ 𝐶1 −𝐶2ℎ 𝐶2 | 𝑠𝑖 ℎ=1 dengan
𝛿(𝑣1𝑖, 𝑣2𝑖) : jarak antara amatan ke-1 dan ke-2 yang termasuk pada peubah ke-i 𝐶1ℎ : banyaknya amatan ke-1 yang termasuk kategori peubah penjelas ke-i 𝐶2ℎ : banyaknya amatan ke-2 yang termasuk kategori peubah penjelas ke-i 𝑠𝑖 : banyaknya kategori pada peubah penjelas ke-i
C1 :banyaknya amatan ke-1
C2 : banyaknya amatan ke-2
Evaluasi Model Uji Kebaikan Model
Uji kebaikan model dilakukan untuk mengetahui kebaikan model dengan menggunakan koefisien determinasi (R2). Pada analisis regresi logistik ordinal
biasa digunakan koefisien determinasi R2 Nagelkerke (Mbachu et al. 2012). Nilai yang dihasilkan oleh R2ini menunjukkan persentase keragaman Y yang dapat
dijelaskan oleh X dalam model. Rumus R2 Nagelkerke adalah sebagai berikut: 𝑅2 = 1 − [𝐿𝐿0 𝑝] 2/𝑛 1 − 𝐿02/𝑛 dengan
L0 : model likelihood tanpa peubah penjelas
Lp : model likelihood dengan peubah penjelas
6
Multiclass Extension of AUC (MAUC)
Akurasi klasifikasi juga dapat diukur dengan menghitung luas di bawah kurva
Receiver Operating Characteristic (ROC), yaitu AUC (Area Under Curve). Nilai
AUC berkisar antara 0.5 hingga 1. Nilai AUC semakin mendekati angka satu maka akurasi model atau klasifikasi semakin tinggi. AUC digunakan untuk kasus biner. Menurut Hand et al. (2001), AUC dapat digunakan pada kasus multiclass, dengan sebutan Multiclass Extension of AUC (MAUC). Rumus MAUC adalah:
𝑀𝐴𝑈𝐶 = 2 𝑗 × (𝑗 − 1)∑ 𝐴𝑖𝑗 𝑖<𝑗 , dengan j : banyaknya kategori
𝐴𝑖𝑗 : AUC antara kategori i dan j
METODOLOGI
Data
Data pada penelitian ini menggunakan data berat lahir bayi hasil Survei Demografi dan Kesehatan Indonesia (SDKI) 2012 di Provinsi Jawa Timur. Survei ini dilakukan oleh Badan Pusat Statistik (BPS) bekerja sama dengan Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) dan Kementerian Kesehatan. Responden pada survei ini adalah wanita umur 15-49 yang tersebar di 34 provinsi yang dilakukan dalam kurun waktu 5 tahun (2007-2012). Di Provinsi Jawa Timur data yang tercatat terdapat 539 observasi (BKKBN et al. 2012).
Tabel 1 Peubah penjelas yang diamati
Peubah Kategori
De
mogra
fi Umur X1 0=20-35 tahun, 1=<20 atau >35 tahun Pendidikan X2 0=PT, 1=SMTA, 2=Tidak sekolah/SD Tempat Tinggal X3 0=Perkotaan, 1=Pedesaan
Status Bekerja X4 0=Tidak, 1=Bekerja
S
osial
Ekonomi
Status Ekonomi X5 0=Atas, 1=Menengah, 2=Bawah Frekuensi Periksa X6 0=≥4 kali, 1=<4 kali
Status Merokok X7 0=Tidak, 1=Merokok
Urutan Kelahiran X8 0=ke-2 atau 3, 1=ke-1 atau >3
Peubah respon Y yang akan diamati adalah klasifikasi berat lahir bayi (1=BBLER, 2=BBLSR, 3=BBLR, 4=Normal) yang terurut dari yang terkecil hingga terbesar. Sedangkan pemilihan peubah bebas X dalam penelitian ini
7 didasarkan pada ketersediaan data SDKI 2012 yang diduga memengaruhi klasifikasi berat lahir bayi yang disajikan pada Tabel 1.
Prosedur Analisis Data
Penelitian ini menggunakan software R 3.0.1. Tahapan analisis data yang dilakukan dalam penelitian ini adalah sebagai berikut:
1. Melakukan eksplorasi data yang meliputi:
a. Melihat persentase banyaknya data pada setiap kategori berat lahir bayi. b. Melihat persentase kategori berat lahir bayi pada setiap peubah
penjelas.
2. Melakukan analisis regresi logistik ordinal dengan menduga parameter dan melakukan pengujian secara simultan dan parsial.
3. Mengevaluasi model dengan melihat nilai MAUC dan R2 Nagelkerke 4. Melakukan metode SMOTE sebanyak kategori minor, yaitu tiga kali.
Pembangkitan nilai acak pada metode ini menggunakan set.seed(9). Adapun langkah-langkah SMOTE adalah sebagai berikut:
a. Menghitung jarak antar amatan pada kategori minor
b. Menentukan 5 tetangga terdekat (k=5), persentase oversampling untuk kategori minor dan undersampling untuk kategori mayor. Penentuan nilai-persentase oversampling dan undersampling tidak memiliki ketentuan baku. Persentase yang dipilih disesuaikan dengan banyaknya data pada setiap kategori respon. SMOTE ke-1: persentase
oversampling=950% dan undersampling=320%. SMOTE ke-2:
persentase oversampling=790% dan undersampling=400%. SMOTE ke-3: persentase oversampling=500% dan undersampling=300%. c. Memilih satu contoh dari kategori minor secara acak
d. Menentukan amatan k tetangga terdekat dengan mengurutkan jarak contoh terpilih dengan semua amatan pada kategori minor.
e. Data sintetis dibuat dengan menentukan nilai masing-masing peubah penjelasnya. Nilai tersebut diperoleh dari mayoritas nilai pada 5 tetangga terdekat. Jika semua peubah telah dibuat maka diperoleh satu amatan baru
f. Langkah c hingga e dilakukan berulang hingga banyaknya
oversampling yang diinginkan telah tercapai.
5. Membangun model dengan data yang dihasilkan dari metode SMOTE 6. Menghitung nilai MAUC dan R2 Nagelkerke bagi model regresi logistik
ordinal tanpa SMOTE dan dengan SMOTE
7. Membandingkan hasil model regresi logistik ordinal tanpa SMOTE dan dengan SMOTE menggunakan MAUC dan R2 Nagelkerke
8
HASIL DAN PEMBAHASAN
Analisis Deskriptif
Eksplorasi data dilakukan untuk melihat persentase banyaknya data pada setiap kategori yang disajikan pada Gambar 1. Hasil yang diperoleh memperlihatkan bahwa kategori BBLER, BBLSR, dan BBLR memiliki persentase yang kecil, yaitu 1.86%, 3.34%, dan 12.62%, sedangkan pada kategori berat lahir bayi normal sangat besar yaitu 82.19%
Gambar 1 Diagram kue persentase kategori berat lahir bayi
Karakteristik Berat Lahir Bayi di Provinsi Jawa Timur
Eksplorasi yang kedua adalah melihat karakteristik demografi dan sosial ekonomi ibu yang melahirkan bayi pada rentang tahun 2007-2012 di Provinsi Jawa Timur. Berdasarkan Gambar 2 terlihat bahwa kategori umur ibu kurang dari 20 tahun lebih banyak melahirkan bayi dengan berat lahir rendah (BBLER, BBLSR, dan BBLR). Persentase dari masing-masing kategori adalah 50%, 55%, dan 62%. Begitu pula dengan umur ibu lebih dari 35 tahun juga lebih banyak melahirkan bayi berat lahir rendah dengan persentase BBLER sebesar 40%, BBLSR sebesar 34%, dan BBLR sebesar 19%. Sedangkan pada kategori berat lahir bayi normal dilahirkan dari ibu dengan umur antara 20-35 tahun yaitu sebesar 61%. Hasil ini sesuai dengan teori Amalia (2011), bahwa umur risiko ibu melahirkan adalah umur kurang dari 20 tahun dan lebih dari 35 tahun. Hal ini berkaitan dengan kondisi psikis, rahim, dan panggul ibu. Ibu hamil pada umur kurang dari 20 tahun, cenderung belum siap terkait fungsi organ dalam menjaga kehamilan dan menerima kehadiran janin, keterampilan ibu untuk melaksanakan perawatan diri dan bayinya, serta faktor psikologis ibu yang masih belum stabil. Demikian pula pada ibu hamil berumur 35 tahun atau lebih, terjadi perubahan jaringan alat-alat kandungan dan jalan lahir tidak lentur lagi.
BBLER 1.86% BBLSR 3.34% BBLR 12.62% Normal 82.19%
9
Gambar 2 Diagram batang peubah umur ibu saat melahirkan
Menurut Kemkes RI (2013), pendidikan secara tidak langsung akan memengaruhi hasil suatu kehamilan khususnya terhadap kejadian bayi dengan berat badan lahir rendah. Hal ini dikaitkan dengan pengetahuan ibu dalam memelihara kondisi kehamilan serta upaya mendapatkan pelayanan dan pemeriksaan kesehatan selama kehamilan. Gambar 3 menunjukkan bahwa semakin rendah tingkat pendidikan ibu, ibu akan cenderung melahirkan bayi dengan klasifikasi lebih rendah pula dan sebaliknya. Hal ini ditunjukkan pada Gambar 3 bahwa grafik menunjukkan trend pada setiap kategori pendidikan akhir ibu.
Gambar 3 Diagram batang peubah pendidikan terakhir ibu
Sebaran daerah tempat tinggal pada setiap kategori berat lahir bayi dapat dilihat pada Gambar 4. Sebanyak 75% ibu yang melahirkan BBLER berasal dari daerah perkotaan, sedangkan untuk kategori BBLSR, BBLR, dan bayi normal masing-masing sebesar 69%, 58%, dan 53% dilahirkan dari ibu yang berasal dari pedesaan. Hal ini tidak sejalan dengan teori Damanik (2011), bahwa faktor lingkungan memegang peranan terbesar dalam menentukan status kesehatan dan gizi masyarakat. Ibu hamil yang gizinya tidak terpenuhi akan memengaruhi pertumbuhan dan perkembangan janin.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR NORMAL
BERAT BAYI LAHIR AGE <20 AGE 20-35 AGE >35
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR NORMAL
BERAT BAYI LAHIR
10
Gambar 4 Diagram batang peubah daerah tempat tinggal ibu
Gambar 5 menunjukkan karakteristik ibu bekerja di Jawa Timur pada setiap kategori berat lahir bayi. Kategori BBLER lebih banyak dilahirkan dari ibu yang bekerja yaitu sebesar 80%. Namun proporsi antara ibu yang bekerja dan tidak bekerja pada kategori lain hampir sama, sehingga tidak dapat dilihat bagaimana pengaruh status ibu bekerja pada klasifikasi berat lahir bayi.
Gambar 5 Diagram batang peubah status bekerja bagi ibu
Selanjutnya berdasarkan status ekonomi yang disajikan pada Gambar 6, ibu dengan status ekonomi bawah cenderung melahirkan bayi dengan kategori berat lahir rendah. Sedangkan ibu dengan status ekonomi menengah cenderung melahirkan bayi dengan kategori berat lahir lebih tinggi. Menurut Amalia (2011), hal ini berkaitan dengan asupan makanan untuk ibu secara kuantitas dan kualitas ketika mengandung sampai melahirkan, dikhawatirkan untuk ibu dengan status ekonomi bawah tidak menjaga dan merawat kandungannya, sehingga mengakibatkan pertumbuhan janin terganggu.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR Normal Pedesaan Perkotaan 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR Normal
11
Gambar 6 Diagram batang peubah status ekonomi bagi ibu
Gambar 7 memperlihatkan bahwa semakin ke klasifikasi bayi normal persentase ibu yang memeriksakan kehamilan minimal 4 kali semakin besar, yaitu 98%. Maka dari itu dapat dikatakan bahwa ibu yang memeriksakan kehamilannya minimal 4 kali lebih banyak melahirkan bayi dengan berat lahir lebih tinggi jika dibandingkan dengan ibu yang hanya memeriksakan kehamilannya kurang dari empat kali. Hal ini sesuai dengan pemaparan yang dijelaskan oleh Kemkes RI (2011). Pemeriksaan kehamilan merupakan pemeriksaan yang diberikan kepada ibu hamil oleh tenaga kesehatan selama kehamilannya, dengan jumlah standar kunjungan selama hamil minimal 4 kali. Jika jarang memeriksakan kehamilannya maka ibu tidak mengetahui permasalahan-permasalahan yang ada selama kehamilan.
Gambar 7 Diagram batang peubah frekuensi periksa kehamilan
Pada kemasan rokok terdapat peringatan bahwa merokok dapat menyebabkan kanker, serangan jantung, impotensi, dan gangguan kehamilan dan janin. Pada data yang digunakan, data ibu yang merokok tercatat hanya sedikit, yaitu hanya 9 amatan. Status merokok bagi ibu tidak dapat dilihat pengaruhnya pada klasifikasi berat lahir bayi karena data terlalu sedikit. Gambar 8 menunjukkan BBLER
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR NORMAL
BERAT BAYI LAHIR
EKO BAWAH EKO MENENGAH EKO ATAS
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR NORMAL
BERAT BAYI LAHIR VISIT <4 KALI VISIT ≥ 4 KALI
12
dilahirkan dari ibu merokok sebanyak 39%. Sedangkan untuk bayi dengan berat lahir normal dilahirkan oleh ibu merokok sebanyak 1%.
Gambar 8 Diagram batang peubah status merokok bagi ibu
Ibu yang pernah melahirkan anak tiga kali atau lebih karena paritas yang terlalu tinggi akan mengakibatkan terganggunya uterus terutama dalam hal fungsi pembuluh darah. Kehamilan yang berulang-ulang akan menyebabkan kerusakan pada dinding pembuluh darah uterus, yang akan memengaruhi nutrisi ke janin pada kehamilan, sehingga dapat menyebabkan gangguan pertumbuhan janin (Pramono dan Paramita 2015). Sedangkan pada kehamilan pertama fungsi organ reproduksi belum siap dalam menjaga dan menerima kehamilannya. Pada Gambar 9 menunjukkan bahwa ibu yang melahirkan anak pertama lebih banyak melahirkan BBLER sebesar 80% dan BBLSR sebesar 67%, sedangkan ibu yang melahirkan bayi ke-2 atau ke-3 cenderung melahirkan BBLR sebesar 72% dan bayi normal sebesar 78%. Hal ini sesuai dengan teori yang telah dijelaskan sebelumnya bahwa ibu yang baru melahirkan anak pertama dan lebih dari 3 akan cenderung melahirkan bayi dengan berat lahir rendah.
Gambar 9 Diagram batang peubah urutan kelahiran
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR Normal Ya Tidak 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% BBLER BBLSR BBLR NORMAL
BERAT BAYI LAHIR
13
Analisis Regresi Logistik Ordinal
Analisis regresi logistik ordinal dilakukan untuk mengetahui peubah-peubah yang berpengaruh terhadap klasifikasi berat lahir bayi. Sebelumnya dilakukan analisis dengan semua peubah. Pendugaan model penuh dengan menggunakan delapan peubah penjelas menghasilkan nilai statistik G sebesar 219.18 dengan nilai-p<0.0001 pada penggunaan taraf nyata 5% disimpulkan bahwa minimal ada satu peubah penjelas yang berpengaruh terhadap klasifikasi berat lahir bayi. Nilai R2 Nagelkerke sebesar 47.4%.
Tabel 2 menunjukkan hasil pendugaan parameter, uji Wald, dan nilai-p. Terdapat peubah penjelas yang tidak berpengaruh terhadap klasifikasi berat lahir bayi pada taraf nyata 5%. Daerah tempat tinggal (pedesaan), status bekerja (ya), dan status merokok (ya) dinyatakan tidak signifikan pada taraf nyata 5% karena memiliki nilai-p lebih dari 0.05 yang berarti bahwa peubah tersebut kurang memengaruhi klasifikasi berat lahir bayi.
Tabel 2 Dugaan parameter model penuh
Peubah B SE Wald Nilai-P
Konstanta (1) -8.25 Konstanta (2) -6.33 Konstanta (3) -4.03 Umur <20 atau >35 tahun X1(1) 3.46 0.44 7.86 <0.0001* Pendidikan SMTA X2(1) -1.51 0.4 -3.78 0.0941 SD/Tidak bersekolah X2(2) 0.84 0.49 1.71 <0.0001* Tempat Tinggal Pedesaan X3(1) 0.5 0.28 1.79 0.0771 Status Bekerja Ya X4(1) 0.19 0.28 0.68 0.4876 Status Ekonomi Menengah X5(1) 0.12 0.39 0.31 <0.0001* Bawah X5(2) 2.6 0.52 5 <0.0001* Frekuensi Periksa <4 kali X6(1) 1.6 0.41 3.9 0.0001* Status Merokok Ya X7(1) -0.44 1.28 -0.34 0.7294 Urutan Kelahiran Ke-1 atau >3 X8(1) 1.57 0.28 5.61 <0.0001*
Keterangan: *)signifikan pada taraf nyata 5%
Peubah-peubah yang tidak signifikan tersebut akan dilakukan pereduksian dari model. Selanjutnya dibentuk model reduksi tanpa peubah bebas yang tidak berpengaruh terhadap klasifikasi berat lahir bayi. Pada model reduksi diperoleh nilai statistik uji G sebesar 215.47 dengan nilai-p<0.001, sehingga disimpulkan bahwa minimal ada satu peubah penjelas yang memengaruhi klasifikasi berat lahir bayi pada taraf nyata 5% dan nilai R2 Nagelkerke sebesar 46.8%. Tahap
14
pereduksian ini mengakibatkan penurunan R2 Nagelkerke sebesar 0.6%. Penurunan yang terjadi cukup kecil, sehingga dapat dikatakan bahwa peubah-peubah yang tidak signifikan tersebut tidak berpengaruh nyata jika tidak terdapat pada model. Koefisien beta model reduksi dapat dilihat pada Tabel 3.
Tabel 3 Dugaan parameter model reduksi
Peubah B SE Wald Nilai-P
Konstanta (1) -8.29 Konstanta (2) -6.37 Konstanta (3) -4.1 Umur <20 atau >35 tahun X1(1) 3.34 0.43 7.77 <0.0001* Pendidikan SMTA X2(1) -1.46 0.4 -3.65 0.1044 SD/Tidak bersekolah X2(2) 0.81 0.5 1.62 <0.0001* Status Ekonomi Menengah X5(1) 0.2 0.4 0.5 <0.0001* Bawah X5(2) 2.72 0.51 5.33 <0.0001* Frekuensi Periksa <4 kali X6(1) 1.54 0.41 3.76 0.0002* Urutan Kelahiran Ke-1 atau >3 X8(1) 1.53 0.28 5.46 <0.0001*
Keterangan: *)signifikan pada taraf nyata 5%
Data yang tidak seimbang pada kategori respon menyebabkan kesalahan prediksi pada kategori minor menjadi sangat besar. Pada Tabel 4 membuktikan bahwa terdapat ketidakseimbangan proses prediksi pada kategori minor. Kesalahan klasifikasi pada kategori bayi normal sangat kecil yaitu sebesar 3% sedangkan untuk kategori lainnya sangat besar yaitu dari 60% sampai 83.3%. Hal ini disebabkan model cenderung memprediksi kategori mayor, sehingga kesalahan klasifikasi pada kategori minor sangat besar.
Tabel 4 Tabel klasifikasi model tanpa SMOTE
Prediksi Ketepatan Klasifikasi Normal BBLR BBLSR BBLER Aktual Normal 428 49 5 0 0.97 BBLR 14 16 9 1 0.24 BBLSR 1 3 3 5 0.17 BBLER 0 0 1 4 0.4 Kesalahan klasifikasi 0.03 0.76 0.83 0.6
Evaluasi model dilihat dari nilai MAUC dan R2 Nagelkerke. Hasil analisis didapatkan nilai MAUC sebesar 0.854. Hal ini menunjukkan bahwa model memiliki tingkat akurasi yang tinggi dalam memprediksi klasifikasi berat lahir bayi. Evaluasi model yang kedua adalah kebaikan model yang ditunjukkan oleh nilai R2 Nagelkerke sebesar 46.8%. Angka ini menunjukkan bahwa besar keragaman yang dapat dijelaskan oleh peubah umur ibu, pendidikan terakhir, status ekonomi,
15 frekuensi periksa kehamilan, dan urutan kelahiran sebesar 46.8% dan sisanya 53.2% dijelaskan oleh peubah lain di luar model.
Synthetic Minority Oversampling Technique (SMOTE)
Data awal terdapat tiga kategori minor, yaitu pada kategori BBLER, BBLSR, dan BBLR masing-masing sebanyak 10, 18, dan 68 dari 539 data keseluruhan. SMOTE dilakukan pada praproses sebanyak 3 kali, sehingga didapatkan banyaknya data pada setiap kategori, yakni 108, 122, 186, dan 235.
Peubah penjelas yang digunakan adalah peubah penjelas hasil pereduksian, yaitu peubah yang signifikan. Hasil pengujian dugaan parameter secara simultan menggunakan uji G diperoleh nilai 734.5 dengan nilai-p<0.0001 yang artinya minimal ada satu peubah yang berpengaruh nyata terhadap model. Selanjutnya, dilakukan uji Wald untuk masing-masing peubah. Pada Tabel 4 terlihat bahwa semua peubah berpengaruh nyata terhadap klasifikasi berat lahir bayi karena memiliki nilai-p kurang dari 0.05. Evaluasi model ditunjukkan dari nilai MAUC dan R2 Nalgelkerke. Nilai MAUC sebesar 0.905. Sedangkan nilai R2 Nagelkerke
pada model dengan SMOTE adalah 72.6%.
Tabel 5 Dugaan parameter model dengan SMOTE
Peubah B SE Wald Nilai-P Rasio
odds Konstanta (1) -9.18 Konstanta (2) -6.46 Konstanta (3) -3.58 Umur <20 atau >35 tahun X1(1) 3.29 0.29 11.34 <0.0001* 26.84 Pendidikan SMTA X2(1) -0.16 0.24 -0.67 <0.0001* 0.85 SD/Tidak bersekolah X2(2) 1.63 0.29 5.62 <0.0001* 5.10 Status Ekonomi Menengah X5(1) 0.53 0.30 1.77 <0.0001* 1.70 Bawah X5(2) 3.09 0.36 8.58 <0.0001* 21.98 Frekuensi Periksa <4 kali X6(1) 1.36 0.25 5.44 <0.0001* 3.90 Urutan Kelahiran Ke-1 atau >3 X8(1) 1.76 0.22 8.00 <0.0001* 5.81
Keterangan: *)signifikan pada taraf nyata 5%
Setelah dilakukan penyeimbangan data dengan metode SMOTE, kesalahan klasifikasi pada kategori minor menjadi turun. Pada Tabel 5 terlihat bahwa kesalahan klasifikasi pada kategori minor turun menjadi 40% sampai 31%. Begitu pula dengan nilai ketepatan klasifikasi pada setiap kategori hampir seimbang. Hal ini menunjukkan bahwa model dengan SMOTE sudah tidak cenderung ke salah satu kategori dalam memprediksi klasifikasi berat lahir bayi.
16
Tabel 6 Tabel klasifikasi model dengan SMOTE
Prediksi Ketepatan Klasifikasi Normal BBLR BBLSR BBLER Aktual Normal 155 63 0 0 0.660 BBLR 47 111 16 5 0.597 BBLSR 33 12 81 29 0.664 BBLER 0 0 25 74 0.685 Kesalahan Klasifikasi 0.34 0.40 0.34 0.31 Perbandingan Model
Perbandingan model dengan SMOTE dan tanpa SMOTE dilakukan dengan membandingkan nilai Multiclass Extension of AUC (MAUC) dan R2 Nagelkerke. Model dengan SMOTE menghasilkan nilai MAUC 0.051 lebih besar dibandingkan dengan model tanpa SMOTE. Begitu pula dengan kebaikan model yang ditunjukkan oleh nilai R2 Nagelkerke. Model dengan SMOTE memiliki nilai R2 Nagelkerke 25.8% lebih besar dibanding model tanpa SMOTE. Nilai MAUC dan R2 Nagelkerke pada masing-masing model dapat dilihat di Tabel 7.
Tabel 7 Perbandingan model
Kriteria Model
Tanpa SMOTE Dengan SMOTE
MAUC 0.854 0.905
R2 Nagelkerke 46.8% 72.6%
Model Klasifikasi Berat Lahir Bayi
Model klasifikasi berat lahir bayi dibangun dari lima peubah penjelas yaitu peubah umur ibu, status ekonomi ibu, pendidikan terakhir ibu, frekuensi periksa kehamilan, dan urutan kelahiran bayi. Model yang digunakan adalah model dengan SMOTE yang memiliki kriteria kebaikan dan keakuratan model lebih baik. Adapun model logit yang diperoleh adalah sebagai berikut:
𝐿𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 1|𝑥)̂ ] = −9.18 + 3.29𝑋1(1)− 0.16𝑋2(1)+ 1.63𝑋2(2)+ 0.53𝑋5(1)+ 3.09𝑋5(2)+ 1.36𝑋6(1)+ 1.76𝑋8(1) 𝐿𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 2|𝑥)̂ ] = −6.46 + 3.29𝑋1(1)− 0.16𝑋2(1)+ 1.63𝑋2(2)+ 0.53𝑋5(1)+ 3.09𝑋5(2)+ 1.36𝑋6(1)+ 1.76𝑋8(1) 𝐿𝑜𝑔𝑖𝑡[𝑃(𝑌 ≤ 3|𝑥)̂ ] = −3.58 + 3.29𝑋1(1)− 0.16𝑋2(1)+ 1.63𝑋2(2)+ 0.53𝑋5(1)+ 3.09𝑋5(2)+ 1.36𝑋6(1)+ 1.76𝑋8(1)
Interpretasi model dilakukan dengan melihat rasio odds, yaitu perbandingan antara dua odds. Berikut disajikan contoh perhitungan odds, rasio odds, dan interpretasi bagi peubah umur ibu.
17 Odds umur ibu dengan model logit 1:
Odds umur ibu <20 tahun atau >35 tahun=exp(−9.18 + 3.29) = 2.767 × 10−3
Ibu yang berumur kurang dari 20 tahun atau lebih dari 35 tahun berisiko melahirkan BBLER sebesar 2.767 × 10−3 kali dibandingkan ibu
melahirkan BBLSR atau BBLR atau bayi normal.
Odds umur ibu 20-35 tahun=exp(−9.18) = 1.031 × 10−4
Ibu yang berumur 20-35 tahun berisiko melahirkan BBLER sebesar 1.031 × 10−4 kali dibandingkan ibu melahirkan BBLSR atau BBLR atau bayi normal.
Maka rasio odds dapat dihitung dengan: 𝑂𝑅 =𝑜𝑑𝑑𝑠1
𝑜𝑑𝑑𝑠2=
2.767 × 10−3
1.031 × 10−3= 26.84
Risiko ibu melahirkan BBLER dibanding dengan melahirkan BBLSR atau BBLR atau bayi normal untuk ibu yang berumur kurang dari 20 atau lebih dari 35 tahun adalah 26.84 kali ibu yang berumur 20-35 tahun.
Odds umur ibu dengan model logit 2:
Odds umur ibu <20 tahun atau >35 tahun=exp(−6.46 + 3.29) = 0.042 Ibu yang berumur kurang dari 20 tahun atau lebih dari 35 tahun berisiko melahirkan BBLER atau BBLSR sebesar 0.042 kali dibandingkan ibu melahirkan BBLR atau bayi normal.
Odds umur ibu 20-35 tahun=exp(−6.46) = 1.565 × 10−3
Ibu yang berumur 20-35 tahun berisiko melahirkan BBLER atau BBLSR sebesar 1.565 × 10−3 kali dibandingkan ibu melahirkan BBLR atau bayi normal.
Maka rasio odds dapat dihitung dengan: 𝑂𝑅 =𝑜𝑑𝑑𝑠1
𝑜𝑑𝑑𝑠2=
0.042
1.565 × 10−3= 26.84
Risiko ibu melahirkan BBLER atau BBLSR dibanding dengan melahirkan BBLR atau bayi normal untuk ibu yang berumur kurang dari 20 tahun atau lebih dari 35 tahun adalah 26.84 kali ibu yang berumur 20-35 tahun. Odds umur ibu dengan model logit 3:
Odds umur ibu <20 atau >35 tahun=exp(−3.58 + 3.29) = 0.74
Ibu yang berumur kurang dari 20 tahun atau lebih dari 35 tahun berisiko melahirkan BBLER atau BBLSR atau BBLR sebesar 0.74 kali dibandingkan ibu melahirkan normal.
Odds umur ibu 20-35 tahun=exp(−3.58) = 0.028
Ibu yang berumur 20-35 tahun berisiko melahirkan BBLER atau BBLSR atau BBLR sebesar 0.028 kali dibandingkan ibu melahirkan bayi normal. Maka rasio odds dapat dihitung dengan:
𝑂𝑅 =𝑜𝑑𝑑𝑠1
𝑜𝑑𝑑𝑠2=
0.74
18
Risiko ibu melahirkan BBLER atau BBLSR atau BBLR dibanding dengan melahirkan bayi normal untuk ibu yang berumur kurang dari 20 tahun atau lebih dari 35 tahun adalah 26.84 kali ibu yang berumur 20-35 tahun. Dari uraian di atas didapatkan rasio odds untuk peubah umur ibu <20 tahun atau >35 tahun pada semua logit adalah sama yaitu 26.84. Nilai tersebut juga sama dengan jika menghitung nilai rasio odds=exp[𝛽1(𝑥1(1)− 𝑥1(0))]. Hal ini menunjukkan bahwa ibu yang berumur kurang dari 20 atau lebih dari 35 tahun berpeluang 26.84 kali dari ibu yang berumur 20-35 tahun untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Bayi dengan berat lahir rendah terjadi pada ibu yang berumur kurang dari 20 tahun dan lebih dari 35 tahun. Dalam hal ini hendaknya ibu merencanakan kehamilan dan persalinannya pada kurun waktu umur reproduksi sehat, yaitu umur 20-35 tahun. Hal tersebut sama dengan penjelasan yang ditunjukkan pada Gambar 2, bahwa umur ibu melahirkan kurang dari 20 atau lebih dari 35 tahun cenderung melahirkan bayi dengan berat lahir rendah dibanding dengan umur aman ibu melahirkan 20-35 tahun.
Perhitungan odds dan rasio odds bagi peubah umur ibu membuktikan bahwa nilai rasio odds pada setiap model logit adalah sama, yang membedakan hanyalah nilai oddsnya. Hal ini juga berlaku pada rasio odds untuk semua peubah pada setiap logit, sehingga rasio odds dari peubah-peubah yang lain dapat langsung diinterpretasikan. Nilai rasio odds untuk semua peubah dapat dilihat pada Tabel 5.
Rasio odds peubah pendidikan akhir ibu SD atau tidak bersekolah adalah 5.10. Hal ini menunjukkan bahwa ibu yang hanya menamatkan SD atau tidak bersekolah berpeluang 5.10 kali dari ibu yang berpendidikan akhir Perguruan Tinggi (PT) untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Rasio odds peubah pendidikan akhir ibu SMTA adalah 0.85. Hal ini menunjukkan bahwa ibu dengan pendidikan terakhir SMTA berpeluang 0.85 kali dari ibu yang berpendidikan akhir Perguruan Tinggi (PT) untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Nilai rasio odds peubah pendidikan akhir ibu sesuai dengan hasil deskriptif pada Gambar 3. Semakin rendah tingkat pendidikan akhir ibu, ibu cenderung melahirkan bayi dengan berat lahir rendah dan sebaliknya. Semakin tinggi tingkat pendidikan akhir ibu, ibu cenderung melahirkan bayi dengan berat lahir lebih tinggi. Oleh karena itu, setidaknya para calon ibu ikut berpartisipasi pada program pemerintah yaitu 9 tahun wajib belajar, sehingga pada jenjang pendidikan yang lebih tinggi pula mereka akan mendapatkan ilmu dan wawasan yang lebih banyak tentang kesehatan dan kesadaran dalam pencegahan penyakit.
Hasil deskriptif data pada Gambar 6 menunjukkan bahwa semakin tinggi tingkat status ekonomi ibu, ibu cenderung melahirkan bayi dengan kategori klasifikasi yang lebih tinggi dan sebaliknya. Ibu dengan status ekonomi rendah cenderung melahirkan bayi dengan kategori berat lahir rendah. Hasil tersebut juga dibuktikan dengan nilai rasio odds hasil penelitian ini. Ibu dengan status ekonomi bawah berpeluang 21.98 kali dari ibu berstatus ekonomi atas untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Sedangkan ibu yang berstatus ekonomi menengah berpeluang 1.70 kali ibu berstatus ekonomi atas untuk melahirkan bayi dengan berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Dalam hal ini hendaknya ibu tetap berusaha dalam pemenuhan gizinya, dapat dilakukan
19 diversifikasi pangan, sehingga pemenuhan gizi dengan menggunakan bahan makanan pengganti yang kadar gizinya sama. Selain itu, ibu hamil juga dapat menggunakan layanan BPJS untuk pemeriksaan kandungan, persalinan, pemeriksaan bayi baru lahir, pemeriksaan pasca persalinan, dan pelayanan KB.
Interpretasi rasio odds frekuensi periksa kehamilan adalah ibu yang memeriksakan kehamilan kurang dari 4 kali akan berpeluang 3.90 kali dari ibu yang memeriksakan kehamilan lebih dari atau sama dengan 4 kali untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Hal ini ini dimaksudkan bahwa semakin sering melakukan pemeriksaan kehamilan maka ibu akan semakin mengerti masalah-masalah selama hamil, sehingga meminimalisasi risiko melahirkan bayi dengan berat lahir rendah. Hal tersebut juga didukung oleh hasil deskriptif data pada Gambar 7. Pada grafik tersebut terlihat ibu yang memeriksakan kehamilannya kurang dari 4 kali cenderung melahirkan bayi dengan berat lahir rendah dan sebaliknya ibu yang memeriksakan kehamilan minimal 4 kali cenderung melahirkan bayi dengan berat lahir lebih tinggi.
Berdasarkan hasil yang ditunjukkan pada Gambar 9, ibu yang melahirkan anak pertama atau lebih dari tiga kali cenderung berisiko melahirkan bayi dengan berat lahir rendah. Sedangkan ibu yang melahirkan anak ke-2 atau ke-3 cenderung melahirkan bayi dengan berat lahir normal. Hasil tersebut juga sama dengan nilai rasio oddsnya. Rasio odds peubah urutan kelahiran ke-1 atau lebih dari ke-3 adalah 5.81. Hal ini menunjukkan bahwa ibu yang melahirkan anak ke-1 atau lebih dari ke-3 berpeluang 5.81 kali dari ibu yang melahirkan anak ke-2 atau ke-3 untuk melahirkan bayi dengan kategori berat lahir rendah dibanding melahirkan bayi dengan kategori berat lahir lebih tinggi. Oleh karena itu, ibu yang akan memiliki anak pertama hendaknya sangat mempersiapkan kondisinya baik fisik maupun psikis, dengan tidak terlalu capek berkegiatan dan tidak terlalu stres. Sedangkan untuk ibu yang telah mempunyai tiga anak hendaknya memprogramkan KB atau konsultasi kepada dokter jika ingin memiliki anak ke-4.
KESIMPULAN
Model klasifikasi berat lahir bayi dibangun oleh lima peubah penjelas, yaitu umur ibu saat melahirkan, pendidikan terakhir ibu, status ekonomi ibu, frekuensi periksa kehamilan, dan urutan kelahiran bayi. Hasil dari penelitian ini menjelaskan bahwa ibu hamil berpeluang lebih besar melahirkan bayi dengan berat lahir rendah untuk usia ibu kurang dari 20 tahun atau lebih dari 35 tahun atau ibu yang memeriksakan kehamilan kurang dari 4 kali atau ibu yang melahirkan bayi ke-1 atau lebih dari ke-3. Selanjutnya semakin rendah tingkat pendidikan terakhir atau status ekonomi bagi ibu hamil berpeluang lebih besar melahirkan bayi dengan berat lahir rendah.
Data yang tidak seimbang pada kategori respon menyebabkan kesalahan klasifikasi pada kategori minor sangat besar. Model yang didapat memiliki akurasi yang rendah dalam memprediksi klasifikasi berat lahir bayi. Penggunaan SMOTE dengan set.seed(9) dapat menyeimbangkan banyaknya data pada setiap kategori berat lahir bayi. Evaluasi model dengan R2 Nargelkerke dan MAUC menunjukkan
bahwa model dengan SMOTE lebih baik dan lebih akurat dalam memprediksi klasifikasi berat lahir bayi.
20
DAFTAR PUSTAKA
Agresti A. 2002. Categorical Data Analysis Second Edition. New Jersey: John Wiley and Sons.
Amalia Lia. 2011. Faktor risiko kejadian bayi berat lahir rendah (BBLR) di RSU Dr. MM Dunda Limboto Kabupaten Gorontalo. Jurnal Sainstek. 6(3):249-260.
[BKKBN; BPS; Kemkes] Badan Kependudukan dan Keluarga Berencana Nasional; Badan Pusat Statistika; Kementrian Kesehatan. 2013. Survey Demografi dan
Kesehatan Indonesia 2012. ID: BKKBN; BPS; Kemkes.
Chawla VN, Bowyer KW, Hall LO, Kegelmeyer WP. 2002. SMOTE: synthetic minority over-sampling technique. Journal of Artificial Intelligence
Research. 9(1):321-357.
Cost S, Salzberg S. 1993. A weighted Nearest Neighbour Algorithm for Learning with Symbolic Features. Machine Learning. 10:57-58. Boston (US): Kluwer Academic Publisher.
Damanik Rizal. 2011. Kejadian Bayi Berat Lahir Rendah dan Faktor-faktor yang Memengaruhinya. Seminar Fakultas Kesehatan Masyarakat Universitas Indonesia. IND: Depok
Hand DJ, Till RJ. 2001. A simple generalisation of the area under the ROC curve for multiple class classification problems. Machien Learning. 1(45):171-186. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression: Second Edition.
NY: John Wiley and Sons Inc.
[Kemkes RI] Kementerian Kesehatan Republik Indonesia. 2011. Menuju
Masyarakat Sehat yang Mandiri dan Berkeadilan. ID: Kemkes RI
[Kemkes RI] Kementerian Kesehatan Republik Indonesia. 2013. Riset Kesehatan
Dasar. ID: Kemkes RI
Mathews TJ, MacDorman MF, Thoma ME. 2015. Infant mortality statistics from the 2013 period linked birth/infant death data set. National Vital Statistics
Reports. [Internet]. [diunduh 2016 Apr 25]; 64(9):1-30. Tersedia pada:
http://www.cdc.gov/nchs/data/nvsr/nvsr64/nvsr64_09.pdf
Mbachu HI, Nduka EC, Nja ME. 2012. Designing a pseudo r-squared goodness-of-fit measure in generalized linear models. Journal of Mathematics
Research.4(2):148-154.
Sari JM, Kusrini DE. 2007. Penggunaan analisis regresi logistik untuk mencari probabilitas turnover intention beserta faktor-faktor yang memengaruhinya.
J Statistika. 3(1):9-22.
[WHO] World Health Orgaization. 2012. Low Birth Weight: Health at a Glance:
Asia/Pacific 2012. [Internet]. Switzerland: WHO. [diunduh pada: 2016 Feb
21
RIWAYAT HIDUP
Penulis dilahirkan di Ponorogo pada tanggal 29 Juni 1993 dari pasangan Bapak Hery Purwanto dan Ibu Siti Mutma’inah. Penulis adalah putra kedua dari dua bersaudara. Tahun 2012 penulis lulus dari SMA Negeri 1 Ponorogo dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) Undangan dan diterima di Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam.
Selama masa perkuliahan, penulis aktif berpartisipasi dalam acara Statistika Ria, yaitu sebagai staf Divisi Desain, Dekorasi, dan Dokumentasi Statistika Ria ke-9 tahun 2013 dan Divisi yang sama pada Statistika Ria ke-10 tahun 2014, sekretaris Divisi Hubungan Masyarakat Explo Science tahun 2015, serta sekretaris Divisi Publikasi, Desain, Dekorasi, dan Dokumentasi Kompetisi Statistika Jr tahun 2015. Penulis juga pernah aktif sebagai staf Departemen Database Center Himpunan Profesi Gamma Sigma Beta Statistika IPB periode 2014/2015. Peneliti juga pernah menjadi Asisten Praktikum mata kuliah Perancangan Percobaan pada tahun ajaran 2014/2015 semester ganjil. Pada bulan Juli-Agustus 2015, penulis melaksanakan kegiatan Praktik Lapang di Balai Penelitian Tanaman Pemanis dan Serat di Malang, Jawa Timur.