TESIS – SS14 2501
COMPARISON OF MULTIVARIABLE SPLINE
NONPARAMETRIC REGRESSION MODEL USING
GENERALIZED CROSS VALIDATION (GCV) AND
UNBIASSED RISK (UBR) IN SELECTING THE
OPTIMAL KNOT POINTS
(Case Study : Data of Maternal Mortality Rate in East Java)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
SUPERVISOR :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM OF MAGISTER DEPARTMENT OF STATISTICS
FACULTY OF MATHEMATICS AND NATURAL SCIENCES INSTITUT TEKNOLOGI SEPULUH NOPEMBER
GENERALIZED CROSS VALIDATION (GCV) AND
UNBIASSED RISK (UBR) IN SELECTING THE
OPTIMAL KNOT POINTS
(Case Study : Data of Maternal Mortality Rate in East Java)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
SUPERVISOR :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM OF MAGISTER DEPARTMENT OF STATISTICS
FACULTY OF MATHEMATICS AND NATURAL SCIENCES INSTITUT TEKNOLOGI SEPULUH NOPEMBER
GENERALIZED CROSS VALIDATION (GCV) AND
UNBIASSED RISK (UBR) IN SELECTING THE
OPTIMAL KNOT POINTS
(Case Study : Data of Maternal Mortality Rate in East Java)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
SUPERVISOR :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM OF MAGISTER DEPARTMENT OF STATISTICS
FACULTY OF MATHEMATICS AND NATURAL SCIENCES INSTITUT TEKNOLOGI SEPULUH NOPEMBER
TESIS – SS14 2501
PERBANDINGAN MODEL REGRESI
NONPARAMETRIK SPLINE MULTIVARIABEL
DENGAN MENGGUNAKAN METODE
GENERALIZED
CROSS VALIDATION
(GCV) DAN
UNBIASSED RISK
(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL
(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
DOSEN PEMBIMBING :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM MAGISTER JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER
CROSS VALIDATION
(GCV) DAN
UNBIASSED RISK
(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL
(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
DOSEN PEMBIMBING :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM MAGISTER JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER
CROSS VALIDATION
(GCV) DAN
UNBIASSED RISK
(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL
(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)
Sulistya Umie Ruhmana Sari NRP. 1314 201 030
DOSEN PEMBIMBING :
Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si
PROGRAM MAGISTER JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER
vii DAFTAR ISI
Halaman
ABSTRAK ... i
ABSTRACT ... iii
KATA PENGANTAR ... v
DAFTAR ISI ... vii
DAFTAR TABEL ... ix
DAFTAR GAMBAR ... xi
DAFTAR LAMPIRAN ... xiii
BAB I PENDAHULUAN ... 1
1.1Latar Belakang ... 1
1.2Rumusan Permasalahan ... 6
1.3Tujuan Penelitian ... 6
1.4 Manfaat Penelitian ... 6
1.5 Batasan Penelitian ... 7
BAB II TINJAUAN PUSTAKA ... 9
2.1 Analisis Regresi ... 9
2.2 Analisis Regresi Linier ... 9
2.3 Analisis Regresi Linier Berganda ... 10
2.4 Analisis Regresi Polinomial... 10
2.5 Regresi Nonparametrik Spline ... 10
2.6 Pemilihan Titik Knot Optimal ... 12
2.6.1 Metode GCV ... 13
2.6.2 Metode UBR ... 14
2.8 Kriteria Pemilihan Model Terbaik ... 14
2.9 Pemeriksaan Asumsi Residual dalam Model Regresi ... 15
2.9.1 Asumsi Residual Identik ... 16
2.9.2 Asumsi Residual Independen ... 16
2.9.3 Asumsi Normalitas Residual ... 17
viii
2.10.1 Uji Serentak ... 18
2.10.2 Uji Individu ... 19
2.11 Angka Kematian Maternal ... 19
BAB III METODOLOGI PENELITIAN ... 23
3.1 Kajian Teoritis ... 23
3.2 Aplikasi Data ... 25
3.2.1 Kerangka Konsep ... 25
3.2.2 Variabel Penelitian ... 26
3.2.3 Langkah Analisis... 28
BAB IV HASIL DAN PEMBAHASAN ... 31
4.1 Estimator Spline dalam Regresi Nonparametrik ... 31
4.2 Metode GCV dalam Regresi Nonparamertik Spline ... 33
4.3 Metode UBR dalam Regresi Nonparamertik Spline ... 35
4.4 Statistika Deskriptif ... 36
4.5 Pemodelan Angka Kematian Maternal Menggunakan Metode GCV ... 38
4.6 Pemodelan Angka Kematian Maternal Menggunakan Metode UBR ... 47
4.7 Perbandingan Metode GCV dan UBR ... 55
BAB V KESIMPULAN DAN SARAN ... 57
5.1 Kesimpulan ... 57
5.2 Saran ... 58
DAFTAR PUSTAKA ... 59
LAMPIRAN ... 63
ix
DAFTAR TABEL
Halaman
Tabel 2.1 ANOVA model regresi ... 19
Tabel 3.1 Variabel penelitian ... 27
Tabel 4.1 Statistika deskriptif ... 36
Tabel 4.2 Nilai GCV dengan 1 titik knot ... 38
Tabel 4.3 Nilai GCV dengan 2 titik knot ... 39
Tabel 4.4 Nilai GCV dengan 3 titik knot ... 41
Tabel 4.5 Nilai GCV dengan kombinasi titik knot ... 42
Tabel 4.6 Ringkasan hasil pemilihan titik knot dengan metode GCV ... 43
Tabel 4.7 Estimasi koefisien parameter ... 43
Tabel 4.8 ANOVA uji glejser ... 44
Tabel 4.9 Uji normalitas ... 45
Tabel 4.10 Hasil estimasi parameter model regresi dengan metode GCV ... 46
Tabel 4.11 Pengujian parameter model regresi secara parsial ... 47
Tabel 4.12 Nilai UBR dengan 1 titik knot ... 48
Tabel 4.13 Nilai UBR dengan 2 titik knot ... 48
Tabel 4.14 Nilai UBR dengan 3 titik knot ... 50
Tabel 4.15 Nilai UBR dengan kombinasi titik knot ... 51
Tabel 4.16 Ringkasan hasil pemilihan titik knot dengan metode UBR ... 52
Tabel 4.17 Estimasi koefisien parameter ... 52
Tabel 4.18 ANOVA uji glejser ... 53
Tabel 4.19 Uji normalitas ... 54
x
xi
DAFTAR GAMBAR
Halaman
Gambar 3.1 Diagram Faktor ysng Mempengaruhi AKM ... 26
Gambar 4.1 Scatter plot AKM dan Faktor-Faktor yang Mempengaruhi ... 37
Gambar 4.2 Uji Normalitas AKM ... 37
Gambar 4.3 ACF plot residual pemodelan regresi dengan metode GCV ... 44
xii
xiii
DAFTAR LAMPIRAN
Halaman
Lampiran 1. Data angka kematian maternal dan variabel yang diduga berpengaruh ... 63
Lampiran 2. Program untuk mencari nilai GCV dan UBR dengan satu titik knot ... 64
Lampiran 3. Program untuk mencari nilai GCV dan UBR dengan dua knot... 66
Lampiran 4. Program untuk mencari nilai GCV dan UBR dengan tiga titik knot ... 69
Lampiran 5. Program untuk mencari nilai GCV dan UBR dengan kombinasi titik knot ... 74
Lampiran 6. Program untuk estimasi parameter ... 79
Lampiran 7. Program untuk uji asumsi residual ... 82
xiv
v
KATA PENGANTAR
Alhamdulillah, puji syukur tak terhingga dipanjatkan kehadirat Allah SWT
karena berkat limpahan rahmat dan hidayah-Nya sehingga penulis dapat
menyelesaikan tesis yang berjudul :
Perbandingan Model Regresi Nonparametrik Spline Multivariabel Menggunakan
Generalized Cross Validation (GCV) dan Unbiassed Risk (UBR) dalam Pemilihan
Titik Knot Optimal. Studi kasus : Angka Kematian Maternal di Jawa Timur
2013.Tesis ini disusun sebagai salah satu syarat untuk menyelesaikan studi pada
Program Studi Statistika, Program Pascasarjana, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Surabaya.
Selesainya laporan Tesis ini tak lepas dari peranan berbagai pihak. Oleh karena
itu pada kesempatan ini penulis mengucapkan terimakasih yang sedalamnya kepada :
1. Bapak I Nyoman Budiantara dan Bapak Wahyu Wibowo selaku dosen
pembimbing yang telah bersedia meluangkan waktu di tengah kesibukannya
untuk membimbing penulis.
2. Ibu Santi Wulan Purnami dan Ibu Vita Ratnasari selaku penguji yang telah
memberikan kritik, saran serta masukan demi kesempurnaan tesis ini.
3. Bapak Dr. Suhartono, M.Sc selaku ketua Jurusan Statistika ITS dan Staff,
karyawan TU, RBS Jurusan Statistika ITS
4. Bapak Dr.rer. pol.HeriKuswanto, M.Si selaku kaprodi pasca sarjana Jurusan
Statistika ITS
5. Bapak dan Ibu dosen pengajar Jurusan Statistika ITS, terimakasih ilmu yang
telah diberikan
6. Kedua orang tua yang sangat saya cintai dan hormati, Bapak Seto Wardoyo dan
Ibu Ummu Kultum, terimakasih atas segala doa yang tidak pernah berhenti dan
dukungan baik moral maupun meteril yang tiada henti. Semoga selalu bisa
membahagiakan Abi dan Umi.
7. Mbak Murni dan Mbak Dyah, terimakasih dukungan dan motivasi yang
vi
8. Meriska, Lela, Renny, Surya, Muktar, terimakasih telah menjadi keluarga yang
baik selama di Surabaya dan semua rekan-rekan pascasarjana Statistika lainnya,
terimakasih telah menjadi keluarga baru selama di Surabaya
Besar harapan penulis agar Tesis ini bermanfaat dan dapat menambah wawasan
keilmuan. Penulis menyadari sepenuhnya bahwa Tesis ini belum sempurna, oleh
karena itu saran dan kritik yang membangun sangat penulis harapkan.
Surabaya, Januari 2016
i
PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE MULTIVARIABEL DENGAN MENGGUNAKAN METODE GCV DAN UBR
DALAM PEMILIHAN TITIK KNOT OPTIMAL
(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)
Nama Mahasiswa : Sulistya Umie Ruhmana Sari
NRP : 1314201030
Pembimbing 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Pembimbing 2 : Dr. Wahyu Wibowo, M.Si
ABSTRAK
Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot yang paling optimal. Terdapat beberapa metode yang dapat digunakan untuk memilih titik knot optimal, antara lain Generalized Cross Validation (GCV), Unbiassed Risk
(UBR) dan Generalized Maximum Likelihood (GML). Penelitian ini akan membahas tentang perbandingan model regresi spline nonparametrik multivariabel dengan menggunakan metode GCV dan UBR sebagai metode pemilihan titik knot optimal. Kriteria pemilihan model terbaik adalah berdasarkan nilai MSE dan nilai R2adj.
Selanjutnya akan dilakukan pemodelan menggunakan data Angka Kematian Maternal di Jawa Timur dengan menggunakan regresi nonparametrik spline. Pada hasil penelitian didapatkan dengan menggunakan metode GCV, titik knot optimum adalah menggunakan kombinasi titik knot 2-3-2-2-1 yang menghasilkan nilai MSE 0,002059 dan nilai R2adj sebesar 92,4%. Selanjutnya pada uji parameter didapatkan nilai bahwa
semua variabel berpengaruh signifikan dengan semua asumsi residual terpenuhi. Sementara, dengan menggunakan metode UBR didapatkan hasil yang berbeda. Titik knot optimum adalah menggunakan satu titik knot yang menghasilkan nilai MSE sebesar 0,01315 dan nilai R2adj sebesar 52,15%. Pada uji parameter didapat bahwa
semua variabel tidak berpengaruh signifikan serta asumsi normalitas residual yang tidak terpenuhi. Hal ini membuktikan bahwa pemodelan regresi nonparametrik dengan menggunakan metode GCV lebih baik untuk data berdistribusi normal seperti angka kematian maternal dibandingkan menggunakan metode UBR dalam pemilihan titik knot.
ii
iii
COMPARISON OF MULTIVARIABLE NONPARAMETRIK SPLINE REGRESSION MODEL USING GCV AND UBR METHODS IN SELECTION
THE OPTIMAL KNOT POINT
(Case Study : Maternal Mortality Rate in East Java)
Name : Sulistya Umie Ruhmana Sari NRP : 1314 201 030
Supervisor 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Supervisor 2 : Dr. Wahyu Wibowo, M.Si
ABSTRACT
In the nonparametric regression spline, determine the optimal point knot becomes very important. Best spline regression model resulting from the selection of the most optimal point knots. There are several methods that can be used to select the optimal knots points, among others Generalized Cross Validation (GCV), Unbiassed Risk (UBR) and Generalized Maximum Likelihood (GML). This research will discuss about the comparison of spline nonparametric regression multivariable models using the GCV and UBR as the method for selecting the optimal knots point. Criteria for selection of the best model is based on the MSE. Next will be using the data modeling Maternal Mortality in East Java using nonparametric regression spline. In the research results obtained by using the method of GCV, knots optimum point is to use a combination of 2-3-2-2-1 knots point that generates the MSE 0.0009965 and R2adj is
92,4%. Furthermore, the test parameter values obtained that all variables have a significant effect with all the residual assumptions are met. While, by using UBR obtained different results. Knots optimum point is to use a single point of knots that generate value MSE of 0.008486 and R2adj sebesar 52,15%. In the test parameters
obtained that all variables not significant and residual normality assumptions were not met. This proves that the nonparametric regression modeling using GCV method is better for maternal mortality data comparison method in the selection of UBR point knots.
iv
1
BAB I
PENDAHULUAN
1.1Latar Belakang
Analisis regresi adalah suatu metode statistika yang dilakukan untuk
mengetahui pola hubungan antara satu atau lebih variabel. Bentuk pola hubungan
antara variabel prediktor dengan variabel respon dapat diidentifikasi berdasarkan
informasi masa lalu atau dengan menggunakan scatter plot (Hardle, 1990). Selain itu analisis regresi bertujuan untuk melakukan sebuah prediksi (Budiantara, 2009).
Namun dalam konsep regresi, prediksi hanya boleh dilakukan dalam rentang data
dari variabel-variabel yang digunakan untuk membentuk model regresi tersebut.
Analisis regresi dapat diterapkan pada data yang mempunyai korelasi antar
variabel, oleh karena itu sebelum melakukan analisis regresi, sebaiknya
menyelidiki apakah variabel-variabel yang digunakan mempunyai korelasi atau
tidak. Tujuan utama dalam melakukan analisis regresi adalah untuk mencari
bentuk estimasi kurva regresi.
Terdapat 3 pendekatan dalam melakukan estimasi kurva regesi yaitu
pendekatan parametrik, nonparametrik dan pendekatan semiparametrik.
Pendekatan parametrik digunakan ketika bentuk kurva regresi diketahui polanya,
baik berupa linier, kuadratik, kubik, polinomial derajat p, eksponen, dll. Selain itu, pada pendekatan parametrik juga harus mempunyai informasi masa lalu terhadap
karakteristik data yang digunakan agar mendapatkan model regresi yang baik.
Dalam model regresi parametrik, estimasi kurva regresi akan ekuivalen dengan
estimasi terhadap parameter-parameter dalam model (Budiantara, 2009).
Sebaliknya, pendekatan nonparametrik digunakan jika bentuk kurva regresi tidak
diketahui polanya dan bisa juga digunakan ketika tidak adaatau keterbatasan
informasi masa lalu terhadap karakteristik data yang digunakan. Beberapa tahun
terakhir, pendekatan regresi nonparametrik menjadi alat yang sangat bermanfaat
bagi para statistikawan yang digunakan untuk analisis, prediksi dan peramalan,
(Memmedli dan Nizamitdinov, 2012). Dalam pendekatan nonparametrik, kurva
2
mempunyai fleksibilitas yang tinggi, artinya data diharapkan dapat mencari
sendiri bentuk estimasinya, tanpa adanya pengaruh dari subjektivitas si
peneliti.Terdapat beberapa metode yang telah banyak digunakan untuk
memodelkan regresi dengan menggunakan pendekatan nonparametrik yaitu antara
lain: Kernel (Hardle,1990), Spline (Wahba, 1990; Budiantara,2009), K-Nearest Neighbor (Hardle,1990), Histogram (Green dan Silverman, 1994), Estimator Deret Fourier (Eubank,1988), MARS, Deret Orthogonal, Wavelets, Neural
Network. Dari berbagai metode yang banyak digunakan, spline adalah salah satu
metode yang mempunyai banyak kelebihan.
Spline adalah salah satu bentuk estimator yang juga seringkali digunakan
dalam regresi nonparametrik karena mempunyai banyak kelebihan. Spline sebagai
pendekatan pola data dikenalkan oleh Whittaker pada tahun 1923. Selanjutnya,
Spline dipopulerkan oleh Schoenberg pada tahun 1942. Sedangkan spline yang
didasarkan pada suatu persoalan optimasi dikembangkan oleh Reinsch pada tahun
1967 (Wahba, 1990). Pendekatan spline mempunyai suatu basis fungsi. Basis
fungsi yang biasa digunakan antara lain spline truncated dan B-spline. Spline
Truncated merupakan fungsi dimana terdapat perubahan pola perilaku kurva yang berbeda pada interval-interval yang berlainan. Berbagai macam kelebihan jika
menggunakan spline antara lain: mempunyai intepretasi visual yang baik, bersifat
fleksibel, serta mampu menangani karakter fungsi yang bersifat mulus (Eubank,
1988; Budiantara, 2007). Selain itu, spline dapat mengatasi pola data dan dapat
menggambarkan perubahan perilaku data yang berubah-ubah pada sub-sub
interval tertentu. Spline juga mempunyai keunggulan dalam mengatasi pola data
yang menunjukkan naik/turun yang tajam dengan bantuan titik-titik knot serta
kurva yang dihasilkan relatif mulus (Eubank, 1988). Spline diperoleh berdasarkan
optimasi yang merupakan perluasan dari optimasi optimasi yang digunakan pada
regresi parametrik. Berbagai pendekatan regresi nonparametrik yang lain, tidak
memiliki tata cara optimasi seperti yang ada pada spline. Dalam pendekatan
3
Log Likelihood (PLL) yang merupakan hasil generalisasi metode Log Likelihood
(LL) pada regresi parametrik.
Spline merupakan potongan-potongan polinomial yang memiliki sifat
tersegmen dan kontinu. Salah satu kelebihan spline seperti yang telah dijelaskan
adalah bersifat fleksibel, artinya model ini cenderung mencari sendiri estimasi
data kemanapun pola data tersebut bergerak. Hal tersebut terjadi karena dalam
spline terdapat adanya titik-titik knot. Titik knot adalah titik perpaduan bersama
yang menunjukkan terjadinya perubahan pola perilaku data (Eubank, 1988;
Budiantara,2009). Dengan titik knot ini, spline dapat memberikan fleksibilitas
yang lebih baik dari pada polinomial, sehingga memungkinkan untuk
menyesuaikan diri secara efektif terhadap karakteristik lokal dari suatu fungsi atau
data. Dalam proses estimasi, apabila estimator spline diperoleh berdasarkan
optimasi Penalized Least Square (PLS), maka persoalan utama dalam estimator ini adalah pemilihan parameter penghalus yang optimal. Sementara, apabila
estimator spline yang dipilih dengan optimasi Least Square (LS), maka persoalan utama dalam estimator ini adalah pemilihan titik-titik kot yang optimal. Semakin
optimal titik knot yang digunakan dalam membuat model regresi maka akan
semakin besar pula kebaikan model regresi yang didapatkan.
Ada tiga kriteria yang harus diperhatikan dalam membentuk model regresi
Spline, antara lain: menentukan orde untuk model, banyaknya knot, dan lokasi
penempatan knot, (Montoya, et all, 2014). Orde untuk model dapat ditentukan
berdasarkan pola yang terjadi pada data, sementara banyaknya knot dan lokasi
knot ditentukan berdasarkan perubahan pola data yang terjadi pada sub-sub
interval tertentu. Terdapat beberapa metode untuk memilih titik knot yang optimal
dalam regresi nonparametrik Spline antara lain metode Cross Validation (CV) yang diberikan oleh Craven dan Wahba (1979), Unbiassed Risk (UBR) yang diberikan oleh Wang (1997), Generalized Cross Validation (GCV) yang diberikan oleh Wahba (1990), dan Generalized Maximum Likelihood (GML) oleh Wahba (1990). Dalam penelitian ini akan membandingkan hasil pemilihan titik knot
optimal dengan metode GCV dan metode UBR.
GCV dan UBR adalah metode pemilihan titik knot optimal yang mempunyai
banyak kelebihan. Adapun kelebihan yang dimiliki metode GCV antara lain
4
invarian terhadap transformasi dan tidak memerlukan informasi terhadap σ².
Pemilihan titik knot dengan metode GCV akan lebih baik jika digunakan pada
data yang Gaussian (berdistribusi normal), sementara pemilihan titik knot dengan metode UBR akan lebih baik jika digunakan pada data non-Gaussian atau tidak berdistribusi normal, (Wahba, 1990; Wang, 1998). Berdasarkan pernyataan
tersebut, peneliti tertarik untuk membandingkan apakah model regresi
nonparametrik spline multivariabel menggunakan metode GCV akan lebih baik
jika dibandingkan dengan model regresi nonparametrik spline multivariabel
menggunakan metode UBR pada data Angka Kematian Maternal di Provinsi Jawa
Timur tahun 2013 yang mempunyai distribusi normal.
Kematian Maternal menurut batasan dari The Tenth Revision of The
International Classification of Diseases (ICD-10) adalah kematian wanita yang
terjadi pada saat kehamilan atau dalam waktu 42 hari setelah kehamilan, tidak
tergantung dari lama dan lokasi kehamilan, disebabkan oleh apapun yang
berhubungan dengan kehamilan, atau yang diperberat oleh kehamilan tersebut,
atau penanganannya, akan tetapi bukan kematiaan yang disebabkan oleh
kecelakaan atau kebetulan (Safrudin dan Hamidah, 2009). Kematian maternal
secara langsung atau tidak langsung sangat berpengaruh terhadap kualitas tumbuh
kembang bayi pada masa perinatal, bahkan sampai masa balita dan usia sekolah
(Kusumawati, 2012).
Millenium Development Goals (MDGs) atau Tujuan Pembangunan Milenium adalah Deklarasi Milenium hasil kesepakatan kepala negara dan
perwakilan dari 189 negara Perserikatan Bangsa-bangsa yang dimulai September
tahun 2000, berupa delapan butir tujuan untuk dicapai pada tahun 2015. Targetnya
adalah tercapai kesejahteraan rakyat dan pembangunan masyarakat pada
2015. Dari delapan butir tujuan MDGs, tujuan kelima adalah meningkatkan
kesehatan ibu, dengan target menurunkan angka kematian ibu sebesar tiga
perempatnya antara 1990 – 2015, serta yang menjadi indikator untuk monitoring
yaitu angka kematian ibu, proporsi pertolongan persalinan oleh tenaga kesehatan
terlatih, dan angka pemakaian kontrasepsi. Target AKI di Indonesia pada tahun
2015 adalah 102 kematian per 100.000 kelahiran hidup. Sementara
itu berdasarkan Survei Demografi dan Kesehatan Indonesia (SDKI) tahun 2012,
5
nifas) sebesar 359 per 100.000 kelahiran hidup. Angka ini masih cukup jauh dari
target yang harus dicapai pada tahun 2015.Penyebab utama kematian ibu
diklasifikasikan sebagai langsung dan tidak langsung, dimana penyebab langsung
berhubungan dengan komplikasi obstetrik selama masa kehamilan, persalinan dan
masa nifas (post-partum). Mayoritas penyebab kematian ibu adalah penyebab
langsung. Sementara, penyebab tidak langsung diakibatkan oleh penyakit yang
telah diderita ibu, atau penyakit yang timbul selama kehamilan dan tidak ada
kaitannya dengan penyebab langsung obstetrik, tapi penyakit tersebut diperberat
oleh efek fisiologik kehamilan.
Saat ini Indonesia masih menghadapi permasalahan tingginya angka kematian
maternal. Menurut Survei Demografi Kesehatan Indonesia, Indonesia memiliki
angka kematian maternal tertinggi di ASEAN pada tahun 2002-2003 sebesar 307
per 100000 kelahiran. Angka kematian maternal di Indonesia tahun 2007 adalah
228 per 100000 kelahiran pada tahun 2007 dan turun menjadi 220 per 100000
kelahiran pada tahun 2010. Hal tersebut menyebabkan Indonesia menduduki
peringkat 51 tertinggi angka kematian maternal di dunia menurut CIA World Factbook pada tahun 2010. Akan tetapi, angka kematian maternal meningkat lagi pada tahun 2011 menjadi 228 per 100000 kelahiran, yang membuat angka
kematian di Indonesia tertinggi di Asia Tenggara. Sesuai target nasional menurut
MDGs (Millennium Development Goals) yaitu menurunkan angka kematian maternal sebesar ¾ dari angka kematian maternal pada tahun 1990, yaitu 450 per
100000 menjadi 102 per 100000 kelahiran pada tahun 2015. Slamet Riyadi
Yuwono, Direktur Jenderal Bina Gizi dan Kesehatan Ibu Anak, mengatakan
bahwa pemerintah mungkin dapat mengurangi angka kematian maternal menjadi
162 per 100000 kelahiran hidup, akan tetapi itu jauh lebih tinggi dari target
MDGs. 5 Provinsi dengan angka kematian maternal tertinggi di Indonesia pada
tahun 2011 adalah Jawa Barat, Jawa Tengah, Jawa Timur, Sumatera Utara, dan
NTT.
Berbagai penelitian telah dilakukan terkait dengan Kematian Maternal
diantaranya adalah Probohapsari (2007) yang melakukan analisis faktor sosial
ekonomi terhadap angka kematian maternal di Jawa Timur pada tahun 2001-2004
menggunakan analisis regresi linier berganda, Chamidah (2008) menganalisis
6
itu penelitian tentang kematian maternal juga dilakukan oleh Darnah (2009)
dengan menggunakan model regresi poisson. Novita (2011) memodelkan
pengaruh kematian maternal menggunakan Geographically Weighted Poisson Regression. Pertiwi (2012) memodelkan pengaruh kematian maternal menggunakan Spatial Durbin Model. Berdasarkan penjelasan diatas, masih belum terdapat penelitian yang mengkaji perbandingan metode GCV dan UBR dalam
pemilihan titik knot optimum pada regresi nonparametrik spline truncated
multivariabel (studi kasus kematian maternal di Provinsi Jawa Timur sebagai
provinsi dengan kontribusi cukup tinggi dalam kematian maternal di Jawa Timur).
1.2Rumusan Permasalahan
Permasalahan dalam penelitian ini adalah :
1. Bagaimana kajian metode GCV untuk memilih titik knot optimal dalam model
regresi nonparametrik spline?
2. Bagaimana kajian metode UBR untuk memilih titik knot optimal dalam model
regresi nonparametrik spline?
3. Bagaimana perbandingan metode GCV dan UBR dalam aplikasinya dengan
menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013?
1.3Tujuan Penelitian
1. Mengkaji metode GCV untuk memilih titik knot optimal dalam model regresi
nonparametrik spline.
2. Mengkaji metode UBR untuk memilih titik knot optimal dalam model regresi
nonparametrik spline.
3. Membandingkan metode GCV dan UBR dalam aplikasinya dengan
menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013.
1.4Manfaat Penelitian
1. Hasil penelitian ini diharapkan dapat memberikan wacana baru yaitu aplikasi
nonparametrik di bidang sosial kesehatan.
2. Hasil penelitian ini dapat menjadi masukan kepada pihak pemerintah
7
kematian maternal agar tujuan kelima MDGs yaitu improve maternal health
dapat tercapai.
1.5Batasan Penelitian
1. Model regresi nonparametrik yang digunakan adalah Spline Truncated.
2. Data yang digunakan adalah data sekunder pada tahun 2013.
3. Metode estimasi yang digunakan dalam penelitian ini adalah Least Square.
4. Pemilihan titik knot pada Spline Truncated digunakan sebanyak 1,2, dan 3
8
9
BAB II
TINJAUAN PUSTAKA
Pada bagian ini akan dibahas mengenai beberapa landasan teori untuk terkait
untuk menyelesaikan permasalahan pada rumusan masalah penelitian mengenai angka
kematian maternal di Jawa Timur meliputi analisis regresi, regresi nonparametrik,
metode GCV, metode UBR, uji parameter, uji asumsi residual, serta definisi kematian
maternal dan faktor-faktor yang mempengaruhinya.
2.1 Analisis Regresi
Analisis regresi adalah salah satu metode statistika yang berfungsi untuk
mengetahui pola hubungan antara variabel respon dengan variabel prediktor. Terdapat
dua jenis variabel yang saling berkorelasi dalam analisis regresi yaitu variabel
independen yang biasa disimbolkan dengan dan variabel dependen yang biasa
disimbolkan dengan . Tujuan utama analisis regresi adalah mencari bentuk estimasi
untuk kurva regresi. Apabila dalam analisis regresi bentuk kurva regresi diketahui
maka didekati dengan model regresi parametrik (Budiantara,2005). Sedangkan bila
pola kurva regresi tidak diketahui maka digunakan regresi nonparametrik. Jika
terdapat komponen parametrik dan komponen nonparametrik maka digunakan regresi
semiparametrik.
2.2 Analisis Regresi Linier
Analisis regresi linier adalah analisis yang digunakan untuk memodelkan
hubungan antara variabel respon dan variabel prediktor dengan pola data berbentuk
garis yang linier. Apabila hanya terdapat satu variabel respon dan satu variabel
prediktor maka disebut sebagai regresi linier sederhana, sedangkan apabila terdapat
satu variabel respon dan lebih dari satu variabel prediktor maka disebut sebagai
regresi linier berganda.
Jika x adalah variabel prediktor, y adalah variabel respon dan terdapat hubungan fungsional antara variabel tersebut, maka fungsinya dapat dijabarkan sebagai berikut.
10
dimanay adalah suatu fungsi dari variabel prediktor dengan adalah error yang diasumsikan bersifat identik, independen dan berdistribusi normal (0,σ²).
2.3 Analisis Regresi Linier Berganda
Pendekatan regresi parametrik spline digunakan jika bentuk dari kurva regresi
antara variabel respon dengan variabel prediktor diketahui polanya. Adapun
persamaan untuk regresi parametrik secara umum adalah sebagai berikut.
(2.2)
Jika persamaan (2.3) ditulis dalam bentuk matrik adalah sebagai berikut.
̃ ̃ ̃ (2.3)
dimana :
̃ : yang merupakan vektor berukuran nx1
X: matrik berukuran nx(p+1) yang berisikan satu kolom angka 1dan p kolom data prediktor
̃ : vektor error random berukuran nx1
Metode OLS (Ordinary Least Square) dapat juga digunakan untuk memperoleh estimasi parameter pada regresi parametrik dengan meminimumkan jumlah kuadrat
eror. Estimasi untuk parameter dalam matrik diberikan oleh :
̂ ( ) ̃ (2.4)
2.4 Analisis Regresi Polinomial
Regresi Polinomial merupakan suatu model regresi linier yang bersifat additif
yang dibentuk dengan menjumlahkan masing-masing variabel prediktor yang
dipangkatkan meningkat sampai derajat ke-p. (Drapper dan Smith, 1992). Secara umum, model regresi polinomial adalah sebagai berikut.
(2.5)
2.5 Regresi Nonparametrik Spline
Pendekatan regresi nonparametrik spline digunakan jika kurva regresi antara
variabel respon dengan variabel prediktor tidak membentuk suatu pola atau tidak ada
informasi masa lalu yang lengkap mengenai pola data. Dalam banyak hal,
pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi asumsi-asumsi yang
11
dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal ini,
teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan. Regresi
nonparametrik memiliki fleksibilitas yang tinggi, karena data diharapkan mencari
sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas
peneliti (Eubank, 1988).
Secara umum, model regresi nonparametrik dapat disajikan sebagai berikut.
( ) , (2.6) dengan adalah variabel respon,dan ( ) adalah kurva rergresi yang tidak diketahui
bentuknya, dan adalah error yang diasumsikan berdistribusi N(0, ).
Spline merupakan model polynomial yang tersegmen. Polinomial tersegmen
memegang peranan penting dalam teori dan aplikasi statistika. Regresi spline
memiliki titik knot yang merupakan titik perpaduan yang menunjukkan perubahan
perilaku kurva pada selang yang berbeda (Hardle, 1990). Secara umum fungsi spline
( ) berorde dengan titik knot dapat dinyatakan sebagai berikut.
dengan merupakan parameter-parameter model dan merupakan orde spline
(Budiantara, 2001). Persamaan (2.7) bila disubstitusikan pada persamaan (2.6)
diperoleh persamaan regresi nonparametrik spline sebagai berikut.
∑ ∑ ( ) (2.8) dengan fungsi truncated diberikan oleh :
( ) ( )
(2.9)
Metode least square adalah metode yang digunakan untuk memperoleh estimasi parameter yaitu dengan meminimumkan jumlah kuadrat error. Apabila diasumsikan erroriberdistribusi normal independen dengan rata rata nol dan variansi adalah2, maka
i
y pada model regresi juga model normal dengan rata-rata ( ) dan
12
Dengan penyajian matriks diperoleh persamaan sebagai berikut.
Selanjutnya, persamaan diatas diturunkan terhadap vektor Tdan disamakan dengan nol, maka :
2.6 Pemilihan Titik Knot Optimal
Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal
yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot
yang paling optimal. Titik knot disebut juga parameter penghalus. Estimator spline
sangat tergantung pada parameter penghalus, sehingga pemilihan parameter
penghalus (smoothing parameter) merupakan hal yang penting dalam mencari estimator spline yang paling sesuai.Wahba, G. dan Wang, Y. dalam Diana, et all
(2012) memperlihatkan bahwa jika nilai parameter penghalus kecil maka akan
13
penghalus sangat besar maka akan menghasilkan estimator spline yang sangat mulus.
Akibatnya perlu dipilih parameter penghalus yang optimal agar diperoleh estimator
spline yang paling sesuai untuk mewakili data yang ada, (Diana et all, 2012). Adapun
metode yang dapat digunakan untuk pemilihan titik knot optimal antara lain: CV,
GCV, UBR dan GML. Dalam penelitian ini bertujuan untuk membandingkan hasil
pemilihan titik knot optimum dengan metode GCV dan metode UBR.
2.6.1 Metode Generalized Cross Validation (GCV)
Metode GCV menjadi metode yang sangat sering digunakan untuk memilih
titik knot yang paling optimal. Seperti yang telah dipaparkan sebelumnya, metode
GCV adalah bentuk modifikasi dari metode CV. Spline terbaik ditandai dengan titik
knot optimal yang diperoleh. Salah satu metode pemilihan titik knot optimal adalah
GCV. Model spline yang terbaik dengan titik knot optimal didapat dari nilai GCV
yang terkecil (Budiantara, 2005). Fungsi GCV diberikan oleh persamaan 2.18.
Nilai GCV.k/ diperoleh dengan menjumlahkan residual-residual kuadrat dari
̂( ) dibagi dengan faktor koreksi dari * , ( )-+ . Titik knot paling optimal dalam GCV.k/ adalah dengan meminimumkan fungsi GCV.k/, (Green dan
14
2.6.2 Metode Unbiassed Risk (UBR)
Metode UBR adalah salah satu metode yang juga digunakan untuk memilih
titik knot optimal dalam pemilihan model spline terbaik. Adapun formula yang
digunakan dalam metode UBR adalah sebagai berikut.
: banyak pengamatan
Secara kasat mata, perbedaan formula dari GCV dan UBR adalah terdapat
pada taksiran varians. Pada metode UBR terdapat taksiran varians, sementara pada
metode GCV tidak ada.
2.7 Kriteria Pemilihan Model Terbaik
Tujuan dari analisis regresi salah satunya adalah untuk mendapatkan model
terbaik. Semakin baik model yang diperoleh melalui analisis regresi, maka model
tersebut semakin mampu untuk menjelaskan hubungan antara variabel prediktor
15
pemilihan model terbaik adalah dengan menggunakan nilai Mean Square Error
(MSE).
nilai MSE yang didapatkan.
Selain itu, kriteria pemilihan model terbaik dapat pula dilihat berdasarkan nilai
Radj. Karena adanya kelemahan dalam perhitungan R
2
, banyak peneliti yang
menyarankan untuk menggunakan Adjusted R Square. Adapun rumus untuk mencari
Adjusted R Square adalah sebagai berikut.
Nilai Adjusted R Square dapat bernilai negatif, sehingga jika nilainya negatif, maka
nilai tersebut dianggap 0, atau variabel bebas sama sekali tidak mampu menjelaskan
varians dari variabel terikatnya.
Suatu sifat penting R2 adalah nilainya merupakan fungsi yang tidak pernah
menurun dari banyaknya variabel bebas yang ada dalam model. Oleh karenanya,
untuk membandingkan dua R2 dari dua model, orang harus memperhitungkan
banyaknya variabel bebas yang ada dalam model. Ini dapat dilakukan dengan
menggunakan “adjusted R square”. Istilah penyesuaian berarti nilai R2 sudah disesuaikan dengan banyaknya variabel (derajat bebas) dalam model. Memang,
R2 yang disesuaikan ini juga akan meningkat bersamaan meningkatnya jumlah
variabel, tetapi peningkatannya relatif kecil. Seringkali juga disarankan, jika variabel
bebas lebih dari dua, sebaiknya menggunakan adjusted R square.
2.8 Pemeriksaan Asumsi Residual Dalam Model Regresi
Uji asumsi residual (goodness of fit) dilakukan untuk mengetahui apakah residual yang dihasilkan telah memenuhi asumsi yakni identik, independen, dan bersdistribusi
16 2.8.1 Asumsi Residual Identik
Asumsi identik terpenuhi bila varians antar residual sama yakni2
dan tidak
terjadi heteroskedastisitas.
Var(yi)=Var(εi)=2; i=1, 2, ...,n (2.30)
Terpenuhi atau tidaknya asumsi identik dapat diketahui dengan melihat pola
sebaran scatter plot (diagram pencar) antara residual dan fits. Asumsi identik terpenuhi dapat dideteksi dengan sebaran plot yang tidak membentuk suatu pola
tertentu (tersebar secara acak). Bila sebaran plot membentuk pola tertentu
mengindikasikan adanya heteroskesdastisitas. Selain menggunakan metode grafis,
identifikasi heteroskesdastisitas dapat dilakukan dengan menggunakan uji Glejser.
Hipotesis yang digunakan adalah sebagai berikut:
0 = = = =
inimal ada satu =
Statistik uji yang digunakan sebagaimana persamaan 2.31.
∑ (| ̂ | | ̅|) ∑ (| | | ̂ |)
Daerah penolakan yakni tolak jika:
( ( ))atau Nilai k adalah banyaknya parameter model glejser.
2.8.2 Asumsi Residual Independen
Asumsi klasik kedua yang harus dipenuhi adalah tidak terdapat korelasi pada
residual yang ditunjukkan oleh nila kovarian antara dan sama dengan nol.
Persamaan untuk ACF adalah sebagai berikut (Wei, 1990):
( )
√ ( )√ ( ) (2.32) dimana:
= korelasi antara et dan et+k
= kovarian antara et danet+k
= Var (et) = Var (et+k)
Interval konfidensi dengan batas signifikansi atas dan bawah adalah sebagai
berikut:
17
√
√ (2.33) Bila terdapat lag yang keluar dari batas signifikansi maka dapat dikatakan asumsi
independen tidak terpenuhi (adanya autokorelasi). Begitu sebaliknya, bila tidak
terdapat lag yang keluar dari batas signifikansi menunjukkan bahwa asumsi
independen terpenuhi.
2.8.3 Asumsi Normalitas Residual
Residual dari model regresi harus mengikuti distribusi normal dengan mean nol dan varians σ2
. Adapun uji hipotesis yang digunakan untuk pengujian asumsi
normalitas residual adalah sebagai berikut :
0 Residual mengikuti distribusi normal
Residual tidak mengikuti distribusi normal
Uji asumsi distribusi normal dapat dilakukan menggunakan uji
Anderson-Darling. Anderson-Darling merupakan modifikasi dari uji Kolmogorov-Smirnov
(KS). Nilai-nilai kritis dalam uji KS tidak tergantung pada distribusi tertentu yang
sedang diuji sedangkan uji Anderson-Darling memanfaatkan distribusi tertentu dalam
menghitung nilai kritis. Ini memiliki keuntungan yang memungkinkan tes yang lebih
sensitif. Statistik uji yang digunakan adalah sebagai berikut.
1
F(Zi) = nilai fungsi distribusi kumulatif normal baku di zi
Selain itu, dalam penelitian ini juga menggunakan uji Shapiro-Wilk untuk
melakukan uji asumsi normalitas. Dengan hipotesis yang sama, keputusan uji
normalitas data adalah dengan melihat sig. atau p value < ( ) 0,05 maka H0 gagal
18 2.9 Uji Parameter Model
Uji parameter dilakukan untuk mengetahui apakah suatu variabel memberikan
pengaruh yang signifikan dalam model. Uji untuk parameter dapat diuji secara
serentak dan uji secara individu.
2.9.1 Uji Serentak (simultan)
Uji serentak merupakan uji parameter kurva regresi secara simultan
menggunakan uji . Hipotesis pada uji ialah sebagai berikut:
0
Statistik uji yang digunakan sebagaimana Persamaan 2.35.
=( ∑ ̂ ( ̂) ( ) ̅) (2.35) Berikut adalah Analysis of variance (ANOVA)dari model regresi:
Tabel 2.1 Analysis of Variance Model Regresi
Sumber
(Sumber :Draper and Smith, 1992)
m merupakan banyak variabel prediktor dan n adalah banyaknya data atau observasi pengamatan.
Tolak H0 jika ( ) atau p-value<α yang menunjukkan bahwa
paling sedikit terdapat satu parameter yang tidak sama dengan nol atau paling sedikit
19 2.9.2 Uji Individu
Uji individu digunakan untuk mengetahui parameter yang berpengaruh signifikan
secara individu terhadap model menggunakan uji . Hipotesis pada uji adalah
sebagai berikut:
0 0
0 =
Statistik uji yang digunakan sebagaimana persamaan 2.36.
1 2 pengamatan dan adalah banyaknya parameter.2.10Angka Kematian Maternal
Kematian maternal adalah kematian wanita yang terjadi pada saat kehamilan atau
dalam 42 hari setelah kehamilan, tidak tergantung dari lama dan lokasi kehamilan,
disebabkan oleh apapun yang berhubungan dengan kehamilan, atau yang diperberat
oleh kehamilan tersebut, atau penanganannya, akan tetapi bukan kematian yang
disebabkan oleh kecelakaan atau kebetulan (Safrudin dan Hamidah, 2009). Tingginya
jumlah kematian maternal menggambarkan tingkat kesadaran perilaku hidup sehat,
status gizi dan kesehatan ibu, kondisi kesehatan lingkungan serta tingkat pelayanan
kesehatan terutama pada ibu hamil, ibu melahirkan dan ibu pada masa nifas.
Terdapat tiga macam faktor yang mempengaruhi kematian maternal, yaitu
determinan dekat, determinan antara, dan determinan jauh (Wiknjosastro dalam
Kusumawati, 2012). Determinan dekat merupakan proses yang paling dekat dengan
kematian itu sendiri, yaitu kehamilan dan komplikasi dari kehamilan, persalinan dan
masa nifas (Wibowo dalam Srianingsih, 2011). Faktor determinan dekat antara lain:
ibu hamil yang mendapat tablet Fe3, ibu hamil yang melaksanakan program K1, ibu
hamil yang beresiko tinggi yang ditangani, ibu hamil yang mengalami perdarahan, ibu
hamil yang mengalami infeksi. Komplikasi persalinan dan nifas adalah komplikasi
yang terjadi menjelang persalinan, terutama adalah perdarahan (Srianingsih, 2011).
Determinan antara yaitu meliputi status kesehatan ibu (status gizi, anemia,
20
Faktor determinan antara, antara lain: ibu hamil yang menderita penyakit komplikasi,
ketersediaan pelayanan kesehatan dan status reproduksi ibu hamil.
Determinan jauh merupakan faktor-faktor yang secara tidak langsung
mempengaruhi kematian maternal, yaitu faktor sosiokultural, ekonomi, keagamaan,
dan faktor lain yang perlu dipertimbangkan dalam pelaksanaan penanganan kematian
ibu. Determinan jauh meliputi tingkat pendidikan, pekerjaan, dan kemiskinan ibu. Ibu
yang berpendidikan rendah menyebabkan kurangnya kesadaran mereka tentang
bahaya yang akan dialami jika kurang perhatian terhadap kesehatan. Determinan jauh
biasa dikenal dengan Empat Terlalu dan Tiga Terlambat. Empat Terlalu adalah hamil
di usia yang terlalu muda (di bawah 17 tahun), hamil terlalu sering (jumlah anak lebih
dari 3), dan hamil di usia yang terlalu tua (di atas 34 tahun), dan hamil terlalu dekat
(jarak anak kurang dari 2 tahun). Tiga Terlambat atau yang disebut dengan The Three Delays Models, adalah sebagai berikut (Srianingsih, 2011):
1. Terlambat dalam mengambil keputusan
Pengambilan keputusan apakah akan mencari fasilitas perawatan kesehartan atau
tidak oleh wanita akan dipengaruhi oleh faktor penyakit, sosial budaya
(pendidikan, pendapatan, budaya kawin muda), biaya tinggi, dan rendahnya
kualitas perawatan. Kurangnya kesadaran dan pengetahuan akan tanda
perdarahan menyebabkan wanita terlambat dalam mengambil keputusan. Tradisi
yang masih lekat pada masyarakat sampai sekarang adalah adanya dukun bayi
dan kekhawatiran akan biaya tinggi jika dirujuk ke rumah sakit.
2. Terlambat mencapai fasilitas rujukan
Terlambatnya wanita mencapai fasilitas rujukan dipengaruhi oleh trtansportasi
yang memadai, ketersediaan transport, kendala kurangnya ongkos untuk
transportasi. Infrastruktur dan geografis menyebabkan sulitnya akses menuju
sarana pelayanan kesehatan.
3. Terlambat mendapat pertolongan
Terlambat mendapat pertolongan terjadi karena rendahnya kualitas perawatan
seperti lemahnya manajemen dan administrasi kesehatan, kelengkapan
obat-obatan dan peralatan, kurangnya keterampilan staf kesehatan, dan buruknya
organisasi pelayanan dan infrastruktur.
Sementara, McCarthy dan Maine (1992) menjelaskan analisis determinan pada
21
sosial ekonomi dan faktor budaya; determinan antara berupa status kesehatan, status
reproduksi, akses pelayanan kesehatan, penggunaan pelayanan kesehatan, dan faktor
22
23
BAB III
METODOLOGI PENELITIAN
3.1Kajian Teoritis
Berdasarkan tujuan pertama dan tujuan kedua, maka akan dilakukan kajian terkait pemilihan titik knot menggunakan metode GCV dan UBR. Adapun langkah-langkah untuk mengkaji metode GCV adalah sebagai berikut.
a. Menghampiri fungsi ( ) dengan fungsi spline berderajat m dan knot sebanyak dapat dinyatakan sebagai berikut
b. Menggunakan metode least square untuk mengestimasi parameter dalam model regresi nonparametrik spline dengan menyelesaikan optimasi :
T
T
c. Mendapatkan estimasi dari kurva regresi nonparmetrik spline f x
denganpersamaan sebagai berikut.
24
e. Mendapatkan matriks
A
( )
k
dengan persamaan sebagai berikut.T -1 T
( ) ( )
Ak X X X X
f. Mendapatkan optimasi GCV dengan persamaan sebagai berikut.
2Sementara, langkah-langkah untuk mengkaji metode UBR adalah sebagai berikut.
dengan fungsi truncated diberikan oleh :
( ) ( )
25
T1, ,...,2 n
danX
k k1, ,...,2 kJ
adalah matriks X yang bergantung padatitik-titik knot.
c. Mendapatkan estimasi dari kurva regresi nonparmetrik spline f x
denganpersamaan sebagai berikut.
e. Mendapatkan matriks
A
( )
k
dengan persamaan sebagai berikut. T -1 T( ) ( )
Ak X X X X
f. Mendapatkan nilai σ² dengan persamaan sebagai berikut.
2
g. Mendapatkan optimasi UBR dengan persamaan sebagai berikut.
3.2Aplikasi Data Angka Kematian Maternal di Jawa Timur tahun 2013
3.2.1 Kerangka Konsep Angka Kematian Maternal
26
: Variabel-variabel yang digunakan dalam penelitian
Gambar 3.1. Faktor yang mempengaruhi angka kematian maternal
Sementara, karena keterbatasan data, maka variabel yang digunakan dalam penelitian ini berdasarkan penelitian sebelumnya yang dilakukan oleh Nuraziza Arfan pada tahun 2013 yang meneliti tentang pemodelan regresi nonparametrik spline pada kasus angka kematian maternal di Jawa Timur. Adapun variabel yang digunakan dalam penelitian ini antara lain: persentase ibu hamil yang mendapatkan tablet Fe1, persentase ibu hamil yang melaksanakan program K1, persentase ibu hamil beresiko tinggi/komplikasi yang ditangani, persentase penduduk perempuan yang pernah kawin dibawah umur, persentase penduduk perempuan dengan pendidikan paling tinggi SD.
3.2.2 Variabel Penelitian
Berikut adalah variabel-variabel yang digunakan dalam penelitian dengan definisi operasionalnya.
- Ibu hamil yang mendapat tablet Fe3
- Ibu hamil yang melaksanakan program K1
- Ibu hamil beresiko tinggi yang ditangani -Ibu hamil yang mengalami perdarahan -Ibu hamil yang mengalami infeksi
-Ibu hamil yang menderita penyakit
komplikasi
-Ketersediaan pelayanan kesehatan -Status reproduksi ibu hamil
- Perempuan yang berpendidikan rendah
- Perempuan yang kawin terlalu muda -Perempuan yang hamil terlalu sering -Perempuan yang hamil terlalu tua -Perempuan yang hamil terlalu dekat -Perempuan yang terlambat mengambil
keputusan
-Perempuan yang terlambat ke fasilitas
kesehatan
-Perempuan yang terlambat mendapat
pertolongan
27
Tabel 3.1 Variabel Penelitian Variabel Nama Variabel
Y Angka kematian maternal
x1
Persentase ibu hamil yang mendapatkan tablet Fe1
x2
Persentase ibu hamil melaksanakan program K1
x3
Presentase ibu hamil berisiko tinggi/komplikasi yang ditangani
x4
Persentase penduduk perempuan yang pernah kawin di bawah umur
x5
Persentase penduduk perempuan dengan pendidikan paling tinggi SD
Definisi operasional variabel yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Variabel y menyatakan hasil bagi antara jumlah kematian ibu hamil, ibu bersalin, dan ibu nifas dengan jumlah lahir hidup dikali 100000.
2. Variabel x1 menyatakan hasil bagi jumlah ibu hamil yang mendapatkan tambahan vitamin yang dapat mencegah anemia dengan jumlah ibu hamil, dinyatakan dalam persentase.
3. Variabel x2 menyatakan hasil bagi antara jumlah ibu hamil yang melakukan kontak pertama dengan sarana kesehatan untuk mendapatkan pelayanan antenatal dengan jumlah ibu hamil, yang dinyatakan dalam persentase.
4. Variabel x3 menyatakan hasil bagi jumlah ibu hamil yang mempunyai kondisi berisiko/berbahaya pada waktu kehamilan maupun persalinan dan telah ditangani sesuai prosedur dengan 20% jumlah ibu hamil, yang dinyatakan dalam persentase.
5. Variabel x4 menyatakan persentase penduduk perempuan usia 10 tahun ke atas yang pernah kawin menurut kabupaten/kota dan umur kawin pertama di bawah 17 tahun.
28
Berdasarkan variabel-variabel yang digunakan yaitu terdapat 5 variabel prediktor dan 1 variabel respon, maka dapat dibuat model regresi nonparametrik spline yang sesuai dengan menggunakan 1 titik knot, 2 titik knot dan 3 titik knot yaitu sebagai berikut.
Model regresi nonparametrik spline dengan 1 titik knot :
Model regresi nonparametrik spline dengan 2 titik knot :
Model regresi spline dengan 3 titik knot :
3.2.3 Langkah Analisis Aplikasi Data
Adapun pada aplikasi data langkah-langkah analisis yang dilakukan adalah sebagai berikut.
a. Membuat scatter plot antara variabel respon (y) dengan variabel prediktor (x). b. Memodelkan data dengan model regresi nonparametrik spline dengan satu ttik
knot, dua titik knot, dan tiga titik knot.
c. Menghitung niai GCV dan UBR untuk masing masing model regresi nonparametrik spline.
d. Menentukan titik knot optimal berdasarkan nilai GCV dan UBR.
e. Melakukan pengujian signifikansi parameter yang dihasilkan dari estimasi model regresi nonparametrik spline dengan metode GCV dan metode UBR
29
g. Membandingkan kebaikan model regresi nonparametrik spline dengan titik knot
optimal menggunakan metode GCV dan UBR berdasarkan kriteria nilai
R
2adjdan nilai MSE.30
31
BAB IV
HASIL DAN PEMBAHASAN
Pada bab ini dilakukan penjabaran mengenai metode pemilihan titik knot, yaitu
Generalized Cross Validation (GCV) dan Unbiassed Risk (UBR) sesuai dengan tujuan penelitian yang telah dijelaskan pada Bab 1. Pada langkah selanjutnya, diberikan aplikasi pada data angka kematian maternal dan faktor-faktor yang mempengaruhi di provinsi Jawa Timur menggunakan regresi nonparametrik spline multivariabel dengan menggunakan 1 titik knot, 2 titik knot, 3 titik knot dan kombinasi titik knot. Tujuan menerapkan aplikasi data adalah untuk membandingkan model regresi nonparametrik spline dengan menggunakan metode GCV dan UBR sebagai metode pemilihan titik knot optimal.
1.1Estimator Spline dalam Regresi Nonparametrik
Fungsi spline merupakan jumlahan dari fungsi polinomial dengan suatu fungsi
truncated. Dalam bagian ini dibahas tentang model regresi nonparametrik, dimana estimasi kurva f dilakukan dengan menggunakan spline. Diberikan data berpasangan (xi, yi) dan hubungan antara xi dan yi diasumsikan mengikuti model regresi diperoleh model regresi spline sesuai dengan persamaan (2.6). Apabila persamaan (2.6) disajikan dalam bentuk matriks, diperoleh bentuk sebagai berikut.
1 1 1
Bentuk kurva regresi f(x) dari persamaan diatas diasumsikan tidak diketahui, sedangkan error εi saling independen dengan rata-rata nol dan varian σ². Fungsi
spline pada persamaan (2.7) dapat dijabarkan dalam bentuk sebagai berikut.
1
2
0 1 2 1
( )i i i ... m im i-k m ... J i-kJ m
f x x x x x x
32
Atau dapat ditulis juga dengan persamaan berikut.
1 2, ,...,
X J
Y k k k
Selanjutnya, estimasi parameter β diperoleh dengan menggunakan metode least square, dengan menyelasikan optimasi sebagai berikut.
diperoleh dengan menyelasikan optimasi yang meminimumkan jumlah kuadrat error
terhadap vektor T, kemudian hasilnya disama dengankan nol sebagai berikut.
33
Jumlah kuadrat error dengan penjabaran matriksnya diberikan sebagai berikut.
2 T
Bila persamaan diatas diturunkan terhadap vektor Tdan hasilnya
disamadengankan nol, maka diperoleh :
T T T T TAkibatnya, estimasi untuk kurva regresi spline dengan knot K diberikan oleh :
34
persamaan GCV diatas dapat ditulis juga dengan persamaan sebagai berikut :
2Berdasarkan persamaan yang ditulis diatas dapat dilihat bahwa GCV merupakan hasil generalisasi metode CV yang telah diberi bobot. Dimana persamaan CV adalah sebagai berikut.
dari penjabaran diatas, diperolah optimasi berikut untuk memperoleh titik knot optimal dengan menggunakan metode GCV .
35
Nilai GCV terkecil yang dihasilkan akan memberikan titik knot yang optimal.
4.3 Metode Unbiassed Risk (UBR) dalam Regresi Nonparametrik Spline
Metode UBR adalah digunakan untuk mencari titik knot optimal ketika ada informasi mengenai σ² atau σ² diketahui. Penggunaan metode UBR dalam pemilihan titik knot yang optimal sangat bergantung pada nilai estimasi σ². Artinya, ketika estimasi σ² yang dihasilkan cukup baik, maka metode UBR akan berkerja dengan baik pula. Berikut rumus yang digunakan untuk mencari titik knot dengan metode UBR.
Estimasi dari σ² dapat diperoleh dengan rumus sebagai berikut.
2
36
Titik knot optimal dihasilkan dengan nilai UBR yang terkecil.
4.4 Statistika Deskriptif Angka Kematian Maternal di Provinsi Jawa Timur
Pada bagian ini, diberikan aplikasi model regresi nonparametrik spline pada data angka kematian maternal di Jawa Timur dengan jumlah knot yang berbeda, yaitu 1 titik knot, 2 titik knot, 3 titik knot dan kombinasi titik knot. Penelitian ini bertujuan untuk membandingkan model regresi nonparametrik spline dengan menggunakan metode GCV dan UBR dalam memilih titik knot yang optimal. Berikut gambaran statistika deskriptif masing masing variabel yang digunakan.
Tabel 4.1 Statistika deskriptif angka kematian maternal dan variabel yang diduga berpengaruh Variabel Jumlah Rata-rata Varians Jumlah Minimum Maximum
Y 38 107,51 1502,23 4085,27 26,06 230,64
Berdasarkan Tabel 4.1 yang menjelaskan statistika deskriptif, terlihat bahwa variabel angka kematian maternal (Y) mempunyai nilai terendah sebesar 26,06 persen yaitu terdapat di kabupaten Madiun, sebaliknya nilai tertinggi angka kematian maternal sebesar 230,64 persen terdapat di kabupaten Probolinggo. Jumlah kabupaten keseluruhan sebanyak 38 di Provinsi Jawa Timur mempunyai rata-rata angka kematian maternal sebesar 107,51 dengan varians 1502,23. Begitu juga untuk variabel prediktor, variabel persentase ibu hamil yang mendapatkan tablet Fe1 (X1)
37
mendapatkan tablet Fe1 mempunyai rata-rata sebesar 91,34 persen dengan varians
sebesar 52,83.
Berikut juga diberikan scatter plot dari data angka kematian maternal di provinsi Jawa Timur dengan faktor faktor yang diduga mempengaruhinya sebagai pendugaan pola data.
38
Gambar 4.2 Uji Normalitas Angka Kematian Maternal
Berdasarkan Gambar 4.2 dapat dilihat bahwa Angka Kematian Maternal berdistribusi normal dengan nilai p-value yang lebih dari (0,05), yaitu 0,076.
4.5 Pemodelan Angka Kematian Maternal di Provinsi Jawa Timur Menggunakan Metode GCV
Berikut disajikan aplikasi pemodelan regresi nonparametrik spline multivariabel data angka kematian maternal dengan menggunakan Generalized Cross Validation (GCV) sebagai metode pemilihan titik knot optimal
4.5.1 Pemilihan Titik Knot Optimal dengan Satu Titik Knot
Dalam memodelkan data dengan menggunakan regresi nonparametrik spline, langkah awal yang dilakukan adalah menentukan titik knot optimal yang berkaitan dengan nilai GCV terkecil. Berikut disajikan output 10 nilai GCV terkecil pada data angka kematian maternal di Jawa Timur tahun 2013 dengan menggunakan satu titik knot.
39
Lanjutan Tabel 4.2. Nilai GCV dengan menggunakan 1 titik knot Knot
Berdasarkan tabel diatas, nilai GCV minimum adalah sebesar 0,02775 dengan titik knot optimum untuk masing masing variabel adalah sebagai berikut.
k1=8,551 k 2=2,063 k 3=2,188
k 4=1,857 k 5=32,19
Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan satu titik knot.
4.5.2 Pemilihan Titik Knot Optimal dengan Dua Titik Knot
40
Berdasarkan tabel diatas, nilai GCV minimum adalah sebesar 0,03688 dengan titik knot optimum untuk masing masing variabel adalah sebagai berikut.
Pada variabel x1 :
Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan dua titik knot.
41
4.5.3 Pemilihan Titik Knot Optimal dengan Tiga Titik Knot
Berdasarkan hasil nilai GCV dari pemilihan titik knot optimal dengan menggunakan satu dan dua titik knot akan dibandingkan dengan hasil dari GCV menggunakan tiga dan kombinasi titik knot untuk memperoleh nilai GCV yang paling minimum. Berikut disajikan output 5 nilai GCV terkecil dengan menggunakan tiga titik knot.
Tabel 4.4. Nilai GCV dengan menggunakan 3 titik knot Knot
GCV
X1 X2 X3 X4 X5
12,4 3,997 4,707 5 59,67 0,02022 13,94 4,77 5,714 6,257 70,66
14,33 4,963 5,966 6,571 73,4
12,4 3,997 4,707 5 59,67 0,02037 13,94 4,77 5,714 6,257 70,66
14,71 5,157 6,218 6,886 76,15
12,4 3,997 4,707 5 59,67 0,02098 14,33 4,963 5,966 6,571 73,4
14,71 5,157 6,218 6,886 76,15
12,02 3,803 4,455 4,686 56,92 0,02122 13,94 4,77 5,714 6,257 70,66
14,33 4,963 5,966 6,571 73,4
12,02 3,803 4,455 4,686 56,92 0,02129 13,94 4,77 5,714 6,257 70,66
14,71 5,157 6,218 6,886 76,15
Berdasarkan tabel diatas, nilai GCV minimum adalah sebesar 0,02022 dengan titik knot optimum untuk masing masing variabel adalah sebagai berikut.
Pada variabel x1 :
k1=12,4; k2=13,94; k3=14,33
Pada variabel x2 :
k4=3.997; k5=4.77; k6=4.963
Pada variabel x3 :
k7=4,707; k8=5,714; k9=5,966
Pada variabel x4 :
42 Pada variabel x5 :
k13=59,67; k14=70,66; k15=73,4
Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan tiga titik knot.
4.5.4 Pemilihan Titik Knot Optimal dengan Kombinasi Titik Knot
Nilai minimum GCV dengan menggunakan satu, dua dan tiga titik knot akan dibandingkan dengan nilai GCV kombinasi dari knot-knot tersebut. Berikut ditampilkan 5 nilai GCV terkecil dengan menggunakan kombinasi titik knot.
Tabel 4.5 Nilai GCV dengan menggunakan kombinasi titik knot
Kombinasi titik knot Knot GCV
43
knot optimal dengan menggunakan metode GCV diperoleh nilai GCV paling minimum yaitu sebesar 0,008796 yaitu menggunakan titik knot kombinasi 2-3-2-2-1. Berikut hasil ringkasan pemilihan titik knot dengan metode GCV.
Tabel 4.6 Ringkasan hasil pemilihan titik knot dengan
metode GCV
Titik Knot Nilai GCV
Satu titik knot 0,02775
Dua titik knot 0,03688
Tiga titik knot 0,02022
Kombinasi titik knot (2-3-2-2-1)
0,008796
Sehingga untuk analisis selanjutnya menggunakan titik knot kombinasi 2-3-2-2-1 dengan model regresi nonparametrik spline sebagai berikut.
Berikut ditampilkan hasil estimasi parameter model regresi nonparametrik spline dengan menggunakan titik knot paling minimum yaitu menggunakan kombinasi titik knot (2-3-2-2-1).
44
β7 7 -0,576185
Lanjutan Tabel 4.7 Estimasi parameter model Parameter Estimator
Berdasarkan model yang diperoleh dengan menggunakan metode GCV dalam pemilihan titik knot optimal yaitu dengan menggunakan kombinasi titik knot (2-3-2-2-1) menghasilkan nilai R2
adj sebesar 92,4%. Artinya, variabel prediktor
mempengaruhi angka kematian maternal sebesar 92,4%.
4.5.5 Pengujian Asumsi Residual Identik
Hipotesis yang digunakan adalah sebagai berikut.
2 2 2 2
Pengujian identik dilakukan untuk mengetahui apakah residual memiliki varians yang sama (homogen) atau tidak. Pengujian identik dilakukan dengan menggunakan uji glejser, dengan output sebagai berikut.
Tabel 4.8. ANOVA Uji Glejser
Sumber df SS MS Fhit P value
Regresi 15 0,004654 0,0003103 0,4982 0,9056 Error 15 0,009341 0,0006227