PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE MULTIVARIABEL DENGAN MENGGUNAKAN METODE GCV DAN UBR DALAM PEMILIHAN TITIK KNOT OPTIMAL (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) - ITS Repository

(1)

TESIS – SS14 2501

COMPARISON OF MULTIVARIABLE SPLINE

NONPARAMETRIC REGRESSION MODEL USING

GENERALIZED CROSS VALIDATION (GCV) AND

UNBIASSED RISK (UBR) IN SELECTING THE

OPTIMAL KNOT POINTS

(Case Study : Data of Maternal Mortality Rate in East Java)

Sulistya Umie Ruhmana Sari NRP. 1314 201 030

SUPERVISOR :

Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si

PROGRAM OF MAGISTER DEPARTMENT OF STATISTICS

FACULTY OF MATHEMATICS AND NATURAL SCIENCES INSTITUT TEKNOLOGI SEPULUH NOPEMBER

GENERALIZED CROSS VALIDATION (GCV) AND

UNBIASSED RISK (UBR) IN SELECTING THE

OPTIMAL KNOT POINTS

(Case Study : Data of Maternal Mortality Rate in East Java)

SUPERVISOR :

GENERALIZED CROSS VALIDATION (GCV) AND

UNBIASSED RISK (UBR) IN SELECTING THE

OPTIMAL KNOT POINTS

(Case Study : Data of Maternal Mortality Rate in East Java)

SUPERVISOR :

(2)

TESIS – SS14 2501

PERBANDINGAN MODEL REGRESI

NONPARAMETRIK SPLINE MULTIVARIABEL

DENGAN MENGGUNAKAN METODE

GENERALIZED

CROSS VALIDATION

_{(GCV) DAN}

UNBIASSED RISK

(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL

(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)

DOSEN PEMBIMBING :

PROGRAM MAGISTER JURUSAN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER

CROSS VALIDATION

_{(GCV) DAN}

UNBIASSED RISK

(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL

(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)

CROSS VALIDATION

_{(GCV) DAN}

UNBIASSED RISK

(UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL

(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)

(3)

(4)

vii DAFTAR ISI

Halaman

ABSTRAK ... i

ABSTRACT ... iii

KATA PENGANTAR ... v

DAFTAR ISI ... vii

DAFTAR TABEL ... ix

DAFTAR GAMBAR ... xi

DAFTAR LAMPIRAN ... xiii

BAB I PENDAHULUAN ... 1

1.1Latar Belakang ... 1

1.2Rumusan Permasalahan ... 6

1.3Tujuan Penelitian ... 6

1.4 Manfaat Penelitian ... 6

1.5 Batasan Penelitian ... 7

BAB II TINJAUAN PUSTAKA ... 9

2.1 Analisis Regresi ... 9

2.2 Analisis Regresi Linier ... 9

2.3 Analisis Regresi Linier Berganda ... 10

2.4 Analisis Regresi Polinomial... 10

2.5 Regresi Nonparametrik Spline ... 10

2.6 Pemilihan Titik Knot Optimal ... 12

2.6.1 Metode GCV ... 13

2.6.2 Metode UBR ... 14

2.8 Kriteria Pemilihan Model Terbaik ... 14

2.9 Pemeriksaan Asumsi Residual dalam Model Regresi ... 15

2.9.1 Asumsi Residual Identik ... 16

2.9.2 Asumsi Residual Independen ... 16

2.9.3 Asumsi Normalitas Residual ... 17

(5)

viii

2.10.1 Uji Serentak ... 18

2.10.2 Uji Individu ... 19

2.11 Angka Kematian Maternal ... 19

BAB III METODOLOGI PENELITIAN ... 23

3.1 Kajian Teoritis ... 23

3.2 Aplikasi Data ... 25

3.2.1 Kerangka Konsep ... 25

3.2.2 Variabel Penelitian ... 26

3.2.3 Langkah Analisis... 28

BAB IV HASIL DAN PEMBAHASAN ... 31

4.1 Estimator Spline dalam Regresi Nonparametrik ... 31

4.2 Metode GCV dalam Regresi Nonparamertik Spline ... 33

4.3 Metode UBR dalam Regresi Nonparamertik Spline ... 35

4.4 Statistika Deskriptif ... 36

4.5 Pemodelan Angka Kematian Maternal Menggunakan Metode GCV ... 38

4.6 Pemodelan Angka Kematian Maternal Menggunakan Metode UBR ... 47

4.7 Perbandingan Metode GCV dan UBR ... 55

BAB V KESIMPULAN DAN SARAN ... 57

5.1 Kesimpulan ... 57

5.2 Saran ... 58

DAFTAR PUSTAKA ... 59

LAMPIRAN ... 63

(6)

ix

DAFTAR TABEL

Halaman

Tabel 2.1 ANOVA model regresi ... 19

Tabel 3.1 Variabel penelitian ... 27

Tabel 4.1 Statistika deskriptif ... 36

Tabel 4.2 Nilai GCV dengan 1 titik knot ... 38

Tabel 4.5 Nilai GCV dengan kombinasi titik knot ... 42

Tabel 4.6 Ringkasan hasil pemilihan titik knot dengan metode GCV ... 43

Tabel 4.7 Estimasi koefisien parameter ... 43

Tabel 4.8 ANOVA uji glejser ... 44

Tabel 4.9 Uji normalitas ... 45

Tabel 4.10 Hasil estimasi parameter model regresi dengan metode GCV ... 46

Tabel 4.11 Pengujian parameter model regresi secara parsial ... 47

Tabel 4.12 Nilai UBR dengan 1 titik knot ... 48

Tabel 4.15 Nilai UBR dengan kombinasi titik knot ... 51

Tabel 4.16 Ringkasan hasil pemilihan titik knot dengan metode UBR ... 52

Tabel 4.17 Estimasi koefisien parameter ... 52

Tabel 4.18 ANOVA uji glejser ... 53

Tabel 4.19 Uji normalitas ... 54

(7)

x

(8)

xi

DAFTAR GAMBAR

Halaman

Gambar 3.1 Diagram Faktor ysng Mempengaruhi AKM ... 26

Gambar 4.1 Scatter plot AKM dan Faktor-Faktor yang Mempengaruhi ... 37

Gambar 4.2 Uji Normalitas AKM ... 37

Gambar 4.3 ACF plot residual pemodelan regresi dengan metode GCV ... 44

(9)

xii

(10)

xiii

DAFTAR LAMPIRAN

Halaman

Lampiran 1. Data angka kematian maternal dan variabel yang diduga berpengaruh ... 63

Lampiran 2. Program untuk mencari nilai GCV dan UBR dengan satu titik knot ... 64

Lampiran 3. Program untuk mencari nilai GCV dan UBR dengan dua knot... 66

Lampiran 4. Program untuk mencari nilai GCV dan UBR dengan tiga titik knot ... 69

Lampiran 5. Program untuk mencari nilai GCV dan UBR dengan kombinasi titik knot ... 74

Lampiran 6. Program untuk estimasi parameter ... 79

Lampiran 7. Program untuk uji asumsi residual ... 82

(11)

xiv

(12)

v

KATA PENGANTAR

Alhamdulillah, puji syukur tak terhingga dipanjatkan kehadirat Allah SWT

karena berkat limpahan rahmat dan hidayah-Nya sehingga penulis dapat

menyelesaikan tesis yang berjudul :

Perbandingan Model Regresi Nonparametrik Spline Multivariabel Menggunakan

Generalized Cross Validation (GCV) dan Unbiassed Risk (UBR) dalam Pemilihan

Titik Knot Optimal. Studi kasus : Angka Kematian Maternal di Jawa Timur

2013.Tesis ini disusun sebagai salah satu syarat untuk menyelesaikan studi pada

Program Studi Statistika, Program Pascasarjana, Fakultas Matematika dan Ilmu

Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Surabaya.

Selesainya laporan Tesis ini tak lepas dari peranan berbagai pihak. Oleh karena

itu pada kesempatan ini penulis mengucapkan terimakasih yang sedalamnya kepada :

1. Bapak I Nyoman Budiantara dan Bapak Wahyu Wibowo selaku dosen

pembimbing yang telah bersedia meluangkan waktu di tengah kesibukannya

untuk membimbing penulis.

2. Ibu Santi Wulan Purnami dan Ibu Vita Ratnasari selaku penguji yang telah

memberikan kritik, saran serta masukan demi kesempurnaan tesis ini.

3. Bapak Dr. Suhartono, M.Sc selaku ketua Jurusan Statistika ITS dan Staff,

karyawan TU, RBS Jurusan Statistika ITS

4. Bapak Dr.rer. pol.HeriKuswanto, M.Si selaku kaprodi pasca sarjana Jurusan

Statistika ITS

5. Bapak dan Ibu dosen pengajar Jurusan Statistika ITS, terimakasih ilmu yang

telah diberikan

6. Kedua orang tua yang sangat saya cintai dan hormati, Bapak Seto Wardoyo dan

Ibu Ummu Kultum, terimakasih atas segala doa yang tidak pernah berhenti dan

dukungan baik moral maupun meteril yang tiada henti. Semoga selalu bisa

membahagiakan Abi dan Umi.

7. Mbak Murni dan Mbak Dyah, terimakasih dukungan dan motivasi yang

(13)

vi

8. Meriska, Lela, Renny, Surya, Muktar, terimakasih telah menjadi keluarga yang

baik selama di Surabaya dan semua rekan-rekan pascasarjana Statistika lainnya,

terimakasih telah menjadi keluarga baru selama di Surabaya

Besar harapan penulis agar Tesis ini bermanfaat dan dapat menambah wawasan

keilmuan. Penulis menyadari sepenuhnya bahwa Tesis ini belum sempurna, oleh

karena itu saran dan kritik yang membangun sangat penulis harapkan.

Surabaya, Januari 2016

(14)

i

PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE MULTIVARIABEL DENGAN MENGGUNAKAN METODE GCV DAN UBR

DALAM PEMILIHAN TITIK KNOT OPTIMAL

(Studi Kasus Data Angka Kematian Maternal di Jawa Timur)

Nama Mahasiswa : Sulistya Umie Ruhmana Sari

NRP : 1314201030

Pembimbing 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Pembimbing 2 : Dr. Wahyu Wibowo, M.Si

ABSTRAK

Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot yang paling optimal. Terdapat beberapa metode yang dapat digunakan untuk memilih titik knot optimal, antara lain Generalized Cross Validation (GCV), Unbiassed Risk

(UBR) dan Generalized Maximum Likelihood (GML). Penelitian ini akan membahas tentang perbandingan model regresi spline nonparametrik multivariabel dengan menggunakan metode GCV dan UBR sebagai metode pemilihan titik knot optimal. Kriteria pemilihan model terbaik adalah berdasarkan nilai MSE dan nilai R2adj.

Selanjutnya akan dilakukan pemodelan menggunakan data Angka Kematian Maternal di Jawa Timur dengan menggunakan regresi nonparametrik spline. Pada hasil penelitian didapatkan dengan menggunakan metode GCV, titik knot optimum adalah menggunakan kombinasi titik knot 2-3-2-2-1 yang menghasilkan nilai MSE 0,002059 dan nilai R2adj sebesar 92,4%. Selanjutnya pada uji parameter didapatkan nilai bahwa

semua variabel berpengaruh signifikan dengan semua asumsi residual terpenuhi. Sementara, dengan menggunakan metode UBR didapatkan hasil yang berbeda. Titik knot optimum adalah menggunakan satu titik knot yang menghasilkan nilai MSE sebesar 0,01315 dan nilai R2adj sebesar 52,15%. Pada uji parameter didapat bahwa

semua variabel tidak berpengaruh signifikan serta asumsi normalitas residual yang tidak terpenuhi. Hal ini membuktikan bahwa pemodelan regresi nonparametrik dengan menggunakan metode GCV lebih baik untuk data berdistribusi normal seperti angka kematian maternal dibandingkan menggunakan metode UBR dalam pemilihan titik knot.

(15)

ii

(16)

iii

COMPARISON OF MULTIVARIABLE NONPARAMETRIK SPLINE REGRESSION MODEL USING GCV AND UBR METHODS IN SELECTION

THE OPTIMAL KNOT POINT

(Case Study : Maternal Mortality Rate in East Java)

Name : Sulistya Umie Ruhmana Sari NRP : 1314 201 030

Supervisor 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Supervisor 2 : Dr. Wahyu Wibowo, M.Si

ABSTRACT

In the nonparametric regression spline, determine the optimal point knot becomes very important. Best spline regression model resulting from the selection of the most optimal point knots. There are several methods that can be used to select the optimal knots points, among others Generalized Cross Validation (GCV), Unbiassed Risk (UBR) and Generalized Maximum Likelihood (GML). This research will discuss about the comparison of spline nonparametric regression multivariable models using the GCV and UBR as the method for selecting the optimal knots point. Criteria for selection of the best model is based on the MSE. Next will be using the data modeling Maternal Mortality in East Java using nonparametric regression spline. In the research results obtained by using the method of GCV, knots optimum point is to use a combination of 2-3-2-2-1 knots point that generates the MSE 0.0009965 and R2adj is

92,4%. Furthermore, the test parameter values obtained that all variables have a significant effect with all the residual assumptions are met. While, by using UBR obtained different results. Knots optimum point is to use a single point of knots that generate value MSE of 0.008486 and R2adj sebesar 52,15%. In the test parameters

obtained that all variables not significant and residual normality assumptions were not met. This proves that the nonparametric regression modeling using GCV method is better for maternal mortality data comparison method in the selection of UBR point knots.

(17)

iv

(18)

1

BAB I

PENDAHULUAN

1.1Latar Belakang

Analisis regresi adalah suatu metode statistika yang dilakukan untuk

mengetahui pola hubungan antara satu atau lebih variabel. Bentuk pola hubungan

antara variabel prediktor dengan variabel respon dapat diidentifikasi berdasarkan

informasi masa lalu atau dengan menggunakan scatter plot (Hardle, 1990). Selain itu analisis regresi bertujuan untuk melakukan sebuah prediksi (Budiantara, 2009).

Namun dalam konsep regresi, prediksi hanya boleh dilakukan dalam rentang data

dari variabel-variabel yang digunakan untuk membentuk model regresi tersebut.

Analisis regresi dapat diterapkan pada data yang mempunyai korelasi antar

variabel, oleh karena itu sebelum melakukan analisis regresi, sebaiknya

menyelidiki apakah variabel-variabel yang digunakan mempunyai korelasi atau

tidak. Tujuan utama dalam melakukan analisis regresi adalah untuk mencari

bentuk estimasi kurva regresi.

Terdapat 3 pendekatan dalam melakukan estimasi kurva regesi yaitu

pendekatan parametrik, nonparametrik dan pendekatan semiparametrik.

Pendekatan parametrik digunakan ketika bentuk kurva regresi diketahui polanya,

baik berupa linier, kuadratik, kubik, polinomial derajat p, eksponen, dll. Selain itu, pada pendekatan parametrik juga harus mempunyai informasi masa lalu terhadap

karakteristik data yang digunakan agar mendapatkan model regresi yang baik.

Dalam model regresi parametrik, estimasi kurva regresi akan ekuivalen dengan

estimasi terhadap parameter-parameter dalam model (Budiantara, 2009).

Sebaliknya, pendekatan nonparametrik digunakan jika bentuk kurva regresi tidak

diketahui polanya dan bisa juga digunakan ketika tidak adaatau keterbatasan

informasi masa lalu terhadap karakteristik data yang digunakan. Beberapa tahun

terakhir, pendekatan regresi nonparametrik menjadi alat yang sangat bermanfaat

bagi para statistikawan yang digunakan untuk analisis, prediksi dan peramalan,

(Memmedli dan Nizamitdinov, 2012). Dalam pendekatan nonparametrik, kurva

(19)

2

mempunyai fleksibilitas yang tinggi, artinya data diharapkan dapat mencari

sendiri bentuk estimasinya, tanpa adanya pengaruh dari subjektivitas si

peneliti.Terdapat beberapa metode yang telah banyak digunakan untuk

memodelkan regresi dengan menggunakan pendekatan nonparametrik yaitu antara

lain: Kernel (Hardle,1990), Spline (Wahba, 1990; Budiantara,2009), K-Nearest Neighbor (Hardle,1990), Histogram (Green dan Silverman, 1994), Estimator Deret Fourier (Eubank,1988), MARS, Deret Orthogonal, Wavelets, Neural

Network. Dari berbagai metode yang banyak digunakan, spline adalah salah satu

metode yang mempunyai banyak kelebihan.

Spline adalah salah satu bentuk estimator yang juga seringkali digunakan

dalam regresi nonparametrik karena mempunyai banyak kelebihan. Spline sebagai

pendekatan pola data dikenalkan oleh Whittaker pada tahun 1923. Selanjutnya,

Spline dipopulerkan oleh Schoenberg pada tahun 1942. Sedangkan spline yang

didasarkan pada suatu persoalan optimasi dikembangkan oleh Reinsch pada tahun

1967 (Wahba, 1990). Pendekatan spline mempunyai suatu basis fungsi. Basis

fungsi yang biasa digunakan antara lain spline truncated dan B-spline. Spline

Truncated merupakan fungsi dimana terdapat perubahan pola perilaku kurva yang berbeda pada interval-interval yang berlainan. Berbagai macam kelebihan jika

menggunakan spline antara lain: mempunyai intepretasi visual yang baik, bersifat

fleksibel, serta mampu menangani karakter fungsi yang bersifat mulus (Eubank,

1988; Budiantara, 2007). Selain itu, spline dapat mengatasi pola data dan dapat

menggambarkan perubahan perilaku data yang berubah-ubah pada sub-sub

interval tertentu. Spline juga mempunyai keunggulan dalam mengatasi pola data

yang menunjukkan naik/turun yang tajam dengan bantuan titik-titik knot serta

kurva yang dihasilkan relatif mulus (Eubank, 1988). Spline diperoleh berdasarkan

optimasi yang merupakan perluasan dari optimasi optimasi yang digunakan pada

regresi parametrik. Berbagai pendekatan regresi nonparametrik yang lain, tidak

memiliki tata cara optimasi seperti yang ada pada spline. Dalam pendekatan

(20)

3

Log Likelihood (PLL) yang merupakan hasil generalisasi metode Log Likelihood

(LL) pada regresi parametrik.

Spline merupakan potongan-potongan polinomial yang memiliki sifat

tersegmen dan kontinu. Salah satu kelebihan spline seperti yang telah dijelaskan

adalah bersifat fleksibel, artinya model ini cenderung mencari sendiri estimasi

data kemanapun pola data tersebut bergerak. Hal tersebut terjadi karena dalam

spline terdapat adanya titik-titik knot. Titik knot adalah titik perpaduan bersama

yang menunjukkan terjadinya perubahan pola perilaku data (Eubank, 1988;

Budiantara,2009). Dengan titik knot ini, spline dapat memberikan fleksibilitas

yang lebih baik dari pada polinomial, sehingga memungkinkan untuk

menyesuaikan diri secara efektif terhadap karakteristik lokal dari suatu fungsi atau

data. Dalam proses estimasi, apabila estimator spline diperoleh berdasarkan

optimasi Penalized Least Square (PLS), maka persoalan utama dalam estimator ini adalah pemilihan parameter penghalus yang optimal. Sementara, apabila

estimator spline yang dipilih dengan optimasi Least Square (LS), maka persoalan utama dalam estimator ini adalah pemilihan titik-titik kot yang optimal. Semakin

optimal titik knot yang digunakan dalam membuat model regresi maka akan

semakin besar pula kebaikan model regresi yang didapatkan.

Ada tiga kriteria yang harus diperhatikan dalam membentuk model regresi

Spline, antara lain: menentukan orde untuk model, banyaknya knot, dan lokasi

penempatan knot, (Montoya, et all, 2014). Orde untuk model dapat ditentukan

berdasarkan pola yang terjadi pada data, sementara banyaknya knot dan lokasi

knot ditentukan berdasarkan perubahan pola data yang terjadi pada sub-sub

interval tertentu. Terdapat beberapa metode untuk memilih titik knot yang optimal

dalam regresi nonparametrik Spline antara lain metode Cross Validation (CV) yang diberikan oleh Craven dan Wahba (1979), Unbiassed Risk (UBR) yang diberikan oleh Wang (1997), Generalized Cross Validation (GCV) yang diberikan oleh Wahba (1990), dan Generalized Maximum Likelihood (GML) oleh Wahba (1990). Dalam penelitian ini akan membandingkan hasil pemilihan titik knot

optimal dengan metode GCV dan metode UBR.

GCV dan UBR adalah metode pemilihan titik knot optimal yang mempunyai

banyak kelebihan. Adapun kelebihan yang dimiliki metode GCV antara lain

(21)

4

invarian terhadap transformasi dan tidak memerlukan informasi terhadap σ².

Pemilihan titik knot dengan metode GCV akan lebih baik jika digunakan pada

data yang Gaussian (berdistribusi normal), sementara pemilihan titik knot dengan metode UBR akan lebih baik jika digunakan pada data non-Gaussian atau tidak berdistribusi normal, (Wahba, 1990; Wang, 1998). Berdasarkan pernyataan

tersebut, peneliti tertarik untuk membandingkan apakah model regresi

nonparametrik spline multivariabel menggunakan metode GCV akan lebih baik

jika dibandingkan dengan model regresi nonparametrik spline multivariabel

menggunakan metode UBR pada data Angka Kematian Maternal di Provinsi Jawa

Timur tahun 2013 yang mempunyai distribusi normal.

Kematian Maternal menurut batasan dari The Tenth Revision of The

International Classification of Diseases (ICD-10) adalah kematian wanita yang

terjadi pada saat kehamilan atau dalam waktu 42 hari setelah kehamilan, tidak

tergantung dari lama dan lokasi kehamilan, disebabkan oleh apapun yang

berhubungan dengan kehamilan, atau yang diperberat oleh kehamilan tersebut,

atau penanganannya, akan tetapi bukan kematiaan yang disebabkan oleh

kecelakaan atau kebetulan (Safrudin dan Hamidah, 2009). Kematian maternal

secara langsung atau tidak langsung sangat berpengaruh terhadap kualitas tumbuh

kembang bayi pada masa perinatal, bahkan sampai masa balita dan usia sekolah

(Kusumawati, 2012).

Millenium Development Goals (MDGs) atau Tujuan Pembangunan Milenium adalah Deklarasi Milenium hasil kesepakatan kepala negara dan

perwakilan dari 189 negara Perserikatan Bangsa-bangsa yang dimulai September

tahun 2000, berupa delapan butir tujuan untuk dicapai pada tahun 2015. Targetnya

adalah tercapai kesejahteraan rakyat dan pembangunan masyarakat pada

2015. Dari delapan butir tujuan MDGs, tujuan kelima adalah meningkatkan

kesehatan ibu, dengan target menurunkan angka kematian ibu sebesar tiga

perempatnya antara 1990 – 2015, serta yang menjadi indikator untuk monitoring

yaitu angka kematian ibu, proporsi pertolongan persalinan oleh tenaga kesehatan

terlatih, dan angka pemakaian kontrasepsi. Target AKI di Indonesia pada tahun

2015 adalah 102 kematian per 100.000 kelahiran hidup. Sementara

itu berdasarkan Survei Demografi dan Kesehatan Indonesia (SDKI) tahun 2012,

(22)

5

nifas) sebesar 359 per 100.000 kelahiran hidup. Angka ini masih cukup jauh dari

target yang harus dicapai pada tahun 2015.Penyebab utama kematian ibu

diklasifikasikan sebagai langsung dan tidak langsung, dimana penyebab langsung

berhubungan dengan komplikasi obstetrik selama masa kehamilan, persalinan dan

masa nifas (post-partum). Mayoritas penyebab kematian ibu adalah penyebab

langsung. Sementara, penyebab tidak langsung diakibatkan oleh penyakit yang

telah diderita ibu, atau penyakit yang timbul selama kehamilan dan tidak ada

kaitannya dengan penyebab langsung obstetrik, tapi penyakit tersebut diperberat

oleh efek fisiologik kehamilan.

Saat ini Indonesia masih menghadapi permasalahan tingginya angka kematian

maternal. Menurut Survei Demografi Kesehatan Indonesia, Indonesia memiliki

angka kematian maternal tertinggi di ASEAN pada tahun 2002-2003 sebesar 307

per 100000 kelahiran. Angka kematian maternal di Indonesia tahun 2007 adalah

228 per 100000 kelahiran pada tahun 2007 dan turun menjadi 220 per 100000

kelahiran pada tahun 2010. Hal tersebut menyebabkan Indonesia menduduki

peringkat 51 tertinggi angka kematian maternal di dunia menurut CIA World Factbook pada tahun 2010. Akan tetapi, angka kematian maternal meningkat lagi pada tahun 2011 menjadi 228 per 100000 kelahiran, yang membuat angka

kematian di Indonesia tertinggi di Asia Tenggara. Sesuai target nasional menurut

MDGs (Millennium Development Goals) yaitu menurunkan angka kematian maternal sebesar ¾ dari angka kematian maternal pada tahun 1990, yaitu 450 per

100000 menjadi 102 per 100000 kelahiran pada tahun 2015. Slamet Riyadi

Yuwono, Direktur Jenderal Bina Gizi dan Kesehatan Ibu Anak, mengatakan

bahwa pemerintah mungkin dapat mengurangi angka kematian maternal menjadi

162 per 100000 kelahiran hidup, akan tetapi itu jauh lebih tinggi dari target

MDGs. 5 Provinsi dengan angka kematian maternal tertinggi di Indonesia pada

tahun 2011 adalah Jawa Barat, Jawa Tengah, Jawa Timur, Sumatera Utara, dan

NTT.

Berbagai penelitian telah dilakukan terkait dengan Kematian Maternal

diantaranya adalah Probohapsari (2007) yang melakukan analisis faktor sosial

ekonomi terhadap angka kematian maternal di Jawa Timur pada tahun 2001-2004

menggunakan analisis regresi linier berganda, Chamidah (2008) menganalisis

(23)

6

itu penelitian tentang kematian maternal juga dilakukan oleh Darnah (2009)

dengan menggunakan model regresi poisson. Novita (2011) memodelkan

pengaruh kematian maternal menggunakan Geographically Weighted Poisson Regression. Pertiwi (2012) memodelkan pengaruh kematian maternal menggunakan Spatial Durbin Model. Berdasarkan penjelasan diatas, masih belum terdapat penelitian yang mengkaji perbandingan metode GCV dan UBR dalam

pemilihan titik knot optimum pada regresi nonparametrik spline truncated

multivariabel (studi kasus kematian maternal di Provinsi Jawa Timur sebagai

provinsi dengan kontribusi cukup tinggi dalam kematian maternal di Jawa Timur).

1.2Rumusan Permasalahan

Permasalahan dalam penelitian ini adalah :

1. Bagaimana kajian metode GCV untuk memilih titik knot optimal dalam model

regresi nonparametrik spline?

2. Bagaimana kajian metode UBR untuk memilih titik knot optimal dalam model

regresi nonparametrik spline?

3. Bagaimana perbandingan metode GCV dan UBR dalam aplikasinya dengan

menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013?

1.3Tujuan Penelitian

1. Mengkaji metode GCV untuk memilih titik knot optimal dalam model regresi

nonparametrik spline.

2. Mengkaji metode UBR untuk memilih titik knot optimal dalam model regresi

nonparametrik spline.

3. Membandingkan metode GCV dan UBR dalam aplikasinya dengan

menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013.

1.4Manfaat Penelitian

1. Hasil penelitian ini diharapkan dapat memberikan wacana baru yaitu aplikasi

nonparametrik di bidang sosial kesehatan.

2. Hasil penelitian ini dapat menjadi masukan kepada pihak pemerintah

(24)

7

kematian maternal agar tujuan kelima MDGs yaitu improve maternal health

dapat tercapai.

1.5Batasan Penelitian

1. Model regresi nonparametrik yang digunakan adalah Spline Truncated.

2. Data yang digunakan adalah data sekunder pada tahun 2013.

3. Metode estimasi yang digunakan dalam penelitian ini adalah Least Square.

4. Pemilihan titik knot pada Spline Truncated digunakan sebanyak 1,2, dan 3

(25)

8

(26)

9

BAB II

TINJAUAN PUSTAKA

Pada bagian ini akan dibahas mengenai beberapa landasan teori untuk terkait

untuk menyelesaikan permasalahan pada rumusan masalah penelitian mengenai angka

kematian maternal di Jawa Timur meliputi analisis regresi, regresi nonparametrik,

metode GCV, metode UBR, uji parameter, uji asumsi residual, serta definisi kematian

maternal dan faktor-faktor yang mempengaruhinya.

2.1 Analisis Regresi

Analisis regresi adalah salah satu metode statistika yang berfungsi untuk

mengetahui pola hubungan antara variabel respon dengan variabel prediktor. Terdapat

dua jenis variabel yang saling berkorelasi dalam analisis regresi yaitu variabel

independen yang biasa disimbolkan dengan dan variabel dependen yang biasa

disimbolkan dengan . Tujuan utama analisis regresi adalah mencari bentuk estimasi

untuk kurva regresi. Apabila dalam analisis regresi bentuk kurva regresi diketahui

maka didekati dengan model regresi parametrik (Budiantara,2005). Sedangkan bila

pola kurva regresi tidak diketahui maka digunakan regresi nonparametrik. Jika

terdapat komponen parametrik dan komponen nonparametrik maka digunakan regresi

semiparametrik.

2.2 Analisis Regresi Linier

Analisis regresi linier adalah analisis yang digunakan untuk memodelkan

hubungan antara variabel respon dan variabel prediktor dengan pola data berbentuk

garis yang linier. Apabila hanya terdapat satu variabel respon dan satu variabel

prediktor maka disebut sebagai regresi linier sederhana, sedangkan apabila terdapat

satu variabel respon dan lebih dari satu variabel prediktor maka disebut sebagai

regresi linier berganda.

Jika x adalah variabel prediktor, y adalah variabel respon dan terdapat hubungan fungsional antara variabel tersebut, maka fungsinya dapat dijabarkan sebagai berikut.

(27)

10

dimanay adalah suatu fungsi dari variabel prediktor dengan adalah error yang diasumsikan bersifat identik, independen dan berdistribusi normal (0,σ²).

2.3 Analisis Regresi Linier Berganda

Pendekatan regresi parametrik spline digunakan jika bentuk dari kurva regresi

antara variabel respon dengan variabel prediktor diketahui polanya. Adapun

persamaan untuk regresi parametrik secara umum adalah sebagai berikut.

(2.2)

Jika persamaan (2.3) ditulis dalam bentuk matrik adalah sebagai berikut.

̃ ̃ ̃ (2.3)

dimana :

̃ : yang merupakan vektor berukuran nx1

X: matrik berukuran nx(p+1) yang berisikan satu kolom angka 1dan p kolom data prediktor

̃ : vektor error random berukuran nx1

Metode OLS (Ordinary Least Square) dapat juga digunakan untuk memperoleh estimasi parameter pada regresi parametrik dengan meminimumkan jumlah kuadrat

eror. Estimasi untuk parameter dalam matrik diberikan oleh :

̂ ( ) _̃ _(2.4)

2.4 Analisis Regresi Polinomial

Regresi Polinomial merupakan suatu model regresi linier yang bersifat additif

yang dibentuk dengan menjumlahkan masing-masing variabel prediktor yang

dipangkatkan meningkat sampai derajat ke-p. (Drapper dan Smith, 1992). Secara umum, model regresi polinomial adalah sebagai berikut.

(2.5)

2.5 Regresi Nonparametrik Spline

Pendekatan regresi nonparametrik spline digunakan jika kurva regresi antara

variabel respon dengan variabel prediktor tidak membentuk suatu pola atau tidak ada

informasi masa lalu yang lengkap mengenai pola data. Dalam banyak hal,

pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi asumsi-asumsi yang

(28)

11

dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal ini,

teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan. Regresi

nonparametrik memiliki fleksibilitas yang tinggi, karena data diharapkan mencari

sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas

peneliti (Eubank, 1988).

Secara umum, model regresi nonparametrik dapat disajikan sebagai berikut.

( ) , (2.6) dengan adalah variabel respon,dan ( ) adalah kurva rergresi yang tidak diketahui

bentuknya, dan adalah error yang diasumsikan berdistribusi N(0, ).

Spline merupakan model polynomial yang tersegmen. Polinomial tersegmen

memegang peranan penting dalam teori dan aplikasi statistika. Regresi spline

memiliki titik knot yang merupakan titik perpaduan yang menunjukkan perubahan

perilaku kurva pada selang yang berbeda (Hardle, 1990). Secara umum fungsi spline

( ) berorde dengan titik knot dapat dinyatakan sebagai berikut.

dengan merupakan parameter-parameter model dan merupakan orde spline

(Budiantara, 2001). Persamaan (2.7) bila disubstitusikan pada persamaan (2.6)

diperoleh persamaan regresi nonparametrik spline sebagai berikut.

∑ ∑ ( ) (2.8) dengan fungsi truncated diberikan oleh :

( ) ( )

(2.9)

Metode least square adalah metode yang digunakan untuk memperoleh estimasi parameter yaitu dengan meminimumkan jumlah kuadrat error. Apabila diasumsikan error_iberdistribusi normal independen dengan rata rata nol dan variansi adalah2_{, maka}

i

y pada model regresi juga model normal dengan rata-rata ( ) dan

(29)

12

Dengan penyajian matriks diperoleh persamaan sebagai berikut.



 



Selanjutnya, persamaan diatas diturunkan terhadap vektor Tdan disamakan dengan nol, maka :

2.6 Pemilihan Titik Knot Optimal

Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal

yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot

yang paling optimal. Titik knot disebut juga parameter penghalus. Estimator spline

sangat tergantung pada parameter penghalus, sehingga pemilihan parameter

penghalus (smoothing parameter) merupakan hal yang penting dalam mencari estimator spline yang paling sesuai.Wahba, G. dan Wang, Y. dalam Diana, et all

(2012) memperlihatkan bahwa jika nilai parameter penghalus kecil maka akan

(30)

13

penghalus sangat besar maka akan menghasilkan estimator spline yang sangat mulus.

Akibatnya perlu dipilih parameter penghalus yang optimal agar diperoleh estimator

spline yang paling sesuai untuk mewakili data yang ada, (Diana et all, 2012). Adapun

metode yang dapat digunakan untuk pemilihan titik knot optimal antara lain: CV,

GCV, UBR dan GML. Dalam penelitian ini bertujuan untuk membandingkan hasil

pemilihan titik knot optimum dengan metode GCV dan metode UBR.

2.6.1 Metode Generalized Cross Validation (GCV)

Metode GCV menjadi metode yang sangat sering digunakan untuk memilih

titik knot yang paling optimal. Seperti yang telah dipaparkan sebelumnya, metode

GCV adalah bentuk modifikasi dari metode CV. Spline terbaik ditandai dengan titik

knot optimal yang diperoleh. Salah satu metode pemilihan titik knot optimal adalah

GCV. Model spline yang terbaik dengan titik knot optimal didapat dari nilai GCV

yang terkecil (Budiantara, 2005). Fungsi GCV diberikan oleh persamaan 2.18.

 





Nilai GCV.k/ diperoleh dengan menjumlahkan residual-residual kuadrat dari

̂( ) dibagi dengan faktor koreksi dari * , ( )-+ . Titik knot paling optimal dalam GCV.k/ adalah dengan meminimumkan fungsi GCV.k/, (Green dan

(31)

14

2.6.2 Metode Unbiassed Risk (UBR)

Metode UBR adalah salah satu metode yang juga digunakan untuk memilih

titik knot optimal dalam pemilihan model spline terbaik. Adapun formula yang

digunakan dalam metode UBR adalah sebagai berikut.

: banyak pengamatan

Secara kasat mata, perbedaan formula dari GCV dan UBR adalah terdapat

pada taksiran varians. Pada metode UBR terdapat taksiran varians, sementara pada

metode GCV tidak ada.

2.7 Kriteria Pemilihan Model Terbaik

Tujuan dari analisis regresi salah satunya adalah untuk mendapatkan model

terbaik. Semakin baik model yang diperoleh melalui analisis regresi, maka model

tersebut semakin mampu untuk menjelaskan hubungan antara variabel prediktor

(32)

15

pemilihan model terbaik adalah dengan menggunakan nilai Mean Square Error

(MSE).

nilai MSE yang didapatkan.

Selain itu, kriteria pemilihan model terbaik dapat pula dilihat berdasarkan nilai

Radj. Karena adanya kelemahan dalam perhitungan R

2

, banyak peneliti yang

menyarankan untuk menggunakan Adjusted R Square. Adapun rumus untuk mencari

Adjusted R Square adalah sebagai berikut.





Nilai Adjusted R Square dapat bernilai negatif, sehingga jika nilainya negatif, maka

nilai tersebut dianggap 0, atau variabel bebas sama sekali tidak mampu menjelaskan

varians dari variabel terikatnya.

Suatu sifat penting R2 adalah nilainya merupakan fungsi yang tidak pernah

menurun dari banyaknya variabel bebas yang ada dalam model. Oleh karenanya,

untuk membandingkan dua R2 dari dua model, orang harus memperhitungkan

banyaknya variabel bebas yang ada dalam model. Ini dapat dilakukan dengan

menggunakan “adjusted R square”. Istilah penyesuaian berarti nilai R2 sudah disesuaikan dengan banyaknya variabel (derajat bebas) dalam model. Memang,

R2 yang disesuaikan ini juga akan meningkat bersamaan meningkatnya jumlah

variabel, tetapi peningkatannya relatif kecil. Seringkali juga disarankan, jika variabel

bebas lebih dari dua, sebaiknya menggunakan adjusted R square.

2.8 Pemeriksaan Asumsi Residual Dalam Model Regresi

Uji asumsi residual (goodness of fit) dilakukan untuk mengetahui apakah residual yang dihasilkan telah memenuhi asumsi yakni identik, independen, dan bersdistribusi

(33)

16 2.8.1 Asumsi Residual Identik

Asumsi identik terpenuhi bila varians antar residual sama yakni2

dan tidak

terjadi heteroskedastisitas.

Var(yi)=Var(εi)=2; i=1, 2, ...,n (2.30)

Terpenuhi atau tidaknya asumsi identik dapat diketahui dengan melihat pola

sebaran scatter plot (diagram pencar) antara residual dan fits. Asumsi identik terpenuhi dapat dideteksi dengan sebaran plot yang tidak membentuk suatu pola

tertentu (tersebar secara acak). Bila sebaran plot membentuk pola tertentu

mengindikasikan adanya heteroskesdastisitas. Selain menggunakan metode grafis,

identifikasi heteroskesdastisitas dapat dilakukan dengan menggunakan uji Glejser.

Hipotesis yang digunakan adalah sebagai berikut:

0 = = = =

inimal ada satu =

Statistik uji yang digunakan sebagaimana persamaan 2.31.

∑_{(| ̂ | | ̅|)} ∑_{(| | | ̂ |)}

Daerah penolakan yakni tolak jika:

( ( ))atau Nilai k adalah banyaknya parameter model glejser.

2.8.2 Asumsi Residual Independen

Asumsi klasik kedua yang harus dipenuhi adalah tidak terdapat korelasi pada

residual yang ditunjukkan oleh nila kovarian antara dan sama dengan nol.

Persamaan untuk ACF adalah sebagai berikut (Wei, 1990):

( )

√ ( )√ ( ) (2.32) dimana:

= korelasi antara et dan et+k

= kovarian antara et danet+k

= Var (et) = Var (et+k)

Interval konfidensi dengan batas signifikansi atas dan bawah adalah sebagai

berikut:

(34)

17

√

√ (2.33) Bila terdapat lag yang keluar dari batas signifikansi maka dapat dikatakan asumsi

independen tidak terpenuhi (adanya autokorelasi). Begitu sebaliknya, bila tidak

terdapat lag yang keluar dari batas signifikansi menunjukkan bahwa asumsi

independen terpenuhi.

2.8.3 Asumsi Normalitas Residual

Residual dari model regresi harus mengikuti distribusi normal dengan mean nol dan varians σ2

. Adapun uji hipotesis yang digunakan untuk pengujian asumsi

normalitas residual adalah sebagai berikut :

0 Residual mengikuti distribusi normal

Residual tidak mengikuti distribusi normal

Uji asumsi distribusi normal dapat dilakukan menggunakan uji

Anderson-Darling. Anderson-Darling merupakan modifikasi dari uji Kolmogorov-Smirnov

(KS). Nilai-nilai kritis dalam uji KS tidak tergantung pada distribusi tertentu yang

sedang diuji sedangkan uji Anderson-Darling memanfaatkan distribusi tertentu dalam

menghitung nilai kritis. Ini memiliki keuntungan yang memungkinkan tes yang lebih

sensitif. Statistik uji yang digunakan adalah sebagai berikut.











1



F(Zi) = nilai fungsi distribusi kumulatif normal baku di zi

Selain itu, dalam penelitian ini juga menggunakan uji Shapiro-Wilk untuk

melakukan uji asumsi normalitas. Dengan hipotesis yang sama, keputusan uji

normalitas data adalah dengan melihat sig. atau p value < ( ) 0,05 maka H0 gagal

(35)

18 2.9 Uji Parameter Model

Uji parameter dilakukan untuk mengetahui apakah suatu variabel memberikan

pengaruh yang signifikan dalam model. Uji untuk parameter dapat diuji secara

serentak dan uji secara individu.

2.9.1 Uji Serentak (simultan)

Uji serentak merupakan uji parameter kurva regresi secara simultan

menggunakan uji . Hipotesis pada uji ialah sebagai berikut:

0

Statistik uji yang digunakan sebagaimana Persamaan 2.35.

=₍∑_̂ ( ̂₎ _{( )} ̅) (2.35) Berikut adalah Analysis of variance (ANOVA)dari model regresi:

Tabel 2.1 Analysis of Variance Model Regresi

Sumber

(Sumber :Draper and Smith, 1992)

m merupakan banyak variabel prediktor dan n adalah banyaknya data atau observasi pengamatan.

Tolak H0 jika _{( )} atau p-value<α yang menunjukkan bahwa

paling sedikit terdapat satu parameter yang tidak sama dengan nol atau paling sedikit

(36)

19 2.9.2 Uji Individu

Uji individu digunakan untuk mengetahui parameter yang berpengaruh signifikan

secara individu terhadap model menggunakan uji . Hipotesis pada uji adalah

sebagai berikut:

0 0

0 =

Statistik uji yang digunakan sebagaimana persamaan 2.36.





1 2 pengamatan dan adalah banyaknya parameter.

2.10Angka Kematian Maternal

Kematian maternal adalah kematian wanita yang terjadi pada saat kehamilan atau

dalam 42 hari setelah kehamilan, tidak tergantung dari lama dan lokasi kehamilan,

disebabkan oleh apapun yang berhubungan dengan kehamilan, atau yang diperberat

oleh kehamilan tersebut, atau penanganannya, akan tetapi bukan kematian yang

disebabkan oleh kecelakaan atau kebetulan (Safrudin dan Hamidah, 2009). Tingginya

jumlah kematian maternal menggambarkan tingkat kesadaran perilaku hidup sehat,

status gizi dan kesehatan ibu, kondisi kesehatan lingkungan serta tingkat pelayanan

kesehatan terutama pada ibu hamil, ibu melahirkan dan ibu pada masa nifas.

Terdapat tiga macam faktor yang mempengaruhi kematian maternal, yaitu

determinan dekat, determinan antara, dan determinan jauh (Wiknjosastro dalam

Kusumawati, 2012). Determinan dekat merupakan proses yang paling dekat dengan

kematian itu sendiri, yaitu kehamilan dan komplikasi dari kehamilan, persalinan dan

masa nifas (Wibowo dalam Srianingsih, 2011). Faktor determinan dekat antara lain:

ibu hamil yang mendapat tablet Fe3, ibu hamil yang melaksanakan program K1, ibu

hamil yang beresiko tinggi yang ditangani, ibu hamil yang mengalami perdarahan, ibu

hamil yang mengalami infeksi. Komplikasi persalinan dan nifas adalah komplikasi

yang terjadi menjelang persalinan, terutama adalah perdarahan (Srianingsih, 2011).

Determinan antara yaitu meliputi status kesehatan ibu (status gizi, anemia,

(37)

20

Faktor determinan antara, antara lain: ibu hamil yang menderita penyakit komplikasi,

ketersediaan pelayanan kesehatan dan status reproduksi ibu hamil.

Determinan jauh merupakan faktor-faktor yang secara tidak langsung

mempengaruhi kematian maternal, yaitu faktor sosiokultural, ekonomi, keagamaan,

dan faktor lain yang perlu dipertimbangkan dalam pelaksanaan penanganan kematian

ibu. Determinan jauh meliputi tingkat pendidikan, pekerjaan, dan kemiskinan ibu. Ibu

yang berpendidikan rendah menyebabkan kurangnya kesadaran mereka tentang

bahaya yang akan dialami jika kurang perhatian terhadap kesehatan. Determinan jauh

biasa dikenal dengan Empat Terlalu dan Tiga Terlambat. Empat Terlalu adalah hamil

di usia yang terlalu muda (di bawah 17 tahun), hamil terlalu sering (jumlah anak lebih

dari 3), dan hamil di usia yang terlalu tua (di atas 34 tahun), dan hamil terlalu dekat

(jarak anak kurang dari 2 tahun). Tiga Terlambat atau yang disebut dengan The Three Delays Models, adalah sebagai berikut (Srianingsih, 2011):

1. Terlambat dalam mengambil keputusan

Pengambilan keputusan apakah akan mencari fasilitas perawatan kesehartan atau

tidak oleh wanita akan dipengaruhi oleh faktor penyakit, sosial budaya

(pendidikan, pendapatan, budaya kawin muda), biaya tinggi, dan rendahnya

kualitas perawatan. Kurangnya kesadaran dan pengetahuan akan tanda

perdarahan menyebabkan wanita terlambat dalam mengambil keputusan. Tradisi

yang masih lekat pada masyarakat sampai sekarang adalah adanya dukun bayi

dan kekhawatiran akan biaya tinggi jika dirujuk ke rumah sakit.

2. Terlambat mencapai fasilitas rujukan

Terlambatnya wanita mencapai fasilitas rujukan dipengaruhi oleh trtansportasi

yang memadai, ketersediaan transport, kendala kurangnya ongkos untuk

transportasi. Infrastruktur dan geografis menyebabkan sulitnya akses menuju

sarana pelayanan kesehatan.

3. Terlambat mendapat pertolongan

Terlambat mendapat pertolongan terjadi karena rendahnya kualitas perawatan

seperti lemahnya manajemen dan administrasi kesehatan, kelengkapan

obat-obatan dan peralatan, kurangnya keterampilan staf kesehatan, dan buruknya

organisasi pelayanan dan infrastruktur.

Sementara, McCarthy dan Maine (1992) menjelaskan analisis determinan pada

(38)

21

sosial ekonomi dan faktor budaya; determinan antara berupa status kesehatan, status

reproduksi, akses pelayanan kesehatan, penggunaan pelayanan kesehatan, dan faktor

(39)

22

(40)

23

BAB III

METODOLOGI PENELITIAN

3.1Kajian Teoritis

Berdasarkan tujuan pertama dan tujuan kedua, maka akan dilakukan kajian terkait pemilihan titik knot menggunakan metode GCV dan UBR. Adapun langkah-langkah untuk mengkaji metode GCV adalah sebagai berikut.

a. Menghampiri fungsi ( ) dengan fungsi spline berderajat m dan knot sebanyak dapat dinyatakan sebagai berikut

b. Menggunakan metode least square untuk mengestimasi parameter  dalam model regresi nonparametrik spline dengan menyelesaikan optimasi :

 

_T











T











c. Mendapatkan estimasi dari kurva regresi nonparmetrik spline f x

 

dengan

persamaan sebagai berikut.

(41)

24

e. Mendapatkan matriks

A

( )

k

_{dengan persamaan sebagai berikut.}

T -1 T

( ) ( )

Ak X X X X

f. Mendapatkan optimasi GCV dengan persamaan sebagai berikut.





2

Sementara, langkah-langkah untuk mengkaji metode UBR adalah sebagai berikut.

dengan fungsi truncated diberikan oleh :

( ) ( )

(42)

25





T

1, ,...,2 n

     danX



k k1, ,...,2 kJ



adalah matriks X yang bergantung pada

titik-titik knot.

c. Mendapatkan estimasi dari kurva regresi nonparmetrik spline f x

 

dengan

persamaan sebagai berikut.

e. Mendapatkan matriks

A

( )

k

dengan persamaan sebagai berikut. T -1 T

( ) ( )

Ak X X X X

f. Mendapatkan nilai σ² dengan persamaan sebagai berikut.

2

g. Mendapatkan optimasi UBR dengan persamaan sebagai berikut.

 

3.2Aplikasi Data Angka Kematian Maternal di Jawa Timur tahun 2013

3.2.1 Kerangka Konsep Angka Kematian Maternal

(43)

26

: Variabel-variabel yang digunakan dalam penelitian

Gambar 3.1. Faktor yang mempengaruhi angka kematian maternal

Sementara, karena keterbatasan data, maka variabel yang digunakan dalam penelitian ini berdasarkan penelitian sebelumnya yang dilakukan oleh Nuraziza Arfan pada tahun 2013 yang meneliti tentang pemodelan regresi nonparametrik spline pada kasus angka kematian maternal di Jawa Timur. Adapun variabel yang digunakan dalam penelitian ini antara lain: persentase ibu hamil yang mendapatkan tablet Fe1, persentase ibu hamil yang melaksanakan program K1, persentase ibu hamil beresiko tinggi/komplikasi yang ditangani, persentase penduduk perempuan yang pernah kawin dibawah umur, persentase penduduk perempuan dengan pendidikan paling tinggi SD.

3.2.2 Variabel Penelitian

Berikut adalah variabel-variabel yang digunakan dalam penelitian dengan definisi operasionalnya.

- Ibu hamil yang mendapat tablet Fe3

- Ibu hamil yang melaksanakan program K1

- Ibu hamil beresiko tinggi yang ditangani -Ibu hamil yang mengalami perdarahan -Ibu hamil yang mengalami infeksi

-Ibu hamil yang menderita penyakit

komplikasi

-Ketersediaan pelayanan kesehatan -Status reproduksi ibu hamil

- Perempuan yang berpendidikan rendah

- Perempuan yang kawin terlalu muda -Perempuan yang hamil terlalu sering -Perempuan yang hamil terlalu tua -Perempuan yang hamil terlalu dekat -Perempuan yang terlambat mengambil

keputusan

-Perempuan yang terlambat ke fasilitas

kesehatan

-Perempuan yang terlambat mendapat

pertolongan

(44)

27

Tabel 3.1 Variabel Penelitian Variabel Nama Variabel

Y Angka kematian maternal

x1

Persentase ibu hamil yang mendapatkan tablet Fe1

x2

Persentase ibu hamil melaksanakan program K1

x3

Presentase ibu hamil berisiko tinggi/komplikasi yang ditangani

x4

Persentase penduduk perempuan yang pernah kawin di bawah umur

x5

Persentase penduduk perempuan dengan pendidikan paling tinggi SD

Definisi operasional variabel yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Variabel y menyatakan hasil bagi antara jumlah kematian ibu hamil, ibu bersalin, dan ibu nifas dengan jumlah lahir hidup dikali 100000.

2. Variabel x1 menyatakan hasil bagi jumlah ibu hamil yang mendapatkan tambahan vitamin yang dapat mencegah anemia dengan jumlah ibu hamil, dinyatakan dalam persentase.

3. Variabel x2 menyatakan hasil bagi antara jumlah ibu hamil yang melakukan kontak pertama dengan sarana kesehatan untuk mendapatkan pelayanan antenatal dengan jumlah ibu hamil, yang dinyatakan dalam persentase.

4. Variabel x3 menyatakan hasil bagi jumlah ibu hamil yang mempunyai kondisi berisiko/berbahaya pada waktu kehamilan maupun persalinan dan telah ditangani sesuai prosedur dengan 20% jumlah ibu hamil, yang dinyatakan dalam persentase.

5. Variabel x4 menyatakan persentase penduduk perempuan usia 10 tahun ke atas yang pernah kawin menurut kabupaten/kota dan umur kawin pertama di bawah 17 tahun.

(45)

28

Berdasarkan variabel-variabel yang digunakan yaitu terdapat 5 variabel prediktor dan 1 variabel respon, maka dapat dibuat model regresi nonparametrik spline yang sesuai dengan menggunakan 1 titik knot, 2 titik knot dan 3 titik knot yaitu sebagai berikut.

Model regresi nonparametrik spline dengan 1 titik knot :













Model regresi nonparametrik spline dengan 2 titik knot :

















Model regresi spline dengan 3 titik knot :

















3.2.3 Langkah Analisis Aplikasi Data

Adapun pada aplikasi data langkah-langkah analisis yang dilakukan adalah sebagai berikut.

a. Membuat scatter plot antara variabel respon (y) dengan variabel prediktor (x). b. Memodelkan data dengan model regresi nonparametrik spline dengan satu ttik

knot, dua titik knot, dan tiga titik knot.

c. Menghitung niai GCV dan UBR untuk masing masing model regresi nonparametrik spline.

d. Menentukan titik knot optimal berdasarkan nilai GCV dan UBR.

e. Melakukan pengujian signifikansi parameter yang dihasilkan dari estimasi model regresi nonparametrik spline dengan metode GCV dan metode UBR

(46)

29

g. Membandingkan kebaikan model regresi nonparametrik spline dengan titik knot

optimal menggunakan metode GCV dan UBR berdasarkan kriteria nilai

R

2adjdan nilai MSE.

(47)

30

(48)

31

BAB IV

HASIL DAN PEMBAHASAN

Pada bab ini dilakukan penjabaran mengenai metode pemilihan titik knot, yaitu

Generalized Cross Validation (GCV) dan Unbiassed Risk (UBR) sesuai dengan tujuan penelitian yang telah dijelaskan pada Bab 1. Pada langkah selanjutnya, diberikan aplikasi pada data angka kematian maternal dan faktor-faktor yang mempengaruhi di provinsi Jawa Timur menggunakan regresi nonparametrik spline multivariabel dengan menggunakan 1 titik knot, 2 titik knot, 3 titik knot dan kombinasi titik knot. Tujuan menerapkan aplikasi data adalah untuk membandingkan model regresi nonparametrik spline dengan menggunakan metode GCV dan UBR sebagai metode pemilihan titik knot optimal.

1.1Estimator Spline dalam Regresi Nonparametrik

Fungsi spline merupakan jumlahan dari fungsi polinomial dengan suatu fungsi

truncated. Dalam bagian ini dibahas tentang model regresi nonparametrik, dimana estimasi kurva f dilakukan dengan menggunakan spline. Diberikan data berpasangan (xi, yi) dan hubungan antara xi dan yi diasumsikan mengikuti model regresi diperoleh model regresi spline sesuai dengan persamaan (2.6). Apabila persamaan (2.6) disajikan dalam bentuk matriks, diperoleh bentuk sebagai berikut.

1 1 1

Bentuk kurva regresi f(x) dari persamaan diatas diasumsikan tidak diketahui, sedangkan error εi saling independen dengan rata-rata nol dan varian σ². Fungsi

spline pada persamaan (2.7) dapat dijabarkan dalam bentuk sebagai berikut.



1







2

0 1 2 1

( )i i i ... m im i-k m ... J i-kJ m

f x   x  x   x  x _   x _

(49)

32

Atau dapat ditulis juga dengan persamaan berikut.

1 2, ,...,

X _J

Y  _k k k _ 

Selanjutnya, estimasi parameter β diperoleh dengan menggunakan metode least square, dengan menyelasikan optimasi sebagai berikut.

 



   



diperoleh dengan menyelasikan optimasi yang meminimumkan jumlah kuadrat error

terhadap vektor _T_{, kemudian hasilnya disama dengankan nol sebagai berikut.}

(50)

33

Jumlah kuadrat error dengan penjabaran matriksnya diberikan sebagai berikut.

2 T

Bila persamaan diatas diturunkan terhadap vektor _T_{dan hasilnya}

disamadengankan nol, maka diperoleh :

 

T T T T T

Akibatnya, estimasi untuk kurva regresi spline dengan knot K diberikan oleh :

 

(51)

34

persamaan GCV diatas dapat ditulis juga dengan persamaan sebagai berikut :





2

Berdasarkan persamaan yang ditulis diatas dapat dilihat bahwa GCV merupakan hasil generalisasi metode CV yang telah diberi bobot. Dimana persamaan CV adalah sebagai berikut.

dari penjabaran diatas, diperolah optimasi berikut untuk memperoleh titik knot optimal dengan menggunakan metode GCV .

(52)

35

Nilai GCV terkecil yang dihasilkan akan memberikan titik knot yang optimal.

4.3 Metode Unbiassed Risk (UBR) dalam Regresi Nonparametrik Spline

Metode UBR adalah digunakan untuk mencari titik knot optimal ketika ada informasi mengenai σ² atau σ² diketahui. Penggunaan metode UBR dalam pemilihan titik knot yang optimal sangat bergantung pada nilai estimasi σ². Artinya, ketika estimasi σ² yang dihasilkan cukup baik, maka metode UBR akan berkerja dengan baik pula. Berikut rumus yang digunakan untuk mencari titik knot dengan metode UBR.

Estimasi dari σ² dapat diperoleh dengan rumus sebagai berikut.

2

(53)

36

Titik knot optimal dihasilkan dengan nilai UBR yang terkecil.

4.4 Statistika Deskriptif Angka Kematian Maternal di Provinsi Jawa Timur

Pada bagian ini, diberikan aplikasi model regresi nonparametrik spline pada data angka kematian maternal di Jawa Timur dengan jumlah knot yang berbeda, yaitu 1 titik knot, 2 titik knot, 3 titik knot dan kombinasi titik knot. Penelitian ini bertujuan untuk membandingkan model regresi nonparametrik spline dengan menggunakan metode GCV dan UBR dalam memilih titik knot yang optimal. Berikut gambaran statistika deskriptif masing masing variabel yang digunakan.

Tabel 4.1 Statistika deskriptif angka kematian maternal dan variabel yang diduga berpengaruh Variabel Jumlah Rata-rata Varians Jumlah Minimum Maximum

Y 38 107,51 1502,23 4085,27 26,06 230,64

Berdasarkan Tabel 4.1 yang menjelaskan statistika deskriptif, terlihat bahwa variabel angka kematian maternal (Y) mempunyai nilai terendah sebesar 26,06 persen yaitu terdapat di kabupaten Madiun, sebaliknya nilai tertinggi angka kematian maternal sebesar 230,64 persen terdapat di kabupaten Probolinggo. Jumlah kabupaten keseluruhan sebanyak 38 di Provinsi Jawa Timur mempunyai rata-rata angka kematian maternal sebesar 107,51 dengan varians 1502,23. Begitu juga untuk variabel prediktor, variabel persentase ibu hamil yang mendapatkan tablet Fe1 (X1)

(54)

37

mendapatkan tablet Fe1 mempunyai rata-rata sebesar 91,34 persen dengan varians

sebesar 52,83.

Berikut juga diberikan scatter plot dari data angka kematian maternal di provinsi Jawa Timur dengan faktor faktor yang diduga mempengaruhinya sebagai pendugaan pola data.

(55)

38

Gambar 4.2 Uji Normalitas Angka Kematian Maternal

Berdasarkan Gambar 4.2 dapat dilihat bahwa Angka Kematian Maternal berdistribusi normal dengan nilai p-value yang lebih dari (0,05), yaitu 0,076.

4.5 Pemodelan Angka Kematian Maternal di Provinsi Jawa Timur Menggunakan Metode GCV

Berikut disajikan aplikasi pemodelan regresi nonparametrik spline multivariabel data angka kematian maternal dengan menggunakan Generalized Cross Validation (GCV) sebagai metode pemilihan titik knot optimal

4.5.1 Pemilihan Titik Knot Optimal dengan Satu Titik Knot

Dalam memodelkan data dengan menggunakan regresi nonparametrik spline, langkah awal yang dilakukan adalah menentukan titik knot optimal yang berkaitan dengan nilai GCV terkecil. Berikut disajikan output 10 nilai GCV terkecil pada data angka kematian maternal di Jawa Timur tahun 2013 dengan menggunakan satu titik knot.

(56)

39

Lanjutan Tabel 4.2. Nilai GCV dengan menggunakan 1 titik knot Knot

Berdasarkan tabel diatas, nilai GCV minimum adalah sebesar 0,02775 dengan titik knot optimum untuk masing masing variabel adalah sebagai berikut.

k1=8,551 k 2=2,063 k 3=2,188

k 4=1,857 k 5=32,19

Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan satu titik knot.













4.5.2 Pemilihan Titik Knot Optimal dengan Dua Titik Knot

(57)

40

Pada variabel x1 :

Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan dua titik knot.

(58)

41

4.5.3 Pemilihan Titik Knot Optimal dengan Tiga Titik Knot

Berdasarkan hasil nilai GCV dari pemilihan titik knot optimal dengan menggunakan satu dan dua titik knot akan dibandingkan dengan hasil dari GCV menggunakan tiga dan kombinasi titik knot untuk memperoleh nilai GCV yang paling minimum. Berikut disajikan output 5 nilai GCV terkecil dengan menggunakan tiga titik knot.

Tabel 4.4. Nilai GCV dengan menggunakan 3 titik knot Knot

GCV

X1 X2 X3 X4 X5

12,4 3,997 4,707 5 59,67 0,02022 13,94 4,77 5,714 6,257 70,66

14,33 4,963 5,966 6,571 73,4

12,4 3,997 4,707 5 59,67 0,02037 13,94 4,77 5,714 6,257 70,66

14,71 5,157 6,218 6,886 76,15

12,4 3,997 4,707 5 59,67 0,02098 14,33 4,963 5,966 6,571 73,4

14,71 5,157 6,218 6,886 76,15

12,02 3,803 4,455 4,686 56,92 0,02122 13,94 4,77 5,714 6,257 70,66

14,33 4,963 5,966 6,571 73,4

12,02 3,803 4,455 4,686 56,92 0,02129 13,94 4,77 5,714 6,257 70,66

14,71 5,157 6,218 6,886 76,15

Pada variabel x1 :

k1=12,4; k2=13,94; k3=14,33

Pada variabel x2 :

k4=3.997; k5=4.77; k6=4.963

Pada variabel x3 :

k7=4,707; k8=5,714; k9=5,966

Pada variabel x4 :

(59)

42 Pada variabel x5 :

k13=59,67; k14=70,66; k15=73,4

Berikut disajikan persamaan regresi nonparametrik spline menggunakan nilai GCV minimum dengan tiga titik knot.

















4.5.4 Pemilihan Titik Knot Optimal dengan Kombinasi Titik Knot

Nilai minimum GCV dengan menggunakan satu, dua dan tiga titik knot akan dibandingkan dengan nilai GCV kombinasi dari knot-knot tersebut. Berikut ditampilkan 5 nilai GCV terkecil dengan menggunakan kombinasi titik knot.

Tabel 4.5 Nilai GCV dengan menggunakan kombinasi titik knot

Kombinasi titik knot Knot GCV

(60)

43

knot optimal dengan menggunakan metode GCV diperoleh nilai GCV paling minimum yaitu sebesar 0,008796 yaitu menggunakan titik knot kombinasi 2-3-2-2-1. Berikut hasil ringkasan pemilihan titik knot dengan metode GCV.

Tabel 4.6 Ringkasan hasil pemilihan titik knot dengan

metode GCV

Titik Knot Nilai GCV

Satu titik knot 0,02775

Dua titik knot 0,03688

Tiga titik knot 0,02022

Kombinasi titik knot (2-3-2-2-1)

0,008796

Sehingga untuk analisis selanjutnya menggunakan titik knot kombinasi 2-3-2-2-1 dengan model regresi nonparametrik spline sebagai berikut.

















Berikut ditampilkan hasil estimasi parameter model regresi nonparametrik spline dengan menggunakan titik knot paling minimum yaitu menggunakan kombinasi titik knot (2-3-2-2-1).

(61)

44

β7 7 -0,576185

Lanjutan Tabel 4.7 Estimasi parameter model Parameter Estimator

Berdasarkan model yang diperoleh dengan menggunakan metode GCV dalam pemilihan titik knot optimal yaitu dengan menggunakan kombinasi titik knot (2-3-2-2-1) menghasilkan nilai R2

adj sebesar 92,4%. Artinya, variabel prediktor

mempengaruhi angka kematian maternal sebesar 92,4%.

4.5.5 Pengujian Asumsi Residual Identik

Hipotesis yang digunakan adalah sebagai berikut.

2 2 2 2

Pengujian identik dilakukan untuk mengetahui apakah residual memiliki varians yang sama (homogen) atau tidak. Pengujian identik dilakukan dengan menggunakan uji glejser, dengan output sebagai berikut.

Tabel 4.8. ANOVA Uji Glejser

Sumber df SS MS Fhit P value

Regresi 15 0,004654 0,0003103 0,4982 0,9056 Error 15 0,009341 0,0006227