• Tidak ada hasil yang ditemukan

ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA SKRIPSI

N/A
N/A
Protected

Academic year: 2019

Membagikan "ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA SKRIPSI"

Copied!
67
0
0

Teks penuh

(1)

ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA

SKRIPSI

DYAH WIDIANTINI

PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

(2)

ESTIMASI MODEL REGRESI NONPARAMETRIK

MULTIVARIAT BERDASARKAN

ESTIMATOR POLINOMIAL LOKAL ORDE DUA

SKRIPSI

Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika

Pada Fakultas Sains dan Teknologi Universitas Airlangga

Disetujui Oleh :

Pembimbing I,

Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001

Pembimbing II,

(3)

LEMBAR PENGESAHAN NASKAH SKRIPSI

Judul : Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua Penyusun : Dyah Widiantini

NIM : 080810540

Tanggal Ujian : 18 Juni 2012

Disetujui oleh :

Pembimbing I,

Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001

Pembimbing II,

Drs. Eko Tjahjono, M.Si NIP . 19600706 198601 1 001

Mengetahui :

Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi

Universitas Airlangga

(4)

PEDOMAN PENGGUNAAN SKRIPSI

(5)

KATA PENGANTAR

Alhamdulillah, segala puji hanya untuk Allah Tuhan semesta alam, atas segala berkat, rahmat, taufik, serta hidayah-Nya yang tak terkira besarnya, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua”.

Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada : 1. Allah SWT, yang telah banyak memberikan rahmat dan hidayah-Nya kepada

penulis.

2. Kedua orang tua dan adik-adik penulis, yang telah memberikan dukungan, kasih, dan kepercayaan yang begitu besar.

3. Dr. Miswanto M.Si selaku Ketua Program Studi Matematika Fakultas Sains dan Teknologi yang telah banyak membantu dengan arahan-arahannya.

4. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga, yang telah banyak memberikan arahan dan saran demi kesuksesan penulis.

5. Drs. Suliyanto, M.Si selaku dosen pembimbing I yang telah memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.

6. Drs. Eko Tjahjono, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran yang sangat bemanfaat. 7. Toha Saifudin, S.Si, M.Si selaku dosen penguji I dan Dr. Fatmawati, M.Si selaku

dosen penguji II yang telah banyak memberikan saran dan masukan agar penulisan skripsi ini dapat lebih baik lagi.

8. Seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

9. Keluarga besar UPTD Ponsos Kalijudan, khususnya kepada Ibu Hj. Rosalia Endang Setyawati selaku kepala asrama, terima kasih atas doa, bimbingan, dan nasehatnya selama ini. Juga teman-teman asrama putra dan putri angkatan 2008, 2009, dan 2011, khususnya teman sekamarku, Titi, Widya, dan Silvi. Aku akan selalu merindukan kebersamaan dengan kalian selama 4 tahun terakhir ini. Semoga suatu saat nanti kita bisa reuni bersama...!!!

10.Abang, yang telah setia menemani dan banyak memberikan motivasi serta saran yang membangun, sehingga penulis bisa belajar banyak hal darinya.

(6)

12.Teman-teman Matematika 2008, juga untuk kakak-kakak 2007 dan adik-adik di 2009, terima kasih untuk segala bantuannya.

13.Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.

Penulis menyadari bahwa masih terdapat banyak kekurangan dalam penulisan skripsi ini. Oleh karena itu, kritik dan saran yang membangun terus penulis harapkan agar skripsi ini dapat lebih baik lagi.

Surabaya, Juli 2012 Penyusun

(7)

Dyah Widiantini, 2012. Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua. Skripsi ini dibawah bimbingan Drs. Suliyanto, M.Si dan Drs. Eko Tjahjono, M.Si., Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya

ABSTRAK

Tujuan penulisan skripsi ini membahas estimasi model regresi nonparametrik multivariat menggunakan estimator polinomial lokal orde dua. Estimasi model regresi nonparametrik multivariat diperoleh dalam bentuk eksplisit yang merupakan fungsi dari bandwidth dan fixed point arbitrary , sehingga estimasinya dilakukan dengan memilih bandwidth optimal yang meminimumkan Generalized Cross Validation (GCV). Setelah estimasi model regresi nonparametrik multivariat diperoleh, selanjutnya dibahas estimasi selang kepercayaan untuk rata-rata estimasi model regresi nonparametrik multivariat.

Data yang digunakan dalam penerapan model regresi nonparametrik multivariat adalah data berat badan balita pada di Rumah Sakit Haji Surabaya pada tahun 2006 sebanyak 30 pengamatan dengan variabel respon adalah berat badan balita dalam satuan kilogram dan kedua variabel prediktornya adalah tinggi badan balita dalam satuan meter dan lingkar kepala balita dalam satuan meter. Hasil penerapan model regresi nonparametrik multivariat pada data berat badan balita dengan selang kepercayaan diperoleh estimasi bagi rata-rata berat badan balita pada pengamatan ke-1 adalah , pada pengamatan ke-2 sebesar , sampai pada pengamatan ke-30 yaitu sebesar dengan nilai bandwidth optimal untuk variabel prediktor sebesar dan variabel prediktor sebesar . Untuk kesesuaian hasil estimasi model regresi nonparametrik multivariat diperoleh nilai dan eror random

Kata Kunci: Regresi nonparametrik multivariat, Estimator polinomial lokal

(8)

Dyah Widiantini, 2012. The Estimation of Multivariate Nonparametric Regression Model based on Second Order Local Polynomial Estimator. This Skripsi is under adviced by Drs. Suliyanto, M.Si and Drs. Eko Tjahjono, M.Si., Mathematics Department, Faculty of Sains and Technology, Airlangga University, Surabaya

ABSTRACT

The purpose of this Skripsi is to estimate multivariate nonparametric regression model based on second order local polynomial estimator. Estimation of multivariate nonparametric regression model is obtained in explicit form from function bandwidth and fixed point arbitrary , so that estimation can be done with choose optimal bandwidth which minimized Generalized Cross Validation (GCV). Furtehermore, we explain the confidence level for mean of estimation of multivariate nonparametric regression model.

In this case, we used data of baby’s weight in 2006 at Rumah Sakit Haji Surabaya. There are thirty observations where the response variable is weight of baby in kilogram and predictor variables are baby’s height in meter and head circumference of baby in meter. The results of multivariate nonparametric regression model in data of baby’s weight with confidence level 95% for mean of estimation baby’s weight on first observation is , on second observation is , then on thirty observation is with an optimal bandwidth value for is and is . For compatibility of the result multivariate nonparametric regression is obtained and error random

.

Key Words : Multivariate nonparametric regression, Second order local

(9)

DAFTAR ISI

2.4 Fungsi Kernel Multivariat ... 10

2.5 Pemilihan Bandwidth Optimal ... 11

2.6 Deret Taylor Multivariat ... 12

(10)

2.8 Estimator Polinomial Lokal Orde Dua ... 12

2.9 Distribusi Normal ... 13

2.10 Software S-PLUS 2000 ... 18

2.11 Software Minitab ... 21

2.12 Pertumbuhan Balita ... 21

BAB III METODE PENELITIAN ... 22

BAB IV HASIL DAN PEMBAHASAN ... 26

4.1 Estimasi Titik pada Model Regresi Nonparametrik Multivariat ... 26

4.2 Selang Kepercayaan Estimator Model Regresi Nonparametrik Multivariat ... 34

4.3 Penerapan pada Data ... 38

4.3.1 Data ... 38

4.3.2 Analisis Data ... 38

BAB V KESIMPULAN DAN SARAN ... 42

5.1 Kesimpulan ... 42

5.2 Saran ... 43

(11)

DAFTAR GAMBAR

Nomor Judul Halaman

4.1 Plot data awal tinggi badan balita terhadap berat badan balita 39 29

4.2 Plot data awal lingkar kepala balita terhadap berat badan balita 39

4.3 Plot selang kepercayaan bagi rata-rata berat badan balita 40

(12)

DAFTAR LAMPIRAN

Nomor Judul

1 Data berat badan balita di Rumah Sakit Haji Surabaya Tahun 2006

2 Program estimasi model regresi nonparametrik multivariat

3 Output program estimasi model regresi nonparametrik multivariat

a Bandwidth optimal untuk variabel respon berat badan balita dengan

variabel prediktor tinggi badan balita dan variabel prediktor lingkar

kepala balita

b Estimasi untuk variabel respon berat badan balita dengan variabel

prediktor tinggi badan balita dan variabel prediktor lingkar kepala

balita pada tiap pengamatan

(13)

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Analisis regresi digunakan untuk menelaah hubungan antara dua variabel

atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum

diketahui dengan sempurna, atau untuk mengetahui pengaruh dari beberapa

variabel prediktor terhadap variabel respon dalam suatu fenomena yang kompleks.

Dalam analisis regresi terdapat dua macam pendekatan, yaitu pendekatan

parametrik dan pendekatan nonparametrik. Pendekatan parametrik digunakan

ketika sudah ada asumsi terhadap bentuk fungsi regresi berdasarkan teori atau

pengalaman masa lalu. Sedangkan pendekatan nonparametrik tidak terikat oleh

asumsi bentuk fungsi regresi tertentu. Dalam kasus nyata hubungan antara

variabel respon dengan variabel prediktor seringkali tidak diketahui bentuk fungsi

regresinya. Oleh karena itu pendekatan regresi nonparametrik banyak sekali

digunakan. Estimasi regresi nonparametrik dilakukan berdasarkan data

pengamatan dengan teknik smoothing tertentu. Ada beberapa teknik smoothing

yang digunakan dalam regresi nonparametrik yang memuat satu variabel

prediktor, diantaranya adalah Histogram, Estimator Kernel, Estimator Spline,

Estimator Penalized Spline, Estimator K-NN, Estimator Deret Fourier, Estimator

Wavelet dan Deret Orthogonal (Eubank, 1988).

Model regresi nonparametrik yang memuat lebih dari satu variabel prediktor

(14)

, dengan adalah variabel respon pada

pengamatan ke , adalah fungsi regresi multivariat pada pengamatan ke

yang diasumsikan kontinu dan tidak diketahui bentuknya dan eror random

.

Estimator polinomial lokal merupakan estimator yang didasarkan pada

prinsip meminimumkan jumlah kuadrat eror dengan pembobot fungsi kernel,

sedangkan ukuran bobot ditentukan oleh parameter yang disebut bandwidth.

Polinomial lokal merupakan suatu pendekatan yang fleksibel dan efisien dalam

metode statistik (Zhang and Chan, 2010). Estimator polinomial lokal orde satu

dikenal sebagai estimator lokal linier, sedangkan estimator polinomial lokal dapat

digunakan untuk lebih dari satu orde, sesuai yang diinginkan. Orde inilah yang

akan menjadi derajat polinomial lokal yang sesuai bagi fungsi regresinya (Fan and

Gijbelis, 1996).

Berdasarkan uraian tersebut dalam skripsi ini dibahas estimasi model regresi

nonparametrik multivariat menggunakan estimator polinomial lokal orde dua,

yang bersumber dari buku “Nonparametric and Semiparametric Models”, dan

ditambah aplikasinya pada data berat balita pada Rumah Sakit Haji Surabaya pada

tahun 2006 menggunakan software S-PLUS 2000.

1.2 Rumusan Masalah

1. Bagaimana mengestimasi model regresi nonparametrik multivariat

(15)

2. Bagaimana menerapkan model regresi nonparametrik multivariat

berdasarkan estimator polinomial lokal orde dua pada data berat badan

balita pada Rumah Sakit Haji Surabaya pada tahun 2006 dengan

menggunakan program dalam software Minitab dan S-PLUS 2000 ?

1.3 Tujuan

1. Mengestimasi model regresi nonparametrik multivariat berdasarkan

estimator polinomial lokal orde dua.

2. Menerapkan model regresi nonparametrik multivariat berdasarkan

estimator polinomial lokal orde dua terhadap data berat badan balita

pada Rumah Sakit Haji Surabaya pada tahun 2006 dengan

menggunakan program dalam software Minitab dan S-PLUS 2000.

1.4 Manfaat

1. Menambah wawasan mengenai model regresi nonparametrik

multivariat berdasarkan estimator polinomial lokal orde dua.

2. Mengetahui aplikasi model regresi nonparametrik multivariat pada data

riil, khususnya penerapan model regresi nonparametrik multivariat

berdasarkan estimator polinomial lokal orde dua pada data berat badan

balita pada Rumah Sakit Haji Surabaya pada tahun 2006

(16)

1.5 Batasan Masalah

Mengacu pada rumusan masalah di atas, maka ruang lingkup dalam

penulisan skripsi ini dibatasi pada penggunaan model regresi nonparametrik

(17)

BAB II

TINJAUAN PUSTAKA

2.1 Aljabar Matriks 2.1.1 Matriks

Matriks adalah susunan bilangan real dalam bentuk persegi panjang yang

mempunyai baris dan kolom dan dinotasikan :

elemen-elemen diagonal utama yang dinotasikan sebagai berikut

Definisi 2.2 Matriks Diagonal

Matriks diagonal adalah matriks persegi yang elemen selain diagonal utama

bernilai nol yang dinotasikan dalam bentuk :

Beberapa sifat matriks adalah sebagai berikut :

1. Jika adalah transpose dari matriks , maka

(18)

3. Jika adalah matriks nonsingular, maka adalah matriks nonsingular, dan

(Myers and Milton, 1991)

2.1.2 Nilai Eigen dan Vektor Eigen Definisi 2.3

Diberikan matriks berukuran dan sebuah vektor tak nol berukuran

. Nilai eigen dari adalah bilangan real sedemikian sehingga .

Vektor yang memenuhi persamaan ini disebut vektor eigen yang bersesuaian

dengan .

(Myers and Milton , 1991)

Nilai-nilai eigen dari matriks diperoleh dengan menyelesaikan persamaan

.

2.1.3 Matriks Definit Positif Definisi 2.4

Misalkan matrik berukuran dan adalah vektor

berdimensi dari variabel real, maka disebut bentuk kuadratik

dalam dan disebut matrik dari bentuk kuadratik.

(19)

Definisi 2.5

Bentuk kuadratik dikatakan definit positif jika untuk semua

. Matrik disebut definit positif jika bentuk kuadratik yang bersesuaian

dengan matrik adalah definit positif.

(Myers and Milton , 1991)

Teorema 2.1

Matriks simetri adalah definit positif jika dan hanya jika semua nilai eigen dari

matriks bernilai positif.

(Rencher, 2000) Bukti :

Dengan menggunakan definisi 2.3 untuk setiap nilai eigen dari yang

bersesuaian dengan vektor eigen memenuhi persamaan . Dengan

mengalikan ruas kiri dan ruas kanan dengan diperoleh :

atau

Menurut definisi 2.5 , karena definit positif maka bentuk kuadratik

definit positif, sehingga Untuk setiap maka

Akibatnya

Misalkan nilai eigen dari yang bersesuaian dengan vektor eigen

(20)

definisi 2.5 maka bentuk kuadratik definit positif . Akibatnya menurut

definisi 2.5 matriks definit positif.

2.1.4 Matriks Kalkulus Definisi 2.6

Misalkan adalah vektor, adalah skalar, dan

fungsi dari vektor . Maka turunan dari adalah :

dan turunan terhadap adalah :

Turunan kedua dari terhadap adalah :

Misalkan terdapat vektor dan matriks simetris , maka :

(21)

2.2 Bandwidth

Bandwidth atau parameter penghalus yang biasanya dinotasikan dengan ,

merupakan pengontrol keseimbangan antara kemulusan fungsi dan kesesuaian

fungsi terhadap data. Jika besar maka estimasi fungsi yang diperoleh akan

semakin mulus, sedangkan jika kecil maka estimasi fungsi yang diperoleh akan

semakin kasar atau fungsi-fungsi menjadi semakin fluktuatif. Oleh karena itu

dalam memilih nilai optimal sangat penting agar estimator yang diperoleh juga

optimal.

(Eubank, 1988)

2.3 Fungsi Kernel Univariat

Sebuah fungsi dikatakan sebagai fungsi kernel jika memenuhi sifat :

(i) untuk semua

(ii) , simetri disekitar

(iii)

(iv)

(v)

Beberapa jenis fungsi kernel univariat adalah :

a. Kernel Uniform :

b. Kernel Segitiga :

c. Kernel Epairichnikov :

(22)

e. Kernel Triweight :

f. Kernel Cosinus :

g. Kernel Gaussian :

Secara umum fungsi kernel dengan parameter penghalus atau bandwidth

(h) dinotasikan sebagai berikut :

(2.1)

(Hardle, 1990)

2.4 Fungsi Kernel Multivariat

Misalkan menyatakan banyaknya pengamatan untuk setiap variabel

random maka pengamatan ke-i dari setiap d variabel random dinyatakan

dalam vektor :

(2.2)

Fungsi kernel untuk nilai bandwidth yang berbeda dapat dinotasikan

sebagai berikut :

(2.3)

dengan , maka berakibat

.

Fungsi kernel multivariat dapat diperoleh dengan menggunakan persamaan (2.3),

(23)

(2.4)

Persamaan (2.4) di atas merupakan fungsi kernel multivariat.

(Hardle et.al, 2004)

2.5 Pemilihan Bandwidth Optimal

Suatu kriteria untuk bandwidth akan dibatasi pada kelas estimator linier.

Ini berarti untuk setiap ada matriks berukuran sehingga:

(2.5)

Salah satu metode untuk mendapatkan optimal adalah dengan menggunakan

metode Generalized Cross Validation (GCV) yang dirumuskan sebagai berikut :

(2.6)

dengan

.

Nilai optimal diperoleh dari h yang meminimumkan nilai GCV.

(24)

2.6 Deret Taylor Multivariat

Misalkan adalah ruang vektor berdimensi . Jika dan ,

dan fungsi mendekati titik , maka :

(2.7)

(Casper, 1965)

2.7 Model Regresi Nonparametrik Multivariat

Model regresi nonparametrik multivariat dinotasikan sebagai berikut :

(2.8)

dengan adalah variabel respon, adalah fungsi regresi

nonparametrik multivariat kontinu yang tidak diketahui bentuknya dengan

dan eror random .

(Zhang and Chan, 2010)

2.8 Estimator Polinomial Lokal Orde Dua

Suatu fungsi dikatakan memiliki lokal pada suatu titik dalam jika

fungsi tersebut memiliki minimum lokal, yaitu jika terdapat persekitaran dari

(25)

maksimum lokal, yaitu jika terdapat persekitaran dari sedemikian hingga

untuk semua persekitaran dari .

Dalam model regresi nonparametrik multivariat (2.8), fungsi akan

diestimasi dengan estimator polinomial lokal orde dua. Fungsi dapat

dihampiri dengan deret Taylor multivariat orde dua di sekitar

sebagai berikut:

(2.9)

Substitusikan (2.9) ke (2.8) maka diperoleh model regresi nonparametrik

multivariat pada pengamatan ke sebagai berikut :

Persamaan (2.10) dapat dinyatakan dalam notasi matriks sebagai berikut :

Estimator polinomial lokal orde dua adalah nilai yang meminimumkan

fungsi :

(2.10)

dengan adalah fungsi kernel multivariat.

(Hardle et.al, 2004)

2.9 Distribusi Normal

Variabel random berdistribusi normal dengan mean dan varians jika

probability density function (pdf) nya berbentuk :

(26)

dan ditulis .

Misalkan variabel random atau , maka diperoleh fungsi

Jacobian . Akibatnya variabel random mempunyai pdf sebagai

berikut :

Ini menunjukkan bahwa variabel random berdistribusi normal baku dan ditulis

.

(Hogg, et. al., 2004) Teorema 2.2

Moment Generating Function (mgf) dari variabel random adalah

Bukti :

(27)

Teorema 2.3

Jika variabel random berdistribusi normal dengan mean dan varians , maka

mgf dari adalah

Bukti :

Misalkan , maka sehingga mgf dari adalah

(dari teorema 2.2)

Teorema 2.4

Jika variabel random independen ; maka variabel

random

Bukti :

Menurut teorema 2.3 diperoleh mgf dari adalah

(28)

Sehingga mgf dari adalah :

Akibatnya variabel random

Teorema 2.5 (Teorema Limit Pusat)

Jika sampel random dari distribusi normal dengan mean dan

varian , maka variabel random

akan berdistribusi normal baku dengan mean dan varian .

Bukti :

Diasumsikan mgf ada untuk , sehingga fungsi

juga ada untuk . Fungsi

merupakan mgf dari , hal itu menunjukkan bahwa

dan . Dengan menggunakan rumus

Taylor untuk di sekitar terdapat sebuah bilangan antara dan

sedemikian sehingga

(29)

Selanjutnya dihitung mgf dari adalah

,

Substitusikan dengan , sehingga diperoleh :

dengan nilai antara dan dan . Akibatnya

diperoleh

Karena kontinu pada dan untuk , maka

sehingga

(30)

untuk semua bernilai real. Menurut (2.14) membuktikan bahwa variabel random

mempunyai limit distribusi normal baku. ■

(Hogg, et. al., 2004)

2.10 Software S-PLUS 2000

S-PLUS adalah suatu paket program yang memungkinkan membuat

program sendiri walaupun di dalamnya sudah tersedia banyak program internal

yang siap digunakan. Kelebihan dari paket program ini adalah baik program

internal maupun program yang pernah dibuat dapat digunakan sebagai sub

program dari program yang akan dibuat. Beberapa perintah internal yang

digunakan dalam S-PLUS adalah sebagai berikut :

a. function( )

merupakan perintah untuk menunjukkan fungsi yang akan digunakan dalam

program.

Bentuknya : function(...)

b. length( )

merupakan perintah untuk menunjukkan banyaknya data.

Bentuknya : length(...)

c. rep(a,b)

merupakan perintah untuk membentuk sebuah vektor yang anggotanya a

sebanyak b.

(31)

d. matrix(a,b,c)

merupakan perintah untuk membentuk sebuah matriks yang anggotanya a

dengan jumlah baris sebanyak b dan jumlah kolom sebanyak c.

Bentuknya : matrix(...,...,...)

e. cat( )

merupakan perintah untuk menuliskan argumentasi dalam bentuk karakter dan

kemudian mencetak hasil atau file yang telah ditetapkan.

Bentuknya : cat(“....”)

f. for( )

merupakan perintah untuk mengulang satu blok pernyataan berulang kali

sesuai dengan kondisi yang telah ditentukan.

Bentuknya : for(kondisi){pernyataan}

g. sum( )

merupakan perintah untuk menjumlahkan semua bilangan anggota dari suatu

vektor.

Bentuknya : sum( ... )

h. if-else

merupakan perintah untuk menjalankan pernyataan pertama jika kondisi benar

dan pernyataan kedua akan dieksekusi jika kondisi bernilai salah.

Bentuknya : if(kondisi)

{

pernyataan pertama

(32)

else pernyataan kedua

i. while

merupakan perintah untuk mengulang satu blok pernyataan terus menerus

selama kondisi ungkapan logika pada while berlaku benar.

Bentuknya : while(logika)

{

pernyataan

}

j. rbind

perintah untuk menggabungkan beberapa vektor baris ke dalam satu bentuk

matriks.

Bentuknya adalah: rbind(….)

k. cbind

perintah untuk menggabungkan beberapa vektor kolom ke dalam satu bentuk

matriks.

Bentuknya adalah : cbind(…..)

l. repeat

merupakan perintah untuk mengulangi eksekusi pernyataan secara terus

menerus, sehingga diperlukan pernyataan lain untuk menghentikan perulangan

eksekusi.

Bentuknya : repeat

{

(33)

if(pernyataan kedua) break }

(Everiit, 1994)

2.11 Software Minitab

Minitab merupakan salah satu software dalam ilmu statistik yang banyak

digunakan. Minitab pertama kali ditemukan pada tahun 1972, yang pada saat itu

masih bernama sistem “Omnitab”. Minitab adalah software yang mudah dipelajari

dan memuat banyak aplikasi dalam statistik. Selain itu, software ini juga dapat

digunakan pada berbagai macam tipe komputer, seperti komputer mikro,

komputer mini, dan sebagainya.

Beberapa command pada Minitab antara lain NAME, TINTERVAL, TTEST,

TWOT, ONEWAY, STOP, dan NOTE.

(Berenson et.al, 1988)

2.12 Pertumbuhan Balita

Di masyarakat, cara pengukuran status gizi yang paling sering digunakan

adalah antropometri gizi. Dewasa ini dalam program gizi masyarakat, penentuan

status gizi balita pun menggunakan metode antropometri sebagai cara untuk

menilai status gizi. Pengukuran antropometri ada dua tipe yaitu pertumbuhan dan

ukuran komposisi tubuh. Penilaian pertumbuhan merupakan komponen esensial

dalam surveilan kesehatan anak karena hampir setiap masalah yang berkaitan

dengan fisiologi, interpersonal, dan domain sosial dapat memberikan efek yang

(34)

Antropometri sebagai indikator status gizi dapat dilakukan dengan

mengukur beberapa parameter. Parameter adalah ukuran tunggal dari tubuh

manusia, antara lain umur, berat badan, tinggi badan, lingkar kepala, lingkar

lengan, lingkar dada, dan tebal lemak bawah kulit.

Ukuran komposisi tubuh balita yang paling sering diukur di posyandu

adalah berat badan. Ada beberapa faktor yang mempengaruhi berat badan balita,

antara lain umur, tinggi badan, dan lingkar kepala. Pertumbuhan balita dikatakan

baik jika berat badannya seimbang dengan umur, tinggi badan, dan lingkar

kepalanya.

(35)

BAB III

METODE PENELITIAN

Metode penelitian yang terkait dengan tujuan penulisan ini adalah sebagai

berikut :

1. Mengestimasi model regresi nonparametrik multivariat berdasarkan

estimator polinomial lokal orde dua melalui langkah-langkah berikut :

Langkah 1.

Mengasumsikan sebagai fungsi respon sebanyak pengamatan dan

dengan sebagai variabel prediktor

sebanyak , memenuhi model regresi nonparametrik multivariat

, dengan adalah fungsi regresi

multivariat yang tidak diketahui bentuknya.

Langkah 2.

Melakukan hampiran terhadap fungsi menggunakan pendekatan

polinomial lokal orde dua di sekitar , yaitu sebagai berikut :

dengan

(36)

Langkah 3.

Menyatakan elemen-elemen dari vektor sebagai berikut :

dengan,

Langkah 4.

Meminimumkan fungsi terhadap vektor parameter :

dengan

Langkah 5.

Mendapatkan estimator bagi vektor parameter .

Langkah 6.

Mendapatkan estimasi model regresi nonparametrik multivariat, yaitu

Langkah 7.

(37)

Langkah 8.

Memperoleh estimasi bagi , yaitu :

Kemudian menghitung nilai , sehingga estimasi bagi

adalah

Langkah 9.

Menentukan distribusi dari variabel random sesuai dengan yang tertera pada

persamaan (2.20) :

Langkah 10.

Menentukan nilai .

Langkah 11.

Mendapatkan selang kepercayaan bagi model regresi nonparametrik

multivariat pada pengamatan ke- , yaitu :

2. Menerapkan model regresi nonparametrik multivariat berdasarkan estimator

polinomial lokal orde dua terhadap data berat badan balita pada Rumah

(38)

Langkah 1.

Menginputkan data berat badan balita pada Rumah Sakit Haji Surabaya

pada tahun 2006 yang memenuhi asumsi model regresi nonparametrik

multivariat dengan berat badan balita sebagai variabel respon, tinggi badan

balita sebagai variabel prediktor pertama dan lingkar kepala balita sebagai

variabel prediktor kedua.

Langkah 2.

Membuat scatterplot antara variabel respon dengan setiap variabel

prediktor.

Langkah 3.

Membuat program dalam software S-PLUS 2000.

Langkah 4.

Mengestimasi model regresi nonparametrik multivariat pada data berat

(39)

BAB IV

HASIL DAN PEMBAHASAN

4.1 Estimasi Titik pada Model Regresi Nonparametrik Multivariat

Diasumsikan data pengamatan berpasangan dengan

adalah variabel respon ke i dan adalah variabel

prediktor multivariat ke-i memenuhi model regresi nonparametrik multivariat :

(4.1)

dengan adalah fungsi regresi nonparametrik multivariat yang tidak

diketahui bentuknya dan diasumsikan eror identik independen normal dengan

mean 0 dan varians .

Model regresi (4.1) dapat ditulis dalam notasi matriks sebagai berikut :

(4.2)

dengan

,

dan vektor eror random .

Vektor pada persamaan (4.2) tidak diketahui bentuknya akan diestimasi

dengan estimator polinomial lokal orde dua sebagai berikut :

(4.3)

(40)

Elemen-elemen dari vektor pada (4.3) dapat dijelaskan sebagai berikut :

(41)
(42)

Sehingga dari (4.3) diperoleh bentuk :

(43)

(4.6)

Persamaan (4.6) dapat dinyatakan dalam bentuk sistem persamaan sebagai

berikut :

(4.7)

Sistem persamaan (4.7) dapat dinyatakan dalam notasi matriks sebagai

berikut :

(4.8)

dengan

(44)

Estimasi model regresi nonparametrik multivariat pada persamaan (4.8)

dengan menggunakan estimator polinomial lokal orde dua dengan pembobot

fungsi kernel diperoleh dengan meminimumkan fungsi :

(4.9)

dengan merupakan fungsi kernel multivariat berdimensi-d dengan

bandwidth yang dinyatakan sebagai berikut :

(45)

Jika dinyatakan dalam notasi matriks, persamaan (4.9) akan menjadi sebagai

berikut :

(4.11)

dengan

Persamaan (4.11) jika dijabarkan sebagai berikut :

(4.12)

Langkah untuk mendapatkan fungsi pada (4.12) mencapai minimum adalah

. Berdasarkan Teorema 2.2, maka diperoleh :

Karena , maka :

Dari persamaan (4.13) diperoleh :

(46)
(47)

bahwa nilai positif, dari sini diperoleh bahwa matriks adalah

definit positif. Karena adalah bentuk kuadratik, dan ,

maka diperoleh . Maka, matriks

definit

positif.

Setelah memperoleh pada persamaan (4.14), maka substitusikan ke

dalam persamaan (4.8). Maka diperoleh estimasi model regresi nonparametrik

multivariat berdasarkan estimator polinomial lokal orde dua adalah :

(4.15)

dengan

Sehingga, estimator polinomial lokal orde dua untuk pengamatan ke-i

adalah :

(4.16)

dengan adalah baris ke- dari matriks .

4.2 Selang Kepercayaan Estimator Model Regresi Nonparametrik Multivariat

Fungsi pada persamaan (4.16) merupakan estimasi model regresi

nonparametrik multivariat pada pengamatan ke- berdasarkan estimator

polinomial lokal orde dua. Selanjutnya akan ditentukan selang kepercayaan bagi

estimator model regresi nonparametrik multivariat pada pengamatan ke- yang

(48)

Fungsi akan diestimasi dengan terlebih dahulu vektor dari eror

random pada persamaan (4.8) diestimasi oleh :

(4.17)

Diperoleh estimasi bagi adalah :

(4.18)

Selanjutnya akan dihitung nilai varians dari , berdasarkan teorema 2.3

diperoleh :

(4.19)

Estimasi bagi pada persamaan (4.19) adalah :

(4.20)

Dari persamaan (4.2) diketahui bahwa vektor random ).

Maka, , sehingga kombinasi linier dari persamaan (4.16)

diperoleh Akibatnya variabel

random –

. Selang kepercayaan )

100% bagi adalah sebagai berikut :

(49)

Untuk mengestimasi model regresi nonparametrik multivariat berdasarkan

estimator polinomial lokal orde dua pada persamaan (4.16) dan menentukan

selang kepercayaan pada persamaan (4.21), maka algoritma yang digunakan

adalah sebagai berikut :

Langkah 1.

Menginputkan variabel respon Y dan variabel prediktor X dari persamaan (4.8).

Langkah 2.

Menentukan fungsi Kernel yang akan digunakan yaitu fungsi Kernel Gaussian.

Langkah 3.

Menentukan nilai bandwidth (h) awal yang berbeda untuk masing-masing variabel

prediktor.

Langkah 4.

Menghitung nilai yaitu

Langkah 5.

Menghitung pada persamaan (4.16).

Langkah 6.

Menghitung

Langkah 7.

Menghitung GCV pada persamaan (2.6).

Langkah 8.

Mendapatkan nilai bandwidth (h) optimal untuk masing-masing variabel prediktor

(50)

Langkah 9.

Mendapatkan estimasi model regresi nonparametrik multivariat berdasarkan

estimator polinomial lokal dengan menentukan nilai .

Langkah 10.

Mendapatkan estimasi pada persamaan (4.17).

Langkah 11.

Menghitung estimasi bagi pada persamaan (4.18).

Langkah 12.

Menghitung pada persamaan (4.19).

Langkah 13.

Mendapatkan estimasi bagi yaitu pada

persamaan (4.20).

Langkah 14.

Menghitung nilai statistik uji

Langkah 15.

Mendapatkan selang kepercayaan ) 100% bagi pada

(51)

4.3 Penerapan pada Data 4.3.1 Data

Data yang digunakan untuk penerapan model regresi nonparametrik

multivariat berdasarkan estimator polinomial lokal orde dua ini adalah data

sekunder yang diambil dari RSU Haji Surabaya pada tahun 2006 sebanyak 30

pengamatan, yang diambil dari Hidayah (2007) (lihat lampiran 1). Data tersebut

merupakan data tentang berat badan balita berdasarkan tinggi badan balita dan

lingkar kepala balita. Variabel respon pada data adalah berat badan balita (dalam

satuan kilogram), sedangkan sebagai variabel prediktor pertama adalah tinggi

badan balita (dalam satuan meter), dan variabel prediktor kedua adalah lingkar

kepala balita (dalam satuan meter).

Untuk mendapatkan estimator model regresi nonparametrik multivariat yang

menunjukkan seberapa besar pengaruh tinggi badan balita dan lingkar kepala

balita terhadap berat badan balita, langkah yang dilakukan adalah menentukan

model hubungan antara variabel respon dengan variabel prediktor secara serentak

dengan menggunakan pendekatan estimator polinomial lokal orde dua.

4.3.2 Analisis Data

Gambaran awal tentang data dapat dilakukan dengan membuat scatterplot

antara berat badan balita dengan tinggi badan balita dan berat badan balita dengan

(52)

Gambar 4.1 Plot data awal tinggi badan balita terhadap berat badan balita

Gambar 4.2 Plot data awal lingkar kepala balitaterhadap berat badan balita

Nilai bandwidth (h) optimal untuk tiap prediktor pada masing-masing

pengamatan ditentukan oleh kriteria GCV dengan menggunakan program pada

software S-Plus 2000 (lihat Lampiran 2). Nilai bandwidth (h) optimal pada untuk

(53)

lingkar kepala balita sebesar , diperoleh nilai minimum GCV sebesar

(lihat Lampiran 3a).

Nilai bandwidth (h) optimal akan digunakan untuk mencari nilai

pada tiap pengamatan. Dengan menggunakan program pada software S-Plus 2000

(pada Lampiran 2), diperoleh nilai estimasi model regresi nonparametrik

multivariat pada setiap pengamatan (lihat Lampiran 3b) dengan Mean Square

Error (MSE) sebesar .

Selanjutnya, dilakukan uji normalitas pada eror dengan menggunakan uji

One sample Kolmogorov-Smirnov pada software S-PLUS 2000. Berdasarkan uji

tersebut, diperoleh nilai p-value sebesar 0.5 (lihat lampiran 3c). Dengan nilai

sebesar 5%, maka dapat disimpulkan bahwa eror berdistribusi normal dengan

mean sebesar dan varian sebesar .

Plot selang kepercayaan 95% bagi rata-rata berat badan balita akan

digambarkan melalui software Minitab 14 sebagai berikut :

(54)

Berdasarkan Lampiran 3b, diperoleh hasil estimasi selang kepercayaan 95%

bagi rata-rata berat badan balita pada pengamatan ke-1 adalah

, pada pengamatan ke-2 sebesar

, sampai pada pengamatan ke-30 yaitu sebesar

(55)

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Dari pembahasan pada bab sebelumnya, maka dapat diambil beberapa

kesimpulan sebagai berikut :

1. Hasil estimasi model regresi nonparametrik multivariat menggunakan

estimator polinomial lokal orde dua adalah , dengan

. Selang pepercayaan

untuk rata-rata estimasi model regresi nonparametrik

multivariat adalah :

2. Penerapan data dalam model regresi nonparametrik multivariat adalah data

berat badan balita pada Rumah Sakit Haji pada tahun 2006 sebanyak 30

pengamatan dengan variabel respon adalah berat badan balita dalam

dan kedua variabel prediktornya adalah tinggi badan balita

dalam satuan meter dan lingkar kepala balita dalam satuan meter. Hasil

penerapan model regresi nonparametrik multivariat pada data berat badan

balita diperoleh diperoleh hasil estimasi selang kepercayaan 95% bagi

rata-rata berat badan balita pada pengamatan ke-1 adalah

, pada pengamatan ke-2 sebesar

(56)

sebesar , dengan bandwidth optimal untuk

variabel prediktor sebesar dan variabel prediktor sebesar .

Untuk kesesuaian hasil estimasi model regresi nonparametrik multivariat

diperoleh nilai dan eror random

5.2 Saran

Saran bagi penulis selanjutnya dapat mencari estimasi model regresi

nonparametrik multivariat dengan menggunakan estimator lain, misalnya

estimator Spline atau Penalized Spline, dengan lebih banyak variabel prediktor,

(57)

DAFTAR PUSTAKA

1. Berenson, M. L., Levine D. M., and Rindskopf, D., 1988, Applied Statistics A First Course, Prentice Hall, Englewood Cliffs, New Jersey.

2. Eubank, R.L., 1988, Spline Smoothing and Nonparametric Regression, Marcel Dekker, New York.

3. Everitt, S., 1994, A Handbook of Statistical Analysis Using S-PLUS, Chapman &Hall, London.

4. Fan, J. and Gijbels, I., 1996, Local Polynomial Modelling and Its Applications, Press, New York.

5. Casper, G., 1965, Calculus of Several Variables, Harper and Row, New York.

6. Hardle, W., 1990, Applied Nonparametric Regression, Cambridge University Press, New York.

7. Hardle, W., Muller, M., Sperlich, S., and Werwatz, A., 2004, Nonparametric and Semiparametric Models, Springer, New York.

8. Hidayah, S., 2007, Estimasi Model Regresi Nonparametrik Multiprediktor dengan Error Lognormal berdasarkan Estimator Penalized Spline, Skripsi, Departemen Matematika, Universitas Airlangga.

9. Hogg, R.V., McKean, J.W., and Craig, A.T., 2004, Introduction to Mathematical Statistic Sixth Edition, UpperSaddle River, New Jersey.

10.Lewis, F. L., and Syrmos, V. L., 1995, Optimal Control Second Edition, A Wiley-Interscience Publication, John Wiley & Sons, Inc.

11.Myers, R. H. and Milton, J. S., 1991, A First Course in The Theory of Linear Statistical Models, PWS-KENT Publishing Company, Boston.

12.Rencher, A. C., 2000, Linear Model in Statistics, Department of Statistics Brigham Young University Provo, Utah.

(58)

14.Zhang, Z. G., and Chan, S. C., 2010, On Kernel Selection of Multivariate Local Polynomial Modelling and its Application to Image Smoothing and

(59)

Lampiran 1 : Data Berat Badan Balita di Rumah Sakit Haji Surabaya Tahun

(60)
(61)

}

(62)
(63)

Lampiran 3 : Output Program Estimasi Model Regresi Nonparametrik Multivariat

(64)
(65)

1 0.6 1.55023 1 0.7 1.55023 1 0.8 1.55023 1 0.9 1.55023 1 1 1.55023 1.1 0.2 1.550224 1.1 0.3 1.550223 1.1 0.4 1.550223 1.1 0.5 1.550223 1.1 0.6 1.550224 1.1 0.7 1.550224 1.1 0.8 1.550224 1.1 0.9 1.550224 1.1 1 1.550224

h1 optimal h2 optimal GCV minimal 1.1 0.3 1.550223

$h1.opt: [1] 1.1

$h2.opt: [1] 0.3

Keterangan :

data : nama data pada data set dalam software S-Plus, yaitu data berat badan balita

(66)

b. Estimasi untuk Variabel Respon Berat Badan Balita dengan Variabel Prediktor Tinggi Badan Balita dan Variabel Prediktor Lingkar Kepala Balita pada Tiap Pengamatan

> estimasi(databalita,1.1,0.3,0.05)

(67)

Keterangan:

MSE = 0.992158139962808

c. Uji Normalitas pada Error

One sample Kolmogorov-Smirnov Test of Composite Normality

ks = 0.0506, p-value = 0.5

alternative hypothesis: True cdf is not the normal distn. with estimated parameters

sample estimates:

mean of x standard deviation of x

Gambar

Gambar 4.1 Plot data awal tinggi badan balita terhadap berat badan balita

Referensi

Dokumen terkait

Model-model pendekatan regresi nonparametrik yang dikembangkan oleh penelitian sebelumnya, pada dasarnya terdapat dua asumsi yang yang sangat berat dan mendasar pada

Fungsi-Fungsi Kernel Pada Metode Regresi Nonpara- metrik dan Aplikasinya Pada Priest River Experimental Forests Data.. Jurnal Teknik

Penerapan interval konfidensi untuk parameter model regresi nonparametrik spline truncated multivariabel pada penelitian ini diterapkan pada data Indeks Pembangunan

Pendekatan regresi nonparametrik dengan estimator kernel menggunakan fungsi kernel Uniform, triangle, epanechnikov, quartic, triweight, gauss, dan cosinus pada data

4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline

Dalam pemodelan tersebut dibahas bagaimana mengestimasi model regresi aditif nonparametrik berdasarkan estimator Penalized Spline, membuat algoritma dan program pada software

Dalam penelitian ini, penulis memodelkan jumlah kematian bayi di Provinsi Sulawesi Selatan yang merupakan data berdistribusi Poisson menggunakan regresi

Data yang digunakan untuk penerapan model regresi semiparametrik birespon pada data longitudinal berdasarkan estimator spline truncated adalah data pertumbuhan