ESTIMATOR SPLINE DALAM REGRESI
NONPARAMETRIK MULTIRESPON
Seminar Hasil TesisNONPARAMETRIK MULTIRESPON
(STUDI KASUS TINGKAT KESEJAHTERAAN DI INDONESIA TAHUN 2009) Oleh: I Gde AdnyanaPembimbing: Prof. Dr. Drs. I Nyoman Budiantara, MS
PROGRAM MAGISTER JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2010
OUTLINE
•
PENDAHULUAN
•
TINJAUAN PUSTAKA
•
METODOLOGI PENELITIAN
•
HASIL DAN PEMBAHASAN
•
KESIMPULAN DAN SARAN
•
KESIMPULAN DAN SARAN
Pendahuluan
lanjutan
Spline ( Eubank)
‐ potongan polinomial sifat tersegmen & kontinu
‐ Minimumkan PLS yaitu gabung antara goodnes of fit dan kemulusan kurva
Kelebihan cenderung mencari sendiri estimasi ‐ Kelebihan: cenderung mencari sendiri estimasi
data kemanapun pola data bergerak ‐ Akibat dari adanya titik knot
lanjutan
Regresi menurut jumlah jumlah variabel
(R h )
(Rencher):
• Regresi linier sederhana ‐‐‐> 1 Var. Respon & 1 Var. prediktor
• Regresi berganda ‐‐‐> 1 Var. Respon & >1 Var. prediktor
prediktor
• Regresi multirespon ‐‐‐> >1 Var. Respon& >= 1 Var. prediktor
lanjutan
• Masalah dunia nyata, kadangkala dihadapkan
d d d d t l bih d
pada dua var. dependen atau lebih dengan beberapa var. Independen dengan pola data tidak diketahui.
• Regresi nonparametrik multirespon sebagai alat untuk memodelkan fungsi yg berkaitang yg dengan masalah tsb.
• Spline sebagai estimator
lanjutan
Ukuran Kesejahteraan
P d d l i d t
• Pada umumnya model regresi dengan satu respon, misalnya pendapatan (Todaro, 2003), pengeluaran (Harianto, 1994; Junaedi, 2005; Berg, 1986), pertumbuhan ekonomi ,
kemiskinan, IPM dll
l bih t t jik di k d i
• lebih tepat jika diukur dengan regresi nonparametrik multirespon dengan menggunakan spline
Permasalahan
• Bagaimana estimasi fungsi regresi
t ik lti d
nonparametrik multirespon dengan pendekatan spline
• Bagaimana memilih titik knot optimal dalam estimator spline
estimator spline
• Bagaimana merancang suatu algoritma dan program komputer untuk menyelesaikan tujuan (1) dan (2)
Permasalahan (2)
• Bagaimana aplikasi algoritma dan program
k t di d t j (3)
komputer yang dirancang pada tujuan (3) untuk estimator spline dalam regresi
nonparametrik multirespon, untuk memodelkan tingkat kesejahteraan di indonesia tahun 2009
Tujuan
• Mendapatkan estimasi fungsi regresi
t ik lti d
nonparametrik multirespon dengan pendekatan spline
• memilih titik knot optimal dalam estimator spline
spline
• merancang suatu algoritma dan program komputer untuk menyelesaikan tujuan (1) dan (2)
Tujuan (2)
• Bagaimana aplikasi algoritma dan program
k t di d t j (3)
komputer yang dirancang pada tujuan (3) untuk estimator spline dalam regresi
nonparametrik multirespon, untuk memodelkan tingkat kesejahteraan di indonesia
Manfaat Penelitian
• Memberikan wawasan keilmuan yang lebih
k d li d k t t t
kepada penulis dan masyarakat tentang penggunaan spline pada regresi
nonparametrik multirespon
• Memberi kontribusi dalam pengembangan
komputasi statistik terutama regresip g
nonparametrik multirespon dalam bentuk macro
Batasan Masalah
• Dikaji model regresi nonparametrik
lti d k d l
multirespon dengan menggunakan model spline truncated linier dan pemilihan titik knot dengan metode GCV dengan aplikasi pada data tingkat kesejahteraan di Indonesia tahun 2009
Tinjauan Pustaka
Analisis Regresi
• Mengetahui pola hubungan antara variabel
dikt d
prediktor dengan var. respon
• Ada tiga pendekatan yaitu regresi parametrik, non parametrik dan semiparametrik
Regresi Nonparametrik
• Menurut Eubank (1999) model regresi nonparametrik yaitu: Dimana :( )
:
1....
j j jy
f t
j
n
: j y V a r respo n ( ) : fu n g si yg tid a k d ik eta h u i d ia su m s ik a n s m o o th d a la m su a tu ru an g i f t : V a r . p r e d i k t o r i t : error diasumsikan ~ N(0, 2) i Model Nonparametrik Spline
• Model spline suatu ruang Sobolev
( ) 2 [ ] { ; ( ( )) } b m m W a b g g t dt • Spline Optimasi PLS
2 [ , ] { (f ) } m f W a b Min R f J 2 [ , ] { ; ( ( )) } a W a b g g t dt Uk. Kemulusan FsGoodness of Parameter Penghalus
fit Penghalus 0 1 ( ) ( ) p r i p i p j j i j s t t t k
Model nonparametrik spline(2)
• Wahba (1990), Craven dan Wahba (1979), dan Kimeldorf dan Wahba (1971) mengambil R(f) dan J(f) dalam bentuk kuadrat spline Natural • Cox dan O’Sullivan (1996) dan Cox (1983) memperoleh estimator spline tipe‐M memperoleh estimator spline tipe M • Oehlert (1992) memberikan estimator spline relaxed • Koenker, et. al. (1994) memberikan estimator spline quantileModel nonparametrik spline(3)
• Budiantara (2006b) telah mengembangkan ti t li d l i t ik estimator spline dalam regresi nonparametrik dengan menggunakan basis fungsi keluarga spline truncated ( ) ( ) m k c m c m k k f t
t
t 2 0 1 2 1 1 1 ... ( ) ( ) ... ( ) ( ) m m m m r r r f t t t t t K I t K t K I t K ( ) , ( ) 0 m m k k k k t t t t 0 1 ( ) c m k( k) c d f
Regresi Multirespon
Model regresi multirespon 1 1 1 2 2 2 ( ) ( ) ( ) j j j j y f t y f t y f t
( ) l lj lj y f t
Pemilihan Titik Knot
Menurut Wahba (1990) dan Eubank (1988): • Jika parameter penghalus kecil kurva kasar • Jika parameter penghalus besar kurva halus • Perlu memilih parameter penghalus optimal
salah satu metode yaitu Generalized Cross
Pemilihan Titik Knot (2)
2 ( ) ( ) MSE K GCV K Dimana 2 1 ( ) ( ( )) n tr I H K 1 2 1 ˆ ( ( )) n j j j MSE n y f t ' 1 ' ( ) ( ) H X X WX X WMenurut Eubank(1999) memilih parameter penghalus optimal ekuivalen dengan memilih titik knot optimal.
Teori Kesejahteraan Sosial dan
Ekonomi
• Kesejahteraan merupakan aspek yg penting • Perlu peran pemerintah dalam menentukan
kebijakan perekonomian
• Pertumbuhan ekonomi abaikan kesejahteraan • Perlu kebijakan untuk peningkatan
pertumbuhan ekonomi dan kesempatan kerja pertumbuhan ekonomi dan kesempatan kerja • Dampak sosial pertumbuhan ketimpangan
Teori Kesejahteraan Sosial dan
Ekonomi (2)
• Pembangunan manusia merupakan paradigma
pembangunan yang menempatkan manusia pembangunan yang menempatkan manusia sebagai fokus dan sasaran akhir dari seluruh kegiatan pembangunanIPM
• Kesejahteraan suatu negara (Thomas dalam Sugiarto, 2007) diukur melalui indikator kemiskinan angka buta huruf angka melek kemiskinan, angka buta huruf, angka melek huruf, emisi karbon, perusakan alam
&lingkungan, polusi, PDB
• Todaro (2003) menyatakan kesejahteraan merupakan fungsi dari pendapatan perkapita, ketimpangan dan kemiskinan absolut
Sumber Data
Bahan dan alat
• Jurnal dan buku referensi yang terkait • Software yang digunakan Matlab Sumber data & unit observasi
• Publikasi BPS yaitu Statistik Indonesia 2009 dan publikasi Perkembangan Beberapa Indikator Sosial Ekonomi Indonesia
• Unit Observasi adalah Propinsi yang ada di Indonesia (33 Propinsi)
Variabel Penelitian
• Variabel Respon
• Y1= Persentase penduduk miskin; • Y2= IPM;
• Variabel prediktor • X1 = TPT
Langkah‐Langkah Penelitian
1. Langkah untuk mendapatkan tujuan 1
• Buat model multirespon
• Kurva regresi didekati dengan fungsi spline truncated
• Buat model dalam bentuk matriks
• Tentukan matriks bobot varian‐kovarian W
• Selesaikan optimasi denganWLS
• Gunakan derivatif parsial untuk selesaikan optimasi diatas
2. Langkah untuk mendapatkan tujuan 2 • Definisikan MSE
• Dapatkan matriks H(λ) dari langkah tujuan 1 • Mencari titik knot yang minimumkan nilai
3. Langkah mendapatkan tujuan 3
Rancang algoritma dan prokom untuk estimator
• untuk pendefinisian dan pengubahan variabel ke matriks • Untuk mendapatkan matriks bobot varian ‐kovarian w • untuk membuat visualisasi untuk estimator spline optimal • untuk menghitung nilai MSE
• untuk menentukan banyak titik awal knot dari fungsi regresi Rancang algoritma dan prokom untuk titik knot optimal
• untuk menentukan nilai titik awal knot. • untuk menghitung nilai GCV awal.
• untuk melakukan iterasi untuk mendapatkan titik knot optimal.
Langkah untuk mendapatkan tujuan 4
• Membuat plot antara variabel respon dan dikt
prediktor
• Memodelkan masing‐masing prediktor dengan respon menggunakan spline truncated
• Mendapatkan estimator spline dengan kendala GCV minimum
kendala GCV minimum • Interpretasi output
HASIL DAN PEMBAHASAN
Estimator Spline Dalam Regresi
Nonparametrik Multirespon
• Bentuk Umum model Multiresponse
• Dalam bentuk matriks
1 1 11 1 2 1 1 1 1 2 2 12 2 22 2 2 2 1 2 ( ) ( ) ... ( ) ( ) ( ) ... ( ) ( ) ( ) ... ( ) j j j m j j j j j m j j l j l l j l l j l m l j l j Y f t f t f t Y f t f t f t Y f t f t f t ( ) ( ) ( ) Y f t f t f t 1 1 11 1 2 1 1 1 1 2 2 12 2 22 2 2 2 1 2 ( ) ( ) ... ( ) ( ) ( ) ... ( ) ( ) ( ) ... ( ) j j j m j j j j j m j j l j l l j l l j l ml j l j Y f t f t f t Y f t f t f t Y f t f t f t
Estimator Spline Dalam Regresi Nonparametrik Multirespon
• Misalkan diberikan suatu fungsi spline
truncated linier s(t) dengan titik knot truncated linier s(t) dengan titik knot
sebanyak k, yaitu:
• Jika dalam model multirespon fungsi f diganti
0 1 1 1 2 2 ( ) ( ) ( ) ... k( k) s t t t t t 1j 1(11j) 1(2 1j) ... 1(m j1) 1j Y s t s t s t p g f g
dengan fungsi spline s 2 2 12 2 22 2 2 2
1 2 ( ) ( ) ... ( ) ( ) ( ) ... ( ) j j j m j j l j l l j l l j l ml j l j Y s t s t s t Y s t s t s t
• uraikan fungsi s dan memisahkan antara
parameter dengan variable X • Dimana y X , 1, 2... : ij i l saling korelasi , 1, 2,..., : ij j n Independent
2 1 2 2 1 1 [ (W )] diag W( ) Wl(l ) optimasi dengan WLS ( 2 )
( 2 ) min ' minnlm k ' nlm k R R W Y X W Y X • Estimasi parameter beta • Estimasi y hat 1 ˆ X WX' X WY' 1 ˆ ' ' Y X X WX X WY Estimasi y hat atau Dengan ˆ ( ) Y H K Y
1 ( ) ' ' H K X X WX X W Pemilihan Titik Knot
• Salah satu metode pemilihan titik knot
d l h i i k il i li d
adalah meminimumkan nilai generalized cross validation (GCV) 2 1 ( ) ( ) min ( ( )) MSE K GCV K N tr I H K • Menurut Eubank(1999) dan Budiantara(2006b) memilih parameter
penghalus optimal ekuivalen dengan memilih titik knot optimal.
Nonparametrik Multirespon
• Mendefinisikan variable dan matriks bobot • Membuat macro program untuk memilih titik • Membuat macro program untuk memilih titik
knot optimal secara otomatis
• Membuat output nilai GCV, MSE, titik knot dan koefisien regresi untuk masing‐masing model kedalam file output.p Model Tingkat Kesejahteraan di Indonesia Variabe l observa si Minim m Maksi m m
Range Mean Varians
Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor
l si um mum
Y1 33 3.62 37.53 33.91 15.13 71.30
Y2 33 64.00 77.03 13.03 70.88 9.30
t1 33 3.13 14.97 11.84 7.24 7.07
Scatter Plot antara TPT dengan Persentase Penduduk Miskin dan IPM
Scatter Plot antara Laju Pertumbuhan PDRB dengan Persentase Penduduk Miskin dan IPM
Nilai GCV dari masing masing model
Model Nilai GCV Nilai MSE
Spline Linier 1 Titik Knot
625.99872 539.53681
Spline Linier 2 Titik Knot
1069.24091 911.28054
Spline Kuadrat 1 Titik Knot
944.64342 804.74401
Spline Kuadrat 2 Titik Knot
2740 46494 2303 09708 2740.46494 2303.09708
Spline Kubik 1 Titik Knot
193.70690 172.61988
Spline Kubik 2 Titik Knot
198.23155 159.07228
Model Yang Optimum
2 3 3 1 1 1 1 1 2 3 3 2 2 2 2 2 3 3 2 1 1 1 1 2 ˆ -62.33800-27.51674 -1.81028 0.27339 11.70603( -11.13) 20.04841 -0.14317 0.08694 -0.22199( -0.51) ˆ -16.28458 3.29673 +0.78923 -0.07632 +9.97793( -5.13) +10.07060 +2. Y t t t t t t t t Y t t t t t 2 3 3 2 2 2 94362 -0.19535 -1.05199( -2.51 ) t t t Interpretasi model
• Model yang terbaik yang menjelaskan tingkat
k j ht di I d i d l h d l
kesejahteraan di Indonesia adalah model spline kubik dengan 1 titik knot.
• Pada respon persentase penduduk miskin, perubahan pola pada variabel TPT terjadi pada titik 11.13 dan variabel laju
p j
pertumbuhan PDRB terjadi pada titik 0.51. • Pada respon IPM, perubahan pola pada
variabel TPT terjadi pada titik 5.13 dan
variabel laju pertumbuhan PDRB terjadi pada i ik 2 51
Kesimpulan
• Estimasi kurva regresi nonparametrik
lti d ti t li
multirespon dengan estimator spline
truncated diberikan oleh:
• Metode untuk memilih titik knot optimal
ˆ ( )
Y H K Y
• Metode untuk memilih titik knot optimal adalah dengan meminimumkan nilai GCV2
1 ( ) ( ) ( ( )) MSE K GCV K N tr I H K • Model yang terbaik yang dapat b k ti k t k j ht di
menggambarkan tingkat kesejahteraan di
Indonesia adalah model spline truncated kubik 1 titik knot dengan Nilai GCV : 193.70690 dan nilai MSE sebesar: 172.61988
• Titik knot pada respon persentase pendudukp p p p miskin yaitu 11.13 untuk variabel TPT dan 0.51 untuk variabel laju pertumbuhan PDRB, titik knot pada respon IPM yaitu 5.13 untuk
DAFTAR PUSTAKA
• Badan Pusat Statistik (2010), Booklet Agustus 2010, BPS, Jakarta.
BPS, Jakarta.
• Badan Pusat Statistik (2010), Data Strategis BPS , BPS, Jakarta.
• Badan Pusat Statistik (2008), Indeks Pembangunan
Manusia 2006‐2007, Badan Pusat Statistik, Jakarta.
• Badan Pusat Statistik (2005), Analisis dan
P hit Ti k t K i ki 2005 BPS J k t
Penghitungan Tingkat Kemiskinan 2005, BPS, Jakarta.
• Badan Pusat Statistik, Bappenas dan UNDP (2004), “The Economics of Democracy: Financing of Human Development in Indonesia”, Indonesia Human
Development Report (IHDR), Badan Pusat Statistik,
Jakarta.
• Budiantara, I N. (2009). “Spline Dalam Regresi Nonparametrik Dan
Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang” Pidato Pengukuhan Untuk Jabatan Guru Besar Dalam Mendatang , Pidato Pengukuhan Untuk Jabatan Guru Besar Dalam
Bidang Ilmu Matematika Statistika dan Probabilitas, Pada Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, ITS
Press, Surabaya.
• Budiantara, I. N. (2006a), “Regresi Nonparametrik Dalam Statistika”,
Makalah Pembicara Utama pada Seminar Nasional Matematika, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Makasar (UNM), Makasar.
• Budiantara I N Suryadi F Otok B dan Guritno S (2006)
• Budiantara, I. N., Suryadi, F., Otok, B. dan Guritno, S. (2006),
“Pemodelan B‐Spline dan MARS pada Nilai Ujian Masuk Terhadap IPK Mahasiswa Jurusan Disain Komunikasi UK Petra, Surabaya”,
Jurnal Teknik Industri, 8, 1‐13.
• Budiantara, I. N. (2005), “Model Keluarga Spline Polinomial
Truncated Dalam Regresi Semiparametrik”, Makalah Seminar
Nasional Matematika, Jurusan Matematika Universitas Diponegoro, Semarang.
• Budiantara, I. N., (2001a),” Regresi Nonparametrik dan Semiparametrik Serta Perkembangannya”, Makalah
Pembicara Utama pada Seminar Nasional Alumni Pembicara Utama pada Seminar Nasional Alumni Pasca Sarjana Matematika Universitas Gadjah Mada, Yogyakarta.
• Budiantara, I. N., (2001b), “Estimasi Parametrik dan Nonparametrik untuk Pendekatan Kurva Regresi”,
Makalah Pembicara Utama pada Seminar Nasional Statistika V, Jurusan Statistika, Fakultas Matematika
d Il P h Al I i T k l i S l h
dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS), Surabaya.
• Budiantara, I. N. (2000a), “Metode U, GML, CV dan GCV Dalam Regresi Nonparametrik Spline”, Majalah
Ilmiah Himpunan Matematika Indonesia (MIHMI), 6,
41‐45.
• Budiantara I N (2000b) ” Optimasi dan Proyeksi
• Cox, D. D. and O’Sullivan, F.,(1996), Penalized Type Estimator for Generalized Nonparametric Regression, 1983, Journal of Multivariate Analysis, 56, 185‐206. • Enggle, R.F., Grangger, C.W.J., Rice, J. and Weiss, A., (1986), Semiparametric Estimates of Relation Between Weather and Electric Sales, Journal of the American Statistical Association., 81, 310‐320.Eubank, R.L. (1999), Nonparametric Regression and Spline
Smoothing Second Edition, Marcel Deker, New York. Smoothing Second Edition, Marcel Deker, New York.
• Green, P.J. and Silverman, B.W. 1994, Nonparametric
Regression and Generalized Linear Model, Chapman &
Hall, London.
• He, X. and Shi, 1996, Bivariate Tensor Product B‐Spline in a Partly Linear Model Linear, Journal
of Multivariate Analysis, 58, 162‐181.
• Junaedi (2005), “Dinamika Pola Konsumsi Telur di Indonesia: Suatu Analisis Data Susenas”, Tesis, Institut Pertanian Bogor, Bogor.
• Khattree, R dan Naik, D.N. (1999),Applied Multivariate Statistics with SAS Software,Second Edition, SAS Institute Cary, NC: SAS Institute Inc.
• Koenker, R., Ng., P. and Portnoy, S.,1994, Quantile Smoothing Spline, Biometrika, 81, 673‐680. • Lestari, B., 2008a. Spline estimator of biresponse nonparametric regression model with
unequal variances of errors. J. Penelitian Math., 15: 85‐93.
• Lestari, B., 2008b. Penalized weighted least‐squares estimator for bivariate nonparametric regression model with correlated errors. Proceeding of the National Seminar on Mathematics and Statistics, (MS’08), Airlangga University, Surabaya, pp: 83‐95.
L t i B I N B di t S S d M M h i 2010 S li ti t i
• Lestari, B., I.N. Budiantara, S. Sunaryo and M. Mashuri, 2010a. Spline estimator in homoscedastic Multiresponse nonparametric regression model. Proceeding of the Indo MS International Conference on Mathematics and Its Application, Oct. 12‐13, Yogyakarta, Indonesia, pp: 845‐854.
• Oehlert, G.W.,1992, Relaxed Boundary Smoothing Spline, The Annals of Statistics, 20, 1146‐1160. • Rencher, A, C. (2002), Methods of Multivariate Analysis.Second Edition, John Wiley & Sons, Inc.New
York.
• Sunaryo, Sony., dan Purwahyuningsih, W. (2010), “Pendekatan Regresi Semiparametrik Spline (Pada data nilai Ujian Nasional siswa SMKN 1 Nguling Pasuruan”), Surabaya, Seminar Nasional
j Pascasarjana X.
• Soo,Yuh‐Wen dan Bates, D. M. (1996), “Multirespon Spline Regression”, Computational Statistics &
Data Analysis. 22, Elsevier Science B.V.p 619‐631.
• Speckman, P., 1988, Kernel Smoothing in Partial Linear Model, Journal of the Royal Statistical
Sociaty, Seies B, 50, 413‐436.
• Sugiarto, Eddy (2007), “Teori Kesejahteraan Sosial dan Pegukurannya”, Jurnal Eksekutif, Vol. 4, No. 2 p. 263‐269.
• Todaro, MP., dan Stephen C. Smith. (2003), Pembangunan Ekonomi di Dunia Ketiga. Jilid I. Edisi Kedelapan. Erlangga, Jakarta.
• Wahba.G. (1990). Spline Models For Observational Data. University Of Winsconsin at Madison. • Wang, Y. (1998), “Spline Smoothing Models With Correlated Errors”, Journal of the American S i i l i i 93 3 3 8 Statistical Association., 93, 341‐348. • Tripena, A. and Budiantara, I N., (2006), Fourier Estimator in Nonparametric Regression, International Conference On Natural Sciences and Applied Natural Scienes, Ahmad Dahlan University, Yogyakarta