• Tidak ada hasil yang ditemukan

ANALISIS REGRESI MENGGUNAKAN METODE KUANTIL ROHMATUL FITRIAH

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS REGRESI MENGGUNAKAN METODE KUANTIL ROHMATUL FITRIAH"

Copied!
33
0
0

Teks penuh

(1)

ANALISIS REGRESI

MENGGUNAKAN METODE KUANTIL

ROHMATUL FITRIAH

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2009

(2)

ABSTRACT

ROHMATUL FITRIAH. Regression Analysis Uses Quantile Method. Supervised by RETNO BUDIARTI and I GUSTI PUTU PURNABA.

Regression analysis is applied to analyze relation between response variable with one or more predictor variable, especially to construct a model that has not been known. In order to estimate the regression parameters, certain estimation method of regression coefficients are carried out. In this paper quantile regression method is applied to asymmetric data. This method divides data into two or more groups, where existence of different estimated values at different quantiles are suspected. In this regression analysis, the regression coefficients are estimated using quantiles regression approximation properties, i.e. weighted least square approximation with all predictor variables included and the suites approximation with partial regression decomposition for certain predictor variables. Quantile regression approximation property explains that the quantile regression coefficient vector can minimize the expected value of weighted mean square error, which will give the best fit. The quantile regression with suites approximation is used to omit predictor variables which do not have influence to the model. The approximation properties of quantile regression are illustrated with the salary data from the U.S. census at 1980, 1990, and 2000.

(3)

ABSTRAK

ROHMATUL FITRIAH. Analisis Regresi Menggunakan Metode Kuantil. Dibimbing oleh RETNO BUDIARTI dan I GUSTI PUTU PURNABA.

Analisis regresi digunakan untuk menelaah hubungan antara peubah respon dengan satu atau lebih peubah prediktor, terutama untuk menelusuri model yang belum diketahui. Dalam rangka untuk menduga model regresi, dilakukan pendugaan koefisien regresi. Untuk menduga koefisien regresi pada data yang berbentuk tidak simetris menggunakan metode regresi kuantil. Pendekatan metode ini dengan membagi data menjadi dua atau lebih kelompok, dimana dicurigai adanya perbedaan nilai dugaan pada kuantil-kuantil tertentu. Untuk mengetahui nilai dugaan koefisien regresi pada analisis regresi ini menggunakan sifat hampiran bagi regresi kuantil yang terdiri dari dua sifat yaitu hampiran kuadrat terkecil terboboti dengan seluruh peubah prediktor dan hampiran yang bersesuaian dengan penguraian regresi parsial. Sifat hampiran regresi kuantil menyatakan bahwa vektor parameter regresinya dapat meminimumkan nilai harapan dari kuadrat tengah error terboboti yang membuat penduga parameter regresi kuantil memperoleh garis hampiran terbaik. Untuk menghilangkan peubah prediktor yang tidak terlalu berpengaruh dalam menduga model menggunakan sifat hampiran regresi kuantil yang sesuai dengan pengembangan dari penguraian regresi parsial. Sifat hampiran bagi regresi kuantil ini diilustrasikan dengan data gaji pada sensus U.S. tahun 1980, 1990 dan 2000.

(4)

ANALISIS REGRESI

MENGGUNAKAN METODE KUANTIL

ROHMATUL FITRIAH

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Sains pada

Departemen Matematika

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2009

(5)

Judul Skripsi : Analisis Regresi Menggunakan Metode Kuantil

Nama

:

Rohmatul

Fitriah

NIM

:

G54053067

Disetujui

Komisi Pembimbing

Ir. Retno Budiarti, MS

Pembimbing I

Dr. Ir. I Gusti Putu Purnaba, DEA.

Pembimbing II

Diketahui

Dr. drh. Hasim, DEA.

Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam

(6)

PRAKATA

Puji Syukur penulis panjatkan kepada Allah SWT atas segala karunianya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul Analisis Regresi Menggunakan Metode Kuantil. Shalawat dan salam semoga senantiasa tercurah kepada Rasulullah Muhammad SAW beserta keluarga, sahabat dan pengikutnya hingga akhir zaman.

Keterbatasan dan ketidaksempurnaan membuat penulis membutuhkan bantuan , dukungan dan semangat dari orang-orang secara langsung maupun tidak langsung berkontribusi besar dalam pembuatan tugas akhir ini. Oleh karena itu penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada :

1. Ibu Retno Budiarti selaku Pembimbing I, yang sabar telah membimbing dan mengarahkan selama penulisan karya ilmiah ini, Bapak I Gusti Putu Purnaba selaku Pembimbing II atas bimbingan dan saran yang telah diberikan, dan Bapak I Wayan Mangku sebagai penguji serta saran dan masukkan yang telah diberikan.

2. Ibuku tercinta, terima kasih atas semua dukungan baik moral maupun materiil, doa, semangat dan kasih sayang yang tiada henti. Mas Oden, terima kasih atas semangat, doa dan pengorbanan moral maupun materiil selama ini. Adik-adikku (Opek dan Alit), atas doa dan semangatnya. Mbak Ida beserta keluarga, terima kasih atas doa dan dukungannya. Seluruh keluarga besarku yang sangat aku sayangi, terima kasih untuk seluruh doanya.

3. Om To, yang telah memberikan bantuan, semangat dan doanya.

4. Ibu Teduh Wulandari, yang telah memberikan bantuan, nasehat dan semangat. 5. Seluruh dosen Departemen Matematika IPB, atas ilmu yang telah diberikan.

6. Bu Susi, Pak Yono, dan Bu Ade, atas saran-saran dan informasi yang telah diberikan. 7. Lela, kamu sahabat terbaik yang pernah ada dan selalu menemani saat senang dan susah. 8. Puput dan Pipit sahabatku yang selalu memberikan doa dan semangat.

9. Siti, Tia, dan Lina, kalian teman terbaik yang selalu memberikan yang terbaik untukku. 10. Rima, Siti dan Yuni atas kesediaannya menjadi pembahas pada saat seminar.

11. Keluarga besar Matematika ’42 : Lela, Tia, Lina, Eko, Dimas, Iput, Dewi, Dian, Budhe, Awi, Zil, Oby, Warno, Lisda, Rima, Siti, Ety, Yuni, Yusep, Nyoman, Mega, Idha, Niken, Bima, Ilyas, Vera, Gita, Octa, Hikmah, Hap-hap, Ocoy, Nola, Mira, Agnes, Ricken, Vita, Luri, Ryu, Rita, Dendi, Danu, Ridwan, Rendi, Ardy, Djawa, Eyyi, Jane, Vino, Heri, Ayu, Achy, Hesti, Fachri, Bayu, Septian, mas Ayeep, Erlin, Boy, Yudi, Sapto, Nofi, Wiwi, Acuy, terima kasih atas persahabatan, kebersamaan, dan keceriaan yang telah kita lewati bersama selama perkuliahan. Kalian adalah sebaik-baiknya teman yang menjadikan masa-masa kebersamaan kita penuh warna. Semoga kebersamaan kita ini akan abadi.

12. Kak Fred, kak Abay, kak Ari, mbak Uli, dan mbak Jaja, mbak Yuda atas semua saran, informasi, bantuan, doa dan semangat yang telah diberikan.

13. Kak Rusan yang, yang telah membantu dalam menyelesaikan pembuatan abstrak.

14. Anak-anak “Fauziah Atas Crew” (Kak Ira, Lalis, Dewi, Selly, Ine, dan Tuty), yang telah memberikan bantuan, saran, semangat dan doa.

15. Seluruh mahasiswa Matematika, kakak kelas dan adik kelas yang telah membantu dan memberikan semangatnya.

16. Serta kepada semua pihak yang telah banyak membantu selama proses penyelesaian tugas akhir ini. Mohon maaf karena keterbatasan penulis tidak dapat menyebutkan satu per satu. Penulis menyadari masih ada kekurangan dalam tugas akhir ini. Oleh karena itu, kritik dan saran dari berbagai pihak akan sangat membantu menyempurnakan tulisan ini. Akhir kata, kami berharap semoga tugas ini dapat memberikan manfaat bagi kita semua

Bogor, Agustus 2009

(7)

RIWAYAT HIDUP

Penulis dilahirkan di Pekalongan pada tanggal 17 Mei 1988 sebagai anak ketiga dari lima bersaudara. Ayah bernama Slamet Mukhlas (alm) dan ibu bernama Joharanah.

Penulis menyelesaikan pendidikan Sekolah Dasar pada tahun 1999 di SD Negeri Kauman Wiradesa Kab. Pekalongan, Sekolah Lanjutan Tingkat Pertama Negeri I Wiradesa Kab. Pekalongan tahun 2002, Sekolah Menengah Atas Negeri I Wiradesa Kab. Pekalongan tahun 2005 dan diterima sebagai mahasiswa Institut Pertanian Bogor melalui jalur USMI pada tahun yang sama. Masuk Departemen Matematika Fakultas Matematika dan IPA Institut Pertanian Bogor tahun 2006.

Selama mengikuti perkuliahan, penulis pernah menjadi pengajar privat mahasiswa Tingkat Persiapan Bersama dan menjadi pengajar SD, SMP serta SMA di bimbingan belajar sampai sekarang. Penulis juga aktif dalam kepengurusan organisasi antara lain: staf Departemen Kewirausahaan Gugus Mahasiswa Matematika (GUMATIKA) pada tahun 2006, kegiatan dalam Ikatan Mahasiswa Pekalongan pada tahun 2005/2007, anggota rohis matematika’42. Penulis juga aktif dalam kegiatan kepanitiaan, antara lain: kepanitiaan kegiatan Matematika Ria (MR) 2007 sebagai anggota Sie. Konsumsi, kepanitiaan kegiatan Masa Perkenalan Departemen (Welcome Ceremony of Mathematic) Matematika tahun 2007 sebagai Sie. Keamanan Acara, kepanitiaan kegiatan Masa Perkenalan Fakultas (G-Force’43) Matematika dan IPA tahun 2007 sebagai Sie. Medis.

(8)

DAFTAR ISI

Halaman Daftar Gambar ... ix Daftar Tabel ... ix Daftar Lampiran ... ix I PENDAHULUAN ... 1 1.1. Latar Belakang ... 1 1.2. Tujuan ... 1 1.3. Sistematika Penulisan ... 1 II LANDASAN TEORI ... 2 2.1 Analisis Regresi ... 2

2.2 Ordinary Least Square (Metode Kuadrat Terkecil) ... 2

2.3 Quantiles (Kuantil) ... 2

2.4 Peubah Acak ... 3

2.5 Fungsi Distribusi/Fungsi Sebaran ... 3

2.6 Fungsi Sebaran Bersyarat ... 3

2.7 Koragam (Covarian) ... 4 2.8 Loss Function ... 4 2.9 Norma ... 4 2.10 Weighting Function ... 4 2.11 Proyeksi Orthogonal ... 4 III PEMBAHASAN ... 5

3.1 Sifat Hampiran Regresi Kuantil ... 5

Teorema 1 ... 6

3.2 Regresi Kuantil Parsial dan Bias Peubah yang dihilangkan ... 9

Teorema 2 ... 6

IV CONTOH KASUS ... 11

4.1 Analisis Regresi Kuantil dengan seluruh peubah prediktor ... 11

4.2 Analisis Regresi Kuantil dengan peubah pendidikan ... 13

4.3 Perbandingan antara Analisis Menggunakan Seluruh Peubah Prediktor dengan Menggunakan peubah pendidikan ... 13

V SIMPULAN ... 15

DAFTAR PUSTAKA ... 15

LAMPIRAN ... 16

(9)

DAFTAR TABEL

         Halaman

Tabel 1 Koefisien Nilai Dugaan Regresi Kuantil dari Seluruh Peubah Prediktor ... 11

Tabel 2 Perbandingan Jarak Antar Kuantil dari CQF dengan Sebaran QR Dasar dengan Seluruh Peubah Prediktor ... 11

Tabel 3 Koefisien Nilai Dugaan Regresi Kuantil dari Peubah Pendidikan ... 12

Tabel 4 Perbandingan Jarak Antar Kuantil dari CQF dengan Sebaran QR Dasar dengan Peubah Pendidikan ... 13

DAFTAR GAMBAR

         Halaman Gambar 1 Plot Sebaran log-earning pada Sebaran Kuantil Tertentu dengan Tingkat Kepercayaan 95% dengan Seluruh Peubah Prediktor ... 12

Gambar 2 Plot Sebaran log-earning pada Sebaran Kuantil Tertentu dengan Tingkat Kepercayaan 95% dengan Seluruh Peubah Prediktor ... 13

Gambar 3 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ=0.10 pada Sensus Tahun 2000 ... 12

Gambar 4 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ=0.50 pada Sensus Tahun 2000 ... 12

Gambar 5 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ=0.90 pada Sensus Tahun 2000 ... 12

DAFTAR LAMPIRAN

      Halaman Lampiran 1 Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1980... 16

Lampiran 2 Keterngan Data Koefisien Pendidikan pada Sensus Tahun 1990 dan 2000 ... 17

Lampiran 3 Grafik Importance dan Density Weights pada Sensus Tahun 1980 ... 18

Lampiran 4 Grafik Importance dan Density Weights pada Sensus Tahun 1990 ... 19

Lampiran 5 Pembuktian Kuantil (Quantiles) ... 20

Lampiran 6 Pembuktian Loss Function Asimetrik ... 21

Lampiran 7 Pembuktian Proyeksi Orthogonal ... 22

Lampiran 8 Pembuktian Persamaan (30) ... 23

(10)

I PENDAHULUAN

1.1 Latar Belakang

Analisis regresi digunakan untuk menelaah hubungan antara peubah respon ( )y dengan satu atau lebih peubah prediktor terutama untuk menelusuri pola hubungan yang modelnya belum diketahui. Dalam rangka untuk menduga model regresi, dilakukan pendugaan koefisien regresi. Ada beberapa metode untuk menduga koefisien regresi, salah satu yang paling sering digunakan adalah metode kuadrat terkecil (OLS).

Dalam OLS disyaratkan untuk memenuhi asumsi-asumsi yang ada. Namun metode ini dikenal peka terhadap penyimpangan asumsi pada data, misalnya jika data tidak memenuhi salah satu asumsi regresi maka penduga OLS tidak lagi baik digunakan. Salah satu asumsi terpenting adalah asumsi sebaran normal (normalitas).

Asumsi normalitas seringkali dilanggar pada saat data mengandung pencilan (outlier). Jika terdapat pencilan dalam data, maka bentuk sebaran data tidak lagi simetrik sehingga melanggar asumsi normalitas. Terkadang untuk mengatasi hal ini seorang peneliti melakukan transformasi tehadap data dengan maksud agar asumsi dapat terpenuhi, namun seringkali transformasi yang dilakukan terhadap data juga tidak dapat memenuhi asumsi pada akhirnya menyebabkan dugaan berbias. Akibatnya metode kuadrat terkecil dianggap kurang tepat untuk menganalisis sejumlah data yang tidak simetris, maka berkembanglah metode regresi median (Median Regression).

Metode regresi median dilakukan dengan pendekatan Least Absolute Deviation (LAD) yang dikembangkan dengan mengganti pendekatan rataan (mean) pada OLS menjadi median. Hal ini dilakukan dengan mempertimbangkan apabila data berbentuk lonceng tidak simetris. Tetapi pada kenyataannya, pendekatan regresi median juga dianggap kurang tepat karena regresi ini

hanya melihat pada dua kelompok data. Padahal ada kemungkinan data bisa terbagi menjadi lebih dari dua kelompok, sehingga dikembangkanlah metode regresi kuantil (Quantile Regression).

Metode regresi kuantil adalah suatu metode yang berasal dari metode regresi median (Median Regression) yang diperumum. Regresi kuantil merupakan suatu metode statistika yang pada umumnya digunakan untuk menyelesaikan permasalahan yang terdapat dalam kasus ekonometrika. Regresi ini berguna untuk menganalisis sejumlah data yang bentuknya lonceng tak simetris.

Pendekatan metode regresi kuantil dengan memisahkan atau membagi data menjadi dua atau lebih kelompok (group). Dimana dicurigai adanya perbedaan nilai dugaan pada kuantil-kuantil tertentu.

1.2 Tujuan

Tujuan dari karya ilmiah ini adalah untuk mempelajari sifat-sifat hampiran bagi regresi kuantil.

1.3 Sistematika Penulisan

Karya ilmiah ini terdiri atas lima bagian. Bagian pertama berupa pendahuluan, terdiri dari latar belakang, tujuan, dan sistematika penulisan. Bagian kedua adalah landasan teori yang menyajikan aspek teoritis penulisan karya ilmiah. Bagian ketiga merupakan pembahasan, yang membahas metode regresi kuantil dan sifat hampiran regresi kuantil. Bagian keempat adalah contoh kasus, yang membahas contoh analisis regresi kuantil dengan seluruh peubah prediktor, analisis regresi kuantil dengan peubah pendidikan saja serta perbandingan kedua analisis tersebut. Sedangkan bagian terakhir adalah kesimpulan, merupakan hasil yang diperoleh dari pembahasan karya ilmiah.

(11)

2

 

II LANDASAN TEORI

Pada bab ini diberikan teori yang menjadi landasan pengerjaan karya ilmiah ini. Berikut diberikan beberapa definisi dan teorema yang berkaitan dengan penulisan karya ilmiah ini.

2.1 Analisis regresi

Analisis regresi adalah analisis statistika yang digunakan untuk melihat hubungan antara peubah respon dengan satu atau beberapa peubah prediktor. Hubungannya dinyatakan dalam model linear atau non-linear. Pemilihan bentuk model berdasarkan pengetahuan sebelumnya atau melalui proses eksplorasi.

Misalkan y menunjukkan peubah tunggal tergantung pada p buah prediktor x , maka

y dapat digambarkan dengan model regresi berikut:

1 2 3

( , , , ..., p)

y= f x x x x +ε (1) dengan daerah asal (domain) DRp.

(Aunuddin 1989)

2.2 Ordinary Least Square (Metode Kuadrat Terkecil)

Pada analisis regresi linear

0 1

i i i

Y =β +β X +ε untuk i=1, 2, ...,n dengan Yi merupakan pengamatan

ke− untuk peubah respon dan i Xi merupakan pengamatan ke− untuk peubah i prediktor. Komponen β dan 0 β merupakan 1 parameter yang belum diketahui dan akan diduga dengan metode kuadrat terkecil. Sedangkan ε merupakan komponen galat i yang diasumsikan menyebar normal, bebas terhadap sesamanya dan identik, mempunyai nilai tengah nol dan varian homogen. Penilaian ketepatan model regresi didasarkan pada besarnya R2.

(Aunuddin 1989)

Definisi 2.2.1 (Metode Kuadrat Terkecil)

Metode kuadrat terkecil adalah suatu metode untuk memperoleh persamaan prediksi linear ˆY = +a bX yang memiliki

jumlah kuadrat galat (JKG)

2

( i ˆ )i

JKG =∑ YY terkecil

(Agresti & Finlay 1999)

2.3 Quantiles (Kuantil)

Misalkan X adalah peubah acak yang kontinu dengan fungsi distribusi kumulatif (cdf) F x( ), definisi kuantil ke-p dari X adalah ξp

=

F−1( )p , untuk 0< <p 1.

Misalkan X1

,

X2

,...,

Xn adalah suatu contoh barisan dari sebaran acak X dan

1 2

...

n

Y <Y < <Y adalah statistik tataan dari contoh barisan dari sebaran acak X.

Jika k =[ (p n+1)], daerah di bawah fungsi kepekatan peluang f x( ) dan sebelah kiri dari Yk adalah F Y( k

)

maka nilai harapan untuk daerah ini adalah

( ( k

))

b ( k

)

k( k

)

k a E F Y

=

F y g y

d

y dengan: (

)

k k

g y = fungsi kepekatan peluang dari Yk ! , < < ( 1)!( )! 0 , k n a y b k n k selainnya θ ⎧⎪⎪ ⋅ ⎪⎪ = ⎨ ⎪⎪ ⎪⎪⎩ dan dengan:

[

] [

1

]

( k)k 1 ( k)n k ( k) F y F y f y θ= − − − .

Jika peubah F Y( k

)

ditransformasi menjadi z

maka nilai harapannya menjadi

1 0 ! ( ( )) ( ) (1 ) . ( 1)!( )! k n k k n E F Y E z z z dz k n k − = = − − −

Dengan menggunakan fungsi kepekatan peluang beta, maka persamaan tersebut dapat dinyatakan menjadi ( 1) ! !( )! ( ( )) ( 1)!( )!( 1)! k n n k n k k E F Y k n k n = + − = − − + .

(Bukti: lihat Lampiran 5)

(12)

3

 

2.4 Peubah Acak

Definisi 2.4.1 (Peubah Acak)

Misalkan Ω adalah ruang contoh dari suatu percobaan acak. Fungsi X yang terdefinisi pada Ω yang memetakan setiap unsur ω∈ Ω ke satu dan hanya satu bilangan real X( )ω =x disebut peubah acak.

Ruang dari X adalah himpunan bagian bilangan real A={ :x x= X( ),ω ω∈ Ω}.

(Hogg et al. 2005)

Definisi 2.4.2 (Peubah Acak Diskret)

Peubah acak X dikatakan diskret jika himpunan semua nilai { ,x x1 2, ...} merupakan

himpunan tercacah.

(Grimmett & Stirzaker 1992)

Definisi 2.4.3 (Peubah Acak Kontinu)

Peubah acak X dikatakan kontinu jika fungsi distribusi kumulatifnya FX( )x adalah fungsi kontinu untuk setiap xR.

(Hogg et al. 2005)

2.5 Fungsi Distribusi/Fungsi Sebaran Definisi 2.5.1 (Fungsi Distribusi)

Jika X suatu peubah acak, fungsi distribusinya didefinisikan sebagai

( ) [ ]

X

F x =P Xx

untuk setiap x∈ −∞ +∞( , ).

(Edward & Satya 1995)

Teorema 2.5.2 (Sifat Fungsi Distribusi)

Apabila X suatu peubah acak, maka fungsi distribusinya FX( )x mempunyai sifat berikut:

i. FX( )x tak turun [yaitu FX( )xFX( )y , jika xy] ii. X( ) lim X( ) 0, x F F x →−∞ −∞ = = dan ( ) lim ( ) 1 X X x F F x →+∞ +∞ = =

iii. FX( )x kontinu dari kanan

(Edward & Satya 1995)

2.6 Fungsi Sebaran Bersyarat

Definisi 2.6.1 (Fungsi Sebaran Bersyarat)

Jika Y suatu peubah acak kontinu dengan syarat X = maka fungsi sebaran peluang x bersyaratnya | ( | ) ( | ) Y X F y x =P Yy X =x | ( , ) . y Y X f t x dt −∞ =

Sehingga, | ( | ) | ( , ) Y X Y X d dtF y x = f y x . (Ghahramani 2005)

Definisi 2.6.2 (Fungsi Kepekatan Bersyarat)

Fungsi kepekatan bersyarat dari suatu peubah acak Y dengan syarat X = , dapat x didefinisikan: , | ( , ) ( , ) ( ) Y X Y X X f y x f y x f x = dengan fX( )x >0. (Ghahramani 2005)

Definisi 2.6.3 (Nilai Harapan Bersyarat)

Nilai harapan bersyarat dari suatu peubah acak Y dengan syarat X =x, dapat didefinisikan: | ( | ) Y X( , ) , E Y X x y f y x dy ∞ −∞ = =

dimana fX( )x >0. (Ghahramani, 2005)

Definisi 2.6.4 (Varian Bersyarat)

Nilai varian bersyarat dari suatu peubah acak Y dengan syarat X = x, dapat didefinisikan: 2 | ( | )

(

( | )

)

Y X( , ) , Var Y X x y E Y X x f y x dy ∞ −∞ = =

− =

sehingga simpangan baku bersyaratnya didefinisikan oleh: | ( | ) Y X x Var Y X x

σ

= = = . (Ghahramani 2005) Teorema 2.6.5

Jika (X Y, ) adalah suatu vektor dengan varian dari Y terbatas, maka dapat didefinisikan:

a. E E Y X[ ( | )]=E Y( ) b. Var E Y X[ ( | )]≤Var Y( ).

(13)

4

 

2.7 Koragam (Covarian) Definisi 2.7.1

Jika X dan Y merupakan suatu peubah acak, maka kovarian dari X dan Y adalah

( , ) [( ( ))( ( ))]

Cov X Y =E XE X YE Y .

(Ghahramani 2005)

Teorema 2.7.2

Jika X dan Y adalah suatu peubah acak, dengan μX =E X( ) dan μY =E Y( ) maka:

( , ) [( ( ))( ( ))] Cov X Y =E XE X YE Y ( ) X Y E XY μ μ = − ( ) ( ) ( ) E XY E X E Y = − . (Ghahramani 2005) 2.8 Loss Function

Definisi 2.8.1(Loss Function asimetrik)

Jika

L

p adalah loss function yang tidak simetrik ke-p maka:

[

( 0) (1 ) ( 0)

]

p

L = p I u≥ + −p I u< u

[

p I u( 0)

]

u

= − < . (2) Sehingga diperoleh , jika 0

( 1) , jika 0 p pu u p u u L ⎧⎪⎨ ≥ − < ⎪⎩ = (3) dengan :

u= error dari pendugaan

( )

I u = fungsi indikator yang didefinisikan

1 , jika 0 0 , jika 0 . ( 0) u u I u ⎧⎪⎨ ≥< ⎪⎩ ≥ =

(Bukti: lihat Lampiran 6)

(Koenker 2005)

2.9 Norma

Definisi 2.9.1

Sebuah ruang vektor V dikatakan ruang linear bernorma (normed linear space) jika untuk setiap vektor vV dikaitkan dengan sebuah bilangan real 2

1

v n i

i=v

=

yang

disebut norma dari v yang memenuhi: i. v ≥0 dengan kesamaan berlaku jika dan

hanya jika v=0

ii. αv =α v untuk setiap skalar α

iii. v+wv + w untuk semua , ∈V

v w .

(Leon 2001)

2.10 Weighting Function

Definisi 2.10.1(Weighting function)

Weighting function adalah suatu fungsi kepekatan rata-rata dari variable dependent atau peubah respon yang mendekati fungsi kuantil bersyarat yang sebenarnya.

(Angrist et al. 2006)

2.11 Proyeksi Orthogonal

Definisi 2.11.1 (Basis Orthonormal)

Suatu famili orthonormal di V yang juga menyatakan suatu basis disebut basis orthonormal bagi V . Jika u u1, 2, ...,un adalah suatu basis orthonormal bagi V , maka untuk setiap v di V , dapat dinyatakan sebagai: (i) 1 |

.

n j j j v v u u = =

(ii) 2 2 1 | | | n j j v v u = =

dengan v u| j =v uT j. (Valenza 1993)

Definisi 2.11.2 (Proyeksi Orthogonal)

Jika vV dan uV adalah suatu vektor satuan, maka

( ) |

u

pr v = v u u

disebut sebagai proyeksi orthogonal dari v atas u . Secara umum, jika W adalah subspace dari V dengan basis orthonormal

1, 2, ..., m u u u maka 1 ( ) | m W j j i pr v v u u = =

merupakan proyeksi orthogonal dari v atas

W .

Berdasarkan definisi tersebut maka untuk setiap v di V

(vpr vW( ))⊥uk (k=1, 2,..., )m

sehingga vpr vW( ) adalah orthogonal atas setiap vektor di W .

(Bukti: lihat Lampiran 7)

(14)

5

 

III PEMBAHASAN

Metode regresi kuantil merupakan salah satu metode regresi yang diperoleh dari metode regresi median yang diperumum, dimana metode regresi ini sering digunakan untuk permasalahan yang terdapat dalam kasus ekonometrika. Penggunaan metode regresi ini dengan pembagian atau pemisahan data menjadi dua atau lebih kelompok yang mana dicurigai mempunyai perbedaan nilai dugaan pada kuantil-kuantil tertentu. Regresi kuantil dapat digunakan untuk mengatasi keterbatasan regresi linear dalam menganalisis sejumlah data yang berbentuk lonceng tidak simetris.

Regresi kuantil adalah suatu metode pendugaan yang digunakan sebagai pencocokan seluruh model-model kecil sebaran bersyarat. Menurut Roger Koenker masalah regresi dapat digunakan untuk memecahkan masalah dalam rataan contoh:

(

)

2 1 min n i R i y μ∈

= −μ . (4)

Jika μ

=

X'

β maka persamaan (4) menjadi:

(

)

2 1 min p n i i R i y

X '

β∈

= − β (5) dengan: i

X

= peubah prediktor kei β = parameter i y = peubah respon kei.

Basset dan Koenker (1978), dalam papernya membahas masalah regresi tersebut, yang kemudian berkembang menjadi median contoh yang dinyatakan:

1 min p n i i R i y

X '

β∈

= − β . (6)

Kemudian secara umum dispesifikasikan dalam fungsi kuantil bersyarat ke− dengan τ mempertimbangkan penduga bagi β τ

( )

( )

)

ˆ

(β τ sehingga diperoleh ide bahwa masalah tersebut dapat dinyatakan:

(

)

1 min ( | ) p n i R i y Q Y X τ τ β∈

= ρ − (7) dengan: τ = indeks kuantil ∈(0,1)

(.)

τ

ρ = loss function yang asimetrik

( | )

Q Y Xτ =

X'

β τ = fungsi kuantil ke τ( ) − dari Y dengan syarat X.

(Koenker 2005) Hal pertama yang harus diperhatikan dalam regresi kuantil adalah fungsi kuantil bersyarat (Conditional Density Function/ CQF). Jika Y merupakan sebaran peubah acak kontinu dan x adalah salah satu vektor regresor X , maka CQF dalam fungsi kuantil

ke− dapat didefinisikan τ ( | ) inf{ : Y( | ) } Q Y Xτ = y F y X ≥τ dengan: ( | ) Y

F y X = fungsi sebaran dari Y dengan syarat X dan fungsi kepekatan bersyaratnya fY( |y X). Berdasarkan asumsi integrabilitas, CQF dapat diperoleh dari masalah minimisasi

( )

( | ) arg min [ ( ( ))].

q X

Q Y XτE ρτ Yq X

(8) Regresi kuantil dapat terpenuhi dengan mengganti suatu model linear q X( ) pada persamaan (8) sehingga diperoleh masalah minimisasi: ( ) arg min [ ( )]. d R E τ Y X' β β τ ρ β ∈ = − (9) Apabila dalam hampiran OLS dari suatu model linear terhadap Y diperoleh dengan meminimumkan nilai harapan kuadrat error, sedangkan dalam hampiran regresi kuantil dari suatu model linear terhadap Y diperoleh dengan meminimumkan nilai harapan loss

function yang tak simetrik yaitu

meminimumkan nilai harapan ρτ( )u .

3.1. Sifat Hampiran Regresi Kuantil

Hasil teori utama dari prinsip regresi kuantil adalah suatu vektor parameter regresi kuantil yang dapat meminimumkan jumlah kuadrat error terboboti. Jika indeks kuantil

(0,1)

τ∈ , maka error dari regresi kuantil : (X, ) X

'

Q Y X( | )

.

τ β β τ

Δ = −

(10) Misalkan ετ adalah error dari regresi kuantil yaitu penyimpangan peubah respon dari kuantil bersyarat, ditulis

( | ),

Y Q Y X

τ = − τ

(15)

6

 

dengan fungsi kepekatan bersyarat f ( |e X)

τ

ε

pada ετ =e.

Teorema berikut menunjukkan bahwa regresi kuantil merupakan hampiran kuadrat terkecil terboboti dengan seluruh peubah prediktor.

Teorema 1

Asumsi yang digunakan pada teorema ini adalah:

1. Terdapat fungsi kepekatan bersyarat ( | )

Y

f y X .

2. E Y[ ]

,

E Q Y X[ τ( | )], dan E X terbatas 3. β τ solusi unik bagi persamaan (9).

( )

Dari asumsi-asumsi tersebut maka diperoleh persamaan:

( )

arg min [ ( , ). 2( , )], d R E w Xτ τ X β β τ β β ∈ = Δ (12) dengan:

( )

β τ = vektor parameter regresi kuantil

2

( , )X

τ β

Δ = kuadrat error dari regresi kuantil

(

,

)

wτ X β = fungsi pembobot (importance

weights)

(

)

1 0 1 0 (1 ). ( , | ) (1 ). 0, u f u X X d u du τ τ β ψ = − Δ = − ≥ ∫ ∫ ε dan dengan: ( . (1 ). ( | ) | ) Y f u X

'

u Q Y Xτ X ψ = β+ − . Bukti :

Diketahui persamaan (9), persamaan tersebut dapat dikurangi tanpa optimisasi karena tak tergantung pada β dan terbatas pada asumsi (2) maka

( )

arg min

{

E

(

Y X'

)

E

(

Y Q (Y X| )

)

}

. d R β τ ρτ β ρτ τ β = − − − ∈

(13)

Dengan menggunakan error regresi kuantil yang didefinisikan pada persamaan (10) dan (11). Sehingga dituliskan

(

)

(

)

(

)

[

( )

]

' ( | ) ' ( | ) ( | ) E Y X E Y Q Y X E Y Q Y X Q Y X X E τ ρτ β ρτ τ ρτ τ τ β ρτ − − − = − + − −

ε

(

)

(

'

)

[

( )

]

( | ) E ρτ τ X β Q Y Xτ E ρτ τ =

− −

ε

ε

(

( , )

)

[

( )

]

E ρτ τ τ X β E ρτ τ =

ε − Δ

ε

; dengan ρτ

( )

ετ = −

(

τ 1

{

ετ<0

}

)

ε

τ

(

)

{

}

(

)

(

)

(

{

}

)

( )

{

}

(

)

(

)

(

{

}

)

( )

{

}

{

}

[

{

}

]

( )

(

{

}

)

(

{

}

)

1 ( , ) 0 1 0 ( , ) 1 0 ( , ) 1 ( , ) 1 ( , ) ( , ) ( , ) 1 ( , ) 1 0 1 ( , ) ( , ) 1 ( , ) X X X X X X E X E E X E E E E E X X E X τ τ τ τ τ β τ τ τ β τ τ τ τ τ ττ τ τ β τ τ β τ τ τ β τ β τ τ β τ τ τ τ β τ τ τ τ β τ β β τ τ τ τ τ − −Δ < − < <Δ − < ⎡ − Δ + Δ ⎤ ⎣ ⎦ + = − Δ − = − − Δ − = − − < = < Δ − Δ − < Δ

ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε

ε

ε

E

( )

τ τε +E

[

1

{

ετ<0

}

ετ

]

{

}

(

1 ( , )

)

( , )

(

1

{

( , )

}

1

{

0

}

)

E τ τ X β τ τ X β E τ τ X β τ τ =

ε < Δ − Δ

ε < Δ − ε <

ε

. (14) Misalkan

(

X

)

=E

(

1

{

ετ < Δτ

(

X

)

}

−τ

)

Δτ

(

X

)

|X

(

X

)

=E

(

1

{

ετ < Δτ

(

X

)

}

−1

{

ετ <0

}

)

ετ |X

.

Maka

( )

arg min d β β τ ∈ = \ { [E (X, )]β −E[ (X, )]}β

.

(16)

7

 

Sehingga perlu membuktikan:

(

X

)

=E

(

1

{

ετ < Δτ

(

X

)

}

−τ

)

Δτ

(

X

)

|X

(

)

{

}

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

1 0 1 , | , , | 0 | , , | , , E E X X X E F X X F X X E f u X X X du X τ τ τ τ τ τ τ τ τ τ τ β τ β β β β β β < Δ − Δ Δ − Δ = Δ Δ Δ

=

=

ε ε ε ε

(15)

(

)

(

)

1 2 0 , |

.

( , ) E fτ u τ X β X du τ X β =

Δ

Δ

ε

.

(16)

Jika uτ =ετ Δτ

(

X

)

,

untuk nilai Δτ

(

X

)

>0

.

(

X

)

=E

(

1

{

ετ < Δτ

(

X

)

}

−1

{

ετ <0

}

)

ετ |X

[ ]

{

}

(

)

[ ]

{

}

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

1 0 1 0 1 2 0 1 0,1 , | 1 0,1 | , | , , | , , , | . ,

. .

.

.

.

.

u E u u X X E u u X X E uf u X du X E uf u X X X du X E uf u X X du X τ τ τ τ τ τ τ τ τ τ τ τ τ τ τ β β β β β β β β = ∈ Δ = ∈ Δ = Δ = Δ Δ Δ = Δ Δ

ε ε

(

)

(

)

(

)

1 2 0 ,

|

.

,

.

E uf u X X X τ Δτ β Δτ β

= ⎢

ε

(17)

Dari persamaan (16) dan (17) maka

(

'

)

(

)

( | ) E

ρτ YX β

E

ρτ YQ Y Xτ

=

(

X

)

(

X

)

(

)

(

)

(

(

)

)

(

)

(

)

(

)

(

)

1 1 2 2 0 0 1 2 0 2 , | ( , ) (1 ) , | ( , ) , . ( , )

.

,

|

.

,

.

.

E f u X X du X f E u f u X X du X E w X X

E

u

u

X

X

X

τ τ τ τ τ τ τ τ τ τ τ β β β β β β

β

β

= Δ Δ = − Δ Δ = Δ

Δ

Δ

ε ε ε Terbukti.

(17)

8

 

Teorema 1 ini menyatakan bahwa vektor parameter regresi kuantil (β τ ) dapat

( )

meminimumkan nilai harapan dari kuadrat tengah terboboti yaitu kuadrat dari selisih antara fungsi kuantil bersyarat yang sebenarnya dan hampiran garis yang linear dengan fungsi pembobot wτ

(

X,β .

)

Fungsi wτ

(

X,β yang didefinisikan

)

,

sebagai fungsi pembobot (importance weights), merupakan fungsi yang menentukan regresi kuantil yang dapat meminimumkan nilai peubah respon

( )

Y dari peubah prediktor

( )

X yang diberikan. Untuk menentukan bentuk dari importance weights tersebut menggunakan pendugaan berikut:

(

)

1

(

(

)

)

2 , . Y | | ( ) wτ X β = f Qτ Y X X + Šτ X , dengan:

(

)

1 0 (X) (1 u) fτ( .u ( , ) |X X) fτ( |0 X) τ =

− Δτ β − Š ε ε  

( )

(

)

( )

1 0 . ( , ) . ' (1 ). 1 6. | , | . ' . X f X u udu X f X τ τ β β ≤ Δ − = Δ

(18) dan dengan: (X) τ Š = sisaan

(

,

)

wτ X β = fungsi pembobot (importance

weights) ( | )

Y

f y X = fungsi kepekatan bersyarat yang diasumsikan mempunyai turunan pertama pada y yang terbatas pada nilai mutlaknya

( )

'

f X = turunan pertama pada y dari fungsi kepekatan fY( |y X)

Dalam beberapa kasus, fungsi kepekatan yang terboboti (density weights) yaitu

(

)

(

)

1

2.fY Qτ Y |X |X , merupakan faktor

penentu bagi importance weights. Dengan

(

)

(

| |

)

Y

f Qτ Y X X adalah nilai tetap dari X

pada model yang berbanding terbalik dengan simpangan baku bersyaratnya.

3.2. Regresi Kuantil Parsial dan Bias Peubah yang Dihilangkan

Berikut teorema yang menunjukkan sifat hampiran yang khas, sesuai dengan prinsip pengembangan dari penguraian regresi parsial dan penurunan dari rumus bias peubah yang dihilangkan.

Teorema 2

Dalam teorema ini terdapat beberapa asumsi yang digunakan yaitu:

a) Terdapat fungsi kepekatan bersyarat ( | )

Y

f y X yang terbatas

b) E Y[ ]

,

E Q Y X[ τ( | )], dan E X terbatas c) β τ solusi unik bagi persamaan (9).

( )

Dan dari asumsi-asumsi tersebut apabila

( )

( )

β τ =β τ merupakan solusi unik maka diperoleh suatu persamaan

( )

2 arg mind [ ( , ( ))

.

(

,

)

], R E wτ X τ X β β τ β τ β ∈ = Δ (19) dengan:

( )

(

)

(

(

( )

)

)

( ) (

) (

)

(

)

1 0 1 0 1 , . , | 2 1 . 1 . | | 0 2 Y . w X f u X X du f u X' u Q Y X X du τ τ τ τ β τ β τ β τ = Δ = + − ≥

ε Bukti:

Untuk membuktikan β τ

( )

=β τ

( )

menggunakan persamaan (9) dan (19). Dari persamaan (9) diperoleh turunan pertama :

( )β =2.E w

[

τ( , )X β Δτ(X, )β X

]

= . 0 (20) Dari persamaan (19) diperoleh turunan pertama :

(18)

9

 

Sehingga dari persamaan (15) diperoleh:

(X, )β =E E

[ [( {

1ετ < Δτ(X, )β

}

−τ

)

|X X

]

.

]

(

)

(

)

(

)

1 0 1 0 ( , ) | (0 | ) . ( , ) | ( , ) . . ( , ) | ( , ). 2. ( , ). ( , ( )). ( , ). ( , ( )).

(

)

.

.

.

[

]

2 [

] .

E F X X F x X E f u X X X du X E f u X X du X X E w X X X E w X X X τ τ τ τ τ τ τ τ τ τ τ τ τ β β β β β β β τ β β τ = Δ − = Δ Δ = Δ Δ = Δ Δ

=

ε ε ε ε (22)

Dari pembuktian tersebut dapat dikatakan bahwa fungsi ( )β dan ( )β identik, karena ( )

β β τ= memberikan solusi unik bagi ( )β =0, dan juga ( )β =0 maka ( ) ( )

β β τ= =β τ merupakan solusi unik bagi keduanya.

Terbukti.

Pada Teorema 2 ini, regresi kuantil memiliki solusi bagi masalah penduga kuadrat terkecil terboboti yaitu

( )

2 arg min [ ( , ). ( , )], d R E w Xτ τ X β β τ β β ∈ = Δ (23) dengan: ( ) ( , ( ))

wτ X =w Xτ β τ adalah suatu fungsi dari X saja (dalam Teorema 1, fungsi pembobot bergantung pada β ). Teorema ini digunakan apabila nilai peubah prediktor yang tidak terlalu berpengaruh dihilangkan. Seperti halnya pada Teorema 1, nilai weighting function

( , ( )),

wτ X β τ dihubungkan dengan fungsi kepekatan bersyarat dari peubah tak bebas yang didefinisikan ( , ( )) 1 2

. (

Y ( | ) |

)

w Xτ β τ = f Q Y Xτ X + ( ),Š X dengan: (X) τ = Š sisaan yaitu (X) 1 4

.

(

X, ( )

) .

f '( )x τ ≤ Δτ β τ Š . (24)

Apabila nilai Δτ

(

X, ( )β τ

)

dan f

'

( )

X kecil, maka diperoleh

( , ( ))

(

, ( )

)

1 2.Y

(

( | ) |

),

w Xτ β τ ≈w Xτ β τ ≈ f Q Y Xτ X

karena cara memperoleh nilai hampiran bagi weighting function ini dari penurunan sifat hampiran pada Teorema 1.

Regresi kuantil parsial didefinisikan dengan membagi X menjadi X1 dan X2, dengan koefisien QR β τ dibagi dalam

( )

( )

1

β τ dan β τ . Selanjutnya 2

( )

Q Y Xτ( | ) dan X1 diurai menggunakan proyeksi orthogonal terhadap X2, terboboti oleh

( ) ( , ( ))

wτ X =w Xτ β τ yang didefinisikan pada Teorema 2 sehingga dapat didefinisikan menjadi: 2 ( | ) Q ( | ), Q Y Xτ = X

'

π +q Y Xτ (25) dengan: 2 1 2 1 1 [ ( ). . ( | )] 0, , E w X X q Y X X X

'

V τ τ π = = + 2 1 [ ( ). . ] 0, E wτ X X V =

[

] [

1

]

2 2 2 ( ). . ( ). . ( | ) , Q E w X X Xτ ' E w X Xτ Qτ Y X π = −

[

]

1

[

]

1 E wτ(X X X). 2 2

'

E wτ(X X). 2

.

X1

.

π = − ×

Penguraian regresi ini mengakibatkan ( | )

q Y Xτ dan V1 menjadi residual yang dibuat oleh suatu nilai proyeksi yang linear dari Q Y Xτ( | ) dan X1 pada X2 dengan nilai

pembobot wτ(X). Sehingga dengan menggunakan standar kuadrat terkecil diperoleh

(19)

10  

( )

(

)

1 2 1 1 1 arg min [β E w Xτ( ) q Y Xτ( | ) V ], β τ = − β (26) dan juga

( )

(

)

1 2 1 1 1 arg minβ E w X[ τ( ) Q Y Xτ( | ) V ], β τ = − β (27) yang dapat menyatakan bahwa β τ 1

( )

merupakan koefisien regresi kuantil parsial dari regresi kuadrat terkecil terboboti bagi

( | )

Q Y Xτ di X1.

Sedangkan rumusan bias peubah yang dihilangkan pada regresi kuantil dapat diduga dengan peubah yang bersifat menjelaskan yaitu X =

[

X1

'

,X2

' '

]

. Pada model regresi kuantil ini yang digunakan hanyalah peubah

1

X sehingga vektor koefisien regresinya

1

1( ) arg minγ E

[

τ

(

Y

X1

' '

1

)]

γ τ = ρ

γ . 

(28)

 Jika panjang vektor koefisien regresinya

1 2 1( )', 2( )' argmin , 1 1 2 2

(

β τ β τ

)

'

=

β β E

[ (

ρτ Y X

'

β −X

'

β

)].

maka: 1 2 1( ) arg minγ E w

[

τ(X). τ

(

X, 1

)]

γ τ =  Δ γ .   (29) Tetapi apabila E w X X X

[

τ( ). 1 1

'

)

mempunyai invers maka: 1 1( ) 1( )

( [

E w X X Xτ( ). 1 1

'

)

E w X X R X

[

τ( ). 1 τ( )

]

γ τ =β τ +  −        (30) dengan: 1 1 ( ) ( | )

( )

Rτ X =Q Y Xτ −X

'

β

τ

=

bias 1 0 1 ( )

(

.

(

, ( ) |

)

)

/ 2 w X f u X X du τ τ =

∈ Δτ γ τ  1 1 1 , ( | )

(

X

)

X

'

Q Y X τ γ γ τ Δ = − = error

(Bukti: lihat Lampiran 8).

Dengan Rτ(X) merupakan bagian dari fungsi kuantil bersyarat yang tidak dijelaskan oleh fungsi linear dari X1 pada panjang regresi kuantil.

IV CONTOH KASUS

Contoh kasus dalam masalah regresi

kuantil menggunakan sebaran gaji yang diperoleh dari himpunan data mikro sensus di Amerika Serikat pada laki-laki yang berumur 40-49 tahun pada sensus tahun 1980, 1990 dan tahun 2000. Dari penelitian yang dilakukan oleh Ruggles (2004), semuanya diperoleh dari website Integrated Public Use Microdata Series (IPUMS).

Peubah respon

( )

Y yang digunakan adalah log gaji mingguan yang dihitung dari log gaji tahunan yang dilaporkan dari lamanya kerja dibagi dengan minggu yang dikerjakan pada tahun sebelumnya. Sedangkan peubah prediktor yang digunakan adalah pendidikan

( )

X1 yang dihitung dari lamanya sekolah

dalam satuan tahun, pengalaman kerja

( )

X2

yang didefinisikan sebagai fungsi kuadratik dan penghargaan yaitu dihitung dari banyaknya penghargaan yang diperoleh berdasar pada banyaknya perlombaan yang diikuti

( )

X3 .

4.1 Analisis Regresi Kuantil dengan Seluruh Peubah Prediktor

Dari penelitian Ruggles tersebut diperoleh suatu koefisien nilai dugaan dari seluruh peubah prediktor yang ditunjukkan pada Tabel 1. Pada Tabel 1 juga terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah prediktor yang semakin beragam dari tahun sebelumnya. Tabel tersebut juga menjelaskan terjadinya perbedaan nilai dugaan pada koefisien kuantil yang berbeda, sehingga metode regresi kuantil dapat digunakan pada kasus sebaran gaji ini. Karena apabila kasus sebaran gaji ini diduga menggunakan metode kuadrat terkecil akan mengakibatkan ketidakcocokan model.

Untuk melihat besarnya keragaman koefisien pendidikan, pengalaman kerja dan banyaknya penghargaan yang diperoleh dapat dilihat pada Tabel 2. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log gaji mingguan (log-earning) pada rata-rata jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan, pengalaman kerja dan penghargaan.

(20)

11

 

Nilai jarak antar kuantil ini meningkat dari 1.19 menjadi 1.35 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya gaji dari tahun 1980 sampai tahun 2000. Pada jarak antar kuantil ini, nilai dugaan regresi kuantil hampir mendekati tingkat kebenaran tetapi hampiran ini menjadi tidak baik digunakan pada saat rataan koefisien pendidikan dihitung pada kelompok yang khusus seperti terlihat pada Tabel 2 bagian B dan C. Tabel 2 juga menjelaskan

peningkatan yang lebih tinggi untuk lulusan perguruan tinggi (College Graduates) daripada lulusan sekolah menengah (High School Graduates).

Pada Tabel 2 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dijelaskan bahwa gaji lebih dominan berada dibawah median.

Tabel 1 Koefisien nilai dugaan regresi kuantil dari seluruh peubah prediktor Census  Obs.  Desc. Stat.  Penduga Regresi Kuantil  Penduga OLS 

Mean  SD  0.1  0.5  0.9  Coeff.  Root MSE  1980  65,023  6.40  0.67  7.48  6.39  7.42  6.98  0.63  (0.223)  (0.067)  (0.100)  (0.080)    [0.239]  [0.067]  [0.110]  [0.087]  1990  86,785  6.49  0.69  10.04  8.93  11.59  9.78  0.64  (0.130)  (0.075)  (0.169)  (0.082)  [0.135]  [0.075]  [0.178]  [0.087]  2000  97,397  6.50  0.75  9.80  11.05  15.51  11.71  0.69  (0.201)  (0.109)  (0.624)  (0.092)              [0.208]  [0.109]  [0.669]  [0.113] 

Tabel 2 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dengan seluruh peubah prediktor. Census  Obs.  jarak antar kuantil  90‐10  90‐50  50‐10  CQ  QR  CQ  QR  CQ  QR  A. Overall  1980  65,023  1.2  1.19  0.52  0.51  0.68  0.67  1990  86,785  1.35  1.35  0.60  0.61  0.75  0.74  2000  97,397  1.43  1.45  0.67  0.70  0.76  0.75  B. High School Graduates  1980  25,020  1.09  1.17  0.44  0.50  0.65  0.67  1990  22,837  1.26  1.31  0.52  0.55  0.74  0.76  2000  25,963  1.29  1.32  0.59  0.60  0.70  0.72  C. College Graduates  1980  7,158  1.26  1.19  0.61  0.54  0.65  0.64  1990  15,517  1.44  1.38  0.70  0.66  0.74  0.72  2000  19,388  1.55  1.57  0.75  0.80  0.80  0.78 

Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 1. Gambar tersebut

menunjukkan bahwa pada selang kepercayaan 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan.

(21)

12

 

Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan, pengalaman kerja dan penghargaan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman seluruh peubah prediktor pada tahun tersebut.

Gambar 1 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan seluruh peubah prediktor.

4.2 Analisis Regresi Kuantil dengan Peubah Pendidikan

Dari penelitian ini juga diperoleh koefisien nilai dugaan dari peubah pendidikan, yang ditunjukkan oleh Tabel 3. Dari Tabel 3 terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah pendidikan yang semakin beragam dari tahun sebelumnya.

Untuk melihat besarnya keragaman koefisien pendidikan dapat dilihat pada Tabel 4. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log gaji mingguan (log-earning) pada rata-rata jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan. Nilai jarak antar kuantil ini meningkat dari 1.2 menjadi 1.37 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya koefisien pendidikan dari tahun 1980 sampai tahun 2000.

Pada Tabel 4 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dikatakan bahwa gaji lebih dominan untuk kuantil dibawah median.

Tabel 3 Koefisien nilai dugaan dari peubah pendidikan

Census  Obs.  Desc. Stat.  Penduga Regresi Kuantil  Penduga OLS  Mean  SD  0.1  0.5  0.9  Coeff.  Root MSE  1980  65,023  6.40  0.67  7.35  6.83  7.91  7.20  0.63  (0.190)  (0.099)  (0.145)  (0.120)  [0.199]  [0.099]  [0.153]  [0.127]  1990  86,785  6.49  0.69  11.15  10.62  13.69  11.36  0.64  (0.274)  (0.104)  (0.252)  (0.117)  [0.285]  [0.104]  [0.263]  [0.122]  2000  97,397  6.50  0.75  9.16  11.13  15.73  11.71  0.69  (0.195)  (0.126)  (0.385)  (0.117)              [0.204]  [0.126]  [0.401]  [0.141] 

(22)

13

 

Tabel 4 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dari peubah pendidikan Census  Obs.  jarak antar kuantil  90‐10  90‐50  50‐10  CQ  QR  CQ  QR  CQ  QR  A. Overall  1980  65,023  1.2  1.2  0.51  0.52  0.69  0.68  1990  86,785  1.37  1.36  0.61  0.61  0.76  0.75  2000  97,397  1.45  1.45  0.69  0.69  0.77  0.76  B. High School Graduates  1980  25,020  1.1  1.2  0.42  0.51  0.67  0.69  1990  22,837  1.27  1.33  0.51  0.56  0.76  0.77  2000  25,963  1.32  1.34  0.6  0.61  0.72  0.73  C. College Graduates  1980  7,158  1.25  1.19  0.58  0.55  0.67  0.64  1990  15,517  1.49  1.4  0.69  0.67  0.77  0.73  2000  19,388  1.57  1.57  0.75  0.78  0.82  0.78 

Gambar 2 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan peubah pendidikan.

Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 2. Gambar tersebut menunjukkan bahwa pada selang kepercayaan bersama 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan. Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan

pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman koefisien pendidikan pada tahun tersebut.

Dari Gambar 2 juga dapat dijelaskan bahwa pada tahun 1980, 1990 maupun 2000 memberikan kesimpulan bahwa semakin tinggi peubah pendidikan, maka tingkat pendapatan atau gaji akan cenderung lebih besar (tinggi) pada tingkatan kuantil yang lebih tinggi pula. Hal ini dapat mengindikasikan bahwa terjadinya perbedaan gaji yang sangat signifikan berdasarkan tingkat pendidikan seseorang.

Pada analisis regresi kuantil yang hanya menggunakan peubah pendidikan juga dihasilkan plot antara nilai pembobot dengan nilai kepekatan terbobotinya, seperti terlihat pada Gambar 3, 4 dan 5.

Pada Gambar 3 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut terlihat bahwa nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) relatif tidak jauh berbeda, yang menandakan bahwa nilai error regresi kuantilnya relatif kecil. Hal

(23)

14

 

ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi kelas pendidikannya tidak terlalu berbeda jauh sehingga besar gaji yang diperoleh juga tidak berbeda jauh.

Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada

0.10

τ = pada sensus tahun 2000. Pada Gambar 4 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) terlihat serupa tetapi tidak identik, yang menandakan bahwa nilai error regresi kuantilnya sangat kecil. Hal ini dikarenakan peubah pendidikan yang tingkat variansi pengelompokan data berdasarkan kelas pendidikannya hampir serupa sehingga besar gaji yang diperoleh juga hampir serupa.

Gambar 4 Plot antara peubah pendidikan dengan nilai pembobot pada

0.50

τ = pada sensus tahun 2000.

Pada Gambar 5 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) terlihat sedikit berbeda tetapi plot ini mempunyai nilai error regresi kuantil yang kecil karena perbedaan plotnya tidak terlalu jauh. Hal ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi data dari kelas pendidikannya sedikit berbeda sehingga besar data gajinya juga agak berbeda, akibatnya error yang diperoleh juga sedikit lebih besar dari error data berdasarkan pengelompokkan yang lain.

Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada

0.90

τ = pada sensus tahun 2000.

4.3 Perbandingan antara menggunakan seluruh peubah prediktor dengan menggunakan peubah pendidikan

Dari dua analisis yang dilakukan, pada analisis data menggunakan seluruh peubah prediktor, diperoleh nilai dugaan dan nilai jarak antar kuantil yang tidak jauh berbeda dengan analisis data menggunakan peubah pendidikan saja, hal ini ditunjukkan pada Tabel 1 dan 3, sehingga dapat disimpulkan bahwa peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam memprediksi nilai peubah respon. Karena peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh maka peubah tersebut dapat dihilangkan.

(24)

15

 

V SIMPULAN

Berdasarkan penduga parameter regresi

kuantil, diperoleh garis hampiran regresi terbaik.

Sifat hampiran regresi kuantil menyatakan bahwa vektor parameter regresinya dapat meminimumkan nilai harapan dari kuadrat tengah error terboboti.

Sifat hampiran yang sesuai dengan prinsip pengembangan dari penguraian regresi persial dapat digunakan untuk menghilangkan peubah prediktor yang tidak terlalu berpengaruh dalam menduga model. Akibat dari menghilangkan peubah prediktor tersebut diperoleh nilai bias, yaitu:

1 1

( ) ( | )

( )

Rτ X =Q Y XτX

'

β

τ

.

Berdasarkan contoh kasus yang digunakan, dapat disimpulkan bahwa analisis regresi kuantil digunakan untuk memodelkan

gaji pada koefisien pendidikan, pengalaman kerja serta penghargaan pada tahun 1980, 1990, dan 2000. Pada contoh kasus tersebut dilakukan dua analisis, yaitu analisis regresi kuantil menggunakan seluruh peubah prediktor dengan analisis regresi kuantil yang hanya menggunakan peubah pendidikan. Dari dua analisis yang dilakukan, disimpulkan bahwa peubah pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam model akibatnya peubah tersebut dapat dihilangkan. Dari analisis regresi kuantil yang menghilangkan peubah pengalaman kerja dan penghargaan, diperoleh error yang relatif kecil seperti yang digambarkan pada plot antara nilai pembobot dengan nilai kepekatan bersyaratnya.

DAFTAR PUSTAKA

Agresti A, Finlay B. 1999. Metode Statistika

untuk Ilmu-ilmu Sosial. Bambang S, penerjemah. Bogor: Institut Pertanian Bogor. Terjemahan dari: Statistical Methods for the Social Sciences.

Angrist J, Chernozhukov V, & Fernandez-Val I. 2006. Quantile Regression Under

Misspesification With An Application To The U.S. Wage Structure, Jurnal Econometrica , Vol. 74, No. 2. Pp: 539-563.

Aunuddin. 1989. Analisis Data. Pusat Antar

Universitas Ilmu Hayat. Institut Pertanian Bogor. Bogor.

Edward JD, Satya NM. 1995. Statistika Matematika Modern . Sembiring RK, penerjemah. Bandung: Institut Teknik Bandung. Terjemahan dari: Modern Mathematical Statistics.

Ghahramani S. 2005. Fundamental of Probability. Ed. Ke-2. Prentice Hall, Inc. New Jersey.

Grimmett GR, Stirzaker DR. 1992. Probability and Random Processes. Ed. Ke-2. Clarendon Press. Oxford.

Hogg RV, AT Craig, & McKean JW. 2005. Introduction to Mathematical Statistics. Ed. Ke-6. Prentice Hall, Inc. New Jersey. Koenker R. 2005. Quantile Regression.

Cambridge University Press. New York. Leon SJ. 1998. Aljabar Linear dan

Aplikasinya. Ed. Ke-5. Bondan A, penerjemah. Jakarta: Erlangga. Terjemahan dari: Linear Algebra with Aplications.

Valenza RJ. 1993. Linear Aljebra An Introduction to abstract mathematics. Department of Mathematics. Claremont McKenna College. Claremont, CA USA.

(25)

16

 

(26)

17

 

Lampiran 1

Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1980

Tahun pada pendidikan Kelas tertinggi dari sekolah secara lengkap 5 kelas ke-5 dari sekolah dasar

6 kelas ke-6 dari sekolah dasar 7 kelas ke-7 dari sekolah dasar 8 kelas ke-8 dari sekolah dasar 9 kelas ke-9 dari sekolah menengah 10 kelas ke-10 dari sekolah menengah 11 kelas ke-11 dari sekolah menengah 12 kelas ke-12 dari sekolah menengah 13 tahun pertama di perguruan tinggi 14 tahun kedua di perguruan tinggi 15 tahun ketiga di perguruan tinggi 16 tahun keempat di perguruan tinggi 17 tahun kelima di perguruan tinggi 18 tahun keenam di perguruan tinggi 19 tahun ketujuh di perguruan tinggi

20 tahun kedelapan atau lebih di perguruan tinggi

(27)

18

 

Lampiran 2

Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1990 dan 2000

Tahun pada pendidikan Gelar Pendidikan 8 kelas 5,6, 7 atau 8 dari sekolah dasar 9 kelas ke-9 dari sekolah menengah 10 kelas ke-10 dari sekolah menengah

11 kelas ke-11 dari sekolah tinggi, tanpa diploma 12 lulusan sekolah tinggi, diploma atau GED

13 pendidikan dibeberapa perguruan tinggi, tetapi tidak punya gelar 14 lulusan perguruan tinggi pada bagian program tertentu

15 lulusan perguruan tinggi (PT)pada program pendidikan 16 bergelar sarjana muda, tetapi tidak sekolah

17 bergelar sarjana muda, tetapi sekarang masih terdaftar di PT

18 bergelar master

19 bergelar tenaga ahli

20 bergelar doktor

(28)

19

 

Lampiran 3

Grafik Importance and Density Weights pada Sensus Tahun 1980

a. Pada τ =0.10

b. Pada τ =0.50

c. Pada τ =0.90

(29)

20

 

Lampiran 4

Grafik Importance and Density Weights pada Sensus Tahun 1990

a. Pada τ =0.10

b. Pada τ =0.50

c. Pada τ =0.90

Gambar

Tabel 1 Koefisien nilai dugaan regresi kuantil dari seluruh peubah prediktor
Gambar 1 Plot Sebaran log-earning pada  sebaran kuantil tertentu dengan  tingkat kepercayaan 95% dengan  seluruh peubah prediktor
Gambar 2 Plot Sebaran log-earning pada  sebaran kuantil tertentu dengan  tingkat kepercayaan 95% dengan  peubah pendidikan
Gambar 5 Plot antara peubah pendidikan  dengan nilai pembobot pada  τ = 0.10  pada sensus tahun 2000
+3

Referensi

Dokumen terkait

pengetahuan, nilai, sikap, dan keterampilan sosial dan kewarganegaraan peserta didik agar dapat direfleksikan dalam kehidupan masyarakat, bangsa, dan negara Indonesia.. Berkaitan

Menurut saya, mernang per[u diadakan perubahan terhadap Pasal 37 UUD 1945, terutama mengenai tata cara melakukan perubahan terhadap Undang-tindang Dasar. Dimana, Pasal 37 yang

Yakni, sebagai semangat baru untuk membangun nilai-nilai profetik agar tercipta masyarakat madani (Civil Society) yang merupakan bagian dari demokrasi

Frekuensi dan periode pemberian pakan yang berbeda pada penelitian ini tidak berpengaruh nyata terhadap bobot relatif limpa, timus, bursa fabrisius dan hati ayam buras

Dengan memanjatkan puji syukur kepada Allah SWT atas rahmat dan hidayahnya yang diberikan kepada penyusun sehingga skripsi yang berjudul “Pengaruh Elemen-Elemen Ekuitas Merek

Dari penelitian tersebut dapat disimpulkan bahwa terdapat perbedaan praktik menguras tempat penampungan air, praktik menutup tempat penampungan air di dalam rumah, dan

Dengan perpaduan antara pasir, arang sekam dan pupuk kandang GA akan dihasilkan media tanam dengan tektur yang baik dan kandungan unsur hara yang cukup sehingga

Penelitian ini bertujuan untuk mengetahui perbedaan yang signifikan kemampuan berfikir kreatif belajar PKn antara siswa yang dibelajarkan melalui model pembelajaran