( ) 1 IV CONTOH KASUS. β τ. Jika panjang vektor koefisien regresinya. (26) dan juga 2. maka: (29) Tetapi apabila Ew [

(1)

( )

(

)

1 2 1 1 1 arg min [_β E w Xτ( ) q Y Xτ( | ) V ], β τ = − β (26) dan juga

( )

(

)

1 2 1 1 1 arg minβ E w X[ τ( ) Q Y Xτ( | ) V ], β τ = − β (27)

yang dapat menyatakan bahwa β τ₁

( )

merupakan koefisien regresi kuantil parsial dari regresi kuadrat terkecil terboboti bagi

( | )

Q Y X_τ di X₁.

Sedangkan rumusan bias peubah yang dihilangkan pada regresi kuantil dapat diduga dengan peubah yang bersifat menjelaskan yaitu X =

[

X₁

'

,X₂

' '

]

. Pada model regresi kuantil ini yang digunakan hanyalah peubah

1

X sehingga vektor koefisien regresinya

1

1( ) arg minγ E

[

τ

(

Y

X1

' '

1

)]

γ τ = ρ

−

γ .

(28)

Jika panjang vektor koefisien regresinya

1 2 1( )', 2( )' argmin , 1 1 2 2

(

β τ β τ

)

'

=

_{β β} E

[ (

ρ_τ Y X−

'

β −X

'

β

)].

maka: 1 2 1( ) arg minγ E w

[

τ(X). τ

(

X, 1

)]

γ τ = Δ γ . (29) Tetapi apabila E w X X X

[

_τ( ). ₁ ₁

'

)

mempunyai invers maka: 1 1( ) 1( )

( [

E w X X Xτ( ). 1 1

'

)

E w X X R X

[

τ( ). 1 τ( )

]

γ τ =β τ + − (30) dengan: 1 1 ( ) ( | )

( )

Rτ X =Q Y Xτ −X

'

β

τ

=

bias 1 0 1 ( )

(

.

(

, ( ) |

)

/ 2 w X f u X X du τ τ =

∫

∈ Δτ γ τ 1 1 1 , ( | )

(

X

)

X

'

Q Y X τ γ γ τ Δ = − = error

(Bukti: lihat Lampiran 8).

Dengan R_τ(X) merupakan bagian dari fungsi kuantil bersyarat yang tidak dijelaskan oleh

fungsi linear dari X₁ pada panjang regresi

kuantil.

IV CONTOH KASUS

Contoh kasus dalam masalah regresi kuantil menggunakan sebaran gaji yang diperoleh dari himpunan data mikro sensus di Amerika Serikat pada laki-laki yang berumur 40-49 tahun pada sensus tahun 1980, 1990 dan tahun 2000. Dari penelitian yang dilakukan oleh Ruggles (2004), semuanya

diperoleh dari website Integrated Public Use

Microdata Series (IPUMS).

Peubah respon

( )

Y yang digunakan

adalah log gaji mingguan yang dihitung dari log gaji tahunan yang dilaporkan dari lamanya kerja dibagi dengan minggu yang dikerjakan pada tahun sebelumnya. Sedangkan peubah prediktor yang digunakan adalah pendidikan

( )

X1 yang dihitung dari lamanya sekolah

dalam satuan tahun, pengalaman kerja

( )

X2

yang didefinisikan sebagai fungsi kuadratik dan penghargaan yaitu dihitung dari banyaknya penghargaan yang diperoleh berdasar pada banyaknya perlombaan yang diikuti

( )

X₃ .

4.1 Analisis Regresi Kuantil dengan

Seluruh Peubah Prediktor

Dari penelitian Ruggles tersebut diperoleh suatu koefisien nilai dugaan dari seluruh peubah prediktor yang ditunjukkan pada Tabel 1. Pada Tabel 1 juga terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah prediktor yang semakin beragam dari tahun sebelumnya. Tabel tersebut juga menjelaskan terjadinya perbedaan nilai dugaan pada koefisien kuantil yang berbeda, sehingga metode regresi kuantil dapat digunakan pada kasus sebaran gaji ini. Karena apabila kasus sebaran gaji ini diduga menggunakan metode kuadrat terkecil akan mengakibatkan ketidakcocokan model.

Untuk melihat besarnya keragaman koefisien pendidikan, pengalaman kerja dan banyaknya penghargaan yang diperoleh dapat dilihat pada Tabel 2. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log

gaji mingguan (log-earning) pada rata-rata

jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan, pengalaman kerja dan penghargaan.

(2)

Nilai jarak antar kuantil ini meningkat dari 1.19 menjadi 1.35 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya gaji dari tahun 1980 sampai tahun 2000. Pada jarak antar kuantil ini, nilai dugaan regresi kuantil hampir mendekati tingkat kebenaran tetapi hampiran ini menjadi tidak baik digunakan pada saat rataan koefisien pendidikan dihitung pada kelompok yang khusus seperti terlihat pada Tabel 2 bagian B dan C. Tabel 2 juga menjelaskan

peningkatan yang lebih tinggi untuk lulusan

perguruan tinggi (College Graduates)

daripada lulusan sekolah menengah (High

School Graduates).

Pada Tabel 2 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dijelaskan bahwa gaji lebih dominan berada dibawah median.

Tabel 1 Koefisien nilai dugaan regresi kuantil dari seluruh peubah prediktor

Census Obs. Desc. Stat. Penduga Regresi Kuantil Penduga OLS

Mean SD 0.1 0.5 0.9 Coeff. Root MSE

1980 65,023 6.40 0.67 7.48 6.39 7.42 6.98 0.63 (0.223) (0.067) (0.100) (0.080) [0.239] [0.067] [0.110] [0.087] 1990 86,785 6.49 0.69 10.04 8.93 11.59 9.78 0.64 (0.130) (0.075) (0.169) (0.082) [0.135] [0.075] [0.178] [0.087] 2000 97,397 6.50 0.75 9.80 11.05 15.51 11.71 0.69 (0.201) (0.109) (0.624) (0.092) [0.208] [0.109] [0.669] [0.113]

Tabel 2 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dengan seluruh peubah prediktor. Census Obs. jarak antar kuantil 90‐10 90‐50 50‐10 CQ QR CQ QR CQ QR A. Overall 1980 65,023 1.2 1.19 0.52 0.51 0.68 0.67 1990 86,785 1.35 1.35 0.60 0.61 0.75 0.74 2000 97,397 1.43 1.45 0.67 0.70 0.76 0.75 B. High School Graduates 1980 25,020 1.09 1.17 0.44 0.50 0.65 0.67 1990 22,837 1.26 1.31 0.52 0.55 0.74 0.76 2000 25,963 1.29 1.32 0.59 0.60 0.70 0.72 C. College Graduates 1980 7,158 1.26 1.19 0.61 0.54 0.65 0.64 1990 15,517 1.44 1.38 0.70 0.66 0.74 0.72 2000 19,388 1.55 1.57 0.75 0.80 0.80 0.78

Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 1. Gambar tersebut

menunjukkan bahwa pada selang kepercayaan 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan.

(3)

Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan, pengalaman kerja dan penghargaan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman seluruh peubah prediktor pada tahun tersebut.

Gambar 1 Plot Sebaran log-earning pada

sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan seluruh peubah prediktor.

4.2 Analisis Regresi Kuantil dengan Peubah Pendidikan

Dari penelitian ini juga diperoleh koefisien nilai dugaan dari peubah pendidikan, yang ditunjukkan oleh Tabel 3. Dari Tabel 3 terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah pendidikan yang semakin beragam dari tahun sebelumnya.

Untuk melihat besarnya keragaman koefisien pendidikan dapat dilihat pada Tabel 4. Bagian kolom QR menjelaskan dugaan

regresi kuantil dari log gaji mingguan

(log-earning) pada rata-rata jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan. Nilai jarak antar kuantil ini meningkat dari 1.2 menjadi 1.37 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya koefisien pendidikan dari tahun 1980 sampai tahun 2000.

Pada Tabel 4 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dikatakan bahwa gaji lebih dominan untuk kuantil dibawah median.

Tabel 3 Koefisien nilai dugaan dari peubah pendidikan

Census Obs. Desc. Stat. Penduga Regresi Kuantil Penduga OLS

Mean SD 0.1 0.5 0.9 Coeff. Root MSE

1980 65,023 6.40 0.67 7.35 6.83 7.91 7.20 0.63 (0.190) (0.099) (0.145) (0.120) [0.199] [0.099] [0.153] [0.127] 1990 86,785 6.49 0.69 11.15 10.62 13.69 11.36 0.64 (0.274) (0.104) (0.252) (0.117) [0.285] [0.104] [0.263] [0.122] 2000 97,397 6.50 0.75 9.16 11.13 15.73 11.71 0.69 (0.195) (0.126) (0.385) (0.117) [0.204] [0.126] [0.401] [0.141]

(4)

Tabel 4 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dari peubah pendidikan Census Obs. jarak antar kuantil 90‐10 90‐50 50‐10 CQ QR CQ QR CQ QR A. Overall 1980 65,023 1.2 1.2 0.51 0.52 0.69 0.68 1990 86,785 1.37 1.36 0.61 0.61 0.76 0.75 2000 97,397 1.45 1.45 0.69 0.69 0.77 0.76 B. High School Graduates 1980 25,020 1.1 1.2 0.42 0.51 0.67 0.69 1990 22,837 1.27 1.33 0.51 0.56 0.76 0.77 2000 25,963 1.32 1.34 0.6 0.61 0.72 0.73 C. College Graduates 1980 7,158 1.25 1.19 0.58 0.55 0.67 0.64 1990 15,517 1.49 1.4 0.69 0.67 0.77 0.73 2000 19,388 1.57 1.57 0.75 0.78 0.82 0.78

Gambar 2 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan peubah pendidikan.

Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 2. Gambar tersebut menunjukkan bahwa pada selang kepercayaan bersama 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan. Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan

pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman koefisien pendidikan pada tahun tersebut.

Dari Gambar 2 juga dapat dijelaskan bahwa pada tahun 1980, 1990 maupun 2000 memberikan kesimpulan bahwa semakin tinggi peubah pendidikan, maka tingkat pendapatan atau gaji akan cenderung lebih besar (tinggi) pada tingkatan kuantil yang lebih tinggi pula. Hal ini dapat mengindikasikan bahwa terjadinya perbedaan gaji yang sangat signifikan berdasarkan tingkat pendidikan seseorang.

Pada analisis regresi kuantil yang hanya menggunakan peubah pendidikan juga dihasilkan plot antara nilai pembobot dengan nilai kepekatan terbobotinya, seperti terlihat pada Gambar 3, 4 dan 5.

Pada Gambar 3 terlihat plot antara peubah

pendidikan dengan nilai pembobot (weights)

yang menunjukkan nilai kepekatan bersyarat

terboboti (density weights) dengan nilai

pembobot (importance weights). Pada plot

tersebut terlihat bahwa nilai kepekatan

bersyarat terboboti (density weights) dengan

nilai pembobot (importance weights) relatif

tidak jauh berbeda, yang menandakan bahwa nilai error regresi kuantilnya relatif kecil. Hal

(5)

ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi kelas pendidikannya tidak terlalu berbeda jauh sehingga besar gaji yang diperoleh juga tidak berbeda jauh.

Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada

0.10

τ = pada sensus tahun 2000.

tersebut nilai kepekatan bersyarat terboboti

(density weights) dengan nilai pembobot

(importance weights) terlihat serupa tetapi tidak identik, yang menandakan bahwa nilai error regresi kuantilnya sangat kecil. Hal ini dikarenakan peubah pendidikan yang tingkat variansi pengelompokan data berdasarkan kelas pendidikannya hampir serupa sehingga besar gaji yang diperoleh juga hampir serupa.

0.50

tersebut nilai kepekatan bersyarat terboboti

(density weights) dengan nilai pembobot

(importance weights) terlihat sedikit berbeda tetapi plot ini mempunyai nilai error regresi kuantil yang kecil karena perbedaan plotnya tidak terlalu jauh. Hal ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi data dari kelas pendidikannya sedikit berbeda sehingga besar data gajinya juga agak berbeda, akibatnya error yang diperoleh juga sedikit lebih besar dari error data berdasarkan pengelompokkan yang lain.

0.90

4.3 Perbandingan antara menggunakan seluruh peubah prediktor dengan menggunakan peubah pendidikan

Dari dua analisis yang dilakukan, pada analisis data menggunakan seluruh peubah prediktor, diperoleh nilai dugaan dan nilai jarak antar kuantil yang tidak jauh berbeda dengan analisis data menggunakan peubah pendidikan saja, hal ini ditunjukkan pada Tabel 1 dan 3, sehingga dapat disimpulkan bahwa peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam memprediksi nilai peubah respon. Karena peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh maka peubah tersebut dapat dihilangkan.