( )
(
)
1 2 1 1 1 arg min [β E w Xτ( ) q Y Xτ( | ) V ], β τ = − β (26) dan juga( )
(
)
1 2 1 1 1 arg minβ E w X[ τ( ) Q Y Xτ( | ) V ], β τ = − β (27)yang dapat menyatakan bahwa β τ1
( )
merupakan koefisien regresi kuantil parsial dari regresi kuadrat terkecil terboboti bagi
( | )
Q Y Xτ di X1.
Sedangkan rumusan bias peubah yang dihilangkan pada regresi kuantil dapat diduga dengan peubah yang bersifat menjelaskan yaitu X =
[
X1'
,X2' '
]
. Pada model regresi kuantil ini yang digunakan hanyalah peubah1
X sehingga vektor koefisien regresinya
1
1( ) arg minγ E
[
τ(
Y
X1' '
1)]
γ τ = ρ
−
γ .(28)
Jika panjang vektor koefisien regresinya
1 2 1( )', 2( )' argmin , 1 1 2 2
(
β τ β τ)
'
=
β β E[ (
ρτ Y X−'
β −X'
β)].
maka: 1 2 1( ) arg minγ E w[
τ(X). τ(
X, 1)]
γ τ = Δ γ . (29) Tetapi apabila E w X X X[
τ( ). 1 1'
)
mempunyai invers maka: 1 1( ) 1( )( [
E w X X Xτ( ). 1 1'
)
E w X X R X[
τ( ). 1 τ( )]
γ τ =β τ + − (30) dengan: 1 1 ( ) ( | )( )
Rτ X =Q Y Xτ −X'
βτ
=
bias 1 0 1 ( )(
.(
, ( ) |)
)
/ 2 w X f u X X du τ τ =∫
∈ Δτ γ τ 1 1 1 , ( | )(
X)
X'
Q Y X τ γ γ τ Δ = − = error(Bukti: lihat Lampiran 8).
Dengan Rτ(X) merupakan bagian dari fungsi kuantil bersyarat yang tidak dijelaskan oleh
fungsi linear dari X1 pada panjang regresi
kuantil.
IV CONTOH KASUS
Contoh kasus dalam masalah regresi kuantil menggunakan sebaran gaji yang diperoleh dari himpunan data mikro sensus di Amerika Serikat pada laki-laki yang berumur 40-49 tahun pada sensus tahun 1980, 1990 dan tahun 2000. Dari penelitian yang dilakukan oleh Ruggles (2004), semuanya
diperoleh dari website Integrated Public Use
Microdata Series (IPUMS).
Peubah respon
( )
Y yang digunakanadalah log gaji mingguan yang dihitung dari log gaji tahunan yang dilaporkan dari lamanya kerja dibagi dengan minggu yang dikerjakan pada tahun sebelumnya. Sedangkan peubah prediktor yang digunakan adalah pendidikan
( )
X1 yang dihitung dari lamanya sekolahdalam satuan tahun, pengalaman kerja
( )
X2yang didefinisikan sebagai fungsi kuadratik dan penghargaan yaitu dihitung dari banyaknya penghargaan yang diperoleh berdasar pada banyaknya perlombaan yang diikuti
( )
X3 .4.1 Analisis Regresi Kuantil dengan
Seluruh Peubah Prediktor
Dari penelitian Ruggles tersebut diperoleh suatu koefisien nilai dugaan dari seluruh peubah prediktor yang ditunjukkan pada Tabel 1. Pada Tabel 1 juga terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah prediktor yang semakin beragam dari tahun sebelumnya. Tabel tersebut juga menjelaskan terjadinya perbedaan nilai dugaan pada koefisien kuantil yang berbeda, sehingga metode regresi kuantil dapat digunakan pada kasus sebaran gaji ini. Karena apabila kasus sebaran gaji ini diduga menggunakan metode kuadrat terkecil akan mengakibatkan ketidakcocokan model.
Untuk melihat besarnya keragaman koefisien pendidikan, pengalaman kerja dan banyaknya penghargaan yang diperoleh dapat dilihat pada Tabel 2. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log
gaji mingguan (log-earning) pada rata-rata
jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan, pengalaman kerja dan penghargaan.
Nilai jarak antar kuantil ini meningkat dari 1.19 menjadi 1.35 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya gaji dari tahun 1980 sampai tahun 2000. Pada jarak antar kuantil ini, nilai dugaan regresi kuantil hampir mendekati tingkat kebenaran tetapi hampiran ini menjadi tidak baik digunakan pada saat rataan koefisien pendidikan dihitung pada kelompok yang khusus seperti terlihat pada Tabel 2 bagian B dan C. Tabel 2 juga menjelaskan
peningkatan yang lebih tinggi untuk lulusan
perguruan tinggi (College Graduates)
daripada lulusan sekolah menengah (High
School Graduates).
Pada Tabel 2 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dijelaskan bahwa gaji lebih dominan berada dibawah median.
Tabel 1 Koefisien nilai dugaan regresi kuantil dari seluruh peubah prediktor
Census Obs. Desc. Stat. Penduga Regresi Kuantil Penduga OLS
Mean SD 0.1 0.5 0.9 Coeff. Root MSE
1980 65,023 6.40 0.67 7.48 6.39 7.42 6.98 0.63 (0.223) (0.067) (0.100) (0.080) [0.239] [0.067] [0.110] [0.087] 1990 86,785 6.49 0.69 10.04 8.93 11.59 9.78 0.64 (0.130) (0.075) (0.169) (0.082) [0.135] [0.075] [0.178] [0.087] 2000 97,397 6.50 0.75 9.80 11.05 15.51 11.71 0.69 (0.201) (0.109) (0.624) (0.092) [0.208] [0.109] [0.669] [0.113]
Tabel 2 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dengan seluruh peubah prediktor. Census Obs. jarak antar kuantil 90‐10 90‐50 50‐10 CQ QR CQ QR CQ QR A. Overall 1980 65,023 1.2 1.19 0.52 0.51 0.68 0.67 1990 86,785 1.35 1.35 0.60 0.61 0.75 0.74 2000 97,397 1.43 1.45 0.67 0.70 0.76 0.75 B. High School Graduates 1980 25,020 1.09 1.17 0.44 0.50 0.65 0.67 1990 22,837 1.26 1.31 0.52 0.55 0.74 0.76 2000 25,963 1.29 1.32 0.59 0.60 0.70 0.72 C. College Graduates 1980 7,158 1.26 1.19 0.61 0.54 0.65 0.64 1990 15,517 1.44 1.38 0.70 0.66 0.74 0.72 2000 19,388 1.55 1.57 0.75 0.80 0.80 0.78
Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 1. Gambar tersebut
menunjukkan bahwa pada selang kepercayaan 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan.
Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan, pengalaman kerja dan penghargaan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman seluruh peubah prediktor pada tahun tersebut.
Gambar 1 Plot Sebaran log-earning pada
sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan seluruh peubah prediktor.
4.2 Analisis Regresi Kuantil dengan Peubah Pendidikan
Dari penelitian ini juga diperoleh koefisien nilai dugaan dari peubah pendidikan, yang ditunjukkan oleh Tabel 3. Dari Tabel 3 terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah pendidikan yang semakin beragam dari tahun sebelumnya.
Untuk melihat besarnya keragaman koefisien pendidikan dapat dilihat pada Tabel 4. Bagian kolom QR menjelaskan dugaan
regresi kuantil dari log gaji mingguan
(log-earning) pada rata-rata jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan. Nilai jarak antar kuantil ini meningkat dari 1.2 menjadi 1.37 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya koefisien pendidikan dari tahun 1980 sampai tahun 2000.
Pada Tabel 4 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dikatakan bahwa gaji lebih dominan untuk kuantil dibawah median.
Tabel 3 Koefisien nilai dugaan dari peubah pendidikan
Census Obs. Desc. Stat. Penduga Regresi Kuantil Penduga OLS
Mean SD 0.1 0.5 0.9 Coeff. Root MSE
1980 65,023 6.40 0.67 7.35 6.83 7.91 7.20 0.63 (0.190) (0.099) (0.145) (0.120) [0.199] [0.099] [0.153] [0.127] 1990 86,785 6.49 0.69 11.15 10.62 13.69 11.36 0.64 (0.274) (0.104) (0.252) (0.117) [0.285] [0.104] [0.263] [0.122] 2000 97,397 6.50 0.75 9.16 11.13 15.73 11.71 0.69 (0.195) (0.126) (0.385) (0.117) [0.204] [0.126] [0.401] [0.141]
Tabel 4 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dari peubah pendidikan Census Obs. jarak antar kuantil 90‐10 90‐50 50‐10 CQ QR CQ QR CQ QR A. Overall 1980 65,023 1.2 1.2 0.51 0.52 0.69 0.68 1990 86,785 1.37 1.36 0.61 0.61 0.76 0.75 2000 97,397 1.45 1.45 0.69 0.69 0.77 0.76 B. High School Graduates 1980 25,020 1.1 1.2 0.42 0.51 0.67 0.69 1990 22,837 1.27 1.33 0.51 0.56 0.76 0.77 2000 25,963 1.32 1.34 0.6 0.61 0.72 0.73 C. College Graduates 1980 7,158 1.25 1.19 0.58 0.55 0.67 0.64 1990 15,517 1.49 1.4 0.69 0.67 0.77 0.73 2000 19,388 1.57 1.57 0.75 0.78 0.82 0.78
Gambar 2 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan peubah pendidikan.
Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 2. Gambar tersebut menunjukkan bahwa pada selang kepercayaan bersama 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan. Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan
pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman koefisien pendidikan pada tahun tersebut.
Dari Gambar 2 juga dapat dijelaskan bahwa pada tahun 1980, 1990 maupun 2000 memberikan kesimpulan bahwa semakin tinggi peubah pendidikan, maka tingkat pendapatan atau gaji akan cenderung lebih besar (tinggi) pada tingkatan kuantil yang lebih tinggi pula. Hal ini dapat mengindikasikan bahwa terjadinya perbedaan gaji yang sangat signifikan berdasarkan tingkat pendidikan seseorang.
Pada analisis regresi kuantil yang hanya menggunakan peubah pendidikan juga dihasilkan plot antara nilai pembobot dengan nilai kepekatan terbobotinya, seperti terlihat pada Gambar 3, 4 dan 5.
Pada Gambar 3 terlihat plot antara peubah
pendidikan dengan nilai pembobot (weights)
yang menunjukkan nilai kepekatan bersyarat
terboboti (density weights) dengan nilai
pembobot (importance weights). Pada plot
tersebut terlihat bahwa nilai kepekatan
bersyarat terboboti (density weights) dengan
nilai pembobot (importance weights) relatif
tidak jauh berbeda, yang menandakan bahwa nilai error regresi kuantilnya relatif kecil. Hal
ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi kelas pendidikannya tidak terlalu berbeda jauh sehingga besar gaji yang diperoleh juga tidak berbeda jauh.
Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada
0.10
τ = pada sensus tahun 2000.
Pada Gambar 4 terlihat plot antara peubah
pendidikan dengan nilai pembobot (weights)
yang menunjukkan nilai kepekatan bersyarat
terboboti (density weights) dengan nilai
pembobot (importance weights). Pada plot
tersebut nilai kepekatan bersyarat terboboti
(density weights) dengan nilai pembobot
(importance weights) terlihat serupa tetapi tidak identik, yang menandakan bahwa nilai error regresi kuantilnya sangat kecil. Hal ini dikarenakan peubah pendidikan yang tingkat variansi pengelompokan data berdasarkan kelas pendidikannya hampir serupa sehingga besar gaji yang diperoleh juga hampir serupa.
Gambar 4 Plot antara peubah pendidikan dengan nilai pembobot pada
0.50
τ = pada sensus tahun 2000.
Pada Gambar 5 terlihat plot antara peubah
pendidikan dengan nilai pembobot (weights)
yang menunjukkan nilai kepekatan bersyarat
terboboti (density weights) dengan nilai
pembobot (importance weights). Pada plot
tersebut nilai kepekatan bersyarat terboboti
(density weights) dengan nilai pembobot
(importance weights) terlihat sedikit berbeda tetapi plot ini mempunyai nilai error regresi kuantil yang kecil karena perbedaan plotnya tidak terlalu jauh. Hal ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi data dari kelas pendidikannya sedikit berbeda sehingga besar data gajinya juga agak berbeda, akibatnya error yang diperoleh juga sedikit lebih besar dari error data berdasarkan pengelompokkan yang lain.
Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada
0.90
τ = pada sensus tahun 2000.
4.3 Perbandingan antara menggunakan seluruh peubah prediktor dengan menggunakan peubah pendidikan
Dari dua analisis yang dilakukan, pada analisis data menggunakan seluruh peubah prediktor, diperoleh nilai dugaan dan nilai jarak antar kuantil yang tidak jauh berbeda dengan analisis data menggunakan peubah pendidikan saja, hal ini ditunjukkan pada Tabel 1 dan 3, sehingga dapat disimpulkan bahwa peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam memprediksi nilai peubah respon. Karena peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh maka peubah tersebut dapat dihilangkan.