commit to user BAB IV
HASIL DAN PEMBAHASAN
4.1 Regresi Robust
Metode kuadrat terkecil (MKT) merupakan salah satu metode yang digunakan untuk mengestimasi parameter model regresi. Metode kuadrat terkecil sangat peka terhadap adanya pencilan. Menurut Sembiring (1995), adanya pencilan dalam data dapat mengakibatkan estimasi koefisien model regresi yang diperoleh tidak tepat.
Penolakan begitu saja suatu pencilan bukanlah prosedur yang bijaksana, karena adakalanya pengamatan pencilan memberikan informasi yang cukup berarti, misalnya karena pencilan timbul dari kombinasi keadaan yang tidak biasa yang mungkin saja sangat penting dan perlu diselidiki lebih lanjut. Oleh karena itu, diperlukan suatu metode estimasi yang bersifat robust (kekar) terhadap pencilan yang dikenal dengan regresi robust. Regresi robust digunakan untuk mengurangi pengaruh pencilan.
4.2 Estimasi-M (Maximum likelihood type)
Menurut Montgomery dan Peck (1992), pada prinsipnya estimasi-M merupakan estimasi yang meminimumkan suatu fungsi dari sisaan
∑ ( ) ∑ ( ∑ ) ( ) Untuk memperoleh skala invariant persamaan (4.1), adalah dengan menyelesaikan persamaan
∑ ( ) ∑ ( ) ∑ ( ∑ ) ( ) dipilih estimasi untuk adalah
̂
| ( )|
Pemilihan konstanta 0,6745 membuat ̂ suatu estimator yang mendekati tak bias dari jika n besar dan sisaan berdistribusi normal (Montgomery dan Peck, 1992).
Berikut dibuktikan jika ̂ , maka ̂ suatu estimator dari . (| | )
12
commit to user (|
|
) (| |
) (
) (
) (
) (
) (
) ( )
Berdasarkan Tabel Distribusi Normal diperoleh nilai ( ) , sehingga diperoleh
Fungsi yang digunakan adalah fungsi objektif Tukey bisquare ( ) { | |
| | .
4.3 Estimasi-S
Estimasi-S pertama kali diperkenalkan oleh Rousseeuw dan Yohai (1984).
Dinamakan estimasi-S karena estimasi ini berdasarkan pada skala, estimasi-S berdasarkan pada skala sisaan dari estimasi-M. Skala estimasi-M didefinisikan sebagai penyelesaian dari
∑ ( ) (4.3) dengan K adalah suatu konstanta yang didefinisikan sebagai ( ( )) yang merupakan nilai ekspektasi dari fungsi objektif jika diasumsikan bahwa u berdistribusi normal standar.
commit to user Persamaan (4.3) dapat ditulis menjadi
∑ ( )
∑ ( ) ( )
( )
∑ ( ) ( )
∑ ( ) (4.4) Didefinisikan pembobot ( )= ( ) maka persamaan (4.4) dapat ditulis dengan
∑
√ ∑ (4.5) dengan estimasi nilai awal untuk adalah
̂ | ( )|.
Estimator skala yang memenuhi persamaan (4.3) dinotasikan dengan ̂.
Estimasi-S mempunyai breakdown point tinggi yaitu 50%. Breakdown point dari estimasi-S dapat ditulis ( ) . Ketika menggunakan fungsi objektif Tukey bisquare, Rousseeuw dan Yohai (1984) menunjukkan bahwa penetapan c =
1,547 memenuhi ( ) , sehingga menghasilkan estimasi-S dengan breakdown point 50%. Berikut dibuktikan jika c = 1,547 memenuhi ( ) .
Untuk u N (0,1), fungsi densitas probabilitas adalah ( ) √ ( )
( ( )) ∫ ( )
( )
∫ ( ) ( )
commit to user ∫ ( )
√ ( )
∫ (
)
√ ( ) ∫
√ ( )
√ ∫ ( ) ( ) ∫ √ ( )
√ ∫ (
)
( ) + 0,798
( ( )).
Berdasarkan Tabel Distribusi Normal diperoleh nilai ( ) ; sehingga diperoleh
√ 0,189+0,798 (1-0,939) = 0,199.
Nilai ( ) sehingga diperoleh nilai ( ) ( )( ( )) .
4.4 Estimasi-MM
Estimasi-MM merupakan metode estimasi regresi robust yang diperkenalkan oleh Yohai (1987). Prosedur estimasi-MM diawali dengan mengestimasi parameter model regresi menggunakan estimasi-S dan dilanjutkan dengan mengestimasi parameter model regresi dengan estimasi-M.
Estimasi-MM terdiri dari dua fungsi obyektif, yaitu dan yang menentukan breakdown point dan efisiensi. Fungsi obyektif menggunakan konstanta dengan nilai 1,547 supaya diperoleh breakdown point mendekati 50% dan menggunakan konstanta dengan nilai 4,685 supaya diperoleh efisiensi 95%
sebagaimana MKT digunakan pada sisaan berdistribusi normal.
Estimasi-MM merupakan penyelesaian dari
∑ ( ∑ ̂ ) (4.6)
commit to user
dengan ∑ adalah sisaan yang diperoleh dari estimasi parameter model regresi dengan estimasi-S dan ̂ merupakan penyelesaian dari
∑ ( ∑ ̃
̂ )
.
4.5 Penyelesaian untuk ̂ Persamaan (4.6) dapat ditulis dalam bentuk
∑ ( ∑ ̂ ) (4.7) dengan ( ) ( ).
Didefinisikan fungsi pembobot
( )
( ∑
̂ )
∑
̂
(4.8) dan misalkan ( ) maka persamaan (4.7) dapat ditulis dengan
∑ ( ∑ ) (4.9) Estimasi parameter model regresi dilakukan dengan estimasi kuadrat terkecil dengan pembobot iteratif. Prosedur estimasi ini membutuhkan proses iteratif yang mana akan berubah pada tiap iterasinya. Prosedur tersebut dinamakan Iteratively Reweighted Least Squares (IRLS). Estimasi awal ̃( ) diperoleh dari regresi robust dengan menggunakan estimasi-S, untuk bobot awal ( ) ( ( )) maka persamaan (4.9) dapat ditulis
∑ ( ) ( ∑ ̃( ))
∑ ( ) ( ∑ ̃( )) ∑ ( ) (∑ ( )∑ ̃( ))
∑ ( )∑ ̃( ) ∑ ( ) (4.10) Dalam notasi matriks, persamaan (4.10) dapat ditulis menjadi
( ) ̃ ( ) (4.11) dengan ( ) adalah matriks diagonal dari “bobot” dengan elemen-elemen diagonal ( ) ( ) ( ). Persamaan (4.11) dikenal sebagai persamaan
commit to user
Weighted Least Squares (WLS). Dengan demikian, estimator satu langkahnya adalah
̂( ) ( ( ) ) ( ( ) )
Pada langkah selanjutnya, dihitung kembali bobot dari ( ) tetapi menggunakan ̂( ) sebagai pengganti ̂( ). Pada umumnya, untuk bobot yang diberikan dapat menyelesaikan
̂ ( ( ) ) ( ( ) )
dan dilakukan iterasi sampai mencapai konvergen. Adapun pembobot ( ) adalah
( ) { ( ) | | | | .
4.6 Studi Kasus
Data yang digunakan dalam studi kasus ini adalah data produksi kedelai di Indonesia tahun 2010 yang diperoleh dari Kementerian Pertanian. Data tersebut meliputi produksi kedelai sebagai variabel dependen sedangkan luas panen dan produksi benih kedelai sebagai variabel independen terdapat pada Lampiran 1.
4.6.1 Metode Kuadrat Terkecil
Model regresi linear ganda dengan metode kuadrat terkecil untuk produksi kedelai di Indonesia tahun 2010 adalah
̂ = - 650 + 1,23 + 6,79 dengan
̂ : produksi kedelai (ton)
: luas panen kedelai (ha)
: produksi benih kedelai (ton)
Selanjutnya akan dilakukan uji asumsi klasik untuk melihat apakah model yang diperoleh memenuhi asumsi atau tidak.
commit to user 4.6.2 Uji Asumsi Regresi 1. Uji Asumsi Normalitas
Uji normalitas digunakan untuk mengetahui apakah sisaan berdistribusi normal atau tidak. Plot kenormalan untuk sisaan dari model produksi kedelai di Indonesia tahun 2010 disajikan pada Gambar 4.1.
30000 20000
10000 0
-10000 -20000
99
95 90
80 70 60 50 40 30 20 10 5
1
sisaan
Persen
Mean 5,208278E-12
StDev 6842
N 32
KS 0,315
P-Value <0,010
Plot probabilitas dari sisaan Normal
Gambar 4.1 Plot probabilitas dari sisaan
Berdasarkan Gambar 4.1 terlihat bahwa pola penyebaran sisaan tidak mengikuti garis lurus, ini berarti asumsi kenormalan pada sisaan tidak dipenuhi. Untuk menguji kenormalan dapat juga digunakan uji Kolmogorov-Smirnov.
i. sisaan berdistribusi normal sisaan tidak berdistribusi normal ii. Pilih
iii. Daerah kritis: ditolak jika p-value <
iv. Statistik uji
Berdasarkan hasil output pada Gambar 4.1 diperoleh p-value < 0,01 v. Kesimpulan
Karena p-value < 0,01 < maka ditolak, artinya sisaan tidak berdistribusi normal.
commit to user
Dengan demikian asumsi normalitas pada kasus produksi kedelai di Indonesia tahun 2010 tidak dipenuhi.
2. Uji Asumsi Non Multikolinearitas
Pengujian multikolinearitas bertujuan untuk mengetahui ada tidaknya hubungan linear antara variabel independen. Untuk mendeteksi adanya mutikolinearitas dapat dilakukan dengan melihat nilai VIF.
Tabel 4.1. Hasil output uji multikolinearitas Variabel independen VIF Keterangan
( luas panen) 7,797 <10 tidak terdapat multikolinearitas (produksi benih) 7,797 <10 tidak terdapat multikolinearitas Berdasarkan Tabel 4.1 dapat dilihat bahwa nilai VIF untuk variabel independen luas panen (X1) dan produksi benih (X2) adalah lebih kecil dari 10, sehingga dapat disimpulkan bahwa asumsi non multikolinearitas dipenuhi.
3. Uji Asumsi Non Heterokedastisitas
Hasil pengujian dengan pengujian rank korelasi dari Spearman mendapatkan hasil bahwa nilai luas panen adalah sebesar 3,7853 dan produksi benih adalah sebesar 4,8236. Dengan menggunakan tabel t, nilai dengan dan derajat bebas n-2 adalah 1,697. Dari hasil tersebut dapat disimpulkan bahwa asumsi non heteroskedastisitas tidak dipenuhi (Lampiran 3).
4. Uji Asumsi Non Autokorelasi
Autokorelasi diartikan sebagai korelasi antara anggota serangkaian observasi yang diurutkan menurut waktu. Uji non autokorelasi dapat dideteksi dengan rumus Durbin Watson.
Uji Dubin Watson (Uji DW)
i. artinya tidak ada autokorelasi artinya ada autokorelasi ii. Pilih
commit to user iii. Daerah kritis
Pada k=2 dan n=32 serta diperoleh nilai dan sehingga ( ) dan ( )
Gambar 4.2 Uji Durbin Watson iv. Statistik uji
Dari perhitungan diperoleh nilai = 1,9525 v. Kesimpulan
Karena nilai = 1,9525 berada pada posisi =1,57 < = 1,9525
< maka H0 tidak ditolak artinya asumsi non autokorelasi dipenuhi.
Berdasarkan pengujian asumsi klasik pada data produksi kedelai di Indonesia tahun 2010 diperoleh bahwa asumsi normalitas dan asumsi non heteroskedastisitas tidak dipenuhi kemungkinan disebabkan adanya data pencilan.
4.6.2 Pendekteksian Pencilan
Pendeteksian pencilan dilakukan dengan menggunakan nilai DFFITS dan Cook’s distance. Hasil pengujian untuk identifikasi pencilan dapat dilihat pada Tabel 4.2.
Tabel 4.2 Hasil uji DFFITS dan Cook’s distance
Pengamatan |DFFITS| √ Cook’s distance 4/n
2 0,9231
0,6124
0,2712
0,125
11 0,6703 0,1412
13 3,0270 1,1815
15 2,7177 2,3360
17 2,6487 1,5155
1,31 2,43 2,69
Ho ditolak tidak dapat
disimpulkan tidak dapat
disimpulkan Ho ditolak
Ho diterima
commit to user
Tabel 4.2 menunjukkan bahwa pengamatan 2, 11, 13, 15, dan 17 merupakan pencilan karena nilai |DFFITS| dan Cook’s distance data tersebut lebih besar dari √ = 0,61237 dan 4/n = 0,125.
Karena data mengandung pencilan, maka penggunaan MKT akan memberikan hasil yang kurang tepat, sehingga diperlukan metode regresi yang robust terhadap pencilan yaitu estimasi-MM.
4.6.3 Model Regresi Robust dengan Estimasi-MM
Prosedur estimasi-MM diawali dengan mengestimasi parameter model regresi dengan estimasi-S dilanjutkan dengan mengestimasi parameter model regresi dengan estimasi-M. Proses penghitungan estimasi-S dimulai dengan menentukan estimasi awal koefisien model regresi yang diperoleh dari MKT yaitu ̂ = - 650 + 1,23 + 6,79 , kemudian dihitung nilai sisaan ̂, nilai ̂ | ( )|, dan nilai pembobot ( ). Proses iterasi menggunakan metode WLS dilanjutkan dengan menghitung sisaan yang baru.
Pada iterasi selanjutnya dihitung nilai ̂ √ ∑ dengan = ( )=
( )
dan dihitung nilai pembobot ( ) yang baru. Proses iterasi menggunakan metode WLS dilanjutkan dengan menghitung sisaan yang baru dan dilakukan estimasi parameter secara berulang-ulang sampai diperoleh nilai ̃ yang konvergen.
Berdasarkan Tabel 4.3 terlihat bahwa koefisien model regresi sudah konvergen sehingga iterasi berhenti dan diperoleh model regresi robust dengan estimasi-S yaitu ̂ = 23 + 1,13 + 1,13 .
Setelah diperoleh model regresi robust dengan estimasi-S, kemudian dilakukan estimasi parameter model regresi dengan estimasi-M. Nilai yang diperoleh dari estimasi-S digunakan untuk menghitung nilai ( ). Proses iterasi menggunakan metode WLS dilanjutkan dengan menghitung sisaan yang baru dan dilakukan estimasi parameter secara berulang-ulang sampai diperoleh nilai ̂ yang konvergen.
commit to user
Tabel 4.3. Nilai ̃ tiap iterasi pada estimasi-S dengan tiga koefisien
iterasi ̃ ̃ ̃
1 -44 1,15 2,27
2 73,9 1,13 1,21
3 75,9 1,13 1,05
4 67,1 1,13 1,06
5 58,3 1,13 1,08
6 51,4 1,13 1,09
7 46,5 1,13 1,10
8 42,5 1,13 1,10
9 39,1 1,13 1,11
10 36,1 1,13 1,11
11 33,6 1,13 1,12
12 31,5 1,13 1,12
13 29,8 1,13 1,12
14 28,4 1,13 1,12
15 27,3 1,13 1,12
16 26,4 1,13 1,12
17 25,7 1,13 1,13
18 25,1 1,13 1,13
19 24,6 1,13 1,13
20 24,3 1,13 1,13
21 24 1,13 1,13
22 23,7 1,13 1,13
23 23,5 1,13 1,13
24 23,4 1,13 1,13
25 23,2 1,13 1,13
26 23,1 1,13 1,13
27 23 1,13 1,13
28 23 1,13 1,13
Tabel 4.4. Nilai ̂tiap iterasi pada estimasi-MM dengan tiga koefisien
iterasi ̂ ̂ ̂
1 135 1,13 0,488
2 151 1,13 0,396
3 153 1,13 0,392
4 153 1,13 0,392
Berdasarkan Tabel 4.4 terlihat bahwa koefisien model regresi sudah konvergen sehingga iterasi berhenti dan diperoleh model regresi robust dengan estimasi-MM yaitu ̂ .
commit to user
Untuk mengetahui variabel independen yang berpengaruh dilakukan uji signifikansi model regresi robust dengan estimasi-MM.
(i)
(luas panen dan produksi benih tidak berpengaruh secara signifikan terhadap produksi kedelai di Indonesia tahun 2010)
untuk suatu
(paling tidak ada salah satu dari luas panen atau produksi benih berpengaruh secara signifikan terhadap produksi kedelai di Indonesia tahun 2010)
(ii) Pilih
(iii) Daerah kritis: ditolak jika p-value < α = 0.05 (iv) Statistik uji
Berdasarkan perhitungan diperoleh hasil bahwa nilai p-value=0,000 (v) Kesimpulan
Karenap-value = 0,000 < 0,05 maka H0 ditolak artinya paling tidak ada salah satu dari luas panen atau produksi benih yang berpengaruh secara signifikan terhadap produksi kedelai di Indonesia tahun 2010.
Selanjutnya dilakukan uji parsial untuk mengetahui signifikansi atau pengaruh masing-masing variabel terhadap model regresi yang dihasilkan.
Tabel 4.5 Hasil uji t pada estimasi-MM
Variabel Kesimpulan
luas panen 0,000 signifikan Produksi benih tidak signifikan
Berdasarkan Tabel 4.5 dapat disimpulkan bahwa variabel X1 mempunyai pengaruh yang signifikan, sedangkan variabel X2 tidak berpengaruh signifikan.
Oleh karena itu ditentukan model regresi dengan variabel X1. Model regresi antara Y dengan X1 dengan MKT adalah
̂ = - 440 + 1,39 .
Hasil uji asumsi menunjukkan asumsi normalitas dengan uji Kolmogorov-Smirnov tidak dipenuhi karena p-value = 0,01 < . Uji asumsi non heteroskedastisitas dengan uji korelasi rank Spearman diperoleh nilai tthitung
4,6113lebih besar dari ttabel = 1,697 sehingga asumsi non heteroskedastisitas tidak
commit to user
dipenuhi. Uji asumsi non autokorelasi dengan uji Durbin Watson diperoleh nilai
2,188 berada pada posisi = 1,5 < = 2,188 < = 2,5 maka H0 tidak ditolak artinya asumsi non autokorelasi dipenuhi.
Hasil pendeteksian pencilan menunjukkan bahwa data 13, 15, dan 17 merupakan pencilan karena nilai |DFFITS| dan Cook’s distance data tersebut lebih besar dari √ = 0,5 dan 4/n = 0,125.
Selanjutnya akan dilakukan estimasi model regresi dengan estimasi-MM.
Proses perhitungan dimulai dengan menentukan estimasi awal koefisien model regresi yang diperoleh dengan metode estimasi-S.
Tabel 4.6. Nilai ̃ tiap iterasi pada estimasi-S dengan dua koefisien
iterasi ̃ ̃
1 -234 1,34
2 -103 1,28
3 13 1,22
4 31,7 1,19
5 31,2 1,19
6 27,4 1,18
7 23,2 1,18
8 19,4 1,18
9 16,2 1,18
10 13,6 1,18
11 11,6 1,18
12 10,1 1,18
13 9 1,18
14 8,1 1,18
15 7,5 1,18
16 7 1,18
17 6,6 1,18
18 6,3 1,19
19 6,1 1,19
20 6 1,19
21 5,8 1,19
22 5,7 1,19
23 5,6 1,19
24 5,6 1,19
Berdasarkan Tabel 4.6 terlihat bahwa koefisien model regresi sudah konvergen sehingga iterasi berhenti dan diperoleh model regresi robust dengan estimasi-S yaitu ̂ = 5,6 + 1,19 .
commit to user
Setelah diperoleh model regresi robust dengan estimasi-S, kemudian dilakukan estimasi parameter model regresi dengan estimasi-M hingga diperoleh nilai ̂ yang konvergen.
Tabel 4.7. Nilai ̂tiap iterasi pada estimasi-MM dengan dua koefisien
iterasi ̂ ̂
1 170 1,15
2 202 1,14
3 202 1,14
Berdasarkan Tabel 4.7 terlihat bahwa koefisien model regresi sudah konvergen sehingga iterasi berhenti dan diperoleh model regresi robust dengan estimasi-MM yaitu
̂
dengan R2adjusted = 99,8% menunjukkan bahwa variasi total sebesar 99,8%
diterangkan oleh luas panen ( ), sedangkan sisanya sebesar disebabkan oleh faktor lain atau kesalahan yang bersifat random.