ANALISIS REGRESI TERPOTONG DENGAN
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis dengan judul Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol adalah karya saya sendiri dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2008
Nurhafni
ABSTRACT
NURHAFNI. Truncated Regression Analysis with Some Zero Observations. Supervised by SISWADI and N. K. KUTHA ARDANA.
In social research survey, the use of household data is often hindered by the occurrence of zero consumption or zero expenditure in the sample. Such zero observations arise as households participating in the survey typically do not consume certain commodity. The aim of this thesis is to evaluate truncated regression with some zero observations on dependent variable. This implies on the method of estimating the regression parameters. The estimation methods used in this research are Ordinary Least Square (OLS), Weighted Least Square (WLS), and Heckman’s two step method. The data applied in this paper are generated using software SAS 9.1 with 8% proportion of zero observations. The following results are obtained. Based on the bias, variance, and Mean Square Error (MSE) of the estimates as well as the MSE for model validation, OLS and WLS methods have relatively similar results. They tend to be better compared to the Heckman’s two step method. Therefore, for the similar pattern of the data, it is recommended to use OLS since it is a well known and simple method.
RINGKASAN
NURHAFNI. Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol. Dibimbing oleh SISWADI dan N. K. KUTHA ARDANA.
Dalam penelitian survei ekonomi sosial, penggunaan data rumah tangga sering diusik dengan kehadiran zero consumption atau zero expenditure dalam sampel. Nilai amatan noltersebut terjadi karena rumah tangga yang berpartisipasi pada survei tidak mengonsumsi komoditas tertentu, yang disebabkan oleh beberapa faktor yaitu adanya variasi pada preferensi konsumsi/rumah tangga, harga komoditas yang relatif tinggi, kesalahan pada pelaporan dan survei hanya dicatat pada periode tertentu, tidak bertepatan dengan pembelian aktual.
Model regresi merupakan suatu alat untuk menganalisis data survei dan parameter yang diduga dari suatu model regresi tersebut sering memberikan gambaran secara umum. Dari sudut pandang pemodelan statistika, masalah tersebut berimplikasi pada metode pendugaan yang sesuai untuk menduga parameter dari model yang dipakai.
Penelitian sebelumnya membandingkan model regresi biasa, model Tobit dan regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga, dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam penelitian tersebut digunakan metode pendugaan OLS dan MLE dan hasilnya menyatakan bahwa metode OLS lebih baik dari MLE.
Penelitian ini dilakukan untuk mengevaluasi regresi terpotong dengan beberapa nilai amatan nol pada peubah respons pada model, yaitu
. Pendugaan parameter yang digunakan dalam penelitian ini adalah metode kuadrat terkecil (Ordinary Least Square, OLS), metode kuadrat terkecil terboboti (Weighted Least Square, WLS) dan penduga dua tahap Heckman (Heckman’s two step estimator). Selanjutnya adalah untuk mengetahui metode manakah di antara ketiga metode tersebut yang akan menghasilkan penduga yang baik pada proporsi nol yang dicobakan.
Data yang digunakan dalam penelitian ini adalah data bangkitan dari distribusi normal dengan proporsi nilai amatan nol sekitar 8% (16 amatan nol dari 192 amatan contoh), pembangkitan dilakukan dengan software SAS 9.1
Secara umum penduga OLS dan WLS lebih baik dan lebih efisien dari metode dua tahap Heckman. Dari hasil tersebut maka disarankan untuk data yang mempunyai pola yang sama, metode OLS dapat digunakan. Selain memberi sifat-sifat yang baik, metode ini sudah umum dikenal, mudah dipahami, prosedur
©
Hak Cipta milik Institut Pertanian Bogor, tahun 2008
Hak Cipta dilindungi undang-undang
1. Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilimiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Judul Tesis : Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol
Nama : Nurhafni NIM : G551060251
Disetujui,
Komisi Pembimbing
Dr. Ir. Siswadi, M.Sc Ir. N. K. Kutha Ardana, M.Sc Ketua Anggota
Diketahui
Ketua Program Studi Matematika Dekan Sekolah Pasca Sarjana Terapan
Dr. Ir. Endar H. Nugrahani, MS Prof. Dr. Ir. Khairil A. Notodiputro, MS
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema penelitian yang dilaksanakan sejak bulan Juni 2007 ini adalah membandingkan metode pendugaan parameter, dengan judul Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol.
Penulis sangat berterima kasih kepada Bapak Dr. Ir. Siswadi, M.Sc dan Bapak Ir. N. K. Kutha Ardana, M.Sc selaku pembimbing atas saran, bimbingan dan nasehatnya selama penelitian dan penulisan tesis ini. Terima kasih juga disampaikan kepada Ibu Ir. Retno Budiarti, MS sebagai penguji luar komisi yang telah banyak memberikan masukan untuk perbaikan tesis ini selama dalam persidangan tesis. Terima kasih juga disampaikan kepada Departemen Agama Republik Indonesia yang telah memberikan izin dan bantuan beasiswa kepada penulis untuk memperoleh gelar Magister Sains pada Program Studi Matematika Terapan, Sekolah Pascasarjana Institut Pertanian Bogor.
Kepada suamiku Sumarhalin, anakku tersayang Fascha Ahmad, orang tua serta seluruh keluarga, terima kasih atas segala kasih sayang, pengertian dan doanya. Terakhir, ucapan terima kasih penulis sampaikan kepada rekan-rekan atas segala bantuannya dan doanya.
Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2008
ANALISIS REGRESI TERPOTONG DENGAN
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2008
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis dengan judul Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol adalah karya saya sendiri dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2008
Nurhafni
ABSTRACT
NURHAFNI. Truncated Regression Analysis with Some Zero Observations. Supervised by SISWADI and N. K. KUTHA ARDANA.
In social research survey, the use of household data is often hindered by the occurrence of zero consumption or zero expenditure in the sample. Such zero observations arise as households participating in the survey typically do not consume certain commodity. The aim of this thesis is to evaluate truncated regression with some zero observations on dependent variable. This implies on the method of estimating the regression parameters. The estimation methods used in this research are Ordinary Least Square (OLS), Weighted Least Square (WLS), and Heckman’s two step method. The data applied in this paper are generated using software SAS 9.1 with 8% proportion of zero observations. The following results are obtained. Based on the bias, variance, and Mean Square Error (MSE) of the estimates as well as the MSE for model validation, OLS and WLS methods have relatively similar results. They tend to be better compared to the Heckman’s two step method. Therefore, for the similar pattern of the data, it is recommended to use OLS since it is a well known and simple method.
RINGKASAN
NURHAFNI. Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol. Dibimbing oleh SISWADI dan N. K. KUTHA ARDANA.
Dalam penelitian survei ekonomi sosial, penggunaan data rumah tangga sering diusik dengan kehadiran zero consumption atau zero expenditure dalam sampel. Nilai amatan noltersebut terjadi karena rumah tangga yang berpartisipasi pada survei tidak mengonsumsi komoditas tertentu, yang disebabkan oleh beberapa faktor yaitu adanya variasi pada preferensi konsumsi/rumah tangga, harga komoditas yang relatif tinggi, kesalahan pada pelaporan dan survei hanya dicatat pada periode tertentu, tidak bertepatan dengan pembelian aktual.
Model regresi merupakan suatu alat untuk menganalisis data survei dan parameter yang diduga dari suatu model regresi tersebut sering memberikan gambaran secara umum. Dari sudut pandang pemodelan statistika, masalah tersebut berimplikasi pada metode pendugaan yang sesuai untuk menduga parameter dari model yang dipakai.
Penelitian sebelumnya membandingkan model regresi biasa, model Tobit dan regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga, dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam penelitian tersebut digunakan metode pendugaan OLS dan MLE dan hasilnya menyatakan bahwa metode OLS lebih baik dari MLE.
Penelitian ini dilakukan untuk mengevaluasi regresi terpotong dengan beberapa nilai amatan nol pada peubah respons pada model, yaitu
. Pendugaan parameter yang digunakan dalam penelitian ini adalah metode kuadrat terkecil (Ordinary Least Square, OLS), metode kuadrat terkecil terboboti (Weighted Least Square, WLS) dan penduga dua tahap Heckman (Heckman’s two step estimator). Selanjutnya adalah untuk mengetahui metode manakah di antara ketiga metode tersebut yang akan menghasilkan penduga yang baik pada proporsi nol yang dicobakan.
Data yang digunakan dalam penelitian ini adalah data bangkitan dari distribusi normal dengan proporsi nilai amatan nol sekitar 8% (16 amatan nol dari 192 amatan contoh), pembangkitan dilakukan dengan software SAS 9.1
Secara umum penduga OLS dan WLS lebih baik dan lebih efisien dari metode dua tahap Heckman. Dari hasil tersebut maka disarankan untuk data yang mempunyai pola yang sama, metode OLS dapat digunakan. Selain memberi sifat-sifat yang baik, metode ini sudah umum dikenal, mudah dipahami, prosedur
©
Hak Cipta milik Institut Pertanian Bogor, tahun 2008
Hak Cipta dilindungi undang-undang
1. Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilimiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis
ANALISIS REGRESI TERPOTONG DENGAN
BEBERAPA NILAI AMATAN NOL
NURHAFNI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Judul Tesis : Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol
Nama : Nurhafni NIM : G551060251
Disetujui,
Komisi Pembimbing
Dr. Ir. Siswadi, M.Sc Ir. N. K. Kutha Ardana, M.Sc Ketua Anggota
Diketahui
Ketua Program Studi Matematika Dekan Sekolah Pasca Sarjana Terapan
Dr. Ir. Endar H. Nugrahani, MS Prof. Dr. Ir. Khairil A. Notodiputro, MS
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema penelitian yang dilaksanakan sejak bulan Juni 2007 ini adalah membandingkan metode pendugaan parameter, dengan judul Analisis Regresi Terpotong dengan Beberapa Nilai Amatan Nol.
Penulis sangat berterima kasih kepada Bapak Dr. Ir. Siswadi, M.Sc dan Bapak Ir. N. K. Kutha Ardana, M.Sc selaku pembimbing atas saran, bimbingan dan nasehatnya selama penelitian dan penulisan tesis ini. Terima kasih juga disampaikan kepada Ibu Ir. Retno Budiarti, MS sebagai penguji luar komisi yang telah banyak memberikan masukan untuk perbaikan tesis ini selama dalam persidangan tesis. Terima kasih juga disampaikan kepada Departemen Agama Republik Indonesia yang telah memberikan izin dan bantuan beasiswa kepada penulis untuk memperoleh gelar Magister Sains pada Program Studi Matematika Terapan, Sekolah Pascasarjana Institut Pertanian Bogor.
Kepada suamiku Sumarhalin, anakku tersayang Fascha Ahmad, orang tua serta seluruh keluarga, terima kasih atas segala kasih sayang, pengertian dan doanya. Terakhir, ucapan terima kasih penulis sampaikan kepada rekan-rekan atas segala bantuannya dan doanya.
Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2008
RIWAYAT HIDUP
Penulis dilahirkan di Tanjung Pura pada tanggal 28 Agustus 1976 dari ayah Ahmad Mansyuruddin dan ibu Helmi Yus. Penulis merupakan anak pertama dari lima bersaudara.
Tahun 1994 penulis lulus dari SMA Negeri Tanjung Pura Kabupaten Langkat dan pada tahun yang sama lulus seleksi masuk USU Medan. Penulis memilih Jurusan Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam dan selesai pada tahun 1999.
Tahun 1999 penulis bekerja sebagai tenaga honorer di Madrasah Aliyah Negeri 2 Tanjung Pura sampai tahun 2006.
Tahun 2005 penulis masuk PNS di Departemen Agama, bekerja sebagai staf pengajar diperbantukan di Madrasah Tsanawiyah Swasta (MTsS) Jam’iyah Mahmudiyah Tanjung Pura sampai sekarang.
DAFTAR ISI
Halaman
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xii
DAFTAR LAMPIRAN ... xiii
PENDAHULUAN
Latar Belakang ... 1
Tujuan dan Manfaat ... 3
TINJAUAN PUSTAKA
Metode Kuadrat Terkecil Biasa ... 4
Metode Kuadrat Terkecil Terboboti ... 5
Regresi Terpotong ... 8
Regresi Tobit ... 8
Model Probit ... 10
Penduga Dua Tahap Heckman ... 12
Sifat-sifat Penduga yang Baik ... 13
METODE PENELITIAN
Sumber Data ... 16
Tahap Analisis ... 16
HASIL DAN PEMBAHASAN
Hasil Pendugaan Parameter ... 23
Evaluasi Metode Pendugaan ... 27
Validasi Model ... 34
KESIMPULAN DAN SARAN ... 37
DAFTAR PUSTAKA ... 39
DAFTAR TABEL
Halaman
1 Nilai peubah penjelas pada data asal ... 17
2 Nilai bias dugaan dengan metode OLS, WLS dan dua tahap Heckman ... 28
3 Nilai ragam dugaan dengan metode OLS, WLS dan dua tahap Heckman ... 30
DAFTAR GAMBAR
Halaman
1 Flowchart dari tahap analisis penelitian ... 20
2 Diagram kotak nilai dugaan untuk keseluruhan parameter pada tahap
pendugaan parameter ... 24
3 Diagram kotak nilai dugaan untuk tiap-tiap parameter pada tahap
pendugaan parameter ... 24
4 Grafik nilai bias dugaan dari keseluruhan parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 28
5 Grafik nilai bias dugaan dari tiap-tiap parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 29
6 Grafik nilai ragam dugaan dari keseluruhan parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 30
7 Grafik nilai ragam dugaan dari tiap-tiap parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 31
8 Grafik nilai MSE dugaan dari keseluruhan parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 32
9 Grafik nilai MSE dugaan dari tiap-tiap parameter ( )
dengan metode OLS, WLS dan dua tahap Heckman ... 33
10 Diagram kotak nilai MSE untuk validasi model dengan metode OLS, WLS
DAFTAR LAMPIRAN
Halaman
1 Program simulasi data ... 40
2 Program pendugaan parameter ... 42
OLS ... 42
WLS ... 43
Dua tahap Heckman ... 45
3 Hasil pendugaan parameter yang diperoleh dari masing-masing metode
pendugaan parameter ... 48
4 Nilai MSE validasi model dengan metode OLS, WLS dan dua
1
PENDAHULUAN
Latar Belakang
Salah satu metode penelitian sosial ekonomi yang sangat luas
penggunaannya adalah metode penelitian survei. Penelitian survei bertujuan untuk
mendeskripsikan fenomena sosial ekonomi tertentu, mengadakan evaluasi dan
melakukan prediksi mengenai fenomena tersebut.
Salah satu penelitian survei yang rutin dilakukan di Indonesia adalah Survei
Sosial Ekonomi Nasional (Susenas) yang diselenggarakan oleh Biro Pusat
Statistik (BPS). Salah satu peubah sasaran adalah konsumsi/pengeluaran rumah
tangga yang dikumpulkan setiap tiga tahun sekali. Survei ini biasanya dilakukan
untuk mendapatkan informasi mengenai barang dan jasa yang dibeli konsumen
serta berapa besar pengeluarannya. Data yang terkumpul digunakan untuk
mempelajari perilaku konsumen, memonitor tingkat kesejahteraan pada kelompok
masyarakat, dan untuk pengambilan kebijakan pajak maupun politik pemerintah
(BPS, 2003).
Perkembangan ilmu sosial ekonomi menuntut analisis kuantitatif untuk
melihat dan menganalisis hubungan peubah-peubah yang saling terkait. Dimulai
dari hubungan dalam teori ekonomi lalu diformulasikan ke persamaan matematika
dengan membuat model, sehingga dapat diukur. Model regresi merupakan suatu
alat untuk menganalisis data survei dan parameter yang diduga dari suatu model
regresi tersebut sering memberikan gambaran secara umum. Dari sudut pandang
pemodelan statistika, masalah tersebut berimplikasi pada metode pendugaan yang
sesuai untuk menduga parameter dari model yang dipakai.
Permasalahan yang sering dihadapi pada survei konsumsi/pengeluaran
rumah tangga adalah diperolehnya nilai amatan nol. Hal tersebut sering dijumpai
karena adanya rumah tangga yang tidak mengonsumsi komoditas tertentu, dikenal
dengan istilah zero consumption/zero expenditure. Akibatnya akan menyulitkan
penggunaan data rumah tangga karena peubah respons pada fungsi permintaannya
mengandung zero consumption/zero expenditure. Ada beberapa faktor yang
menyebabkan fenomena zero consumption/zero expenditure, di antaranya adalah
2
komoditas yang cukup mahal, 3) kesalahan pada pelaporan 4) survei hanya dicatat
pada periode tertentu, tidak bertepatan dengan pembelian aktual. Bagaimanapun
di antara rumah tangga terdapat variasi yang luas dalam kuantitas atau jumlah
yang dikonsumsi, sehingga kemungkinan ada sejumlah nilai amatan nol.
Kemalawaty (1999) yang menggunakan data Susenas dalam penelitian
mengenai sistem permintaan makanan di daerah Aceh menggabungkan beberapa
rumah tangga sesuai dengan interval besar anggaran pengeluaran untuk mencegah
nilai amatan nol, padahal model yang digunakan menghendaki semua rumah
tangga contoh mengkonsumsi semua komoditas yang dianalisis.
Ada juga sebagian peneliti tidak menganalisis data zero consumption, hal ini
tentu saja mengurangi informasi, ukuran sampel dan tidak mencerminkan keadaan
yang sebenarnya karena berkurangnya rumah tangga contoh.
Virgantari (2005), membandingkan model regresi biasa, model Tobit dan
regresi terpotong (Truncated Regression) pada data konsumsi rumah tangga,
dengan mengikutkan zero consumption dan tanpa zero consumption. Dalam kajian
penerapan metode kuadrat terkecil biasa (Ordinary Least Square, OLS) dan
metode kemungkinan maksimum (Maximum Likelihood, ML), disimpulkan
bahwa berdasarkan nilai Mean Square Error (MSE) serta penyimpangan asumsi,
secara umum dapat dikatakan metode OLS memberikan hasil yang lebih baik
daripada menggunakan metode ML.
Banyak metode pendugaan yang biasa digunakan dalam analisis regresi
atau untuk menduga parameter model yang digunakan. Metode kuadrat terkecil
biasa sangat populer digunakan, karena secara teori metode tersebut mudah dan
cukup baik apabila asumsi klasik dipenuhi. Semakin banyak nilai amatan nol pada
data yang diperoleh akan menyebabkan terjadinya penyimpangan asumsi klasik,
sehingga diperlukan metode pendugaan yang lain, seperti metode kuadrat tekecil
terboboti (Weighted Least Square, WLS) dan metode penduga dua tahap
3
Tujuan dan Manfaat
Tujuan penelitian ini mengevaluasi model regresi terpotong dengan
beberapa nilai amatan nol, dengan metode kuadrat terkecil biasa (OLS), metode
kuadrat terkecil terboboti (WLS) dan penduga dua tahap Heckman (Probit dan
OLS) untuk memperoleh metode pendugaan yang terbaik.
Dari hasil penelitian ini diharapkan dapat diperoleh suatu metode
pendugaan parameter yang terbaik dalam penelitian yang banyak melibatkan nilai
amatan nol seperti pada pola konsumsi/pengeluaran rumah tangga, sehingga
diharapkan pendugaan pola konsumsi dan model fungsi permintaan dapat
memberikan gambaran yang lebih rinci dan tepat tentang perilaku konsumsi
rumah tangga. Informasi yang dihasilkan dapat bermanfaat lebih jauh bagi
4
TINJAUAN PUSTAKA
Pendugaan parameter pada model regresi dapat diselesaikan dengan metode
pendugaan yang berbeda, seperti OLS, WLS, penduga dua tahap Heckman yang
akan digunakan dalam tulisan ini.
Metode Kuadrat Terkecil Biasa (OLS)
Persamaan regresi linear adalah persamaan antara satu peubah respons (Y)
dengan satu atau lebih peubah penjelas (X1, X2, X3, …, Xp). Hubungan antara
peubah-peubah tersebut dapat dirumuskan dalam bentuk persamaan,
(1)
Atau dalam bentuk matriks,
dengan X adalah matriks peubah penjelas berukuran n × k, Y adalah vektor
peubah respons berukuran n × 1, adalah vektor parameter berukuran k × 1,
adalah vektor galat atau sisaan berukuran n × 1 (n adalah banyaknya amatan dan
k = p + 1 adalah banyaknya parameter ). Asumsikan
, .
Pendugaan parameter dalam model regresi linear dilakukan dengan
meminimumkan kuadrat sisaan atau
(2)
Sebagai nilai dugaan, maka dipilih ß sedemikian rupa sehingga nilai
minimum. Caranya adalah dengan mendiferensialkan persamaan (2) terhadap ß
dan kemudian disamakan dengan nol, yaitu:
(3)
Sehingga diperoleh:
(4)
dengan matriks koragam dari penduga adalah :
(5)
5
Jika matriks
singular, maka penduga ß dicari dengan matriks
kebalikan umum. Penduga tersebut tidak bersifat unik, dan solusi umumnya
(Kshirsagar, 1983) adalah:
(6)
di mana adalah matriks idempoten berukuran p × p yang mempunyai
sifat pangkat H = pangkat S = pangkat X = tr H; dan z adalah
vektor sembarang, sedangkan
(7)
di mana adalah kebalikan umum dari S= .
Metode OLS merupakan metode pendugaan yang sering dipakai pada
analisis regresi klasik. Hal ini berdasarkan pada kenyataan bahwa penduga OLS
relatif lebih mudah dan selalu tersedia pada software statistika, penduga OLS
merupakan penduga tak bias linear terbaik (BLUE).
Metode Kuadrat Terkecil Terboboti (WLS)
Asumsi yang biasa dibuat mengenai model regresi linear
adalah . Kadang-kadang asumsi tersebut tidak
terpenuhi, dan modifikasi metode kuadrat terkecil diperlukan ketika
, di mana merupakan matriks n × n. Jika matriks diagonal dengan
elemen diagonal yang tidak sama, maka amatan Y tidak berkorelasi tetapi
mempunyai ragam yang berbeda. Jika selain elemen diagonal pada adalah tak
nol, maka amatan Y ada yang saling berkorelasi.
Secara formal, andaikan model
(8)
diketahui, tidak perlu diketahui
penduga kuadrat terkecil biasa tidak lagi sesuai. Pendekatan
masalah ini dilakukan dengan transformasi model pada himpunan amatan baru
yang memenuhi asumsi kuadrat terkecil dan selanjutnya menggunakan OLS pada
data yang telah ditransformasi. Karena merupakan matriks koragam dari galat,
adalah sebarang matriks tak singular dan definit positif, maka terdapat matriks
simetrik tak singular K berukuran n × n, di mana Matriks K
6
Definisikan peubah-peubah baru
maka model regresi menjadi atau
(10)
Dengan demikian elemen mempunyai nilai tengah nol, ragam konstan dan tak
berkorelasi. Karena galat pada persaman (10) memenuhi asumsi biasa,
sehingga OLS dapat digunakan. Fungsi kuadrat terkecil adalah
(11)
Dengan pendiferensialan secara parsial terhadap dan menyamakan hasil yang
diperoleh dengan nol, sehingga diperoleh persamaan normal kuadrat terkecil,
(12)
dan solusi persamaan tersebut adalah :
(13)
disebut penduga kuadrat terkecil umum (Generalized Least Square, GLS)
dari , dengan matriks koragam dari penduga adalah :
(14)
(Montgomery and Peck, 1992).
Jika struktur dari matriks koragam tidak diketahui, atau matriks tidak
diketahui maka untuk metode pendugaaan parameter GLS pada persamaan (13)
perlu diduga dari data selain pendugaan parameter dengan menggunakan metode
OLS. Metode GLS secara khusus memerlukan proses iterasi. Dalam prakteknya,
secara khusus tidak diketahui, maka pendugaan parameter dengan metode GLS
tidak dapat diperoleh. Dengan menggantikan penduga untuk pada
persamaan (13) menghasilkan penduga yaitu
(15)
dengan yang berunsur n(n+1)/2 parameter, sehingga terlalu banyak untuk
diduga dari n amatan. Pendugaan yang tepat dari tidak akan mungkin kecuali
pembatasan pada elemen ditentukan atau strukturnya harus ditentukan pada
7
Jika galat mempunyai ragam tak sama, maka = diag dan bentuk
khusus dari GLS ini disebut sebagai metode kuadrat terkecil terboboti (Weighted
Least Square, WLS). Dalam kasus ini K = diag = dan
. Diasumsikan struktur sederhana dari sehingga
merupakan matriks diagonal dengan elemen diagonal yang mungkin berbeda,
(16)
yang artinya elemen Y tidak berkorelasi tetapi mempunyai ragam yang berbeda.
Untuk menentukan penduga WLS, tansformasi matriks yang diinginkan adalah,
(17)
Algoritma WLS jika struktur tidak diketahui dapat ditulis dalam
langkah-langkah sebagai berikut :
1 Regresikan Y dengan konstanta dan semua peubah bebas atau menduga
parameter dengan OLS, menghasilkan sebagai dugaan awal.
2 Tentukan galat dari regresi pada langkah pertama.
3 Analisis galat dan tentukan pembobot atau dugaan dari yaitu yang
merupakan matriks diagonal.
4 Duga kembali parameter dengan menyelesaikan persamaan (15) untuk
memperoleh yang baru, atau dilakukan dengan memerhatikan bahwa dapat
didekomposisikan sebagai dan dugaan parameter dapat diperoleh
dengan membentuk pembobot dan melakukan regresi kuadrat terkecil terboboti
dengan mentransformasi semua peubah pada langkah pertama dengan
mengalikan setiap peubah termasuk konstanta dengan bobot yang dibentuk
pada langkah sebelumnya.
5 Ulangi langkah 2, 3, 4 sampai
8
Regresi Terpotong
Menganalisis data survei rumahtangga misalnya pengeluaran rumahtangga
pada suatu barang dengan menggunakan model regresi dengan memerhatikan
kenyataan bahwa pengeluaran (peubahrespons pada model regresi) tidak mungkin
negatif.
Peubah respons dalam model regresi diamati pada seluruh daerah hasil
(range). Peubah respons dikatakan terpotong jika sebagian dari amatan
merupakan nilai minimum atau maksimum, karena peubah terpotong tidak
diamati pada seluruh daerah hasil. Sebuah sampel dikatakan terpotong jika data
hanya diperoleh pada himpunan bagian dari keseluruhan populasi.
Dalam studi ini peubah respons dikatakan terpotong pada titik c bila
nilainya
c dianggap bernilai c atau Y didefinisikan sebagai berikut :
(18)
(Maddala, 1983).
Model Tobit
Model ini pertama kali dibicarakan oleh Tobin (1958), yang menganalisis
pengeluaran rumahtangga pada suatu barang menggunakan model regresi dengan
memerhatikan kenyataan bahwa pengeluaran (peubah respons pada model regresi)
tidak mungkin negatif. Untuk data dengan beberapa nilai amatan nol, metode
kuadrat terkecil tidak sesuai karena asumsi klasik tidak terpenuhi. Karena Tobin
menghubungkan studinya pada analisis Probit, maka model ini juga disebut model
Tobit oleh Goldberger (Amemiya, 1984).
Maddala (1983) mendefinisikan model Tobit sebagai berikut:
(19)
Pada model ini , adalah vektor parameter berukuran k × 1,
adalah vektor peubah penjelas berukuran k × 1, termasuk unsur 1 bila dengan
intersep, dan adalah galat yang saling bebas dan berdistribusi normal dengan
9
Pendugaan parameter menurut Maddala (1983) dilakukan dengan
memisahkan amatan peubah respons yang bernilai nol dan positif. Misalkan N0
adalah banyaknya amatan di mana yi = 0 dan Ni adalah banyaknya amatan
yi > 0, dan didefinisikan:
(20)
(21)
(22)
(23)
dan masing-masing merupakan fungsi kepekatan peluang dan fungsi
distribusi kumulatif normal baku yang dievaluasi pada .
Misalkan,
(24)
merupakan vektor N1 amatan tak nol berukuran 1 N1
merupakan matriks nilai-nilai untuk amatan
tak
nol berukuran k N1
merupakan matriks nilai-nilai untuk amatan
0 berukuran k N0
merupakan vektor nilai-nilai untuk amatan
0 berukuran 1 N0
Untuk amatan 0, diketahui bahwa
Untuk amatan 0, diperoleh
(25)
Pada model regresi linear fungsi kemungkinanmerupakan fungsi kepekatan
10
acak yang saling bebas, maka juga merupakan peubah acak yang saling bebas
sehingga fungsi kemungkinan persamaan (19) adalah
(26)
di mana suku pertama meliputi N0 amatan untuk 0 dan suku kedua N1amatan
untuk 0 dan log-fungsi kemungkinan adalah
(27)
di mana penjumlahan So meliputi N0 amatan untuk 0 dan S1 meliputi N1
amatan untuk
Dengan memaksimumkan log-fungsi kemungkinan dengan menggunakan
turunan pertama log L terhadap ßdan s2 akan diperoleh
(28)
(29)
sehingga solusi persamaan (28) dan persamaan (29) adalah
(30)
(31)
di mana merupakan penduga yang diperoleh dari N1 nilai amatan tak nol.
Persamaan (31) menunjukkan hubungan antara penduga kemungkinan maksimum
(ML) dan OLS yang diperoleh dari nilai amatan tak nol.
Model Probit
Jika peubah respons merupakan peubah boneka (dummy variable), regresi
OLS tidak sesuai. Regresi OLS akan menghasilkan ramalan-ramalan yang tidak
tepat, yang dapat bernilai lebih besar dari 1 atau kurang dari 0, selain akan
melanggar asumsi homogenitas karena sifat diskret peubah respons (Salvatore and
Reagle, 2002).
Sebuah pendekatan alternatif untuk mengatasi masalah peubah respons
bersifat dikotomi, disebut model analisis Probit (Golberger, 1964), diasumsikan
11
(32)
dan berdistribusi normal baku, . Dalam prakteknya tidak
teramati, yang diamati peubah boneka Y yang didefinisikan
(33)
Dalam kasus ini nilai-nilai amatan Y merupakan realisasi dari proses binomial
sehingga fungsi kemungkinan diasumsikan mengikuti distribusi binomial.
Dari (32) dan (33), peluang dari amatan adalah:
= (34)
di mana merupakan fungsi distribusi kumulatif (cdf) untuk . Asumsikan
saling bebas, diperoleh fungsi kemungkinan sebagai berikut
(35)
Notasi dan masing-masing merupakan fungsi kepekatan dan fungsi distribusi
kumulatif normal baku, sehingga fungsi kemungkinan model Probit yang
berkaitan dengan persamaan (33) dapat ditulis
(36)
dan log fungsi kemungkinan
(37)
Turunan log L terhadap ß menghasilkan
(38)
Penduga kemungkinan maksimum dapat diperoleh sebagai solusi dari
persamaan 0. Persamaan tersebut tidak memberikan bentuk tertutup
12
Penduga dua tahap Heckman(Probit dan OLS)
Pendugaan parameter model Tobit dengan OLS untuk semua amatan atau
hanya amatan positif akan menghasilkan penduga parameter yang bias dan
tidak konsisten, sehingga diperlukan alternatif lain. Selain menggunakan metode
kemungkinan maksimum, pendugaan parameter model Tobit dapat dilakukan
dengan dua tahap atau lebih dikenal dengan istilah Heckman’s two step estimator
(Maddala, 1983 dan Amemiya, 1985).
Andaikan model pada persamaan (19) dan amatan positif diperoleh,
(39)
di mana suku terakhir pada ruas kanan secara umum tak nol. Hal ini menyebabkan
sifat bias penduga OLS menggunakan amatan positif . Karena asumsi
kenormalan pada , persamaan (39) dapat ditulis menjadi
(40)
di mana dan masing-masing merupakan fungsi kepekatan
peluang dan fungsi distribusi kumulatif normal baku yang dievaluasi
pada .
Alternatif yang ditemukan Heckman (1976b) pada dasarnya terdiri dari dua
tahap, yaitu pendugaan aspek kualitatif dan kemudian pendugaan aspek kuantitatif
dari model Tobit (Maddala, 1983).
Tahap pertama:
Aspek kualitatif dari model Tobit menggunakan model Probit. Didefinisikan
peubah boneka yaitu:
dan , dimana
Dengan menggunakan model Probit, diperoleh penduga kemungkinan maksimum
dari sehingga dengan hasil tersebut diperoleh nilai penduga dari dan .
Tahap kedua:
Aspek kuantitatif dari model Tobit yang berkaitan dengan amatan positif
(41)
Dengan demikian persamaan (41) dapat ditulis,
13
di mana
Dengan mengunakan metode kuadrat terkecil (OLS) pada persamaan (42)
akan diperoleh penduga parameter dan yang konsisten, di mana
menggantikan posisi sebagai peubah bebas yang nilainya diperoleh pada tahap
sebelumnya.
Sifat-sifat penduga yang baik
Penduga (estimator) adalah fungsi dari contoh acak yang tidak bergantung
pada parameter, sedangkan dugaan (estimate) adalah nilai dari penduga. Ada
beberapa kriteria yang dapat dipakai untuk mendapatkan penduga yang baik
tersebut di antaranya adalah sifat tak bias, ragam minimum, konsisten, minimum
MSE, konsisten serta sifat asimtotis (Koutsoyiannis, 1973).
1 Tak bias
Bias suatu penduga didefinisikan sebagai selisih antara nilai harapan
penduga dengan nilai parameter yang sebenarnya, atau
(43)
Jadi dikatakan penduga tak bias dari ß jika nilai harapan dari sama dengan
nilai ß atau sebaliknya jika maka dikatakan penduga tak
bias. Dengan kata lain suatu penduga dikatakan tak bias jika nilai biasnya sama
dengan nol.
2 Ragam minimum
Suatu penduga dikatakan penduga terbaik apabila ragam dari mempunyai
nilai minimum dibandingkan dengan ragam dari penduga-penduga tak bias
lainnya, atau
(44)
14
3 Konsisten
Suatu penduga dikatakan penduga konsisten dari ß
jika konvergen
peluang ke ß, yaitu plim = ß. Jadi untuk setiap ,
(45)
4 Best Linear Unbiased Estimator (BLUE)
Suatu penduga dikatakan penduga tak bias linear terbaik jika memenuhi:
a. merupakan fungsi linear dari amatan sampel
b. bersifat tak bias atau
c. , di mana adalah penduga lain dari parameter ß.
5 Mean Square Error (MSE) Minimum
Kriteria ini juga merupakan kombinasi dari sifat ketakbiasan dan ragam
minimum. Suatu penduga dikatakan mempunyai MSE minimum jika nilai
harapan kuadrat selisih antara penduga dengan nilai parameter populasinya
mempunyai nilai paling kecil, atau dirumuskan sebagai berikut:
6 Sifat Asimtotis
Sifat ini dimaksudkan untuk melihat perilaku dari distribusi sampling
penduga dalam ukuran sampel yang cukup besar. Distribusi sampling penduga
pada umumnya berubah dengan berubahnya ukuran sampel. Sifat-sifat asimtotis
yang diinginkan dari suatu penduga adalah tak bias asimtotis, konsisten dan
efisien asimtotis, sebagai berikut :
a. adalah penduga tak bias asimtotis dari ß jika
b. Dapat dibuktikan bahwa syarat cukup agar merupakan penduga konsisten
bagi ßadalah dipenuhi syarat-syarat berikut:
adalah penduga tak bias asimtotis dari ß
15
c. merupakan penduga yang efisien asimtotis jika
(48)
di mana merupakan penduga konsisten yang lain dari .
erupakan penduga yang efisien asimtotis dari ika memenuhi ketiga
syarat berikut:
i. mempunyai distribusi asimtotis dengan nilai tengah dan ragam
tertentu
ii. konsisten
iii. Tidak ada penduga konsisten lain dari yang mempunyai ragam
16
METODE PENELITIAN
Sumber Data
Data yang digunakan pada penelitian ini adalah data bangkitan (generated)
dari software statistika, yaitu SAS 9.1 dengan proporsi nilai amatan nol 8%
(16 amatan nol dari 192 amatan contoh) seperti kasus yang diperoleh pada
penelitian sebelumnya, yaitu proporsi nilai amatan nol pada konsumsi ikan
(Virgantari, 2005).
Tahap Analisis
Tahap analisis meliputi hal-hal berikut:
a. Simulasi/pembangkitan data
Data yang digunakan dalam penelitian ini merupakan data simulasi yang
dibangkitkan dengan software SAS 9.1. Simulasi merupakan suatu proses
membuat desain logika matematika dari suatu sistem real dengan melibatkan
batasan-batasan tertentu untuk memecahkan suatu masalah. Jadi langkah awal
yang dilakukan pada tahap simulasi/pembangkitan data adalah pembentukan
model atau penyusunan model.
Spesifikasi Model
Pada penelitian ini model yang digunakan merupakan hasil dari penelitian
sebelumnya (Virgantari, 2005), yaitu model Almost Ideal Demand System (AIDS)
(49)
dengan anggaran pengeluaran komoditas ke-i
harga unit komoditas ke-j
total pengeluaran
indeks harga Stone, didefinisikan
parameter model, berturut-turut untuk intersep, pengeluaran
harga dan jumlah anggota rumah tangga
Data yang digunakan dalam penelitian sebelumnya adalah data sekunder
17
dilakukan oleh Biro Pusat Stastistik (BPS), di mana data yang dipakai adalah nilai
pengeluaran dan konsumsi pangan sumber protein hewani yaitu ikan, daging, dan
telur di wilayah DKI Jakarta. Setelah dianalisis dan diduga parameternya
diperoleh model regresi, khususnya untuk konsumsi ikan yang akan digunakan
untuk pembangkitan data dalam penelitian ini. Model regresi yang dikaji adalah:
(50)
Algoritma pembangkitan data dilakukan dengan langkah sebagai berikut:
1 Diberikan nilai parameter dari penelitian sebelumnya, yaitu
= (0.0206, -6.37E-7, 0.0867, -0.0869, 0.1277,
0.1316).
2 Menentukan nilai X berdasarkan kombinasi berbagai nilai data asal pada
penelitian sebelumnya yang dapat dilihat pada Tabel 1, sehingga diperoleh 192
kombinasi.
Tabel 1 Nilai peubah penjelas pada data asal
Peubah penjelas Nilai data asal
0.5; 2.5
2.5; 3.5
2.5; 3.5
-1.1; -0.4; 1.0; 1.7
2.5; 3.5; 4.5; 5.5; 6.5; 7.5
3 Merumuskan fungsi
4 Membangkitkan bilangan acak
5 Menggunakan kombinasi X dan nilai untuk memperoleh nilai Y dengan
proporsi nilai amatan nol sebanyak 8% (16 amatan).
6 Jika pada iterasi pertama belum diperoleh nilai Y 0 sebanyak 16 amatan
maka iterasi akan terus berlanjut dan proses akan berhenti jika sudah diperoleh
16 amatan nol, sehingga data yang dibangkitkan berukuran 192 sesuai dengan
kombinasi nilai X.
7 Langkah 1-6 dilakukan sebanyak 100 kali dan data bangkitan tersebut dibagi
menjadi dua sampel, di mana sampel yang pertama digunakan untuk
[image:42.612.191.445.352.473.2]18
b. Pendugaan parameter
Dari sampel pertama yang diperoleh pada tahap simulasi data, ada 50 nilai
amatan (N = 50) dengan proporsi nilai amatan nol yang dicobakan, dan
selanjutnya dilakukan pendugaan dengan menggunakan metode OLS, WLS dan
penduga dua tahap Heckman. Nilai-nilai dugaan tersebut akan dapat digunakan
untuk mendapatkan gambaran tentang distribusi sampling dari dan selanjutnya
akan digunakan untuk mendapatkan gambaran tentang bias, ragam dan MSE dari
nilai dugaan yang diperoleh.
c. Evaluasi penduga parameter
Penduga-penduga yang dihasilkan pada tahap sebelumnya dievaluasi
dengan kriteria sifat ketakbiasan, ragam penduga, dan nilai kuadrat tengah galat
(MSE) yang minimum. Sifat-sifat distribusi sampling yang diperiksa adalah nilai
harapan dan ragam yang selanjutnya digunakan untuk menduga bias dan kuadrat
tengah galat sebagai berikut:
Nilai bias dugaan
Nilai bias dari diperoleh dengan mengurangkan rata-rata dari dugaan yag
diperoleh dengan nilai ßyang sebenarnya,
(51)
Ragam dugaan
Ragam dari distribusi sampling diduga dengan menggunakan rumus biasa
untuk menduga ragam yaitu:
(52)
Kuadrat tengah galat (MSE)
Nilai MSE dari diduga berdasarkan rata-rata dari kuadrat selisih antara
penduga dengan nilai sebenarnya yaitu:
19
d. Validasi model
Validasi dilakukan dengan membandingkan nilai amatan yang dibangkitkan,
Y, dengan nilai dugaan padanannya, , yang diperoleh dengan menggunakan
dugaan parameter pada tahap pendugaan.
Berdasarkan nilai tersebut kemudian dihitung nilai rata-rata penyimpangan
kuadrat (MSE) dari masing-masing contoh dengan cara:
(54)
dan kemudian nilai tersebut dirata-ratakan dari 50 sampel yang ada. Metode yang
20
Tahap-tahap dari analisis tersebut dapat dilihat pada flowchart dan algoritma
[image:45.612.118.551.110.686.2]berikut:
Gambar 1 Flowchart dari tahap analisis penelitian.
tidak ya
Nilai dugaan dan validasi
i < 50
Evaluasi penduga dan validasi
Metode terbaik
Selesai
Perumusan Model
Simulasi Data
i = i+1
Sampel 2 , ulangan ke – i Yij , j = 1,2, ..., 192
Sampel 1 , ulangan ke – i Yij , j = 1,2, ..., 192
Pendugaan parameter
OLS GLS Heckman
Mulai
i = 0
21
Algoritma:
Langkah 1: Perumusan model, yaitu :
ß= (0.0206, -6.37E-7, 0.0867, -0.0869, 0.1277, 0.1316)
X ditentukan berdasarkan kombinasi beberapa nilai data asal,
yaitu: 0.5; 2.5,
2.5; 3.5,
2.5; 3.5,
-1.1; -0.4; 1; 1.7,
2.5; 3.5; 4.5; 5.5; 6.5; 7.5,
Tetapkan : i 0 (belum dilakukan proses ulangan);
N 50 (banyaknya ulangan);
Proporsi nilai amatan nol 8% (16 amatan)
Langkah 2: Melakukan simulasi data berdasarkan model pada langkah 1
i= i + 1: simulasi untuk ulangan ke –i
Gunakan kombinasi semua peubah , , , ,
n
nrow(X);
; ; ; ; ;
Pembangkitan data dilakukan sekaligus 2 kali untuk memperoleh
dua sampel. Sampel pertama digunakan untuk pendugaan
parameter dan sampel kedua untuk validasi.
Langkah 3: Melakukan pendugaan parameter pada sampel pertama dengan
metode OLS, GLS, dua tahap Heckman sehingga untuk
masing-masing metode diperoleh dan
Langkah 4: Melakukan validasi dengan membandingkan nilai amatan
pada sampel kedua, Y, dengan nilai dugaan padanannya,
22
Langkah 5: Selama i < 50, proses kembali ke langkah 2 untuk ulangan ke – i,
selain itu proses berhenti
Langkah 6: Mengevaluasi penduga parameter dari distribusi sampling penduga
yang diperoleh pada langkah 4
Langkah 7: Menentukan metode yang terbaik berdasarkan hasil evaluasi dan
23
HASIL DAN PEMBAHASAN
Dalam bab ini disajikan hasil utama dari penelitian, yang terdiri atas bagian
utama, yaitu hasil pendugaan parameter, evaluasi dari masing-masing metode
pendugaan parameter dan bagian berikutnya adalah validasi model regresi yang
digunakan.
Dalam penelitian ini hasil pendugaan parameter, nilai MSE validasi model
disajikan dalam bentuk diagram kotak (boxplot), sedangkan untuk evaluasi nilai
dugaan masing-masing metode dan analisis validasi model menggunakan grafik
garis. Dalam statistik deskriptif, diagram kotak merupakan cara yang tepat untuk
menyajikan kelompok data secara ringkas, menyampaikan informasi tentang
lokasi dan variasi kelompok data. Diagram kotak juga berguna untuk
menampilkan perbedaan antara populasi atau kelompok data, spasi antara bagian
berbeda dari kotak membantu untuk menunjukkan tingkat dispersi/penyebaran
dan kecondongan dalam data.
Hasil Pendugaan Parameter
Pada tahap ini model regresi pada persamaan (50) diduga dengan
menggunakan ketiga metode yaitu OLS, WLS dan dua tahap Heckman.
Pendugaan parameter dilakukan dengan menggunakan data pada sampel pertama,
di mana masing-masing metode menghasilkan 50 nilai dugaan untuk tiap
parameter (Lampiran 3). Nilai-nilai dugaan tersebut akan dapat digunakan untuk
mendapat gambaran tentang distribusi sampling dari . Hasil statistik deskriptif
pendugaan parameter ketiga metode untuk masing-masing parameter dapat dilihat
24
N il a i d u g a a n Hec km
an b _5 WL
S b_ 5 OL
S b_ 5
Hec km
an b _4 WL
S b_ 4 OL
S b_ 4
Hec km
an b _3 WL
S b_ 3 OL
S b_ 3
Hec km
an b _2 WL
S b_ 2 OL
S b_ 2
He c km
an b _1 WL
S b_ 1 OL
S b_ 1
He c km
an b _0 WL
S b_ 0 OL
S b_ 0 1.5 1.0 0.5 0.0 -0.5 -1.0 41 46 41 26 2 46 45 41 2 6 49 25 19
[image:49.612.160.476.78.281.2]Boxplot Nilai Dugaan Parameter
Gambar 2 Diagram kotak dari nilai dugaan untuk keseluruhan parameter pada tahap pendugaan parameter.
D a ta Heckman WLS OLS 1.5 1.0 0.5 0.0 -0.5 -1.0 49 25
Boxplot b_0
D a ta Heckman WLS OLS 0.3 0.2 0.1 0.0 -0.1 19 Boxplot b_2 D a ta Heckman WLS OLS 0.10 0.05 0.00 -0.05 Boxplot b_1 D a ta Heckman WLS OLS 0.1 0.0 -0.1 -0.2 -0.3 41
Boxplot b_3
D a ta Heckman WLS OLS 0.25 0.20 0.15 0.10 0.05 0.00 46 41 26 2 46 45 41 2 6
Boxplot b_4
D a ta Heckman WLS OLS 0.20 0.15 0.10 0.05 0.00
Boxplot b_5
[image:49.612.155.467.330.664.2]25
Dari Gambar 2 diperoleh informasi atau gambaran tentang nilai dugaan
ketiga metode pada tahap pendugaan parameter sehingga dapat mendeteksi lokasi
dan dapat membandingkan ukuran pemusatan (central tendency), keragaman
(variability), kecondongan (skewness) dan pencilan (outlier) himpunan data ketiga
metode tersebut.
Secara umum dari keseluruhan metode dan parameter pada Gambar 2
diketahui bahwa metode dua tahap Heckman mempunyai median relatif paling
tinggi dibandingkan dengan metode OLS dan WLS. Nilai kisaran (range) dan
antar kuartil (interquartil) metode dua tahap Heckman lebih besar, sehingga ada
kecenderungan ragamnya lebih besar dibandingkan dengan metode OLS dan
WLS. Nilai kisaran dan antar kuartil metode OLS dan WLS untuk keseluruhan
parameter relatif sama, jadi ada kecenderungan ragamnya sama. Pola distribusi
dari data pada himpunan data ketiga metode berbeda untuk tiap parameter
walaupun ada kecenderungan metode OLS dan WLS mempunyai kecondongan
yang sama. Data pencilan sering terjadi pada metode dua tahap Heckman untuk
keseluruhan parameter, kecuali pada dan Dari Gambar 2 juga dapat dilihat
bahwa secara umum keragaman data untuk parameter cenderung berbeda untuk
ketiga metode. Keragaman paling besar terjadi pada
jika dibandingkan dengan
parameter yang lain. Pencilan banyak ditemukan pada dibandingkan dengan
parameter lain, kecuali pada dan tidak terdapat pencilan.
Untuk lebih terperinci dari Gambar 3 dapat dilihat nilai dugaan untuk tiap
parameter. Pada dapat dilihat bahwa metode dua tahap Heckman mempunyai
median yang relatif paling tinggi dibandingkan dengan dua metode yang lain.
Nilai kisaran dan antar kuartil ketiga metode berbeda, sehingga mempunyai ragam
yang berbeda. Keragaman metode dua tahap Heckman relatif lebih besar
dibandingkan dengan dua metode yang lain. Metode OLS dan WLS mempunyai
kisaran dan antar kuartil yang hampir sama, sehingga keragamannya relatif sama.
Pola distribusi data dari himpunan data metode OLS adalah simetris, sedangkan
pola distribusi himpunan data metode WLS condong ke kiri. Tidak ada pencilan
pada data yang diperoleh pada kedua metode tersebut. Pola distribusi data dari
himpunan data metode dua tahap Heckman adalah condong ke kiri dan terdapat
26
Pada dapat dilihat bahwa metode dua tahap Heckman mempunyai
median yang relatif paling tinggi dibandingkan dengan dua metode yang lain.
Untuk ketiga metode mempunyai kisaran dan antar kuartil yang berbeda, sehingga
keragamannya berbeda. Keragaman metode dua tahap Heckman relatif lebih besar
dibandingkan dengan dua metode yang lain. Pola distribusi dari data pada
himpunan data untuk metode OLS dan WLS sama, yaitu condong ke kiri,
sedangkan untuk metode dua tahap Heckman polanya condong ke kanan. Untuk
ketiga metode pendugaan parameter tidak terdapat pencilan pada himpunan
datanya.
Pada
terlihat metode WLS mempunyai median yang relatif paling
rendah dibandingkan dengan dua metode yang lain. Untuk ketiga metode
mempunyai kisaran dan antar kuartil yang berbeda, keragaman data metode dua
tahap Heckman relatif lebih kecil dibandingkan dengan metode OLS dan WLS.
Metode OLS dan WLS mempunyai kisaran dan antar kuartil yang hampir sama,
sehingga keragamannya relatif sama. Pola distribusi data dari himpunan data
metode OLS dan WLS adalah condong ke kanan dan untuk metode dua tahap
Heckman polanya simetris. Terdapat nilai pencilan pada himpunan data metode
dua tahap, yaitu data ke - 29 (0.30392).
Pada , metode dua tahap Heckman mempunyai median yang relatif lebih
tinggi dibandingkan dengan dua metode yang lain. Untuk ketiga metode
mempunyai kisaran dan antar kuartil yang semakin menurun, sehingga terjadi
pengurangan keragaman data dari metode OLS ke metode dua tahap Heckman.
Keragaman metode dua tahap Heckman relatif lebih kecil dibandingkan dengan
metode OLS dan WLS. Pola distribusi data dari himpunan data metode OLS dan
WLS adalah condong ke kanan, sedangkan metode dua tahap Heckman polanya
simetris dan ada nilai pencilan, yaitu data ke - 41 (-0.26786).
Pada , metode OLS mempunyai median yang relatif lebih rendah
dibandingkan dengan dua metode yang lain. Untuk ketiga metode mempunyai
kisaran dan antar kuartil yang berbeda dan semakin menaik dari metode OLS ke
metode dua tahap Heckman, sehingga keragamannya semakin besar. Keragaman
metode dua tahap Heckman relatif lebih besar dibandingkan dengan metode OLS
27
hampir sama, sehingga keragamannya relatif sama. Pola distribusi data dari
himpunan data metode WLS adalah condong ke kanan, sedangkan OLS dan dua
tahap Heckman mempunyai pola condong ke kiri dan terdapat banyak nilai
pencilan pada himpunan data untuk ketiga metode.
Pada , metode dua tahap Heckman mempunyai median yang relatif lebih
rendah dibandingkan dengan dua metode yang lain. Metode OLS dan WLS
mempunyai kisaran dan antar kuartil yang relatif sama walaupun keragaman
metode OLS cenderung lebih kecil dibandingkan dengan dua metode yang lain,
sedangkan metode dua tahap Heckman mempunyai kisaran dan antar kuartil yang
lebih besar, sehingga keragaman metode dua tahap Heckman lebih besar
dibandingkan dengan dua metode yang lain. Pola distribusi data dari himpunan
data ketiga metode berbeda, OLS berpola condong ke kanan, WLS mempunyai
pola distribusi condong ke kiri dan metode dua tahap Heckman berpola simetris.
Untuk ketiga metode tidak terdapat nilai pencilan.
Evaluasi Metode Pendugaan
Tahap evaluasi metode pendugaan parameter dilakukan untuk melihat
sifat-sifat parameter dan perilaku metode pendugaan parameter yang diperoleh dari
tahap sebelumnya. Jadi dengan mudah dapat ditentukan metode pendugaan
parameter yang terbaik. Pada tahap ini evaluasi dilakukan dengan bantuan Excel
2007 dan Minitab 14. Adapun kriteria evaluasi metode pendugaan berdasarkan
nilai bias, ragam dan MSE sebagai berikut :
1 Nilai bias dugaan.
Selanjutnya menentukan nilai bias dugaan dari hasil pendugaan parameter
pada tahap sebelumnya dengan menggunakan persamaan (51), sehingga diperoleh
nilai bias dugaan untuk masing-masing metode, yaitu OLS, WLS dan dua tahap
Heckman. Hasilnya diberikan pada Tabel 2 dan secara grafik diberikan pada
Gambar 4 dan 5.
Dari Gambar 4 secara umum diperoleh bahwa nilai bias dugaan parameter
28
satu dengan yang lain walaupun ada kecenderungan nilai bias metode WLS lebih
kecil dibandingkan dengan dua metode yang lain.
Nilai bias dugaan pada dan
bernilai positif artinya bahwa rata-rata
nilai dugaan lebih besar dari nilai yang sebenarnya atau nilai dugaan berbias ke
atas. Sedangkan nilai bias dugaan pada dan yang bernilai negatif
artinya bahwa rata-rata nilai dugaan lebih kecil dari nilai yang sebenarnya atau
berbias ke bawah. Nilai bias metode OLS dan WLS dapat dikatakan relatif sama
pada semua nilai dugaan. Perbedaan bias metode dua tahap Heckman dengan
metode OLS dan WLS paling besar dapat dilihat pada sedangkan pada
parameter yang lain perbedaannya tidak terlalu besar. Untuk keseluruhan
parameter nilai bias yang diperoleh dari ketiga metode pada relatif lebih kecil
[image:53.612.138.500.342.669.2]dibandingkan dengan parameter yang lain.
Tabel 2 Nilai bias dari dugaan metode OLS, WLS dan dua tahap Heckman
Parameter Bias OLS Bias WLS Bias Heckman
ß0 0.139340 0.125700 0.135150
ß1 -0.002750 -0.002210 0.005440
ß2 -0.015400 -0.014360 -0.013250
ß3 0.018430 0.019490 0.017980
ß4 -0.017440 -0.017070 -0.019760
ß5 -0.019930 -0.018870 -0.020210
Gambar 4 Nilai bias dugaan untuk keseluruhan parameter ( ) dengan metode OLS, WLS dan dua tahap Heckman.
-0.04 -0.02 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16
ß_0 ß_1 ß_2 ß_3 ß_4 ß_5
N
il
a
i b
ia
s
Bias OLS
Bias WLS
29
Metode N il a i b ia s Heckman WLS OLS 0.1400 0.1375 0.1350 0.1325 0.1300 0.1275 0.1250 Bias b_0 Metode N il a i b ia s Heckman WLS OLS 0.006 0.005 0.004 0.003 0.002 0.001 0.000 -0.001 -0.002 -0.003
Bias b_1
Met ode N il a i b ia s Heckman WLS OLS -0.0130 -0.0133 -0.0136 -0.0139 -0.0142 -0.0145 -0.0148 -0.0151 -0.0154 -0.0157
Bias b_2
Metode N il a i b ia s Heckman WLS OLS 0.0196 0.0194 0.0192 0.0190 0.0188 0.0186 0.0184 0.0182 0.0180
Bias b_3
Metode N il a i b ia s Heckman WLS OLS -0.0170 -0.0175 -0.0180 -0.0185 -0.0190 -0.0195 -0.0200
Bias b_4
Met ode N il a i b ia s Heckman WLS OLS -0.01900 -0.01925 -0.01950 -0.01975 -0.02000 -0.02025
Bias b_5
Gambar 5 Nilai bias dugaan untuk tiap-tiap parameter dengan metode OLS, WLS dan dua tahap Heckman.
Untuk gambaran khusus dari Gambar 5 dapat dilihat nilai bias dugaan
untuk tiap parameter. Pada dan , nilai bias dugaan ketiga metode bernilai
positif (berbias ke atas) dan nilai bias dugaan metode WLS relatif lebih kecil
dibandingkan dengan dua metode yang lainnya. Perbedaan bias ketiga metode
tidak terlalu besar, dapat dikatakan relatif sama.
Pada nilai bias dugaan metode OLS dan WLS bernilai negatif (berbias
ke bawah), sedangkan untuk metode dua tahap bernilai positif (berbias ke atas).
Nilai bias dugaan metode WLS cenderung lebih kecil dibandingkan dengan dua
metode yang lain. Perbedaan nilai bias ketiga metode terlihat besar terutama pada
metode dua tahap Heckman.
Pada , nilai bias dugaan ketiga metode bernilai negatif (berbias ke bawah)
[image:54.612.150.471.86.409.2]30
dengan dua metode yang lain. Perbedaan nilai bias ketiga metode tidak terlalu
besar. Nilai bias dugaan dan bernilai negatif (berbias ke bawah) untuk
ketiga metode. Perbedaan bias ketiga metode tidak terlalu besar atau relatif sama
walaupun ada kecenderungan nilai bias dugaan metode WLS lebih kecil
dibandingkan dengan dua metode yang lain.
2 Ragam dugaan
Selanjutnya menentukan nilai ragam dugaan dari hasil pendugaan parameter
pada tahap sebelumnya dengan menggunakan persamaan (52), sehingga diperoleh
nilai ragam dugaan untuk masing-masing metode, yaitu OLS, WLS dan dua tahap
Heckman. Hasilnya diberikan pada Tabel 3 dan secara grafik diberikan pada
[image:55.612.148.489.333.665.2]Gambar 6 dan 7.
Tabel 3 Nilai ragam dugaan dengan metode OLS, WLS dan dua tahap Heckman
Parameter Ragam OLS Ragam WLS Ragam Heckman
ß0 0.080260 0.085082 0.22852
ß1 0.000680 0.000682 0.00143
ß2 0.003612 0.004023 0.00491
ß3 0.004269 0.004230 0.00605
ß4 0.000872 0.000912 0.00252
ß5 0.000366 0.000357 0.00223
Gambar 6 Nilai ragam dugaan keseluruhan parameter ( ) dengan metode OLS, WLS dan dua tahap Heckman.
0.00 0.05 0.10 0.15 0.20 0.25
ß_0 ß_1 ß_2 ß_3 ß_4 ß_5
N
il
a
i r
a
ga
m
Ragam OLS
Ragam WLS
31
Metode N il a i ra g a m Heckman WLS OLS 0.25 0.20 0.15 0.10
Ragam b_0
Metode N il a i ra g a m Heckman WLS OLS 0.0015 0.0014 0.0013 0.0012 0.0011 0.0010 0.0009 0.0008 0.0007 0.0006
Ragam b_1
Metode N il a i ra g a m Heckman WLS OLS 0.00500 0.00475 0.00450 0.00425 0.00400 0.00375 0.00350
Ragam b_2
Metode N il a i ra g a m Heckman WLS OLS 0.0063 0.0060 0.0057 0.0054 0.0051 0.0048 0.0045 0.0042
Ragam b_3
Metode N il a i ra g a m Heckman WLS OLS 0.00250 0.00225 0.00200 0.00175 0.00150 0.00125 0.00100
Ragam b_4
Metode N il a i ra g a m Heckman WLS OLS 0.0025 0.0020 0.0015 0.0010 0.0005
Ragam b_5
Gambar 7 Nilai ragam dugaan tiap-tiap parameter ( ) dengan metode OLS, WLS dan dua tahap Heckman.
Dari Gambar 6 secara umum nilai ragam dugaan yang diperoleh dari metode
dua tahap Heckman relatif lebih besar dibandingkan dengan dua metode yang
lain. Dari keseluruhan parameter, nilai ragam dugaan metode OLS dan WLS
dapat dikatakan sama walaupun ada kecenderungan nilai ragam metode OLS lebih
kecil dibandingkan dengan dua metode yang lain.
Perbedaan ragam yang paling besar antara penduga dua tahap Heckman
dengan dua metode yang lain dapat dil