ESTIMASI PARAMETER REGRESI ROBUST DENGAN METODE ESTIMASI-S
PADA PRODUKSI JAGUNG DI INDONESIA TAHUN 2010
Oleh Retno Jati Sahari
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sebelas Maret
ABSTRAK
Produksi jagung di Indonesia menunjukan peningkatan dari tahun ke tahun, tetapi Indonesia masih harus melakukan impor jagung. Ada 2 variabel penting yang mempengaruhi produksi jagung nasional di Indonesia yaitu luas lahan (Ha) dan produktivitas. Untuk menganalisis hubungan antara variabel prediktor dan variabel respon (produksi) diperlukan suatu metode, salah satunya yaitu analisis regresi. Melalui analisis regresi dapat ditentukan model prediksi nilai produksi jagung serta seberapa besar pengaruh variabel-variabel prediktor. Namun, dalam melakukan regresi persyaratan yang harus dipenuhi yaitu asumsi-asumsi klasik yang terkandung pada data. Ada 4 asumsi klasik yang harus dipenuhi yaitu normalitas, homokesdasitas, non autokorelasi dan non multikolinearitas. Apabila salah satu asumsi tidak dipenuhi maka model regresi yang dihasilkan tidak valid. Oleh karena itu diperlukan suatu metode untuk mengatasi data yang tidak memenuhi asumsi-asumsi. Pada penelitian ini digunakan data produksi jagung 33 provinsi di Indonesia. Regresi Robust estimasi-S salah satunya untuk mengatasi asumsi normalitas yang tidak dipenuhi data produksi jagung tahun 2010. Kelebihan dari estimasi-S dibanding estimasi M, LTS, GS, dan GM yaitu estimasi-S dapat mencapai breakdown point hingga 50% maka estimasi-S dapat mengatasi setengah dari pencilan dan memberikan pengaruh yang baik bagi pengamatan lainnya. Penggunaan regresi robust untuk mengestimasi nilai-nilai parameter pada model regresi produksi Jagung Indonesia tahun 2010 diharapkan dapat memberikan informasi yang valid bagi pemerintah Indonesia sehingga dapat dijadikan acuan untuk langkah peningkatan produksi di tahun-tahun berikutnya.
Kata kunci : produksi, jagung, estimasi, regresi, Robust
I. PENDAHULUAN
Jagung merupakan bahan makanan pokok yang sangat dibutukan karena setiap hari dikonsumsi oleh sebagian masyarakat di seluruh dunia. Kebutuhan bahan makanan pokok akan meningkat sejalan dengan pertambahan jumlah penduduk yang semakin menigkat.
Menurut data BPS, produksi jagung tahun 2010 (ATAP) sebesar 18,33 juta ton, meningkat sebanyak 697,89 ribu ton (3,96 persen) dibandingkan tahun 2009.
Peningkatan produksi tersebut terjadi di Jawa sebesar 489,94 ribu ton, dan di luar Jawa sebesar 207,95 ribu ton. Angka ramalan I (Aram I) produksi jagung tahun 2011 sebesar 17,93 juta ton. Jumlah ini turun sekitar 438.960 ton atau 2,39 persen ketimbang produksi tahun lalu. Sebenarnya, kebutuhan jagung nasional hanya 16,3 juta ton.
Dengan produksi jagung sebesar 18,33 juta ton di tahun 2010, seharusnya kebutuhan dalam negeri tercukupi.
Analisis regresi merupakan teknik statistika yang digunakan untuk menyelidiki dan nemodelkan hubungan antara variabel dependen dan variabel independen. Jika Y variabel dependen dan X1, X2, ... , XK variabel independen, maka model regresi linear secara umum dapat dinyatakan sebagai
Dengan adalah parameter-parameter regresi dan adalah sisaan yang berdistribusi normal dengan mean nol dan variansi konstan (Sembiring, 2003).
Permasalahan yang muncul dalam analisis regresi adalah menentukan estimator terbaik
untuk menentukan . Dalam menetukan estimator terbaik sangat dipengaruhi oleh penggunaan metode. Metode yang biasa digunakan adalah Metode Kuadrat Terkecil (MKT).
Dalam kasus model regresi linear, dimungkinkan terdapat data outlier (pencilan) yaitu pengamatan dengan nilai mutlak sisaan jauh lebih besar daripada sisaan-sisaan lain sehingga akan mempengaruhi model regresi yang terbentuk. Data pencilan tersebut tidak boleh dibuang begitu saja karena akan mempengaruhi model prediksi serta menghasilkan estimasi parameter yang kurang tepat. Untuk menyelesaikan masalah tersebut diperlukan adanya metode yang bersifat robust dimana nilai estimasinya tidak boleh dipengaruhi perubahan kecil dalam data.
Regresi Robust merupakan metode regresi yang digunakan ketika distribui dari sisaan tidak normalatau adanya beberapa pncilan yang berpengaruh pada model.
Dalam regresi robust terdapat beberapa metode estimsi seperti estimasi-M, estimasi Least Median Square (LSM), estimasi Least Trimmed Squarre (LTS), estimasi-S,
estimasi-MM (Chen, 2002)
Dalam penelitian ini penulis membahas dengan metode estimasi-S karena metode ini mempunyai kelebihan yaitu bisa digunakan untuk pencilan dengan proporsi hingga 50% serta digunakan ketik variabel dependen dan variabel independn terdapat pencilan.
Metode estimasi-S prtama kali dikembangkan oleh Rousseeuw dan Yohai (1984) dimana metode ini merupakan keluarga high breakdown point yaitu ukuran umum proporsi dari data pencilan yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model prediksi. Disebut estimasi-S karena mengestimasi berdasarkan skala. Skala yang digunakan adalah standart deviasi sisaan.
II. TUJUAN DAN MANFAAT PENELITIAN a. Tujuan penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah menentukan estimasi produksi jagung di Indonesia tahun 2010 menggunakan metode regresi robust estimasi-S
b. Manfaat penelitian
Manfaat yang diharapkan dalam penelitian ini adalah dapat mengembangkan ilmu pengetahuan dalam bidang statistika dan industri. Pada bidang statistika, metode estimasi-S dapat diaplikasikan terhadap data yang mengandung pencilan pada variabel dependen dan independennya. Sedangkan pada bidang industri dapat memberikan masukan dalam meningkatkan produksi jagung di Indonesia.
III. METODOLOGI
Metode penelitian yang digunakan dalam penulisan makalah ini adalah studi kasus, yaitu melakukan estimasi regresi robust pada model produksi jagung di 33 provinsi di Indonesia tahun 2010. Data yang digunakan adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) Indonesia.
1. Pengujian Asumsi Analisis Regresi
Pada model regresi, perlu dilakukan uji asumsi analisis regresi untuk mengetahui apakah model memenuhi asumsi atau tidak. Uji asumsi yang dilakukan pada model regresi adalah
1. Normalitas
Analisis regresi linier mengasumsikan bahwa sisaan berdistribusi normal.
Menurut Gujarati (1978) pada regresi linier klasik diasumsikan bahwa tiap
didistribusikan secara random dengan
Salah satu cara untuk menguji asumsi kenormalan adalah dengan uji Kolmogorov-Smirnov. Uji ini didasarkan pada nilai D dengan
Dengan adalah fungsi distribusi frekuensi kumulatifrelatif dari distribusi
teoritis dibawah . adalah distribusi frekuensi kumulatif pengamatan sebanyak sampel. adalah sisaan berdistribusi normal. Selanjutnya nilai D ini
dibandingkan dengan nilai D kritis dengan signifikansi (tabel Kolmogorov- Smirnov). Apabila nilai atau , maka asumsi kenormalan tidak dipenuhi.
Dalam penelitian ini asumsi yang digunakan adalah asumsi dari sisaan tidak berdistribusi normal, sehingga MKT tidak layak untuk digunakan (Draper dan Smith, 1998).
2. Homoskedastisitas
Salah satu asumsi penting dalam analisis regresi adalah variasi sisaan pada setiap variabel independen adalah homoskedastisitas. Asumsi ini dapat ditulis sebagai berikut
Salah satu cara menguji kesamaan variansi yaitu dengan melihat pola tebaran sisaan terhadap nilai estimasi Y. Jika tebaran sisaan bersifat acak (tidak membentuk pola tertentu), maka dikatakan bahwa variansi sisaan homogen (Draper dan Smith, 1998).
Untuk lebih tepatnya, menurut Gujarati (1978) salah satu cara untuk mendeteksi heteroskedastisitas adalah dengan pengujian korelasi rank Spearman yang didefinisikan sebagai berikut
Dengan perbedaan dalam rank yang ditempatkan pada dua karakteristik yang berbeda dari individual atau fenomena ke-i dan n adalah banyaknya individual yang dirank. Koefisien rank korelasi tersebut dapat digunakan untuk mendeteksi heterokedastisitas dengan mengasumsikan . Adapun tahapnnya dalah sebagai berikut
1. Mencocokkan regresi terhadap data mengenai Y dan X dan mendapatkan sisaan .
2. Dengan mengabaikan tanda dari , yaitu dengan mengambil nilai mutlaknya | , meranking baik harga mutlak | | dan sesuai dengan urutan yang meningkat atau menurun dan menghitung koefisien rank korelasi Spearman yang telah diberikan sebelumnya.
3. Dengan mengasumsikan bahwa koefisien rank korelasi populasi adalah nol dan , signifikan dari yang disampel dapat diuji dengan pengujian t sebagai berikut :
Jika nilai t yang dihitung melebihi nilai t kritis maka H0 ditolak, artinya asumsi homoskedastitas tidak dipenuhi. Jika model regresi meliputi lebih dari satu variabel X, dapat dihitung antara dan tiap-tiap variabel X secara terpisah dan dapat di uji untuk tingkat penting secara statistik dengan pengujian t yang diberikan di atas.
3. Non autokorelasi
Salah satu asumsi penting dari regresi linear adalah bawa tidak ada autokrelasi antara serangkaian pegamatan yang diurutkan menurut waktu. Adanya kebebasan antar sisaan dapat dideteksi secara grafis dan empiris. Pendeteksian autokorelasi secara grafis yaitu denan melihat pola tebaran sisaan terhadap urutan waktu. Jika tebaran sisaan terhadap urutan waktu tidak membentuk suatu pola tertentu atau bersifat acak maka dapat disimpulkan tidak ada autokorelasi antar sisaan (Draper dan Smith, 1998)
Pengujian secara empiris dilakukan dengan menggunakan statistik uji Durbin- Watson. Hipotesis yang diuji adalah:
H0: Tidak terdapat autokorelasi antar sisaan H1: Terdapat autokorelasi antar sisaan
Adapun rumusan matematis uji Durbin-Watson adalah:
Kaidah keputusan dalam uji Durbin-Watson adalah:
1. Jika atau , maka H0 ditolak berarti bahwa terdapat autokorelasi antar sisaan.
2. Jika , maka H0 tidak ditolak yang berarti bahwa asumsi non autokorelasi terpenuhi.
3. Jika atau maka tidak dapat diputudkan apakah H0 diterima atau ditolak, sehingga tidak dapat disimpulan ada atau tidak adanya autokorelasi.
4. Untuk statistik dari Durbin-Watson dapat dilihat pada tabel
4. Non Multikolinearitas
Menurut Montgomery dan Peck (1992), kolinearitas terjadi karena terdapat korelasi yang cukup tinggi di antara variabel independen. VIF (Variance Inflation Factor) merupakan salah satu cara untuk mengukur besar kolineritas dan didefinisikan sebagai berikut
Dengan m= 1,2,...,p dan p adalah banyaknya variabel independen adalah koefisien determinasi yang dihasilkan dari regresi variabel independen dengan
variabel independen lain . nilai VIF menjadi semakin besar jika terdapat korelasi yang semakin besar diantara variabel independen. Jika VIF lebih dari 10, multikolinearitas memberikan pengaruh yang serius pada pendugaan metode kuadrat kecil.
2. Pencilan
Pada beberapa kasus dimungkinkan adanya data yang jauh dari pola kumpulan dan keseluruhan, yang lazim didefinisikan sebagai data pencilan. Keberadaan dari pencilan akan menyebabkan kesulitan dalam proses analisis data dan perlu untuk dihindari. Permasalahan yang uncul akibat adanya pencilan antara lain:
1. Sisaan yang besar dari model yan terbentuk
2. Variansi dari data akan menjadi lebih besar
3. Estimasi interval akan memiliki rentang yag lebih besar
Menurut Drape dan smith (1998) metode yang digunakan dalam mengidentifikasi pencilan terhadap variabel Y adalah Studientized Deleted Residual (TRES) yang didfinisikan sebagai:
Dimana: = 1,2,...,n
=
=
= simpangan baku beda
=
=p+1
= banyaknya pengamatan
Hipotesis untuk menguji adanya pencilan adalah:
H0: pengamatan ke-i bukan pencilan H1: pengamatan ke-i merupakan pencilan
adalah stastistik uji untuk mengetahui pencilan terhadap Kriteria pengujian yang melandasi keputusan adalah:
Metode yang diunakan dalam mengidentifikasi pencilan terhadap variabel adalah nlai pengaruh (Leverage Point). Nilai pengaruh dari penamatan
menunjukan besarnya peranan terhadap dan didefinisikan sebagai:
=
Dimana i: 1,2,...,n
Xi= adalah vektor baris yang berisi nilai-nilai dari peubah
variabel independen dalam pengamatan ke-i. Nilai berada diantara 0 dan 1
dengan k=p+1. Jika lebih besar dari dengan
Maka pengamatan ke-i dikatakan pencilan terhadap X.
3. Estimasi-S
Estimasi-S pertama kali diperkenalkan oleh Rousseeuw dan Yohai (1984) merupakan estimasi robust yang dapat mencapai breakdown point hingga 50%.
Breakdown point adalah ukuran umum proporsi dari pencilan yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model. Karena estimasi-S dapat mencapai breakdown point hingga 50% maka estimasi-S dapat mengatasi setengah dari pencilan dan memberikan pengaruh yang baik bagi pengamatan lainnya.
Estimasi-S didefinisikan