REGRESI ROBUST DENGAN METODE CONSTRAINED M ESTIMATION PADA PRODUKSI PADI SAWAH DI JAWA TENGAH

(1)

commit to user

i

REGRESI ROBUST_{DENGAN METODE}CONSTRAINED M ESTIMATION

PADA PRODUKSI PADI SAWAH DI JAWA TENGAH

oleh

IDA YUSWARA DYAH PITALOKA M0108046

SKRIPSI

ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA

(2)

commit to user

iii

MOTO

“Sesungguhnya bersama kesulitan ada kemudahan”

(QS. Al-Insyiroh : 6).

“Barang siapa menempuh jalan untuk memperoleh ilmu, maka Allah akan

memudahkan baginya jalan menuju surga”

(3)

commit to user

iv

PERSEMBAHAN

Skripsi ini kupersembahkan khusus untuk

Kedua orangtuaku tercinta yang selelu mendoakan yang terbaik untukku,

(4)

commit to user

v

ABSTRAK

Ida Yuswara Dyah Pitaloka, 2012. REGRESI ROBUST_{DENGAN METODE}

CONSTRAINED M ESTIMATION_{PADA PRODUKSI PADI SAWAH DI}

JAWA TENGAH, FMIPA, Universitas Sebelas Maret Surakarta.

Jawa Tengah merupakan provinsi penyangga padi sawah nasional. Produksi padi sawah dapat dipengaruhi oleh faktor luas panen, produktivitas, dan luas pengairan. Hubungan produksi padi sawah dan faktor-faktor tersebut dapat dimodelkan dengan analisis regresi, namun terdapat tujuh data pencilan pada data-data produksi padi dan faktor-faktor tersebut. Regresi robust dengan metode

constrained M estimation dapat digunakan untuk mengatasi adanya data pencilan. Tujuan dari penelitian ini untuk menyusun model regresi robust dengan metode

constrained M estimation pada produksi padi sawah di Jawa Tengah. Hasil

penelitian menunjukkan bahwa model regresinya adalah 283520 5,70 5016 dengan i adalah kabupaten di provinsi Jawa Tengah, adalah luas panen dan adalah produktivitas. Ini berarti bahwa faktor yang berpengaruh terhadap produksi padi sawah di Jawa Tengah adalah luas panen dan produktivitas.

(5)

commit to user

vi

ABSTRACT

Ida Yuswara Dyah Pitaloka, 2012. ROBUST_{REGRESSION WITH}

CONSTRAINED M ESTIMATION METHOD IN WET LAND PADDY PRODUCTION IN CENTRAL JAVA, FMIPA, Universitas Sebelas Maret Surakarta.

Central Java is a province of the national rice buffer. Wet land paddy production can be influenced by factors in harvested area, productivity, and extensive irrigation. The relationship between wet land paddy production and these factors can be modeled with regression analysis, but there are seven outliers in the data of wet land paddy production data and factors. A robust regression with constrained M estimation method can be used to address the existence of data outliers. The purpose of this research is to find the robust regression model by the method of constrained M estimation in wet land paddy production in Central Java. The results showed that the regression model is 283520 5,70 5016 with i is the district in Central Java province, is the harvested area and is productivity. It means that factor influence in wet land paddy production in Central Java is the harvested area and productivity.

(6)

commit to user

vii

KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang dengan siraman rahmat dan

hidayah-Nya telah memberi kekuatan pada penulis dalam menyusun skripsi ini.

Penulis menyadari bahwa tanpa bantuan dan dukungan dari pihak lain, tidak

mungkin dapat menyelesaikan skripsi ini. Untuk itulah pada kesempatan ini

penulis menyampaikan rasa terima kasih kepada

1. Ibu Dra. Yuliana Susanti, M.Si. dan Bapak Drs. Pangadi, M.Si., selaku dosen

Pembimbing I dan Pembimbing II yang telah memberikan bimbingan dan

pengarahan sehingga dapat diselesaikannya penyusunan tugas akhir ini,

2. semua pihak yang membantu penyusunan skripsi ini.

Semoga skripsi ini dapat bermanfaat bagi pembaca.

Surakarta, Juli 2012

(7)

commit to user

viii

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PENGESAHAN ... ii

MOTO ... iii

PERSEMBAHAN ... iv

ABSTRAK ... v

ABSTRACT ... vi

KATA PENGANTAR ... vii

DAFTAR ISI ... viii

DAFTAR TABEL ... x

DAFTAR GAMBAR ... xi

I. PENDAHULUAN 1

1.1Latar Belakang ... 1

1.2 Perumusan Masalah ... 2

1.3 Tujuan Penelitian ... 3

1.4 Manfaat Penelitian ... 3

II. LANDASAN TEORI 4

2.1Tinjauan Pustaka ... 4

2.1.1 Model Regresi Linier ... 5

2.1.2 Metode Kuadrat Terkecil ... 5

2.1.3 Pengujian Asumsi Analisis Regresi ... 6

2.1.4 Pencilan ... 10

2.1.5 Pengujian Kriteria Statistik ... 11

2.1.6 Regresi Robust ... 13

2.1.7 Estimasi-CM ... 14

2.2 Kerangka Pemikiran ... 15

(8)

commit to user

ix

IV. HASIL DAN PEMBAHASAN 17

4.1Data ... 17

4.2Deteksi Pencilan ... 18

4.3Model Kuadrat Terkecil ... 19

4.3.1 Uji Asumsi Normalitas ... 19

4.3.2 Uji Asumsi Homoskedastisitas ... 20

4.3.3 Uji Asumsi Bebas Autokorelasi ... 21

4.3.4 Uji Asumsi Bebas Multikolinearitas ... 22

4.4Model Regresi Robust dengan Estimasi-CM ... 22

V. KESIMPULAN DAN SARAN 5.1 Kesimpulan ... 28

5.2 Saran ... 28

DAFTAR PUSTAKA ... 29

(9)

commit to user

x

DAFTAR TABEL

Halaman

Tabel 4.1. Hasil uji TRES dan 19

Tabel 4.2. Hasil uji multikolinearitas 22

Tabel 4.3. Nilai tiap iterasi pada estimasi-CM dengan empat

koefisien

23

Tabel 4.4. Hasil uji t pada estimasi-CM untuk tiga variabel

independen

25

Tabel 4.5. Nilai tiap iterasi pada estimasi-CM dengan tiga

koefisien

26

Tabel 4.6. Hasil uji t pada estimasi-CM untuk dua variabel

independen

(10)

commit to user

xi

DAFTAR GAMBAR

Halaman

Gambar 2.1. Pola yang memenuhi asumsi homoskedastisitas 7

Gambar 2.2. Pola-pola heteroskedastisitas 8

Gambar 2.3. Statistik d Durbin-Watson 9

Gambar 4.1. Plot antara produksi padi sawah ( ) dan luas panen ( ) 17

Gambar 4.2. Plot antara produksi padi sawah ( ) dan produktivitas

( )

17

Gambar 4.3. Plot antara produksi padi sawah ( ) dan luas pengairan

teknis ( )

18

Gambar 4.4. Plot probabilitas sisaan 20

Gambar 4.5. Plot kuadrat sisaan dengan estimasi Y 21

(11)

commit to user

1

BAB I PENDAHULUAN

1.1Latar Belakang Masalah

Jawa Tengah merupakan salah satu provinsi penyangga padi nasional.

Kebutuhan padi setiap tahun selalu meningkat sebagai akibat dari peningkatan

jumlah penduduk. Produksi padi sawah provinsi Jawa Tengah tahun 2010 sebesar

9,86 juta ton Gabah Kering Giling (GKG), naik 479,46 ribu ton atau 5,11%

dibandingkan produksi padi sawah Tahun 2009. Peningkatan produksi padi sawah

tahun 2010 selain disebabkan adanya kenaikan luas panen seluas 71,62 ribu ha

atau 4,31% juga disebabkan oleh kenaikan produktivitas padi sawah sebesar 0,43

kwintal/ha atau 0,76% (Badan Pusat Statistik, 2011). Selain itu, produksi padi

bergantung dari adanya pengairan yang baik. Menurut Sutawan (2001) air

merupakan salah satu unsur yang sangat penting dalam produksi pangan seperti

halnya padi. Jika air tidak tersedia maka produksi pangan akan terhenti. Salah satu

jenis pengairan adalah pengairan teknis, yaitu jenis pengairan dimana saluran

pemberi terpisah dari saluran pembuang agar penyediaan dan pembagian air ke

dalam lahan sawah dapat sepenuhnya diatur dan diukur dengan mudah. Mudakir

(2007) menunjukkan bahwa luas pengairan teknis berpengaruh positif terhadap

produksi padi sawah. Oleh karena itu, luas panen, produktivitas dan luas

pengairan teknis berpengaruh terhadap produksi padi sawah.

Produksi padi sawah dapat diprediksi menggunakan analisis regresi untuk

mengetahui hubungan antara variabel dependen yaitu produksi padi sawah dan

variabel independen yaitu luas panen, produktivitas dan luas pengairan teknis.

Analisis regresi merupakan teknik statistika yang digunakan untuk menyelidiki

dan memodelkan hubungan antara variabel dependen dan variabel independen.

Dalam analisis regresi harus dipenuhi asumsi-asumsi, yakni asumsi normalitas,

homoskedastisitas, bebas autokorelasi dan bebas multikolinearitas (Gujarati,

1978). Jika asumsi-asumsi tersebut tidak dipenuhi, maka estimator yang

dihasilkan tidak lagi merupakan estimator tak bias linier terbaik (best linear

(12)

commit to user

regresi linear, misalnya sisaan tidak berdistribusi normal atau sisaan tidak

menyebar secara acak. Salah satu penyebabnya terdapat data outlier (pencilan),

yaitu pengamatan yang sangat berbeda dengan pengamatan yang lain, mungkin

nilainya terlalu besar atau lebih kecil (Kartika, 1985). Data pencilan tidak boleh

dibuang karena dimungkinkan data pencilan tersebut mengandung informasi yang

penting. Oleh karena itu, diperlukan suatu metode agar tidak membuang informasi

tersebut, salah satu di antaranya dengan menggunakan metode yang bersifat

robust yakni regresi robust. Diharapkan dengan regresi robust tersebut nilai

estimasinya tidak banyak dipengaruhi oleh perubahan kecil dalam data.

Regresi robust merupakan metode regresi yang digunakan ketika terdapat

beberapa pencilan yang berpengaruh pada model. Metode ini merupakan alat

penting untuk menganalisis data yang dipengaruhi oleh pencilan sehingga

dihasilkan model yang robust atau resistance terhadap pencilan. Menurut Arslan

et al. (2002), salah satu estimasi regresi robust adalah estimasi constrained M

(estimasi-CM) yang pertama kali dikembangkan oleh Mendes dan Tyler pada

tahun 1995.

Metode estimasi-CM memiliki nilai breakdown point hingga 0,5 (Kent

and Tyler, 2001). Breakdown point adalah salah satu cara untuk mengukur

ke-robust-an suatu estimator (Yohai, 1987). Breakdown point merupakan proporsi

minimal dari banyaknya pencilan dibandingkan keseluruhan data yang dapat

ditangani sebelum pengamatan tersebut mempengaruhi model. Selain itu, metode

estimasi-CM ini dapat menangani pencilan pada variabel dependen dan variabel

independennya. Metode ini menggunakan nilai pembobot dengan fungsi Tukey’s

biweight untuk mendapatkan estimator.

1.2Perumusan Masalah

Berdasarkan latar belakang masalah dapat dirumuskan suatu permasalahan

yaitu bagaimana menyusun model regresi robust dengan metode estimasi-CM

(13)

commit to user

1.3Tujuan Penelitian

Tujuan dalam penelitian ini adalahmenyusun model regresi robust dengan

metode estimasi-CM produksi padi sawah di Jawa Tengah.

1.4Manfaat Penelitian

Manfaat yang diharapkan dari penelitian ini yakni dapat menambah

(14)

commit to user

4

BABII

LANDASAN TEORI

Ada dua subbab yang dibahas pada landasan teori ini, yaitu tinjauan

pustaka dan kerangka pemikiran. Tinjauan pustaka berisi pengertian-pengertian

yang berhubungan dengan pembahasan model estimasi regresi robust dengan

estimasi-CM. Kerangka pemikiran berisi langkah dan arah penelitian untuk

mencapai tujuan.

2.1Tinjauan Pustaka

Metode estimasi dalam regresi robust sebelum estimasi-CM yakni

estimasi-M, least trimmed square (LTS), dan least median square (LMS) (Chen,

2002). Metode estimasi-M pertama kali diperkenalkan oleh Huber pada tahun

1973. Estimasi-M merupakan metode regresi robust yang sering digunakan dan

dipandang baik untuk mengestimasi parameter yang disebabkan oleh -outlier

dan memiliki breakdown point 1/ . Metode estimasi LMS merupakan metode

high breakdown point yang diperkenalkan pertama kali oleh Rousseeuw pada

tahun 1984. LMS adalah modifikasi dari metode kuadrat terkecil biasa. Modifikasi

yang dilakukan dengan mengubah operator jumlah menjadi median. Parameter

dapat diestimasi dengan cara meminimumkan median dari kuadrat sisaan.Metode

estimasi LTS merupakan metode high breakdown point yang diperkenalkan

pertama kali oleh Rousseeuw pada tahun 1984. LTS merupakan suatu metode

pendugaan parameter regresi robust untuk meminimumkan jumlah kuadrat h

sisaan (fungsi objektif).

Kelemahan dari ketiga metode tersebut bahwa ketiganya hanya dapat

mengestimasi parameter yang disebabkan oleh pencilan pada variabel independen

dengan breakdown point lebih kecildari 0,5 sehingga dikembangkanlah

estimasi-CM.

Teori-teori yang relevan dan mendukung yang digunakan dalam penelitian

meliputi model regresi linear berganda, metode kuadrat terkecil, asumsi analisis

(15)

commit to user

2.1.1. Model Regresi Linear Berganda

Model regresi adalah model yang memberikan gambaran mengenai

hubungan antara variabel independen dengan variabel dependen (Sembiring,

2003). Bentuk umum dari model regresi linear berganda adalah

… , 1,2, … , 2.1 dengan

: harga variabel dependen pada pengamatan ke-i

, , , … , : parameter koefisien regresi

, , … , : variabel independen pada pengamatan ke-i

: sisaan ke-i dengan ~ 0, : banyaknya pengamatan

: banyaknya variabel independen.

2.1.2 Metode Kuadrat Terkecil (MKT)

Metode kuadrat terkecil pada prinsipnya adalah meminimumkan jumlah

kuadrat sisaan (JKS) yang dirumuskan sebagai

JKS ∑ ∑ … . 2.2

Cara untuk meminimumkan (2.2), dicari turunan JKS secara parsial terhadap

, 0, 1, 2, … , dan disamakan dengan nol sehingga diperoleh

(16)

commit to user

…

… . 2.4

Jika disusun dalam bentuk matriks maka persamaan (2.4) menjadi

2.5 dengan

,

1 1

1

, .

Penyelesaian persamaan (2.5) diperoleh dengan mengalikan kedua sisinya dengan

invers dari , sehingga estimator adalah

.

2.1.3 Pengujian Asumsi Analisis Regresi

Pengujian untuk mengetahui apakah model regresi memenuhi asumsi

regresi atau tidak sangat diperlukan pada model regresi. Uji asumsi tersebut ada

empat.

1. Normalitas

Analisis regresi linear mengasumsikan bahwa sisaan ( ) berdistribusi

normal. Menurut Gujarati (1978) pada regresi linear klasik diasumsikan bahwa

(17)

commit to user

Cara untuk menguji asumsi kenormalan adalah dengan uji

Kolmogorov-Smirnov. Uji ini didasarkan pada nilai D yang didefiniikan sebagai

max| | , 1, 2, . . , ,

dengan adalah fungsi distribusi frekuensi kumulatif relatif dari

distribusi teoritis di bawah , adalah distribusi frekuensi kumulatif

pengamatan sebanyak sampel, adalah sisaan berdistribusi normal.

Selanjutnya, nilai ini dibandingkan dengan nilai kritis dengan signifikansi

(tabel Kolmogorof-Smirnov). Jika nilai > atau , maka

asumsi kenormalan tidak dipenuhi.

2. Homoskedastisitas

Asumsi penting dalam analisis regresi adalah variasi sisaan ( ) pada

setiap variabel independen adalah homoskedastisitas. Asumsi ini dapat ditulis

sebagai

i =1, 2,…n.

Pengujian homoskedastisitas yaitu dengan melihat pola tebaran sisaan

( ) terhadap nilai estimasi . Jika tebaran sisaan bersifat acak (tidak

membentuk pola tertentu) maka dikatakan bahwa variansi sisaan homogen

(Draper dan Smith, 1998).

Gujarati (1978) menggambarkan beberapa plot sisa terhadap seperti

pada Gambar 2.1 dan Gambar 2.2. Jika hasil plot mirip pola pada Gambar 2.1,

maka asumsi homoskedastisitas dipenuhi karena titik-titik tersebar rata atau

tidak membentuk pola tertentu. Pada Gambar 2.2 (a) sampai (c) terlihat

membentuk pola tertentu, artinya terjadi heteroskedastisitas.

(18)

commit to user

(a) (b) (c)

Gambar 2.2. Pola-pola heteroskedastisitas

Menurut Gujarati (1978) cara untuk mendeteksi heteroskedastisitas

adalah dengan pengujian White. Hipotesis untuk pengujian White adalah

: homoskedastisitas, var ( , : heteroskedastisitas, var ( . Langkah-langkah pengujian White adalah

a. meregresikan dengan MKT, dan diperoleh

sisaan ̂,

b. meregresikan kembali berdasarkan hasil (a), ̂

,

c. menghitung ,

d. membandingkan nilai dan , dimana berdasarkan penduga pada

(b). jika , maka ditolak.

3. Bebas multikolinearitas

Menurut Montgomery dan Peck (1992), kolinearitas terjadi karena

terdapat korelasi yang cukup tinggi di antara variabel independen. Variance

inflation factor (VIF) merupakan salah satu cara untuk mengukur besar

kolinearitas dan didefinisikan sebagai 1 1

dengan 1,2, … , dan adalah banyaknya variabel independen.

adalah koefisien determinasi yang dihasilkan dari regresi variabel independen

dengan variabel independen lain . Nilai VIF menjadi semakin

(19)

commit to user

Jika nilai VIF lebih dari 10, multikolinearitas memberikan pengaruh yang

serius pada pendugaan metode kuadrat terkecil.

4. Bebas autokorelasi

Asumsi penting dari regresi linear adalah bahwa tidak ada autokorelasi

antara serangkaian pengamatan yang diurutkan menurut waktu. Kebebasan

antar sisaan dapat dideteksi secara grafis dan empiris. Pendeteksian

autokorelasi secara grafis yaitu dengan melihat pola tebaran sisaan terhadap

urutan waktu. Jika tebaran sisaan terhadap urutan waktu tidak membentuk

suatu pola tertentu atau bersifat acak maka dapat disimpulkan tidak ada

autokorelasi antar sisaan (Draper dan Smith, 1998).

Pengujian secara empiris dilakukan dengan menggunakan statistik uji

Durbin-Watson. Adapun rumusan matematis uji Durbin-Watson adalah:

∑ ∑

Kaidah keputusan dalam uji Durbin-Watson adalah sebagai berikut.

a. : 0 vs : 0. Menolak pada tingkat signifikansi jika

yang berarti terdapat autokorelasi positif.

b. : 0 vs : 0. Menolak pada tingkat signifikansi jika

4 yang berarti terdapat autokorelasi negatif.

c. : 0 vs : 0. Menolak pada tingkat signifikansi 2 jika

dan 4 yang berarti terdapat autokorelasi negatif ataupun

positif.

d. Untuk uji DW dapat dilihat pada Gambar 2.3.

H0 diterima

2 4 4 Gambar 2.3. Statistik d Durbin-Watson

(20)

commit to user

2.1.4 Pencilan (Outlier₎

Terkadang pada beberapa kasus ditemukan adanya data yang jauh dari

pola kumpulan data keseluruhan yang didefinisikan sebagai data pencilan.

Menurut Chen (2002) terdapat 3 kelas masalah yang dapat menggunakan teknik

regresi robust, yaitu

1. masalah dengan pencilan yang terdapat pada variabel (variabel dependen),

2. masalah dengan pencilan yang terdapat pada variabel (variabel independen),

dan

3. masalah dengan pencilan yang terdapat pada keduanya yaitu pada variabel

(variabel dependen) dan variabel (variabel independen).

Permasalahan yang muncul akibat adanya pencilan adalah

1. sisaan yang besar dari model yang terbentuk 0,

2. variansi dari data akan menjadi lebih besar, dan

3. estimasi interval akan memiliki rentang yang lebih besar.

Menurut Draper dan Smith (1998), metode yang digunakan dalam

mengidentifikasi pencilan terhadap variabel adalah studientized deleted residual

(TRES) yang didefinisikan sebagai

1 1

dengan adalah prediksi dari bila pengamatan ke- tidak diikutsertakan,

adalah jumlah variabel independen, adalah banyaknya pengamatan dan

adalah simpangan baku beda ( ), 1, 2, … , , , ,

′ ′ _, ₁_.

Hipotesis untuk menguji adanya pencilan adalah

: Pengamatan ke- bukan pencilan,

: Pengamatan ke- merupakan pencilan.

Kriteria pengujian yang melandasi keputusan adalah ditolak jika | |

(21)

commit to user

Metode yang digunakan dalam mengidentifikasi pencilan terhadap

variabel adalah nilai pengaruh (leverage point). Nilai Pengaruh ( ) dari

pengamatan , menunjukkan besarnya peranan terhadap dan

didefinisikan sebagai

′ ′ , 1, 2, … , ,

dengan = [ 1 … ] adalah vektor baris yang berisi nilai – nilai dari

variabel independen dalam pengamatan ke- . Nilai berada diantara 0 dan 1,

∑ dengan 1 dan ∑ / . Jika lebih besar dari 2 dengan

2 2 ∑ 2 ,

maka pengamatan ke- dikatakan pencilan terhadap .

2.1.5 Pengujian Kriteria Statistik

Gujarati (1978) menyatakan bahwa uji signifikansi merupakan prosedur

yang digunakan untuk menguji kebenaran atau kesalahan dari hasil hipotesis nol

dari sampel. Ide dasar yang melatarbelakangi pengujian signifikansi adalah uji

statistik (estimator) dari distribusi sampel dari suatu statistik di bawah hipotesis

nol. Keputusan untuk mengolah dibuat berdasarkan nilai uji statistik yang

diperoleh dari data yang ada.

Uji statistik terdiri dari pengujian koefisien regresi secara bersama-sama

(uji F), pengujian koefisien regresi parsial (uji t), dan pengujian koefisien

determinasi Goodness of fit test R .

1. Pengujian Signifikansi Simultan (Uji F)

Uji F dilakukan untuk mengetahui apakah variabel-variabel independen

secara keseluruhan signifikan secara statistik dalam mempengaruhi variabel

dependen. Jika nilai F lebih besar dari nilai F tabel, maka variabel-variabel

independen secara keseluruhan berpengaruh terhadap variabel dependen.

Hipotesis yang digunakan adalah

(22)

commit to user

Nilai hitung dirumuskan sebagai

/

/ 1

dimana

jumlah parameter yang diestimasi termasuk konstanta jumlah observasi

Kriteria pengujian yang digunakan pada tingkat signifikansi 5% dinyatakan

sebagai

a. diterima dan ditolak apabila F< F tabel atau p-value > yang

artinya variabel independen secara serentak atau bersama-sama tidak

mempengaruhi variabel dependen secara signifikan,

b. ditolak dan diterima apabila F hitung > F tabel atau p-value <

yang artinya variabel independen secara serentak dan bersama-sama

mempengaruhi variabel yang dijelaskan secara signifikan.

2. Pengujian Signifikansi Parameter Individual (Uji t)

Uji signifikansi parameter individual (uji t) dilakukan untuk melihat

signifikansi dari pengaruh variabel independen terhadap variabel dependen

secara individual dan menganggap variabel lain konstan. Hipotesis yang

digunakan adalah

: 0, 1, 2, … , ,

: 0, 1, 2, … , .

Nilai t hitung dapat divari dengan rumus

dimana

parameter yang diestimasi, nilai pada hipotesis,

standar error .

(23)

commit to user

a. jika t-hitung > t-tabel atau p-value < , maka ditolak. Artinya salah

satu variabel independen mempengaruhi variabel dependen secara

signifikan.

b. jika t-hitung < t-tabel atau p-value > , maka diterima. Artinya salah

satu variabel independen tidak mempengaruhi variabel dependen secara

signifikan.

3. Koefisien Determinasi

Gujarati (1978) menyatakan bahwa koefisien determinasi pada

intinya mengukur seberapa jauh kemampuan suatu model dalam menerangkan

variasi variabel dependen. Nilai adalah antara nol dan satu. Nilai yang

kecil (mendekati nol) berarti kemampuan satu variabel dalam menjelaskan

variabel dependen sangat terbatas. Nilai yang mendekati satu berarti

variabel-variabel independen memberikan hampir semua informasi dibutuhkan untuk

memprediksi variabel dependen.

Kelemahan mendasar penggunaan determinasi adalah bias terhadap

jumlah variabel independen yang dimasukkan ke dalam model. Setiap

penambahan satu variabel pasti meningkat tidak peduli apakah variabel

tersebut berpengaruh secara signifikan terhadap variabel dependen. Oleh

karena itu, banyak peneliti menganjurkan untuk menggunakan adjusted pada

saat mengevaluasi model regresi terbaik. Nilai koefisien determinasi diperoleh

dengan rumus

Asumsi regresi klasik sering tidak dipenuhi dalam memprediksi model

regresi, misal tidak dipenuhinya asumsi kenormalan atau asumsi

homoskedastisitas. Pelanggaran tersebut dapat dikarenakan adanya pencilan.

(24)

commit to user

sisaan tidak normal (Draper dan Smith, 1998). Analisis regresi robust merupakan

alternatif dari MKT. Seringkali transformasi tidak akan menghilangkan atau

melemahkan pengaruh dari pencilan yang akhirnya estimasi menjadi bias dan

estimasi parameter menjadi tidak valid. Oleh karena itu, sangat tepat jika

menggunakan metode regresi robust yang tahan terhadap pengaruh pencilan

sehingga menghasilkan estimasi yang lebih baik.

2.1.7 Estimasi-CM

Estimasi-CM diperkenalkan pertama kali oleh Mendes dan Tyler pada

Tahun 1995 yang memiliki breakdown point min , 1 atau 50% ketika

0,5 (Arslan et al., 2002). Breakdown point adalah ukuran umum proporsi dari pencilan yang dapat ditangani sebelum pengamatan tersebut mempengaruhi

model. Masalah estimasi-CM adalah menentukan global minimum dari fungsi

objektif

, log

dengan “ ” adalah rata-rata nilai aritmatik dan ∑ untuk

1, 2, … , dan 0, 1, … , , dimana , 0, dan subjek constraint

dan adalah jumlah pengamatan.

Dalam kasus ini, bersifat terbatas, fungsi tidak turun untuk 0

dengan 0 dan didefinisikan sebagai fungsi pembobot Tukey’s beweight

2 2 6 , | | 1 1

6, | | 1.

(25)

commit to user

′ 1 , | | 1

0, | | 1

dengan dan 4. Sisaan awal yang digunakan pada estimasi-CM adalah sisaan yang diperoleh dari MKT. Kemudian dengan mencari pembobot untuk melakukan iterasi dengan MKT terboboti secara iterasi yang disebut iteratively reweighted least square (IRLS) hingga mencapai konvergen. Adapun pembobot IRLS adalah

Berdasarkan tinjauan pustaka, dapat dibuat kerangka pemikiran bahwa

asumsi regresi klasik sering tidak dipenuhi dalam menentukan nilai parameter

regresi, misal tidak dipenuhinya asumsi kenormalan atau asumsi

homoskedastisitas. Hal ini terjadi karena pada suatu data terdapat observasi pada

variabel dependen maupun independen yang mengandung pencilan sehingga

mengakibatkan sisaan tidak berdistribusi normal atau sisaan tidak menyebar

secara acak. Oleh karena itu, dalam melakukan estimasi parameter tidak bisa

membuang data pencilan tersebut ataupun menggunakan metode yang biasa

digunakan yaitu MKT.

Penyelesaian masalah tersebut adalah harus digunakannya suatu metode

yang kekar terhadap adanya pencilan yaitu dengan menggunakan regresi robust.

Regresi robust yang digunakan adalah estimasi-CM yang meminimumkan fungsi

objektif dengan fungsi pembobot Tukey’s biweight. Fungsi pembobot ini

digunakan untuk mendapatkan nilai pembobot yang digunakan dalam perhitungan

MKT terbobot. Kemudian melakukan iterasi sampai diperoleh kekonvergenan

(26)

commit to user

16

BAB III

METODE PENELITIAN

Data yang digunakan dalam penelitian ini adalah produksi padi sawah

sebagai variabel dependen , sedangkan luas panen , produktivitas ,

dan luas pengairan teknis sebagai variabel independen. Data diambil

sebanyak 35 kabupaten dan kota di Jawa Tengah dari Buku Jawa Tengah Dalam

Angka 2011. Langkah-langkah yang digunakan dalam penelitian ini yaitu

1. eksplorasi data,

2. mendeteksi adanya pencilan,

3. menduga koefisien regresi dengan MKT yang akan digunakan sebagai

nilai awal untuk menentukan koefisien regresi robust debgan

estimasi-CM,

4. menguji asumsi klasik regresi linier,

5. menduga koefisien regresi dengan estimasi-CM dengan langkah

a. memperoleh nilai awal dan menghitung sisaan awal yang

diperoleh dari MKT pada langkah 3 kemudian dihitung untuk

mendapatkan nilai ,

b. menghitung nilai pembobot ,

c. menggunakan MKT terbobot untuk mendapatkan penduga kuadrat

terkecil terbobot ′ ′ ,

d. menjadikan sisaan langkah (c) sebagai sisaan awal langkah (b)

sehingga diperoleh nilai dan pembobot yang baru, dan

e. melakukan iterasi hingga konvergen dan diperoleh , , … ,

yang merupakan estimasi-CM,

(27)

commit to user

17

BAB IV

HASIL DAN PEMBAHASAN

4.1Data

Bab ini menyajikan hasil analisis data sekunder produksi padi sawah di

Jawa Tengah Tahun 2010 yang diperoleh dari Badan Pusat Statistik. Data tersebut

meliputi produksi padi sawah sebagai variabel dependen , luas panen ,

produktivitas padi sawah dan luas pengairan teknis sebagai variabel

independen.

Adapun plot tiap variabel independen dengan variabel dependen disajikan

pada gambar –gambar berikut untuk mengetahui hubungan linier antara

masing-masing variabel independen dan variabel dependen.

140000

(28)

commit to user

Gambar 4.3. Plot antara produksi padi sawah dan luas pengairan

teknis

Gambar 4.1 menunjukkan bahwa titik-titik mengikuti pola garis lurus,

yang artinya luas panen dan produksi padi sawah memiliki hubungan linier,

sedangkan pada Gambar 4.2 dan 4.3 titik-titik juga mengikuti pola garis lurus atau

memiliki hubungan linier, tetapi titik-titiknya lebih menyebar sehingga diduga

data produksi padi sawah mengandung pencilan.

Setelah menyelidiki hubungan kelinieran antar variabel, dilanjutkan

mendeteksi adanya pencilan.

4.2Deteksi Pencilan

Berdasar statistik uji untuk mengetahui pencilan terhadap yaitu TRES

dengan menarik kesimpulan menolak apabila nilai TRES > maka

diperoleh kesimpulan seperti pada Tabel 4.1 bahwa pengamatan ke 15, 27, 31 dan

33 merupakan pencilan terhadap variabel .

Berdasar statistik uji untuk mengetahui pencilan terhadap yaitu hii yang

dengan menarik kesimpulan menolak apabila nilai > 2 / maka diperoleh

kesimpulan seperti pada Tabel 4.1 bahwa pengamatan ke 1, 28 dan 33 merupakan

pencilan terhadap variabel . Nilai TRES dan secara lengkap ada pada

(29)

commit to user

Tabel 4.1. Hasil uji TRES dan

Pengamatan TRES ttabel 2k /n

1 0.260026 > 0,2286

15 3.50196 > 2,042

27 -2.15301 < -2,042

28 0.259067 > 0,2286

31 2.18431 > 2,042

33 3.66633 > 2,042 0.235876 > 0,2286

4.3Model Kuadrat Terkecil

Koefisien regresi dari metode kuadrat terkecil digunakan pada penelitian

ini sebagai nilai awal yang akan digunakan untuk menduga koefisien regresi

dengan estimasi-CM. Model regresi dengan metode kuadrat terkecil adalah

239519 5,73 4285 0,216 , 1, 2, … , 35 (4.1)

dengan

: estimasi produksi padi sawah (ton) di kabupaten ke-i

: luas panen (ha) di kabupaten ke-i

: produktivitas padi sawah (kwintal/ha) di kabupaten ke-i

: luas pengairan teknis (ha) di kabupaten ke-i.

Adapun langkah-langkah dan hasil MKT terdapat pada Lampiran 2.

Selanjutnya dilakukan uji asumsi klasik untuk melihat apakah model yang diteliti

memenuhi asumsi klasik atau tidak. Hasil uji asumsi klasik ada empat.

4.3.1 Uji Asumsi Normalitas

Pengujian kenormalan digunakan untuk mengetahui apakah sisaan

berdistribusi normal atau tidak. Plot kenormalan untuk sisaan dari model produksi

padi sawah disajikan pada Gambar 4.4.

Gambar 4.4 menunjukkan pola penyebaran sisaan tidak mengikuti pola

garis lurus, ini berarti asumsi kenormalan pada sisaan tidak dipenuhi. Pengujian

kenormalan dapat juga digunakan uji Kolmogorof-Smirnov sebagai berikut.

(30)

commit to user

: sisaan tidak berdistribusi normal. 2. Dipilih α 0,05.

3. Daerah kritis: H ditolak jika p-value 0,05.

4. Statistik uji : hasil menunjukkan pada Gambar 4.4 bahwa p-value < 0,010.

5. Kesimpulan : karena p-value 0,01 0,05, maka ditolak artinya

sisaan tidak berdistribusi normal.

40000

Gambar 4.4. Plot probabilitas sisaan

4.3.2 Uji Asumsi Homoskedastisitas

Pendeteksian homoskedastisitas dapat dilakukan dengan melihat pola plot.

Plot kesamaan variansi untuk data sisaan pada model produksi padi sawah di Jawa

Tengah disajikan pada gambar 4.5.

Gambar 4.5 menunjukkan bahwa variansi sisaan dari satu pengamatan ke

pengamatan yang lain tidak berpola acak yang mengindikasikan bahwa variansi

sisaan tidak konstan sehingga dapat disimpulkan asumsi homoskedastisitas tidak

dipenuhi. Selain itu, dapat dilakukan uji White. Jika nilai , maka sisaan

mengandung masalah heteroskedastisitas. Hasil pengujian menunjukkan bahwa

35 0,867 30,345 dan nilai _{, ;} 16,92. Karena nilai _{, ;} ,

maka disimpulkan bahwa asumsi homoskedastisitas tidak dipenuhi (Lampiran 3).

(31)

commit to user

Gambar 4.5. Plot kuadrat sisaan dengan estimasi

4.3.3 Uji Asumsi Bebas Autokorelasi

Autokorelasi diartikan sebagai korelasi antara anggota serangkaian

observasi yang diurutkan menurut waktu. Uji bebas autokorelasi dapat dideteksi

dengan rumus Durbin Watson.

Uji Durbin Watson (Uji DW)

1. : 0, artinya tidak ada autokorelasi, : 0, artinya ada autokorelasi.

2. Dipilih 0,05. Gambar 4.6 Uji DurbinWatson

4. Statistik uji: hasil menunjukkan bahwa nilai 1,98150 .

(32)

commit to user

5. Kesimpulan : berdasarkan hasil diperoleh nilai 1.98150 berada

pada posisi 1,65 maka tidak ditolak. Artinya, asumsi

bebas autokorelasi pada model produksi padi sawah di Jawa Tengah Tahun

2010 dipenuhi.

4.3.4 Uji Asumsi Bebas Multikolinearitas

Pengujian multikolinearitas bertujuan untuk mengetahui ada tidaknya

hubungan linear antara variabel independen. Pendeteksian adanya

mutikolinearitas dapat dilakukan dengan melihat nilai VIF. Hasil uji

multikolinearitas dapat dilihat pada Tabel 4.2.

Tabel 4.2. Hasil uji multikolinearitas

Variabel independen VIF_Keterangan

(Luas panen) 3.330 < 10 Tidak terdapat multikolinearitas

(Produktivitas padi sawah) 1.153 < 10 Tidak terdapat multikolinearitas

(Luas pengairan teknis) 3.145 < 10 Tidak terdapat multikolinearitas

Tabel 4.2 menunjukan bahwa nilai VIF untuk semua variabel independen,

baik variabel luas panen , produktivitas padi sawah , dan luas pengairan

teknis adalah lebih kecil dari 10, sehingga dapat disimpulkan bahwa asumsi

bebas multikolinearitas dipenuhi.

Berdasarkan pengujian asumsi klasik pada model produksi padi sawah di

Jawa Tengah tahun 2010 menggunakan analisis regresi diperoleh bahwa asumsi

normalitas dan asumsi homoskedastisitas telah dilanggar sehingga diperlukan

penanganan terhadap pelanggaran asumsi-asumsi tersebut agar diperoleh model

regresi yang tepat di antaranya dengan menggunakan regresi robust estimasi-CM.

4.4Model Regresi Robust_{dengan Estimasi-}CM

Proses perhitungan estimasi-CM secara iterasi diawali dengan menentukan

estimasi koefisien regresi yang diperoleh dari MKT yaitu =

( 239519: 5,73 ; 4285; 0,216) kemudian berdasarkan langkah-langkah menduga

(33)

commit to user

dan

. Proses iterasi menggunakan MKT terboboti dilanjutkan dengan

menghitung nilai dan menghitung pembobot yang baru dan dilakukan

pendugaan parameter secara berulang-ulang sampai konvergen. Koefisien regresi

tiap iterasi ditunjukkan pada Tabel 4.3.

Tabel 4.3. Nilai tiap iterasi pada estimasi-CM dengan empat koefisien

iterasi

Tabel 4.3 menunjukkan kekonvergenan koefisien regresi . Koefisien

konvergen ke nilai -285356, koefisien konvergen ke nilai 5,72, koefisien

regresi konvergen ke nilai 5047, dan koefisien konvergen ke nilai -0,07.

Berdasarkan hasil yang diperoleh dapat ditulis model regresi robust dengan

(34)

commit to user

R2adjusted = 99,8% dan s = 8829,31. Interpretasi model yaitu sebesar 99,8%

produksi padi sawah dapat diterangkan oleh variabel luas panen, produktivitas

padi sawah, dan luas pengairan teknis, sedangkan sebesar 0,2 % diterangkan oleh

variabel yang lain. Setiap peningkatan satu ha luas panen dan satu kwintal/ha

produktivitas padi sawah di kabupaten ke-i akan meningkatkan produksi padi

sawah di Jawa tengah di kabupaten ke-i masing-masing sebesar 5,72 ton dan 5047

ton, setiap peningkatan satu ha luas pengairan teknis di kabupaten ke-i akan

menurunkan produksi padi sawah di kabupaten ke-i sebesar 0,070 ton.

Uji serentak digunakan untuk mengetahui apakah variabel-variabel

independen secara keseluruhan signifikan dalam mempengaruhi variabel

independen.

1. 0, 1,2,3

(luas panen, produktivitas padi sawah atau luas pengairan teknis tidak

berpengaruh secara signifikan terhadap produksi padi sawah).

0, untuk suatu 1,2,3

(paling tidak ada salah satu di antara luas panen, produktivitas padi sawah atau

luas pengairan teknis berpengaruh secara signifikan terhadap produksi padi

sawah).

2. Dipilih 0,05.

3. Daerah kritis: ditolak jika 0,05.

4. Statistik uji : hasil menunjukkan bahwa nilai 0,000.

5. Kesimpulan : karena 0,000 0,05 maka ditolak.

Artinya, paling tidak ada salah satu di antara luas panen, produktivitas padi

sawah atau luas pengairan teknis berpengaruh secara signifikan terhadap

produksi padi sawah.

Selanjutnya dilakukan uji parsial untuk mengetahui signifikansi atau

pengaruh masing-masing variabel independen terhadap model regresi yang

(35)

commit to user

Tabel 4.4. Hasil uji t pada estimasi-CM untuk tiga variabel independen

Variabel Kesimpulan

Luas panen 0,000 0,05 Signifikan Produktivitas padi sawah 0,000 0,05 Signifikan Luas pengairan teknis 0,881 0,05 Tidak signifikan

Tabel 4.4 menunjukkan bahwa luas panen dan produktivitas padi sawah

adalah signifikan dalam mempengaruhi jumlah produksi padi sawah di Jawa

Tengah, sedangkan luas pengairan teknis tidak berpengaruh signifikan.

Karena variabel luas pengairan teknis tidak berpengaruh signifikan

terhadap produksi padi sawah, maka variabel tersebut dikeluarkan dari model,

kemudian diregresikan kembali dengan estimasi-CM antara variabel produksi padi

sawah dengan luas panen dan produktivitas dengan regresi robust dengan metode

estimasi-CM. Koefisien regresi konvergen ditunjukkan pada Tabel 4.5.

Tabel 4.5 menunjukkan koefisien regresi telah konvergen. Koefisien

konvergen ke nilai -283520, koefisien konvergen ke nilai 5,7, dan koefisien

konvergen ke nilai 5016, sehingga diperoleh model regresi robust dengan

estimasi-CM yaitu 283520 5,70 5016 dengan adjusted= 99,8%

dan s = 8684,51. Interpretasi model yaitu sebesar 99,8% produksi padi sawah

dapat diterangkan oleh variabel luas panen dan produktivitas, sedangkan sebesar

0,2% diterangkan oleh variabel lain. Setiap peningkatan satu ha luas panen di

kabupaten ke-i dan satu kwintal/ha produktivitas di kabupaten ke-i akan

meningkatkan produksi padi sawah di Jawa Tengah pada kabupaten ke-i

masing-masing sebesar 5,70 ton dan 5016 ton.

Kemudian untuk mengetahui apakah variabel-variabel independen

berpengaruh terhadap variabel dependen dilakukan uji serentak pada model

regresi robust estimasi-CM.

1. 0, 1,2

(luas panen atau produktivitas padi sawah tidak berpengaruh secara signifikan

terhadap produksi padi sawah).

0, untuk suatu 1,2

(paling tidak ada salah satu di antara luas panen atau produktivitas padi sawah

(36)

commit to user

2. Dipilih 0,05.

3. Daerah kritis: ditolak jika 0,05.

4. Statistik uji : hasil menunjukkan bahwa nilai 0,000.

5. Kesimpulan : karena 0,000 0,05 maka ditolak.

Artinya paling tidak ada salah satu luas panen atau produktivitas padi sawah

yang berpengaruh secara signifikan terhadap produksi padi sawah.

Tabel 4.5. Nilai tipa iterasi pada estimasi-CM dengan tiga koefisien

iterasi

Selanjutnya dilakukan uji parsial untuk mengetahui signifikansi atau

pengaruh masing-masing variabel independen terhadap model regresi yang

(37)

commit to user

Tabel 4.6. Hasil uji t pada estimasi-CM untuk dua variabel independen

Variabel Kesimpulan

Luas panen 0,000 0,05 Signifikan Produktivitas padi sawah 0,000 0,05 Signifikan

Tabel 4.6. menunjukkan bahwa luas panen dan produktivitas padi sawah

mempengaruhi jumlah produksi padi sawah di Jawa Tengah.

Berdasarkan analisis di atas, berarti upaya pemerintah dalam meningkatkan

produksi padi sawah di jawa Tengah adalah dengan menambah luas panen yaitu

dengan penambahan luas lahan sawah. Selain itu, pemerintah juga dapat

meningkatkan produktivitas padi sawah, misalnya dengan cara penggunaan

(38)

commit to user

28

BAB V PENUTUP

5.1 Kesimpulan

Berdasarkan hasil pembahasan, dapat ditarik dua kesimpulan.

1. Model regresi robust dengan metode estimasi-CM dalam memprediksi

produksi padi sawah di Jawa Tengah adalah

283520 5,70 5016 , 1, 2, … , 35

dengan adjusted= 99,8%. Interpretasi model yaitu sebesar 99,8% produksi

padi sawah dapat diterangkan oleh variabel luas panen dan produktivitas,

sedangkan sebesar 0,2% diterangkan oleh variabel lain. Setiap peningkatan satu

ha luas panen di kabupaten ke-i dan satu kwintal/ha produktivitas di kabupaten

ke-i akan meningkatkan produksi padi sawah di kabupaten ke-i di Jawa Tengah

masing-masing sebesar 5,70 ton dan 5016 ton.

2. Variabel independen yang berpengaruh dalam model regresi robust

menggunakan estimasi-CM dalam memprediksi produksi padi sawah di Jawa

Tengah adalah variabel luas panen dan produktivitas. Sedangkan variabel luas

pengairan teknis tidak berpengaruh signifikan.

5.2 Saran

Bagi peneliti yang tertarik dengan estimasi-CM, dapat melanjutkan