1
TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH
May Cristanti, Yuliana Susanti, dan Sugiyanto Program Studi Matematika FMIPA UNS
ABSTRAK. Metode Kuadrat Terkecil (MKT) merupakan salah satu metode untuk mengestimasi parameter dalam model regresi. Penggunaan metode ini harus memenuhi asumsi-asumsi yang ada. Terdapatnya pencilan menyebabkan salah satu asumsi normalitas tidak terpenuhi sehingga diperlukan suatu metode lain dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data, metode tersebut adalah metode regresi robust. Estimasi parameter regresi dalam metode regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS). Tujuan dari penelitian ini untuk menentukan efisiensi estimasi S terhadap estimasi LTS pada data produksi padi di Provinsi Jawa Tengah tahun 2015 sebagai indikator untuk menentukan model regresi yang lebih baik. Hasil dari penelitian menunjukkan bahwa estimasi S lebih efisien dibandingkan dengan estimasi LTS karena nilai efisiensi
, ∗ = 1,85647 > 1.
Kata kunci: regresi robust, estimasi S, estimasi LTS, efisiensi.
1.
P
ENDAHULUAN2
Analisis regresi linear merupakan suatu analisis yang mempelajari hubungan antara variabel dependen dengan variabel independen. Metode yang digunakan untuk mengestimasi parameter model regresi dengan menggunakan Metode Kuadrat Terkecil (MKT). Pada suatu data dimungkinkan terdapatnya pencilan, yakni suatu data pengamatan yang tidak mengikuti pola sebagian besar data. Terdapatnya pencilan menyebabkan MKT tidak akurat untuk mengestimasi parameter. Oleh karena itu, diperlukan suatu metode regresi yang bersifat robust dimana nilai estimasinya tidak banyak dipengaruhi oleh pencilan dalam data.
Regresi robust merupakan regresi yang digunakan ketika suatu data pengamatan terdapat pencilan. Data pencilan seringkali mempunyai pengaruh terhadap estimasi parameter sehingga data tersebut tidak dihilangkan begitu saja. Terdapat beberapa estimasi pada regresi robust antara lain estimasi Scale (S) dan estimasi Least Trimmed Square (LTS), kedua estimasi tersebut diaplikasikan pada data produksi padi di Provinsi Jawa Tengah untuk mengetahui efisiensi yang digunakan sebagai indikator untuk menentukan model mana yang lebih baik.
2. REGRESI ROBUST
Model regresi robust diperkenalkan oleh Andrews pada tahun 1972. Menurut Drapper [4] regresi robust ditujukan untuk mengatasi masalah pencilan yang dapat menyebabkan data tidak normal sehingga nilai estimasi dari suatu parameter tidak tepat. Pada penelitian ini digunakan regresi robust estimasi S dan estimasi LTS.
a. Estimasi Scale (S)
Estimasi S diperkenalkan oleh Rousseeuw dan Yohai pada tahun 1984. Estimasi S didefinisikan
= mi n ( , ,…, )
dengan adalah estimator koefisien regresi, adalah estimator skala
robust, dan , , …, merupakan sisaan.
Estimasi S dapat dilakukan dengan langkah-langkah berikut.
1. Menghitung estimasi parameter dengan menggunakan MKT. 2. Menghitung nilai sisaan = − .
3
5. Menghitung nilai fungsi pembobot .
=
6. Menghitung nilai estimasi dengan metode Iteratively Reweighted
Least Square (IRLS) dengan pembobot .
7. Mengulangi langkah 2 sampai dengan 6 sehingga diperoleh nilai yang konvergen.
8. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model.
b. Estimasi Least Trimmed Square (LTS)
Estimasi Least Trimmed Square (LTS) adalah salah satu metode estimasi parameter regresi robust yang kekar terhadap pencilan. Metode LTS mengestimasi koefisien regresi dengan meminimumkan jumlah kuadrat sisaan dari himpunan bagian data berukuran ℎ pengamatan dengan kuadrat sisaan terkecil. Estimasi LTS didefinisikan sebagai
= ( ) = ( ) − ( )
dengan ℎ = [ / 2] + [( + 1) / 2], adalah banyaknya pengamatan, adalah banyaknya parameter, ( ) adalah kuadrat sisaan yang diurutkan
dari yang terkecil ke yang terbesar.
Estimasi LTS dapat dilakukan dengan langkah-langkah sebagai berikut. 1. Mengestimasi koefisien regresi dengan Metode Kuadrat Terkecil
4
2. Menghitung nilai sisaan = − .
3. Menghitung kuadrat sisaan dan menghitung nilai ℎ. 4. Menghitung nilai estimasi .
5. Melakukan estimasi parameter ( ) dari ℎ ( ) pengamatan.
6. Menentukan kuadrat sisaan dari ℎ ( ) pengamatan.
7. Menghitung nilai estimasi ( ).
8. Melakukan tahap 5 sampai dengan 7 hingga diperoleh nilai yang konvergen.
9. Menguji hipotesis untuk mengetahui apakah variabel independen mempunyai pengaruh signifikan terhadap model.
3. M
ETODE PENELITIANPenelitian ini merupakan penelitian terapan yaitu penerapan untuk menentukan efisiensi estimasi S terhadap estimasi LTS. Data yang digunakan pada penelitian ini adalah data produksi padi di Provinsi Jawa Tengah tahun 2015, merupakan data sekunder yang diambil dari Dinas Pertanian Tanaman Pangan dan Holtikultura. Data tersebut terdiri atas 4 variabel yakni jumlah produksi padi sebagai variabel dependen , luas lahan panen sebagai variabel independen , curah hujan sebagai variabel independen , dan jumlah pupuk sebagai variabel independen .
5
4. H
ASIL DAN PEMBAHASAN4.1. Metode Kuadrat Terkecil. Model regresi linear berganda dengan
menggunakan metode kuadrat terkecil pada data produksi padi di Provinsi Jawa Tengah tahun 2015 diperoleh hasil = −9154,09 + 6,4046 + 0,05 − 39,273 dengan adalah produksi padi, adalah luas lahan panen, adalah curah hujan, dan adalah jumlah pupuk.
4.2. Uji Asumsi Klasik. Pada model regresi, diperlukan uji untuk mengetahui
apakah model regresi memenuhi asumsi regresi atau tidak. Uji asumsi klasik yang digunakan dalam model regresi adalah uji normalitas, uji non autokorelasi, uji non heteroskedastisitas, dan uji non multikolinearitas.
1. Uji Asumsi Normalitas. Pengujian asumsi ini menggunakan uji Anderson
Darling. Hipotesis adalah sisaan berdistribusi normal dan adalah
sisaan tidak berdistribusi normal, dengan keputusan uji ditolak apabila > . , = 0,739642. Hasil pengujian diperoleh sebesar
1.704292 maka dapat disimpulkan bahwa ditolak yang berarti sisaan tidak berdistribusi normal.
2. Uji Asumsi Homoskedastisitas. Pengujian ini dilakukan menggunakan uji
korelasi rank Spearman. Hipotesis : variansi sisaan homogen dan : variansi sisaan tidak homogen, dengan keputusan uji ditolak apabila
> = 2,048. Hasil pengujian diperoleh bahwa luas lahan
panen sebesar 1,038 dan hasil curah hujan sebesar 1,756 serta hasil jumlah pupuk diperoleh sebesar 1,204. Karena < = 2,048 maka dapat disimpulkan bahwa variansi sisaan homogen.
3. Uji Asumsi Bebas Autokorelasi. Pengujian asumsi ini menggunakan uji
Durbin-Watson. Hipotesis : tidak terdapat autokorelasi dan : terdapat
6
4. Uji Bebas Multikolinearitas. Pengujian ini menggunakan nilai Variance
Inflation Factor (VIF). Hipotesis : tidak terdapat multikolinearitas dan :
terdapat multikolinearitas, dengan keputusan uji ditolak apabila nilai VIF<10. Hasil pengujian diperoleh nilai VIF luas lahan sebesar 2.554, VIF curah hujan sebesar 1.084, dan VIF jumlah pupuk sebesar 2.662. Karena nilai VIF<10, ditolak sehingga dapat disimpulkan bahwa tidak terdapat multikolinearitas.
4.3.
I
dentifikasi Pencilan. Identifikasi pencilan terhadap menggunakanStudentized Deleted Residuals (TRES). Hipotesis : tidak terdapat pencilan dan :
terdapat pencilan, dengan keputusan uji ditolak apabila nilai | | > ( , ; ) = 2.056. Hasil pengujian diperoleh bahwa pada data ke-16 , data ke-26,
dan data ke-27 merupakan pencilan terhadap . Identifikasi pencilan terhadap menggunakan nilai ℎ dengan keputusan uji ditolak apabila nilai ℎ > = 0,267. Hasil perhitungan diperoleh hasil bahwa pada data 1, data 15, data ke-17, dan data ke-19 merupakan data pencilan.
4.4. Model Regresi Robust Estimasi Scale (S). Model regresi dengan estimasi S
adalah = 3110,30 + 6,6366 −41,314 −0,2874 dengan interpretasi bahwa setiap kenaikan satu hektar luas lahan panen akan menaikkan produksi padi sebesar 6,6366 ton, setiap kenaikan satu milimeter kubik curah hujan akan menurunkan produksi padi sebesar 41,314 ton, dan setiap kenaikan satu ton jumlah pupuk akan menurunkan produksi padi sebesar 0,2874 ton.
4.5. Model Regresi Robust Estimasi Least Trimmed Square (LTS). Model
7
4.6. Uji simultan F dan uji parsial t. Uji hipotesis simultan digunakan untuk
mengetahui apakah ada variabel independen mempunyai pengaruh signifikan terhadap model. Hipotesis : = = = 0 (semua variabel independen tidak berpengaruh secara signifikan terhadap model) dan : ≠ ≠ ≠0 (paling tidak ada satu variabel independen yang berpengaruh signifikan terhadap model). Keputusan uji ditolak apabila > ( . , , ) = 2.975. Hasil pengujian
diperoleh untuk model estimasi S sebesar 1965.01 sedangkan untuk
model estimasi LTS sebesar 9681.07, karena nilai > ( . , , ) = 2.975
maka ditolak yang berarti bahwa paling tidak ada satu variabel independen yang berpengaruh signifikan terhadap model. Selanjutnya akan diuji parsial untuk mengetahui variabel independen yang mempunyai pengaruh signifikan terhadap produksi padi. Hipotesis : = 0, = 1,2,3 (variabel independen tidak berpengaruh secara signifikan terhadap model) dan : ≠0, = 1,2,3 (variabel independen berpengaruh signifikan terhadap model). Kriteria pengambilan keputusan ditolak apabila nilai > ( . ; ) = 4.3027. Hasil pengujian
ditunjukkan pada Tabel 1
Tabel 1 Hasil uji t pada parameter regresi robust estimasi S dan estimasi LTS
Estimasi Variabel Kesimpulan
Estimasi S
Luas lahan panen 49.84 Signifikan
Curah hujan 0.77 Tidak Signifikan
Jumlah pupuk 0.96 Tidak Signifikan
Estimasi LTS
Luas lahan panen 97.93 Signifikan
Curah hujan 2.03 Tidak Signifikan
Jumlah pupuk 1.36 Tidak Signifikan
Berdasarkan Tabel 1 diperoleh kesimpulan bahwa variabel luas lahan panen ( ) berpengaruh secara signifikan terhadap model sedangkan variabel curah hujan ( ) dan jumlah pupuk ( ) tidak berpengaruh secara signifikan terhadap model baik pada estimasi S maupun pada estimasi LTS.
4.7. Efisiensi. Efisiensi suatu estimasi diperlukan untuk mengetahui bahwa
8
estimasi LTS yakni sebesar 78935654.7944, sehingga efisiensi dapat diperoleh sebesar , ∗ = 1,85647. Dengan demikian produksi padi di Provinsi Jawa Tengah tahun 2015, estimasi S lebih efisien dibanding estimasi LTS. Hal ini dapat dilihat dari nilai , ∗ = 1,85647 > 1.
5.
K
ESIMPULANEfisiensi estimasi S terhadap estimasi LTS pada produksi padi di Provinsi Jawa Tengah tahun 2015 adalah 1,85647. Hasil ini menjelaskan bahwa estimasi S lebih efisien dibandingkan estimasi LTS karena nilai , ∗ = 1,85647 > 1. Dengan demikian model yang tepat digunakan untuk produksi padi di Jawa Tengah tahun 2015 adalah model estimasi S, yaitu
= 3110,30 + 6,6366 −41,314 −0,2874 .
D
AFTAR PUSTAKA[1] Badan Pusat Statistik. https://www.jateng.bps.go.id/ (diakses tanggal 20 Juli 2016)
[2] Balai Pengkajian Teknologi Pertanian Jawa Tengah http://jateng.litbang.pertanian.go.id/ind/images/artikel/Kem.Pangan4 (diakses tanggal 9 Oktober 2016)
[3] Dinas Pertanian Tanaman Pangan dan Holtikultura. http://dinpertantph.jatengprov.go.id/data/ (diakses tanggal 8 Agustus 2016) [4] Drapper, N.R dan Smith, H., 1998, Applied Regression Analysis, John
Wiley and Sons, Inc., New York.
[5] Montgomery, D.C. and Peck, E.A, 2006, Introduction to Linier Regression Analysis, John Wiley and Sons, New York.
[6] Musafirah, 2012, Perbandingan Metode Robust Least Trimmed Squares Dengan Metode Scale Dalam Mengestimasi Parameter Regresi Linear Untuk Data Yang Mengandung Pencilan, Universitas Hasanudin, Makassar.
[7] Wijayanti, Lisa Unik, 2015, Analisis Perbandingan Regresi Robust Estimasi-M Huber dan Estimasi-S Dalam Mengatasi Outlier. Universitas Negeri Yogyakarta, Yogyakarta.