• Tidak ada hasil yang ditemukan

BAGGING MARS PADA PEMODELAN ANOMALI LUAS PANEN PADI DI KABUPATEN NGAWI. Abstrak

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAGGING MARS PADA PEMODELAN ANOMALI LUAS PANEN PADI DI KABUPATEN NGAWI. Abstrak"

Copied!
9
0
0

Teks penuh

(1)

1

BAGGING MARS PADA PEMODELAN ANOMALI LUAS PANEN PADI

DI KABUPATEN NGAWI

Naily Kamaliah (1), Bambang Widjanarko Otok(2), Sutikno (3) (1)

Mahasiswa S2 Jurusan Statistika FMIPA ITS Surabaya

(2,3)

Dosen Jurusan Statistika FMIPA ITS Surabaya

e-mail:(1)naily_k@yahoo.com, (2) bambang_wo@statistika.its.ac.id, (3) sutikno@statistika.its.ac.id

Abstrak

Variasi iklim musiman merupakan salah satu penyebab utama beragamnya produksi tanaman pangan di Indonesia. Kemarau panjang dan kekeringan menyebabkan gagal panen dan kekurangan pangan sehingga dapat mempengaruhi produksi pertanian dan ketahanan pangan. Indikatornya terjadi penurunan luas tanam, luas panen dan produksi merosot tajam saat terjadi penyimpangan iklim. Besarnya dampak yang diakibatkan oleh adanya penyimpangan iklim menyebabkan diperlukan suatu model yang menghubungkan antara luas panen dengan indikator anomali iklim sehingga dapat dilakukan perencanaan yang tepat serta langkah-langkah antisipasi lebih dini guna menghindari risiko gagal panen. Dalam penelitian ini akan dilakukan pemodelan Sea Surface Temperature (SST Nino 3.4) dan Dipole Mode Index terhadap anomali luas panen di Kabupaten Ngawi pada tiap subround, dengan menggunakan bagging MARS. Adanya keterkaitan antar variabel prediktor menyebabkan diperlukannya penggunaan analisis faktor untuk mendapatkan variabel baru yang tidak saling berkorelasi. Hasil dari penggunaan metode bagging MARS dalam pemodelan anomali luas panen dan faktor-faktor yang berpengaruh memberikan hasil yang sangat baik yakni lebih dari 90% variasi anomali luas panen pada setiap subgroudnya dapat diterangkan menggunakan bagging MARS. Sehingga metode ini layak untuk digunakan dalam peramalan selanjutnya.

Kata kunci: Bagging MARS, Anomali Luas Panen Padi 1. Pendahuluan

Penyediaan pangan, terutama beras, dalam jumlah yang cukup dan harga terjangkau tetap menjadi prioritas utama pembangunan nasional. Selain merupakan makanan pokok untuk lebih dari 95% rakyat Indonesia, padi juga telah menyediakan lapangan kerja bagi sekitar 20 juta rumah tangga petani di pedesaan (Wiguna, 2009). Secara umum Indonesia mempunyai dua musim yaitu penghujan dan kemarau. Karena wilayah Indonesia masuk ke dalam pengaruh kawasan laut pasifik sehingga menjadi pertemuan sirkulasi meridional dan sirkulasi zonal, kondisi ini sangat mempengaruhi keragaman iklim Indonesia. Produksi pertanian, khususnya padi, di Indonesia sangat rentan terhadap perubahan iklim. Variasi iklim musiman merupakan penyebab utama menurunnya produksi tanaman pangan di Indonesia. Kemarau panjang dan kekeringan menyebabkan gagal panen dan kekurangan pangan sehingga dapat mempengaruhi produksi pertanian dan ketahanan pangan. Indikatornya terjadi penurunan luas tanam, luas panen dan produksi merosot tajam saat terjadi penyimpangan iklim

Besarnya dampak yang diakibatkan oleh adanya penyimpangan iklim menyebabkan diperlukan suatu model yang menghubungkan antara luas panen dengan indikator anomali iklim sehingga dapat dilakukan perencanaan yang tepat serta langkah-langkah antisipasi lebih dini guna menghindari risiko gagal panen. Berbagai model produksi padi telah dikembangkan di Indonesia, seperti model dengan menggunakan peubah indikator ENSO (Boer 2000; Naylor et al. 2001, 2002, 2007; Falcon et al. 2004). Model ini menghasilkan tingkat ketepatan yang tinggi

Seminar Nasional Statistika IX

(2)

2

pada wilayah yang dipengaruhi oleh fenomena ENSO, khususnya wilayah dengan tipe hujan monsun. Untuk wilayah dengan tipe hujan ekuatorial pengaruh ENSO kecil dan tidak jelas untuk wilayah tipe hujan lokal (Boer 2000). Disamping itu model dengan menggunakan indikator gabungan SOI dan DMI (Boer et al. 2004), SST Nino 3.4 dan DMI (Surmaini 2006; Arrigo dan Wilson 2008). Selanjutnya, Beberapa model tanaman pangan (terutama padi) dengan menggunakan peubah penjelas SST Nino 3.4 (diantaranya: Boer 2000; Naylor et al. 2001, 2002, 2007; Falcon et al 2004), SOI dan DMI (Surmaini 2006; Arrigo dan Wilson, 2008).

MARS merupakan pendekatan untuk regresi multivariate nonparametrik yang dikembangkan oleh Friedman (1990), untuk model regresi nonlinier dan didasarkan pada prosedur recursive partitioning regression (RPR) dengan menggunakan fungsi splines untuk menduga model. Pertimbangan penggunaan metode MARS untuk pemodelan ini, didasarkan pada ketidakjelasan pola hubungan antara variabel respon dan variabel prediktor. MARS merupakan metode yang tidak tergantung pada asumsi bentuk kurva tertentu, sehingga dapat memberikan fleksibilitas yang lebih besar. Selain itu, MARS memiliki beberapa kelebihan diantaranya fleksibel untuk pemodelan data berdimensi tinggi serta pemodelan dengan menambahkan atau melibatkan banyak interaksi dengan sedikit variabel (Friedman, 1990).

Bagging(bootstrap aggregating) merupakan metode untuk membangkitkan multiple version dari

prediktor (yang dibentuk dengan replikasi dari data set) dan menggunakannya untuk aggregate prediktor. (Breiman, 1994). Metode yang digunakan ialah pengambilan sampel dengan pengembalian (resampling with replacement) dari sampel data (Efron dan Tibshirani, 1993).

Bagging banyak digunakan pada metode klasifikasi dan regresi untuk mereduksi variansi. Teknik

ini dapat digunakan untuk memperbaiki stabilitas dan kekuatan prediktif. Dalam penelitian ini pemodelan dilakukan dengan enggunakan metode bagging MARS, yang diperkirkan dapat meningkatkan ketepatan ramalan produksi padi Hasil dugaan yang terbaik dengan error terkecil, akan digunakan untuk melakukan prediksi produksi padi. Adanya keterkaitan antara keragaman curah hujan dan fenomena ENSO di lautan Pasifik dalam hal ini adalah SST Nino 3.4 dan DMI di lautan Hindia, maka dikembangkan model ramalan produksi padi dengan menggunakan kedua peubah iklim tersebut.

2. Multivariate Adaptive Regression Splines (MARS)

MARS diperkenalkan pertama kali oleh Friedman (1990) untuk pendekatan model

nonparametrik antara variabel respon dan beberapa variabel prediktor pada piecewise regresi. Piecewise regresi merupakan regresi yang memiliki sifat tersegmen (terpotong-potong). MARS merupakan pengembangan dari pende-katan Recursive Partition Regression (RPR) yang masih memiliki kelemahan dimana model yang dihasilkan tidak kontinu pada knots.

Model MARS dapat ditulis sebagai berikut.

(1) dengan adalah basis fungsi induk, adalah koefisien dari basis fungsi ke-m, M adalah Maksi-mum basis fungsi (nonconstant basis fungsi), adalah derajat interaksi, ± 1, adalah variabel independen, dan adalah nilai knots dari variabel independen

.

3. Bagging

Breiman (1994) orang pertama yang menggunakan metode bootstrap sebagai alat untuk membentuk classifier yang lebih stabil. Bagging prediktor adalah metode untuk

(3)

3

membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate prediktor. Multiple versions dibentuk dengan replikasi bootstrap dari sebuah data set. Pada beberapa kasus

bagging pada data set real atau simulasi dapat meningkatkan akurasi. Jika perubahan dalam data

set memyebabkan perubahan yang signifikan maka bagging dapat meningkatkan akurasi.

Sebuah data set £ terdiri dari dengan dapat berupa klas label atau numerik repon. Jika input adalah maka diprediksi dengan dimana adalah prediktor. Untuk mendapatkan prediktor yang lebih baik maka dilakukan replikasi bootstrap yang kemudian disebut . Replikasi bootstrap dilakukan sebanyak sehingga dari £ dengan resampling dengan pengembalian dan dibentuk predictor

. adalah resampling dengan pengembalian. 4. Analisis Faktor

Analisis faktor adalah analisis statistik yang bertujuan untuk mendapatkan sejumlah kecil faktor (komponen utama) yang memiliki sifat mampu menerangkan semaksimal mungkin keragaman data. Analisis faktor dikembangkan dengan konsep mengekstraksi sejumlah faktor (common factor) dari gugusan variabel asal dimana banyaknya faktor lebih sedikit dari variabel asal dan sebagian besar informasi variabel tersimpan dalam faktor (Johnson&Wichern, 1998). Model analisis faktor ortogonal dapat dituliskan sebagai berikut (Sharma, 1996).

(2)

Dalam notasi matriks,

(3) dengan, adalah variabel random , adalah mean variabel , adalah specific factor ke- , adalah common factor ke- dan adalah loading factor ke- pada faktor ke- . Diasumsikan

dan independent, dengan dan , dengan adalah

matriks diagonal. Sehingga berdasarkan asumsi di atas, maka struktur kovarian untuk model analisis faktor ortogonal adalah

dan (4) Ada dua metode estimasi parameter yang sangat popular untuk analisis faktor yaitu metode principal component dan metode maksimum likelihood (Lievens, 2004). Didalam principal component, jumlah varians dalam data dipertimbangkan. Diagonal matriks korelasi terdiri dari angka satu dan full variance dibawa ke dalam matriks faktor. Analisis faktor dilakukan untuk mencari variabel baru yang disebut faktor yang saling tidak berkorelasi, bebas satu sama lainnya, lebih sedikit jumlahnya daripada variabel asli, akan tetapi bisa menyerap sebagian besar informasi yang terkandung dalam variabel asli atau yang bisa memberikan sumbangan terhadap varians seluruh variabel (Miller, 1993). Salah satu prosedur yang digunakan untuk menentukan banyaknya faktor yaitu berdasarkan eigenvalue. Eigenvalue yang lebih besar

(4)

4

sama dengan satu dipertahankan, sedangkan jika lebih kecil dari satu, faktornya tidak diikutsertakan dalam model. Suatu eigenvalue menunjukkan besarnya sumbangan dari faktor terhadap varians seluruh variabel asli.

Hasil yang didapat dari analisis faktor, memungkinkan peneliti mengalami kesulitan dalam menginterpretasikan faktor-faktor yang terbentuk. Oleh karena itu perlu dilakukan transformasi pada matriks loading faktor untuk meningkatkan daya interpretasi factor yaitu dilakukan dengan merotasi matrik tersebut dengan mengunakan metode rotasi tegak lurus varians. Rotasi merupakan salah satu tahap yang memperbolehkan peneliti untuk mengidentifikasi arti dari faktor atau memberikan penjelasan (Darlington, 1973). Terdapat empat metode untuk rotasi orthogonal dengan inisialisasi faktor yang ditemukan menggunakan

principal component atau perhitungan maksimum likelihood. Rotasi orthogonal merotasikan axis

untuk memberikan gambaran yang berbeda. Metode yang dimaksud sebagai adalah metode varimax, quartimax, equamax, dan promax.

5. Metodologi

Data yang digunakan untuk penelitian adalah data sekunder yang diperoleh dari BPS (Badan Pusat Statistik), Departemen Pertanian dan BMKG ( Badan Meteorologi Klimatologi dan Geofisika), periode Januari 1990 s.d. Desember 2005. Lokasi penelitian adalah Kabupaten Ngawi. Variabel yang digunakan dalam penelitian ini adalah Variabel respon (y) adalah anomali luas panen padi untuk setiap subround, meliputi AnLP1 (anomali luas panen padi subround 1,

yaitu bulan Januari – April), AnLP2 (anomali luas panen padi subround 2, yaitu bulan Mei -

Agustus), AnLP3 (anomali luas panen padi subround 3, yaitu bulan September - Desember).

AnLPp diperoleh dari selisih antara luas panen padi per periode dengan rata-rata luas panen padi

per periode mulai tahun 1990 – 2005. Variabel prediktor terdiri dari DMI (Dipole Mode Index) dan SST Nino 3.4 (pada setiap bulan).

Tahapan analisis data dalam penelitian ini yaitu melakukan identifikasi yang bertujuan untuk mengetahui gambaran umum variabel prediktor. Selanjutnya melakukan analisis faktor, karena diduga terjadi kasus multikolinearitas pada variabel prediktor, dan dilanjutkan dengan menyusun model hubungan antara Anomali luas panen per subround (respon) dengan SST 3.4, DMI, dengan menggunakan bagging MARS. Karena masa penanaman padi membutuhkan waktu 3 s.d. 4 bulan dan luas panen dapat dihitung setelah tanam, maka mengikuti

persamaan , dengan t adalah peride (bulan) dan

.

6. Analisa dan Pembahasan

Gambaran awal bentuk hubungan antara variabel prediktor dengan variabel respon digambarkan pada matriks plot (Gambar 1a). Plot tersebut menunjukkan bahwa terdapat ketidakjelasan dan pola antara masing-masing variabel prediktor terhadap variabel respon. Dengan adanya keterbatasan informasi mengenai bentuk fungsi, dan tidak jelasnya pola hubungan antara variabel respon dan prediktor merupakan pertimbangan digunakannya metode

(5)

5

(a)

(b)

Gambar 1. (a) Matriks Plot variabel prediktor dengan anomali luas panen (b) Matriks plot Skor Faktor dengan anomali luas panen

Adanya keterkaitan secara linear (korelasi) antara lag Sea Surface Temperature (SST Nino 3.4) dan Dipole Mode Index pada tiap subround, meyebabkan perlunya melakukan analisis faktor pada variabel-variabel prediktornya. Pemilihan banyaknya faktor yang digunakan, didasarkan pada nilai eigenvalue pada Principal Componen Analysis yang lebih besar dari 1. Nilai eigenvalue yang dijadikan acuan untuk menentukan banyaknya faktor yang terbentuk adalah nilai eigenvalue yang lebih besar dari satu (Sharma, 1996). Hasil menunjukkan bahwa pada subround 1, dan subround 3, ke-8 variabel prediktor akan difaktorkan menjadi 2 faktor dengan total masing-masing sebesar 74.1% dan 89.3 % variabilitas data dapat dijelaskan dengan menggunakan kedua faktor pada tiap-tiap subround. Pada subround 2, dengan menggunakan rotasi varimax (untuk memudahkan interpretasi), variabel prediktor akan direduksi menjadi 3 faktor, dengan total sebesar 88.2% variabilitas data dapat dijelaskan dengan menggunakan kedua faktor tersebut. Tabel 1 menggambarkan pengelompokan variabel prediktor pada tiap subround.

(6)

6

Tabel 1. Hasil pengelompokan variabel prediktor menurut loading faktor

Subround 1 Subround 2 Subround 3

Faktor 1 Faktor 2 Faktor 1 Faktor 2 Faktor 3 Faktor 1 Faktor 2

DMI3 DMI1 SST5 DMI7 DMI5 DMI9 DMI12

DMI4 DMI2 SST6 DMI8 DMI6 DMI10

SST1 SST7 DMI11 SST2 SST8 SST9 SST3 SST10 SST4 SST11 SST12

Setelah didapatkan faktor-faktor yang saling independen, langkah selanjutnya ialah melakukan pemodelan MARS terhadap Anomali Luas Panen tiap subround. Anomali luas panen merupakan selisih antara luas panen tiap subround dengan rata-rata pada tiap subroundnya. Untuk mendapatkan jumlah sampel yang sesuai, dilakukan metode resampling. Metode

resampling yang digunakan adalah bootstrap aggregatinig (bagging) dengan replikasi sebanyak

50, 60, 70, 80, 90, 100, 150, dan 200 kali. Pembentukan model bagging MARS dilakukan dengan trial and error terhadap maksimum Basis Fungsi (BF), Maksimum Interaksi (MI) dan minimal jumlah pengamatan diantara knots atau Minimum Observasi (MO) hingga diperoleh model optimal dengan nilai R2 yang optimum. Berikut ini adalah hasil pemodelan bagging MARS terbaik pada tiap subround.

Tabel 2. Metode pengelompokan pada tiap subground

Keterangan Metode R2

Subround 1 BF=8 MI=2 MO=0 replikasi=90 99.40%

Subround 2 BF=12 MI=3 MO=0 replikasi=90 94.40%

Subround 3 BF=6 MI=3 MO=0 replikasi=90 95.90%

Secara garis besar dapat dikatakan bahwa dengan replikasi sebanyak 90 kali, 90% variasi anomali luas panen pada setiap subgroudnya dapat diterangkan menggunakan bagging MARS. Berikut ini adalah model terbaik pada setiap subroundnya. Model persamaan bagging MARS untuk subround 1 adalah sebagai berikut

(7)

7

Model persamaan bagging MARS untuk subround 2 adalah sebagai berikut

dengan

Model persamaan bagging MARS untuk subround 3 adalah sebagai berikut

dengan

7. Kesimpulan

Adanya keterkaitan antar variabel prediktor menyebabkan diperlukannya penggunaan analisis faktor untuk mereduksi dimensi data. Hasil dari penggunaan metode bagging MARS dalam pemodelan anomali luas panen dan faktor-faktor yang berpengaruh memberikan hasil yang sangat baik yakni lebih dari 90% variasi anomali luas panen pada setiap subgroudnya dapat diterangkan menggunakan bagging MARS. Sehingga metode ini layak untuk digunakan dalam peramalan selanjutnya.

(8)

8

8. Daftar Pustaka

Arrigo RD, Wilson R. (2008) . El Nino and Indian Ocean influences on Indonesian drought: implications for forecasting rainfall and crop productivity. Int. J. Climatology. [http:www.interscience.wiley.com] di download tanggal 31 Agustus 2009, jam 20.00 [BMKG] Badan Meteorologi dan Geofisika. (2009). Klimatologi. Jakarta.

Breiman, L. (1994).Bagging Predictor. Technical report No.421. Department of statistics University of California.

Boer R. (2000). Perkiraan Kondisi Iklim dan Produksi Beras Nasional 2001. Paper disajikan dalam Pertemuan Prospek Ketersediaan Pangan 2001. Badan Urusan Ketahanan Pangan. Kampus Departemen Pertanian Jakarta.30 Agustus 2000.

Darlington, Richard B., Sharon Weinberg, and Herbert Walberg (1973). Canonical variate analysis and related techniques. Review of Educational Research, 453-454.

Efron, B. dan Tibshirani, R.J. (1993). An Introduction to the Bootstrap. New York: Chapman & Hall, Inc

Falcon WP, Naylor RL, Wada N, Smith WL, Burke MB, McCullough EB. (2004). Using Climate Models To Improve Indonesian Food Securaty. Bulletin of Indonesian Economic

Studies 40: 355-377.

Friedman, J.H. (1990). Mulivariate Adaptive Regression Splines, Tech Report 102 Rev, Departemen of Statistics Stanford University Stanford, California.

Johnson, N. and Wichern, D. (1998). Applied Multivariate Statistical Analysis, Prentice-Hall, Englewood Cliffs, N.J.

Lievens, F and Anseel, F. (2004). Confirmatory factor analysis and invariance of an organizational citizenship behaviour measure across samples in a Dutch-speaking context. Journal of Occupational and Organizational Psychology. Vol . 77, 299–306 Miller, G. A., & Rice, K. G. (1993). A factor analysis of a university counseling center problem

checklist. Journal of College Student Development, 34, 98 – 102.

Naylor RL, Falcon WP, Daniel Rochberg D, Nikolaswada. (2001). Using El Niño/Southern Oscillation Climate Data To Predict Rice Production In Indonesia. Climatic Change 50: 255–265.

Naylor RL, Falcon WP, Wada N, Rochberg D. (2002). Using El Niño-Southern Oscillation Climate Data To Improve Food Policy Planning In Indonesia. Bulletin of Indonesian

(9)

9

Naylor RL, Falcon WP, Wada N, Battisti D, Vimont DJ, Burke MB. (2007). Assessing risk of climate variability and climate change for Indonesian rice agriculture. PNAS 104: 7752– 7757.

Sharma, S. (1996). Applied Multivariate Techniques, New-York: John Wiley&Sons,Inc

Surmaini E. (2006). Optimalisasi Alokasi Lahan Berdasarkan Skenario Iklim di Kabupaten Bandung [Tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor.

Wiguna, T.(2009). ” Peningkatan Produksi Padi Menuju 2020”. [http: //www.puslittan.bogor.net] , didownload tanggal 24 Juni 2009, jam 18.00

Gambar

Gambar 1. (a) Matriks Plot variabel prediktor dengan anomali luas panen              (b) Matriks plot Skor Faktor dengan anomali luas panen
Tabel 1. Hasil pengelompokan variabel prediktor menurut loading faktor

Referensi

Dokumen terkait

Peraturan Pemerintah Nomor 69 Tahun 1996 tentang Pelaksanaan Hak dan Kewajiban serta Bentuk dan Tata Cara Peran Serta Masyarakat dalam Penataan Ruang (Lembaran

Perlu pemerataan distribusi SDM dengan pemetaan kebutuhan SDM dokter, dokter spesialis dan nakes di seluruh kota/kabupaten dengan perhitungan sesuai rasio jumlah penduduk

Agar tetap dapat bertahan hidup (survive), para migran yang tinggal dikota melakukan aktifitas-aktifitas informal (baik yang sah dan tidak sah) sebagai sumber mata

Dapat kita lihat bahwa tingkat partisipasi anggota dalam unit usaha penjualan hasi produksi sesuai dengan harga parik, serta dalam unit usaha simpan pinjam guna

Untuk penelaahan data sifat fisis mekanis (kerapatan dan keteguhan tarik sejajar serat) dari 23 jenis rotan berdiameter kecil (<1,2 cm), digunakan analisa keragaman

Untuk file links.htm, faqs.htm dan contact.htm dapat Anda peroleh dari disket Anda dan Anda harus mendesain agar tampilan sesuai dengan content yang dibuat sebelumnya. Untuk

Kesemua faktor tersebut memiliki pengaruh positif yang signifikan, dimana semakin tinggi manfaat, kemudahan, serta penggunaan sistem, maka tingkat penerimaan