• Tidak ada hasil yang ditemukan

Teknik Ensemble dengan Additive Noise pada Estimasi Parameter Model Autoregressive Spasial

N/A
N/A
Protected

Academic year: 2021

Membagikan "Teknik Ensemble dengan Additive Noise pada Estimasi Parameter Model Autoregressive Spasial"

Copied!
6
0
0

Teks penuh

(1)

Teknik Ensemble dengan Additive Noise pada Estimasi

Parameter Model Autoregressive Spasial

Sulistiyaningsih1, Dewi Retno Sari Saputro2, Purnami Widyaningsih3 Program Studi Matematika FMIPA Universitas Sebelas Maret1,2,3

suliss14@gmail.com

Abstrak—Model regresi merupakan model yang digunakan untuk mengetahui pola

hubungan antara variabel dependen dan variabel independen. Salah satu metode yang dapat digunakan untuk mengestimasi parameter model regresi adalah Metode Kuadrat Terkecil (MKT). Jika data yang dianalisis merupakan data spasial, yaitu data yang memuat informasi lokasi, maka estimasi parameter model regresi menggunakan MKT tidak tepat untuk digunakan. Hal ini disebabkan karena pada data spasial, pengamatan pada suatu lokasi bergantung pada pengamatan di lokasi lain yang berdekatan. Akibatnya terdapat efek spasial pada data yaitu heterogenitas spasial dan ketergantungan spasial. Model regresi yang dapat digunakan untuk memodelkan data yang memuat efek spasial adalah model regresi spasial, salah satunya adalah model

Autoregressive Spasial (ARS). Model ARS didasarkan pada efek spasial lag

menggunakan pendekatan area. Tingkat akurasi estimasi parameter model ARS dapat ditingkatkan, terutama untuk memberikan hasil yang lebih baik serta dapat menurunkan tingkat kesalahan, menggunakan metode resampling. Resampling dalam hal ini dilakukan dengan menambahkan gangguan (noise) pada data menggunakan teknik

ensemble. Jenis noise yang umum digunakan adalah additive noise. Additive noise

diperoleh dari data bangkitan berdistribusi normal, 𝜺𝐳~𝑵(𝟎, 𝝈𝟐𝑰), yang dibangkitkan

sebanyak q ulangan dan menghasilkan set data resampling sebanyak q. Dari q data

resampling tersebut, dihasilkan q model ARS tunggal. Tujuan dalam penelitian adalah

mengestimasi parameter model ARS menggunakan teknik ensemble dengan additive

noise. Model ARS dengan teknik ensemble diperoleh dengan menggabungkan q model

ARS berbeda dan menghitung rata-rata estimasi parameter dari q model ARS tersebut.

Kata kunci: Additive noise, Ensemble, Estimasi parameter, Model ARS

I. PENDAHULUAN

Menurut [1], model regresi digunakan untuk mengetahui pola hubungan antara variabel dependen dan variabel independen. Untuk memperoleh model regresi, perlu dilakukan estimasi terhadap parameter model regresi. Salah satu metode yang dapat digunakan untuk mengestimasi parameter model regresi adalah Metode Kuadrat Terkecil (MKT). Konsep MKT adalah meminimumkan jumlah kuadrat eror dari proses pembentukan model regresi. Model regresi berbasis MKT harus memenuhi asumsi klasik regresi yaitu eror harus berdistribusi normal, tidak terdapat autokorelasi, dan bersifat homoskedastisitas serta khusus untuk model regresi yang melibatkan lebih dari dua variabel independen, tidak boleh terdapat multikolinearitas antar variabel-variabel independen.

Jika data yang digunakan dalam pembentukan model regresi merupakan data spasial, yaitu data yang memuat informasi lokasi, maka model regresi berbasis MKT tidak tepat untuk digunakan. Hal ini disebabkan karena pada data spasial, pengamatan pada suatu lokasi bergantung pada pengamatan di lokasi lain yang berdekatan. Akibatnya terdapat efek spasial berupa heterogenitas spasial dan ketergantungan spasial pada erornya. Selain itu, MKT mengabaikan informasi lokasi pada data. Referensi [2] menyatakan jika informasi lokasi atau spasial diabaikan maka pengamatan akan menghasilkan kesimpulan yang berbeda sehingga model yang dibentuk menjadi tidak layak. Cara mengatasi permasalahan tersebut adalah memasukkan efek spasial ke dalam model regresi, sehingga model yang digunakan adalah model regresi spasial. Salah satu model spasial yang dapat digunakan adalah model Autoregressive Spasial (ARS). Model ARS didasarkan pada efek spasial lag menggunakan pendekatan area. Tingkat akurasi estimasi parameter model ARS dapat

(2)

menggunakan metode resampling. Resampling dalam hal ini dilakukan dengan menambahkan gangguan (noise) pada data menggunakan teknik ensemble. Referensi [3] menyatakan bahwa teknik ensemble mampu meningkatkan akurasi model. Menurut [4], teknik ensemble menjadi salah satu teknik penting dalam meningkatkkan kemampuan prediksi dari berbagai model standar. Jenis noise yang umum digunakan adalah additive noise. Additive noise diperoleh dari data bangkitan berdistribusi normal, 𝜀z~𝑁(0, 𝜎2) , yang dibangkitkan sebanyak q ulangan dan menghasilkan set data resampling sebanyak q. Dari q data resampling tersebut, dihasilkan q model ARS tunggal. Model ARS dengan teknik ensemble diperoleh dari rata-rata estimasi parameter q model ARS tersebut. Salah satu manfaat dari model regresi adalah sebagai model prediksi. Sebagai model prediksi, tingkat akurasi model merupakan faktor penting untuk memperoleh ketepatan prediksi. Jika data yang dianalisis merupakan data spasial maka teknik ensemble merupakan salah satu cara yang dapat digunakan untuk memperoleh model prediksi yang baik. Penelitian terkait kajian teori, penerapan, serta perluasan terkait teknik ensemble cukup banyak dilakukan. Pada tahun 2005, referensi [3] menerapkan teknik ensemble pada data spektrum near-infrared (NIR) sehingga Partial Least Squares Regression (PLSR) menjadi lebih kekar terhadap beberapa jenis noise yang ditambahkan. Tahun 2014, referensi [5] melakukan prediksi harga beras di Indonesia menggunakan teknik ensemble K-Nearest Neighbors (KNN) dan menghasilkan prediksi yang mendekati data aktualnya. Tahun berikutnya, referensi [6] melakukan penelitian tentang teknik ensemble dengan additive noise pada model regresi spasial untuk data kemiskinan di Jawa dan diperoleh kesimpulan bahwa model ARS dengan ensemble lebih baik dibandingkan model ARS tanpa ensemble. Berdasarkan penelitian-penelitian tersebut, penelitian ini bertujuan untuk melakukan estimasi parameter model ARS menggunakan teknik ensemble dengan additive noise.

II. HASIL DAN PEMBAHASAN

Model ARS

Model regresi spasial secara umum oleh [7] ditulis sebagai

𝒚 = 𝜌𝑾 + 𝑿𝜷 + 𝒖 𝒖 = 𝜆𝑾 + 𝜺𝜺~𝑁(𝟎, 𝝈2𝑰)

dengan 𝒚 adalah vektor variabel dependen berukuran 𝑛 × 1, 𝜌 adalah parameter koefisien spasial lag, 𝑾 adalah matriks pembobot berukuran 𝑛 × 𝑛, 𝑿 adalah matriks variabel independen berukuran 𝑛 × (𝑝 + 1), 𝜷 adalah vektor parameter koefisien regresi berukuran (𝑝 + 1) × 1, dan 𝜺 adalah vektor eror berukuran 𝑛 × 1 dengan setiap elemennya berdistribusi normal dengan rata-rata nol dan variansi 𝜎2𝑰 serta 𝑰 merupakan matriks identitas berukuran 𝑛 × 𝑛, 𝒖 adalah vektor eror berukuran 𝑛 × 1, dan 𝜆 adalah parameter koefisien spasial eror dan 𝑝 merupakan banyaknya parameter koefisien regresi. Jika 𝜌 ≠ 0 dan 𝜆 = 0, maka model (1) merupakan model ARS. Model ini menunjukkan adanya efek spasial pada variabel dependen [8]. Dengan demikian, secara umum model ARS tunggal dituliskan sebagai

𝒚 = 𝜌𝑾𝒚 + 𝑿𝜷 + 𝜺, dengan 𝜺~𝑁(𝟎, 𝝈2𝑰). (2)

Matriks Pembobot Spasial

Referensi [7] menyatakan bahwa matriks persingguan ditentukan berdasarkan informasi atau kedekatan antara satu wilayah dengan wilayah lain, dalam hal ini digunakan matriks pembobot tipe data spasial dengan pendekatan area yaitu matriks persinggungan Queen. Matriks persinggungan Queen didefinisikan

(3)

𝑪 = ( 𝑐11 𝑐12 … 𝑐1𝑛 𝑐21 𝑐22 … 𝑐2𝑛 ⋮ ⋮ ⋱ ⋮ 𝑐𝑛1 𝑐𝑛2 … 𝑐𝑛𝑛 ).

Matriks 𝑪 merupakan matriks persinggungan sisi sudut yang mendefinisikan 𝑐𝑖𝑗 = 1, 𝑖, 𝑗 = 1,2, … , 𝑛, dengan 𝑛 merupakan banyaknya pengamatan, untuk daerah yang sisi (common side) atau titik sudutnya (common vertex ) bertemu dengan daerah yang menjadi perhatian dan 𝑐𝑖𝑗= 0 untuk daerah lainnya, dengan 𝑐𝑖𝑗 adalah elemen C yang menyatakan ukuran pembobot spasial antara daerah ke−𝑖 dan 𝑗.

Matriks pembobot spasial dapat disebut sebagai matriks yang menggambarkan kekuatan interaksi antar lokasi. Matriks pembobot dapat diperoleh melalui matriks C yang distandardisasi. Pada matriks C, nilai 1 menunjukkan daerah yang bertetanggaan satu sama lain. Untuk melihat seberapa besar pengaruh masing-masing tetangga terhadap suatu daerah dapat dihitung dari rasio antara nilai pada daerah tertentu dengan total nilai daerah tetangganya. Standarisasi masing-masing elemen matriks C dihitung sesuai dengan (3).

𝑤𝑖𝑗 = 𝑐𝑖𝑗 / 𝑐𝑖 . 

Matriks persinggungan Queen, C, yang telah distandarisasi dituliskan sebagai

𝑾 = ( 𝑤11 𝑤12 … 𝑤1𝑛 𝑤21 𝑤22 … 𝑤2𝑛 ⋮ ⋮ ⋱ ⋮ 𝑤𝑛1 𝑤𝑛2 … 𝑤𝑛𝑛 ). Teknik Ensemble

Proses resampling menggunakan teknik ensemble dilakukan dengan menambahkan noise pada data. Referensi [9] menyebutkan bahwa noise merupakan gangguan tidak beraturan yang diberikan pada data. Salah satu jenis noise yang sering digunakan adalah additive noise. Model ARS tunggal dengan teknik ensemble menggunakan additive noise dihasilkan dari data variabel dependen pada model (2) yang telah ditambahkan noise dan dituliskan sebagai

𝒚k = 𝒚 + 𝜺z 

dengan 𝒚𝒌 , 𝑘 = 1,2, … , 𝑞 adalah vektor variabel dependen yang telah ditambah noise berukuran 𝑛 × 1 dan 𝜺z~ 𝑵(𝟎, 𝝈2𝐼) yang diperoleh dari hasil bangkitan sebanyak q ulangan.

Referensi [10] menyatakan terdapat dua jenis teknik ensemble yaitu teknik ensemble hybrid dan teknik ensemble nonhybrid. Teknik ensemble hybrid menggunakan berbagai model regresi spasial dan menggabungkan hasil estimasi dari masing-masing model spasial tersebut menjadi satu model spasial akhir. Sedangkan teknik ensemble nonhybrid menggunakan satu model regresi spasial dan digunakan berulang kali untuk memperoleh beberapa model yang berbeda, kemudian menggabungkan hasil estimasi dari model– model tersebut menjadi satu model spasial akhir. Teknik ensemble nonhybrid lebih popular digunakan dibandingkan dengan teknik ensemble hybrid [10].

Model ARS dengan Teknik Ensemble

Menurut [8], model ARS dibentuk dari data cross-sectional dan struktur datanya ditunjukkan pada Tabel 1.

(4)

TABEL1.STRUKTUR DATA VARIABEL DEPENDEN DAN VARIABEL INDEPENDEN No. 𝒚 𝑿𝟏 𝑿𝟐 𝑿𝟑 𝑿𝒑 1 𝑦11 𝑥11 𝑥12 𝑥13 … 𝑥1𝑝 2 𝑦21 𝑥21 𝑥22 𝑥23 … 𝑥2𝑝 ⋮ ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ 𝑛 𝑦𝑛1 𝑥𝑛1 𝑥𝑛2 𝑥𝑛3 … 𝑥𝑛𝑝

Parameter model ARS tunggal pada (2) dapat diestimasi menggunakan metode maximum likelihood. Fungsi likelihood model ARS untuk variabel dependen 𝒚 adalah

𝐿(𝜌, 𝜷, 𝜎2; 𝒚) = | 𝑰−𝜌𝑾 (2𝜋𝜎2)𝑛/2| 𝑒𝑥𝑝 (− (𝒚− 𝜌𝑾𝒚− 𝑿𝜷)′(𝒚− 𝜌𝑾𝒚− 𝑿𝜷) 2𝜎2 ) (4) dengan

|𝑰 − 𝜌𝑾| = |

𝜕(𝒚− 𝜌𝑾𝒚− 𝑿𝜷) 𝜕𝒚

|

. Dengan demikian, fungsi ln dari (4) ditulis sebagai

𝑙𝑛(𝐿(𝜌, 𝜷, 𝜎2; 𝒚)) = −𝑛 2𝑙𝑛(2𝜋) − 𝑛 2𝑙𝑛(𝜎 2) +𝑙𝑛|𝑰 − 𝜌𝑾| −(𝒚− 𝜌𝑾𝒚− 𝑿𝜷)′(𝒚− 𝜌𝑾𝒚− 𝑿𝜷) 2𝜎2 . (5)

Estimasi parameter 𝜎2 dan 𝜷 diperoleh dengan memaksimumkan (5), dengan estimasi untuk 𝜎2 adalah

𝜎̂2=(𝒚 − 𝜌𝑾𝒚 − 𝑿𝜷)

(𝒚 − 𝜌𝑾𝒚 − 𝑿𝜷) 𝑛

dan estimasi untuk 𝜷 adalah

𝜷̂ = (𝑿′𝑿)−1𝑿(𝑰 − 𝜌𝑾)𝒚.

Sebelum dikonstruksikan model ARS, sesuai dengan teknik ensemble bahwa diperlukan resampling untuk noise (𝜺𝒛) dengan 𝜺𝒛~𝑵(𝟎, 𝝈𝟐) sebanyak 𝑞 ulangan sehingga struktur data untuk variabel dependen yang telah diberi noise (𝒚k) ditunjukkan pada Tabel 2.

TABEL2.STRUKTUR DATA VARIABEL DEPENDEN DENGAN ADDITIVE NOISE

No. 𝒚 Noise 𝒚𝟏 1 𝑦1 𝜀1 𝑦11 2 𝑦2 𝜀1 𝑦21 ⋮ ⋮ ⋮ ⋮ 𝑛 𝑦𝑛 𝜀1 𝑦1𝑛 No. 𝒚 Noise 𝒚𝟐 1 𝑦1 𝜀2 𝑦21 2 𝑦2 𝜀2 𝑦22 ⋮ ⋮ ⋮ ⋮ 𝑛 𝑦𝑛 𝜀2 𝑦2𝑛 ⋮ No. 𝒚 Noise 𝒚𝒒 1 𝑦1 𝜀𝑞 𝑦𝑞1 2 𝑦2 𝜀𝑞 𝑦𝑞2 ⋮ ⋮ ⋮ ⋮ 𝑛 𝑦𝑛 𝜀𝑞 𝑦𝑞𝑛

(5)

Dengan menggunakan variabel dependen 𝒚1, 𝒚2, … 𝒚𝑞, dapat dikonstruksi sebanyak 𝑞 model ARS tunggal yang berbeda seperti ditunjukkan pada Tabel 3.

TABEL3.STRUKTUR Q MODEL ARS

No. Model ARS

1 𝒚̂ 1= 𝜌1𝑾𝒚1+𝑿𝜷̂1 2 𝒚̂2= 𝜌2𝑾𝒚2+𝑿𝜷̂ 2 ⋮ ⋮ 𝑘 𝒚̂𝑞= 𝜌𝑞𝑾𝒚𝑞+𝑿𝜷̂𝑞

Model ARS dengan teknik ensemble adalah model yang diperoleh dari rata-rata hasil estimasi parameter q model regresi. Model ARS dengan teknik ensemble dapat dituliskan sebagai

𝑦̂ =1 𝑞∑ 𝑦̂𝑘

𝑞

𝑘=1  

dengan 𝑦̂ adalah rata-rata estimasi q model ARS, 𝑞 adalah banyaknya resampling, dan 𝑦̂𝑘 adalah model ARS ke-k. Dengan demikian, secara umum model ARS dengan teknik ensemble dituliskan pada model (6).

𝒚 = 𝜌𝑾𝒚𝑘+ 𝑿𝜷 + 𝜺, 𝜺~𝑵(𝟎, 𝝈𝟐𝑰). (6)

III. SIMPULAN

Model ARS dengan teknik ensemble dihasilkan dari rata-rata estimasi model ARS gabungan. Model ARS tunggal dengan teknik ensemble diperoleh dari masing-masing data hasil resampling, yaitu data variabel dependen yang telah diberi noise dengan jenis additive noise. Model ARS dengan teknik ensemble menggunakan additive noise dituliskan sebagai

𝒚 = 𝜌𝑾𝒚k+ 𝑿𝜷 + 𝜺, 𝜺~𝑵(𝟎, 𝝈𝟐𝑰).

DAFTAR PUSTAKA

[1] R.E. Walpole, R.H. Myers, S.L. Myers, and K. Ye, Probability and Statistics for Engineers and Scientists, 9th ed., New Jersey : Prentice Hall, 2012.

[2] J.P. LeSage, “Bayesian Estimation of Spatial Autoregressive Models,” in International Regional Science Review, pp. 113-129, 1997.

[3] B.H. Mevik, V.H. Segtnan, and T. Naes, “Ensemble Methods and Partial Least Squares Regression,” in Journal of Chemometrics, vol.18, pp. 498-507, 2005.

[4] M. Zhu, Kernel and Ensemble : Perspective on Statistical Learning, Waterloo : University of Waterloo, 2008.

[5] D. Sinta, H. Wijayanto, and B. Sartono, “Ensemble K-Nearest Neighbor Method to Predict Rice Price in Indonesia,” in Applied Statistical Sciences, vol.8, pp. 7993-8005, 2014.

[6] N. Rohmawati, H. Wijayanto, and A.H. Wigena, “Ensemble Spatial Autoregressive Model on the Poverty Data in Java,” in Applied Statistical Sciences, vol.9, pp. 2103-2110, 2015.

[7] J.P. LeSage, The Theory and Practice of Spatial Econometrics, Toledo : University of Toledo, February 1999. [8] L. Anselin, Spatial Econometrics : Methods and Models, Nedherlands : Kluwer Academic Publishers, 1988.

(6)

[9] Z. Wu and N.E. Huang, “Ensemble Empirical Mode Decomposition : A Noise Assisted Data Analysis Method, Kernels and Ensemble, Perspective on Statistical Learning,” pp. 1-41, August 2005.

[10] K.W. De Bock, K. Coussement, and D.V.D. Poel, “Ensemble Classification Based on Generalized Additive Models,” in Computational and Data Analysis, vol. 54, pp. 1535-1546, 2010.

Gambar

TABEL 2. S TRUKTUR  D ATA  V ARIABEL  D EPENDEN DENGAN  A DDITIVE  N OISE
TABEL 3. S TRUKTUR Q  M ODEL  ARS

Referensi

Dokumen terkait

Pendekatan yang digunakan dalam penelitian ini adalah pendekatan kuantitatif, yaitu sebuah pendekatan penelitian yang berlandaskan pada filsafat positivisme, digunakan

Osteokalsin mempunyai peran penting dalam regulasi pembentukan kristal hidroksiapatit (mineralisasi), oleh karena itu osteoklasin baru bisa di deteksi pada fase reparatif

Setelah mendengar penjelasan dari guru, bermain scramble dan melakukan tanya jawab, siswa dapat menulis kalimat sederhana yang didiktekan dengan benar.. Materi Pembelajaran

Kontribusi Hasil Prakerin Siswa Smk Terhadap Kesiapan Kerja Sebagai Cook Helper Universitas Pendidikan Indonesia | repository.upi.edu..

Tujuan dari penelitian ini adalah untuk mengetahui hubungan antara pengetahuan dan status gizi ibu hamil dengan kejadian pre eklamsia pada ibu hamil di Puskesmas Pasar

Power can be provided by a Ubiquiti Networks UniFi Switch or Gigabit PoE adapter (included with single-pack only).. Reset The Reset button serves two functions for the

Dengan demikian dapat disimpulkan hipotesis yang menyatakan BOPO secara parsial mempunyai pengaruh negatif yang signifikan terhadap CAR pada Bank Umum Swasta Nasional

Penelitian ini bertujuan untuk memproduksi antibodi terhadap antigen ekskretori-sekretori cacing jantan dan cacing betina untuk pengembangan diagnosis berbasis deteksi