commit to user
BAB IV
HASIL DAN PEMBAHASAN
Pada bab ini dibahas model regresi probit spasial, dan algoritme Gibbs
sampling. Selanjutnya algoritme Gibbs sampling tersebut diterapkan untuk
esti-masi nilai parameter model regresi probit spasial menggunakan software R.
4.1
Model Regresi Probit Spasial
Model regresi probit yang merupakan model regresi linier dapat digunakan pada data kewilayahan sehingga disebut model regresi probit spasial. Pada regre-si sparegre-sial, pengamatan pada suatu wilayah bergantung pada pengamatan yang berada di wilayah lain yang berdekatan. Hal tersebut mengakibatkan tidak terpe-nuhinya asumsi residu yang independen (Marsh [12]). Adanya pengaruh wilayah menyebabkan model probit pada persamaan (2.7) perlu dimodifikasi. Menurut LeSage dan Pace [11] model umum regresi probit spasial adalah
z = ρW z + Xβ + ǫ (4.1)
dengan z merupakan variabel dependen yang berupa vektor berukuran n × 1, X adalah matriks variabel independen yang berukuran n×k dan β adalah parameter yang berukuran k ×1. Koefisien autoregressive spasial lag dinotasikan rho dengan |ρ| < 1. Matriks W merupakan matriks ketergantungan wilayah yang digunakan untuk mengetahui hubungan antar wilayah. Himpunan pembobot dinyatakan dalam matriks pembobot W berukuran (n × n), dengan n adalah banyaknya pengamatan. Diagonal elemen utama bernialai 0, karena diasumsikan antara wilayah yang sama tidak saling berdekatan. Karakteristik dari matriks W adalah jumlah semua unsur pada setiap baris dan kolom sama dengan satu. ǫ adalah residu berukuran (n × 1) yang diasumsikan berautokorelasi yang berdistribusi
commit to user
ǫ ∼ N(0; σ2I). Berdasarkan persamaan (4.1), y = 1 jika z ≥ 0 untuk kejadian sukses dan y = 0 jika z < 0 untuk kejadian gagal. Variabel z pada persamaan (4.1)yang merupakan variabel dependen dikotomi mengikuti distribusi normal standar yaitu z ∼ N(0, σ2) dapat dituliskan sebagai
G(z) = √1 2π Z z −∞ exp−z2 dz = √1 2π Z ρW z+Xβ −∞ exp−z2 dz.
4.2
Estimasi Parameter Model Regresi Probit Spasial
Pembangkitan data melalui distribusi posterior memerlukan perhitungan yang banyak dan berdimensi tinggi, oleh karena itu digunakan metode MCMC dengan algoritma Gibbs sampling yang diaplikasikan pada software R. Nilai para-meter pada model regresi probit spasial yakni β dan ρ dapat ditentukan dengan terlebih dahulu diketahui distribusi posteriornya. Distribusi posterior masing-masing parameter digunakan untuk simulasi menggunakan agoritme Gibbs
sam-pling. Berikut dipaparkan distribusi posterior masing-masing parameter menurut
Wilhelm dan Godinho [19].
4.3
Distribusi Posterior
Distribusi posterior diperoleh dengan menggabungkan informasi prior dan informasi sampel. Dsitribusi posterior dihitung untuk menetukan nilai estimasi parameter. Parameter β memiliki informasi prior N(c, T ) dengan c merupakan rata-rata yang ditetapkan 0 dan T merupakan variansi untuk β yang berupa ma-triks T = In.1010. Berdasarkan teori bayesian dapat dibentuk distribusi posterior
commit to user untuk β yaitu p(β|ρ, z, y) ∝ p(y1, y2, . . . , yn).p(β) ∝ (σn)n/2+(k/2)+1|In+ ρW | ×exp−2σ12(y′ |In+ ρW | ′ |In+ ρW |y) − (c ∗ )′ (T∗ )−1 (c∗ ) +(β − c∗ )′ (T∗ )−1 (β − c∗ ) ∼ N(c∗ , T∗ ).
Parameter β berdistribusi normal dengan c∗
sebagai rata-rata yaitu c∗
= (X′X+ T−1
)−1 (X′
Sz+ T−1
c) dan variansi dinotasian T∗
yaitu T∗ = (X′ X+ T−1 )−1 dan S = (In− ρW ).
Untuk melengkapi simulasi MCMC dengan algoritme Gibbs sampling terha-dap parameter model regresi probit spasial, dibutuhkan juga distribusi posterior parameter ρ. Dalam menentukan distribusi posterior untuk ρ dilakukan cara yang sama dengan mengalikan informasi sampel dan informasi prior, dinyatakan dengan p(ρ|β, z, y) ∝ p(y1, y2, . . . , yn).p(ρ) ∝ [In− ρW ]exp(−1 2 (Sz − Xβ) ′ (Sz − Xβ)).
Proses simulasi dilakukan dengan sampling data pada variabel z yang mem-butuhkan distribusi posterior p(z|β, ρ, y) dinyatakan sebagai
z ∼ ((In− ρW ) −1 Xβ,[(In− ρW ) ′ (In− ρW )] −1 ).
Berdasarkan distribusi posterior masing-masing parameter yang telah ditulis oleh LeSage dan Pace [11], pendekatan MCMC dapat diaplikasikan untuk estimasi parameter model probit spasial. Pembangkitan data melalui distribusi bersyarat dari p(β|ρ, z), p(ρ|β, z), dan p(z|β, ρ) tidak cukup hanya dengan satu kali iterasi.
4.4
Algoritme Gibbs
Sampling
MCMC terdiri atas 2 algoritme yaitu algoritme Metropolis-Hastings dan algoritme Gibbs sampling (Walsh [18]). Algoritme Metropolis-Hastings
diguna-commit to user
kan bila terdapat satu parameter yang tidak diketahui. Algoritme Gibbs
sam-pling merupakan kasus khusus dari algoritme Metropolis-Hastings yang
memer-lukan semua distribusi bersyarat dari parameter yang dicari. Algoritme Gibbs
sampling digunakan bila terdapat lebih dari satu parameter yang tidak diketahui
(Hastings [8]). Dalam penelitian ini digunakan Algoritme Gibbs sampling untuk mengestimasi nilai parameter pada regresi probit spasial.
Algoritme Gibbs sampling diimplementasikan dengan software R untuk membangkitkan data dengan menghitung distribusi bersyarat masing-masing pa-rameter. Karena estimasi tidak dilakukan pada data asli melainkan melalui pem-bangkitan data, perlu ditetapkan nilai n = 400, N = 1000, β = (0, 1, −1)′
sebagai nilai awal parameter β dan ρ = 0.7 digunakan sebagai koefisien autoregressive
spasial lag, selanjutnya ditentukan 6 daerah yang berdekatan sehingga diperoleh
matriks pembobot yang sudah distandardisasi. Berikut diberikan source code estimasi parameter model regresi probit spasial (Wilhelm dan Gudinho [19]).
1. Input: nilai n, β merupakan matriks yang berukuran 3×1, ρ dengan asumsi |ρ| < 1, dan m merupakan banyaknya iterasi pada Gibbs sampling
2. For i = 1 sampai m dilakukan
(a) X := cbind(intercept = 1, x = rnorm(n), y = rnorm(n)); (b) In := sparseMatrix(i = 1 : n, j = 1 : n, x = 1);
(c) nb := knn2nb(knearneigh(cbind(x = rnorm(n), y = rnorm(n)), k = 6));
(d) Listw := nb2listw(nb, style = ”W ”);
(e) W := as(asdgRM atrixlistw(listw), ”CsparseMatrix”); (f) eps := rnorm(n = n, mean = 0, sd = 1);
(g) z := solve(qr(In− ρ ∗ W ), X% ∗ %β + eps); (h) z := y < −as.double(z >= 0);
3. end For
4. sarprobit.fit1:=sarprobit(y ∼ X − 1,W,ndraw = 1000,burn.in = 200,thin-ning = 1,m = 10);
commit to user
5. output: nilai estimasi β dan ρ.
Hasil estimasi menggunakan software R dengan algoritme Gibbs sampling untuk estimasi nilai parameter ditunjukkan pada Tabel 4.1.
Tabel 4.1. Hasil estimasi dengan algoritme Gibbs sampling untuk parameter ρ dan β
ρ= 0.5 ρ= 0.6 ρ= 0.7
Estimasi Mean Std dev Mean Std dev Mean Std dev
β = −0.2 -0.21741 0.06562 -0.2062 0.06297 -0.18825 0.05946 β = 0.9 0.84787 0.10134 0.86872 0.10414 0.86537 0.10643 β = −0.9 -1.093 0.11562 -1.08424 0.11745 -1.09279 0.12107 ρ 0.38936 0.08267 0.47301 0.07187 0.61467 0.05757 β = −0.1 -0.1373 0.06608 -0.07826 0.05501 -0.06671 0.05409 β = 1 0.97707 0.10982 0.93304 0.09418 0.92855 0.09692 β = −1 -1.1692 0.1242 -0.17714 0.08108 -1.16015 0.08303 ρ 0.3385 0.08378 0.60833 0.06636 0.69732 0.05211 β = 0 0.02316 0.05883 0.03747 0.05634 0.02108 0.05525 β = 0.7 0.56592 0.07791 0.62787 0.08242 0.64612 0.08572 β = −0.7 0.71755 0.08794 -0.66171 0.08903 -0.6561 0.09168 ρ 0.39817 0.09109 0.54347 0.07067 0.66708 0.0564 β = 0 -0.02034 0.06364 -0.0554 0.0598 0.01205 0.05594 β = 1 0.99255 0.10981 0.97431 0.10919 0.98709 0.11345 β = −1 -1.11895 0.11953 -1.09901 0.11809 -0.9675 0.11391 ρ 0.38268 0.07838 0.5012 0.06554 0.68523 0.04863
Berdasarkan Tabel 4.1 ditunjukkan bahwa penetapan nilai awal untuk β dan ρakan mempengaruhi nilai estimasi dari hasil simulasi menggunakan software R. Nilai hasil estimasi mendekati nilai awal yang ditetapkan.
Pemilihan m = 10 merupakan banyaknya iterasi Gibbs atau burn-in period yang dilakukan pada MCMC. Pengurangan nilai dari m = 10 hingga m = 1 dapat mengurangi kecepatan waktu iterasi untuk pengestimasian parameter. Menurut