BAB IV HASIL DAN PEMBAHASAN

(1)

commit to user

BAB IV

HASIL DAN PEMBAHASAN

Pada bab ini dibahas model regresi probit spasial, dan algoritme Gibbs

sampling. Selanjutnya algoritme Gibbs sampling tersebut diterapkan untuk

esti-masi nilai parameter model regresi probit spasial menggunakan software R.

4.1 Model Regresi Probit Spasial

Model regresi probit yang merupakan model regresi linier dapat digunakan pada data kewilayahan sehingga disebut model regresi probit spasial. Pada regre-si sparegre-sial, pengamatan pada suatu wilayah bergantung pada pengamatan yang berada di wilayah lain yang berdekatan. Hal tersebut mengakibatkan tidak terpe-nuhinya asumsi residu yang independen (Marsh [12]). Adanya pengaruh wilayah menyebabkan model probit pada persamaan (2.7) perlu dimodifikasi. Menurut LeSage dan Pace [11] model umum regresi probit spasial adalah

z = ρW z + Xβ + ǫ (4.1)

dengan z merupakan variabel dependen yang berupa vektor berukuran n × 1, X adalah matriks variabel independen yang berukuran n×k dan β adalah parameter yang berukuran k ×1. Koefisien autoregressive spasial lag dinotasikan rho dengan |ρ| < 1. Matriks W merupakan matriks ketergantungan wilayah yang digunakan untuk mengetahui hubungan antar wilayah. Himpunan pembobot dinyatakan dalam matriks pembobot W berukuran (n × n), dengan n adalah banyaknya pengamatan. Diagonal elemen utama bernialai 0, karena diasumsikan antara wilayah yang sama tidak saling berdekatan. Karakteristik dari matriks W adalah jumlah semua unsur pada setiap baris dan kolom sama dengan satu. ǫ adalah residu berukuran (n × 1) yang diasumsikan berautokorelasi yang berdistribusi

(2)

commit to user

ǫ _{∼ N(0; σ}2I_{). Berdasarkan persamaan (4.1), y = 1 jika z ≥ 0 untuk kejadian} sukses dan y = 0 jika z < 0 untuk kejadian gagal. Variabel z pada persamaan (4.1)yang merupakan variabel dependen dikotomi mengikuti distribusi normal standar yaitu z ∼ N(0, σ2_{) dapat dituliskan sebagai}

G(z) = _√1 2π Z z −∞ exp−z2 dz = √1 2π Z ρW z+Xβ −∞ exp−z2 dz.

4.2 Estimasi Parameter Model Regresi Probit Spasial

Pembangkitan data melalui distribusi posterior memerlukan perhitungan yang banyak dan berdimensi tinggi, oleh karena itu digunakan metode MCMC dengan algoritma Gibbs sampling yang diaplikasikan pada software R. Nilai para-meter pada model regresi probit spasial yakni β dan ρ dapat ditentukan dengan terlebih dahulu diketahui distribusi posteriornya. Distribusi posterior masing-masing parameter digunakan untuk simulasi menggunakan agoritme Gibbs

sam-pling. Berikut dipaparkan distribusi posterior masing-masing parameter menurut

Wilhelm dan Godinho [19].

4.3 Distribusi Posterior

Distribusi posterior diperoleh dengan menggabungkan informasi prior dan informasi sampel. Dsitribusi posterior dihitung untuk menetukan nilai estimasi parameter. Parameter β memiliki informasi prior N(c, T ) dengan c merupakan rata-rata yang ditetapkan 0 dan T merupakan variansi untuk β yang berupa ma-triks T = In.1010. Berdasarkan teori bayesian dapat dibentuk distribusi posterior

(3)

commit to user untuk β yaitu p_{(β|ρ, z, y) ∝ p(y}1, y2, . . . , yn).p(β) ∝ (σn)n/2+(k/2)+1_|In+ ρW | ×exp−_2σ1₂(y′ |In+ ρW | ′ |In+ ρW |y) − (c ∗ )′ (T∗ )−₁ (c∗ ) +(β − c∗ )′ (T∗ )−₁ (β − c∗ ) ∼ N(c∗ , T∗ ).

Parameter β berdistribusi normal dengan c∗

sebagai rata-rata yaitu c∗

= (X′X+ T−₁

)−₁ (X′

Sz+ T−₁

c) dan variansi dinotasian T∗

yaitu T∗ = (X′ X+ T−₁ )−₁ dan S = (In− ρW ).

Untuk melengkapi simulasi MCMC dengan algoritme Gibbs sampling terha-dap parameter model regresi probit spasial, dibutuhkan juga distribusi posterior parameter ρ. Dalam menentukan distribusi posterior untuk ρ dilakukan cara yang sama dengan mengalikan informasi sampel dan informasi prior, dinyatakan dengan p_{(ρ|β, z, y) ∝ p(y}1, y2, . . . , yn).p(ρ) ∝ [In− ρW ]exp(−1 2 (Sz − Xβ) ′ (Sz − Xβ)).

Proses simulasi dilakukan dengan sampling data pada variabel z yang mem-butuhkan distribusi posterior p(z|β, ρ, y) dinyatakan sebagai

z _{∼ ((I}n− ρW ) −₁ Xβ,[(In− ρW ) ′ (In− ρW )] −₁ ).

Berdasarkan distribusi posterior masing-masing parameter yang telah ditulis oleh LeSage dan Pace [11], pendekatan MCMC dapat diaplikasikan untuk estimasi parameter model probit spasial. Pembangkitan data melalui distribusi bersyarat dari p(β|ρ, z), p(ρ|β, z), dan p(z|β, ρ) tidak cukup hanya dengan satu kali iterasi.

4.4 Algoritme Gibbs

Sampling

MCMC terdiri atas 2 algoritme yaitu algoritme Metropolis-Hastings dan algoritme Gibbs sampling (Walsh [18]). Algoritme Metropolis-Hastings

(4)

diguna-commit to user

kan bila terdapat satu parameter yang tidak diketahui. Algoritme Gibbs

sam-pling merupakan kasus khusus dari algoritme Metropolis-Hastings yang

memer-lukan semua distribusi bersyarat dari parameter yang dicari. Algoritme Gibbs

sampling digunakan bila terdapat lebih dari satu parameter yang tidak diketahui

(Hastings [8]). Dalam penelitian ini digunakan Algoritme Gibbs sampling untuk mengestimasi nilai parameter pada regresi probit spasial.

Algoritme Gibbs sampling diimplementasikan dengan software R untuk membangkitkan data dengan menghitung distribusi bersyarat masing-masing pa-rameter. Karena estimasi tidak dilakukan pada data asli melainkan melalui pem-bangkitan data, perlu ditetapkan nilai n = 400, N = 1000, β = (0, 1, −1)′

sebagai nilai awal parameter β dan ρ = 0.7 digunakan sebagai koefisien autoregressive

spasial lag, selanjutnya ditentukan 6 daerah yang berdekatan sehingga diperoleh

matriks pembobot yang sudah distandardisasi. Berikut diberikan source code estimasi parameter model regresi probit spasial (Wilhelm dan Gudinho [19]).

1. Input: nilai n, β merupakan matriks yang berukuran 3×1, ρ dengan asumsi |ρ| < 1, dan m merupakan banyaknya iterasi pada Gibbs sampling

2. For i = 1 sampai m dilakukan

(a) X := cbind(intercept = 1, x = rnorm(n), y = rnorm(n)); (b) In := sparseMatrix(i = 1 : n, j = 1 : n, x = 1);

(c) nb := knn2nb(knearneigh(cbind(x = rnorm(n), y = rnorm(n)), k = 6));

(d) Listw := nb2listw(nb, style = ”W ”);

(e) W := as(asdgRM atrixlistw(listw), ”CsparseMatrix”); (f) eps := rnorm(n = n, mean = 0, sd = 1);

(g) z := solve(qr(In− ρ ∗ W ), X% ∗ %β + eps); (h) z := y < −as.double(z >= 0);

3. end For

4. sarprobit.fit1:=sarprobit(y ∼ X − 1,W,ndraw = 1000,burn.in = 200,thin-ning = 1,m = 10);

(5)

commit to user

5. output: nilai estimasi β dan ρ.

Hasil estimasi menggunakan software R dengan algoritme Gibbs sampling untuk estimasi nilai parameter ditunjukkan pada Tabel 4.1.

Tabel 4.1. Hasil estimasi dengan algoritme Gibbs sampling untuk parameter ρ dan β

ρ= 0.5 ρ= 0.6 ρ= 0.7

Estimasi Mean Std dev Mean Std dev Mean Std dev

β _{= −0.2 -0.21741 0.06562 -0.2062} 0.06297 -0.18825 0.05946 β = 0.9 0.84787 0.10134 0.86872 0.10414 0.86537 0.10643 β _{= −0.9 -1.093} 0.11562 -1.08424 0.11745 -1.09279 0.12107 ρ 0.38936 0.08267 0.47301 0.07187 0.61467 0.05757 β _{= −0.1 -0.1373} 0.06608 -0.07826 0.05501 -0.06671 0.05409 β = 1 0.97707 0.10982 0.93304 0.09418 0.92855 0.09692 β _{= −1} -1.1692 0.1242 -0.17714 0.08108 -1.16015 0.08303 ρ 0.3385 0.08378 0.60833 0.06636 0.69732 0.05211 β = 0 0.02316 0.05883 0.03747 0.05634 0.02108 0.05525 β = 0.7 0.56592 0.07791 0.62787 0.08242 0.64612 0.08572 β _{= −0.7 0.71755} 0.08794 -0.66171 0.08903 -0.6561 0.09168 ρ 0.39817 0.09109 0.54347 0.07067 0.66708 0.0564 β = 0 -0.02034 0.06364 -0.0554 0.0598 0.01205 0.05594 β = 1 0.99255 0.10981 0.97431 0.10919 0.98709 0.11345 β _{= −1} -1.11895 0.11953 -1.09901 0.11809 -0.9675 0.11391 ρ 0.38268 0.07838 0.5012 0.06554 0.68523 0.04863

Berdasarkan Tabel 4.1 ditunjukkan bahwa penetapan nilai awal untuk β dan ρakan mempengaruhi nilai estimasi dari hasil simulasi menggunakan software R. Nilai hasil estimasi mendekati nilai awal yang ditetapkan.

Pemilihan m = 10 merupakan banyaknya iterasi Gibbs atau burn-in period yang dilakukan pada MCMC. Pengurangan nilai dari m = 10 hingga m = 1 dapat mengurangi kecepatan waktu iterasi untuk pengestimasian parameter. Menurut