BAB II LANDASAN TEORI

(1)

commit to user

BAB II

LANDASAN TEORI

Pada bagian pertama bab kedua ini diberikan tinjuan pustaka yang berisi penelitian sebelumnya yang mendasari penelitian ini. Pada bagian kedua bab ini diberikan teori penunjang yang berisi deﬁnisi-deﬁnisi sebagai dasar pengertian untuk memperoleh pembahasaan selanjutnya. Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan alur penelitian.

2.1 Tinjauan Pustaka

Keragaman data yang rendah menyebabkan model yang dikonstruksikan menjadi lebih baik. Keragaman yang rendah dapat diperoleh dari proses pengelompokkan. Anderberg [2] menyatakan bahwa pengelompokkan pada metode cluster tidak berdasarkan pada kategori yang sudah ditentukan sebelumnya.

K-means clustering bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang mirip. K-means clustering diperlukan untuk meminimumkan ragam pada data yang memiliki efek ruang dan waktu.

Data yang memiliki efek waktu dapat diterapkan ke dalam model runtun waktu. Data yang memiliki efek ruang dapat diterapkan ke dalam model spasial.

Jika data memiliki efek waktu dan ruang maka dapat diterapkan ke dalam model ruang waktu. Model ruang waktu pertama kali diperkenalkan oleh Pfeifer dan Deustch [13] yaitu model STAR. Kemudian pada tahun 2002 Borovkova et al. [3]

mengembangkan model STAR menjadi model GSTAR. Wutsqa dan Suhartono

[6] menyatakan bahwa model VAR yang direpresentasikan ke dalam model GS-

TAR disebut model VAR-GSTAR. Model VAR-GSTAR menyaratkan data harus

berpola stasioner dan memiliki sisaan white noise. Model VAR-GSTAR memiliki

orde waktu dan orde ruang.

(2)

commit to user

Karena adanya efek ruang, keterkaitan antar ruang dalam model dapat dinyatakan menggunakan pembobot. Salah satu pembobot dalam model VAR- GSTAR adalah normalisasi korelasi silang (Suhartono dan Subanar, [17]). Bo- bot lokasi normalisasi korelasi silang memberikan semua kemungkinkan bentuk hubungan antar lokasi dengan mempertimbangkan lag waktu. Pembobot normalisasi korelasi silang bersifat ﬂeksibel pada nilainya dan tanda hubungan antar lokasi yang berlainan yaitu positif dan negatif.

2.2 Teori-Teori Penunjang

Pada bagian ini dijelaskan deﬁnisi dan teori yang dipakai dalam mencapai tujuan penelitian. Selanjutnya diberikan gambaran tentang k-means clustering, model VAR, model VAR-GSTAR, kestasioneran model VAR-GSTAR, pembobot normalisasi korelasi silang pada model VAR-GSTAR, identiﬁkasi model, pendugaan parameter, regresi stepwise, dan validasi model VAR-GSTAR.

2.2.1 K-means Clustering

Teknik pengelompokkan yang didasarkan pada kemiripan objek disebut clustering. Clustering digunakan untuk menggabungkan observasi-observasi ke dalam kelompok-kelompok yang memiliki karakteristik sama. Menurut MacQu- een [11], k-means clustering memiliki k banyaknya cluster dan means sebagai pusat cluster. Metode pengelompokkan ini didasarkan pada kemiripan objek menggunakan alat ukur, yaitu jarak. Jarak yang digunakan dalam penelitian ini adalah jarak euclidean.

Menurut Johnson dan Wichern [10] algoritme k-means clustering dinyatakan sebagai berikut.

1. Menentukan banyaknya k cluster serta menetapkan means sebagai pusat cluster.

2. Menghitung jarak setiap nilai observasi ke pusat cluster menggunakan jarak

euclidean.

(3)

commit to user

3. Mengelompokkan data ke dalam cluster dengan jarak terpendek.

4. Mengulangi langkah ke-2 dan ke-3 hingga pusat cluster menjadi tetap.

Jarak euclidean digunakan untuk menentukan kemiripan anggota dalam cluster. Menurut Anderberg [2], jarak euclidean dirumuskan sebagai

d ^′ (x _ij , x _ic ) =

√

(x _ij − x ic ) ² + (x _ij − x ic ) ² + . . . + (x _ij − x ic ) ² (2.1) dengan x ij adalah data curah hujan pada lokasi ke-i bulan ke-j dan x ic adalah data curah hujan bulanan pada lokasi ke-i dan centroid ke-c .

2.2.2 Model Vector Autoregressive (VAR)

Model VAR dikemukakan oleh Sims [16] dalam bidang makroekonomi. Pe- nelitian ini menjelaskan jika dalam suatu persamaan terdapat sifat simultan, maka semua variabel dianggap variabel endogen. Model VAR (p) dinyatakan sebagai

Y _t = c + ϕ ₁ Y _(t ₋₁₎ + ϕ ₂ Y _(t ₋₂₎ + ... + ϕ _p Y _(t _−p) + ε _t , t = 1, . . . , T

dengan Y _t = (y _1t , y _2t , ..., y _nt )

^′

merupakan vektor variabel runtun waktu pada waktu ke-t (n x 1), ϕ adalah matriks koeﬁsien (n x n) dan ε _t adalah vektor sisaan white noise pada waktu ke-t (n x 1).

2.2.3 Model Vector Autoregressive-Generalized Space Time Autoregressive (VAR-GSTAR)

Menurut Wutsqa dan Suhartono [6], model VAR-GSTAR merupakan model VAR yang direpresentasikan ke dalam model GSTAR. Model VAR-GSTAR dinyatakan sebagai

Z _i (t) =

∑ p k=1

λ

s

∑

l=0

∑ n i=1

Φ ⁱ _kl W ^l (k)Z _i (t − k) + e i (t) (2.2)

dengan Φ ⁱ _kl merupakan matriks diagonal ruang waktu dengan lag spasial l dan

lag waktu ke-k pada daerah i, W ^l (k) yaitu matriks pembobot ukuran (n × n),

e _i,t yaitu sisaan (n × 1) yang berdistribusi normal pada daerah i dan waktu ke-t,

Z i,t yaitu nilai observasi pada daerah i dan waktu ke-t.

(4)

commit to user

2.2.4 Kestasioneran Model VAR-GSTAR

Menurut Dhoriva dan Suhartono [6], penerapan model VAR-GSTAR dimu- lai dengan menentukan kestasioneran data. Hal ini sejalan dengan Ruchjana [14]

yang menyatakan bahwa dalam pemodelan VAR-GSTAR data harus stasioner.

Identiﬁkasi pola stasioner dilakukan dengan uji Im Pesaran Shin (IPS). Berikut adalah uji hipotesisnya.

1. Hipotesis

H ₀ : data tidak stasioner H ₁ : data stasioner

2. Taraf signiﬁkansi : α = 0.05 3. Statistik uji :

t = 1 N

∑ t _i (2.3)

dengan t adalah nilai IPS, t _i adalah nilai t _hitung dari augmented Dickey Fuller (ADF) wilayah ke-i. Nilai t _i diperoleh dari

t _i =

∑

n

t=1

Z(t −1)Z(t)

∑

n

t=1

Z(t −1)

²

− 1

√ _∑

_n

t=1

(Z(t) −ηZ(t−1))

²

n −1

(2.4)

4. Daerah kritis (DK) : {t | t > t

^α₂

;n } 5. Keputusan uji : H ₀ ditolak jika t ∈ DK

dengan α adalah tingkat kesalahan, n adalah banyaknya data, p adalah banyaknya parameter, dan Z t data pengamatan ke-t.

2.2.5 Pembobot Normalisasi Korelasi Silang pada Model VAR-GSTAR

Pembobot lokasi yang digunakan dalam penerapan model VAR-GSTAR

pada curah hujan adalah pembobot normalisasi korelasi silang. Pembobot loka-

si normalisasi korelasi silang merupakan pembobot lokasi dengan menggunakan

(5)

commit to user

hasil normalisasi korelasi silang antar lokasi pada lag waktu yang bersesuaian.

Oleh karena itu, menurut Suhartono dan Atok [18] pembobot normalisasi korelasi silang memberikan semua kemungkinan hubungan yang terjadi antar lokasi.

Pembobot normalisasi korelasi silang tersebut oleh Suhartono dan Subanar [17]

dinyatakan sebagai

w _ij (k) = r _ij (k)

∑ p

k=1 |r ik (k) | (2.5)

dengan i ̸= j, k = 1,2,...,p, dan nilai r ij (k ) merupakan korelasi silang yang ditentukan dengan

r _ij (k) =

∑ n

t=k+1 [Z _i (t) − ¯ Z _i ][Z _j (t − k) − ¯ Z _j ]

√ ( ∑ _n

t=1 [Z _i (t) − ¯ Z _i ] ² )( ∑ _n

t=1 [Z _j (t) − ¯ Z _j ] ² ) . (2.6) Pembobot ini dihitung berdasarkan korelasi antar lokasi pada data curah hujan.

Karena nilai korelasi yang terjadi pada suatu lokasi memiliki nilai lebih dari atau kurang dari 1, untuk memenuhi asumsi jumlah elemen dalam matriksnya bernilai 1, perlu dilakukan normalisasi. Menurut Suhartono dan Subanar [17], langkah- langkah menghitung pembobot normalisasi korelasi silang dengan menjumlahkan nilai mutlak korelasi pada setiap lokasi dan membagi setiap elemen matriksnya dengan jumlah nilai mutlak korelasi tersebut.

2.2.6 Identifikasi Model

Model VAR-GSTAR memiliki keterkaitan ruang dan waktu sehingga orde modelnya berupa orde waktu dan spasial. Penentuan orde spasial menurut Wuts- qa et al. [7] dibatasi dengan orde spasial 1 karena orde tinggi sulit diintepretasik- an. Selain itu, menurut Wutsqa dan Suhartono [6], penentuan orde autoregressive model VAR-GSTAR dapat menggunakan orde model VAR (p). Widarjono [22]

menyatakan bahwa pengidentiﬁkasian orde model VAR ditentukan dengan panjang lag optimal. Kriteria menentukan panjang lag optimal menggunakan nilai AIC terkecil. Nilai AIC merupakan suatu nilai yang digunakan sebagai ukuran kriteria kebaikan model. Menurut Tsay [20] nilai AIC dapat dirumuskan sebagai

AIC = ln

( J KS n

)

+ 2K ²

n (2.7)

(6)

commit to user

dengan J KS jumlah kuadrat sisaan, n banyaknya data, dan K jumlah parameter pada model.

2.2.7 Pendugaan Parameter

Dalam model VAR-GSTAR, menurut Wutsqa dan Suhartono [6], metode kuadrat terkecil (MKT) digunakan untuk pendugaan parameter. Model VAR-GSTAR memiliki nilai pengamatan yang dinotasikan dengan Z i (t), t = 0, 1, 2, ..., T adalah waktu, lag waktu yang dinotasikan dengan k, lag spasial yang dinotasikan dengan l, pembobot yang dinotasikan dengan W ^l (k) dan i = 1, 2, ..., n adalah daerah observasi. Berdasarkan persamaan (2.2), bentuk matriks model VAR-GSTAR dapat dinyatakan sebagai



 

 Z

1

(1)

.. . Z

₁

(T )

.. . Z

n

(1)

.. . Z

_n

(T )



 



=



 

 

ϕ

¹_k0

0 0 0 0 · · · 0

0 ϕ

²_k0

0 0 0 · · · 0

0 0 ϕ

³_k0

0 0 · · · 0

0 0 0 ϕ

⁴_k0

0 · · · 0

0 0 0 0 ϕ

⁵_k0

· · · 0

.. . .. . .. . .. . .. . . . . .. .

0 0 0 0 0 · · · ϕ

ⁿk0



 

 



 



Z

1

(T − k) .. . Z

₂

(T − k)

.. . Z

3

(T − k)

.. . Z

_n

(T − k)



 



+



 

 

ϕ

¹_kl

0 0 0 0 · · · 0

0 ϕ

²_kl

0 0 0 · · · 0 0 0 ϕ

³_kl

0 0 · · · 0 0 0 0 ϕ

⁴_kl

0 · · · 0 0 0 0 0 ϕ

⁵_kl

· · · 0 .. . .. . .. . .. . .. . . . . .. .

0 0 0 0 0 · · · ϕ

ⁿ_kl



 

 



 

 

0 w

₁₂

(k) w

₁₃

(k) · · · w

1n

(k) w

21

(k) 0 w

23

(k) · · · w

2n

(k) w

31

(k) w

32

(k) 0 · · · w

3n

(k) w

41

(k) w

42

(k) w

43

(k) · · · w

4n

(k) w

51

(k) w

52

(k) w

53

(k) · · · w

5n

(k)

.. . .. . .. . . . . .. . w

_n1

(k) w

_n2

(k) w

_n3

(k) · · · 0



 

 



 



Z

1

(T − k) .. . Z

2

(T − k)

.. . Z

3

(T − k)

.. . Z

n

(T − k)



 

 +



 

 e

1

(T )

.. . e

2

(T )

.. . e

3

(T )

.. . e

n

(T )



 



(7)

commit to user

=



 

 

ϕ

¹_k0

Z

1

(T − k) ϕ

²_k0

Z

2

(T − k) ϕ

³_k0

Z

3

(T − k) ϕ

⁴_k0

Z

4

(T − k) ϕ

⁵_k0

Z

5

(T − k)

.. . ϕ

ⁿ_k0

Z

_n

(T − k)



 

 

+



 

 

ϕ

¹_kl

0 0 0 0 · · · 0

0 ϕ

²_kl

0 0 0 · · · 0 0 0 ϕ

³_kl

0 0 · · · 0 0 0 0 ϕ

⁴_kl

0 · · · 0 0 0 0 0 ϕ

⁵_kl

· · · 0 .. . .. . .. . .. . .. . . . . .. .

0 0 0 0 0 · · · ϕ

ⁿkl



 

 



 

 

w

₁₂

(k)Z

₂

(T − k) + · · · + w

1n

(k)Z

_n

(T − k) w

₂₁

(k)Z

₁

(T − k) + · · · + w

2n

(k)Z

_n

(T − k) w

31

(k)Z

1

(T − k) + · · · + w

3n

(k)Z

n

(T − k) w

41

(k)Z

1

(T − k) + · · · + w

4n

(k)Z

n

(T − k) w

51

(k)Z

1

(T − k) + · · · + w

5n

(k)Z

n

(T − k)

· · ·

w

n1

(k)Z

1

(T − k) + · · · + w

nn

(k)Z

n

(T − k)



 

 

+



 

 e

₁

(T )

.. . e

2

(T )

.. . e

₃

(T )

.. . e

n

(T )



 



(8)

commit to user dengan V _i (t) = ∑ n

j=1 w _ij (k)Z _i (t) sehingga bentuk matriks model VAR-GSTAR dapat dinyatakan sebagai



 

 Z

₁

(1)

.. . Z

1

(T )

.. . Z

_n

(1)

.. . Z

n

(T )



 



=



 

 

ϕ

¹_k0

Z

₁

(T − k) ϕ

²_k0

Z

2

(T − k) ϕ

³_k0

Z

3

(T − k) ϕ

⁴_k0

Z

4

(T − k) ϕ

⁵_k0

Z

5

(T − k)

.. . ϕ

ⁿ_k0

Z

_n

(T − k)



 

  +



 

 

ϕ

¹_kl

0 0 0 0 · · · 0

0 ϕ

²_kl

0 0 0 · · · 0 0 0 ϕ

³_kl

0 0 · · · 0 0 0 0 ϕ

⁴_kl

0 · · · 0 0 0 0 0 ϕ

⁵_kl

· · · 0 .. . .. . .. . .. . .. . . . . .. .

0 0 0 0 0 · · · ϕ

ⁿ_kl



 

 



 



V

₁

(T − k) .. . V

2

(T − k)

.. . V

₃

(T − k)

.. . V

n

(T − k)



 



+



 

 e

1

(T )

.. . e

₂

(T )

.. . e

3

(T )

.. . e

_n

(T )



 

 .

Model untuk lokasi ke-i dapat dinyatakan dengan ⃗ Z _i = ⃗ Z _i ^∗ ⃗ Φ + ⃗ ε sehingga pendugaan parameter Φ untuk masing-masing lokasi dapat dihitung secara terpisah.

Model VAR-GSTAR untuk keseluruhan lokasi dapat dinyatakan dalam model regresi linier yaitu

Z = ⃗ ⃗ Z ^∗ ⃗ Φ + ⃗ ε (2.8)

sehingga bentuk matriks model sebagai



 

 Z

₁

(1) Z

₁

(2)

.. . Z

1

(T )

.. .

Z

_n

(1) Z

n

(2)

.. . Z

n

(T )



 



=



 



Z

₁

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 Z

₁

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 .. . .. . .. . .. . .. . . . . .. . Z

1

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 .. . .. . .. . .. . .. . .. . .. .

0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k) 0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k)

.. . .. . .. . .. . .. . . . . .. . 0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k)



 





 

 ϕ

¹_k0

ϕ

²_k0

.. . ϕ

ⁿ_k0

.. .

ϕ

¹_kl

ϕ

²_kl

.. . ϕ

ⁿ_kl



 



(9)

commit to user

+



 

 e

1

(1) e

1

(2)

.. .

e

1

(T ) e

2

(1) e

2

(2)

.. . e

_n

(T )



 



dengan

Z = ⃗



 

 Z

1

(1) Z

1

(2)

.. . Z

₁

(T )

.. .

Z

n

(1) Z

n

(2)

.. . Z

_n

(T )



 

 , ⃗ Z ∗ =



 



Z

1

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 Z

1

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 .. . .. . .. . .. . .. . . . . .. . Z

₁

(T − k) · · · V

1

(T − k) · · · 0 · · · 0 .. . .. . .. . .. . .. . .. . .. .

0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k) 0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k) .. . .. . .. . .. . .. . . . . .. . 0 · · · 0 · · · Z

n

(T − k) · · · V

n

(T − k)



 

 ,

⃗ Φ =



 

  ϕ ¹ _k0 ϕ ² _k0 .. . ϕ ⁿ _k0

.. . ϕ ¹ _kl ϕ ² _kl .. . ϕ ⁿ _kl



 

 

, dan ⃗ ε =



 

 e 1 (1) e ₁ (2)

.. . e ₁ (T )

e ₂ (1) e ₂ (2)

.. . e _n (T )



 

 .

Menurut Gujarati [9], MKT yang merupakan metode pendugaan parameter digunakan dengan meminimumkan jumlah kuadrat sisaannya. Berdasarkan model (2.8), diperoleh

⃗

ε = ⃗ Z − ⃗ Z ^∗ ⃗ Φ

(10)

commit to user

sehingga jumlah kuadrat residual model tersebut adalah

ε ⃗ ^′ ⃗ ε = ( ⃗ Z − ⃗ Z ^∗ Φ) ^′ ( ⃗ Z − ⃗ Z ^∗ Φ) ⃗

= Z ⃗ ^′ Z ⃗ − ⃗ Z ^′ Z ⃗ ^∗ Φ ⃗ − ⃗Φ ^′ Z ⃗ ^∗ Z + ⃗ ⃗ Φ ^′ Z ⃗ ^∗

^′

Z ⃗ ^∗ ⃗ Φ

= Z‘ ⃗ ⃗ Z − 2 ⃗Φ ^′ Z ⃗ ^∗ Z + ⃗ ⃗ Φ ^′ Z ⃗ ^∗

^′

Z ⃗ ^∗ ⃗ Φ.

Untuk memperoleh nilai minimum dari jumlah kuadrat sisaannya diperoleh dari turunan parsial pertama fungsi ε ^′ ε terhadap Φ yang disamadengankan 0 sehingga didapatkan

∂⃗ ε ^′ ⃗ ε

∂⃗ Φ = −2 ⃗Φ ^′ Z ⃗ ^∗

^′

Z + ⃗ ⃗ Φ ^′ Z ⃗ ^∗

^′

Z ⃗ ^∗ Φ ⃗ 0 = −2 ⃗Φ ^′ Z ⃗ ^∗

^′

Z + ⃗ ⃗ Φ ^′ Z ⃗ ^∗

^′

Z ⃗ ^∗ Φ ⃗ Φ = ( ⃗ ˆ Z ^∗

^′

Z ⃗ ^∗ ) ⁻¹ ( ⃗ Z ^∗

^′

Z). ⃗

2.2.8 Metode Stepwise pada Model Regresi

Penentuan parameter yang dapat diterapkan ke dalam model terkadang menemui kendala. Jika terdapat parameter duga yang tidak signiﬁkan maka dilakukan regresi dengan metode stepwise. Hal ini dilakukan untuk mereduksi parameter yang tidak signiﬁkan. Regresi dengan metode stepwise merupakan gabungan metode maju dan mundur yang diterapkan secara bergantian. Metode stepwise memilih variabel berdasarkan korelasi parsial terbesar dengan variabel yang telah masuk dalam model. Variabel yang telah masuk ke dalam model dapat dikeluarkan lagi. Menurut Sembiring [15], berikut merupakan tahapan metode stepwise.

1. Variabel bebas dimasukkan satu demi satu menurut urutan besarnya korelasi terhadap variabel terikat.

2. Menguji apakah variabel bebas yang masuk memiliki pengaruh signiﬁkan.

3. Jika sudah tidak ada variabel yang memiliki pengaruh signiﬁkan ketika

ditambahkan variabel, maka tahapan berhenti.

(11)

commit to user

2.2.9 Uji White Noise

Sebelum melakukan validasi model, sisaan yang diperoleh harus bersifat white noise pada masing-masing cluster terlebih dahulu. Menurut Wei [21], pe- meriksaan sisaan yang bersifat white noise dengan uji Ljung and Box (LB ).

Berikut uji hipotesisnya.

1. Hipotesis

H ₀ : sisaan tidak white noise H ₁ : sisaan white noise 2. Taraf signiﬁkansi : α = 0.05 3. Statistik uji :

LB = n(n + 2)

∑ n k=1

ˆ ρ _k ²

n − k (2.9)

dengan n adalah banyaknya pengamatan, k adalah banyaknya lag, dan ˆ ρ k

adalah autokorelasi duga pada lag ke-k.

4. Daerah kritis (DK) : {LB | LB > χ ² 1 −α;k } 5. Keputusan uji : H ₀ ditolak jika LB ∈ DK

2.2.10 Validasi Model VAR-GSTAR

Setelah memperoleh sisaan yang bersifat white noise dilakukan validasi model VAR-GSTAR sebagai ukuran ketepatan model dengan melihat nilai RMSE.

RMSE dirumuskan sebagai

RM SE =

√∑ n

t=1 (Z _t − ˆ Z _t ) ²

n (2.10)

dengan n adalah banyaknya data, Z _t adalah data aktual curah hujan masing-

masing cluster, dan ˆ Z _t adalah data prediksi curah hujan dengan pembobot nor-

malisasi korelasi silang pada masing-masing cluster.

(12)

commit to user

2.3 Kerangka Pemikiran

Berdasarkan tinjauan pustaka, disusun kerangka pemikiran untuk penerapan model VAR-GSTAR dengan k-means clustering. Besarnya curah hujan yang berbeda-beda setiap lokasi membutuhkan teknik pengelompokkan yaitu 2-means clustering. Model VAR-GSTAR yang memiliki ketergantungan ruang dan waktu dapat diterapkan pada data curah hujan di 29 kabupaten/kotamadya di Jawa Tengah. Model VAR-GSTAR diterapkan pada data yang memiliki karakteristik lokasi heterogen. Asumsi yang dimiliki model VAR-GSTAR adalah kestasioneran data dan sisaan bersifat white noise. Kestasioneran model VAR-GSTAR menurut Ruchjana [14] berasal dari kestasioneran model VAR dan sisaan yang bersifat white noise berdasarkan uji LB.

Menurut Wutsqa dan Suhartono [6] model VAR-GSTAR memiliki orde wak-

tu dan orde ruang. Orde waktu menyatakan pengaruh waktu dan orde spasi-

al menyatakan keterkaitan lokasi. Keterkaitan antar lokasi ditunjukkan dengan

pembobot lokasi. Pembobot lokasi yang ditentukan adalah pembobot normalisasi

korelasi silang. Pendugaan parameter dalam model VAR-GSTAR dengan metode

MKT. Adapun teori-teori yang berkaitan dalam penerapan model VAR-GSTAR

adalah uji stasioneritas, model VAR, pembobot lokasi normalisasi korelasi silang,

pendugaan parameter, dan validasi model.

BAB II LANDASAN TEORI

commit to user

BAB II

LANDASAN TEORI

2.1 Tinjauan Pustaka

Keragaman data yang rendah menyebabkan model yang dikonstruksikan menjadi lebih baik. Keragaman yang rendah dapat diperoleh dari proses pe- ngelompokkan. Anderberg [2] menyatakan bahwa pengelompokkan pada meto- de cluster tidak berdasarkan pada kategori yang sudah ditentukan sebelumnya.

K-means clustering bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang mirip. K-means clustering diperlukan untuk meminimumkan ragam pada data yang memiliki efek ruang dan waktu.

Data yang memiliki efek waktu dapat diterapkan ke dalam model runtun waktu. Data yang memiliki efek ruang dapat diterapkan ke dalam model spasial.

Jika data memiliki efek waktu dan ruang maka dapat diterapkan ke dalam model ruang waktu. Model ruang waktu pertama kali diperkenalkan oleh Pfeifer dan Deustch [13] yaitu model STAR. Kemudian pada tahun 2002 Borovkova et al. [3]

mengembangkan model STAR menjadi model GSTAR. Wutsqa dan Suhartono

[6] menyatakan bahwa model VAR yang direpresentasikan ke dalam model GS-

TAR disebut model VAR-GSTAR. Model VAR-GSTAR menyaratkan data harus

berpola stasioner dan memiliki sisaan white noise. Model VAR-GSTAR memiliki

orde waktu dan orde ruang.

commit to user

2.2 Teori-Teori Penunjang

2.2.1 K-means Clustering

Menurut Johnson dan Wichern [10] algoritme k-means clustering dinyata- kan sebagai berikut.

1. Menentukan banyaknya k cluster serta menetapkan means sebagai pusat cluster.

2. Menghitung jarak setiap nilai observasi ke pusat cluster menggunakan jarak

euclidean.

commit to user

3. Mengelompokkan data ke dalam cluster dengan jarak terpendek.

4. Mengulangi langkah ke-2 dan ke-3 hingga pusat cluster menjadi tetap.

Jarak euclidean digunakan untuk menentukan kemiripan anggota dalam cluster. Menurut Anderberg [2], jarak euclidean dirumuskan sebagai

d ′ (x ij , x ic ) =

√

(x ij − x ic ) 2 + (x ij − x ic ) 2 + . . . + (x ij − x ic ) 2 (2.1) dengan x ij adalah data curah hujan pada lokasi ke-i bulan ke-j dan x ic adalah data curah hujan bulanan pada lokasi ke-i dan centroid ke-c .

2.2.2 Model Vector Autoregressive (VAR)

Model VAR dikemukakan oleh Sims [16] dalam bidang makroekonomi. Pe- nelitian ini menjelaskan jika dalam suatu persamaan terdapat sifat simultan, ma- ka semua variabel dianggap variabel endogen. Model VAR (p) dinyatakan sebagai

Y t = c + ϕ 1 Y (t −1) + ϕ 2 Y (t −2) + ... + ϕ p Y (t −p) + ε t , t = 1, . . . , T

dengan Y t = (y 1t , y 2t , ..., y nt )

merupakan vektor variabel runtun waktu pada wak- tu ke-t (n x 1), ϕ adalah matriks koeﬁsien (n x n) dan ε t adalah vektor sisaan white noise pada waktu ke-t (n x 1).

2.2.3 Model Vector Autoregressive-Generalized Space Time Autoregressive (VAR-GSTAR)

Menurut Wutsqa dan Suhartono [6], model VAR-GSTAR merupakan mo- del VAR yang direpresentasikan ke dalam model GSTAR. Model VAR-GSTAR dinyatakan sebagai

Z i (t) =

∑ p k=1

λ

∑

l=0

∑ n i=1

Φ i kl W l (k)Z i (t − k) + e i (t) (2.2)

dengan Φ i kl merupakan matriks diagonal ruang waktu dengan lag spasial l dan

lag waktu ke-k pada daerah i, W l (k) yaitu matriks pembobot ukuran (n × n),

e i,t yaitu sisaan (n × 1) yang berdistribusi normal pada daerah i dan waktu ke-t,

Z i,t yaitu nilai observasi pada daerah i dan waktu ke-t.

commit to user

2.2.4 Kestasioneran Model VAR-GSTAR

Menurut Dhoriva dan Suhartono [6], penerapan model VAR-GSTAR dimu- lai dengan menentukan kestasioneran data. Hal ini sejalan dengan Ruchjana [14]

yang menyatakan bahwa dalam pemodelan VAR-GSTAR data harus stasioner.

Identiﬁkasi pola stasioner dilakukan dengan uji Im Pesaran Shin (IPS). Berikut adalah uji hipotesisnya.

1. Hipotesis

H 0 : data tidak stasioner H 1 : data stasioner

2. Taraf signiﬁkansi : α = 0.05 3. Statistik uji :

t = 1 N

∑ t i (2.3)

dengan t adalah nilai IPS, t i adalah nilai t hitung dari augmented Dickey Fuller (ADF) wilayah ke-i. Nilai t i diperoleh dari

t i =

∑

Z(t −1)Z(t)

∑

Z(t −1)

− 1

√ ∑

(Z(t) −ηZ(t−1))

n −1

(2.4)

4. Daerah kritis (DK) : {t | t > t

;n } 5. Keputusan uji : H 0 ditolak jika t ∈ DK

dengan α adalah tingkat kesalahan, n adalah banyaknya data, p adalah banyaknya parameter, dan Z t data pengamatan ke-t.

2.2.5 Pembobot Normalisasi Korelasi Silang pada Model VAR-GSTAR

Pembobot lokasi yang digunakan dalam penerapan model VAR-GSTAR

pada curah hujan adalah pembobot normalisasi korelasi silang. Pembobot loka-

si normalisasi korelasi silang merupakan pembobot lokasi dengan menggunakan

commit to user

hasil normalisasi korelasi silang antar lokasi pada lag waktu yang bersesuaian.

Oleh karena itu, menurut Suhartono dan Atok [18] pembobot normalisasi kore- lasi silang memberikan semua kemungkinan hubungan yang terjadi antar lokasi.

Pembobot normalisasi korelasi silang tersebut oleh Suhartono dan Subanar [17]

dinyatakan sebagai

w ij (k) = r ij (k)

d ^′ (x _ij , x _ic ) =

(x _ij − x ic ) ² + (x _ij − x ic ) ² + . . . + (x _ij − x ic ) ² (2.1) dengan x ij adalah data curah hujan pada lokasi ke-i bulan ke-j dan x ic adalah data curah hujan bulanan pada lokasi ke-i dan centroid ke-c .

Y _t = c + ϕ ₁ Y _(t ₋₁₎ + ϕ ₂ Y _(t ₋₂₎ + ... + ϕ _p Y _(t _−p) + ε _t , t = 1, . . . , T

dengan Y _t = (y _1t , y _2t , ..., y _nt )

merupakan vektor variabel runtun waktu pada wak- tu ke-t (n x 1), ϕ adalah matriks koeﬁsien (n x n) dan ε _t adalah vektor sisaan white noise pada waktu ke-t (n x 1).

Z _i (t) =

Φ ⁱ _kl W ^l (k)Z _i (t − k) + e i (t) (2.2)

dengan Φ ⁱ _kl merupakan matriks diagonal ruang waktu dengan lag spasial l dan

lag waktu ke-k pada daerah i, W ^l (k) yaitu matriks pembobot ukuran (n × n),

e _i,t yaitu sisaan (n × 1) yang berdistribusi normal pada daerah i dan waktu ke-t,

H ₀ : data tidak stasioner H ₁ : data stasioner

∑ t _i (2.3)

dengan t adalah nilai IPS, t _i adalah nilai t _hitung dari augmented Dickey Fuller (ADF) wilayah ke-i. Nilai t _i diperoleh dari

t _i =

√ _∑

;n } 5. Keputusan uji : H ₀ ditolak jika t ∈ DK

w _ij (k) = r _ij (k)

r _ij (k) =

t=k+1 [Z _i (t) − ¯ Z _i ][Z _j (t − k) − ¯ Z _j ]

√ ( ∑ _n

t=1 [Z _i (t) − ¯ Z _i ] ² )( ∑ _n

t=1 [Z _j (t) − ¯ Z _j ] ² ) . (2.6) Pembobot ini dihitung berdasarkan korelasi antar lokasi pada data curah hujan.

+ 2K ²