commit to user
BAB II
LANDASAN TEORI
Pada bagian pertama bab kedua ini diberikan tinjuan pustaka yang berisi penelitian sebelumnya yang mendasari penelitian ini. Pada bagian kedua bab ini diberikan teori penunjang yang berisi definisi-definisi sebagai dasar pengertian untuk memperoleh pembahasaan selanjutnya. Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan alur penelitian.
2.1 Tinjauan Pustaka
Keragaman data yang rendah menyebabkan model yang dikonstruksikan menjadi lebih baik. Keragaman yang rendah dapat diperoleh dari proses pe- ngelompokkan. Anderberg [2] menyatakan bahwa pengelompokkan pada meto- de cluster tidak berdasarkan pada kategori yang sudah ditentukan sebelumnya.
K-means clustering bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang mirip. K-means clustering diperlukan untuk meminimumkan ragam pada data yang memiliki efek ruang dan waktu.
Data yang memiliki efek waktu dapat diterapkan ke dalam model runtun waktu. Data yang memiliki efek ruang dapat diterapkan ke dalam model spasial.
Jika data memiliki efek waktu dan ruang maka dapat diterapkan ke dalam model ruang waktu. Model ruang waktu pertama kali diperkenalkan oleh Pfeifer dan Deustch [13] yaitu model STAR. Kemudian pada tahun 2002 Borovkova et al. [3]
mengembangkan model STAR menjadi model GSTAR. Wutsqa dan Suhartono
[6] menyatakan bahwa model VAR yang direpresentasikan ke dalam model GS-
TAR disebut model VAR-GSTAR. Model VAR-GSTAR menyaratkan data harus
berpola stasioner dan memiliki sisaan white noise. Model VAR-GSTAR memiliki
orde waktu dan orde ruang.
commit to user
Karena adanya efek ruang, keterkaitan antar ruang dalam model dapat dinyatakan menggunakan pembobot. Salah satu pembobot dalam model VAR- GSTAR adalah normalisasi korelasi silang (Suhartono dan Subanar, [17]). Bo- bot lokasi normalisasi korelasi silang memberikan semua kemungkinkan bentuk hubungan antar lokasi dengan mempertimbangkan lag waktu. Pembobot norma- lisasi korelasi silang bersifat fleksibel pada nilainya dan tanda hubungan antar lokasi yang berlainan yaitu positif dan negatif.
2.2 Teori-Teori Penunjang
Pada bagian ini dijelaskan definisi dan teori yang dipakai dalam mencapai tujuan penelitian. Selanjutnya diberikan gambaran tentang k-means clustering, model VAR, model VAR-GSTAR, kestasioneran model VAR-GSTAR, pembobot normalisasi korelasi silang pada model VAR-GSTAR, identifikasi model, pendu- gaan parameter, regresi stepwise, dan validasi model VAR-GSTAR.
2.2.1 K-means Clustering
Teknik pengelompokkan yang didasarkan pada kemiripan objek disebut clustering. Clustering digunakan untuk menggabungkan observasi-observasi ke dalam kelompok-kelompok yang memiliki karakteristik sama. Menurut MacQu- een [11], k-means clustering memiliki k banyaknya cluster dan means sebagai pusat cluster. Metode pengelompokkan ini didasarkan pada kemiripan objek menggunakan alat ukur, yaitu jarak. Jarak yang digunakan dalam penelitian ini adalah jarak euclidean.
Menurut Johnson dan Wichern [10] algoritme k-means clustering dinyata- kan sebagai berikut.
1. Menentukan banyaknya k cluster serta menetapkan means sebagai pusat cluster.
2. Menghitung jarak setiap nilai observasi ke pusat cluster menggunakan jarak
euclidean.
commit to user
3. Mengelompokkan data ke dalam cluster dengan jarak terpendek.
4. Mengulangi langkah ke-2 dan ke-3 hingga pusat cluster menjadi tetap.
Jarak euclidean digunakan untuk menentukan kemiripan anggota dalam cluster. Menurut Anderberg [2], jarak euclidean dirumuskan sebagai
d ′ (x ij , x ic ) =
√
(x ij − x ic ) 2 + (x ij − x ic ) 2 + . . . + (x ij − x ic ) 2 (2.1) dengan x ij adalah data curah hujan pada lokasi ke-i bulan ke-j dan x ic adalah data curah hujan bulanan pada lokasi ke-i dan centroid ke-c .
2.2.2 Model Vector Autoregressive (VAR)
Model VAR dikemukakan oleh Sims [16] dalam bidang makroekonomi. Pe- nelitian ini menjelaskan jika dalam suatu persamaan terdapat sifat simultan, ma- ka semua variabel dianggap variabel endogen. Model VAR (p) dinyatakan sebagai
Y t = c + ϕ 1 Y (t −1) + ϕ 2 Y (t −2) + ... + ϕ p Y (t −p) + ε t , t = 1, . . . , T
dengan Y t = (y 1t , y 2t , ..., y nt )
′merupakan vektor variabel runtun waktu pada wak- tu ke-t (n x 1), ϕ adalah matriks koefisien (n x n) dan ε t adalah vektor sisaan white noise pada waktu ke-t (n x 1).
2.2.3 Model Vector Autoregressive-Generalized Space Time Autoregressive (VAR-GSTAR)
Menurut Wutsqa dan Suhartono [6], model VAR-GSTAR merupakan mo- del VAR yang direpresentasikan ke dalam model GSTAR. Model VAR-GSTAR dinyatakan sebagai
Z i (t) =
∑ p k=1
λ
s∑
l=0
∑ n i=1
Φ i kl W l (k)Z i (t − k) + e i (t) (2.2)
dengan Φ i kl merupakan matriks diagonal ruang waktu dengan lag spasial l dan
lag waktu ke-k pada daerah i, W l (k) yaitu matriks pembobot ukuran (n × n),
e i,t yaitu sisaan (n × 1) yang berdistribusi normal pada daerah i dan waktu ke-t,
Z i,t yaitu nilai observasi pada daerah i dan waktu ke-t.
commit to user
2.2.4 Kestasioneran Model VAR-GSTAR
Menurut Dhoriva dan Suhartono [6], penerapan model VAR-GSTAR dimu- lai dengan menentukan kestasioneran data. Hal ini sejalan dengan Ruchjana [14]
yang menyatakan bahwa dalam pemodelan VAR-GSTAR data harus stasioner.
Identifikasi pola stasioner dilakukan dengan uji Im Pesaran Shin (IPS). Berikut adalah uji hipotesisnya.
1. Hipotesis
H 0 : data tidak stasioner H 1 : data stasioner
2. Taraf signifikansi : α = 0.05 3. Statistik uji :
t = 1 N
∑ t i (2.3)
dengan t adalah nilai IPS, t i adalah nilai t hitung dari augmented Dickey Fuller (ADF) wilayah ke-i. Nilai t i diperoleh dari
t i =
∑
nt=1
Z(t −1)Z(t)
∑
nt=1
Z(t −1)
2− 1
√ ∑
nt=1