1 PENERAPAN METODE GSTAR
DENGAN PENDEKATAN SPATIO-TEMPORAL UNTUK MEMODELKAN KEJADIAN DEMAM BERDARAH
(STUDI KASUS: JUMLAH PENDERITA DEMAM BERDARAH DI KOTA SURABAYA)
1Novita Dya Gumanti, 2Sutikno, 3Setiawan
1Mahasiswa Jurusan Statistika FMIPA-ITS (1306 100 020),
2,3Dosen Pembimbing, Staf Pengajar Jurusan Statistika FMIPA-ITS,
1[email protected], 2[email protected], 3[email protected]
Abstrak
Penyakit Deman Berdarah Dengue (DBD) berkembang menjadi masalah kesehatan yang serius di dunia, terutama di Indonesia. Salah satu kunci tinggi rendahnya jumlah kasus DBD yang terjadi adalah perilaku masyarakat terhadap lingkungan. Kejadian serta perilaku seperti yang tersebut diatas tentunya berbeda di setiap wilayah. Karena itu pemodelan sebaran wilayah rawan penyakit DBD perlu segera dibuat. Metode statistika yang digunakan untuk mencapai tujuan penelitian tersebut adalah GSTAR. Metode GSTAR mampu mempertimbangkan aspek spatial dan waktu (spatio- temporal) sehingga diperkirakan akan meningkatkan tingkat akurasi. Dalam penelitian ini akan dilakukan penerapan model GSTAR dengan tiga bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak dan bobot lokasi korelasi silang pada data jumlah penderita demam berdarah di Kota Surabaya. Pemodelan hanya dilakukan terhadap empat kecamatan di wilayah Surabaya Pusat dikarenakan keterbatasan data. Hasil analisis menunjukkan, model yang sesuai dengan data yaitu model GSTAR(11) – I(1) untuk empat lokasi. Dari model GSTAR yang terbentuk dipilih model terbaik dari ketiga bobot lokasi yang menghasilkan kesalahan ramalan terkecil. Pemilihan model terbaik didasarkan pada nilai Root Mean Squared Error (RMSE) data outsampel dari model. Pada penelitian ini, didapatkan kesimpulan bahwa model yang paling sesuai dengan kondisi data adalah model GSTAR(11) – I(1) dengan bobot lokasi seragam dengan nilai RMSE sebesar 5,572.
Kata kunci : Model GSTAR, RMSE, Demam Berdarah
1. Pendahuluan
Di Indonesia, penyakit DBD pertama kali ditemukan di Surabaya pada tahun 1968. Sejak pertama kali ditemukan, jumlah kasus menunjukkan kecenderungan meningkat baik dalam jumlah maupun luasan wilayah yang terjangkit. Pada tahun 1970an, kurang dari 10 kota / kabupaten yang terjangkit penyakit DBD, dan pada tahun 2003 sudah menjadi lebih dari 200 kota / kabupaten. Berbagai upaya telah dilakukan, akan tetapi angka kejadian DBD masih terus meningkat. Hal ini menunjukkan bahwa langkah antisipasi masih belum berjalan baik dan langkah penanggulangan belum efektif untuk menekan angka kejadian. Rendahnya hasil antisipasi kejadian DBD antara lain disebabkan karena waktu, tempat dan angka kejadian belum dapat diprediksi dengan baik. Salah satu kunci tinggi rendahnya jumlah kasus DBD yang terjadi adalah perilaku masyarakat terhadap lingkungan. Perilaku tersebut diatas tentunya berbeda di setiap wilayah. Kota Surabaya merupakan kota metropolis dengan kepadatan penduduk yang tinggi. Di samping itu mobilitas penduduknya cukup tinggi, sehingga peluang terjadinya wabah demam berdarah antar kecamatan saling berkaitan. Banyaknya kejadian DBD di Kota Surabaya pada tahun 2005 – 2009 cenderung menurun, namun masih dalam angka yang besar, masing–masing sebanyak 2568; 4187; 3214;
2169; 2268.
Berkaitan dengan permasalahan di atas, maka perlu dilakukan penelitian yang bertujuan untuk menyusun model prediksi kejadian penyakit DBD menurut tempat dan waktu. Luaran model tersebut dapat digunakan untuk menentukan wilayah prioritas pelaksanaan program antisipasi dan penang- gulangan.
Pada penelitian ini dilakukan penyusunan model peramalan yang mempertimbangkan aspek spatial dan waktu (spatio-temporal) sehingga diperkirakan akan meningkatkan tingkat akurasi. Model yang akan dikembangkan adalah Generalized Space Time Autregressive (GSTAR). Pemilihan model terbaik nantinya akan ditetapkan berdasarkan kriteria Akaike’s Information Criterion (AIC) atau nilai Root Mean Squared Error (RMSE). Metode GSTAR telah digunakan beberapa kasus dan menunjukkan
2 kinerja yang cukup baik, diantaranya prediksi curah hujan di Kabupaten Ngawi (Ningrum,2010), ramalan data produksi gas di Joint Operating Body Pertamina-Petrochina East Java (JOB P-PEJ) oleh Shofiya (2009) dan Elliyana (2009).
2. Tinjauan Pustaka
Pustaka yang digunakan dalam penelitian ini meliputi konsep mengenai analisis time series, dan penyakit DBD.
Multivariate Time Series
Multivariate time series atau deret waktu multivariate merupakan deret waktu yang terdiri dari beberapa variabel. Hal seperti ini sering kali terjadi pada beberapa studi empirik. Contohnya, dalam studi mengenai penjualan. Beberapa variabel yang mungkin terlibat adalah volume penjualan, harga barang, dan biaya iklan. Identifikasi pada model multivariate time series hampir sama dengan model univariate time series. Identifikasi tersebut dapat dilakukan berdasarkan pola atau struktur matriks fungsi korelasi (MACF) dan matriks fungsi korelasi parsial (MACF) setelah data sudah stasioner (Wei, 2006).
Secara visual kestasioneran data pada model multivariate time series juga dapat dilihat dari plot MACF dan PACF serta plot Box-Cox. Plot MACF yang turun secara lambat mengindikasikan bahwa data belum stasioner dalam mean sehingga perlu dilakukan differencing untuk menstasionerkan data.
Demikian juga dengan kestasioneran dalam varians. Agar data stasioner dalam varians, maka transformasi perlu dilakukan.
Model Generalized Space TimeAutregressive (GSTAR)
Model GSTAR merupakan pengembangan dari model STAR model ini cenderung lebih fleksibel dibandingkan model STAR. Secara matematis, notasi dari model GSTAR(p1) adalah sama dengan model STAR(p1). Perbedaan utama dari model GSTAR(p1) ini terletak pada nilai-nilai parameter pada lag spasial yang sama diperbolehkan berlainan. Pada model STAR adalah pada parameter autoregresifnya yang diasumsikan sama pada seluruh lokasi. Dalam notasi matriks, model GSTAR(p1) dapat ditulis sebagai berikut :
∑ Φ Φ (2.1) dengan
- Φ diag , … , dan Φ diag , … ,
- Pembobot dipilih sedemikian hingga 0 dan ∑ 1
Penaksir parameter model GSTAR dilakukan dengan menggunakan metode kuadrat terkecil dengan cara meminimumkan jumlah kuadrat simpangannya.
Pemilihan Bobot Lokasi pada Model GSTAR
Salah satu permasalahan utama pada pemodelan GSTAR adalah pemilihan atau penentuan bobot lokasi. Terdapat beberapa cara penentuan bobot lokasi yang sering digunakan dalam aplikasi model GSTAR yaitu (Suhartono dan Atok, 2006):
a. Bobot seragam (Uniform)
Nilai dari bobot seragam dihitung dengan rumus
! dengan " adalah jumlah lokasi yang berdekatan dengan lokasi i. Bobot lokasi ini memberikan nilai bobot yang sama untuk masing-masing lokasi. Oleh karena itu, bobot lokasi ini seringkali digunakan pada data yang lokasinya homogen atau mempunyai jarak antar lokasi yang sama.
B A
C
1 2
3
3 b. Bobot biner (Binary)
Nilai dari bobot biner adalah 0 atau 1. Nilai tersebut dipakai tergantung pada suatu batasan tertentu.
Untuk contoh kasus pada Gambar 3.1 #$ = 1 dan #% 0 . Nilai #$ lebih besar daripada #% karena jarak antara lokasi A dengan lokasi B lebih dekat dibanding dengan jarak antara lokasi A dengan lokasi C. Jarak yang lebih dekat diduga mempunyai hubungan yang lebih kuat.
c. Bobot inverse jarak
Nilai dari bobot invers jarak didapatkan dari perhitungan berdasarkan jarak sebenarnya antara lokasi.
Lokasi yang berdekatan mendapatkan nilai bobot yang lebih besar. Berikut perhitungan bobotnya.
d. Bobot berdasarkan pada semi-variogram atau kovariogram dari variable antar lokasi
Bobot lokasi ini digunakan untuk lokasi yang jumlahnya banyak. Penggunaan bobot lokasi ini memungkinkan suatu bobot nilainya bertanda negatif.
e. Bobot berdasarkan pada normalisasi inferensia korelasi silang antar lokasi pada lag waktu yang bersesuaian
Penggunaan bobot lokasi ini pertama kali diperkenalkan oleh Suhartono dan Atok (2006). Secara umum korelasi silang antar dua variabel atau antara lokasi ke-i dan ke-j pada lag waktu ke-k, corr
&'(), '( * +), didefinisikan sebagai :
-'+) .0!/')
!0/ , + 0, 11, 12, … (2.2) dengan 3 adalah kovarians silang antara kejadian di lokasi ke-i dan ke-j pada lag waktu ke-k, 4 dan 4 adalah deviasi standar dari kejadian di lokasi ke-i dan ke-j.
Kriteria Pemilihan Model Terbaik
Akaike’s Information Criterion (AIC) dan nilai Root Mean Squared Error (RMSE) akan digunakan dalam proses pemilihan model terbaik. Pemilihan ini dilakukan berdasarkan kriteria in sample dan out sample. Akaike’s Information Criterion (AIC) digunakan pada in sample dan nilai Root Mean Squared Error (RMSE) untuk out sample. Berikut akan dijelaskan masing-masing kriteria pemilihan model terbaik.
a. Akaike’s Information Criteria (AIC)
Salah satu kriteria pemilihan dalam penentuan model terbaik pada data training adalah Akaike’s Information Criteria (AIC). Model terbaik adalah model dengan nilai AIC paling kecil. Berikut cara perhitungan nilai AIC (Lutkepohl, 2005):
567'8) log ;('∑ '8)~= ) >?> (2.3) Log adalah notasi logaritma natural, det(.) merupakan notasi determinan, dan ∑ '8) @ ∑C ABAB′
~
=
adalah matriks taksiran kovarian residual dari model VAR'8).
b. Root Mean Squared Error (RMSE)
Root Mean Squared Error (RMSE) adalah Ukuran perbedaan antara nilai prediksi dari model atau penaksir dengan nilai sebenarnya dari observasi. RMSE digunakan untuk memperoleh gambaran keseluruhan standar deviasi yang muncul saat menunjukkan perbedaan antar model, atau hubungan yang dimiliki. Untuk mengetahui besarnya nilai RMSE, dapat digunakan rumus sebagai berikut :
DEFG √EFG IJ ∑ J * K> (2.4) dimana M merupakan banyak ramalan yang dilakukan.
3. Metodologi Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Departemen Kesehatan Kota Surabaya. Variabel yang digunakan adalah data Penderita DBD bulanan di Surabaya Pusat per kecamatan selama 9 tahun (2000 – 2009). Data penderita demam berdarah didapatkan dari laporan adanya kejadian dari masyarakat ke puskesmas setempat melalui keputusan dokter yang
4 kemudian dikumpulkan di Dinas Kesehatan. Adapun daftar kecamatan di Surabaya adalah sebagai berikut.
1. Tegalsari 2. Simokerto 3. Genteng 4. Bubutan 5. Gubeng 6. Gunung anyar 7. Sukolilo 8. Tambaksari 9. Mulyorejo 10. Rungkut
11. Tenggilis Mejoyo
12. Bulak 13. Kenjeran 14. Semampir 15. Pabean Cantikan 16. Krembangan 17. Wonokromo 18. Wonocolo 19. Wiyung 20. Karang pilang 21. Jambangan 22. Gayungan
23. Dukuh Pakis 24. Sawahan 25. Benowo 26. Pakal 27. Aserowo 28. Sukomanunggal 29. Tandes
30. Sambikerep 31. Lakarsantri
Metode time series yang digunakan pada penelitian ini adalah pemodelan GSTAR dengan tiga bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak dan bobot lokasi korelasi silang.
Pemodelan dilakukan pada data training. Pemilihan model terbaik pada data training berdasarkan pada nilai AIC. Selanjutnya dilakukan peramalan untuk data testing. Dari hasil ramalan tersebut dapat diketahui model terbaik yaitu model dengan nilai RMSE terkecil. Tahapan analisis data yang digunakan dalam penelitian ini dijabarkan secara rinci sebagai berikut :
1. Untuk mencapai tujuan pertama, maka langkah yang akan dilakukan adalah mendeskripsikan pola kejadian DBD di tiap kecamatan dengan menggunakan histogram.
2. Untuk mencapai tujuan kedua yaitu menyusun model kejadian DBD Kota Surabaya dengan menggunakan pendekatan spatio-temporal, akan dilakukan dengan beberapa tahap, yaitu:
a. Mengidentifikasi data dengan asumsi-asumsi dasar time series.
b. Menentukan estimasi parameter untuk masing-masig bobot lokasi.
c. Menetukan orde VAR model GSTAR yang akan dipakai dalam menentukan model tiap wilayah pada masing-masing bobot lokasi.
d. Analisis data menggunakan metode GSTAR untuk masing-masing bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak, dan bobot lokasi korelasi silang.
e. Mendapatkan model GSTAR tiap lokasi pos hujan untuk masing-masing bobot lokasi yaitu bobot seragam dan bobot inverse jarak.
f. Melakukan uji asumsi residual dari model yang diperoleh untuk masing-masing bobot lokasi.
g. Melakukan forecast / peramalan jumlah penderita demam berdarah masing-masing wilayah dengan data outsampel.
h. Menentukan model terbaik berdasarkan nilai RMSE data outsampel dari hasil forecast yang dilakukan untuk masing-masing bobot lokasi.
4. Analisis dan Pembahasan
Pada bagian ini akan dijelaskan secara rinci mengenai hasil serta analisis dari pengolahan data jumlah penderita demam berdarah di empat kecamatan di Surabaya Pusat. Analisis yang dilakukan meliputi pendeskripsian karakteristik data pada tiap wilayak dan pencarian model terbaik untuk meramalkan jumlah penderita demam berdarah pada beberapa waktu kedepan.
4.1 Karakteristik Data Demam Berdarah
Data yang digunakan dalam penelitian ini adalah data jumlah penderita demam berdarah di 31 kecamatan di Kota Surabaya selama periode tahun 2001-2009. Karakteristik data demam berdarah diwakili oleh statistika deskriptif. Pada Tabel 4.1 berikut disajikan statistika deskriptif dari data tersebut.
5 Tabel 4.1 Nilai Rataan, Standar deviasi, Minimum, dan
Maksimum Data jumlah penderita demam derdarah di setiap kecamatan
Kecamatan Mean N SD Min Max
Sukomanunggal 7,046 108 8,231 0 46
Tandes 7,815 108 8,959 0 40
Asemrowo 2,565 108 3,256 0 17
Benowo 2,176 108 3,057 0 19
Pakal 1,630 108 2,249 0 12
Lakarsantri 2,981 108 3,727 0 20 Sambikerep 3,000 108 3,586 0 17
Genteng 6,343 108 6,711 0 31
Tegalsari 6,889 108 8,023 0 38
Bubutan 7,167 108 7,894 0 44
Simokerto 6,259 108 7,478 0 32
Pabean
Cantikan 4,954 108 5,118 0 24
Semampir 8,546 108 8,516 0 44
Krembangan 8,741 108 9,488 0 50
Kenjeran 6,963 108 7,184 0 39
Bulak 1,741 108 2,670 0 16
Tambaksari 14,787 108 17,767 0 83
Gubeng 11,444 108 11,117 0 55
Rungkut 7,259 108 8,731 0 43
T. Mejoyo 5,361 108 6,115 0 27
Gunung Anyar 4,231 108 4,773 0 24
Sukolilo 6,639 108 7,652 0 48
Mulyorejo 5,333 108 5,876 0 39
Sawahan 14,731 108 12,309 1 70
Wonokromo 7,574 108 9,360 0 51
Dukuh Pakis 4,824 108 4,534 0 22 Karang Pilang 4,102 108 5,006 0 24
Wiyung 4,880 108 4,556 0 22
Gayungan 3,630 108 4,692 0 26
Wonocolo 6,778 108 7,467 0 29
Jambangan 4,213 108 4,616 0 19
Dari hasil ringkasan pada tabel 4.1 memberikan keterangan bahwa rata-rata jumlah penderita dari tahun 2001-2009 pada masing-masing variabel berbeda. Rata-rata tertinggi terdapat pada Kecamatan Tambaksari yaitu sebesar 14 orang dengan jumlah tertinggi sebesar 83 orang yang terjadi pada bulan Maret 2006 dan jumlah terendah sebesar 0 orang yang terjadi pada beberapa bulan selama tahun 2001- 2009. Sedangkan rata-rata terendah terdapat pada Kecamatan Pakal yaitu sebesar 1 orang. Jumlah tertinggi dan terendah ini tidak terulang pada bulan yang sama di tahun-tahun berikutnya.
Pola data jumlah penderita demam berdarah bulanan di tiap Kecamatan selama tahun 2001-2009 menunjukkan rata-rata kejadian yang berbeda tiap bulannya secara jelas dapat dilihat pada Gambar 4.1 di bawah ini. Dari gambar, dapak diketahui bahwa keempat variabel memiliki pola yang hampir sama yaitu mengalami kenaikan serta penurunan pada waktu yang hampir sama
0 5 10 15 20
1 2 3 4 5 6 7 8 9 10 11 12
Sukomanunggal
0 5 10 15 20
1 2 3
Tandes
0 0,5 1 1,5 2 2,5 3
1 2 3 4 5 6 7 8 9 10 11 12
Pakal
0 1 2 3 4 5 6
1 2 3
Lakarsantri
0 5 10 15
1 2 3 4 5 6 7 8 9 10 11 12
Tegalsari
0 5 10 15
1 2
Bubutan
0 5 10 15 20
1 2 3 4 5 6 7 8 9 10 11 12
Semampir
0 5 10 15 20
1 2 3
Krembangan
0 5 10 15 20 25 30 35
1 2 3 4 5 6 7 8 9 10 11 12
Tambaksari
0 5 10 15 20 25
1 2 3
0 2 4 6 8 10
1 2 3 4 5 6 7 8 9 10 11 12
Gunung Anyar
0 5 10 15 20
1 2 3
4 5 6 7 8 9 10 11 12
Tandes
0 1 2 3 4 5 6
1 2 3 4 5 6 7 8 9 10 11 12
Asemrowo
0 1 2 3 4 5
1
4 5 6 7 8 9 10 11 12
Lakarsantri
0 1 2 3 4 5 6
1 2 3 4 5 6 7 8 9 10 11 12
Sambikerep
0 5 10 15
3 4 5 6 7 8 9 10 11 12
Bubutan
0 5 10 15
1 2 3 4 5 6 7 8 9 10 11 12
Simokerto
0 2 4 6 8 10 12
Pabean Cantikan
3 4 5 6 7 8 9 10 11 12
Krembangan
0 2 4 6 8 10 12 14
1 2 3 4 5 6 7 8 9 10 11 12
Kenjeran
0 1 2 3 4
1
3 4 5 6 7 8 9 10 11 12
Gubeng
0 5 10 15 20
1 2 3 4 5 6 7 8 9 10 11 12
Rungkut
0 2 4 6 8 10 12
3 4 5 6 7 8 9 10 11 12
Sukolilo
0 2 4 6 8 10 12 14
1 2 3 4 5 6 7 8 9 10 11 12
Mulyorejo
0 5 10 15 20 25 30
6
1 2 3 4 5 6 7 8 9 10 11 12
Benowo
1 2 3 4 5 6 7 8 9 10 11 12
Genteng
1 2 3 4 5 6 7 8 9 10 11 12
Pabean Cantikan
1 2 3 4 5 6 7 8 9 10 11 12
Bulak
1 2 3 4 5 6 7 8 9 10 11 12
T. Mejoyo
1 2 3 4 5 6 7 8 9 10 11 12
Sawahan
7 Gambar 4.1 Rata-Rata Jumlah Penderita Demam Berdarah Bulanan Tiap Kecamatan
4.2 Data Analisis
Pembentukan model dalam penelitian ini memprioritaskan kecamatan dengan jumlah penderita tinggi yang terletak dalam satu wilayah/kawasan. Dari 31 kecamatan di Kota Surabaya, hanya digunakan 4 Kecamatan di wilayah Surabaya Pusat. Hal ini juga disebabkan dengan terbatasnya jumlah data. Oleh sebab itu, dalam penelitian ini, pemodelan dilakuan terhadap wilayah Surabaya Pusat yang terdiri dari 4 kecamatan yaitu Genteng, Tegalsari, Bubutan, dan Simokerto. Untuk analisis selanjutnya jumlah penderita demam berdarah di masing-masing kecamatan disebut sebagai variabel. Z1 untuk jumlah penderita demam berdarah di Kecamatan Genteng, Z2 untuk jumlah penderita demam berdarah di Kecamatan Tegalsari, Z3 untuk jumlah penderita demam berdarah di Kecamatan Bubutan, dan Z4 untuk jumlah penderita demam berdarah di Kecamatan Simokerto.
4.3 Korelasi Antar Variabel
Nilai korelasi antar variabel dapat digunakan untuk mengetahui besarnya pengaruh atau hubungan keterkaitan antara satu variabel terhadap variabel yang lain. Tabel 4.2 menunjukkan nilai korelasi antar kecamatan melalui matriks korelasi.
Tabel 4.2 Matriks Korelasi Antar Kecamatan
Variabel Z1 Z2 Z3 Z4
Z1 1
Z2 0,628* 1
Z3 0,703* 0,737* 1 Z4 0,669* 0,531* 0,649* 1
* nyata pada L = 5%
Berdasarkan Tabel 4.2, semua nilai korelasi antar variabel M 0,5 dan memiliki nilai p-value yang lebih kecil dari nilai L yaitu 5%. Hai ini menunjukkan bahwa antar lokasi memiliki hubungan yang signifikan atau mempunyai keterkaitan pada waktu yang sama. Besarnya diagonal pada matriks korelasi di atas adalah 1 karena diagonal tersebut merupakan korelasi variabel dengan dirinya sendiri.
4.4 Model Generalized Space Time Autoregressive
Model GSTAR merupakan salah satu model yang ada dalam analisis time series. Ada dua syarat utama yang harus dipenuhi dalam pemodelan time series, yaitu stasioner dan residual white noise. Asumsi yang harus dipenuhi pada langkah awal dalam identifikasi model yaitu data harus stasioner dalam varians maupun mean. Identifikasi awal stasioner mean dan varian dapat dilihat dari plot time series. Ternyata plot menunjukkan bahwa data belum stationer baik terhadap mean maupun varian.
Untuk mengetahui kestasioneran dalam varians maka dilakukan Box-Cox Transformation. Adapun hasil dari transformasi terhadap data jumlah penderita demam berdarah dapat dilihat pada Gambar 4.2.
0 5 10 15 20
1 2 3 4 5 6 7 8 9 10 11 12
Wonokromo
0 2 4 6 8 10
1 2 3 4 5 6 7 8 9 10 11 12
Dukuh Pakis
0 2 4 6 8 10
1 2 3 4 5 6 7 8 9 10 11 12
Karang Pilang
0 2 4 6 8 10 12
1 2 3 4 5 6 7 8 9 10 11 12
Wiyung
0 2 4 6 8
1 2 3 4 5 6 7 8 9 10 11 12
Gayungan
0 5 10 15 20
1 2 3 4 5 6 7 8 9 10 11 12
Wonocolo
0 2 4 6 8
1 2 3 4 5 6 7 8 9 10 11 12
Jambangan
8 Gambar 4.2 Plot Box-Cox Untuk Z1, Z2, Z3 dan Z4.
Dari gambar 4.2, diketahui bahwa nilai batas bawah, batas atas, lambda estimate, dan rounded value masing-masing variabel tidak sama. Karena nilai tersebut tidak sama pada masing-masing variabel, maka jika dilakukan transformasi harus sesuai dengan nilai lambda estimasion masing-masing variabel. Namun pada penelitian ini tidak dilakukan transformasi karena belum ada jaminan bahwa model yang didapatkan dari hasil transformasi akan lebih baik daripada model tanpa transformasi.
Gambar 4.3 Nilai AIC
Gambar 4.3 menunjukkan adanya beberapa lag yang keluar dari batas standar deviasi. Jumlah lag yang keluar lebih dari satu. Hal ini menandakan bahwa model yang terbentuk lebih dari satu. Maka dari itu perlu dilakukan identifikasi terhadap nilai AIC dari masing-masing model. Nilai AIC dalam gambar 4.6 menunjukkan nilai terkecil yaitu 13,606353 pada AR1 dan MA 0. Dengan demikian didaparkan model VAR(1) dengan data hasil differ-rencing tingkat 1. Maka model GSTAR yang digunakan adalah GSTAR (11)-I(1).
Langkah selanjutnya adalah penaksiran parameter yang didasarkan pada dugaan model yang telah diperoleh pada tahap identifikasi. Penaksiran parameter dilakukan sesuai dengan bobot lokasi yang digunakan, adapun bobot lokasi yang digunakan yaitu: bobot seragam = w P
0 0,33 0,33 0,33 0,33 0 0,33 0,33 0,33 0,33 0 0,33 0,33 0,33 0,33 0
R , bobot invers jarak =
w P
0 0,204 0,598 0,198 0,483 0 0,299 0,218 0,451 0,322 0 0,227 0,272 0,314 0,414 0
R , dan bobot korelasi silang = w P
0 0,207 0,468 0,325 0,184 0 0,582 0,234 0,129 0,361 0 0,510 0,419 -0,065 0,0646 0
R . Setelah didapatkan nilai bobot, selanjutnya dilakukan estimasi parameter untuk model GSTAR(11) – I(1).
3 2 1 0 -1 20
15
10
5
Lambda
StDev
Lower CL Upper CL
Limit
Estimate 0,09
Lower CL -0,12
Upper CL 0,31
Rounded Value 0,00 (using 95,0% confidence)
Lambda Box-Cox Plot of bGenteng
3 2 1 0 -1 25
20
15
10
5
0
Lambda
StDev
Lower CL Upper CL
Limit Estimate 0,12 Lower CL -0,09 Upper CL 0,31 Rounded Value 0,00 (using 95,0% confidence)
Lambda Box-Cox Plot of bTegalsari
3 2 1 0 -1 25
20
15
10
5
Lambda
StDev
Lower CL Upper CL
Limit Estimate 0,13 Lower CL -0,09 Upper CL 0,32 Rounded Value 0,00 (using 95,0% confidence)
Lambda Box-Cox Plot of bBubutan
3 2 1 0 -1 30 25 20
15
10 5
0
Lambda
StDev
Lower CL Upper CL
Limit Estimate 0,12 Lower CL -0,09 Upper CL 0,31 Rounded Value 0,00 (using 95,0% confidence)
Lambda Box-Cox Plot of bSimokerto
Minimum Information Criterion
Lag MA 0 MA 1 MA 2 MA 3 MA 4 MA 5 AR 0 14.238808 13.720354 13.864419 14.087346 14.304841 14.477839 AR 1 13.606353 13.773983 14.0292 14.297982 14.553172 14.720012 AR 2 13.781413 13.899621 14.239834 14.675018 14.945108 15.10927 AR 3 13.993212 14.262957 14.567211 14.98536 15.435766 15.721029 AR 4 14.178589 14.532149 14.965731 15.47111 15.969648 16.404346 AR 5 14.435699 14.814458 15.286409 15.867296 16.259319 17.099688 AR 6 14.88719 15.605475 16.193542 16.910012 17.4709 18.538043 AR 7 15.216868 16.054964 17.021997 17.907066 18.683398 20.014482 AR 8 15.921874 16.914387 18.075839 19.453375 20.568202 22.337111 AR 9 16.469161 17.665682 19.090113 20.814424 22.944455 25.391095 AR 10 17.427943 18.902198 20.695211 22.922893 25.765108 29.516832
9 Tabel 4.3 Taksiran parameter model GSTAR (11)-I(1)
Parameter
Bobot Seragam Bobot Invers Jarak Bobot Korelasi Silang Nilai
Taksiran p-value Nilai
Taksiran p-value Nilai
Taksiran p-value
0,330 0,011* 0,3874 0,004* 0,261 0,051**
> 0,533 0,000* 0,5678 0,000* 0,460 0,000*
Y 0,349 0,010* 0,4145 0,002* 0,267 0,035*
Z 0,547 0,000* 0,5466 0,000* 0,573 0,000*
0,508 0,000* 0,4328 0,001* 0,651 0,001*
> 0,392 0,002* 0,3457 0,006* 0,604 0,011*
Y 0,595 0,000* 0,5116 0,001* 1,129 0,000*
Z 0,255 0,048* 0,2236 0,049* -0,098 0,762
* nyata pada L = 5%
** nyata pada L = 10%
Tabel diatas menjelaskan bahwa banyak parameter yang signifikan, tetapi ada satu yang tidak signifikan karena nilai p lebih dari [. Parameter yang tidak signifikan tersebut seharusnya tidak dimasukkan dalam persamaan model, namun untuk mengetahui nilai ramalan dari model GSTAR dengan bobot lokasi korelasi silang maka semua parameter akan dimasukkan kedalam model.
Tahap selanjutnya yaitu cek diagnosis untuk mengetahui dan memastikan apakah model dugaan sudah merupakan model yang sesuai untuk data yang ada. Model GSTAR(11) – I(1) dikatakan sesuai jika residualnya white noise dan berdistribusi multivariate normal, sehingga perlu dilakukan identifikasi untuk melihat apakah residual dari model sudah white noise dan berdistribusi multivariate normal. Identifikasi white noise dapat dilihat pada skema matriks korelasi silang antar residual pada Gambar 4.4 di bawah ini.
Gambar 4.4 Skema MatrikKorelasi Silang Residual Z1, Z2, Z3, Z4 dengan (a) Bobot Lokasi Seragam, (b) Bobot Lokasi Invers Jarak, dan (c) Bobot Lokasi Korelasi Silang.
Ketiga skema diatas menyajikan banyaknya simbol (.) daripada (+) dan (-) pada lag 1. Hal ini berarti tidak ada nilai korelasi silang yang keluar secara bersama-sama melampaui batas standar dari masing-masing variabel pada lag 1 dan sebelumnya, sehingga dpat dikataan bahwa hasil residual model dengan bobot lokasi seragam, invers jarak, maupun korelasi silang adalah saling bebas atau white noise.
Setelah asumsi white noise dipenuhi, maka asumsi berikut-nya yang juga harus dipenuhi adalah residual berdistribusi normal. Hasil pengujian distribusi normal dari residual model GSTAR (11)-I(1) dengan bobot lokasi seragam, invers jarak dan korelasi silang selengkapnya ditampilkan pada tabel 4.4
Schematic Representation of Cross Correlations
Variable/
Lag 0 1 2 3 4 5 6 7 8 9 10 11 12
resiZ1 ++++ -... ... .... .... .... .... .... .... .... .... .... ....
resiZ2 +++. .-.. .... .... .... .... .... .... .... .... .... .... ....
resiZ3 ++++ .... .... .... .... .... .... .... .... .... .... .... ....
resiZ4 +.++ ---- .... .... .... .... .... .... .... ..-. .... .... ....
+ is > 2*std error, - is < -2*std error, . is between (c)
Schematic Representation of Cross Correlations
Variable/
Lag 0 1 2 3 4 5 6 7 8 9 10 11 12
resiZ1 ++++ .... .... .... .... .-.. .... .... .... .... .-.. .... ....
resiZ2 +++. .... .... .+.. .... .... .... .... .... .... .... .... ....
resiZ3 ++++ -... .... .... -... .... ..+. .... .... .... .-.. .... ....
resiZ4 +.++ -.-- .... .... .... +... .... .... .... ..-. .... .... ....
+ is > 2*std error, - is < -2*std error, . is between (b) Schematic Representation of Cross Correlations
Variable/
Lag 0 1 2 3 4 5 6 7 8 9 10 11 12
resiZ1 ++++ -... .... .... .... .... .... .... .... .... .-.. .... ....
resiZ2 ++++ .... -.-. .... .... .... .... .... .... .... .-.. .... ....
resiZ3 ++++ .... .... .... -... .... ..+. .... .... .... .-.. .... ....
resiZ4 ++++ ---- ...+ .... .... .... .... .... .... ..-. .... .... ....
+ is > 2*std error, - is < -2*std error, . is between (a)
10 Tabel 4.4 Normality Test Residual
Nilai Bobot Lokasi
Seragam Invers Jarak Korelasi Silang Rata-rata -0,02473 -0,02855 -0,01992
Standar Deviasi 8,569 8,535 9,137
N 376 376 376
Kolmogorov Smirnov 0,117 0,109 0,130
Nilai P 0,010 0,010 0,010
Dari Tabel diatas dapat disimpulkan bahwa residual model GSTAR (11)-I(1) dengan bobot lokasi seragam, invers jarak dan korelasi silang tidak berdistribusi normal. Hal ini ditunjukkan dengan nilai P- value kurang dari 5%. Ketidaknormalan pada residual model ini mungkin saja terjadi karena adanya nilai ekstrim (outlier).
Peramalan Model GSTAR (11)-I(1)
Model GSTAR yang telah didapatkan digunakan untuk mendapatkan nilai pada periode yang akan datang atau peramalan untuk setiap lokasi dengan ketiga bobot lokasi. Hasil peramalan selama 12 bulan dapat dilihat pada gambar 4.5 berikut.
Gambar 4.5 Plot Nilai Asli dan Nilai hasil Peramalan Model GSTAR (11)-I(1) dengan Bobot Lokasi Seragam, Invers Jarak, dan Korelasi Silang di Kecamatan Genteng, Tegalsari, Bubutan, dan Simokerto.
Hasil peramalan dibandingkan dengan data out sample yaitu data pada tahun 2009. Hasil peramalan model GSTAR (11)-I(1) yang terletak setelah garis vertikal selalu mengalami nilai yang hampir konstan, padahal nilai sebenarnya mengalami perubahan yang cukup besar.
Pemilihan Model Terbaik
Pemilihan model terbaik dilakukan dengan membandingkan nilai RMSE yang mewakili ketepatan ramalan untuk masing-masing pos dengan ketiga bobot lokasi pada data jumlah penderita demam berdarah.
Tabel 4.5 RMSE Out-Sample Model GSTAR (11)
Kecamatan RMSE
Seragam Invers Jarak Korelasi Silang
Genteng 4,402 4,845 4,045
Tegalsari 6,174 6,301 6,281
Bubutan 7,044 7,852 6,455
Simokerto 4,667 4,642 5,869
Rata-rata 5,572 5,910 5,662
Year Month
2009 2008 2007 2006 2005 2004 2003 2002 2001
Jan Jan Jan Jan Jan Jan Jan Jan Jan 50 40 30 20 10 0 -10 -20
Data
Jan/2009
Asli Seragam Jarak Korelasi Variable Genteng
Year Month
2009 2008 2007 2006 2005 2004 2003 2002 2001
Jan Jan Jan Jan Jan Jan Jan Jan Jan 60 50 40 30 20 10 0 -10
Data
Jan/2009
Asli Seragam Jarak Korelasi Variable Tegalsari
Year Month
2009 2008 2007 2006 2005 2004 2003 2002 2001
Jan Jan Jan Jan Jan Jan Jan Jan Jan 60 50 40 30 20 10 0 -10 -20 -30
Data
Jan/2009 Asli Seragam Jarak Korelasi Variable Bubutan
Year Month
2009 2008 2007 2006 2005 2004 2003 2002 2001
Jan Jan Jan Jan Jan Jan Jan Jan Jan 60 50 40 30 20 10 0 -10
Data
Jan/2009 Asli Seragam Jarak Korelasi Variable Simokerto
11 Dari tabel 4.5 dapat diketahui bahwa tingkat ketepatan ramalan untuk model GSTAR(11)-I(1) dengan rata-rata RMSE terkecil terletak pada bobot seragam yaitu 5,572. Namun karena hasil rata-rata RMSE ketiga bobot hampir sama, maka dilakukan pengujian dengan Anova. Hasil dari pengujian menunjukkan bahwa nilai rata-rata RMSE dari ketiga bobot lokasi berbeda. Dengan demikian dapat disimpulkan bahwa model yang terbaik adalah model dengan bobot seragam yaitu:
1. Model untuk kecamatan Genteng (Z1)
Z1't)1,33Z1't‐1)‐0,33Z 't‐2)0,17Z>'t‐1)‐0,17Z>'t‐2)0,17ZY't‐1)‐0,17Z3't‐2)0,17Z4't‐1)‐0,17Z4't‐2)e1't)
2. Model untuk kecamatan Tegalsari (Z2)
Z2't)0,13Z1't‐1)‐0,13Z1't‐2)1,53Z2't‐1)‐0,53Z2't‐2)0,13ZY't‐1)‐0,13ZY't‐2)0,13ZZ't‐1)‐0,13Z4't‐2)e1't)
3. Model untuk kecamatan Bubutan (Z3)
Z3't)0,2Z1't‐1)‐0,2Z1't‐2)0,2Z2't‐1)‐0,2Z>'t‐2)1,35Z3't‐1)‐0,35Z3't‐2)0,2ZZ't‐1)‐0,2Z4't‐2)e1't)
4. Model untuk kecamatan Simokerto (Z4)
Z4't)0,09Z1't‐1)‐0,09Z1't‐2)0,09Z>'t‐1)‐0,09Z2't‐2)0,09Z3't‐1)‐0,09Z3't‐2)1,55ZZ't‐1)‐0,55Z4't‐2)e1't)
5. Kesimpulan dan Saran 5.1 Kesimpulan
Berdasarkan hasil penelitian dan analisis yang dilakukan pada tahapan sebelumnya, diperoleh beberapa kesimpulan sebagai berikut :
1. Karakteristik data demam berdarah pada masing-masing kecamatan di Kota Surabaya berbeda. Hal ini ditunjukkan oleh nilai rata-rata. Rata-rata tertinggi penderita dari tahun 2001-2009 terdapat pada Kecamatan Tambaksari yaitu sebesar 14 orang. Sedangkan rata-rata terendah terdapat pada Kecamatan Pakal yaitu sebesar 1 orang.
2. Bobot lokasi yang optimal untuk model GSTAR adalah bobot seragam karena mempunyai RMSE out-sample terkecil yaitu sebesar 5,572.
5.2 Saran
Untuk penelitian selanjutnya, sebaiknya dipertimbangkan juga faktor-faktor lain yang mempengaruhi kejadian demam berdarah termasuk faktor alam. Hal ini diperkirakan dapat meningkatkan akurasi model.
Selain itu, dalam penelitian ini pemodelan jumlah penderita demam berdarah hanya dilakukan terhadap empat kecamatan. Untuk penelitian selanjutnya disarankan untuk menambah jumlah data sehingga dapat memodelkan seluruh kecamatan di Kota Surabaya
Daftar Pustaka
Borovkova, S.A., Lopuhaa, H.P., dan Ruchjana, B.N. (2008). Consistency and Asymptotic Normality of Least Squares Estimators in Generalized STAR Models, Statistica Neerlandica, vol.62, pp. 482-508.
Box, G.E.P., Jenkins, G.M., dan Reinsel, G.C. (1994). Time Series Analysis: Forecasting and Control. 3rd edition, Englewood Cliffs: Prentice Hall.
Cryer, J.D. (1986). Time Series Analysis. PWS-Kent Publishing Co: Boston.
Depkes RI. (2005). Pencegahan dan Pemberantasan Demam Berdarah Dengue Di Indonesia. Direktorat Jenderal Pengendalian Penyakit dan Penyehatan Lingkungan. Departemen Kesehatan RI.
Ellyana, M. (2009). Penerapan GSTAR dan Model ARIMA Untuk Peramalan Data Produksi Minyak Bumi di Joint Operating Body Pertamina-Petrochina East Java (JOB P-PEJ). Tugas Akhir Statistika FMIPA-ITS. Surabaya.
Lopuhaa, H.P. (2002). Space Time Autoregressive Models. Delft University of Technology. Jerman.
Ningrum, S.P. (2010). Pemodelan spatio-temporal dengan metode gstar pada data curah hujan bulanan Di kabupaten ngawi. Tugas akhir Statistika FMIPA-ITS. Surabaya.
Sasmito, Gunawan H, Widiatmoko H.(2006). Informasi Meteorologi Untuk Peringatan Dini Bahaya Demam Berdarah Dengue (DBD) di Wilayah DKI Jakarta. Laporan Proyek Pengembangan Meteorologi dan Geofisika Tahun 2006. BMKG Jakarta.
Shofia, M.A. (2009). Peramalan Data Produksi Gas Di Joint Operating Body Pertamina-Petrochina East Java (Job P-PEJ) Dengan Model Gstar Dan Arima. Tugas Akhir Statistika FMIPA-ITS. Surabaya Suhartono dan Atok, R.M. (2006). Pemilihan Bobot Lokasi yang Optimal pada Model GSTAR, Prosiding
Konferensi Nasional Matematika XIII, Universitas Negeri Semarang, 24-27 Juli 2006, hal. 571-580.
(ISBN : 979-704-457-2).
Wei, W.W.S. (2006). Time Series Analysis: Univariate and Multivariate Methods. Addison-Wesley Publishing Co., USA.