PREDIKSI KEMUNCULAN TITIK PANAS DI PROVINSI RIAU
MENGGUNAKAN
SEASONAL AUTOREGRESSIVE
INTEGRATED MOVING AVERAGE
(SARIMA)
NALAR ISTIQOMAH
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
ABSTRAK
NALAR ISTIQOMAH. Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA). Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Hutan Indonesia merupakan salah satu dari paru-paru dunia yang peranannya sangat penting bagi makhluk hidup. Sayangnya luas hutan di Indonesia semakin berkurang. Salah satu penyebabnya adalah kebakaran hutan. Kebakaran hutan dapat diprediksi melalui kemunculan titik panas yang dipengaruhi oleh cuaca sehingga bersifat musiman. Oleh karena itu, perlu metode yang dapat menangani unsur musiman dalam memprediksi titik panas. Penelitian ini bertujuan membuat model prediksi kemunculan titik panas menggunakan seasonal autoregressive integrated moving average (SARIMA). SARIMA merupakan metode prediksi yang dapat digunakan untuk pemodelan data deret waktu musiman. Pemodelan dilakukan pada data kemunculan titik panas perbulan pada periode 2001 sampai 2012 di wilayah Provinsi Riau. Hasil penelitian menunjukkan bahwa model prediksi terbaik adalah ARIMA(1,0,0)(0,1,2)12 dengan nilai mean absolute percentage error (MAPE) terbaik sebesar 0.579 untuk meramal satu bulan ke depan.
Kata kunci: model prediksi, SARIMA, titik panas
ABSTRACT
NALAR ISTIQOMAH. Prediction for Hotspot Occurrences in Riau Province using Seasonal Autoregressive Integrated Moving Average (SARIMA). Supervised by IMAS SUKAESIH SITANGGANG.
Indonesia’s forests have important roles in the world. Unfortunately, the forest area in Indonesia is on the wane because of forest fires. Forest fires can be predicted by the appearance of hotspots that are influenced by seasonal weather. Therefore, a method that can handle seasonal elements is necessary in predicting hotspots. This research aims to create predictive models for occurrences of hotspots using seasonal autoregressive integrated moving average (SARIMA). The SARIMA is a prediction method that can be used for modelling seasonal time-series data. This research uses monthly data of hotspot occurrences from 2001 to 2012 data in Riau Province. The experimental results show that the ARIMA(1,0,0)(0,1,2)12 model is the best model to predict the number of monthly hotspot occurrences with mean absolute percentage error (MAPE) of 0.579 for predicting one month ahead.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada
Departemen Ilmu Komputer
PREDIKSI KEMUNCULAN TITIK PANAS DI PROVINSI RIAU
MENGGUNAKAN
SEASONAL AUTOREGRESSIVE
INTEGRATED MOVING AVERAGE
(SARIMA)
NALAR ISTIQOMAH
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Penguji :
1 Aziz Kustiyo, SSi MKom
Judul Skripsi : Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA) Nama : Nalar Istiqomah
NIM : G64110033
Disetujui oleh
Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhana wa ta'ala. Shalawat serta salam semoga senantiasa dilimpahkan kepada Nabi Muhammad, keluarganya, sahabatnya, dan kepada kita yang selau berusaha menggapai ridha Allah.
Alhamdulillah atas bimbingan dan petunjuk dari Allah Subhana wa ta'ala serta bimbingan dari semua pihak, penyusunan tugas akhir yang berjudul “Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA)” dapat diselesaikan. Tugas akhir ini tidak mungkin dapat diselesaikan tanpa adanya bantuan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terimakasih dan penghargaan yang setinggi-tingginya kepada:
Ayah (almarhum), Ibu dan keluarga yang selalu mendoakan, memberi nasihat, kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan.
Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah memberi saran, masukan dan ide-ide dalam penelitian ini.
Bapak Aziz Kustiyo, SSi MKom dan Bapak Hari Agung Adrianto, SKom MSi sebagai penguji.
Ibu Yenni Angraini, SSi MSi sebagai dosen Analisis Deret Waktu yang telah memberikan penjelasan mengenai analisis data deret waktu dan SARIMA.
Teman seperjuangan Nida, Rachma, Pristi, Gita, Uci, Gisha, Nadia, Yenni dan Fay yang telah memberikan semangat dan masukan.
Teman-teman Core-i 48 yang telah memberikan pengalaman paling berharga selama 3 tahun ini.
Ka Rangga, Bang Isnan dan teman-teman Pasca Sarjana Ilkom 51 yang telah bersedia membantu, mendoakan dan senantiasa mendukung.
Departemen Ilmu Komputer IPB, staf dan dosen yang telah banyak membantu selama masa perkuliahan hingga penelitian.
Semoga penelitian ini bermanfaat.
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Perumusan Masalah 2
Tujuan Penelitian 2
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
SARIMA (Seasonal Autoregressive Integrated Moving Average) 2
Bahan 4
Prosedur Analisis Data 4
Plot Data Deret Waktu 4
Pembuatan Model Titik Panas Menggunakan SARIMA 4
Evaluasi Model 7
Peralatan Penelitian 8
HASIL DAN PEMBAHASAN 8
Plot Data Deret Waktu Titik Panas 8
Pembuatan Model Titik Panas Menggunakan SARIMA 9
Evaluasi Model 18
SIMPULAN DAN SARAN 19
Simpulan 19
Saran 19
DAFTAR TABEL
1 Cara identifikasi ordo (Wei 2006) 5
2 Nilai lamda dan transformasinya (Zt adalah data awal) 10
3 Identifikasi ordo non-musiman (p dan q) 12
4 Identifikasi ordo musiman (P dan Q) 13
5 Identifikasi ordo model SARIMA 13
6 Pendugaan parameter model SARIMA 14
7 Nilai p-value uji Ljung-Box dan Shapiro Wilk 15 8 Perbandingan nilai AIC model overfitting ARIMA(1,0,0)(0,1,2)12 15 9 Hasil peramalan titik panas bulanan tahun 2013 16
10Evaluasi model ARIMA(1,0,0)(0,1,2)12 18
11Perbandingan nilai MAPE pada berbagai periode untuk model
ARIMA(1,0,0)(0,1,2)12 18
DAFTAR GAMBAR
1 Tahapan penelitian 4
2 Tahapan pembuatan model prediksi dengan SARIMA 5 3 Plot data titik panas per bulan dari tahun 2001 sampai 2012 8
4 Plot Box-Cox 9
5 Plot data titik panas bulanan hasil transformasi Box-Cox 10 6 Plot ACF kemunculan bulanan titik panas di Riau bulanan 11 7 Plot PACF kemunculan bulanan titik panas di Riau bulanan 11
8 Plot ACF hasil differencing pada lag musiman 12
9 Plot PACF hasil differencing pada lag musiman 12
PENDAHULUAN
Latar Belakang
Indonesia merupakan salah satu paru-paru dunia yang peranannya sangat penting dalam menunjang kehidupan di bumi. Berdasarkan hasil penafsiran citra satelit Landsat 7 ETM+ tahun 2009/2010, luas hutan Indonesia adalah sebesar 98.56 juta hektar atau mencapai 52.4% dari luas wilayah Indonesia (Kemenhut 2011). Selain dari luasan, hutan Indonesia juga memiliki kekayaan hayati yang sangat beragam, meliputi flora dan fauna. Sayangnya, luasan hutan Indonesia semakin hari semakin berkurang karena mengalami deforestasi hutan. Berdasarkan data digital hasil penafsiran citra Landsat 7 ETM+ liputan tahun 2005/2006 dan 2009/2010, laju deforestasi hutan Indonesia mencapai 832126.9 ha. Salah satu penyebab terjadinya deforestasi hutan yaitu kebakaran hutan.
Menurut Tacconi (2003), kebakaran hutan dapat mengakibatkan pencemaran kabut asap, emisi karbon, degradasi dan deforestasi hutan yang mengakibatkan hilangnya hasil hutan dan berbagai jasa lingkungan yang diberikan hutan serta kerugian di sektor pedesaan. Dapat disimpulkan bahwa, kerugian akibat kebakaran hutan sangatlah besar dan berdampak luas. Oleh karena itu, diperlukan suatu metode untuk memprediksi adanya kebakaran hutan, agar dapat dilakukan pencegahan kebakaran hutan.
Salah satu indikator kebakaran hutan yaitu titik panas. Data titik panas merupakan data deret waktu yang bersifat musiman. Artinya, data tersebut dicatat berdasarkan urutan waktu dan mempunyai pola yang berulang setiap periode waktu tertentu. Dengan memprediksi kemunculan titik panas, terjadinya kebakaran hutan juga dapat diprediksi. Dari hasil prediksi tersebut, didapat pengetahuan yang diharapkan dapat mencegah terjadinya kebakaran hutan.
Salah satu metode forecasting adalah autoregressive integrated moving average (ARIMA) (Montgomery et al. 2008). Pada teknik ini, digunakan nilai mean absolute percentage error (MAPE) untuk menunjukkan seberapa baik sebuah model dijadikan sebagai model prediksi. Model prediksi yang baik memiliki nilai MAPE yang kecil, atau bahkan mendekati nol. Artinya, model tersebut memiliki tingkat akurasi prediksi yang tinggi.
2
Dalam penelitian ini SARIMA akan digunakan untuk memodelkan data titik panas di Provinsi Riau yang diperoleh Fire Information for Resource Management System (FIRMS) dari satelit moderate resolution imaging spectrometer national aeronautics and space administration (MODIS NASA) dari tahun 2001 sampai 2013. Model prediksi SARIMA digunakan untuk melakukan prediksi terhadap kemungkinan munculnya titik panas di masa yang akan datang sehingga dapat mencegah kemungkinan terjadinya kebakaran hutan.
Perumusan Masalah
Data deret waktu titik panas dapat dimodelkan untuk melakukan prediksi terhadap kemungkinan munculnya suatu titik panas pada suatu waktu. Karena data bersifat musiman maka muncul pertanyaan bagaimana model SARIMA digunakan dalam membuat prediksi kemunculan titik panas. Kemudian, bagaimana tingkat akurasi model prediksi yang dihasilkan.
Tujuan Penelitian
Tujuan dari penelitian ini adalah menerapkan SARIMA untuk memodelkan data deret waktu titik panas dan prediksi terjadinya kebakaran hutan di masa yang akan datang. Kemudian mengevaluasi model prediksi yang dihasilkan oleh metode SARIMA.
Manfaat Penelitian
Penelitian ini diharapkan dapat menghasilkan model yang akurat untuk memprediksi kemungkinan munculnya titik panas di masa mendatang yang dapat digunakan untuk mencegah terjadinya kebakaran hutan sehingga dapat memperlambat laju deforestasi hutan.
Ruang Lingkup Penelitian
Ruang lingkup dari penelitian ini adalah:
1 Data yang digunakan merupakan data titik panas di Provinsi Riau dari tahun 2001 sampai 2013 yang diperoleh dari FIRMS MODIS NASA.
2 Data titik panas yang diamati adalah aspek frekuensi kemunculan titik panas bulanan.
3 Tahap pra-proses data tidak dilakukan dalam penelitian ini, karena telah dilakukan pada penelitian sebelumnya oleh Robby (2014).
METODE
Seasonal Autoregressive Integrated Moving Average (SARIMA)
3 data yang konstan), double moving average dan double exponential smoothing (untuk tipe data yang mengandung trend), serta winters atau 3 tahap exponential smoothing (untuk tipe data musiman). Sedangkan metode modeling dapat dilakukan dengan menggunakan metode ARCH/GARCH dan ARIMA.
ARIMA pertama kali dipopulerkan oleh George Box dan Gwilyn Jenkinson pada tahun 1970 (Makridakis et al. 1998). ARIMA merupakan gabungan dari model autoregressive (AR) dan moving average (MA) yang mengakomodasi adanya differencing untuk membuat data yang tidak stasioner menjadi stasioner. ARIMA cocok untuk data time series dengan berbagai pola perubahan data, selain itu metode ini tidak mengharuskan pengguna untuk memilih parameter apriori (Abdullah 2012). Namun, metode ARIMA tidak cocok digunakan pada data deret waktu yang mengandung musiman. Oleh karena itu, dilakukan modifikasi pada metode ARIMA untuk data musiman, yang disebut SARIMA. Model SARIMA merupakan gabungan antara model autoregressive dan model moving average baik yang bersifat musiman maupun non-musiman. Secara umum, notasi model SARIMA adalah sebagai berikut (Makridakis et al. 1998):
ARIMA (p,d,q) (P,D,Q)s (1)
dengan (p,d,q) merupakan bagian musiman dari model. p merupakan ordo non-seasonal autoregressive, d merupakan banyaknya proses differencing yang dilakukan pada bagian non-musiman hingga data stasioner dalam rataan, dan q merupakan ordo non-seasonal moving average. Kemudian, (P,D,Q)s adalah bagian
musiman dari model. P merupakan merupakan ordo seasonal autoregressive (SAR), D merupakan banyaknya proses differencing yang dilakukan pada bagian musiman hingga data stasioner dalam rataan, dan Q merupakan ordo seasonal moving dan at adalah sisaan atau error hasil ramalan. Sebagai contoh, untuk model tentatif ARIMA (1,0,1)(1,0,1)6, berdasarkan Persamaan 2 model SARIMA-nya adalah: Φ1 B λ1(B6) 1-B 0(1-B6)0 xt =μ+ Γ1(B6) Θ Bat
1-Φ1B (1-λ1B6) xt= μ+ 1-ΘB (1-Γ1B6)at
xt=μ+ Φ1xt-1+λ1xt-6+Φ1λ1xt-7+at-θ1at-1
4
Bahan
Data yang digunakan dalam penelitian ini adalah data titik panas di Provinsi Riau dari tahun 2001 sampai 2013 yang diperoleh dari FIRMS MODIS NASA. Data tahun 2001 sampai 2012 digunakan untuk membangun model prediksi, sedangkan data tahun 2013 untuk mengevaluasi model. Aspek yang diamati pada data titik panas adalah aspek frekuensi kemunculan titik panas bulanan. Pra-proses telah dilakukan oleh Robby (2014).
Prosedur Analisis Data
Penelitian ini akan dilaksanakan berdasarkan tahapan yang digambarkan dalam Gambar 1.
Gambar 1 Tahapan penelitian Plot Data Deret Waktu
Plot data yang telah melewati tahap pra-proses dapat digunakan untuk melihat hubungan antara kejadian dengan waktu. Selain itu, dari plot data juga dapat dilihat kestasioneran data dan ada atau tidaknya unsur musiman pada data.
Pembuatan Model Titik Panas Menggunakan SARIMA
Pembuatan model prediksi titik panas dilakukan dengan menggunakan metode Box-Jenkins yang terdiri dari 3 langkah utama (Makridakis et al. 1998). Tiga langkah utama tersebut dapat digambarkan pada Gambar 2.
a Persiapan data
5
Gambar 2 Tahapan pembuatan model prediksi dengan SARIMA (Makridakis et al. 1998)
b Pemilihan model
Setelah data stasioner, beberapa model tentatif ditentukan. Model tentatif didapat dengan menentukan nilai p, q, d, P, Q, dan D. Penentuan nilai-nilai tersebut dilakukan dengan mengamati grafik fungsi autocorrelation function (ACF) dan partial autocorrelation function (PACF) (Montgomery et al. 2008). Nilai p dan P (ordo proses AR) dapat ditentukan dengan melihat nilai pada grafik fungsi PACF. Nilai q dan Q (ordo proses MA) dapat ditentukan dengan melihat nilai pada grafik fungsi ACF. Nilai d dan D merupakan banyaknya proses differencing yang dilakukan hingga data stasioner dalam rataan. Cara untuk identifikasi ordo tersebut dapat dilihat pada Tabel 1 (Wei 2006).
Tabel 1 Cara identifikasi ordo (Wei 2006)
Proses ACF PACF
AR(p) Tails off Cuts off setelah lag p
MA(q) Cuts off setelah lag q Tails off
6
Gambar 3 Contoh tails off dan cuts off
Persamaan untuk menghitung ACF pada lag ke-k adalah (Montgomery et al. 2008):
ρk=Cov(yt, yt+k)
Var(yt) k=0,1,2,…, k (4)
dengan ρk merupakan nilai ACF pada lag ke-k, dan yt merupakan data pada waktu ke-t. Sedangkan persamaan untuk menghitung PACF pada lag ke-k adalah sebagai berikut (Montgomery et al. 2008):
ρ(j)= ∑ki=1Øikρ(j-i) j=1,2,3,…,k (5)
dengan ρ(j) merupakan nilai ACF pada lag ke-j, dan Øik merupakan nilai PACF pada lag ke-k.
c Pendugaan parameter dilakukan pada setiap model tentatif. Tahap ini bertujuan untuk menentukan kelayakan parameter yang digunakan pada model. Parameter suatu model dikatakan layak jika nilai t-hitung lebih besar dari t-tabel (t(1-α/2);df = n-np), dengan taraf nyata (α) bernilai 0.05 (5%). t-hitung dapat diperoleh melalui
Persamaan 6 (Nisa’ 2010).
t-hitung = SE(β)|β| (6)
dengan β adalah parameter dugaan, sedangkan SE(β) adalah standar error dari setiap parameter dugaan.
Hipotesis uji yang digunakan adalah
H0: �� = � �� = (parameter tidak signifikan)
H1: �� ≠ � �� ≠ (parameter signifikan)
7 d Diagnosa model dilakukan untuk melihat model yang relevan dengan data yaitu yang memenuhi asumsi kenormalan dan kebebasan sisaan. Untuk mengecek kebebasan sisaan model, dilakukan dengan uji Ljung-Box. Sedangkan untuk memeriksa kenormalan sisaan, dilakukan uji Shapiro-wilk. Jika p-value pada uji Ljung-Box dan Shapiro-wilk yang dihasilkan lebih besar dari α, maka memenuhi kebebasan dan kenormalan sisaan.
e Overfitting. Pada tahap ini, dibuat model baru yang dihasilkan dengan menambahkan satu ordo pada setiap parameter yang terdapat pada model tentatif . Model baru ini digunakan sebagai pembanding dengan model tentatif . Salah satu kriteria pemilihan model berdasarkan sisaannya yaitu kriteria Akaike information criterion (AIC) (Wei 2006). Persamaan untuk menghitung nilai AIC (Wei 2006)
AIC= -2 ln maximum likelihood +2M (7) dengan M merupakan jumlah parameter pada model yaitu M=p+q+P+Q, p dan P adalah ordo AR serta q dan Q adalah ordo MA.
Nilai maximum likelihood dihitung oleh komputer. Namun karena tidak semua program komputer menghasilkan nilai AIC atau maximum likelihood, nilai AIC dari sebuah model tidak selalu dapat diketahui. Oleh karena itu, nilai AIC bisa didapatkan melalui pendekatan pada persamaan 8 (Makridakis et al. 1998)
-2 ln (maximum likelihood) ≈n(1+ ln 2π ) +nlnσ2 (8)
dengan � adalah ragam dari sisaan dan n adalah banyaknya data time series. Sehingga AIC dapat didekati dengan persamaan 9 (Makridakis et al. 1998)
AIC≈ n(1+ ln 2π ) +nlnσ2+2M (9)
f Melakukan peramalan dengan menggunakan model-model yang layak untuk beberapa waktu ke depan (forecasting). Forecasting dapat dilakukan dengan software atau dengan menggunakan metode minimum mean square error (MMSE) forecasting. MMSE adalah metode yang meminimumkan kuadrat error (MSE) dari peramalan Zt pada l periode ke depan (Wei 2006).
Evaluasi Model
Tingkat akurasi dari model prediksi dapat diukur dengan menghitung nilai MAPE. Semakin kecil nilai MAPE menunjukan bahwa data hasil peramalan semakin mendekati nilai aktual. MAPE dapat dihitung dengan rumus pada Persamaan 10 (Montgomery et al. 2008):
MAPE=1n ∑ |nt=1 ret| (10) dengan ret adalah relative forecast error yang dapat dihitung sebagai berikut
ret= xtx-tft ×100= (yet
8
dengan xt adalah data aktual pada waktu ke-t, n adalah jumlah data yang akan
diprediksi dan ft adalah data hasil prediksi pada waktu ke-t.
Peralatan Penelitian
Perangkat lunak yang digunakan dalam penelitian ini adalah:
• Sistem operasi : Windows 8.1
• Bahasa pemrograman : R
• Antarmuka bahasa pemrograman : R Studio
Perangkat keras yang digunakan dalam penelitian ini adalah komputer personal dengan spesifikasi:
• Prosesor : Intel Core i5-4200U
• Memory : 4 GB
• VGA : NVDIA GeForce GT720M
HASIL DAN PEMBAHASAN
Plot Data Deret Waktu Titik Panas
Grafik hasil plot data titik panas per bulan di Provinsi Riau tahun 2001 sampai 2012 dapat dilihat pada Gambar 4. Dari Gambar 4 dapat dilihat bahwa pada data terdapat fluktuasi jumlah kemunculan titik panas. Hal ini disebabkan oleh musim yang mempengaruhi kemunculan titik panas. Contohnya, pada musim kemarau, suhu tinggi dan kelembaban udara rendah, sehingga peluang kemunculan titik panas lebih tinggi. Pada grafik dapat dilihat bahwa rata-rata kemunculan titik panas di awal tahun (musim kemarau) lebih tinggi daripada di akhir tahun. Selain itu, terdapat juga pola 5-7 tahunan akibat pengaruh iklim seperti fenomena el-Nino. Dari Gambar 4 dapat dilihat bahwa tahun 2005 kemunculan titik panas lebih tinggi.
9 Pembuatan Model Titik Panas Menggunakan SARIMA
a Persiapan data
Pada tahap ini, dilakukan pengecekan kestasioneran data. Untuk mengecek stasioneritas data dalam rataan, dapat diperoleh dengan menggunakan uji augmented Dickey-Fuller. Sedangkan untuk mengecek kestasioneran dalam ragam, dilakukan dengan melakukan uji Bartlett-Levene. Berikut adalah perintah dalam R untuk melakukan uji stasioneritas.
Hasil dari uji Augmented Dickey-Fuller adalah sebagai berikut
Nilai p-value hasil uji adalah sebesar 0.01. Nilai tersebut lebih kecil dari α (0.05), sehingga data titik panas bulanan stasioner dalam rataan.
Hasil uji Bartlett-Levene adalah sebagai berikut
Nilai p-value hasil uji adalah lebih kecil dari 2.2 × 10-16. Nilai tersebut lebih
kecil dari α (0.05), sehingga data titik panas bulanan tidak stasioner dalam ragam. Oleh karena itu, perlu dilakukan transformasi Box-Cox. Gambar 5 merupakan gambar plot Box-Cox. Dapat dilihat bahwa selang kepercayaan 95% berada pada selang -0.05 sampai 0.15.
10
Dalam menentukan nilai lamda, digunakan pedoman umum seperti yang dijelaskan oleh Wei (2006) pada Tabel 2.
Tabel 2 Nilai lamda dan transformasinya (Ztadalah
data awal)
Nilai λ (lamda) Transformasi yang dilakukan
-1.0 1/Zt
-0.5 1/√ �
0.0 ln Zt
0.5 √Zt
1.0 Zt (tidak ditransformasi)
Pada Gambar 5, dapat dilihat bahwa nilai lamda 0.0 berada pada selang kepercayaan. Oleh karena itu, nilai lamda 0.0 akan digunakan pada transformasi data dengan persamaan transformasi seperti pada Tabel 2.
Setelah dilakukan transformasi, data kemudian diplot kembali. Gambar 6 adalah plot data titik panas bulanan yang telah melalui proses transformasi Box Cox.
Gambar 6 Plot data titik panas bulanan hasil transformasi Box-Cox
b Pemilihan model
11
Gambar 7 Plot ACF kemunculan bulanan titik panas di Riau bulanan
Gambar 8 Plot PACF kemunculan bulanan titik panas di Riau bulanan
Cara mengidentifikasi ordo p, q, P dan Q dapat dilihat pada Tabel 1. Identifikasi ordo secara detail dapat dijelaskan sebagai berikut.
Pengecekan kestasioneran lag musiman
Dari Gambar 7, dapat dilihat bahwa plot ACF memiliki pola lag nyata yang berulang pada lag kelipatan 12, maka nilai s=12. Kemudian lag musimannya diuji kestasionerannya dalam rataan dengan melakukan uji Augmented Dickey-Fuller. Berikut adalah hasil uji pada lag kelipatan 12.
12
Gambar 9 Plot ACF hasil differencing pada lag musiman
Gambar 10 Plot PACF hasil differencing pada lag musiman
Setelah data stasioner, dilakukan identifikasi ordo non-musiman dan ordo musiman.
Identifikasi ordo non-musiman
Dilakukan dengan melihat lag awal (lag ke-1,2,3 dan seterusnya). Data non-musiman tidak mengalami differencing, maka nilai d adalah nol. Identifikasi ordo non-musiman dijelaskan pada Tabel 3.
Tabel 3 Identifikasi ordo non-musiman (p dan q)
Identifikasi plot Ordo non-musiman Dari plot ACF pada Gambar 9, dapat dilihat bahwa
terjadi cuts off setelah lag ke-1. Kemudian, plot PACF dianggap tails off.
MA(1)
Dari plot PACF pada Gambar 10, dapat dilihat bahwa terjadi cuts off setelah lag ke-1. Kemudian, plot ACF dianggap tails off.
AR(1)
13
Identifikasi ordo musiman
Lag musiman telah mengalami differencing satu kali, maka nilai D adalah 1. Identifikasi ordo musiman dijelaskan pada Tabel 4.
Tabel 4 Identifikasi ordo musiman (P dan Q)
Identifikasi plot Ordo musiman
Dari plot ACF pada Gambar 9, dapat dilihat bahwa terjadi cuts off setelah lag ke-24. Kemudian, plot PACF dianggap tails off.
IMA(2)
Dari plot PACF pada Gambar 10, dapat dilihat bahwa terjadi cuts off setelah lag ke-24. Kemudian, plot ACF dianggap tails off.
ARI(2)
Gabungan dari hasil identifikasi ACF dan PACF. ARIMA(2,2)
Model tentatif SARIMA adalah kombinasi dari kesemua ordo teridentifikasi pada Tabel 3 dan 4 yang dapat dilihat pada Tabel 5.
Tabel 5 Identifikasi ordo model SARIMA Ordo non-musiman Ordo musiman Model SARIMA MA(1)
Dari hasil pendugaan parameter, diketahui model ARIMA(0,0,1)(0,1,2)12,
ARIMA(0,0,1)(2,1,0)12
, ARIMA(1,0,0)(0,1,2)12, ARIMA(1,0,0)(2,1,0)12, dan
ARIMA(1,0,1)(0,1,2)12 mempunyai |t-hitung| lebih besar daripada t-tabel (1.97705) untuk semua parameternya, sehingga model tersebut dikatakan layak. d Diagnosa model
14
Hasil uji Ljung-Box dan Shapiro Wilk model dapat dilihat pada Tabel 7. Tabel 6 Pendugaan parameter model SARIMA
Model Tipe Nilai parameter SE |t-hitung|
ARIMA(0,0,1)(0,1,2)12 MA(1) 0.3846 0.0808 4.7599
SMA(1) -0.5611 0.1268 4.4251
SMA(2) -0.2508 0.1164 2.1546
ARIMA(0,0,1)(2,1,0)12 MA(1) 0.3688 0.0834 4.4221
SAR(1) -0.3862 0.0910 4.2440
ARIMA(1,0,0)(2,1,0)12 AR(1) 0.3573 0.0831 4.2996
SAR(1) -0.3856 0.0890 4.3326
SAR(2) -0.3459 0.0895 3.8648
ARIMA(1,0,0)(2,1,2)12 AR(1) 0.3827 0.0835 4.5832
SAR(1) -0.1265 0.6034 0.2096
SAR(2) -0.0235 0.2552 0.0921
SMA(1) -0.4409 0.6024 0.7319
SMA(2) -0.3260 0.5633 0.5787
ARIMA(1,0,1)(0,1,2)12 AR(1) 0.9790 0.0577 16.9671
MA(1) -0.8347 0.0975 8.5610
SMA(1) -0.6290 0.1543 4.0765
SMA(2) -0.2535 0.1322 1.9175
ARIMA(1,0,1)(2,1,0)12 AR(1) 0.1818 0.3115 0.5836
MA(1) 0.1970 0.3196 0.6164
SAR(1) -0.3857 0.0902 4.2761
SAR(2) -0.3256 0.0959 3.3952
ARIMA(1,0,1)(2,1,2)12 AR(1) 0.2621 0.2951 0.8882
MA(1) 0.1369 0.3092 0.4428
SAR(1) -0.1508 0.6767 0.2228
SAR(2) 0.0134 0.2904 0.0461
SMA(1) -0.4158 0.6733 0.6176
15 Tabel 7 Nilai p-value uji Ljung-Box dan Shapiro Wilk
Model
Ljung-Box
Shapiro Wilk
AIC ARIMA(0,0,1)(0,1,2)12 0.9763 0.5026 411.70
ARIMA(0,0,1)(2,1,0)12 0.9764 0.2258 417.80 ARIMA(1,0,0)(0,1,2)12 0.6067 0.4945 411.26 ARIMA(1,0,0)(2,1,0)12 0.6561 0.2282 417.83 ARIMA(1,0,1)(0,1,2)12 0.0035 0.3092 415.02
Dari hasil uji diketahui model ARIMA(1,0,1)(0,1,2)12, sisaannya belum
bebas, karena p-value uji Ljung-Box lebih kecil dari taraf nyata (α). Sedangkan keempat model lainnya memenuhi asumsi kebebasan dan kenormalan sisaan. Kemudian, dari keempat model tersebut model ARIMA(1,0,0)(0,1,2)12 yang mempunyai nilai AIC paling kecil. Maka model tersebut yang digunakan pada tahap selanjutnya.
e Overfitting
Model overfitting beserta perbandingan nilai AIC dapat dilihat dari Tabel 8. Perlu diperhatikan bahwa model ARIMA(1,0,1)(0,1,2)12 tidak memenuhi asumsi sisaan, maka tidak perlu dihitung nilai AICnya.
Dari Tabel 8, didapat model ARIMA(1,0,0)(0,1,2)12 yang mempunyai nilai
AIC paling kecil. Maka model ini yang akan digunakan pada tahap selanjutnya.
Tabel 8 Perbandingan nilai AIC model overfitting ARIMA(1,0,0)(0,1,2)12 2013. Karena data telah mengalami transformasi Box-Cox, maka hasil peramalan harus ditransformasi balik terlebih dahulu.
Plot hasil model prediksi ARIMA(1,0,0)(0,1,2)12 yang masih dalam bentuk
16
Gambar 11 Hasil peramalan model ARIMA(1,0,0)(0,1,2)12
Pada plot hasil prediksi terdapat tiga garis, garis biru menunjukkan batas atas dan batas bawah dari hasil prediksi sedangkan garis merah menunjukkan data hasil prediks. Model ARIMA(1,0,0)(0,1,2)12 mempunyai batas atas tertinggi
dengan nilai 9.465 dan batas atas terendah dengan nilai 5.501, untuk hasil prediksi tertinggi dengan nilai 7.155 dan hasil prediksi terendah 3.192, sedangkan untuk batas bawah tertinggi dengan nilai 4.844 dan nilai batas bawah terendah 0.882. Berikut adalah perintah dalam R untuk melakukan plot model ARIMA(1,0,0)(0,1,2)12
Tabel 9 Hasil peramalan titik panas bulanan tahun 2013
Dari Tabel 9, dapat dilihat bahwa model ARIMA(1,0,0)(0,1,2)12 mempunyai nilai prediksi tertinggi pada bulan Agustus sebesar 1,279.92 dan terendah pada bulan April sebesar 139.67.
Untuk prediksi menggunakan MMSE, perlu diketahui persamaan model prediksinya terebih dahulu. Persamaan ARIMA(1,0,0)(0,1,2)12 adalah sebagai berikut
xt= µ+at+Φ1 (xt-1- xt-13)+xt-12-Γ1 at-12-Γ2 at-13
Untuk t=n+l , dengan l adalah panjang periode yang akan diprediksi maka
xn+l= µ+an+l+Φ1 (xn+l-1- xn+l-13)+xn+l-12-Γ1an+l-12-Γ2 an+l-13
Karena nilai E(an+1)=0, maka untuk l≥1 didapat persamaan sebagai berikut
x
̂n(l) = µ+Φ1 (x̂n(l-1)- x̂n(l-13))+̂xn(l-12)-Γ1 ân(l-12)-Γ2ân(l-13)
Jan Feb Mar Apr Mei Jun Jul Agus
ARIMA(1,0,0)
17 Atau dapat ditulis bersama parameter ordonya seperti pada Persamaan 12.
x̂n l = 0.0518+0.3834 (x̂n l-1 - x̂n l-13 ) +x̂n l-12 +0.5737
ân l-12 +0.2657 ân(l-13)
(12) dengan l adalah panjang prediksi yang dilakukan x̂n adalah jumlah kemunculan titik panas bulanan dan ân adalah error prediksi.
Tabel 10 Contoh data hasil prediksi beserta error
t xt at
Untuk menggunakan Persamaan 12, dibutuhkan data hasil prediksi 13 bulan sebelumnya. Misal, didapat data hasil prediksi beserta error-nya dari bulan ke 20 sampai bulan ke 33 seperti pada Tabel 10. Kemudian ingin diprediksi bulan ke 34 (1 bulan ke depan, l=1).
Maka untuk memprediksi satu bulan ke depan adalah
x̂33 1 = 0.0518+0.3834 (x̂33 1-1 - x̂33 1-13 ) +x̂33 1-12 +0.5737
Jadi, berdasarkan Persamaan 12, prediksi kemunculan titik panas pada bulan ke 34 adalah 7.297. Tapi, karena pada tahap awal dilakukan transformasi data dengan menggunakan ln(Zt), maka nilai tersebut harus ditransformasi balik
18
Jadi, berdasarkan Persamaan 12, prediksi kemunculan titik panas pada bulan ke 35 adalah 4.343. Jadi, nilai kemunculan titik panas pada bulan ke-35 adalah eksponen(4.343) = 76.938.
Evaluasi Model
Tahap evaluasi model akan membandingkan hasil peramalan dengan data aktual. Kemudian, dihitung error dari hasil peramalan menggunakan MAPE yang dihitung dengan menggunakan Persamaan 10. Tabel 11 menunjukkan hasil evaluasi model ARIMA(1,0,0)(0,1,2)12.
Tabel 11 Evaluasi model ARIMA(1,0,0)(0,1,2)12
Jan Feb Mar Apr Mei Jun Jul Agus
Ramalan 187.91 440.56 253.88 139.67 338.82 919.61 712.53 1279.92
Data
Aktual 189.00 232.00 392.00 401.00 328.00 8257.00 1740.00 2963.00
� � 0.58 89.90 35.23 65.17 3.30 88.86 59.05 56.80
Semakin panjang periode yang diprediksi, maka nilai MAPE semakin besar. Hal ini dikarenakan data yang dimodelkan tidak cukup untuk melakukan prediksi jangka panjang. Tabel 12 adalah perbandingan nilai MAPE yang didapat pada panjang periode yang berbeda untuk model ARIMA(1,0,0)(0,1,2)12.
Tabel 12 Perbandingan nilai MAPE pada berbagai periode untuk model ARIMA(1,0,0)(0,1,2)12
Panjang periode prediksi Nilai MAPE
8 bulan 49.862
19
SIMPULAN DAN SARAN
Simpulan
Model ARIMA(1,0,0)(0,1,2)12 dapat digunakan untuk pemodelan data bulanan titik panas karena telah memenuhi tahap pendugaan parameter, uji kebebasan dan kenormalan sisaan, AIC dan mempunyai nilai MAPE yang paling kecil dari model-model yang diperoleh. Model ARIMA(1,0,0)(0,1,2)12 paling baik digunakan untuk memprediksi kemunculan titik panas 1 bulan ke depan, dengan nilai MAPE 0.579. Untuk melakukan prediksi kemunculan titik panas di masa yang akan datang dengan menggunakan ARIMA(1,0,0)(0,1,2)12, diperlukan data kemunculan titik panas minimal 13 bulan sebelumnya.
Saran
Penelitian ini masih memiliki kekurangan. Hasil dari penelitian ini hanya bisa memprediksi jumlah kemunculan titik panas per bulan tanpa mengetahui lokasi kemunculan titik panas. Oleh karena itu, perlu dilakukan spatial prediction agar dapat diketahui jumlah kemunculan titik panas beserta lokasinya. Selain itu, perlu diperhatikan aspek penyebab kebakaran hutan yang lain seperti curah hujan, kelembaban udara dan sebagainya, agar tingkat akurasi prediksi lebih baik.
DAFTAR PUSTAKA
Abdullah L. 2012. ARIMA model for gold bullion coin selling prices forecasting. International Journal of Advances in Appllied Sciences (IJAAS). 1(4):153-158. [Kemenhut] Kementrian Kehutanan. 2013. Statistik Kehutanan Indonesia 2012.
Jakarta (ID): Kementrian Kehutanan.
Makridakis S, Wheelwright SC, Hyndman RJ. 1998. Forecasting: Methods and Applications. 3rd ed. New York (US): J Wiley.
Montgomery DC, Jennings CL, Kulahci M. 2008. Introduction to Time Series Analysis and Forecasting. New York (US): J Wiley.
Nisa' HDK. 2010. Peramalan debit air Sungai Brantas dengan metode GSTAR dan ARIMA [skripsi]. Surabaya (ID): Institut Teknologi Sepuluh Nopember Surabaya.
Robby IS. 2014. Prediksi temporal untuk kemunculan titik panas di Provinsi Riau menggunakan autoregressive integrated moving average (ARIMA) [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Tacconi L. 2003. Kebakaran Hutan di Indonesia: Penyebab, Biaya dan Implikasi Kebijakan. Bogor (ID): Center for International Forestry Research.
20
RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 23 Agustus 1993 di Subang, Jawa Barat. Penulis merupakan anak pertama dari tiga bersaudara dari pasangan Enok Ratnaningsih dan Iwan Hudaya Sabata (almarhum). Pada tahun 2011, penulis lulus dari SMA Negeri 1 Subang dan diterima di Institut Pertanian Bogor melalui jalur SNMPTN Undangan di Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA).