Prediksi Kemunculan Titik Panas Di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (Sarima).

(1)

PREDIKSI KEMUNCULAN TITIK PANAS DI PROVINSI RIAU

MENGGUNAKAN

SEASONAL AUTOREGRESSIVE

INTEGRATED MOVING AVERAGE

(SARIMA)

NALAR ISTIQOMAH

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)

(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

ABSTRAK

NALAR ISTIQOMAH. Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA). Dibimbing oleh IMAS SUKAESIH SITANGGANG.

Hutan Indonesia merupakan salah satu dari paru-paru dunia yang peranannya sangat penting bagi makhluk hidup. Sayangnya luas hutan di Indonesia semakin berkurang. Salah satu penyebabnya adalah kebakaran hutan. Kebakaran hutan dapat diprediksi melalui kemunculan titik panas yang dipengaruhi oleh cuaca sehingga bersifat musiman. Oleh karena itu, perlu metode yang dapat menangani unsur musiman dalam memprediksi titik panas. Penelitian ini bertujuan membuat model prediksi kemunculan titik panas menggunakan seasonal autoregressive integrated moving average (SARIMA). SARIMA merupakan metode prediksi yang dapat digunakan untuk pemodelan data deret waktu musiman. Pemodelan dilakukan pada data kemunculan titik panas perbulan pada periode 2001 sampai 2012 di wilayah Provinsi Riau. Hasil penelitian menunjukkan bahwa model prediksi terbaik adalah ARIMA(1,0,0)(0,1,2)12 dengan nilai mean absolute percentage error (MAPE) terbaik sebesar 0.579 untuk meramal satu bulan ke depan.

Kata kunci: model prediksi, SARIMA, titik panas

ABSTRACT

NALAR ISTIQOMAH. Prediction for Hotspot Occurrences in Riau Province using Seasonal Autoregressive Integrated Moving Average (SARIMA). Supervised by IMAS SUKAESIH SITANGGANG.

Indonesia’s forests have important roles in the world. Unfortunately, the forest area in Indonesia is on the wane because of forest fires. Forest fires can be predicted by the appearance of hotspots that are influenced by seasonal weather. Therefore, a method that can handle seasonal elements is necessary in predicting hotspots. This research aims to create predictive models for occurrences of hotspots using seasonal autoregressive integrated moving average (SARIMA). The SARIMA is a prediction method that can be used for modelling seasonal time-series data. This research uses monthly data of hotspot occurrences from 2001 to 2012 data in Riau Province. The experimental results show that the ARIMA(1,0,0)(0,1,2)12 model is the best model to predict the number of monthly hotspot occurrences with mean absolute percentage error (MAPE) of 0.579 for predicting one month ahead.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer

pada

Departemen Ilmu Komputer

PREDIKSI KEMUNCULAN TITIK PANAS DI PROVINSI RIAU

MENGGUNAKAN

SEASONAL AUTOREGRESSIVE

INTEGRATED MOVING AVERAGE

(SARIMA)

NALAR ISTIQOMAH

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)

Penguji :

1 Aziz Kustiyo, SSi MKom

(7)

Judul Skripsi : Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA) Nama : Nalar Istiqomah

NIM : G64110033

Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah Subhana wa ta'ala. Shalawat serta salam semoga senantiasa dilimpahkan kepada Nabi Muhammad, keluarganya, sahabatnya, dan kepada kita yang selau berusaha menggapai ridha Allah.

Alhamdulillah atas bimbingan dan petunjuk dari Allah Subhana wa ta'ala serta bimbingan dari semua pihak, penyusunan tugas akhir yang berjudul “Prediksi Kemunculan Titik Panas di Provinsi Riau Menggunakan Seasonal Autoregressive Integrated Moving Average (SARIMA)” dapat diselesaikan. Tugas akhir ini tidak mungkin dapat diselesaikan tanpa adanya bantuan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terimakasih dan penghargaan yang setinggi-tingginya kepada:

 Ayah (almarhum), Ibu dan keluarga yang selalu mendoakan, memberi nasihat, kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan.

 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah memberi saran, masukan dan ide-ide dalam penelitian ini.

 Bapak Aziz Kustiyo, SSi MKom dan Bapak Hari Agung Adrianto, SKom MSi sebagai penguji.

 Ibu Yenni Angraini, SSi MSi sebagai dosen Analisis Deret Waktu yang telah memberikan penjelasan mengenai analisis data deret waktu dan SARIMA.

 Teman seperjuangan Nida, Rachma, Pristi, Gita, Uci, Gisha, Nadia, Yenni dan Fay yang telah memberikan semangat dan masukan.

 Teman-teman Core-i 48 yang telah memberikan pengalaman paling berharga selama 3 tahun ini.

 Ka Rangga, Bang Isnan dan teman-teman Pasca Sarjana Ilkom 51 yang telah bersedia membantu, mendoakan dan senantiasa mendukung.

 Departemen Ilmu Komputer IPB, staf dan dosen yang telah banyak membantu selama masa perkuliahan hingga penelitian.

Semoga penelitian ini bermanfaat.

(9)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Perumusan Masalah 2

Tujuan Penelitian 2

Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

METODE 2

SARIMA (Seasonal Autoregressive Integrated Moving Average) 2

Bahan 4

Prosedur Analisis Data 4

Plot Data Deret Waktu 4

Pembuatan Model Titik Panas Menggunakan SARIMA 4

Evaluasi Model 7

Peralatan Penelitian 8

HASIL DAN PEMBAHASAN 8

Plot Data Deret Waktu Titik Panas 8

Pembuatan Model Titik Panas Menggunakan SARIMA 9

Evaluasi Model 18

SIMPULAN DAN SARAN 19

Simpulan 19

Saran 19

(10)

DAFTAR TABEL

1 Cara identifikasi ordo (Wei 2006) 5

2 Nilai lamda dan transformasinya (Zt adalah data awal) 10

3 Identifikasi ordo non-musiman (p dan q) 12

4 Identifikasi ordo musiman (P dan Q) 13

5 Identifikasi ordo model SARIMA 13

6 Pendugaan parameter model SARIMA 14

7 Nilai p-value uji Ljung-Box dan Shapiro Wilk 15 8 Perbandingan nilai AIC model overfitting ARIMA(1,0,0)(0,1,2)12 15 9 Hasil peramalan titik panas bulanan tahun 2013 16

10Evaluasi model ARIMA(1,0,0)(0,1,2)12 18

11Perbandingan nilai MAPE pada berbagai periode untuk model

ARIMA(1,0,0)(0,1,2)12 18

DAFTAR GAMBAR

1 Tahapan penelitian 4

2 Tahapan pembuatan model prediksi dengan SARIMA 5 3 Plot data titik panas per bulan dari tahun 2001 sampai 2012 8

4 Plot Box-Cox 9

5 Plot data titik panas bulanan hasil transformasi Box-Cox 10 6 Plot ACF kemunculan bulanan titik panas di Riau bulanan 11 7 Plot PACF kemunculan bulanan titik panas di Riau bulanan 11

8 Plot ACF hasil differencing pada lag musiman 12

9 Plot PACF hasil differencing pada lag musiman 12

(11)

PENDAHULUAN

Latar Belakang

Indonesia merupakan salah satu paru-paru dunia yang peranannya sangat penting dalam menunjang kehidupan di bumi. Berdasarkan hasil penafsiran citra satelit Landsat 7 ETM+ tahun 2009/2010, luas hutan Indonesia adalah sebesar 98.56 juta hektar atau mencapai 52.4% dari luas wilayah Indonesia (Kemenhut 2011). Selain dari luasan, hutan Indonesia juga memiliki kekayaan hayati yang sangat beragam, meliputi flora dan fauna. Sayangnya, luasan hutan Indonesia semakin hari semakin berkurang karena mengalami deforestasi hutan. Berdasarkan data digital hasil penafsiran citra Landsat 7 ETM+ liputan tahun 2005/2006 dan 2009/2010, laju deforestasi hutan Indonesia mencapai 832126.9 ha. Salah satu penyebab terjadinya deforestasi hutan yaitu kebakaran hutan.

Menurut Tacconi (2003), kebakaran hutan dapat mengakibatkan pencemaran kabut asap, emisi karbon, degradasi dan deforestasi hutan yang mengakibatkan hilangnya hasil hutan dan berbagai jasa lingkungan yang diberikan hutan serta kerugian di sektor pedesaan. Dapat disimpulkan bahwa, kerugian akibat kebakaran hutan sangatlah besar dan berdampak luas. Oleh karena itu, diperlukan suatu metode untuk memprediksi adanya kebakaran hutan, agar dapat dilakukan pencegahan kebakaran hutan.

Salah satu indikator kebakaran hutan yaitu titik panas. Data titik panas merupakan data deret waktu yang bersifat musiman. Artinya, data tersebut dicatat berdasarkan urutan waktu dan mempunyai pola yang berulang setiap periode waktu tertentu. Dengan memprediksi kemunculan titik panas, terjadinya kebakaran hutan juga dapat diprediksi. Dari hasil prediksi tersebut, didapat pengetahuan yang diharapkan dapat mencegah terjadinya kebakaran hutan.

Salah satu metode forecasting adalah autoregressive integrated moving average (ARIMA) (Montgomery et al. 2008). Pada teknik ini, digunakan nilai mean absolute percentage error (MAPE) untuk menunjukkan seberapa baik sebuah model dijadikan sebagai model prediksi. Model prediksi yang baik memiliki nilai MAPE yang kecil, atau bahkan mendekati nol. Artinya, model tersebut memiliki tingkat akurasi prediksi yang tinggi.

(12)

2

Dalam penelitian ini SARIMA akan digunakan untuk memodelkan data titik panas di Provinsi Riau yang diperoleh Fire Information for Resource Management System (FIRMS) dari satelit moderate resolution imaging spectrometer national aeronautics and space administration (MODIS NASA) dari tahun 2001 sampai 2013. Model prediksi SARIMA digunakan untuk melakukan prediksi terhadap kemungkinan munculnya titik panas di masa yang akan datang sehingga dapat mencegah kemungkinan terjadinya kebakaran hutan.

Perumusan Masalah

Data deret waktu titik panas dapat dimodelkan untuk melakukan prediksi terhadap kemungkinan munculnya suatu titik panas pada suatu waktu. Karena data bersifat musiman maka muncul pertanyaan bagaimana model SARIMA digunakan dalam membuat prediksi kemunculan titik panas. Kemudian, bagaimana tingkat akurasi model prediksi yang dihasilkan.

Tujuan Penelitian

Tujuan dari penelitian ini adalah menerapkan SARIMA untuk memodelkan data deret waktu titik panas dan prediksi terjadinya kebakaran hutan di masa yang akan datang. Kemudian mengevaluasi model prediksi yang dihasilkan oleh metode SARIMA.

Manfaat Penelitian

Penelitian ini diharapkan dapat menghasilkan model yang akurat untuk memprediksi kemungkinan munculnya titik panas di masa mendatang yang dapat digunakan untuk mencegah terjadinya kebakaran hutan sehingga dapat memperlambat laju deforestasi hutan.

Ruang Lingkup Penelitian

Ruang lingkup dari penelitian ini adalah:

1 Data yang digunakan merupakan data titik panas di Provinsi Riau dari tahun 2001 sampai 2013 yang diperoleh dari FIRMS MODIS NASA.

2 Data titik panas yang diamati adalah aspek frekuensi kemunculan titik panas bulanan.

3 Tahap pra-proses data tidak dilakukan dalam penelitian ini, karena telah dilakukan pada penelitian sebelumnya oleh Robby (2014).

METODE

Seasonal Autoregressive Integrated Moving Average (SARIMA)

(13)

3 data yang konstan), double moving average dan double exponential smoothing (untuk tipe data yang mengandung trend), serta winters atau 3 tahap exponential smoothing (untuk tipe data musiman). Sedangkan metode modeling dapat dilakukan dengan menggunakan metode ARCH/GARCH dan ARIMA.

ARIMA pertama kali dipopulerkan oleh George Box dan Gwilyn Jenkinson pada tahun 1970 (Makridakis et al. 1998). ARIMA merupakan gabungan dari model autoregressive (AR) dan moving average (MA) yang mengakomodasi adanya differencing untuk membuat data yang tidak stasioner menjadi stasioner. ARIMA cocok untuk data time series dengan berbagai pola perubahan data, selain itu metode ini tidak mengharuskan pengguna untuk memilih parameter apriori (Abdullah 2012). Namun, metode ARIMA tidak cocok digunakan pada data deret waktu yang mengandung musiman. Oleh karena itu, dilakukan modifikasi pada metode ARIMA untuk data musiman, yang disebut SARIMA. Model SARIMA merupakan gabungan antara model autoregressive dan model moving average baik yang bersifat musiman maupun non-musiman. Secara umum, notasi model SARIMA adalah sebagai berikut (Makridakis et al. 1998):

ARIMA (p,d,q) (P,D,Q)s (1)

dengan (p,d,q) merupakan bagian musiman dari model. p merupakan ordo non-seasonal autoregressive, d merupakan banyaknya proses differencing yang dilakukan pada bagian non-musiman hingga data stasioner dalam rataan, dan q merupakan ordo non-seasonal moving average. Kemudian, (P,D,Q)s_{adalah bagian}

musiman dari model. P merupakan merupakan ordo seasonal autoregressive (SAR), D merupakan banyaknya proses differencing yang dilakukan pada bagian musiman hingga data stasioner dalam rataan, dan Q merupakan ordo seasonal moving dan a_tadalah sisaan atau error hasil ramalan. Sebagai contoh, untuk model tentatif ARIMA (1,0,1)(1,0,1)6, berdasarkan Persamaan 2 model SARIMA-nya adalah: Φ1 B λ1(B6) 1-B 0(1-B6)0 xt =μ+ Γ1(B6) Θ Bat

1-Φ1B (1-λ1B6) xt= μ+ 1-ΘB (1-Γ1B6)at

xt=μ+ Φ1xt-1+λ1xt-6+Φ1λ1xt-7+a_t-θ1at-1

(14)

4

Bahan

Data yang digunakan dalam penelitian ini adalah data titik panas di Provinsi Riau dari tahun 2001 sampai 2013 yang diperoleh dari FIRMS MODIS NASA. Data tahun 2001 sampai 2012 digunakan untuk membangun model prediksi, sedangkan data tahun 2013 untuk mengevaluasi model. Aspek yang diamati pada data titik panas adalah aspek frekuensi kemunculan titik panas bulanan. Pra-proses telah dilakukan oleh Robby (2014).

Prosedur Analisis Data

Penelitian ini akan dilaksanakan berdasarkan tahapan yang digambarkan dalam Gambar 1.

Gambar 1 Tahapan penelitian Plot Data Deret Waktu

Plot data yang telah melewati tahap pra-proses dapat digunakan untuk melihat hubungan antara kejadian dengan waktu. Selain itu, dari plot data juga dapat dilihat kestasioneran data dan ada atau tidaknya unsur musiman pada data.

Pembuatan Model Titik Panas Menggunakan SARIMA

Pembuatan model prediksi titik panas dilakukan dengan menggunakan metode Box-Jenkins yang terdiri dari 3 langkah utama (Makridakis et al. 1998). Tiga langkah utama tersebut dapat digambarkan pada Gambar 2.

a Persiapan data

(15)

5

Gambar 2 Tahapan pembuatan model prediksi dengan SARIMA (Makridakis et al. 1998)

b Pemilihan model

Setelah data stasioner, beberapa model tentatif ditentukan. Model tentatif didapat dengan menentukan nilai p, q, d, P, Q, dan D. Penentuan nilai-nilai tersebut dilakukan dengan mengamati grafik fungsi autocorrelation function (ACF) dan partial autocorrelation function (PACF) (Montgomery et al. 2008). Nilai p dan P (ordo proses AR) dapat ditentukan dengan melihat nilai pada grafik fungsi PACF. Nilai q dan Q (ordo proses MA) dapat ditentukan dengan melihat nilai pada grafik fungsi ACF. Nilai d dan D merupakan banyaknya proses differencing yang dilakukan hingga data stasioner dalam rataan. Cara untuk identifikasi ordo tersebut dapat dilihat pada Tabel 1 (Wei 2006).

Tabel 1 Cara identifikasi ordo (Wei 2006)

Proses ACF PACF

AR(p) Tails off Cuts off setelah lag p

MA(q) Cuts off setelah lag q Tails off

(16)

6

Gambar 3 Contoh tails off dan cuts off

Persamaan untuk menghitung ACF pada lag ke-k adalah (Montgomery et al. 2008):

ρ_k=Cov(yt, yt+k)

Var(y_t) k=0,1,2,…, k (4)

dengan ρ_k merupakan nilai ACF pada lag ke-k, dan y_t merupakan data pada waktu ke-t. Sedangkan persamaan untuk menghitung PACF pada lag ke-k adalah sebagai berikut (Montgomery et al. 2008):

ρ(j)= ∑ki=1Øikρ(j-i) j=1,2,3,…,k (5)

dengan ρ(j) merupakan nilai ACF pada lag ke-j, dan Ø_ik merupakan nilai PACF pada lag ke-k.

c Pendugaan parameter dilakukan pada setiap model tentatif. Tahap ini bertujuan untuk menentukan kelayakan parameter yang digunakan pada model. Parameter suatu model dikatakan layak jika nilai t-hitung lebih besar dari t-tabel (t(1-α/2);df = n-np), dengan taraf nyata (α) bernilai 0.05 (5%). t-hitung dapat diperoleh melalui

Persamaan 6 (Nisa’ 2010).

t-hitung = _SE(β)|β| (6)

dengan β adalah parameter dugaan, sedangkan SE(β) adalah standar error dari setiap parameter dugaan.

Hipotesis uji yang digunakan adalah

H0: �_� = � �_� = (parameter tidak signifikan)

H1: �_� ≠ � �_� ≠ (parameter signifikan)

(17)

7 d Diagnosa model dilakukan untuk melihat model yang relevan dengan data yaitu yang memenuhi asumsi kenormalan dan kebebasan sisaan. Untuk mengecek kebebasan sisaan model, dilakukan dengan uji Ljung-Box. Sedangkan untuk memeriksa kenormalan sisaan, dilakukan uji Shapiro-wilk. Jika p-value pada uji Ljung-Box dan Shapiro-wilk yang dihasilkan lebih besar dari α, maka memenuhi kebebasan dan kenormalan sisaan.

e Overfitting. Pada tahap ini, dibuat model baru yang dihasilkan dengan menambahkan satu ordo pada setiap parameter yang terdapat pada model tentatif . Model baru ini digunakan sebagai pembanding dengan model tentatif . Salah satu kriteria pemilihan model berdasarkan sisaannya yaitu kriteria Akaike information criterion (AIC) (Wei 2006). Persamaan untuk menghitung nilai AIC (Wei 2006)

AIC= -2 ln maximum likelihood +2M (7) dengan M merupakan jumlah parameter pada model yaitu M=p+q+P+Q, p dan P adalah ordo AR serta q dan Q adalah ordo MA.

Nilai maximum likelihood dihitung oleh komputer. Namun karena tidak semua program komputer menghasilkan nilai AIC atau maximum likelihood, nilai AIC dari sebuah model tidak selalu dapat diketahui. Oleh karena itu, nilai AIC bisa didapatkan melalui pendekatan pada persamaan 8 (Makridakis et al. 1998)

-2 ln (maximum likelihood) ≈n(1+ ln 2π ) +nlnσ2₍₈₎

dengan � adalah ragam dari sisaan dan n adalah banyaknya data time series. Sehingga AIC dapat didekati dengan persamaan 9 (Makridakis et al. 1998)

AIC≈ n(1+ ln 2π ) +nlnσ2₊₂_M₍₉₎

f Melakukan peramalan dengan menggunakan model-model yang layak untuk beberapa waktu ke depan (forecasting). Forecasting dapat dilakukan dengan software atau dengan menggunakan metode minimum mean square error (MMSE) forecasting. MMSE adalah metode yang meminimumkan kuadrat error (MSE) dari peramalan Zt pada l periode ke depan (Wei 2006).

Evaluasi Model

Tingkat akurasi dari model prediksi dapat diukur dengan menghitung nilai MAPE. Semakin kecil nilai MAPE menunjukan bahwa data hasil peramalan semakin mendekati nilai aktual. MAPE dapat dihitung dengan rumus pada Persamaan 10 (Montgomery et al. 2008):

MAPE=1_n ∑ |nt=1 ret| (10) dengan re_t adalah relative forecast error yang dapat dihitung sebagai berikut

ret= xt_x-_tft ×100= (_yet

(18)

8

dengan xt adalah data aktual pada waktu ke-t, n adalah jumlah data yang akan

diprediksi dan ft adalah data hasil prediksi pada waktu ke-t.

Peralatan Penelitian

Perangkat lunak yang digunakan dalam penelitian ini adalah:

• Sistem operasi : Windows 8.1

• Bahasa pemrograman : R

• Antarmuka bahasa pemrograman : R Studio

Perangkat keras yang digunakan dalam penelitian ini adalah komputer personal dengan spesifikasi:

• Prosesor : Intel Core i5-4200U

• Memory : 4 GB

• VGA : NVDIA GeForce GT720M

HASIL DAN PEMBAHASAN

Plot Data Deret Waktu Titik Panas

Grafik hasil plot data titik panas per bulan di Provinsi Riau tahun 2001 sampai 2012 dapat dilihat pada Gambar 4. Dari Gambar 4 dapat dilihat bahwa pada data terdapat fluktuasi jumlah kemunculan titik panas. Hal ini disebabkan oleh musim yang mempengaruhi kemunculan titik panas. Contohnya, pada musim kemarau, suhu tinggi dan kelembaban udara rendah, sehingga peluang kemunculan titik panas lebih tinggi. Pada grafik dapat dilihat bahwa rata-rata kemunculan titik panas di awal tahun (musim kemarau) lebih tinggi daripada di akhir tahun. Selain itu, terdapat juga pola 5-7 tahunan akibat pengaruh iklim seperti fenomena el-Nino. Dari Gambar 4 dapat dilihat bahwa tahun 2005 kemunculan titik panas lebih tinggi.

(19)

9 Pembuatan Model Titik Panas Menggunakan SARIMA

a Persiapan data

Pada tahap ini, dilakukan pengecekan kestasioneran data. Untuk mengecek stasioneritas data dalam rataan, dapat diperoleh dengan menggunakan uji augmented Dickey-Fuller. Sedangkan untuk mengecek kestasioneran dalam ragam, dilakukan dengan melakukan uji Bartlett-Levene. Berikut adalah perintah dalam R untuk melakukan uji stasioneritas.

Hasil dari uji Augmented Dickey-Fuller adalah sebagai berikut

Nilai p-value hasil uji adalah sebesar 0.01. Nilai tersebut lebih kecil dari α (0.05), sehingga data titik panas bulanan stasioner dalam rataan.

Hasil uji Bartlett-Levene adalah sebagai berikut

Nilai p-value hasil uji adalah lebih kecil dari 2.2 × 10-16_{. Nilai tersebut lebih}

kecil dari α (0.05), sehingga data titik panas bulanan tidak stasioner dalam ragam. Oleh karena itu, perlu dilakukan transformasi Box-Cox. Gambar 5 merupakan gambar plot Box-Cox. Dapat dilihat bahwa selang kepercayaan 95% berada pada selang -0.05 sampai 0.15.

(20)

10

Dalam menentukan nilai lamda, digunakan pedoman umum seperti yang dijelaskan oleh Wei (2006) pada Tabel 2.

Tabel 2 Nilai lamda dan transformasinya (Ztadalah

data awal)

Nilai λ (lamda) Transformasi yang dilakukan

-1.0 1/Z_t

-0.5 _1/_√ _�

0.0 ln Z_t

0.5 _√_Z_t

1.0 Z_t (tidak ditransformasi)

Pada Gambar 5, dapat dilihat bahwa nilai lamda 0.0 berada pada selang kepercayaan. Oleh karena itu, nilai lamda 0.0 akan digunakan pada transformasi data dengan persamaan transformasi seperti pada Tabel 2.

Setelah dilakukan transformasi, data kemudian diplot kembali. Gambar 6 adalah plot data titik panas bulanan yang telah melalui proses transformasi Box Cox.

Gambar 6 Plot data titik panas bulanan hasil transformasi Box-Cox

b Pemilihan model

(21)

11

Gambar 7 Plot ACF kemunculan bulanan titik panas di Riau bulanan

Gambar 8 Plot PACF kemunculan bulanan titik panas di Riau bulanan

Cara mengidentifikasi ordo p, q, P dan Q dapat dilihat pada Tabel 1. Identifikasi ordo secara detail dapat dijelaskan sebagai berikut.

 Pengecekan kestasioneran lag musiman

Dari Gambar 7, dapat dilihat bahwa plot ACF memiliki pola lag nyata yang berulang pada lag kelipatan 12, maka nilai s=12. Kemudian lag musimannya diuji kestasionerannya dalam rataan dengan melakukan uji Augmented Dickey-Fuller. Berikut adalah hasil uji pada lag kelipatan 12.

(22)

12

Gambar 9 Plot ACF hasil differencing pada lag musiman

Gambar 10 Plot PACF hasil differencing pada lag musiman

Setelah data stasioner, dilakukan identifikasi ordo non-musiman dan ordo musiman.

 Identifikasi ordo non-musiman

Dilakukan dengan melihat lag awal (lag ke-1,2,3 dan seterusnya). Data non-musiman tidak mengalami differencing, maka nilai d adalah nol. Identifikasi ordo non-musiman dijelaskan pada Tabel 3.

Tabel 3 Identifikasi ordo non-musiman (p dan q)

Identifikasi plot Ordo non-musiman Dari plot ACF pada Gambar 9, dapat dilihat bahwa

terjadi cuts off setelah lag ke-1. Kemudian, plot PACF dianggap tails off.

MA(1)

Dari plot PACF pada Gambar 10, dapat dilihat bahwa terjadi cuts off setelah lag ke-1. Kemudian, plot ACF dianggap tails off.

AR(1)

(23)

13

 Identifikasi ordo musiman

Lag musiman telah mengalami differencing satu kali, maka nilai D adalah 1. Identifikasi ordo musiman dijelaskan pada Tabel 4.

Tabel 4 Identifikasi ordo musiman (P dan Q)

Identifikasi plot Ordo musiman

Dari plot ACF pada Gambar 9, dapat dilihat bahwa terjadi cuts off setelah lag ke-24. Kemudian, plot PACF dianggap tails off.

IMA(2)

Dari plot PACF pada Gambar 10, dapat dilihat bahwa terjadi cuts off setelah lag ke-24. Kemudian, plot ACF dianggap tails off.

ARI(2)

Gabungan dari hasil identifikasi ACF dan PACF. ARIMA(2,2)

Model tentatif SARIMA adalah kombinasi dari kesemua ordo teridentifikasi pada Tabel 3 dan 4 yang dapat dilihat pada Tabel 5.

Tabel 5 Identifikasi ordo model SARIMA Ordo non-musiman Ordo musiman Model SARIMA MA(1)

Dari hasil pendugaan parameter, diketahui model ARIMA(0,0,1)(0,1,2)12,

ARIMA(0,0,1)(2,1,0)12

, ARIMA(1,0,0)(0,1,2)12, ARIMA(1,0,0)(2,1,0)12, dan

ARIMA(1,0,1)(0,1,2)12 mempunyai |t-hitung| lebih besar daripada t-tabel (1.97705) untuk semua parameternya, sehingga model tersebut dikatakan layak. d Diagnosa model

(24)

14

Hasil uji Ljung-Box dan Shapiro Wilk model dapat dilihat pada Tabel 7. Tabel 6 Pendugaan parameter model SARIMA

Model Tipe Nilai parameter SE |t-hitung|

ARIMA(0,0,1)(0,1,2)12 _MA(1) _0.3846 _0.0808 _4.7599

SMA(1) -0.5611 0.1268 4.4251

SMA(2) -0.2508 0.1164 2.1546

ARIMA(0,0,1)(2,1,0)12 _MA(1) _0.3688 _0.0834 _4.4221

SAR(1) -0.3862 0.0910 4.2440

ARIMA(1,0,0)(2,1,0)12 _AR(1) _0.3573 _0.0831 _4.2996

SAR(1) -0.3856 0.0890 4.3326

SAR(2) -0.3459 0.0895 3.8648

ARIMA(1,0,0)(2,1,2)12 _AR(1) _0.3827 _0.0835 _4.5832

SAR(1) -0.1265 0.6034 0.2096

SAR(2) -0.0235 0.2552 0.0921

SMA(1) -0.4409 0.6024 0.7319

SMA(2) -0.3260 0.5633 0.5787

ARIMA(1,0,1)(0,1,2)12 _AR(1) _0.9790 _0.0577 _16.9671

MA(1) -0.8347 0.0975 8.5610

SMA(1) -0.6290 0.1543 4.0765

SMA(2) -0.2535 0.1322 1.9175

ARIMA(1,0,1)(2,1,0)12 _AR(1) _0.1818 _0.3115 _0.5836

MA(1) 0.1970 0.3196 0.6164

SAR(1) -0.3857 0.0902 4.2761

SAR(2) -0.3256 0.0959 3.3952

ARIMA(1,0,1)(2,1,2)12 _AR(1) _0.2621 _0.2951 _0.8882

MA(1) 0.1369 0.3092 0.4428

SAR(1) -0.1508 0.6767 0.2228

SAR(2) 0.0134 0.2904 0.0461

SMA(1) -0.4158 0.6733 0.6176

(25)

15 Tabel 7 Nilai p-value uji Ljung-Box dan Shapiro Wilk

Model

Ljung-Box

Shapiro Wilk

AIC ARIMA(0,0,1)(0,1,2)12 _0.9763 _0.5026 _411.70

ARIMA(0,0,1)(2,1,0)12 0.9764 0.2258 417.80 ARIMA(1,0,0)(0,1,2)12 0.6067 0.4945 411.26 ARIMA(1,0,0)(2,1,0)12 0.6561 0.2282 417.83 ARIMA(1,0,1)(0,1,2)12 _0.0035 _0.3092 _415.02

Dari hasil uji diketahui model ARIMA(1,0,1)(0,1,2)12_{, sisaannya belum}

bebas, karena p-value uji Ljung-Box lebih kecil dari taraf nyata (α). Sedangkan keempat model lainnya memenuhi asumsi kebebasan dan kenormalan sisaan. Kemudian, dari keempat model tersebut model ARIMA(1,0,0)(0,1,2)12 yang mempunyai nilai AIC paling kecil. Maka model tersebut yang digunakan pada tahap selanjutnya.

e Overfitting

Model overfitting beserta perbandingan nilai AIC dapat dilihat dari Tabel 8. Perlu diperhatikan bahwa model ARIMA(1,0,1)(0,1,2)12 tidak memenuhi asumsi sisaan, maka tidak perlu dihitung nilai AICnya.

Dari Tabel 8, didapat model ARIMA(1,0,0)(0,1,2)12_{yang mempunyai nilai}

AIC paling kecil. Maka model ini yang akan digunakan pada tahap selanjutnya.

Tabel 8 Perbandingan nilai AIC model overfitting ARIMA(1,0,0)(0,1,2)12 2013. Karena data telah mengalami transformasi Box-Cox, maka hasil peramalan harus ditransformasi balik terlebih dahulu.

Plot hasil model prediksi ARIMA(1,0,0)(0,1,2)12_{yang masih dalam bentuk}

(26)

16

Gambar 11 Hasil peramalan model ARIMA(1,0,0)(0,1,2)12

Pada plot hasil prediksi terdapat tiga garis, garis biru menunjukkan batas atas dan batas bawah dari hasil prediksi sedangkan garis merah menunjukkan data hasil prediks. Model ARIMA(1,0,0)(0,1,2)12 _{mempunyai batas atas tertinggi}

dengan nilai 9.465 dan batas atas terendah dengan nilai 5.501, untuk hasil prediksi tertinggi dengan nilai 7.155 dan hasil prediksi terendah 3.192, sedangkan untuk batas bawah tertinggi dengan nilai 4.844 dan nilai batas bawah terendah 0.882. Berikut adalah perintah dalam R untuk melakukan plot model ARIMA(1,0,0)(0,1,2)12

Tabel 9 Hasil peramalan titik panas bulanan tahun 2013

Dari Tabel 9, dapat dilihat bahwa model ARIMA(1,0,0)(0,1,2)12 mempunyai nilai prediksi tertinggi pada bulan Agustus sebesar 1,279.92 dan terendah pada bulan April sebesar 139.67.

Untuk prediksi menggunakan MMSE, perlu diketahui persamaan model prediksinya terebih dahulu. Persamaan ARIMA(1,0,0)(0,1,2)12 adalah sebagai berikut

xt= µ+at+Φ1 (xt-1- xt-13)+xt-12-Γ1 at-12-Γ2 at-13

Untuk t=n+l , dengan l adalah panjang periode yang akan diprediksi maka

xn+l= µ+an+l+Φ1 (xn+l-1- xn+l-13)+xn+l-12-Γ1an+l-12-Γ2 an+l-13

Karena nilai E(an+1)=0, maka untuk l≥1 didapat persamaan sebagai berikut

x

̂n(l) = µ+Φ1 (x̂n(l-1)- x̂n(l-13))+̂xn(l-12)-Γ1 ân(l-12)-Γ2ân(l-13)

Jan Feb Mar Apr Mei Jun Jul Agus

ARIMA(1,0,0)

(27)

17 Atau dapat ditulis bersama parameter ordonya seperti pada Persamaan 12.

x̂n l = 0.0518+0.3834 (x̂n l-1 - x̂n l-13 ) +x̂n l-12 +0.5737

ân l-12 +0.2657 ân(l-13)

(12) dengan l adalah panjang prediksi yang dilakukan x̂_n adalah jumlah kemunculan titik panas bulanan dan â_n adalah error prediksi.

Tabel 10 Contoh data hasil prediksi beserta error

t xt at

Untuk menggunakan Persamaan 12, dibutuhkan data hasil prediksi 13 bulan sebelumnya. Misal, didapat data hasil prediksi beserta error-nya dari bulan ke 20 sampai bulan ke 33 seperti pada Tabel 10. Kemudian ingin diprediksi bulan ke 34 (1 bulan ke depan, l=1).

Maka untuk memprediksi satu bulan ke depan adalah

x̂33 1 = 0.0518+0.3834 (x̂33 1-1 - x̂33 1-13 ) +x̂33 1-12 +0.5737

Jadi, berdasarkan Persamaan 12, prediksi kemunculan titik panas pada bulan ke 34 adalah 7.297. Tapi, karena pada tahap awal dilakukan transformasi data dengan menggunakan ln(Zt), maka nilai tersebut harus ditransformasi balik

(28)

18

Jadi, berdasarkan Persamaan 12, prediksi kemunculan titik panas pada bulan ke 35 adalah 4.343. Jadi, nilai kemunculan titik panas pada bulan ke-35 adalah eksponen(4.343) = 76.938.

Evaluasi Model

Tahap evaluasi model akan membandingkan hasil peramalan dengan data aktual. Kemudian, dihitung error dari hasil peramalan menggunakan MAPE yang dihitung dengan menggunakan Persamaan 10. Tabel 11 menunjukkan hasil evaluasi model ARIMA(1,0,0)(0,1,2)12.

Tabel 11 Evaluasi model ARIMA(1,0,0)(0,1,2)12

Jan Feb Mar Apr Mei Jun Jul Agus

Ramalan 187.91 440.56 253.88 139.67 338.82 919.61 712.53 1279.92

Data

Aktual 189.00 232.00 392.00 401.00 328.00 8257.00 1740.00 2963.00

� � 0.58 89.90 35.23 65.17 3.30 88.86 59.05 56.80

Semakin panjang periode yang diprediksi, maka nilai MAPE semakin besar. Hal ini dikarenakan data yang dimodelkan tidak cukup untuk melakukan prediksi jangka panjang. Tabel 12 adalah perbandingan nilai MAPE yang didapat pada panjang periode yang berbeda untuk model ARIMA(1,0,0)(0,1,2)12.

Tabel 12 Perbandingan nilai MAPE pada berbagai periode untuk model ARIMA(1,0,0)(0,1,2)12

Panjang periode prediksi Nilai MAPE

8 bulan 49.862

(29)

19

SIMPULAN DAN SARAN

Simpulan

Model ARIMA(1,0,0)(0,1,2)12 dapat digunakan untuk pemodelan data bulanan titik panas karena telah memenuhi tahap pendugaan parameter, uji kebebasan dan kenormalan sisaan, AIC dan mempunyai nilai MAPE yang paling kecil dari model-model yang diperoleh. Model ARIMA(1,0,0)(0,1,2)12 paling baik digunakan untuk memprediksi kemunculan titik panas 1 bulan ke depan, dengan nilai MAPE 0.579. Untuk melakukan prediksi kemunculan titik panas di masa yang akan datang dengan menggunakan ARIMA(1,0,0)(0,1,2)12, diperlukan data kemunculan titik panas minimal 13 bulan sebelumnya.

Saran

Penelitian ini masih memiliki kekurangan. Hasil dari penelitian ini hanya bisa memprediksi jumlah kemunculan titik panas per bulan tanpa mengetahui lokasi kemunculan titik panas. Oleh karena itu, perlu dilakukan spatial prediction agar dapat diketahui jumlah kemunculan titik panas beserta lokasinya. Selain itu, perlu diperhatikan aspek penyebab kebakaran hutan yang lain seperti curah hujan, kelembaban udara dan sebagainya, agar tingkat akurasi prediksi lebih baik.

DAFTAR PUSTAKA

Abdullah L. 2012. ARIMA model for gold bullion coin selling prices forecasting. International Journal of Advances in Appllied Sciences (IJAAS). 1(4):153-158. [Kemenhut] Kementrian Kehutanan. 2013. Statistik Kehutanan Indonesia 2012.

Jakarta (ID): Kementrian Kehutanan.

Makridakis S, Wheelwright SC, Hyndman RJ. 1998. Forecasting: Methods and Applications. 3rd ed. New York (US): J Wiley.

Montgomery DC, Jennings CL, Kulahci M. 2008. Introduction to Time Series Analysis and Forecasting. New York (US): J Wiley.

Nisa' HDK. 2010. Peramalan debit air Sungai Brantas dengan metode GSTAR dan ARIMA [skripsi]. Surabaya (ID): Institut Teknologi Sepuluh Nopember Surabaya.

Robby IS. 2014. Prediksi temporal untuk kemunculan titik panas di Provinsi Riau menggunakan autoregressive integrated moving average (ARIMA) [skripsi]. Bogor (ID): Institut Pertanian Bogor.

Tacconi L. 2003. Kebakaran Hutan di Indonesia: Penyebab, Biaya dan Implikasi Kebijakan. Bogor (ID): Center for International Forestry Research.

(30)

20

RIWAYAT HIDUP

Penulis dilahirkan pada tanggal 23 Agustus 1993 di Subang, Jawa Barat. Penulis merupakan anak pertama dari tiga bersaudara dari pasangan Enok Ratnaningsih dan Iwan Hudaya Sabata (almarhum). Pada tahun 2011, penulis lulus dari SMA Negeri 1 Subang dan diterima di Institut Pertanian Bogor melalui jalur SNMPTN Undangan di Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA).