• Tidak ada hasil yang ditemukan

Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average (ARIMA)

N/A
N/A
Protected

Academic year: 2017

Membagikan "Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average (ARIMA)"

Copied!
30
0
0

Teks penuh

(1)

PREDIKSI TEMPORAL UNTUK KEMUNCULAN TITIK PANAS

DI PROVINSI RIAU MENGGUNAKAN

AUTOREGRESSIVE

INTEGRATED MOVING AVERAGE

(ARIMA)

ISNAN SYAIFUL ROBBY

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*

Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average (ARIMA) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

ABSTRAK

ISNAN SYAIFUL ROBBY. Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average (ARIMA). Dibimbing oleh IMAS SUKAESIH SITANGGANG.

Hutan mempunyai manfaat yang besar terhadap kehidupan manusia. Saat ini luas hutan di Indonesia semakin berkurang disebabkan oleh illegal logging, kebakaran hutan, dan alih fungsi hutan. Kebakaran hutan dapat menyebabkan kerugian ekonomi, gangguan kesehatan, dan polusi. Indikator terjadinya kebakaran hutan dapat diketahui melalui munculnya titik panas. Penelitian ini bertujuan untuk melakukan pemodelan data untuk memprediksi kemunculan titik panas menggunakan Autoregressive Integrated Moving Average (ARIMA). ARIMA merupakan salah satu metode prediksi yang dapat digunakan untuk pemodelan data deret waktu seperti titik panas yang dicatat setiap hari oleh sensor pada satelit. Pemodelan dilakukan terhadap data jumlah munculnya titik panas perbulan pada periode tahun 2001 sampai dengan tahun 2012 untuk wilayah Provinsi Riau. Hasil penelitian menunjukkan model ARIMA(2,0,0) sebagai model terbaik untuk memprediksi jumlah kemunculan titik panas perbulan dengan nilai Mean Absolute Percentage Error (MAPE) sebesar 40.974.

Kata kunci: ARIMA, deret waktu, titik panas

ABSTRACT

ISNAN SYAIFUL ROBBY. Temporal Prediction for Hotspot Occurrences in Riau Province using Autoregressive Integrated Moving Average (ARIMA). Supervised by IMAS SUKAESIH SITANGGANG.

Forest has many benefits for human life. Nowadays forest areas in Indonesia have decreased because of illegal logging, forest fires and forest conversion. Wildfires have resulted economic losses, health problems and pollution. Forest fires can be indicated through hotspot occurrences. In this work, data modeling was conducted to predict hotspot occurrences using Autoregressive Integrated Moving Average (ARIMA). ARIMA is one of prediction methods that can be used for modeling timeseries data such as hotspots that are daily recorded by satellite sensor. Modeling was performed on monthly hotspots occurrences data for the period of 2001 to 2012 in Riau Province. The experimental results showed the ARIMA(2,0,0) model was the best model to predict the number of monthly hotspot occurrences with a Mean Absolute Percentage Error (MAPE) of 40.974.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer

pada

Departemen Ilmu Komputer

PREDIKSI TEMPORAL UNTUK KEMUNCULAN TITIK PANAS

DI PROVINSI RIAU MENGGUNAKAN

AUTOREGRESSIVE

INTEGRATED MOVING AVERAGE

(ARIMA)

ISNAN SYAIFUL ROBBY

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)

Penguji :

1 Hari Agung Adrianto, SKom MSi

(7)

Judul Skripsi : Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average

(ARIMA)

Nama : Isnan Syaiful Robby NIM : G64100031

Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga penelitian ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan November 2013 ini ialah titik panas, dengan judul Prediksi Temporal untuk Kemunculan Titik Panas di Provinsi Riau Menggunakan Autoregressive Integrated Moving Average (ARIMA).

Terima kasih penulis ucapkan kepada:

 Ayah, Ibu dan keluarga yang selalu mendoakan, memberi nasihat, kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan.

 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah memberi saran, masukan dan ide-ide dalam penelitian ini.

 Bapak Hari Agung Adrianto, SKom MSi dan Bapak Muhammad Asyhar Agmalaro, SSi MKom sebagai penguji.

 Ibu Yenni Aggraeni, MSi sebagai dosen Analisis Deret Waktu yang telah memberikan penjelasan mengenai analisis data deret waktu dan ARIMA.

 Rekyan Hanung Puspadewi yang telah mendoakan, mendukung dan memberikan semangat selama ini.

 Teman seperjuangan Dhiya, Khairil, Putri, Egi, Resty, Risa, Ana, Indri, Yaumil yang telah memberikan masukan.

 PIXELS 47 yang telah membantu penulis selama ini dan memberikan warna di kampus IPB.

 ESCIFION yang selalu meberikan semangat dan inspirasi.

 Keluarga Mahasiswa Madura, Keluarga Olahraga Tarung Derajat IPB dan teman-teman kosan yang selalu menghibur, mendukung dan memberi semangat.

 Departemen Ilmu Komputer, staf dan dosen yang telah banyak membantu selama penelitian dan masa perkuliahan.

Semoga penelitian ini bermanfaat.

(9)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Perumusan Masalah 2

Tujuan Penelitian 2

Manfaat Penelitian 2

Ruang Lingkup Penelitian 3

METODE 3

ARIMA 3

Bahan 4

Prosedur Analisis Data 4

Pra-Proses Data 4

Analisis Data Deret Waktu 5

Pembuatan Model Titik Panas Menggunakan ARIMA 5

Evaluasi Model 7

Peralatan Penelitian 7

HASIL DAN PEMBAHASAN 7

Pra-Proses Data 7

Analisis Data Time Series 7

Pembuatan Model Titik Panas Menggunakan ARIMA 8

Evaluasi Model 16

SIMPULAN DAN SARAN 17

Simpulan 17

Saran 17

DAFTAR PUSTAKA 17

LAMPIRAN 19

(10)

DAFTAR TABEL

1 Pendugaan parameter model ARIMA 12

2 Perbandingan nilai AIC 14

3 Hasil Peramalan 16

4 Evaluasi model ARIMA(0,0,1) 16

5 Evaluasi model ARIMA(2,0,0) 16

DAFTAR GAMBAR

1 Tahapan penelitian 4

2 Plot data titik panas per bulan pada tahun 2001 sampai dengan 2012 8 3 Plot titik panas bulanan di Provinsi Riau dengan perbedaan warna

pertahun 9

4 Plot Box-Cox 10

5 Plot data titik panas bulanan hasil transformasi Box-Cox 10

6 Plot ACF titik panas bulanan 11

7 Plot PACF titik panas bulanan 12

8 Model ARIMA(0,0,1) 15

(11)

PENDAHULUAN

Latar Belakang

Hutan merupakan ekosistem yang penting bagi manusia karena hutan dapat menjaga keseimbangan ekologi dan berperan dalam mengatur aliran hidrologis. Kerusakan hutan dapat menyebabkan punahnya ribuan spesies hewan dan tumbuhan yang hidup dalam kawasan hutan tersebut karena hutan merupakan sumber plasma nutfah dan sebagai penyangga kehidupan bagi berbagai spesies hewan dan tumbuhan (Hyde 2002). Berkurangnya luas hutan dapat menyebabkan naiknya suhu bumi yang berimplikasi terhadap meningkatnya volume es yang mencair di kutub. Kebakaran hutan berada di peringkat kedua setelah ilegal logging dalam daftar penyebab kerusakan hutan di Indonesia.

Setiap tahunnya jutaan hektar hutan mengalami kebakaran. Pengendalian kebakaran hutan merupakan tugas yang kompleks karena ketika terjadi kebakaran hutan api dapat menyebar sampai 600 km2 dalam waktu sembilan hari dan membutuhkan biaya jutaan dolar untuk memadamkannya (Martinus dan Junk 1982). Kebakaran hutan dapat menyebabkan kerusakan besar terhadap lingkungan dan membahayakan kehidupan manusia. Hutan tropika Indonesia telah dikenal di dunia sebagai hutan tropika terluas nomor 3 di dunia, setelah Brazil dan Zaire. Pada awalnya diperkirakan luas hutan tropika di Indonesia adalah 164 juta Ha, kemudian berkurang menjadi 143 juta Ha dan pada tahun 1999 diperkirakan tinggal 90 juta Ha. Apabila luas daratan Indonesia diperkirakan 190 juta Ha, luas hutan di Indonesia tinggal ± 48-64% dari daratan (Suratmo et al. 2003). Kebakaran hutan yang terbesar di Indonesia terjadi pada Tahun 1997/1998 yang mencapai luasan 9,7 juta Ha lahan dengan luasan areal terbakar tersebar di beberapa pulau seperti, Sumatera 1.7 juta Ha, Kalimantan 6.5 juta Ha, Jawa 0.1 juta Ha, Sulawesi 0.4 juta Ha dan Irian Jaya 1 juta Ha. Dengan pembagian menurut tipe hutan yang terbakar adalah hutan pegunungan 0.1 juta Ha, hutan dataran rendah 3.3 juta Ha, gambut 1.5 juta Ha, lahan pertanian dan alang-alang terbuka 45 juta Ha, HTI dan perkebunan 0.3 juta Ha. Dengan jumlah kerugian mencapai Rp 9.5 Trilyun (EEPSEA danWWF 1998).

Dari fakta-fakta yang telah disebutkan, diperlukan cara untuk mengawasi dan mengantisipasi terjadinya kebakaran hutan. Salah satu cara untuk membantu mengurangi masalah kebakaran hutan yang terjadi adalah membuat suatu model yang dapat memprediksi kemungkinan terjadinya kebakaran hutan. Dengan adanya model tersebut dapat dilakukan pencegahan lebih dini terjadinya kebakaran hutan.

(12)

2

Data titik panas termasuk dalam data deret waktu karena pencatatan dari munculnya titik panas berdasarkan runtut waktu. Data deret waktu dapat digunakan untuk melakukan prediksi untuk suatu kejadian pada waktu tertentu. Salah satu metode yang dapat digunakan untuk melakukan prediksi terhadap data deret waktu adalah ARIMA (Autoregressive Integrated Moving Average). ARIMA merupakan teknik untuk mencari pola yang cocok dari sekelompok data deret waktu untuk melakukan peramalan (Pankratz 1983).

Dalam penelitian ini ARIMA akan digunakan untuk memodelkan data titik panas di Provinsi Riau. Data titik panas yang digunakan dalam penelitian ini merupakan data deret waktuyang diperoleh NASA dari tahun 2001 sampai 2013. Dengan menggunakan ARIMA data titik panas akan dimodelkan untuk melakukan prediksi terhadap kemungkinan munculnya titik panas di masa yang akan datang sehingga dengan adanya prediksi tersebut dapat dilakukan pencegahan terhadap kemungkinan terjadinya kebakaran hutan.

Perumusan Masalah

Kebakaran hutan merupakan bencana yang sangat berpengaruh terhadap lingkungan harus dicegah dan ditanggulangi bencana tersebut. Titik panas merupakan indikator kebakaran hutan, titik panas bisa muncul kapan saja sehingga dengan adanya kemungkinan tersebut maka pencatatan mengenai kemunculannya harus secara intensif sesuai kapan terjadinya kebakaran tersebut. Dengan pencatatan yang berkala tersebut, sekumpulan data yang diperoleh merupakan suatu data deret waktukarena dicatat berdasarkan runtutan waktu. Dari data deret waktu titik panas yang diperoleh maka dapat dimodelkan untuk dilakukan prediksi terhadap kemungkinan munculnya suatu titik panas pada suatu waktu menggunakan ARIMA. Karena data bersifat deret waktu maka muncul pertanyaan bagaimana model ARIMA digunakan dalam membuat prediksi kemunculan titik panas.

Tujuan Penelitian

Tujuan dari penelitian ini adalah:

 Menerapkan ARIMA (Autoregressive Integrated Moving Average) untuk memodelkan data deret waktu titik panas untuk prediksi terjadinya kebakaran hutan di masa yang akan datang.

 Mengevaluasi model prediksi yang dihasilkan oleh metode ARIMA. Manfaat Penelitian

(13)

3 Ruang Lingkup Penelitian

Ruang lingkup dari penelitian ini adalah:

1 Data yang digunakan merupakan data titik panas di Provinsi Riau dari tahun 2001 sampai 2013 yang diperoleh dari NASA.

2 Data titik panas yang diamati adalah aspek temporal yang terkandung dalam data tersebut.

METODE

ARIMA (Autoregressive Integrated Moving Average)

Data deret waktu merupakan data hasil pengamatan pada sebuah variabel yang terjadi dalam suatu kurun waktu (Pankartz 1983). Waktu yang digunakan dalam data deret waktu dapat berupa minggu, bulan, tahun, dan sebagainya. Menurut Makridakis et al. (1999), peramalan merupakan alat bantu yang penting dalam perencanaan yang efektif dan efisien. Menurut Montgomery et al. (2008) terdapat dua metode peramalan deret waktu yaitu smoothing dan pemodelan. Smoothing dibagi berdasarkan tipe datanya, tipe data konstan menggunakan Single Moving Average dan Single Exponensial Smoothing, untuk tipe data tren menggunakan Double Moving Average dan Double Exponensial Smoothing, dan untuk tipe data musiman menggunakan Winters atau 3 tahap exponensial smoothing. Sedangkan pemodelan menggunakan model Box-Jenkins atau metode ARIMA (Autoregressive Integrated Moving Average).

Data deret waktu dapat digunakan untuk menganalisis pola dari data tersebut yang akan diperlukan dalam peramalan di masa yang akan datang. Salah satu metode yang digunakan untuk melakukan peramalan data deret waktu adalah ARIMA. ARIMA merupakan suatu metode yang menghasilkan ramalan-ramalan berdasarkan sintesis dari pola data secara historis (Arsyad 1995). ARIMA mempunyai beberapa kelebihan yaitu, mudah dalam pembentukan modelnya, lebih cepat dalam pembentukan model, tidak perlu pelatihan seperti ANN (Artificial Neural Network), hasilnya mudah diinterpretasikan, karena koefisien-koefisien model diketahui, sehingga dapat dilihat pengaruh masing-masing prediktor terhadap hasil keluaran model (Hagen 2006). ARIMA memiliki tingkat keakuratan peramalan yang cukup tinggi karena setelah mengalami tingkat pengukuran kesalahan peramalan MAE (Mean Absolute Error) nilainya mendekati nol (Francis dan Hare 1995).

ARIMA (Autoregressive Integrated Moving Average) merupakan model yang dikembangkan oleh George Box dan Gwilyn Jenkinson yang diterapkan untuk analisis dan peramalan data deret waktu, sehingga model ini sering disebut dengan model Box-Jenkins. ARIMA adalah teknik untuk mencari pola yang paling cocok dari sekelompok data (curve fitting), dengan memanfaatkan sepenuhnya data masa lalu dan sekarang untuk melakukan peramalan jangka pendek yang akurat (Pankartz 1983). Metode ini dapat digunakan hanya pada data deret waktu yang stationer (Pankratz 1983). Metode ini terdiri dari tiga langkah yaitu identifikasi model, pendugaan parameter, dan diagnostik model (Pankratz 1983).

(14)

4

yang berbeda, tapi untuk Autoregressive (AR) regresi dilakukan terhadap dirinya sendiri atau menghubungkan nilai-nilai sebelumnya pada variabel itu sendiri, sedangkan model Moving Average (MA) merupakan salah satu metode analisis teknikal sederhana dengan mencari rataan bergerak dari suatu variabel selama beberapa periode yang dipengaruhi oleh kesalahan atau residual pada saat ini dan masa lalu. Secara umum model ARIMA (p,d,q) dengan p merupakan derajat Autoregressive (AR), d merupakan banyaknya proses differencing, dan q merupakan derajat Moving Average (MA) dinyatakan sebagai berikut (Cryer dan Kung-Sik 2008)

wt = � ��− + � ��− +....+ ��− + - ∅ ��− - ∅ ��− -....- ��− ...(1)

dengan wt =variabel yang menyatakan selisih antara pengamatan dalam deret

waktu (yt - yt-1); yt = deret waktu stasioner; yt-1 = nilai masa lalu; θ1... θp= parameter

model Autoregressive; ∅1... p= parameter model Moving Avarage; wt-1...wt-p =

nilai masa lalu; et-1...et-p =residual yang digunakan oleh modeldan et = residualpada

waktu t.

Bahan

Dalam penelitian ini data yang digunakan adalah data titik panas di Provinsi Riau pada tahun 2001 sampai dengan 2013 yang diperoleh dari NASA. Dari data yang diperoleh aspek yang diamati adalah atribut waktu karena akan digunakan untuk melakukan prediksi temporal yang berdasarkan rentang waktu tertentu.

Prosedur Analisis Data

Penelitian ini akan dilaksanakan berdasarkan tahapan yang digambarkan dalam Gambar 1.

Gambar 1 Tahapan penelitian

Pra-Proses Data

Tahap pra-proses data merupakan tahap untuk mengubah data mentah yang diperoleh menjadi suatu data yang siap digunakan dalam penelitian ini. Pada tahap

Mulai

Selesai

Pra-Proses Data Deret Waktu Plot Data Deret Waktu

(15)

5 ini akan dilakukan pembersihan data dengan melakukan seleksi terhadap titik panas yang berada di area studi atau membuang data yang tidak diperlukan dalam penelitian ini dan dilakukan seleksi atribut-atribut pada data mentah menjadi menjadi data yang memiliki atribut yang dibutuhkan dalam penelitian. Hasil dari tahap ini merupakan data yang siap digunakan untuk melakukan pemodelan. Plot Data Deret Waktu

Plot data deret waktu memungkinkan untuk mengetahui hubungan atau pengaruh suatu kejadian dengan kejadian lain. Misalnya, apakah kenaikan jumlah penggunaan pupuk diikuti dengan kenaikan produksi padi. Pada penelitian ini akan diamati bagaimana waktu dapat mempengaruhi kemunculan titik panas pada waktu yang akan datang. Pengaruh waktu menunjukkan kalau data tersebut bisa dikatakan data musiman yang terjadi pada waktu tertentu.

Data deret waktu mempunyai beberapa komponen sehingga dengan plot data deret waktu dapat diketahui masing-masing atribut, bahkan dengan plot data deret waktu, satu atau beberapa atribut dapat dihilangkan jika ingin mengamati atribut tersebut secara mendalam tanpa kehadiran atribut yang lain. Data deret waktu selalu mengalami perubahan karena adanya pengaruh dari atribut tersebut sehingga jika dibuat grafiknya akan menunjukkan suatu fluktuasi. Fluktuasi merupakan naik turunnya suatu grafik (Supranto 1996).

Pembuatan Model Titik Panas Menggunakan ARIMA

Pembuatan model prediksi titik panas dilakukan dengan langkah sebagai berikut:

a Identifikasi model. Dalam tahap ini diawali dengan melihat stasioneritas data, jika data tidak stasioner maka dilakukan proses differencing. Setelah data stasioner, ditentukan model-model sementara, yaitu dengan menentukan nilai p, q dan d. Penentuan nilai-nilai tersebut dilakukan dengan mengamati grafik fungsi ACF (korelogram) dan PACF (korelogram parsial) (Montgomery et al. 2008). Nilai p (ordo proses AR) dapat ditentukan dengan melihat nilai pada grafik fungsi PACF dan nilai q (ordo proses MA) dapat ditentukan dengan melihat nilai pada grafik fungsi ACF, sedang d merupakan banyaknya proses differencing yang dilakukan. Cara untuk identifikasi ordo tersebut secara lengkap dapat dilihat pada Lampiran 1. Persamaan untuk menghitung ACF pada lag ke-k (Montgomery et al. 2008):

� =� ����, �+

� = , , , … ,

(16)

6

b Pendugaan parameter dari setiap model-model sementara menentukan apakah parameter sudah layak digunakan dalam model. Pendugaan parameter dapat dilakukan dengan menggunakan beberapa metode, yaitu metode momen, kuadrat terkecil dan kemungkinan maksimum (likelihood) (Montgomery et al. 2008). Pendugaan parameter untuk suatu model dikatakan berpengaruh signifikan jika nilai |t-hitung| lebih besar dari t-tabel (t(1-α/β);df = n-np), dengan α adalah taraf nyata (level of significance) yang dalam bernilai 0,05 (5%). Freedom of degree (df) adalah tingkat kepercayaan yang didapatkan dari operasi pengurangan antara jumlah data dengan jumlah perkiraan parameter. Persamaan t-hitung (Irianto 2004) adalah

|t-hitung| = �

�� � ...(2)

dengan adalah parameter dugaan, sedangkan SE( ) adalah standar

error dari setiap parameter dugaan.

c Diagnostik model dilakukan untuk melihat model yang relevan dengan data. Pada tahap ini model harus dicek kelayakannya dengan melihat sifat sisaan dari sisi kenormalan dan kebebasannya. Secara umum pengecekan kebebasan sisaan model dapat dilakukan dengan menggunakan uji Q modifikasi Box-Pierce (Ljung-Box). Persamaan uji Q sebagai berikut (Cryer dan Kung-Sik 2008)

�∗= ( + 2) ��

�−

= ...(3) dengan rk adalah nilai korelasi diri sisaan pada lag ke-k, n banyaknya data yang diamati, dan k adalah lag maksimum.

Statistik uji Q* Ljung-Box menyebar mengikuti sebaran 2(K-p-q), dengan p adalah ordo AR dan q adalah ordo MA. Jika nilai Q* lebih

besar dari nilai 2(K-p-q), untuk tingkat kepercayaan tertentu (df = k-p-q) atau nilai peluang statistik Q* Ljung-Box lebih kecil dari taraf nyata

(α), dapat dikatakan bahwa sisaan tidak saling bebas. Kemudian dilakukan uji Shapiro-wilk untuk mengetahui kenormalan pada sisaan, jika nilai p yang dihasilkan lebih besar dari α, maka memenuhi kenormalan sisaan.

d Overffiting. Proses ini adalah membandingkan model-model yang diperoleh dengan model beda satu ordo di atasnya. Model yang digunakan sebagai pembanding adalah model yang dihasilkan dengan menambahkan satu ordo pada setiap parameter yang terdapat pada model sementara. Model dengan nilai AIC (Akaike’s Information Criterion) terkecil, memenuhi asumsi sisaan dan semua parameternya signifikan, diikutsertakan pada langkah berikutnya. Persamaan untuk menghitung nilai AIC (Montgomery et al. 2008):

��� = − log � ℎ +

Dengan k merupakan jumlah parameter yaitu k = p + q, dengan p adalah ordo AR dan q adalah ordo MA.

(17)

7 Evaluasi Model

Pada tahap ini akan dihitung ketepatan dari model yang telah dipilih. Ketepatan peramalan dapat dicari dengan menghitung nilai Mean Absolute Percentage Error (MAPE) (Montgomery et al. 2008):

MAPE =

dan ft adalah data hasil ramalan pada waktu ke-t. Semakin kecilnya nilai MAPE menunjukan bahwa data hasil peramalan mendekati nilai aktual.

Peralatan Penelitian

Perangkat lunak yang digunakan dalam penelitian ini adalah:

Sistem Operasi : Microsoft Windows 7 (32-bit)

Bahasa Pemrograman : R

Antarmuka Bahasa Pemrograman : R Studio

Perangkat keras yang digunakan dalam penelitian ini komputer personal dengan spesifikasi:

Prosesor : Intel(R) Core(TM)i5-2410M

Memory : 2GB (RAM)

VGA : NVDIA GeForce GT 525M

HASIL DAN PEMBAHASAN

Pra-Proses Data

Data mentah yang diperoleh dalam penelitian ini masih mengandung beberapa data dan atribut yang tidak diperlukan dalam penelitian. Sehingga diperlukan pra-proses data untuk menghilangkan data dan atribut yang tidak diperlukan tersebut. Area penelitian ini merupakan Provinsi Riau sehingga data yang berada di luar Provinsi Riau harus dibuang. Selain itu atribut yang tidak diperlukan juga dibuang. Sehingga dari tahap ini diperoleh data bersih yaitu data titik panas Provinsi Riau saja dengan atribut yang diperlukan seperti time, longitude, dan latitude. Kemudian dihitung jumlah titik panas yang muncul tiap bulan.

Plot Data Deret Waktu Titik Panas

Gambar 2 menunjukkan grafik hasil plot data titik panas per bulan di Provinsi Riau dari tahun 2001 sampai dengan tahun 2012. Perintah dalam R untuk menghasilkan plot seperti pada Gambar 2:

(18)

8

tahun 2005 yang mencapai nilai 7057 seperti yang tergambar dalam grafik berwarna hijau muda. Hal tersebut disebabkan titik panas dipengaruhi beberapa faktor seperti suhu dan musim. Ketika musim kemarau maka kemungkinan munculnya titik panas semakin besar karena suhu udara ketika musim kemarau cukup tinggi sehingga dapat memicu munculnya titik panas. Perintah dalam R untuk menghasilkan plot seperti pada Gambar 3:

Gambar 2 Plot data titik panas per bulan pada tahun 2001 sampai dengan 2012 Pembuatan Model Titik Panas Menggunakan ARIMA

a Identifikasi model

Untuk mengidentifikasi model, pertama harus melakukan uji stasioneritas data titik panas yang dihasilkan dari pra-proses data. Untuk mengetahui stasioneritas data dalam nilai tengah dapat diperoleh dengan melakukan uji akar unit menggunakan uji Augmented Dickey-Fuller terhadap data titik panas bulanan. p-value hasil uji Augmented Dickey-Fuller sebesar 0.0156, dimana nilai tersebut lebih kecil dari α yang bernilai 0.05 yang menunjukkan kestasioneran dalam nilai tengah. Berikut adalah perintah dalam R untuk melakukan uji stasioneritas:

(19)

9 Berikut adalah hasil Augmented Dickey-Fuller:

Gambar 3 Plot titik panas bulanan di Provinsi Riau dengan perbedaan warna pertahun

Selain kestasioneran dalam nilai tengah, uji stasioneritas dalam ragam juga dilakukan menggunakan uji Bartlett and Levene. p-value hasil uji Bartlett and levene yang diperoleh lebih kecil dari 2.2e-16 sehingga data titik panas bulanan tidak stasioner dalam ragam karena nilai p-value hasil uji Bartlett and levene lebih kecil dari α yang bernilai 0.05. Karena data masih belum stasioner dalam ragam, sehingga perlu dilakukan transformasi Box-Cox, agar data dapat digunakan pada tahap selanjutnya yaitu penentuan plot ACF dan PACF. Berikut adalah hasil uji Bartlett and levene:

Menurut Ispriyanti (2004) transformasi Box Cox adalah transformasi pangkat pada respons. Box Cox mempertimbangkan kelas transformasi berparameter tunggal, yaitu λ yang dipangkatkan pada variabel respon . Secara umum transformasi Box-Cox mempunyai rumus = �, dimana adalah data hasil transformasi, adalah data awal sebelum ditransformasi, dan λ merupakan koefisien dari transformasi Box-Cox yang perlu diduga. Nilai λ dapat diperoleh dari plot

(20)

10

Box-Cox seperti yang terlihat pada Gambar 4. Berdasarkan Gambar 4 diperoleh λ=0.05. Setelah itu dilakukan transformasi menggunakan nilai

λ yang diperoleh, plot data hasil transformasi Box-Cox ditampilkan pada Gambar 5. Berikut adalah perintah dalam R untuk transformasi Box-Cox:

Gambar 4 Plot Box-Cox

Gambar 5 Plot data titik panas bulanan hasil transformasi Box-Cox

-0.10 -0.05 0.00 0.05 0.10 0.15 0.20

(21)

11 Setelah data bersifat stasioner, maka plot ACF dan plot PACF dapat dilakukan dengan menggunakan data titik panas bulanan yang telah ditransformasi. Plot ACF dapat dilihat pada Gambar 6 dan plot PACF dapat dilihat pada Gambar 7. Dari hasil plot diagram ACF dapat dilihat bahwa nilai korelasi diri nyata pada lag ke-1 sehingga dapat diketahui bahwa ordo dari MA adalah 1 dan dapat diidentifikasi bahwa model sementara yang mungkin dapat dibentuk adalah ARIMA (0,0,1). Sedangkan dari hasil plot diagram PACF dapat diketahui bahwa nilai korelasi diri parsial nyata pada lag ke-1, sehingga dapat diketahui bahwa ordo AR adalah 1 dan dapat diidentifikasi model sementara berikutnya yang dapat dibentuk adalah ARIMA (1,0,0). Selain melihat plot ACF dan PACF secara terpisah untuk menentukan kemungkinan model berikutnya yang dapat dibentuk dengan menggabungkan hasil plot ACF dan PACF yaitu dengan menggabungkan ordo dari AR dan MA, sehingga diperoleh model ARIMA (1,0,1). Berikut adalah perintah dalam R untuk melakukan plot ACF dan PACF:

Gambar 6 Plot ACF titik panas bulanan

(22)

12

Gambar 7 Plot PACF titik panas bulanan b Pendugan parameter

Pada tahap ini dilakukan pendugaan parameter pada model-model sementara yang diperoleh akan dilakukan pendugaan parameter. Hasil pendugaan parameter dapat dilihat pada Tabel 1. Dari hasil pendugaan parameter diperoleh dua model yang terseleksi dari tahap ini adalah model ARIMA(0,0,1) dan model ARIMA(1,0,0), karena kedua model tersebut mempunyai t-hitung lebih besar dari t-tabel untuk semua parameternya, dimana nilai t-tabel sebesar 1.97705.

Tabel 1 Pendugaan parameter model ARIMA

Model Tipe Nilai

Pada tahap ini dilakukan diagnostik model pada model-model yang diperoleh dari tahap pendugaan parameter dan dilakukan diagnostik model untuk memeriksa kelayakan menggunakan asumsi kebebasan dan kenormalan dari sebaran sisaan. Uji Ljung-Box digunakan untuk melihat kebebasan sisaan, sedangkan uji Shapiro-walk digunakan untuk melihat kenormalan sisaan.

(23)

13

Beriut adalah hasil uji Ljung-Box pada model ARIMA(0,0,1):

Beriut adalah hasil uji Shapiro-wilk pada model ARIMA(0,0,1):

Pada model ARIMA(1,0,0) mempunyai nilai p-value dari hasil uji Ljung-Box sebesar 0.5309 dan nilai p-value hasil uji Shapiro-wilk sebesar 0.5857. Model ini juga dianggap layak karena mempunyai nilai p yang lebih dari α untuk semua hasil uji. Berikut adalah perintah dalam R untuk melakukan uji Ljung-Box dan uji Shapiro-walk ARIMA(2,0,0):

Beriut adalah hasil uji Ljung-Box pada model ARIMA(0,0,1):

(24)

14

d Overfitting

Model overfitting untuk model ARIMA(0,0,1) adalah ARIMA(0,0,2) dan model overfitting dari model ARIMA(1,0,0) adalah ARIMA(2,0,0). Dari kedua model yang di-overfitting akan dibandingkan dan model hasil overfitting ditentukan oleh nilai AIC (Akaike’s Information Criterion) terkecil. Perbandingan nilai AIC dapat dilihat dari Tabel 2. Dari tahap overfitting diperoleh model ARIMA(0,0,1) yang mempunyai ordo MA(1) menghasilkan nilai AIC yang lebih kecil dari model ARIMA(0,0,2) yang mempunyai ordo MA(2) dan ARIMA(2,0,0) yang mempunyai ordo AR(2) menghasilkan nilai AIC yang lebih kecil dari model ARIMA(1,0,0) yang mempunyai ordo AR(1). Dua model yang terpilih, yaitu model ARIMA(0,0,1) dan Model ARIMA(2,0,0) digunakan untuk melakukan peramalan pada tahap selanjutnya.

Tabel 2 Perbandingan nilai AIC

Model AIC

Model yang diperoleh dari tahap overfitting akan digunakan untuk peramalan. Peramalan akan dilakukan untuk 8 bulan selama tahun 2013 dari bulan Januari sampai Agustus. Hasil peramalan harus ditransformasi balik terlebih dahulu karena sebelumnya telah dilakukan transformasi Box-Cox. Plot dari model ARIMA(0,0,1) dapat dilihat pada Gambar 8, sedangkan plot model ARIMA(2,0,0) dapat dilihat pada Gambar 9. Data hasil peramalan dari model yang terbentuk dapat dilihat pada Tabel 3.

(25)

15

Gambar 8 Model ARIMA(0,0,1)

Gambar 9 merupakan plot grafik hasil model prediksi ARIMA(2,0,0) yang masih dalam bentuk data transformasi. Plot hasil prediksi pada Gambar 9 mempunyai struktur yang sama seperti Gambar 8 yang mempunyai batas atas, hasil prediksi dan batas bawah. Model ARIMA(2,0,0) mempunyai batas atas tertinggi dengan nilai 1.562 dan batas atas terendah dengan nilai 1.413, untuk hasil prediksi tertinggi dengan nilai 1.394 dan hasil prediksi terendah 1.245, sedangkan untuk batas bawah tertinggi dengan nilai 1.226 dan nilai batas bawah terendah 1.077. Berikut adalah perintah dalam R untuk melakukan plot model ARIMA(2,0,0):

Pada Tabel 3 menunjukkan data hasil prediksi selama delapan bulan dari bulan Januari sampai bulan Agustus untuk model ARIMA(0,0,1) dan model ARIMA(2,0,0). Dua model yang digunakan untuk prediksi menghasil data hasil prediksi yang hampir mirip, yaitu mempunyai hasil prediksi yang tinggi pada bulan Juni sampai Agustus dan mempunyai hasil prediksi yang rendah pada bulan Januari. Model ARIMA(0,0,1) mempunyai nilai prediksi tertingi pada bulan Juni sebesar 837.606 dan terendah pada bulan Januari sebesar 186.407, sedangkan model ARIMA(2,0,0) mempunyai nilai prediksi tertinggi pada bulan Juni sebesar 775.959 dan terendah pada bulan Januari sebesar 188.135.

Time

2002 2004 2006 2008 2010 2012 2014

1.

1

1.

2

1.

3

1.

4

1.

(26)

16

Gambar 9 Model ARIMA(2,0,0) Tabel 3 Hasil peramalan titik panas bulanan

Evaluasi Model

Tahap evaluasi model akan membandingkan hasil peramalan dengan data aktual. Kemudian, akan dihitung error dari hasil peramalan menggunakan Mean Absolute Percentage Error (MAPE). Tabel 4 menunjukkan hasil evaluasi model ARIMA(0,0,1) dan Tabel 5 menunjukkan hasil evaluasi model ARIMA(2,0,0). Model ARIMA(0,0,1) mempunyai nilai MAPE sebesar 43.460, sedangkan model ARIMA(2,0,0) mempunyai nilai MAPE sebesar 40.974. Sehingga model yang lebih baik adalah model ARIMA(2,0,0) karena mempunyai nilai MAPE terkecil. Secara matematis model ARIMA(2,0,0) dapat ditulis sebagai berikut :

� = . + . �− − . �−

Tabel 4 Evaluasi model ARIMA(0,0,1)

Jan Feb Mar Apr Mei Jun Jul Agus

Ramalan 186.407 252.655 204.000 207.691 292.411 837.606 545.649 832.767 Data

Aktual 189 232 392 401 328 8257 1740 2963

� � 1.371 -8.903 47.959 48.206 10.850 89.855 68.640 71.894

Tabel 5 Evaluasi model ARIMA(2,0,0)

Jan Feb Mar Apr Mei Jun Jul Agus

Ramalan 188.135 237.747 253.263 239.034 282.980 775.959 524.759 743.458 Data

Aktual 189 232 392 401 328 8257 1740 2963

� � 0.457 -2.477 35.392 40.390 13.725 90.602 69.841 74.908

Time

2002 2004 2006 2008 2010 2012 2014

1.

(27)

17 Dari hasil evaluasi dua model yang digunakan untuk memprediksi jumlah kemunculan titik panas bulanan mempunyai nilai MAPE yang tinggi. Tingginya nilai MAPE disebabkan oleh data aktual yang tinggi pada bulan Juni sampai Agustus. Terjadi fluktuasi data yang signifikan pada data aktual tahun 2013 dari bulan Juni sampai Agustus, hal tersebut sama seperti yang terjadi pada tahun 2005. Data aktual pada bulan Juni sebesar 8257, Juli sebesar 1740 dan Agustus sebesar 2963.

SIMPULAN DAN SARAN

Simpulan

Hasil penelitian menunjukkan bahwa data titik panas bulanan yang diperoleh tidak stasioner dalam ragam. Hal ini dapat dilihat dari hasil uji Bartlett and Levene, sehingga dilakukan transformasi data menggunakan transformasi Box-Cox. Model ARIMA(2,0,0) dapat digunakan untuk pemodelan data bulanan titik panas karena telah memenuhi tahap pendugaan parameter, uji kebabasan dan kenormalan sisaan, AIC (Akaike’s Information Criterion) dan mempunyai nilaiMAPE (Mean Absolute Percentage Error) yang paling kecil dari model-model yang diperoleh. Model ARIMA(2,0,0) mempunyai nilai MAPE sebesar 40.974, nilai MAPE tersebut masih cukup besar, hal ini disebabkan oleh data aktual yang sangat tinggi pada bulan Juni, Juli dan Agustus, sehingga menghasilkan selisih error yang tinggi.

Saran

Penelitian ini masih memiliki kekurangan. Hal tersebut dapat terlihat dari nilai MAPE yang cukup besar, sehingga mungkin dapat menggunakan teknik lain seperti ARIMA Fuzzy Timeseries, Fuzzy atau teknik lain yang mungkin bisa menghasil error yang lebih kecil. Selain itu disarankan penelitian lanjutan untuk melakukan peramalan tidak hanya aspek temporal saja, tapi dari aspek spasial atau lokasi yang mungkin muncul titik panas pada waktu tertentu.

DAFTAR PUSTAKA

Arsyad L. 1995. Peramalan Bisnis. Jakarta (ID): Ghalia Indonesia.

Cryer JD, Kung-Sik C. 2008. Time Series Analysis With Applications in R Second Edition. New York (US): Springer Science+Business Media, LLC. [EEPSEA] Economy and Environment Program for Southeast Asia and [WWF]

World Wide Fund for Nature. 1998. Interim results of Study on The Economic Value of Haze Damage In Southest Asia. Jakarta.

[FFSEA] Fire Fight South East Asia. 2002. Pengadilan Pelaku Kebakaran Hutan dan Lahan : Sebuah Studi Kasus Mengenai Proses Hukum di Riau Indonesia. Fire Fight South East Asia. WWF. IUCN. European Union.

Francis RC, Hare SR. 1995, Climate Change and Salmon Production in The Northeast Pacific Ocean. Climate Change and Northern Fish Populations. p.357-372

(28)

18

Hyde EB. 2002. Southeast Asian Rainforest [Internet]. [diakses 2013 Des 7]. Tersedia pada: http://www.blueplanetbiomes.org/se_asian_rnfrst.htm

Irianto A. 2004. Statistik Konsep Dasar dan Aplikasinya. Jakarta (ID): Kencana Prenada Media Group

Ispriyanti D. 2004. Pemodelan statistika dengan transformasi box-cox. Jurnal Matematika dan Komputer. 7(3):8-17.

Makridakis SG, Wheelmright, SC, McGee VE. 1999. Metode dan Aplikasi Peramalan. Jakarta (ID): Binarupa Aksara.

Martinus N, Junk W. 1982. The Petawawa National Forestry Institute: Forest fires in North America. Proceedings of the International Seminar on Forest Fire Prevention and Control, Warsaw, Poland (PL): 127–34.

Montgomery DC, Cheryl LJ, Murat K. 2008. Introduction to Time Series Analysis and Forecasting. New Jersey (US): John Wiley & Sons, Inc.

Pankratz A.1983. Forecasting With Univariate Box – Jenkins Model. New Jersey (US): John Wiley & Sons, Inc.

Supranto J. 1996. Dasar-dasar Statistik. Jakarta (ID): Rieneka Cipta Group. Suratmo, Husaeni FGA, Jaya NS. 2003. Pengetahuan Dasar Pengendalian

Kebakaran Hutan. Bogor (ID): Fakultas Kehutanan IPB.

(29)

19 Lampiran 1 Tabel penentuan nilai ordo pada proses ARIMA berdasarkan plot

ACF dan PACF

No Kemngkinan plot ACF dan PACF Ordo

1

ACF nyata pada lag ke-1,2,3,....,q dan terpotong setelah lag q (cuts off), PACF menurun cepat membentuk pola

exponensial atau sinus(tails off)

MA(q)

2 ACF tails off , PACF nyata pada lag ke

1,2,....,p dan cuts off setelah lag ke-p AR(p) 3

ACF nyata pada lag ke-1,2,...q lalu cuts off, PACF nyata pada lag ke-1,2,3...,p dan cuts off

MA(q) jika ACF cuts off lebih tajam, AR(p) jika PACF cuts off lebih tajam 4 Tidak ada autokorelasi yang nyata pada

plot ACF dan PACF ARMA(0,0)

(30)

20

RIWAYAT HIDUP

Gambar

Gambar 2  Plot data titik panas per bulan pada tahun 2001 sampai dengan 2012
Gambar 3  Plot titik panas bulanan di Provinsi Riau dengan perbedaan   warna pertahun
Gambar 5  Plot data titik panas bulanan hasil transformasi Box-Cox
Gambar 6  Plot ACF titik panas bulanan
+4

Referensi

Dokumen terkait

Rumusan permasalahan pada penelitian ini adalah bagaimana data cuaca yaitu curah hujan dan temperatur dapat mempengaruhi kemunculan berurutan titik panas di wilayah

Mendapatkan model ARIMA terbaik yang dapat digunakan untuk memprediksi nilai IHK dan indeks harga komoditas kesehatan kota Bandar Lampung pada periode yang akan

Rumusan permasalahan pada penelitian ini adalah bagaimana data cuaca yaitu curah hujan dan temperatur dapat mempengaruhi kemunculan berurutan titik panas di wilayah

Dengan menggunakan model subset ARIMA ([1,12],1,0) dengan penambahan 19 outlier , diprediksikan besar inflasi pada akhir tahun 2015 sekitar 8% dan target inflasi tahun 2015

Gambar 1 Prosedur Box‐Jenkins untuk pembentukan model ARIMA Dalam penelitian ini data yang akan digunakan merupakan data sekunder ,tepatnya data tentang nilai saham

Penelitian ini mengenai peramalan deret waktu (time series) dengan penerapan model Autoregressive Integrated Moving Average (ARIMA) untuk meramalkan nilai harga

Tujuan Penelitian ini yaitu membantu pemerintah memprediksi harga jahe merah dipasaran dalam kurung waktu tertentu dengan membuat aplikasi prediksi berbasis Web, bahasa pemrograman

Pada penelitian ini diramalkan IHK untuk 6 bulan ke depan dari Januari 2023 sampai dengan Juni 2023 yang menggunakan model Autoregressive Integrated Moving Average ARIMA.. Hasil