• Tidak ada hasil yang ditemukan

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA"

Copied!
27
0
0

Teks penuh

(1)

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI

RIAU BERDASARKAN TIPE PENUTUPAN LAHAN

ANESIA MEILA ROSA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR 2014

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Analisis Data Deret Waktu Hotspot Provinsi Riau Berdasarkan Tipe Penutupan Lahan adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Januari 2014 Anesia Meila Rosa NIM G64114002

(4)

ABSTRAK

ANESIA MEILA ROSA. Analisis Data Deret Waktu Hotspot Provinsi Riau Berdasarkan Tipe Penutupan Lahan. Dibimbing oleh IMAS SUKAESIH SITANGGANG.

Riau merupakan salah satu provinsi di Indonesia yang kerap kali menjadi salah satu Provinsi dengan tingkat kebakaran tertinggi dan menimbulkan polemik ke negara tetangga.Identifikasi pola terjadinya kebakaran berdasarkan waktu dapat dilakukan dengan pengolahan data sebaran titik panas (hotspot) Provinsi Riau.Pada penelitian ini, digunakan analisis dengan mendekomposisi data deret waktu untuk mengidentifikasi pola data hotspot. Metode yang digunakan untuk klasifikasi adalah conditional inference tree dan k nearest neighbor yang tersedia dalam perangkat komputasi statistika R. Dekomposisi data deret waktu yang dihasilkan mampu menunjukkan pola titik panas kurun waktu tahun 2001 hingga tahun 2012. Klasifikasi data deret waktu memiliki akurasi tertinggi sebesar 33.3% saat menggunakan tujuh kelas target tipe penutupan lahan dengan periode waktu bulanan.

Kata kunci: conditional inference tree, data deret waktu, dekomposisi data, k nearest neighbour, titik panas

ABSTRACT

ANESIA MEILA ROSA. Time Series Hotspot Data Analysis Based on Land Cover Type. Supervised by IMAS SUKAESIH SITANGGANG.

Riau is a province in Indonesia which has high occurences of forest fires and also causes polemics to its neighboring countries. Fire occurences identification can be performed by processing hotspot distribution data. In this research, decomposition of the time series data was used to identify hotspot occurence patterns. Decomposition of time series data shows several patterns of hotspot over the year 2001 to 2012. In addition, classification methods namely conditional inference tree and k-nearest neighbor were applied to create classifiers for hotspot data based on land cover types. The highest accuracy of classifier is 33.3% for the dataset with seven target classes of land cover types in monthly period.

Keywords: conditional inference tree, data decomposition, hotspot, k nearest neighbour, time series data

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer

pada

Departemen Ilmu Komputer

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI

RIAU BERDASARKAN TIPE PENUTUPAN LAHAN

ANESIA MEILA ROSA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR 2014

(6)

Penguji:

1 M Asyhar Agmalaro, SSi MKom 2 Toto Haryanto, SKom MSi

(7)

Judul Skripsi : Analisis Data Deret Waktu Hotspot Provinsi Riau Berdasarkan Tipe Penutupan Lahan

Nama : Anesia Meila Rosa NIM : G64114002

Disetujui oleh

Dr. Imas S Sitanggang, SSi MKom Pembimbing

Diketahui oleh

Dr Ir. Agus Buono, MSi MKom Ketua Departemen

(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah Subhanahu wa Ta'ala atas segala karunia-Nya sehingga skripsi ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juni 2013 ini ialah data deret waktu, dengan judul Analisis Data Deret Waktu Hotspot Provinsi Riau Berdasarkan Tipe Penutupan Lahan.

Terima kasih penulis ucapkan kepada Ibu Imas S Sitanggang selaku pembimbing. Ungkapan terima kasih juga disampaikan kepada suami, ayah, ibu, mama, papa, serta seluruh keluarga besar, atas segala doa dan kasih sayangnya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Januari 2014

(9)

DAFTAR ISI

DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 1 Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

METODE 2

Data Penelitian 2

Alur Penelitian 3

Praproses data 3

Dekomposisi Data Deret Waktu 4

Klasifikasi data deret waktu dengan k-NN dan conditional inference tree 4

Analisis Model Klasifikasi 4

Lingkungan Pengembangan 4

HASIL DAN PEMBAHASAN 5

Pengumpulan Data 5

Praproses Data Deret Waktu 6

Dekomposisi data deret waktu 8

Pola Distribusi Hotspot Untuk Setiap Kelas Tipe Penutupan Lahan 10 Klasifikasi data deret waktu dengan metode conditional inference tree 10

Klasifikasi data deret waktu dengan k-NN 14

SIMPULAN DAN SARAN 15

Simpulan 15

Saran 15

DAFTAR PUSTAKA 16

LAMPIRAN 13

(10)

DAFTAR TABEL

1 Data hotspot Provinsi Riau tahun 2008 (NASA, 2013) 2 2 Tipe lahan penutupan Provinsi Riau (data spasial Provinsi Riau 2008) 3 3 Kelas penutupan lahan yang dipakai pada penelitian 6 4 Hasil klasifikasi dengan data hotspot harian Provinsi Riau tahun 2001

hingga 2012 menggunakan metode conditional inference tree 12 5 Hasil klasifikasi dengan data hotspot bulanan Provinsi Riau tahun 2001

hingga 2012 menggunakan metode conditional inference tree 13 6 Akurasi pohon keputusan data hotspot 2001-2012 menggunakan

metode conditional inference tree 13

7 Akurasi klasifikasi data uji hotspot 2013 menggunakan metode

conditional inference tree 14

8 Akurasi klasifikasi data hotspot 2001-2012 menggunakan metode k-NN

dengan leave one out cross validation 14

9 Akurasi klasifikasi data hotspot data uji hotspot 2013 menggunakan

metode k-NN 14

DAFTAR GAMBAR

1 Diagram alur penelitian 3

2 Diagram alur praproses data deret waktu hotspot 3 3 Jumlah titik panas Provinsi Riau tahun 2001-2012 (Data hotspot spasial

Provinsi Riau, 2013) 5

4 Titik panas berdasarkan area penutupan lahan kurun waktu 2001 hingga

2012 (Data hotspot spasial Provinsi Riau, 2013) 6

5 Data hotspot sebelum dilakukan clipping dan query sederhana 7 6 Jumlah titik panas harian Provinsi Riau tahun 2001-2012 8 7 Trend data deret waktu hotspot Provinsi Riau tahun 2001-2012 9 8 Indeks musiman data deret waktu hotspot Provinsi Riau tahun

2001-2012 9

9 Irregular component data deret waktu hotspot Provinsi Riau tahun

2001-2012 9

10 Data sampel hotspot kelas (plantation) tahun 2001 hingga 2005 10 11 Data sampel hotspot untuk masing-masing kelas penutupan lahan

plantation, dryland forest, agricultural fied, dan shrubs 10 12 Pohon keputusan yang dihasilkan oleh data hotspot harian tahun 2001

hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan

sebagai kelas target 11

13 Pohon keputusan yang dihasilkan oleh data hotspot bulanan tahun 2001 hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan

(11)

PENDAHULUAN

Latar Belakang

Kebakaran hutan merupakan fenomena yang sering terjadi di Indonesia khususnya Provinsi Riau. Dalam selang beberapa tahun kebakaran hutan di wilayah ini menimbulkan polemik hingga negara tetangga. Keluhan dari beberapa negara tetangga pun tak terelakkan. Menkokesra Agung Laksono yang dikutip oleh Merdeka (2013) mengatakan, hal ini tidak hanya dialami oleh Indonesia saja, negara-negara Eropa seperti Jerman dan Hungaria pun juga mengalaminya. Jika peristiwa ini dapat dicegah atau diberikan penanggulangan yang baik dampak yang sebelumnya marak terjadi akan berkurang.

Kebakaran merupakan permasalahan yang terus berulang dengan waktu dan tempat tertentu. Tentunya informasi yang terkandung dalam data persebaran hotspot dapat digunakan untuk tindakan preventif atau pertimbangan kebijakan lainnya karena masalah tersebut. Untuk itu diperlukan analisis yang melibatkan aspek waktu dan tempat terjadinya hotspot.

Anderson dan Bowen (2000) menyatakan bahwa terdapat tujuh zona kebakaran besar yang terdapat di pulau Sumatera. Zona ini terletak di bagian propinsi Sumatera Utara, Riau, Jambi, Sumatera Barat, Bengkulu dan Sumatera Selatan. Kebakaran terus menerus terjadi pada tujuh zona ini selama kurun waktu tahun 1996 hingga tahun 2000. Anderson dan Bowen juga menjelas bahwa hanya ujung-ujung pulau Sumatera yaitu Aceh dan Provinsi Lampung yang bebas dari zona kebakaran walaupun lahan basah Lampung (Way Kambas) dan Aceh (Singkil dan Babah Rot) telah mengalami kerusakan akibat kebakaran.

Penelitian ini menggunakan data persebaran hotspot yang didapat dari deteksi satelit Terra dan Aqua MODIS (Moderate-resolution Imaging Spectroradiometer) milik NASA (National Aeronautics and Space Administration), serta digunakan pula data penutupan lahan Provinsi Riau sebagai penentu kelas target. Data tersebut merupakan data deret waktu yang memiliki informasi spasial yang akan dicari pola dan aturan-aturan klasifikasinya dengan teknik data mining. Sebagian besar masalah forecasting melibatkan penggunaan data deret waktu. Data deret waktu merupakan variabel yang berorientasi waktu atau urutan kejadian (Montgomery et al. 2008). Untuk memodelkan klasifikasi data deret waktu ini digunakan metode klasifikasi data deret waktu yaitu conditional inference tree dan k nearest neighbor (k-NN).

Tujuan Penelitian

Penelitian ini bertujuan:

1 Menganalisis data deret waktu untuk melihat kecenderungan pola hotspot Riau selama 12 tahun (tahun 2001 sampai dengan tahun 2012).

2 Membuat klasifikasi data hotspot Provinsi Riau menggunakan metode conditional inference tree dan k-NN berdasarkan tipe penutupan lahan.

(12)

2

Manfaat Penelitian

Penelitian ini diharapkan dapat menggambarkan karakteristik data deret waktu hotspot berdasarkan tipe penutupan lahan yang dapat menjadi bahan pertimbangan pencegahan dan penanggulangan kebakaran hutan di daerah Riau.

Ruang Lingkup Penelitian

1. Data yang digunakan adalah data hotspot Provinsi Riau (tahun 2001 sampai dengan 2012), data penutupan lahan Provinsi Riau tahun 2008, dan data hotspot Provinsi Riau tahun 2013 sebagai data uji untuk klasifikasi dengan k-NN.

2. Metode yang digunakan untuk klasifikasi adalah conditional inference tree dan k-NN yang tersedia di perangkat komputasi statistik R.

3. Analisis mencakup dekomposisi data deret waktu hotspot, pola hotspot berdasarkan tipe penutupan lahan, dan klasifikasi data deret waktu hotspot berdasarkan tipe penutupan lahan.

METODE

Data Penelitian

Data yang digunakan pada penelitian ini adalah data hotspot Provinsi Riau tahun 2001 hingga tahun 2012 yang di peroleh dari NASA, dan data penutupan lahan tahun 2008 (land cover) Provinsi Riau sebagai kelas target. Tabel 1 merupakan data hotspot bulanan Provinsi Riau tahun 2008. Kolom “total hotspot per bulan” menggambarkan jumlah hotspot yang muncul di Provinsi Riau setiap bulannya. Tabel 2 merupakan data luas lahan penutupan Provinsi Riau tahun 2008. Data tipe lahan penutupan tahun 2008 ini akan digunakan sebagai kelas target.

Tabel 1 Data hotspot Provinsi Riau tahun 2008 (NASA 2013) Bulan Total hotspot per

bulan Januari 227 Februari 1318 Maret 58 April 71 Mei 731 Juni 329 Juli 411 Agustus 2001 September 217 Oktober 38 November 102 Desember 147

(13)

3 Tabel 2 Tipe lahan penutupan Provinsi Riau (data spasial Provinsi Riau 2008)

Tipe Land Cover Luas Area (km2)

Plantation 28,417.13 Dryland forest 17,497.66 Agricultural field 20,294.21 Shrubs 8176.02 Natural forest 8,110.41 Bare land 3029.42

Swamp & Mangrove 3,746.12

Alur Penelitian

Pembuatan model klasifikasi data hotspot serta analisis polanya dapat diwujudkan dengan menggunakan perangkat lunak R. Pemodelan data tersebut dibagi menjadi beberapa tahap seperti yang ditunjukkan pada Gambar 1.

Mulai

Data Hotspot

Time Series &

Penutupan Lahan

Praproses

Dekomposisi data time series Pembuatan model

klasifikasi dan prediksi kelas time series hotspot Analisis model

klasifikasi Selesai

Gambar 1 Diagram alur penelitian

Praproses data

Sebelum data hotspot diolah menggunakan R studio, data spasial terlebih dahulu diolah menggunakan Quantum GIS 1.8.0 Lisboa untuk mendapatkan data hotspot yang terdeteksi di Provinsi Riau dari tahun 2001 hingga tahun 2012. Selanjutnya data tersebut di-import ke basis data menggunakan PostgreSQL 9.1 yang telah terintegrasi dengan PostGIS 2.0. Kemudian dilakukan query pada data yang diperlukan hingga didapatkan data yang dibutuhkan untuk klasifikasi. Agar data yang telah di-query sesuai dengan kode yang telah dibuat di R, digunakan Microsoft Excel 2007 sebagai perangkat lunak pembantu. Diagram alur praproses data dapat dilihat pada Gambar 2.

Mulai Import shape

file ke QGIS Query sederhana data spasial Export shapefile hasil query Import shapefile ke PostGreSQL Query semua data yang diperlukan Sesuaikan Format data menjadi csv menggunakan Excel Selesai

(14)

4

Dekomposisi Data Deret Waktu

Dekomposisi data deret waktu dalam penelitian ini meliputi penghitungan empat faktor dalam data hotspot yaitu trend (T), siklis (C), irregular (I), dan seasonal (S). Rasyad (2003) menjelaskan gerakan seasonal terjadi berulang-ulang dengan gerakan yang teratur artinya naik turunnya gerakan terjadi pada waktu-waktu tertentu yang sama atau berdekatan. Gerakan trend (T) yang berlangsung jangka panjang yaitu suatu gerakan yang menunjukkan arah perkembangan secara umum. Garis trend sangat berguna untuk membuat ramalan (forecasting). Gerakan siklis adalah variasi jangka panjang di sekitar garis trend. Gerakan ini dapat terulang untuk jangka waktu tertentu, tetapi dapat juga tidak berulang. Gerakan atau variasi yang tidak teratur (irregular) yaitu gerakan atau variasi yang sifatnya sporadic, misalnya naik turunnya produksi karena banjir yang sifatnya jarang terjadi.

Klasifikasi data deret waktu dengan k-NN dan conditional inference tree

Menurut Zhao (2013), metode klasifikasi k-NN juga dapat digunakan untuk mengklasifikasikan data deret waktu berdasarkan kedekatan objek dalam data tersebut. Han dan Kamber (2011) menyatakan kedekatan objek biasanya didefinisikan sebagai sebuah fungsi jarak antara dua data. Fungsi jarak yang umumnya digunakan adalah jarak Euclidean. Misalkan terdapat dua data X1 = (x11, x12, … , x1n) menyatakan data uji dan X2 = (x21, x22, … , x2n) menyatakan data latih, jarak Euclidean-nya sebagai berikut:

ist , 2 √∑ i 2i 2 n

i

Selain metode klasifikasi k-NN, penelitian ini juga menerapkan metode conditional inference tree yang tersedia pada party package dalam perangkat lunak R. Metode conditional inference tree merupakan pengembangan algoritme recursive binary partitioning (Zhao 2013).

Analisis Model Klasifikasi

Sistem diuji dengan menghitung akurasi, yaitu jumlah data yang berhasil dikenali benar oleh metode klasifikasi conditional inference tree dan k-NN. Persamaan berikut digunakan untuk menghitung akurasi (Buono et al. 2004) :

umlah klasi ikasi benar

umlah seluruhn a

Lingkungan Pengembangan

Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut :

Perangkat keras berupa komputer personal dengan spesifikasi:  Processor Intel® Dual Core 1.7GHz

(15)

5  Harddisk 160 GB

Perangkat lunak:

 Sistem operasi Microsoft Windows 8

 Quantum GIS 1.8.0 Lisboa untuk pengolahan dan visualisasi data spasial  PostgreSQL 9.1 sebagai sumber manajemen basis data

 PostGIS 2.0 sebagai ekstensi PostgreSQL untuk analisis data spasial  Tool komputasi statistik R

 Microsoft Excel 2007 untuk mengolah data

HASIL DAN PEMBAHASAN

Pengumpulan Data

Pada penelitian ini, data yang digunakan adalah : 1. Data persebaran hotspot

Data persebaran hotspot yang digunakan adalah data tahun 2001 sampai dengan tahun 2012. Data ini memiliki atribut longitude, latitude, dan acq_date. Atribut longitude dan latitude merupakan informasi spasial yang digunakan untuk menginterpretasikan letak hotspot dalam peta geografis Provinsi Riau sedangkan atribut acq_date merupakan keterangan tanggal terjadinya hotspot di titik tertentu. Gambar 3 menunjukkan jumlah hotspot yang tersebar di Provinsi Riau selama kurun waktu tahun 2001 hingga tahun 2012. Terlihat bahwa tahun 2005, 2006, 2009, dan 2012 merupakan tahun-tahun yang memiliki catatan jumlah hotspot tertinggi berdasarkan satelit MODIS Terra dan Aqua.

Gambar 3 Jumlah titik panas Provinsi Riau tahun 2001-2012 (Data hotspot spasial Provinsi Riau, 2013)

2. Data penutupan lahan (land cover)

Kemunculan titik panas pada Provinsi Riau terdapat pada penggunaan lahan seperti lahan perkebunan (plantation), hutan kering (dryland forest), lahan pertanian (agricultural field), semak (shrubs), hutan alam (natural forest), lahan kosong (bare land), serta rawa dan bakau (swamp and mangrove). Gambar 4 menunjukkan selama kurun

1677 5954 6874 4251 11453 11124 4094 5650 10895 4100 6840 7820 0 2000 4000 6000 8000 10000 12000 14000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Jumlah Hotspot

(16)

6

waktu tahun 2001 sampai dengan tahun 2012 titik panas paling banyak ditemukan pada area perkebunan (plantation).

Secara akumulatif dari tahun 2001 hingga tahun 2012, titik panas paling banyak muncul pada area plantation yaitu sebanyak 35739 titik (Gambar 4). Menurut penelitian Januarisky tahun 2012 yang menggunakan data hotspot di Provinsi Kalimantan Barat, kemunculan tertinggi di area perkebunan umumnya disebabkan oleh aktivitas penyiapan lahan. Untuk lahan berupa rawa dan bakau (swamp & mangrove), disebabkan oleh sulitnya mencari lahan untuk kegiatan berladang. Ini menyebabkan sebagian masyarakat mulai beralih memanfaatkan hutan rawa sebagai area pertanian menggunakan teknik pembakaran untuk membuka lahan.

Gambar 4 Titik panas berdasarkan area penutupan lahan kurun waktu 2001 hingga 2012 (Data hotspot spasial Provinsi Riau, 2013)

Praproses Data Deret Waktu

Pada penelitian ini digunakan 2 (dua) jenis data sebagai data latih yaitu data harian hotspot dengan tujuh kelas target dan data bulanan hotspot dengan tujuh kelas target (Tabel 3). Data latih terdiri dari 84 record yang merupakan gabungan data dari masing-masing kelas target yaitu sebanyak 12 data (12 tahun) per kelas.

Tabel 3 Tujuh Kelas penutupan lahan yang dipakai pada penelitian 7 Kelas land cover

Plantation Dryland forest Agricultural field Shrubs Natural forest Bare land

Swamp & mangrove 35739 13004 10813 7983 6004 5904 1405 0 5000 10000 15000 20000 25000 30000 35000 40000 Total Hotspot

(17)

7 Berikut ini adalah tahapan praproses dalam penelitian ini :

1. Import shape file ke Quantum GIS

Pada awalnya, data hotspot yang didapatkan dari NASA merupakan shape file yang mengandung data hotspot di Provinsi Riau dan luar area Riau dalam jangka waktu tertentu. Untuk mendapatkan data hotspot yang hanya terdapat di Provinsi Riau saja, dapat dilakukan query spasial menggunakan Quantum GIS atau menggunakan PostgreSQL.

2. Query sederhana pada data spasial

Query sederhana ini meliputi clipping hotspot yang terdapat di area penutupan lahan Provinsi Riau, query pengelompokan hotspot berdasarkan tahun, dan query pemecahan fail area penutupan lahan menjadi beberapa shape file. Gambar 5 adalah contoh data hotspot yang belum dilakukan clipping dan masih terdiri dari kumpulan data hotspot selang beberapa tahun.

Gambar 5 Data hotspot sebelum dilakukan clipping dan query sederhana Setelah proses clipping, dilakukan query pengelompokan hotspot berdasarkan tahun. Satu shape file yang didapat dari NASA terdiri dari catatan hotspot dalam kurun waktu beberapa tahun. Untuk itu diperlukan query agar data hotspot Provinsi Riau terpisah dalam layer yang berbeda-beda berdasarkan tahun.

Query sederhana yang terakhir adalah query pemecahan data penutupan lahan berdasarkan kelompoknya. Ada 13 tipe area penutupan lahan pada data asli. Pada penelitian ini 13 tipe area tersebut disederhanakan lagi menjadi 7 (tujuh). Hasil dari query ini adalah tujuh layer yang merupakan tujuh area penutupan lahan.

3. Export shape file hasil query

Hasil query yang telah berbentuk layer di Quantum GIS dapat diubah menjadi shape file. Pada penelitian ini hasil export shape file akan berguna sebagai back up layer untuk diolah selanjutnya pada PostgreSQL. Export layer akan menghasilkan fail dengan ekstensi .shp yang kemudian dapat di-import ke dalam PostgreSQL.

(18)

8

4. Import shape file ke PostgreSQL

Agar PostgreSQL dapat membaca shape file yang berisi informasi spasial, terlebih dahulu dipasang postGIS yang terintegrasi dengan PostgreSQL. Satu buah shape file yang telah di export melalui Quantum GIS akan menjadi satu buah tabel pada PostgreSQL. Tahap ini menghasilkan tabel hotspot Provinsi Riau tahun 2001 hingga tahun 2012 dan tabel area penutupan lahan yang telah dipecah menjadi tujuh bagian. 5. Query semua data yang dibutuhkan

Data yang dibutuhkan untuk dijadikan kelas target dalam metode klasifikasi penelitian ini adalah area penutupan lahan. Karenanya perlu dicari data hotspot tiap tahun tertentu yang terdapat di masing-masing area penutupan lahan agar hasil yang didapat adalah data hotspot yang terbagi dalam tujuh kelas area penutupan lahan untuk setiap tahun.

Data yang dibutuhkan untuk membentuk pohon keputusan dengan conditional inference tree dan klasifikasi dengan k-NN adalah jumlah hotspot per satuan waktu. Jumlah hotspot bisa didapat dengan menghitung jumlah tanggal yang sama (dengan syntax group by acq_date) untuk setiap area penutupan lahan selama kurun waktu tahun 2001 hingga tahun 2012. 6. Sesuaikan format data menggunakan excel

Hotspot di Provinsi Riau tidak muncul di area lahan penutupan setiap hari. Oleh karena itu, data hasil query yang dihasilkan dengan PostgreSQL tidak dapat langsung diproses seperti format data yang dibutuhkan dalam syntax R, yaitu jumlah hotspot di hitung per hari atau per bulan selama 12 tahun. Di excel perhitungan jumlah data tersebut dapat dihitung dengan cepat dan rapi serta dalam format yang diinginkan. Pa a penelitian ini igunakan ata engan ekstensi “. ata” sebagai ail masukan data latih dan data uji.

Dekomposisi data deret waktu

Gambar 6 adalah grafik jumlah hotspot harian Provinsi Riau selama kurun waktu tahun 2001 hingga tahun 2012 yang didapat dari hasil praproses. Selama kurun waktu 12 tahun tersebut, tahun 2012 tercatat memiliki jumlah hotspot tertinggi oleh NASA dengan satelit MODIS yaitu pada tanggal 10 bulan Agustus sebanyak 761 titik.

(19)

9 Gambar 7 merupakan visualisasi dari perkembangan arah data hotspot secara umum (trend). Dengan teknik dekomposisi aditif dihasilkan trend yang tidak linier maupun kuadratik, trend hotspot Provinsi Riau selang waktu 2001 hingga 2012 adalah acak dari tahun ke tahun. Namun demikian apabila di lihat trend pada masing-masing tahun, jumlah hotspot akan signifikan naik atau signifikan turun disekitar waktu pergantian tahun. Hal ini dapat kita lihat pada waktu awal pergantian tahun 2002, 2003, 2006, 2008, 2009, 2011 yang naik secara signifikan. Demikian pua halnya dengan awal pergantian tahun 2004, 2005, 2007, dan 2010 yang turun secara signifikan.

Gambar 7 Trend data deret waktu hotspot Provinsi Riau tahun 2001-2012 Gambar 8 merupakan indeks musiman data deret waktu hotspot Provinsi Riau tahun 2001 hingga tahun 2012. Indeks musiman atau seasonal index merupakan gerakan data musiman yang memiliki pola yang sama (siklis) karena terus mengulang tiap waktu tertentu. Berdasarkan pola tersebut, dapat kita lihat bahwa kemunculan hotspot tertinggi untuk setiap tahunnya adalah pada pertengahan tahun dan terendah menjelang akhir tahun. Hotspot tertinggi pada pertengahan tahun dikarenakan puncak kekeringan terjadi pada akhir musim kemarau sekitar bulan juli hingga agustus. Hotspot terendah menjelang akhir tahun terjadi karena akhir tahun merupakan musim penghujan.

Gambar 8 Indeks musiman data deret waktu hotspot Provinsi Riau tahun 2001-2012

Irregular component merupakan pola data yang tidak teratur dan tidak termasuk ke dalam trend dan siklis (Gambar 9). Irregular component sifatnya jarang terjadi.

Gambar 9 Irregular component data deret waktu hotspot Provinsi Riau tahun 2001-2012

(20)

10

Pola Distribusi Hotspot Untuk Setiap Kelas Tipe Penutupan Lahan

Gambar 10 merupakan data sampel hotspot untuk setiap kelas penutupan lahan Provinsi Riau. Label angka 1, 13, 25, dan 37 merupakan nomor urut data sampel yang di ambil. Data dengan nomor urut 1 hingga 12 merupakan data kelas 1 (plantation) selama 12 tahun (2001 hingga 2012), demikian pula dengan nomor urut 13 hingga 24 merupakan data kelas 2 (dryland forest), nomor urut 25 hingga 36 merupakan kelas 3 (agricultural field), nomor urut 37 hingga 48 merupakan kelas 4 (shrubs), nomor urut 49 hingga 60 merupakan data kelas 5 (natural forest), nomor urut 61 hingga 72 merupakan data kelas 6 (bare land), dan sisanya adalah data kelas 7 (swamp and mangrove). Dapat dilihat pada masing-masing data sampel (Gambar 11), bahwa masing-masing kelas memiliki kemiripan. Hal ini dapat dilihat dari tingginya angka hotspot menjelang hari ke 200. Kemiripan data pada masing-masing kelas juga menggambarkan bahwa lahan penutupan memiliki korelasi yang sangat kecil terhadap data hotspot.

Gambar 10 Data sampel hotspot kelas (plantation) tahun 2001 hingga 2005

Gambar 11 Data sampel hotspot untuk masing-masing kelas penutupan lahan plantation, dryland forest, agricultural fied, dan shrubs

Klasifikasi data deret waktu dengan metode conditional inference tree

Berikut ini (Gambar 12) adalah decision tree yang terbentuk dari data hotspot harian 7 dengan 7 (tujuh) kelas target dan tahun 2001 – 2012. Berdasarkan pohon keputusan tersebut, ada 4 buah leaf node yang berarti dapat dibuat 4 aturan. Aturan yang terbentuk dari conditional inference tree diatas adalah sebagai berikut:

1. Aturan 1 (leaf node = 7)

Jika pada hari ke 226 terdapat hotspot lebih dari 16 (>16), maka hotspot terjadi di plantation dengan peluang 85%.

(21)

11 2. Aturan 2 (leaf node = 6)

Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16) dan pada hari ke 115 terdapat hotspot lebih dari 1 buah (> 1), maka hotspot terjadi di plantation dengan peluang 100%.

3. Aturan 3 (leaf node = 5)

Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16) dan hari ke 115 terdapat hotspot kurang dari atau sama dengan 1 buah (<= 1), dan hari ke 61 terdapat lebih dari 26 hotspot, maka hotspot terjadi di plantation dengan peluang 100%.

4. Aturan 4 (leaf node = 4)

Jika pada hari ke 226 terdapat hotspot kurang dari 16 (<16), hari ke 115 terdapat hotspot kurang dari atau sama dengan 1 buah (<= 1), dan hari ke 61 terdapat kurang dari atau sama dengan (<=) 26 hotspot, maka hotspot terjadi di dryland forest, shrubs, natural forest, bare land, swamp and mangrove dengan peluang 14.28%.

Gambar 12 Pohon keputusan yang dihasilkan oleh data hotspot harian tahun 2001 hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan sebagai kelas target

Klasifikasi berdasarkan pohon keputusan dengan data hotspot harian (Gambar 12) hanya dapat mengklasifikasikan data ke dalam dua kelas yaitu kelas 1 (plantation) dan kelas 2 (dryland forest). Akibatnya klasifikasi data kelas 3, 4, 5, 6, dan 7 akan selalu salah (Tabel 4). Hal ini menjadi salah satu faktor penyebab rendahnya akurasi. Pohon keputusan ini (Gambar 12) memiliki akurasi terhadap data training sebesar 28.5% dengan ketepatan klasifikasi terhadap kelas 1 dan kelas 2 sebesar 100%. Dengan demikian dapat dikatakan bahwa pohon keputusan (Gambar 12) hanya akan mengklasifikasikan dengan baik pada data dengan kelas 1 dan 2 saja.

(22)

12

Tabel 4 Hasil klasifikasi dengan data hotspot harian Provinsi Riau tahun 2001 hingga 2012 menggunakan metode conditional inference tree

Kelas Jumlah Record Hasil Klasifikasi 1 2 3 4 5 6 7 1 12 12 0 0 0 0 0 0 2 12 0 12 0 0 0 0 0 3 12 1 11 0 0 0 0 0 4 12 0 12 0 0 0 0 0 5 12 0 12 0 0 0 0 0 6 12 0 12 0 0 0 0 0 7 12 0 12 0 0 0 0 0

Berdasarkan pohon keputusan pada Gambar 13, ada 3 buah leaf node yang berarti dapat dibuat 3 aturan klasifikasi. Aturan yang terbentuk dari conditional inference tree tersebut adalah sebagai berikut:

1. Aturan 1 (leaf node = 5)

Jika pada bulan ke 4 terdapat hotspot lebih dari 33 (>33, maka hotspot terjadi di plantation dengan peluang 75% .

2. Aturan 2 (leaf node = 4)

Jika pada bulan ke 4 terdapat hotspot kurang dari 33 (<=33) dan lebih dari 3, maka hotspot terjadi di lahan gundul (bare land) pada bulan tersebut adalah 29% .

3. Aturan 3 (leaf node = 3)

Jika pada bulan ke 4 terdapat hotspot kurang dari 33 (<=33) dan kurang dari atau sama dengan 3 hotspot, maka hotspot terjadi di area rawa dan hutan bakau (swamp & mangrove) dengan peluang 40%

Gambar 13 Pohon keputusan yang dihasilkan oleh data hotspot bulanan tahun 2001 hingga tahun 2012 menggunakan 7 (tujuh) area penutupan lahan sebagai kelas target

(23)

13 Klasifikasi berdasarkan pohon keputusan dengan data hotspot bulanan (Gambar 13) hanya dapat mengklasifikasikan data ke dalam tiga kelas yaitu kelas 1 (plantation), kelas 6 (Bare Land) dan kelas 7 (Swamp and Mangrove). Akibatnya klasifikasi terhadap data kelas 2, 3, 4, dan 5 akan selalu salah (Tabel 5). Hal ini juga menjadi salah satu faktor penyebab rendahnya akurasi klasifikasi. Pohon keputusan dengan data bulanan (Gambar 13) memiliki akurasi terhadap data training sebesar 38 %. Pohon keputusan ini dapat mengklasifikasikan dengan benar pada kelas 1 sebanyak 9 dari 12 record (benar 75%), benar mengklasifikasikan pada kelas 6 sebanyak 12 dari 12 record (benar 100%), dan benar mengklasifikasikan pada kelas 7 sebanyak 11 dari 12 record (benar 91.6%). Tabel 5 Hasil klasifikasi dengan data hotspot bulanan Provinsi Riau tahun 2001

hingga 2012 menggunakan metode conditional inference tree Kelas Jumlah Record Hasil Klasifikasi 1 2 3 4 5 6 7 1 12 9 0 0 0 0 3 0 2 12 2 0 0 0 0 5 5 3 12 1 0 0 0 0 11 0 4 12 0 0 0 0 0 8 4 5 12 0 0 0 0 0 5 7 6 12 0 0 0 0 0 12 0 7 12 0 0 0 0 0 1 11

Berdasarkan Tabel 6, akurasi tertinggi diperoleh ketika satuan waktu yang dipakai adalah hotspot per bulan yaitu sebesar 38%. Rendahnya akurasi ini disebabkan oleh tren data hotspot yang acak serta kemiripan pola distribusi data masing-masing kelas. Demikian pula halnya dengan akurasi untuk data bulanan, selalu lebih tinggi daripada akurasi data harian. Ini disebabkan atribut waktu yang digunakan lebih sedikit daripada atribut waktu data hotspot harian dengan kemiripan pola distribusi yang lebih rendah bila dibandingkan dengan data harian. Tabel 6 Akurasi pohon keputusan data hotspot 2001-2012 menggunakan metode

conditional inference tree

Data Set Pohon Keputusan Akurasi

Waktu Jumlah Kelas Jumlah Node Jumlah Daun (%) Harian tahun 2001 – 2012 7 7 4 28.5 Bulanan tahun 2001 – 2012 7 5 3 38.0

Tabel 7 merupakan akurasi data uji menggunakan data hotspot Provinsi Riau tahun 2013 dengan rata-rata akurasi 14.3%. Didapat akurasi yang sama besar antara data bulanan dan data harian tahun 2013 dengan tujuh kelas lahan penutupan. Nilai 14.3% didapat dari hasil klasifikasi yang hanya mampu mengklasifikasikan 1 (satu) objek dengan benar dari 7 objek data uji.

(24)

14

Tabel 7 Akurasi klasifikasi data uji hotspot 2013 menggunakan metode conditional inference tree

Data /Jumlah kelas Akurasi (%)

Harian / 7 kelas 14.3

Bulanan / 7 kelas 14.3

Klasifikasi data deret waktu dengan k-NN

Tabel 8 menunjukkan akurasi tertinggi diperoleh ketika parameter k yang dipakai adalah k = 10 dan k = 15 dengan rata-rata akurasi sebesar 24.4%. Rata-rata akurasi terendah diperoleh ketika parameter k yang dipakai adalah k = 5 yaitu 22.61%. Rendahnya akurasi untuk data harian disebabkan tren data hotspot yang acak dan kemiripan pola distribusi data masing-masing kelas. Akurasi untuk data bulanan selalu lebih tinggi daripada akurasi data harian. Ini disebabkan oleh atribut waktu yang digunakan lebih sedikit dengan kemiripan pola distribusi yang lebih rendah bila dibandingkan dengan data harian.

Tabel 8 Akurasi klasifikasi data hotspot 2001-2012 menggunakan metode k-NN dengan leave one out cross validation

Data /Jumlah kelas Akurasi (%) Rata-rata

k = 5 k = 10 k = 15 k = 20

Harian / 7 kelas 14.28 16.66 15.47 14.3 15.17 Bulanan / 7 kelas 30.95 32.14 33.33 32.14 32.14

Dalam penelitian dengan metode k-NN, digunakan data deret waktu hotspot Provinsi Riau tahun 2013 sebagai data uji. Data uji dimulai dengan data uji dari tanggal 1 Januari 2013 hingga tanggal 22 Desember 2013 dikarenakan jalannya penelitian berlangsung hingga tanggal tersebut. Tabel 9 berikut adalah akurasi klasifikasi yang diperoleh dengan menggunakan metode k-NN.

Rata-rata akurasi data uji pada Tabel 9 tertinggi sebesar 39.32% diperoleh ketika menggunakan dataset bulanan, sedangkan rata-rata akurasi terendah diperoleh ketika menggunakan dataset bulanan yaitu 25.02%.

Tabel 9 Akurasi klasifikasi data hotspot data uji hotspot 2013 menggunakan metode k-NN

Data /Jumlah kelas Akurasi (%) Rata-rata

k = 5 k = 10 k = 15 k = 20

Harian / 7 kelas 28.6 28.6 28.6 14.3 25.025 Bulanan / 7 kelas 42.9 42.9 28.6 42.9 39.325

(25)

15

SIMPULAN DAN SARAN

Simpulan

Berdasarkan penelitian yang telah dilakukan terhadap data deret waktu hotspot, didapat kesimpulan bahwa :

1. Kemunculan hotspot tertinggi untuk setiap tahun adalah pada pertengahan tahun (bulan juli dan agustus) dan terendah menjelang akhir tahun

2. Untuk data latih tahun 2001 hingga tahun 2012, rata-rata akurasi klasifikasi terbaik didapat menggunakan metode conditional inference tree dengan dataset bulanan yaitu sebesar 38%, sedangkan metode k-NN memiliki rata-rata akurasi tertinggi pada dataset bulanan sebesar 32.14%. 3. Dari klasifikasi dengan data uji tahun 2013 diperoleh rata-rata akurasi

klasifikasi terbaik menggunakan metode k-NN dengan dataset bulanan yaitu sebesar 39.32% sedangkan metode conditional inference tree memiliki rata-rata akurasi 14.3% pada semua dataset.

Saran

Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara lain : 1. Uji coba penelitian dilakukan lebih spesifik dengan wilayah yang lebih

sempit dengan data yang lebih banyak.

2. Penggunaan metode lain untuk klasifikasi agar akurasi yang didapat menjadi lebih baik.

(26)

16

DAFTAR PUSTAKA

Anderson IP, Bowen MR. 2000. Fire Zones And The Threat To The Wetlands Of Sumatera, Indonesia. Palembang (ID) : Dinas Kehutanan Provinsi Sumatera Selatan.

Buono A, Marimin, Putri D. 2004. Klasifikasi Penutup dan Penggunaan Lahan Pada Multispectral Image dari Landsat Thematic Mapper Menggunakan Probabilistic Neural Network. Jurnal Ilmiah – Ilmu Komputer. 2(2):1-13. Han J, Kamber M, Pei J. 2011. Data Mining Concepts and Techniques. 3rd

Edition. Massachusetts (US): Morgan Kaufmann Publishers.

Januarisky H A. 2012. Pola sebaran titik panas (hotspot) dan keterkaitannya dengan perubahan penggunaan lahan [skripsi]. Bogor(ID): Institut Pertanian Bogor.

Merdeka. 2013. Ini penyebab kebakaran hutan di Riau yang diprotes Singapura

[Internet]. (tanggal diperbaharui 19 Juni 2013 [diakses tanggal 1 juli 2013]).

Tersedia pada: http://www.merdeka.com/peristiwa/ini-penyebab-kebakaran-hutan-di-riau-yang-diprotes-singapura.html

Montgomery DC, Jennings CL, Kulahci M. 2008. Introduction to Time Series Analysis and Forecasting. New Jersey (US) : John Wiley & Sons Inc.

Rasyad R. 2003. Metode Statistik Deskriptif. Jakarta (ID) : Grasindo.

Zhao Y. 2013. R and Data Mining: Examples and Case Studies [Internet]. Elsevier. (tanggal diperbaharui 25 April 2013 [diunduh tanggal 1 juli 2013]).Tersedia pada: http://www.rdatamining.com/docs

(27)

17

RIWAYAT HIDUP

Penulis adalah putri pertama dari lima bersaudara pasangan Bapak Fahrurrozi dan Ibu Suningsih, dilahirkan di Palembang pada tanggal 14 Mei 1989. Penulis menyelesaikan pendidikan Sekolah Menengah Atas di SMA Negeri 1 Talang Kelapa, Kabupaten Banyuasin, Sumatera Selatan pada tahun 2006. Pada tahun yang sama penulis melanjutkan pendidikan sebagai mahasiswa di Politeknik Negeri Sriwijaya jurusan Teknik Komputer di kota Palembang dan lulus tahun pada bulan Oktober 2009. Tahun 2009 penulis sempat menempuh pendidikan ekstensi di Universitas Sriwijaya jurusan Sistem Komputer hingga awal tahun 2010.

Setelah bekerja di PT. Schlumberger sebagai field system assistant, penulis melanjutkan kembali studi ke jenjang S1 pada tahun 2011 di Program Sarjana Alih Jenis Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Gambar

Gambar 1 Diagram alur penelitian  Praproses data
Gambar 5 Data hotspot sebelum dilakukan clipping dan query sederhana  Setelah  proses  clipping,  dilakukan  query  pengelompokan  hotspot  berdasarkan  tahun
Gambar 7 Trend data deret waktu hotspot Provinsi Riau tahun 2001-2012  Gambar  8  merupakan  indeks  musiman  data  deret  waktu  hotspot  Provinsi  Riau  tahun  2001  hingga  tahun  2012
Gambar 10 Data sampel hotspot kelas  (plantation)  tahun  2001  hingga 2005
+3

Referensi

Dokumen terkait

Namun penulis berkesimpulan bahwa dalam ketentuan maupun praktek ketatanegaraan, kondisi ini pada akhirnya digunakan sebagai alasan pemberhentian presiden pada

mengumumkan Rencana Umum Pengadaan Barang/Jasa untuk pelaksanaan kegiatan tahun anggaran 2013..., seperti tersebut dibawah ini:.. NO NAMA PAKET PEKERJAAN KEGIATAN

Maka dari itu perlu adanya edukasi sejak dini kepada siswa khususnya siswa sekolah dasar untuk memahami bahaya penggunaan plastik secara berlebihan, yakni

Kecenderungan para pelaku ekonomi dalam melakukan penyelesaian transaksi perekonomian menggunakan dana yang tersimpan di rekening bank melalui proses kliring dan penyelesaian

Lebih dari separuh panjang tubuhnya adalah ekornya, sehingga cukup untuk memberi keseimbangan pada lehernya yang besar dan berat pada saat ia berjalan2. Meski luar biasa

Penelitian ini adalah penelitian deskriptif yang bertujuan untuk mengetahui gambaran Identitas Nasional, Nasionalisme, dan Patriotisme Membangun pada penduduk Kota

Indonesia telah mempunyai perjanjian angkutan udara internasional timbal balik ( bilateral air transport agreement ) tidak kurang dari 67 negara yang dapat digunakan sebagai

Perancis memiliki banyak bagian dalam awal Perang Dunia I. Mereka secara aktif terlibat dalam urusan negara lain dan pertandingan tangan-tangan mereka menyebabkan perang