SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK
KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI
RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5
KHAIRIL AMRI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5 adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Juni 2014
Khairil Amri
ABSTRAK
KHAIRIL AMRI. Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5. Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Kebakaran hutan merupakan masalah serius karena dapat menyebabkan rusaknya ekosistem hutan dan lingkungan sekitar di banyak wilayah di Sumatera dan Kalimantan, termasuk Provinsi Riau. Salah satu upaya pencegahan terjadinya kebakaran hutan adalah dengan menyediakan informasi terkait titik api dan karakteristik wilayah yang berpotensi munculnya titik api. Informasi tersebut dapat disajikan dalam bentuk sistem informasi geografis (SIG) untuk klasifikasi kemunculan titik api. Penelitian ini bertujuan untuk membangun modul klasifikasi kemunculan titik api dalam SIG menggunakan OpenGeo Suite 3.0. Modul klasifikasi dibuat menggunakan metode pohon keputusan yaitu algoritme C4.5. Penerapan algoritme C4.5 pada data kebakaran hutan menghasilkan 109 aturan klasifikasi dengan akurasi 69.56%. SIG memiliki fitur-fitur utama yaitu menampilkan peta, pan map, zoom in, zoom out, scale, mouse position dan fungsi klasifikasi kemunculan titik api berdasarkan karakteristik wilayah. Dengan adanya SIG ini, dapat ditentukan apakah suatu wilayah berpotensi munculnya titik api berdasarkan karakteristik wilayah yang dapat digunakan dalam pengambilan keputusan terkait pencegahan kebakaran hutan.
Kata kunci: algoritme C4.5, klasifikasi, pohon keputusan, sistem informasi geografis, titik api
ABSTRACT
KHAIRIL AMRI. Web-Based Geographic Information System for Hotspot Occurrences Classification in Riau Province using C4.5 Decision Tree. Supervised by IMAS SUKAESIH SITANGGANG.
Forest fire is a serious problem because it causes damages to forest ecosystem and surrounding environment in many areas in Sumatera and Kalimantan including Riau Province. One of activities in forest fire prevention is to provide relevant information about hotspot and characteristics of areas where hotspots probably occur. Such information can be presented in a geographic information system (GIS) for classification of hotspot occurrences. This study aims to develop a classification of hotspot occurrences module in a GIS using OpenGeo Suite 3.0. The classification module was made using the decision tree method namely the C4.5 algorithm. Applying the C4.5 algorithm on the forest fire data generated 109 classification rules with accuracy of 69.56%. The SIG has major features such as displaying map, pan map, zoom, in, zoom out, scale, mouse position and a classification module for hotspot occurrences based on characteristics of areas. The GIS enables users to determine whether an area is potential for hotspot occurrences or not based on its characteristics. Potential hotspot occurrences can be used in decision making related to forest fire prevention.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada
Departemen Ilmu Komputer
SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK
KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI
RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5
KHAIRIL AMRI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Penguji:
Judul Skripsi : Sistem Informasi Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5 Nama : Khairil Amri
NIM : G64100006
Disetujui oleh
Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2013 ini ialah kebakaran hutan, dengan judul Sistem Informasi Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Penulis mengucapkan terima kasih kepada semua pihak yang telah berperan dalam penelitian ini, di antaranya:
1 Mama, kakak, adik, keponakan dan keluarga lainnya yang telah memberikan dukungan, doa, motivasi, semangat, dan kasih sayang yang sangat besar
2 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku dosen pembimbing yang telah memberikan bimbingan, saran, arahan, dan bantuan selama penyelesaian skripsi
3 Bapak Hari Agung Adrianto, SKom MSi dan Ibu Rina Trisminingsih SKom MT selaku dosen penguji atas kesediaannya menguji pada waktu sidang
4 Sahabat-sahabat terbaik penulis, Hafizd Adityo Utomo, Resti Hidayah, Roudhotul Jannah, Risa Ika Wijayanti, Colin Sabatini Lumban Tobing, terima kasih atas doa, semangat, dan bantuannya, semoga sukses untuk kita semua 5 Kak Anna Qahhariana dan kak Sonita Veronica Br Barus atas bantuannya 6 Teman-teman PIXELS 47 yang terus memberikan semangat dan keceriaan serta
kenangan bagi penulis.
7 Seluruh dosen dan civitas akademika Departemen Ilmu Komputer IPB
8 Semua pihak yang telah membantu dalam penyelesaian skripsi ini yang tidak bisa penulis sebutkan satu persatu.
Penulis berharap semoga skripsi ini bermanfaat bagi pihak yang membutuhkan.
Bogor, Juni 2014
DAFTAR ISI
DAFTAR TABEL viii
DAFTAR GAMBAR viii
DAFTAR LAMPIRAN viii
PENDAHULUAN 1
Latar Belakang 1
Perumusan Masalah 1
Tujuan Penelitian 1
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
Data dan Area Studi 2
Tahapan Penelitian 3
Perangkat Penelitian 6
HASIL DAN PEMBAHASAN 7
Praproses Data 7
Pembagian Dataset 8
Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5 8
Menghitung Akurasi Pohon Keputusan 9
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis 9
SIMPULAN DAN SARAN 13
Simpulan 13
Saran 13
DAFTAR PUSTAKA 14
LAMPIRAN 15
DAFTAR TABEL
1 Kategori untuk jarak terdekat dengan pusat kota 7
2 Kategori untuk jarak terdekat dengan jalan 8
3 Kategori untuk jarak terdekat dengan sungai 8
4 Confusion matrix 9
DAFTAR GAMBAR
1 Diagram alir penelitian 3
2 Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003) 6
3 Potongan kode program klasifikasi 10
4 Kode program untuk menampilkan penanda 11
5 Tampilan halaman utama klasifikasi titik api di Provinsi Riau 11 6 Tampilan data dan hasil klasifikasi sesuai masukan pengguna 12
7 Tampilan peta menggunakan Google Map 12
8 Tampilan menu “Tentang Sistem” 13
DAFTAR LAMPIRAN
1 Contoh record data yang belum dikonversi dari derajat menjadi
kilometer 15
2 Contoh record data yang sudah dikonversi dari derajat menjadi kilometer
dan dikategorikan 16
PENDAHULUAN
Latar Belakang
Indonesia merupakan negara yang sebagian besar daratannya ditutupi hutan. Luas hutan Indonesia adalah 98.56 juta hektar atau 52.4% luas wilayah Indonesia (Kemenhut 2012). Luasnya hutan Indonesia menjadikan Indonesia sebagai salah satu paru-paru dunia. Namun, dari tahun ke tahun luas hutan di Indonesia semakin menyusut. Laju deforestasi hutan Indonesia mencapai 610 375.92 hektar per tahun (Kemenhut 2012). Banyak hal yang menyebabkan menyusutnya luas hutan di Indonesia, salah satu di antaranya adalah kebakaran hutan. Kebakaran hutan termasuk masalah serius yang membutuhkan perhatian penuh dalam penanggulangannya. Kebakaran hutan dapat menyebabkan rusaknya keseimbangan ekosistem hutan. Selain itu, kebakaran hutan juga akan menurunkan produksi oksigen (O2) yang diperlukan manusia. Oleh karena itu, kebakaran hutan harus dikendalikan dengan sebaik-baiknya.
Pengendalian kebakaran hutan dapat dilakukan dengan berbagai cara, salah satu di antaranya adalah membangun sistem informasi geografis (SIG) untuk persebaran titik api. Titik panas adalah indikator kebakaran hutan yang mendeteksi suatu lokasi yang memiliki suhu relatif lebih tinggi dibandingkan dengan suhu di sekitarnya (Kemenhut 2009). Pada penelitian ini dibentuk modul klasifikasi kemunculan titik api di Provinsi Riau dalam sistem informasi geografis (SIG). Pada penelitian ini, klasifikasi kemunculan titik api dilakukan menggunakan algoritme C4.5. Modul ini diintegrasikan dengan SIG data histori titik api di Indonesia yang dibangun oleh Barus (2014).
Perumusan Masalah
Informasi persebaran titik api dapat divisualisasikan dalam bentuk peta menggunakan SIG. Pengembangan aplikasi SIG sudah banyak dilakukan. Namun, pada aplikasi tersebut hanya menampilkan lokasi kebakaran hutan dan belum terdapat modul klasifikasi titik api. Modul klasifikasi titik api sangat penting untuk menentukan lokasi rawan kebakaran berdasarkan karakeristik lokasi terjadinya titik api. Informasi tersebut bermanfaat dalam pengambilan keputusan terkait pengendalian kebakaran hutan di Provinsi Riau. Rumusan masalah dari penelitian ini yaitu membangun dan mengintegrasikan modul klasifikasi kemunculan titik api pada SIG berbasis web yang telah dibangun oleh peneliti sebelumnya.
Tujuan Penelitian
Penelitian ini bertujuan:
1 Menerapkan algoritme C4.5 dalam pembentukan klasifikasi kemunculan titik api di Provinsi Riau.
2
3 Visualisasi hasil klasifikasi kemunculan titik api dalam bentuk peta.
Manfaat Penelitian
Penelitian ini diharapkan bermanfaat dalam menentukan daerah yang rawan terjadi kebakaran berdasarkan karakteristik lokasi tersebut sehingga dapat dijadikan informasi tambahan dalam pengambilan keputusan terkait pengendalian kebakaran hutan di Provinsi Riau.
Ruang Lingkup Penelitian
Ruang lingkup penelitian ini meliputi:
1 Data yang digunakan adalah data hotspot Provinsi Riau tahun 2005 yang sudah dilakukan pembersihan data, perhitungan jarak terdekat suatu lokasi terhadap pusat kota, jalan, dan sungai pada penelitian Fernando (2014).
2 Data pendukung berupa data karakteristik wilayah yaitu jalan, sungai, dan pusat kota.
3 Modul klasifikasi diintegrasikan pada sistem informasi geografis berbasis web yang dikembangkan oleh Barus (2014).
4 Pengembangan sistem menggunakan OpenGeo Suite 3.0 sebagai DBMS (PostGIS) serta web map server (GeoServer) dan XAMPP 1.7.3 sebagai web server.
METODE
Data dan Area Studi
Data yang digunakan dalam penelitian ini merupakan data spasial. Data spasial berhubungan dengan geometri fitur spasial. SIG menggunakan dua model dasar untuk merepresentasikan fitur spasial yaitu vektor dan raster. Model data vektor menggunakan titik dan koordinat x, y untuk membangun fitur spasial titik, terdiri atas titik dan edge (garis) yang menghubungkan titik-titik ini ke bentuk
polygon. Model data raster menggunakan sebuah grid untuk merepresentasikan variasi spasial dari sebuah fitur. Setiap sel dalam grid memiliki nilai yang berhubungan dengan karakteristik fitur spasial pada lokasi itu. Data raster sangat cocok digunakan untuk merepresentasikan fitur spasial yang kontinu seperti curah hujan dan ketinggian (Chang 2002).
Data yang digunakan berupa hasil perhitungan jarak terdekat suatu lokasi terhadap pusat kota, jalan, dan sungai dalam satuan derajat serta kelas kemunculan titik api (7169 record kelas true dan 7200 record kelas false). Kelas true
3 format shapefile. Peta Provinsi Riau yang digunakan terdiri atas 9 kabupaten (Rokan Hulu, Rokan Hilir, Kuantan Singingi, Indragiri Hulu, Kampar, Bengkalis, Pelalawan, Siak, dan Indragiri Hilir) dan 2 kota (Pekan Baru dan Dumai). Data pusat kota terdiri atas Tembilahan, Selat Panjang, Dumai, Balai Pungut, Duri, dan Bengkalis.
Tahapan Penelitian
Penelitian ini dilakukan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 1.
Gambar 1 Diagram alir penelitian Praproses Data
Pada praproses data dilakukan 3 tahap, yaitu menghapus data duplikat, mengkonversi nilai data dari derajat menjadi kilometer (km), serta diskretisasi dan mengkategorikan data jarak terdekat dengan pusat kota, jalan, serta sungai. Data hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai, beberapa di antaranya merupakan data duplikat. Untuk itu, perlu dilakukan penghapusan data duplikat untuk mendapatkan hasil yang lebih akurat. Setelah menghapus data duplikat, kemudian dilakukan konversi nilai terhadap jarak terdekat dengan pusat kota, jalan, dan sungai yang semula dalam satuan derajat menjadi km agar lebih mudah dipahami oleh pengguna.
4
Data yang telah dihapus duplikatnya dan dikonversi menjadi km kemudian dilakukan diskretisasi berdasarkan frekuensi guna mendapatkan hasil yang merata untuk setiap interval. Jarak terdekat dengan pusat kota dibagi menjadi 10 interval yang diberi label M1 sampai M10. Jarak terdekat dengan jalan dibagi menjadi 5 interval yang diberi label RO1 sampai RO5. Jarak terdekat dengan sungai dibagi menjadi 5 interval yang diberi label RI1 sampai RI5.
Pembagian Dataset
Data hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai dibagi menjadi data training dan data uji dengan k-fold cross validation. Data
training digunakan untuk membangun pohon keputusan, sedangkan data uji digunakan untuk menghitung akurasi pohon keputusan.
Pembuatan Modul Klasifikasi Menggunakan Algoritme Pohon Keputusan C4.5
Klasifikasi adalah sebuah bentuk analisis data yang model ekstraksi datanya menggambarkan kelas data penting. Model tersebut disebut classifier yang memprediksi kategori (discrete, unordered) label kelas. Klasifikasi data merupakan proses yang terdiri atas dua tahap, yaitu pembelajaran dan klasifikasi. Pada tahap pembelajaran, data training dianalisis dengan sebuah algoritme klasifikasi. Learned model atau classifier direpresentasikan dalam bentuk aturan klasifikasi. Pada tahap klasifikasi, data uji digunakan untuk menghitung akurasi dari aturan klasifikasi. Jika akurasi dianggap dapat diterima, aturan-aturan yang telah terbentuk dapat digunakan untuk klasifikasi data tuple baru (Han et al. 2012). Model klasifikasi berguna untuk keperluan deskriptif dan prediktif.
Pada tahapan ini dibuat pohon keputusan untuk klasifikasi kemunculan titik api. Atribut targetnya adalah kelas dengan label T (true) dan F (false). Kelas T (true) menunjukkan kemunculan titik api, sedangkan kelas F (false) menunjukkan ketidakmunculan titik api. Pohon keputusan adalah sebuah flowchart dengan struktur seperti pohon di mana setiap internal node (nonleaf node) menunjukkan tes pada atribut, setiap cabang merupakan hasil dari tes, dan masing-masing node
(terminal node) memegang label kelas (Han et al. 2012).
Pada penelitian ini digunakan algoritme pohon keputusan C4.5. Algoritme C4.5 dikembangkan dari algoritme ID3 untuk membangkitkan pohon keputusan. Algoritme C4.5 mengadopsi konsep “greedy” (nonbacktracking), yaitu membentuk pohon keputusan dengan metode divide dan conquer data secara rekursif dari atas ke bawah (Han et al. 2012). Algoritme C4.5 secara rekursif mengunjungi setiap
decision node, memilih pemisahan (split) yang optimal, sampai tidak ada pemisahan yang mungkin. Algoritme C4.5 menggunakan konsep information gain
atau entropy reduction untuk memilih pemisahan yang optimal (Larose 2005).
Entropy himpunan kasus S yang memiliki k atribut berbeda untuk setiap kelas
5
|�| : banyaknya himpunan kasus S
� : himpunan kasus optimal menjadi pemisahan (split) yang memiliki information gain tertinggi. Hasil klasifikasi berupa aturan-aturan pohon keputusan. Dalam penelitian ini dibangun modul klasifikasi pohon keputusan dalam SIG yang berisi aturan-aturan klasifikasi. Modul klasifikasi dibangun menggunakan bahasa pemrograman PHP.
Menghitung Akurasi Pohon Keputusan
Akurasi pohon keputusan yang dihasilkan dapat dilihat dari confusion matrix, yaitu matriks yang memperlihatkan perhitungan banyaknya label kelas yang diprediksi benar dibagi label kelas keseluruhan. Jika hasilnya melebihi threshold
65% diproses ke tahap berikutnya, apabila kurang dari threshold 65%, masuk ke proses pembuatan modul klasifikasi pohon keputusan untuk pengolahan data kembali.
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis
6
(SQL) (Peng dan Tsou 2003). Komponen dasar SIG berbasis web diilustrasikan pada Gambar 2.
Gambar 2 Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003) Pada tahapan ini, data yang telah diolah melalui proses klasifikasi dengan algoritme C4.5 diolah kembali dengan menggunakan perangkat lunak OpenGeo Suite 3.0. Proses ini dilakukan untuk membentuk peta rawan kebakaran yang baru berdasarkan aturan yang dihasilkan. Hasilnya diintegrasikan dengan sistem informasi geografis yang sudah ada untuk visualisasi kemunculan titik api di Provinsi Riau.
Perangkat Penelitian
Pembuatan modul klasifikasi untuk data persebaran titik api di Provinsi Riau ini menggunakan perangkat lunak dan perangkat keras sebagai berikut:
1 Perangkat keras berupa komputer personal dengan spesifikasi sebagai berikut: a. Intel®Core ™ i5-2430M CPU @ 2.40GHz
b. Memori RAM 4.00 GB c. 750GB HDD
d. Mouse
2 Perangkat lunak
a. Sistem operasi Windows 8
b. OpenGeo Suite 3.0 untuk mengelola data peta
c. Microsoft Excel 2013 untuk mengolah data titik api dalam format .csv d. XAMPP 1.7.3 sebagai web server
e. Adobe Dreamweaver CS 6 untuk mengkodekan aturan-aturan pohon keputusan
f. Bahasa pemrograman PHP
g. Quantum GIS 2.0.1 Dufour untuk visualisasi data spasial
h. RapidMiner 5 untuk diskretisasi data jarak berdasarkan frekuensinya i. Weka 3.6.9 untuk klasifikasi data
Web Server with Application
Server
Map Server Data Server Client
7
HASIL DAN PEMBAHASAN
Praproses Data
Tahapan-tahapan yang dilakukan dalam praproses data adalah sebagai berikut:
1 Menghapus data duplikat
Data yang digunakan diolah menggunakan Microsoft Excel dan dilakukan penghapusan data duplikat untuk menghasilkan klasifikasi yang lebih akurat. Data yang semula berjumlah 14 369 record, setelah dihapus data duplikat menjadi 11 810 record.
2 Mengkonversi nilai data
Data jarak terdekat dengan pusat kota, jalan, dan sungai semula dalam satuan derajat, kemudian dikonversi ke km dengan mengalikan setiap nilai jarak dengan pengali 111.3199. Angka tersebut merupakan hasil bagi keliling bumi dengan 360 karena keliling bumi berbentuk lingkaran. Contoh data yang belum dikonversi dari derajat ke km dapat dilihat pada Lampiran 1. Konversi nilai dari derajat menjadi km bertujuan memudahkan pengguna memahami data yang ditampilkan pada web sistem informasi geografis.
3 Diskretisasi data
Atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan jarak terdekat dengan sungai didiskretisasi berdasarkan frekuensi menggunakan perangkat lunak RapidMiner 5. Untuk memudahkan implementasi jumlah digit desimal ditetapkan satu sehingga jumlah objek untuk setiap interval berubah dari
output yang dihasilkan RapidMiner 5. Contoh data yang sudah dikonversi dari derajat ke km dan dikategorikan dapat dilihat pada Lampiran 2. Kategori data untuk atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan jarak terdekat dengan sungai berturut-turut dapat dilihat pada Tabel 1, Tabel 2, dan Tabel 3.
Tabel 1 Kategori untuk jarak terdekat dengan pusat kota Kategori Interval jarak ke
pusat kota (km) Jumlah objek
8
Tabel 2 Kategori untuk jarak terdekat dengan jalan Kategori Interval jarak ke
jalan (km) Jumlah objek
RO1 (0, 0.2] 2163
RO2 (0.2, 0.7] 2548
RO3 (0.7, 1.6] 2387
RO4 (1.6, 3.8] 2337
RO5 >3.8 2375
Tabel 3 Kategori untuk jarak terdekat dengan sungai Kategori Interval jarak ke
sungai (km) Jumlah objek
RI1 (0, 1.7] 2384
Data akan dibagi menjadi data latih dan data uji menggunakan metode 10-folds cross validation. Setiap bagian (fold) dijadikan sebagai data uji dan n-1 fold
dijadikan data latih. Proses ini dilakukan oleh Weka 3.6.9 pada saat klasifikasi data untuk membangkitkan aturan-aturan pohon keputusan.
Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5
Dataset yang terbentuk diklasifikasikan menggunakan algoritme C4.5. Algoritme C4.5 memilih atribut yang memiliki information gain yang paling tinggi sebagai atribut uji. Pada Weka 3.6.9, algoritme C4.5 diimplementasikan dengan modul J48. Algoritme C4.5 menghasilkan 109 aturan yang dapat dilihat pada Lampiran 3. Beberapa contoh aturan yang terbentuk antara lain:
Aturan 1: Jika jarak terdekat dengan sungai kurang dari atau sama dengan 1.7 km maka lokasi tersebut tidak berpotensi terjadi kebakaran (false).
Aturan2: Jika jarak terdekat dengan sungai di antara 1.7 km dan 3.9 km dan jarak terdekat dengan pusat kota kurang dari atau sama dengan 22.8 km maka lokasi tersebut tidak berpotensi terjadi kebakaran (false).
Aturan 3: Jika jarak terdekat dengan sungai di antara 3.9 km dan 7.2 km dan jarak terdekat dengan pusat kota di antara 108.5 km dan 126.3 km dan jarak terdekat dengan jalan kurang dari 0.2 km maka lokasi tersebut berpotensi terjadi kebakaran (true).
9 terdekat dengan jalan di antara dari 0.7 km dan 1.6 km maka lokasi tersebut berpotensi terjadi kebakaran (true).
Aturan 5: Jika jarak terdekat dengan sungai lebih besar dari 12.8 km dan jarak terdekat dengan pusat kota kurang dari 22.8 km maka lokasi tersebut berpotensi terjadi kebakaran (true).
Menghitung Akurasi Pohon Keputusan
Dengan menggunakan metode pengujian cross validation 10 folds, diperoleh
confusion matrix untuk pohon keputusan C4.5 yang dapat dilihat pada Tabel 4. Tabel 4 Confusion matrix
Kelas hasil prediksi
Total
True False
Kelas aktual True 2168 2442 4610
False 1152 6048 7200
Total 3320 8490 11 810
Dari confusion matrix dalam Tabel 4, dapat diketahui bahwa sekitar 34% dari data yang diklasifikasi kelas true merupakan salah klasifikasi dan sekitar 29% dari data yang diklasifikasi kelas false merupakan salah klasifikasi. Akurasi model pohon keputusan yang diperoleh dapat dihitung sebagai berikut:
akurasi= banyak total prediksi yang benar total banyaknya prediksi
akurasi = 2168+2442+1152+60482168+6048
akurasi= 11 8108216 =0.6956
Akurasi pohon keputusan yang menunjukkan keakuratan pohon keputusan dalam mengklasifikasikan kemunculan titik api adalah 69.56%.
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis
Data spasial yang meliputi jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, jarak terdekat dengan sungai, kelas, peta Provinsi Riau, pusat kota, jalan, dan sungai disimpan dalam basis data spasial dalam SIG. Data ini diolah lebih lanjut untuk menampilkan hasil klasifikasi titik api berdasarkan pohon keputusan yang telah diperoleh pada tahap sebelumnya. SIG dibangun menggunakan perangkat lunak OpenGeo Suite 3.0.
10
dari web browser via HTTP. Modul klasifikasi kemunculan titik api terletak pada bagian server web. Server aplikasi berperan sebagai translator atau penghubung antara server web dan server peta. Server aplikasi meliputi model common gateway interface (CGI) atau CGI extension seperti Microsoft’s Internet Server Application
Program Interface (ISAPI) dan Active Server Pages (ASP), dan lain-lain. Selanjutnya Geoserver bertindak sebagai server peta yang memroses permintaan klien dan membangkitkan peta. PostGIS bertindak sebagai server data yang melayani data spasial dan non spasial. Geoserver dan PostGIS sudah terdapat dalam
package OpenGeo Suite 3.0. Gambar 3 merupakan potongan kode program untuk klasifikasi.
Gambar 3 Potongan kode program klasifikasi
Data hasil klasifikasi diintegrasikan dengan peta Provinsi Riau dan ditampilkan penanda untuk visualisasi lokasi-lokasi yang tidak atau berpotensi terjadi kebakaran berdasarkan jarak terdekat terhadap pusat kota, jalan, dan sungai yang dimasukkan pengguna. Gambar 4 merupakan potongan kode program untuk menampilkan penanda.
Gambar 5 menunjukkan halaman muka SIG untuk klasifikasi titik api. Halaman muka ini memiliki beberapa fitur utama yang terdiri atas pan map, zoom in, zoom out, scale, dan peta Provinsi Riau menggunakan Openlayer. Pada peta Provinsi Riau terlihat sungai (garis biru), jalan (garis coklat), pusat kota (titik merah muda) serta marker. Markermuncul setelah tombol “Prediksi” yang terlihat pada
11
Gambar 4 Kode program untuk menampilkan penanda
Gambar 5 Tampilan halaman utama klasifikasi titik api di Provinsi Riau Tampilan hasil klasifikasi kemunculan titik api berdasarkan data jarak lokasi ke pusat kota, jalan, dan sungai terdekat yang di-input-kan pengguna diberikan pada Gambar 6. Terdapat 2 tombol pada Gambar 6, tombol “Prediksi” berfungsi untuk menampilkan hasil klasifikasi serta marker dan tombol “Reset Map” untuk
menghapus tabel hasil klasifikasi serta marker pada peta. Data yang ditampilkan pada tabel merupakan data yang sesuai dengan masukan pengguna dan hasil klasifikasi kemunculan titik api.
Gambar 7 menunjukkan halaman SIG yang menampikan peta menggunakan
google map. Tampilan ini muncul ketika masuk ke menu “Google Map”. Pada
halaman ini ditampilkan pan map, zoom in, zoom out, scale, map type control,
marker, dan info window. Info window muncul ketika pengguna melakukan aksi pada marker. Info window dapat ditutup dengan menekan close button pada pojok kanan atas info window. Pada info window ditampilkan keterangan dari marker
meliputi info kabupaten / kota, jarak titik tersebut dengan pusat kota, jalan, dan sungai. Selain itu, pengguna dapat mengganti jenis tampilan peta google map. Tampilan default yaitu jenis roadmap. Pengguna dapat menggantinya dengan tipe
12
Gambar 6 Tampilan data dan hasil klasifikasi sesuai masukan pengguna
Gambar 7 Tampilan peta menggunakan Google Map
13
Gambar 8 Tampilan menu “Tentang Sistem”
SIMPULAN DAN SARAN
Simpulan
Simpulan dari penelitian ini yaitu:
1 Penerapan algoritme C4.5 untuk data kebakaran hutan di Provinsi Riau yang terdiri atas jarak terdekat dengan pusat kota, jalan, dan sungai menghasilkan 109 aturan klasifikasi untuk titik api dengan akurasi 69.56%.
2 Sistem informasi geografis untuk klasifikasi titik api berdasarkan pohon keputusan C4.5 berhasil dibangun menggunakan perangkat lunak OpenGeo Suite 3.0. SIG memiliki enam modul utama yaitu menampilkan peta, pan map, zoom in, zoom out, scale, mouse position dan fungsi klasifikasi kemunculan titik api berdasarkan karakteristik lokasi yang di-input-kan pengguna.
3 Visualisasi hasil klasifikasi titik api dalam bentuk peta memudahkan pengguna dalam melihat lokasi yang rawan terjadinya titik api berdasarkan karakteristik lokasi tersebut yaitu jarak terdekat ke pusat kota, jalan, dan sungai.
Saran
Penelitian ini masih memiliki kekurangan, saran yang dapat disampaikan untuk penelitian selanjutnya adalah sebagai berikut:
1 Dilakukan praproses dengan pendekatan yang berbeda untuk diskretisasi dan tranformasi data.
14
DAFTAR PUSTAKA
Barus SV. 2014. Sistem informasi geografis berbasis web untuk data histori hotspot
di Indonesia menggunakan OpenGeo Suite 3.0 [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Chang KT. 2002. Introduction to Geographic Information Systems. New York (US): McGraw-Hill.
Fernando V. 2014. Klasifikasi data spasial untuk kemunculan hotspot di Provinsi Riau menggunakan algoritme ID3 [skripsi]. Bogor (ID): Institut Pertanian Bogor. Han J, Kamber M, Pei J. 2012. Data Mining: Concepts and Techniques. 3rd ed.
Massachusetts (US): Morgan Kaufmann.
[Kemenhut] Kementerian Kehutanan. 2009. Peraturan Menteri Kehutanan Nomor: P.12/Menhut-II/2009 tentang pengendalian kebakaran hutan [Internet]. [diunduh 2013 Nov 3]. Tersedia pada: http://storage.jak-stik.ac.id/ProdukHukum/kehutanan/P12_09.pdf.
[Kemenhut] Kementerian Kehutanan. 2012. Statistik kehutanan Indonesia 2011 [Internet]. [diunduh 2013 Okt 30]. Tersedia pada:
http://agungwi.files.wordpress.com/2012/11/buku-statistik-juli-2012_terbaru.pdf.
Larose DT. 2005. Discovering Knowledge in Data: an Introduction to Data Mining. New Jersey (US): J Wiley.
Peng ZR, Tsou MH. 2003. Internet GIS: Distributed Geographic Information Services for the Internet and Wireless Networks. New Jersey (US): J Wiley. Quinlan JR. 1993. C4.5: Programs for Machine Learning. Vol ke-1. California
15 Lampiran 1 Contoh record data yang belum dikonversi dari derajat menjadi
kilometer Jarak terdekat
dengan pusat kota (derajat)
Jarak terdekat dengan jalan
(derajat)
Jarak terdekat dengan sungai
(derajat)
Kelas
0.39 0.000744 0.09 T
0.35 0.010375 0.15 T
1.23 0.005791 0.03 T
1.22 0.003971 0.00 T
0.52 0.004044 0.03 T
0.27 0.003050 0.19 F
0.22 0.000793 0.02 F
1.17 0.042827 0.08 F
0.14 0.026304 0.18 F
16
Lampiran 2 Contoh record data yang sudah dikonversi dari derajat menjadi kilometer dan dikategorikan
Jarak terdekat
dengan pusat kota
(km)
Jarak terdekat
dengan jalan (km)
Jarak terdekat
dengan sungai (km)
Kategori jarak ke pusat kota
Kategori jarak ke
jalan
Kategori jarak ke sungai
Kelas
50.09396 4.442823 5.565995 M4 RO5 RI3 T
84.60312 1.032791 18.92438 M7 RO3 RI5 T
43.41476 0.082819 10.01879 M4 RO1 RI4 T
38.96197 1.154933 16.69799 M3 RO3 RI5 T
136.9235 0.644653 3.339597 M10 RO2 RI2 T
57.88635 0.450129 3.339597 M5 RO2 RI2 T
30.05637 0.339516 21.15078 M2 RO2 RI5 F
24.49038 0.088272 2.226398 M2 RO1 RI2 F
130.2443 4.767545 8.905592 M10 RO5 RI4 F
17 Lampiran 3 Contoh hasil klasifikasi dengan C4.5 menggunakan Weka 3.6.9 MinDist_River = RI5
| MinDist_Maincities = M3: T (458.0/133.0) | MinDist_Maincities = M1: T (525.0/133.0) | MinDist_Maincities = M2: T (464.0/123.0) | MinDist_Maincities = M4: F (135.0/50.0) | MinDist_Maincities = M6: T (149.0/42.0) | MinDist_Maincities = M8: F (125.0/44.0) MinDist_River = RI2
| MinDist_Maincities = M3: F (178.0/46.0) | MinDist_Maincities = M1: F (162.0/39.0) | MinDist_Maincities = M5: F (309.0/108.0) | MinDist_Maincities = M7: F (278.0/98.0) | MinDist_Maincities = M2: F (151.0/48.0) | MinDist_Maincities = M8: F (290.0/89.0) | MinDist_Maincities = M10: F (351.0/46.0) MinDist_River = RI3
| MinDist_Maincities = M3: F (155.0/42.0) | MinDist_Maincities = M7
| | MinDist_Road = RO3: F (46.0/13.0) | | MinDist_Road = RO1: F (100.0/25.0) | | MinDist_Road = RO4: T (44.0/19.0) | | MinDist_Road = RO2: F (62.0/14.0) | | MinDist_Road = RO5: F (40.0/7.0) | MinDist_Maincities = M4: F (287.0/98.0) | MinDist_Maincities = M6: F (250.0/97.0) | MinDist_Maincities = M8: F (302.0/85.0) | MinDist_Maincities = M10: F (240.0/26.0) MinDist_River = RI4
18
Lampiran 4 Hasil pengujian fungsi-fungsi SIG No Kelas uji Deskripsi uji Kondisi
awal Skenario uji
Hasil yang
Menggeser peta Halaman tampilan
Tampilan peta Tampilan
20
RIWAYAT HIDUP
Penulis dilahirkan Tanjung Jati pada tanggal 18 Oktober 1992 dari pasangan Bapak Zairul Zaidar dan Ibu Indrawati. Penulis merupakan anak kedua dari tiga bersaudara. Pada tahun 2010, penulis lulus dari SMA Negeri 1 Kecamatan Guguak, Kabupaten Lima Puluh Kota, Sumatera Barat dan penulis diterima sebagai mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun yang sama, penulis mendapatkan beasiswa Bidik Misi.