POLA SEKUENSIAL KEMUNCULAN TITIK PANAS
BERDASARKAN DATA CUACA
DI PROVINSI RIAU
TRIA AGUSTINA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER
INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pola Sekuensial Kemunculan Titik Panas Berdasarkan Data Cuaca di Provinsi Riau adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Desember 2014
ABSTRAK
TRIA AGUSTINA. Pola Sekuensial Kemunculan Titik Panas Berdasarkan Data Cuaca di Provinsi Riau. Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Faktor cuaca merupakan faktor pendukung terjadinya kebakaran hutan. Titik panas merupakan salah satu indikator terjadinya kebakaran hutan. Kumpulan data cuaca dan data titik panas yang diperoleh dapat menghasilkan pola sekuensial kemunculan titik panas berdasarkan data cuaca. Pola sekuensial dapat digunakan untuk membantu dalam pengambilan keputusan atau kebijakan yang tepat untuk mencegah kebakaran hutan. Penelitian ini menerapkan algoritme Closed Sequential Pattern Mining (Clospan) dan program Sequential Pattern Mining Framework (SPMF) dalam menghasilkan pola sekuensial. Datasetyang digunakan merupakan data titik panas berdasarkan curah hujan dan temperatur yang dikelompokkan berdasarkan tahun kejadian dimulai dari tahun 2001 sampai 2010 dengan minimum support dari 1% sampai 20%. Hasil penelitian menunjukkan bahwa pola sekuensial yang dihasilkan dari data titik panas dan curah hujan menunjukkan kemunculan titik panas pertama pada lokasi dengan curah hujan 0.03 inci per 6 jam diikuti dengan curah hujan 0.20 inci per 6 jam pada waktu yang berbeda.Pola sekuensial dari data titik panas dan temperatur menunjukkan kemunculan titik panas pertama pada lokasi dengan temperatur 28.33 °C diikuti temperatur 28.89 °C dan temperatur 29.44 °C pada waktu yang berbeda.Area yang sering ditemukan titik panas adalah yang memilikicurah hujan 0.03 inci per 6 jam dan temperatur 29.44 °C.
Kata kunci: clospan, data cuaca, data titik panas, kebakaran hutan, SPMF
ABSTRACT
TRIA AGUSTINA. Sequential Patterns for Hotspots Occurence Based Weather Data in Riau Province. Supervised by IMAS SUKAESIH SITANGGANG.
Weather is one of some contributing factors causing forest fires. A hotspot is an indicator of forest fires. Weather and hotspots data can generate sequential pattern occurences of hotspots based on weather data. The sequential pattern can be used to help in making right decisions or policies to prevent forest fires. This research applied the Closed Sequential Pattern Mining (Clospan) algorithm that avaliable in Sequential Pattern Mining Framework program (SPMF) to generate sequential patterns. The data used are hotspots, precipitation and temperature that are grouped by year of events starting from the year 2001 to 2010. The sequential patterns were discovered with minimum supports from 1% to 20%. The results show that the sequential patterns generated from hotspot and precipitation data indicate the first hotspot occurence in a location with precipitation 0.03 inch per 6 hours followed by precipitation 0.20 inches per 6 hours at different times. Sequential patterns of hotspot and temperature data indicate the first hotspot occurence in a location with temperature 28.33 °C followed by temperature 28.89 °C and temperature 29.44 °C at different times. Areas where most commonly found hotspot occurrences are those with precipitation 0.03 inch per 6 hours and temperature 29.44 °C.
POLA SEKUENSIAL KEMUNCULAN TITIK PANAS
BERDASARKAN DATA CUACA
DI PROVINSI RIAU
TRIA AGUSTINA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Penguji 1: Hari Agung Adrianto, SKom MSi
Judul Skripsi : Pola Sekuensial Kemunculan Titik Panas Berdasarkan Data Cuaca di Provinsi Riau
Nama : Tria Agustina
NIM : G64124058
Disetujui oleh
Dr Imas Sukaesih Sitanggang, SSi, MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi, MKom Ketua Departemen
PRAKATA
Alhamdulillah hirabbil alamin, puji syukur penulis panjatkan ke hadirat Allah Subhanahu Wa Ta'ala atas berkat, rahmat, taufik, dan hidayah-Nya sehingga penyusunan skripsi yang berjudul Pola Sekuensial Kemunculan Titik Panas Berdasarkan Data Cuaca di Provinsi Riau dapat diselesaikan dengan baik.
Ucapan terima kasih penulis sampaikan kepada Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah membantu penulis dalam menyusun tugas akhir. Di samping itu, ucapan terima kasih juga penulis sampaikan kepada Bapak Hari Agung Adrianto, SKom MSi dan Bapak Muhammad Asyhar Agmalaro, SSi MKom selaku penguji dalam tugas akhir. Ungkapan terima kasih juga penulis sampaikan kepada Ayahanda Aji Purnomo, Ibunda Lina Marlina, serta seluruh keluarga atas doa, kasih sayang, semangat, dan dukungan kepada penulis. Terima kasih kepada seluruh staf dan dosen Departemen Ilmu Komputer IPB atas segala bimbingan dan kemudahan layanan, seluruh teman-teman Ilmu Komputer AJ 7 khususnya teman-teman satu bimbingan atas kebersamaan dan semangatnya. Serta semua pihak yang telah membantu penulis yang tidak dapat disebutkan satu persatu, jazakumullah khairan.
Bogor, Desember 2014
DAFTAR ISI
DAFTAR TABEL viii
DAFTAR GAMBAR viii
DAFTAR LAMPIRAN viii
PENDAHULUAN 1
Latar Belakang 1
Perumusan Masalah 2
Tujuan Penelitian 2
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE PENELITIAN 2
Data Penelitian 2
Spesifikasi Kebutuhan Perangkat Sistem 3
Sequential Pattern Mining 4
Tahapan Penelitian 4
Praproses Data 4 Data Titik Panas dan Cuaca 5 Penentuan Pola Sekuensial Menggunakan Algoritme Clospan 5 Pola Sekuensial Titik Panas dan Cuaca 6 Analisis Pola Sekuensial 6 HASIL DAN PEMBAHASAN 6
Praproses Data 6
Seleksi Data 6 Pembersihan Data 7 Pembuatan Data Sekuensial 7 Penentuan Pola Sekuensial Menggunakan Algoritme Clospan 8
Analisis Pola Sekuensial 11
SIMPULAN DAN SARAN 13
Simpulan 13
DAFTAR TABEL
1 Atribut data titik panas 3
2 Atribut data cuaca 3
3 Kategori laporan pengambilan data curah hujan 7
4 Contoh data curah hujan dalam bentuk sekuensial 7 5 Contoh data temperatur dalam bentuk sekuensial 8
6 Contoh data dengan format masukkan SPMF 8
7 Jumlah pola sekuensial data titik panas dan curah hujan 9 8 Jumlah pola sekuensial data titik panas dan temperatur 9 9 Pola sekuensial data titik panas dan curah hujan tahun 2005 9 10Pola sekuensial data titik panas dan temperatur tahun 2005 10
DAFTAR GAMBAR
1 Lokasi stasiun cuaca 3
2 Tahapan penelitian 4
3 Tahapan praproses data 5
4 Algoritme Clospan 5
DAFTAR LAMPIRAN
1
PENDAHULUAN
Latar Belakang
Kebakaran hutan memiliki dampak buruk bagi Indonesia maupun negara-negara tetangga. Terjadinya kebakaran hutan secara umum dipengaruhi oleh faktor manusia dan cuaca. Faktor manusia merupakan hal yang sulit untuk diidentifikasi kejadiannya karena didasari pada kesadaran manusia untuk melindungi alam sekitar, sedangkan faktor cuaca dapat diidentifikasi dengan mengetahui keadaan cuaca tertentu di daerah terjadinya kebakaran hutan.
Upaya pencegahan yang dapat dilakukan dari sisi faktor cuaca adalah melakukan pemantauan terhadap data cuaca pada saat ditemukan titik panas di suatu lokasi. Titik panas (hotspot) adalah suatu indikator kebakaran hutan yang mendeteksi suatu lokasi yang memiliki suhu relatif lebih tinggi dibandingkan dengan suhu di sekitarnya (Kemenhut 2009). Pemantauan terhadap data cuaca dilakukan untuk mengetahui keadaan cuaca tertentu pada suatu lokasi titik panas muncul. Stasiun cuaca mencatat data cuaca setiap harinya, begitu pula dengan satelit yang merekam data titik panas yang merupakan indikator kebakaran hutan. Kumpulan data tersebut dapat dianalisis sehingga menghasilkan informasi yang dapat membantu dalam pengambilan keputusan atau kebijakan yang tepat untuk mencegah kebakaran hutan, seperti mengetahui pola kemunculan titik panas di provinsi tersebut.
Teknik data mining dapat diterapkan untuk menganalisis pola sekuensial kemunculan titik panas berdasarkan data cuaca di Riau. Data mining merupakan proses menemukan pola menarik dan pengetahuan dalam jumlah data yang besar (Han et al. 2011). Metode sequential pattern mining adalah metode data mining yang digunakan dalam penelitian ini. Sequential pattern mining digunakan untuk mencari kemunculan item yang diikuti oleh item lain yang terurut berdasarkan waktu transaksi (Agrawal dan Srikant 1995). Terdapat 2 kelas utama pada metode sequential pattern mining. Kelas pertama yaitu apriori-based yang terdiri dari Generalized Sequential Pattern (GSP) dan Sequential Pattern Discovery using Equivalent Class (SPADE). Kelas kedua yaitu projection-based yang terdiri dari algoritme Prefixspan dan Closed Sequential Pattern Mining (Clospan) (Han et al. 2005).
2
Perumusan Masalah
Rumusan permasalahan pada penelitian ini adalah bagaimana data cuaca yaitu curah hujan dan temperatur dapat mempengaruhi kemunculan berurutan titik panas di wilayah Provinsi Riau dengan menggunakan metode sequential pattern mining yaitu algoritme Clospan.
Tujuan Penelitian
Tujuan dari penelitian ini adalah menentukan pola sekuensial kemunculan titik panas berdasarkan data cuaca yaitu curah hujan dan temperatur di Provinsi Riau menggunakan algoritme Clospan.
Manfaat Penelitian
Pola sekuensial kemunculan titik panas berdasarkan data cuaca dapat digunakan sebagai informasi yang dapat membantu dalam pengambilan keputusan atau kebijakan yang tepat untuk mencegah kebakaran hutan.
Ruang Lingkup Penelitian Penelitian ini memiliki ruang lingkup sebagai berikut:
1 Penelitian ini menggunakan data kemunculan titik panas dan data cuaca yaitu curah hujan dan temperatur di Provinsi Riau dari tahun 2001 sampai 2010. 2 Penelitian ini menggunakan program Sequential Pattern Mining Framework
(SPMF) (Viger 2013) untuk memperoleh pola sekuensial.
METODE PENELITIAN
Data Penelitian
3
Gambar 1 Lokasi stasiun cuaca
Data titik panas terdiri dari 156 703 baris data. Atribut yang digunakan dalam penelitian ini adalah longitude, latitude, dan tanggal. Keterangan dari atribut data titik panas dapat dilihat pada Tabel 1.
Tabel 1 Atribut data titik panas
No Nama atribut Deskripsi Tipe data
1 Longitude Koordinat longitude data Numeric 2 Latitude Koordinat latitude data Numeric 3 Tanggal Tanggal pengambilan data Date
Data cuaca terdiri dari 3694 baris data. Atribut yang digunakan dalam penelitian ini adalahtanggal, temperatur, dan curah hujan. Keterangan dari atribut data cuaca dapat dilihat pada Tabel 2.
Tabel 2 Atribut data cuaca
No Nama atribut Deskripsi Tipe data
1 Tanggal Tanggal pengambilan data Date
2 Temperatur Temperatur rataan untuk satu hari dalam derajat Fahrenheit
Numeric
3 Curah hujan Total curah hujan untuk satu hari dalam inci Numeric
Spesifikasi Kebutuhan Perangkat Sistem
Penelitian ini menggunakan spesifikasi perangkat keras dan lunak sebagai berikut:
1 Perangkat keras
Prosesor Intel(R) Core(TM) i5-3230M CPU @ 2.60GHz
RAM 2 GB 2 Perangkat lunak
Windows 8 Enterprise 64-bit sebagai sistem operasi
PostgreSQL versi 9.3 sebagai sistem manajemen basis data
4
Sequential Pattern Mining
Sequential pattern adalah pola yang menggambarkan urutan waktu terjadinya suatu peristiwa. Pola tersebut dapat ditemukan apabila data yang disimpan relatif besar dan peristiwa yang berurutan terjadi beberapa kali (Han et al. 2011). Sequential pattern mining pertama kali diperkenalkan oleh Agrawal dan Srikant pada tahun 1995 yang digunakan untuk mencari kemunculan item yang diikuti oleh item lain yang terurut berdasarkan waktu transaksi (Agrawal dan Srikant 1995). Sequential pattern digambarkan sebagai berikut: diberikan sejumlah urutan, setiap urutan terdiri atas sederetan elemen, dan setiap elemen terdiri atas sejumlah item, serta diberikan nilai minimum support. Pola sekuensial adalah semua subsequence berulang, yaitu subsequence yang frekuensi kejadiannya lebih besar dari minimum support (Agrawal dan Srikant 1995).
Sebuah itemset adalah himpunan item yang tidak kosong, dinotasikan dengan i = {i1 i2 i3 …im}, dengan ij adalah item. Sebuah sequence adalah daftar urutan dari
menunjukkan banyaknya sequence dalam database D. Support sequence α adalah banyaknya sequence dalam D yang memuat α, support(α) = |{s|sϵ D dan α ⊆ s}|.
Minimum support adalah batas jumlah minimum dari suatu itemset yang frequent.
Frequent sequence pattern berisi semua sequence yang memiliki nilai support yang tidak lebih rendah dari minimum support yang telah ditentukan (Yan et al. 2003).
Tahapan Penelitian
Penelitian ini memiliki beberapa tahapan dalam menghasilkan pola sekuensial. Tahapan-tahapan yang dilakukan pada penelitian ini dapat dilihat pada Gambar 2.
Gambar 2 Tahapan penelitian Praproses Data
Praproses data yang dilakukan meliputi seleksi data, pembersihan data, dan pembuatan data sekuensial. Seleksi data merupakan proses pemilihan atribut data yang digunakan dalam penelitan. Pembersihan data merupakan tahap membersihkan
5
data dari missing value dan noise. Pembuatan data sekuensial merupakan tahapan mengurutkan data berdasarkan longitude, latitude, dan waktu kejadian. Tahapan praproses dapat dilihat pada Gambar 3.
Gambar 3 Tahapan praproses data Data Titik Panas dan Cuaca
Data yang telah melewati tahap praproses menghasilkan data sekuensial yang terurut berdasarkan longitude, latitude, dan waktu. Data dalam bentuk sekuensial kemudian disesuaikan kembali untuk menjadi masukkan program SPMF. Penyesuaian format data dilakukan dengan bahasa pemrograman PHP.
Penentuan Pola Sekuensial Menggunakan Algoritme Clospan
Pola sekuensial dalam penelitian ini dihasilkan dengan menggunakan program SPMF (Viger 2013). Pola ini menunjukkan keterkaitan kejadian antar-item yang terurut berdasarkan waktu. Penentuan pola sekuensial dilakukan dengan mencari frequent sequence. Frequent sequence merupakan kumpulan transaksi yang memiliki jumlah minimum support sama atau melebihi minimum support yang telah ditentukan sebelumnya (Han et al. 2011). Tahap ini dilakukan dengan menggunakan algoritme Clospan. Clospan merupakan suatu algoritme penghasil pola sekuensial dengan metode efisiensi basis data (Yan et al. 2003). Metode efisiensi basis data yang dilakukan yaitu dengan menerapkan konsep post-pruning. Post-pruning merupakan proses efisiensi pola pada basis data dengan teknik backward super-pattern dan backward sub-pattern. Algoritme Clospan dapat dilihat pada Gambar 4 (Yan et al. 2003):
Gambar 4 Algoritme Clospan Basis data
Masukan: sequence s, projected database Ds, dan minimum
support min_sup
Output: pola pencarian prefix L
1: Periksa apakah ditemukan s’, baik s ⊆ s’ atau s’ ⊆ s, dan Γ(Ds)= Γ(Ds’)
2: Jika terdapat super-pattern atau sub-pattern kemudian
6
Langkah awal yang dilakukan algoritme Clospan di Gambar 4 adalah memeriksa apakah ditemukan sequences’, baik sequence s terdapat pada sequence s’ atau sequences’ terdapat pada sequence s, dan memeriksa apakah total jumlah item dalam Ds sama dengan Ds’. Jika kondisi terpenuhi, dilakukan backward super-pattern atau backward sub-pattern. Selainnya, sequence s dimasukkan ke pola prefix. Baca projected database satu kali, ketika ditemukan item yang sering muncul, sequence s dapat diperluas menjadi item terakhir dari sequence baru, atau sequence s dapat diperluas menjadi pola sekuensial. Pemanggilan Clospan secara rekursif dengan cara pencarian depth-first pada pohon pencarian prefix dan membangun pola sequence prefix yg sesuai dilakukan untuk setiap pola sekuensial baru α (Yan et al. 2003).
Pola Sekuensial Titik Panas dan Cuaca
Tahap penentuan pola dengan program SPMF menggunakan algoritme Clospan yang telah dilakukan sebelumnya menghasilkan pola sekuensial. Jumlah pola sekuensial yang dihasilkan berpengaruh pada minimum support yang ditentukan sebelumnya.
Analisis Pola Sekuensial
Pada tahap ini dilakukan analisis dari pola sekuensial yang telah dihasilkan sebelumnya. Langkah analisis yang dilakukan meliputi pemantauan terhadap keterkaitan item pada pola sekuensial untuk setiap minimum support dan dataset yang ditentukan sebelumnya.
HASIL DAN PEMBAHASAN
Praproses Data
Praproses dilakukan melalui tahapan seleksi data, pembersihan data, dan pembuatan data sekuensial. Berikut penjelasan langkah praproses, yaitu:
Seleksi Data
Langkah awal praproses adalah data dimasukkan ke dalam basis data menggunakan DBMS PostgreSQL. Langkah selanjutnya adalah pemilihan atribut yang akan digunakan dalam penelitian dengan query. Data titik panas yang memiliki 14 atribut, kemudian dilakukan seleksi sehingga hanya 3 atribut yang digunakan. Hal yang sama dilakukan pada data cuaca, dipilih 3 atribut dari 22 atribut.
7
Pembersihan Data
Pada data curah hujan ditemukan beberapa missing value dengan nilai 99.99, juga terdapat noise dengan nilai curah hujan 0.00 yang berarti tidak ada curah hujan yang terukur. Data tersebut kemudian dihilangkan karena akan merusak pola sekuensial yang dihasilkan.
Pembuatan Data Sekuensial
Setelah pembersihan data, dilakukan penyesuaian manual sebagai persiapan untuk membuat data dalam bentuk sekuensial. Penyesuaian dilakukan dengan mengurutkan data curah hujan berdasarkan ukuran dan kategori pengambilan data karena perbedaan tipe laporan pengambilan data curah hujan. Terdapat 5 kategori laporan pengambilan data curah hujan yang dapat dilihat pada Tabel 3.
Tabel 3 Kategori laporan pengambilan data curah hujan
No. Kategori Keterangan
1 A Satu laporan jumlah curah hujan per 6 jam.
2 B Penjumlahan dua laporan jumlah curah hujan per 6 jam 3 C Penjumlahan tiga laporan jumlah curah hujan per 6 jam 4 D Penjumlahan empat laporan jumlah curah hujan per 6 jam 5 E Satu laporan jumlah curah hujan per 12 jam.
Proses pengurutan dilakukan secara manual yang menghasilkan 305 data unik. Setiap data unik kemudian diberi penamaan berurut dengan kode 1 sampai 305. Hal ini disebabkan program SPMF hanya dapat membaca masukkan bilangan bulat positif, sedangkan data curah hujan asli merupakan bilangan desimal yang disertai dengan kategori laporan seperti 0.03A. Sebagai contoh curah hujan dengan nilai 0.01A diberi kode 1. Penyesuaian juga dilakukan dengan mengubah data temperatur yang semula bilangan desimal menjadi bilangan bulat.
Pada data longitude dan latitude dilakukan pembulatan menjadi bilangan desimal dengan 2 angka di belakang koma yang semula 3 angka di belakang koma. Hal tersebut dilakukan karena tidak ditemukan munculnya 2 atau lebih titik panas pada lokasi yang sama karena lokasi pencarian terlalu spesifik. Dengan dilakukan pembulatan 2 angka di belakang koma, terdapat beberapa data titik panas yang ditemukan muncul di lokasi yang sama.
Pembangkitan pola sekuensial dilakukan dengan program SPMF. Program ini membaca masukkan berupa data dalam bentuk sekuensial. Bahasa pemrograman PHP digunakan untuk mengubah format data menjadi data dalam bentuk sekuensial, data sekuensial menggunakan atribut longitude dan latitude sebagai id, atribut curah hujan dan temperatur sebagai item yang diurut berdasarkan tanggal. Contoh data curah hujan pada tahun 2002 dalam bentuk sekuensial dapat dilihat pada Tabel 4.
Tabel 4 Contoh data curah hujan dalam bentuk sekuensial Longitude Latitude Data Sekuensial
8
Data sekuensial pada Tabel 4 berisikan data curah hujan saat ditemukannya titik panas di longitude dan latitude tertentu yang berurut berdasarkan waktu. Tanda kurung menjelaskan terjadinya kejadian dalam satu waktu. Tanda kurung yang berbeda menggambarkan data curah hujan yang terjadi di lokasi yang sama pada waktu yang berbeda. Pada Tabel 4 terdapat data yang hanya memiliki satu data curah hujan seperti pada longitude 101.78 dan latitude 1.55. Hal ini karena tidak ditemukan munculnya titik panas pada data yang tepat berada pada lokasi dan waktu yang sama. Begitu pula pembacaan data temperatur dalam bentuk sekuensial. Contoh data temperatur pada tahun 2002 dalam bentuk sekuensial dapat dilihat pada Tabel 5.
Tabel 5 Contoh data temperatur dalam bentuk sekuensial Longitude Latitude Data Sekuensial
101.78 1.52 <(83)(80)(81)(82)> 101.78 1.54 <(81)(80)(82)(83)> 101.78 1.56 <(82)(83)>
101.78 1.55 <(83)(82)> 101.79 1.57 <(82)(83)>
Data sekuensial yang telah diperoleh kemudian diubah kembali menggunakan bahasa pemrograman PHP menjadi format masukkan yang sesuai dengan program SPMF. Contoh data curah hujan dan temperatur dengan format masukkan SPMF dapat dilihat pada Tabel 6. Nilai ‘-1’ menunjukkan akhir dari suatu itemset. Nilai ‘ -2’ menunjukkan akhir dari sequence (Viger 2003).
Tabel 6 Contoh data dengan format masukkan SPMF Data Curah Hujan Data Temperatur
67 -1 1 -1 5 -1 -2 83 -1 80 -1 81 -1 82 -1 -2 3 -1 1 -1 5 -1 -2 81 -1 80 -1 82 -1 83 -1 -2 1 -1 5 -1 -2 82 -1 83 -1 -2
5 -1 -2 83 -1 82 -1 -2 5 -1 -2 82 -1 83 -1 -2
Tahap ini menghasilkan 2 data sekuensial, yaitu data curah hujan dan data temperatur. Masing-masing data akan ditentukan pola sekuensialnya menggunakan program SPMF.
Penentuan Pola Sekuensial Menggunakan Algoritme Clospan
9
Tabel 7 Jumlah pola sekuensial data titik panas dan curah hujan No Dataset (tahun) Minimum support (%)
Pencarian pola sekuensial juga dilakukan pada data temperatur menggunakan SPMF. Jumlah pola sekuensial yang dihasilkan dapat dilihat pada Tabel 8.
Tabel 8 Jumlah pola sekuensial data titik panas dan temperatur No Dataset (tahun) Minimum support (%) tahun 2005 yang merupakan tahun dengan kemunculan titik panas terbanyak, yaitu sebanyak 2287 kejadian. Pada tabel ini ditampilkan 5 pola dengan nilai support tertinggi. Hasil eksekusi pola sekuensial data curah hujan tahun 2005 selengkapnya dapat dilihat pada Lampiran 1.
Tabel 9 Pola sekuensial data titik panas dan curah hujan tahun 2005 Minimun
support 1-sequence 2-sequence
10
Minimun
support 1-sequence 2-sequence
5% 175 -1 #SUP: 504; 46 -1 #SUP: 227; 237 -1 #SUP: 218; 288 -1 #SUP: 166; 179 -1 #SUP: 122
10% 175 -1 #SUP: 504 15% 175 -1 #SUP: 504 20% 175 -1 #SUP: 504
Tabel 10 merupakan pola sekuensial hasil eksekusi SPMF data temperatur tahun 2005 yang merupakan tahun dengan kemunculan titik panas terbanyak, yaitu sebanyak 9279 kejadian. Pada tabel ini ditampilkan 5 pola dengan nilai support tertinggi. Hasil eksekusi pola sekuensial data curah hujan tahun 2005 selengkapnya dapat dilihat pada Lampiran 2.
Tabel 10 Pola sekuensial data titik panas dan temperatur tahun 2005 Minimun
11
Analisis Pola Sekuensial
Pembangkitan pola pada tahap sebelumnya menghasilkan pola sekuensial yang dapat dianalisis pada setiap dataset. Pola tersebut menggambarkan karakteristik cuaca, yaitu curah hujan dan temperatur pada saat ditemukannya titik panas.
1 Data curah hujan tahun 2005
Data sekuensial yang terbentuk dari data curah hujan pada tahun 2005 sebanyak 2287 kemunculan titik panas. Pola yang dianalisis merupakan pola pada minimum support 1% yang berarti sedikitnya terdapat 22 kemunculan titik panas dari 2287 kejadian. Pola yang dihasilkan sebagai berikut:
Pola di atas menunjukkan pola yang memiliki keterkaitan dari 2 item. Pola <175 237>, <229 175>, dan <260 175> menjelaskan bahwa 71 kemunculan titik panas dari 2287 kejadian diantaranya muncul pada lokasi dengan curah hujan dengan kode 175 (0.03C yaitu curah hujan bernilai 0.03 inci yang berasal dari penjumlahan tiga laporan curah hujan per 6 jam) kemudian diikuti curah hujan dengan kode 237 (0.20D yaitu curah hujan bernilai 0.20 inci yang berasal dari penjumlahan empat laporan curah hujan per 6 jam) pada waktu yang berbeda. Pola lain yang ditemukan adalah 28 kemunculan titik panas pada lokasi dengan curah hujan dengan kode 260 (0.78D yaitu curah hujan bernilai 0.78 inci yang berasal dari penjumlahan empat laporan curah hujan per 6 jam) kemudian pada waktu berbeda curah hujan ditemukan dengan kode 175 (0.03C yaitu curah hujan bernilai 0.03 inci yang berasal dari penjumlahan tiga laporan curah hujan per 6 jam). Tidak dapat dilihat rentang waktu terjadinya kemunculan titik panas dari pola sekuensial yang dihasilkan pada penelitian ini.
Kemudian dilakukan pula analisis pola sekuensial pada minimum support 2% dan 3% yang menghasilkan pola yang sama. Minimum support 2% berarti sedikitnya ditemukan 45 kemunculan titik panas. Minimum support 3% berarti sedikitnya ditemukan 68 kemunculan titik panas. Pola yang dihasilkan sebagai berikut:
Pola <175 237> menjelaskan bahwa terdapat 71 kemunculan titik panas dari 2287 kejadian diantaranya muncul pada lokasi dengan curah hujan dengan kode 175 (0.03C yaitu curah hujan bernilai 0.03 inci yang berasal dari penjumlahan tiga laporan curah hujan per 6 jam) kemudian diikuti curah hujan dengan kode 237 (0.20D yaitu curah hujan bernilai 0.20 inci yang berasal dari penjumlahan empat laporan curah hujan per 6 jam) pada waktu yang berbeda. Tidak dapat dilihat rentang waktu terjadinya kemunculan titik panas dari pola sekuensial yang dihasilkan pada penelitian ini.
2 Data temperatur tahun 2005
Data sekuensial yang terbentuk dari data temperatur pada tahun 2005 sebanyak 9279 kemunculan titik panas. Pola yang dianalisis merupakan pola
175 -1 237 -1 #SUP: 71 260 -1 175 -1 #SUP: 28 229 -1 175 -1 #SUP: 22
12
1-sequence pada minimum support 20% yang berarti sedikitnya terdapat 1855 kemunculan titik panas dari 9279 kejadian. Pola 1-sequence merupakan pola yang memiliki keterkaitan hanya dari 1 item, yaitu item itu sendiri. Pola yang dihasilkan sebagai berikut:
Pola di atas menunjukkan 3595 kejadian dari 9279 lokasi ditemukannya titik panas pada lokasi dengan temperatur 85 °F (29.44 °C). Ditemukan pula 3595 kemunculan titik panas pada lokasi dengan temperatur 83 °F (28.33 °C).
Analisis kemudian dilakukan untuk pola 2-sequence yang merupakan pola yang memiliki keterkaitan 2 item. Pola dianalisis dengan menggunakan minimum support 5% yang berarti sedikitnya terdapat 463 kemunculan titik panas dari 9279 kejadian. Pola yang dihasilkan sebagai berikut:
Pola di atas menunjukkan 672 kemunculan titik panas pada lokasi dengan temperatur 83 °F (28.33 °C) dan diikuti dengan temperatur 85 °F (29.44 °C) pada waktu yang berbeda. Ditemukan juga 655 kemunculan titik panas pada lokasi dengan temperatur 85 °F (29.44 °C) dan pada waktu yang berbeda ditemukan titik panas dengan temperatur 83 °F (28.33 °C) di lokasi yang sama. Tidak dapat dilihat rentang waktu terjadinya kemunculan titik panas dari pola sekuensial yang dihasilkan pada penelitian ini.
Analisis kembali dilakukan untuk pola 3-sequence yaitu pola yang memiliki keterkaitan hingga 3 item. Analisis dilakukan dengan minimum support 1% yang berarti sedikitnya terdapat 92 kemunculan titik panas dari 9279 kejadian. Pola yang dihasilkan sebagai berikut:
13
SIMPULAN DAN SARAN
Simpulan
Kemunculan titik panas ditemukan pada lokasi dengan curah hujan berkode 46 (1.85A yaitu curah hujan bernilai 1.85 inci yang berasal dari satu laporan curah hujan per 6 jam), 175 (0.03C yaitu curah hujan bernilai 0.03 inci yang berasal dari penjumlahan tiga laporan curah hujan per 6 jam), 237 (0.20D yaitu curah hujan bernilai 0.20 inci yang berasal dari penjumlahan empat laporan curah hujan per 6 jam), dan 288 (2.13D yaitu curah hujan bernilai 2.13 inci yang berasal dari penjumlahan empat laporan curah hujan per 6 jam). Kemunculan titik panas pada lokasi dengan curah hujan berkode 175 ditemukan di semua pola sekuensial yang diperoleh, dapat disimpulkan curah hujan dengan kode 175 tersebut merupakan area yang paling sering ditemukannya titik panas. Kemunculan titik panas pada lokasi dengan curah hujan berkode 175 secara umum diikuti dengan peningkatan curah hujan dengan kode 237 dilokasi yang sama pada waktu yang berbeda.
Kemunculan titik panas ditemukan pada lokasi dengan temperatur 83 °F (28.33 °C), 84 °F (28.89 °C), 85 °F (29.44 °C), dan 86 °F (30 °C). Kemunculan titik panas pada lokasi dengan temperatur 85 °F (29.44 °C) dapat disimpulkan menjadi area yang paling sering ditemukannya titik panas karena lebih dari sepertiga data kemunculan titik panas pada lokasi dengan temperatur tersebut. Kemunculan titik panas pada lokasi dengan temperatur 83 °F (28.33 °C) yang ditemukan diikuti peningkatan temperatur menjadi 84 °F (28.89 °C) di waktu yang berbeda, dan selanjutnya diikuti dengan peningkatan kembali temperatur menjadi 85 °F (29.44 °C) pada waktu yang berbeda pula.
Saran
Penelitian ini memiliki beberapa kekurangan seperti tidak dapat diketahui lokasi ditemukannya titik panas dan rentang waktu antar kejadian. Penelitian selanjutnya dapat dilakukan dengan menyertakan keterangan lokasi (longitude dan latitude) pada pola sekuensial, sehingga diketahui lokasi-lokasi mana saja yang sering ditemukan kemunculan titik panas pada karakteristik cuaca tertentu. Dapat pula dilakukan pembentukan pola sekuensial dengan menentukan batasan rentang waktu antar kejadian, seperti penentuan rentang waktu kejadian per bulan agar dapat diketahui dengan pasti rentang waktu antar kejadian pertama dengan kejadian selanjutnya.
DAFTAR PUSTAKA
14
Han J, Kamber M, Pei J. 2011. Data Mining: Concepts and Techniques, 3rd Ed. America (US): Morgan Kaufmann.
Han J, Pei J, Yan X. 2005. Sequential pattern mining by pattern growth: principles and extensions. Di dalam: Chu W, Lin TY, editor. Foundation and Advances in Data Mining, Studies in Fuzziness and Soft Computing Volume 180. Berlin (DE): Springer Berlin Heidelberg. hlm 183-220.
Yan X, Han J, Ashfar R. 2003. Clospan: Mining closed sequential pattern in large dataset. Di dalam: Barbara D, Kamath C, editor. Proceedings of the Third SIAM International Conference on Data Mining; 2003 Mei 1-3; San Francisco, United States. Philadelphia (US): The Society for Industrial and Applied Mathematic. hlm 166-177.
[Kemenhut] Kementrian Kehutanan. 2009. Peraturan menteri kehutanan nomor: p.12/ menhut-ii/2009 [internet]. Jakarta(ID): Kemenhut. [diunduh 2014 Mei 29]. Tersedia pada: http://www.dephut.go.id/uploads/files/P12_09.pdf Khairunnisa DM. 2014. Penerapan algoritme prefixspan dan clospan untuk mencari
pola sekuensial pada data peminjaman buku di perpustakaan IPB [skripsi]. Bogor (ID): Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
15
LAMPIRAN
Lampiran 1 Pola sekuensial data titik panas dan curah hujan tahun 2005 Minimun
16
Lanjutan
Minimun
support 1-sequence 2-sequence 227 -1 #SUP: 115
Lampiran 2 Pola sekuensial data titik panas dan temperatur tahun 2005 Minimun
17
Lanjutan Minimun
18
Lanjutan Minimun
support 1-sequence 2-sequence 3-sequence
19
Lanjutan Minimun
support 1-sequence 2-sequence 3-sequence 82 -1 #SUP: 1853
20