• Tidak ada hasil yang ditemukan

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV

N/A
N/A
Protected

Academic year: 2021

Membagikan "HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV"

Copied!
24
0
0

Teks penuh

(1)

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES

HOTSPOT PROVINSI RIAU

ILHAM ALPHA DINOV

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR 2014

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Hierarchical

Clustering Pada Data Time Series Hotspot Provinsi Riau adalah benar karya saya

dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Maret 2014

Ilham Alpha Dinov

(4)

ABSTRAK

ILHAM ALPHA DINOV. Hierarchical Clustering Pada Data Time Series

Hotspot Provinsi Riau. Dibimbing oleh IMAS SUKAESIH SITANGGANG.

Kebakaran hutan menjadi permasalahan tahunan di Indonesia khususnya di provinsi Riau. Penelitian ini menerapkan metode hierarchical clustering untuk data time series hotspot menggunakan rumus jarak rataan untuk menganalisis distribusi hotspot di provinsi Riau. Penelitian ini fokus pada persebaran hotspot di bulan Juni, Juli dan Agustus periode tahun 2001 hingga tahun 2012. Dekomposisi data time series diolah untuk mendapatkan pola kemunculan hotspot selama periode tersebut. Hierarchical clustering menghasilkan 4 buah cluster pada ketinggian sekitar 300 dendrogram. Sebagian besar hotspot pada cluster-cluster tersebut berada di daerah perkebunan.

Kata kunci: Data Time Series, kebakaran hutan, hotspot, hierarchical clustering.

ABSTRACT

ILHAM ALPHA DINOV. Hierarchical Clustering on Hotspot Time Series Data in Riau Province. Supervised by IMAS SUKAESIH SITANGGANG.

Land and forest fires become yearly issues in Indonesia, particularly in Riau province. This work applied the hierarchical clustering method for hotspot time series data using average distance formula to analyze hotspots distribution in Riau province. This work focuses on the hotspots distribution in June, July and August for the period 2001-2012. Time series data decomposition was generated to obtain the hotspot occurrence patterns over the period. Hierarchical clustering on the data results 4 clusters at the height of dendrogram about 300. Most of hotspots in these clusters are located in plantation.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer

pada

Departemen Ilmu Komputer

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES

HOTSPOT PROVINSI RIAU

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAMM INSTITUT PERTANIAN BOGOR

BOGOR 2014

(6)
(7)

Judul Skripsi : Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau

Nama : Ilham Alpha Dinov NIM : G64114008

Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juli 2013 ini ialah Data

Mining, dengan judul Hierarchical Clustering Pada Data Time Series Hotspot

Provinsi Riau.

Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Allah subhanahu wa ta'ala sehingga kendala-kendala yang dihadapi tersebut dapat diatasi. Untuk itu penulis menyampaikan ucapan terima kasih dan penghargaan kepada Ibu Dr Imas Sukaesih Sitanggang SSi, MKom selaku pembimbing yang telah dengan sabar, tekun, tulus dan ikhlas meluangkan waktu, tenaga dan pikiran memberikan bimbingan, motivasi, arahan, dan saran-saran yang sangat berharga kepada penulis selama menyusun skripsi. Ucapan terimakasih juga saya saya tujukan kepada Bapak Toto Haryanto SKom MSi dan Bapak Asyhar Agmalaro SSi MKom selaku penguji atas segala masukan dan saran yang telah diberikan. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga atas segala doa dan kasih sayangnya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Februari 2014

(9)

DAFTAR ISI

DAFTAR TABEL vi DAFTAR GAMBAR vi PENDAHULUAN 1 Latar Belakang 1 Tujuan Penelitian 2 Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

METODE 2

Data Penelitian 2

Lingkungan Pengembangan 3

Prosedur Analisis Data 3

Praproses Data 3

HASIL DAN PEMBAHASAN 4

Pengumpulan Data 4

Praproses Data Time Series Hotspot 6

Analisis Data 7

Clustering Data Time Series 7

SIMPULAN DAN SARAN 12

Simpulan 12

Saran 12

DAFTAR PUSTAKA 13

(10)

DAFTAR TABEL

1 Kelas penutupan lahan provinsi Riau 3

2 Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun

kurun waktu 2001 hingga tahun 2012. 8

3 List anggota pembagian cluster berdasarkan pembagian ketinggian

dendrogram 10

4 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada

ketinggian 300 per tipe penutupan lahan 11

DAFTAR GAMBAR

1 Diagram tahapan penelitian 2

2 Diagram alur praproses data 4

3 Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012 5 4 Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau

tahun 2001 hingga tahun 2012 5

5 Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun 2012 7 6 Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun

2012 8

7 Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012) 9 8 Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001 hingga

(11)

PENDAHULUAN

Latar Belakang

Kebakaran hutan dan lahan menjadi permasalahan yang kian mencolok di Indonesia. Peluang terjadinya kebakaran hutan di Indonesia meningkat dari tahun ke tahun. Hal tersebut menandakan perubahan hotspot yang terjadi di suatu wilayah bersifat dinamis seiring waktu yang berjalan. Kebakaran hutan ini merupakan salah satu masalah yang berulang sehingga menghasilkan informasi waktu dan lokasi persebaran hotspot. Informasi tersebut dapat diolah untuk menghasilkan kebijakan dalam penanganan kebakaran hutan di Indonesia.

Salah satu upaya pencegahan kebakaran hutan tersebut yakni dengan mengetahui persebaran pengelompokan hotspot yang berpotensi tinggi terhadap terjadinya kebakaran hutan. Konsep data mining sesuai untuk diterapkan pada data hotspot tersebut. Clustering digunakan untuk untuk mengelompokkan data berdasarkan pada kedekatan dari suatu karakteristik sampel.

Secara umum, clustering merupakan proses pengelompokan sekumpulan objek ke dalam kelas yang objeknya mirip (Han dan Kamber 2006). Ukuran kemiripan dan ketidakmiripan dinilai berdasarkan nilai atribut yang mendeskripsikan objek. Tujuan dari clustering adalah untuk mengidentifikasi struktur data yang belum berlabel yang ditentukan secara objektif oleh data yang terorganisir ke dalam grup yang homogen dengan meminimalisir kesamaan antar grup dan memaksimalkan ketidakmiripan antar grup (Liao 2005).

Data hotspot merupakan salah satu indikator kemungkinan terjadinya kebakaran hutan pada wilayah tertentu. Pemantauan hotspot dilakukan dengan penginderaan jauh (remote sensing) menggunakan satelit. Data hotspot merupakan data time series karena diamati secara periodik setiap harinya oleh satelit seperti NOAA dan MODIS.

Time series adalah serangkaian waktu koleksi pengamatan yang dilakukan

secara kronologis (Tak-Chung 2011). Contoh data time series yang sering ditemui adalah data suhu harian (daily temperature), total penjualan mingguan (weekly

sales totals) dan harga reksa dana (prices of mutual funds).

Penelitian ini dilakukan untuk melihat pola persebaran hotspot di Riau dalam kurun waktu dari tahun 2001 sampai tahun 2012. Time series clustering dipilih sebagai metode yang digunakan karena merupakan salah satu metode yang sesuai untuk melihat pola pengelompokan per satuan waktu. Terdapat dua kategori utama dalam time series clustering yaitu ―whole clustering‖ dan ―subsequence clustering‖. ―Whole clustering‖ adalah clustering yang dilakukan pada banyak objek time series untuk serangkaian kelompok yang sama. ―Subsequence clustering‖ berdasarkan pada ekstraksi sliding window atau window yang berjalan dari time series tunggal yang bertujuan untuk menemukan kesamaan dan perbedaan time windows atau antar objek waktu (Keogh et al 2003). Contoh dari “whole clustering” adalah penggunaan dua buah objek waktu seperti bulan dan tanggal. “Subsequence clustering” hanya menggunakan satu objek waktu saja, misal objek tanggal seperti yang digunakan dalam penelitian ini. Penelitian ini termasuk pada subsequence clustering karena hanya menggunakan satu objek time series yaitu tanggal.

(12)

2

Tujuan Penelitian

1 Analisis data time series hotspot, dengan melihat pola kecenderungan kemunculan hotspot selama 12 tahun dari tahun 2001 hingga tahun 2012. 2 Menentukan pengelompokan hotspot menggunakan metode hierarchical

clustering.

Manfaat Penelitian

Penelitian ini diharapkan membantu pihak–pihak yang membutuhkan informasi terkait pengelompokan hotspot provinsi Riau periode 2001 – 2012.

Ruang Lingkup Penelitian

1 Analisis dan pengelompokkan data time series hotspot dilakukan menggunakan modul-modul terkait dalam perangkat lunak komputasi statistika R (www.r-project.org).

2 Formula jarak yang digunakan dalam hierarchical clustering adalah average / rataan

METODE

Pemodelan dan analisis clustering data hotspot dilakukan dengan menggunakan perangkat lunak R. Penelitian ini dilakukan dalam beberapa tahap seperti yang ditunjukkan pada Gambar 1.

Gambar 1 Diagram tahapan penelitian

Data Penelitian

Data yang digunakan dalam penelitian ini adalah data hotspot provinsi Riau tahun 2001 hingga tahun 2012 yang diunduh dari situs NASA dan tipe data

(13)

3 penutupan lahan provinsi Riau pada tahun 2008 sebagai kelas target. Luas daerah tiap tipe penutupan lahan dapat dilihat pada Tabel 1.

Tabel 1 Kelas penutupan lahan provinsi Riau Tipe Penutupan Lahan Luas Area (km2) Plantation 28,417.13 Dryland Forest 17,497.66 Agricultural Field 20,294.21 Shrubs 8,176.02 Natural Forest 8,110.41 Bare Land 3,029.42

Swamp & Mangrove 3,746.12

Lingkungan Pengembangan

Perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut

Perangkat keras berupa komputer personal dengan spesifikasi sebagai berikut:

o Processor Intel® CoreTM i5 o Memory 4 GB

o Hardisk 320 GB Perangkat lunak:

o Sistem operasi Microsoft Windows 8

o Tool untuk komputasi statistika R 3.0.1 64 Bit

o Tool R Studio untuk memudahkan modifikasi sintaks R o DBMS PostgreSQL 9.1

o Quantum GIS 1.8.0 untuk analisis, visualisasi data spasial dan pemisah data

hotspot per tipe kelas penutupan lahan.

o PostGIS 2.0 sebagai ekstensi spasial dalam PostgreSQL 9.1 untuk menghubungkan dengan Quantum GIS 1.8.0.

o Microsoft Excel untuk memanipulasi data time series hasil kueri DBMS menjadi masukan R

Prosedur Analisis Data Praproses Data

Praproses dilakukan untuk mempersiapkan dataset time series untuk keperluan analisis awal dan clustering. Tahapan praproses data dapat dilihat pada Gambar 2. Pada langkah awal, data dimasukkan ke dalam aplikasi Quantum GIS 1.8.0 untuk dilakukan proses clipping. Proses ini memisahkan tiap tipe penutupan lahan dan untuk mendapatkan data hotspot yang berada di wilayah provinsi Riau dari tahun 2001 hingga tahun 2012. Selanjutnya hasil proses clipping di-export menjadi shape file agar file tersebut dapat diolah di dalam DBMS PostgreSQL. Kemudian data yang diperoleh di-import ke dalam DBMS PostgreSQL 9.1 yang telah terintegrasi dengan PostGIS 2.0. Selanjutnya dilakukan kueri–kueri hingga didapatkan data yang dibutuhkan untuk clustering. Sebelum data digunakan

(14)

4

menjadi data masukan R, struktur data diubah menjadi struktur data yang sesuai dengan struktur data masukan R dengan bantuan Microsoft Excel 2010. Selanjutnya data dapat diolah menggunakan R dengan bantuan tool R Studio.

Gambar 2 Diagram alur praproses data

HASIL DAN PEMBAHASAN

Pengumpulan Data Pada penelitian ini, data yang digunakan adalah: 1 Data persebaran hotspot

Data persebaran hotspot yang digunakan adalah data hotspot dari tahun 2001 hingga tahun 2012 yang diunduh dari situs resmi NASA. Data ini memiliki atribut latitude, longitude dan acq_date. Atribut latitude dan

longitude menggambarkan letak hotspot dalam peta geografis provinsi Riau

sedangkan atribut acq_date adalah keterangan tanggal suatu hotspot muncul pada titik tertentu. Gambar 3 menyajikan jumlah hotspot di wilayah provinsi Riau dari tahun 2001 hingga tahun 2012.

(15)

5

Gambar 3 Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012 Dari Gambar 3 terlihat bahwa tahun 2005, 2006 dan 2009 merupakan tahun–tahun yang memiliki catatan jumlah hotspot tinggi.

2 Data penutupan lahan

Data penutupan lahan di wilayah Riau terbagi atas tujuh tipe yaitu lahan perkebunan (plantation), hutan kering (dryland forest), lahan pertanian (agricultural field), semak (shrubs), hutan alami (natural forest), lahan kosong (bare land), serta rawa dan bakau (swamp & mangrove). Gambar 4 menunjukkan grafik kemunculan hotspot per kelas penutupan lahan dari tahun 2001 hingga tahun 2012.

Gambar 4 Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau tahun 2001 hingga tahun 2012

1645 5911 6891 4229 11746 11079 4067 5628 10937 4128 6840 7726 0 2000 4000 6000 8000 10000 12000 14000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 J um la h H o ts po t Tahun 35744 12995 10817 7978 6001 5887 1405 0 5000 10000 15000 20000 25000 30000 35000 40000 J um ;a h H o ts po t

(16)

6

Praproses Data Time Series Hotspot 1 Import shape file ke dalam Quantum GIS

Data awal hotspot yang didapatkan berupa shape file yang berisi data hotspot yang berada di dalam dan di luar wilayah provinsi Riau. Untuk memudahkan memanipulasi data awal tersebut maka dilakukan importing file ke dalam aplikasi Quantum GIS.

2 Kueri dan clipping data hotspot dengan data penutupan lahan

Proses kueri dan clipping ini dilakukan guna mendapatkan hotspot yang berada di dalam wilayah provinsi Riau tiap tahun dari tahun 2001 hingga tahun 2012. Kueri dilakukan untuk pengelompokan data hotspot berdasarkan tahun. Setelah data hotspot sudah terbagi berdasarkan tahun, selanjutnya dilakukan proses

clipping data. Clipping data dilakukan untuk memisahkan data hotspot tiap tipe

penutupan lahan.

Langkah terakhir proses clipping adalah mengelompokkan data berdasarkan tujuh kelas landcover di wilayah provinsi Riau yaitu lahan perkebunan (plantation), hutan kering (dryland forest), lahan pertanian (agricultural field), semak (shrubs), hutan alami (natural forest), lahan kosong (bare land), serta rawa dan bakau (swamp & mangrove).

3 Export layer hasil clipping menjadi shape file

Hasil kueri dan clipping di-export menjadi shape file. Sehingga dapat diolah selanjutnya menggunakan DBMS PostgreSQL.

4 Import shape file ke dalam PostgreSQL

Agar PostgreSQL dapat membaca shape file yang berisi data spasial, terlebih dahulu dipasang tool pendukung PostGIS. Satu buah shape file menghasilkan satu buah tabel dalam PostgreSQL. Pada tahap ini akan dihasilkan tabel–tabel

hotspot provinsi Riau dari tahun 2001 hingga 2012 dan tabel penutupan lahan

provinsi Riau.

5 Kueri untuk mendapatkan frekuensi hotspot per hari

Data yang dibutuhkan untuk kelas target dalam metode clustering adalah kelas pada data penutupan lahan Provinsi Riau. Untuk itu perlu penyaringan data

hotspot yang terdapat pada masing–masing kelas penutupan lahan tiap tahun

dalam periode 12 (dua belas) tahun.

6 Modifikasi struktur data menggunakan Microsoft Excel

Hotspot di setiap tipe penutupan lahan tidak muncul setiap hari, sehingga data

hasil kueri pada proses sebelumnya tidak bisa langsung dijadikan data masukan dalam sintak R. Untuk membuat struktur data time series hotspot perlu dihitung jumlah hotspot per hari selama setahun. Dengan menggunakan Microsoft Excel struktur data dapat dimodifikasi sesuai dengan format yang dibutuhkan aplikasi R.

(17)

7 Analisis Data

Gambar 5 menyajikan dekomposisi data time series hotspot di wilayah Riau pada kurun waktu 2001 hingga 2012. Label observed merupakan gambaran banyaknya hotspot per hari selama setahun pada data time series tahun 2001 hingga tahun 2012. Proses dekomposisi menghasilkan trend yang tidak linear maupun kuadratik, terlihat pada Gambar 5 baris kedua label Trend. Apabila dilihat

trend masing-masing tahun, jumlah hotspot akan terlihat signifikan naik dan

signifikan turun disekitar pergantian tahun. Hal ini dapat dilihat pada awal pergantian tahun 2002, 2003, 2006, 2008, 2009, dan 2011 yang naik secara signifikan. Sedangkan pada awal pergantian tahun 2004, 2005, 2007 dan 2010 yang turun secara signifikan. Season atau musiman dari data time series didefinisikan sebagai pola yang berulang selama interval waktu yang tetap.

Gambar 5 Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun 2012

Clustering Data Time Series

Pada algoritme clustering, data akan dikelompokkan menjadi cluster-cluster berdasarkan kemiripan satu data dengan yang lain. Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan kesamaan antaranggota cluster yang berbeda.

Dengan menggunakan algoritme Hierarchical Clustering kita bisa membagi

(18)

8

dendrogram. Hasil keseluruhan dari algoritme hierarchical clustering secara grafik dapat digambarkan sebagai tree, yang disebut dengan dendrogram. Tree ini secara grafik menggambarkan proses penggabungan dari cluster–cluster yang ada, sehingga menghasilkan cluster dengan level yang lebih tinggi (Steinbach et al 2000). Tampilan dendrogram hasil hierarchical clustering data hotspot dalam setahun kurun waktu 2001 hingga tahun 2012 dapat dilihat pada Gambar 6

Gambar 6 Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun 2012

Sebanyak 80,852 hotspot yang diamati dalam 365 hari yang berada dalam rentang waktu tahun 2001 hingga tahun 2012. Data tersebut dibagi per kelas penutupan lahan tiap tahunnya. Tabel 2 menyajikan rataan dan persentase jumlah

hotspot tiap kelas penutupan lahan dalam 12 (dua belas) bulan setiap tahun selama

kurun waktu dari tahun 2001 hingga tahun 2012.

Tabel 2 Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun kurun waktu 2001 hingga tahun 2012.

No Kelas Rataan Hotspot Persentase (%) 1 Plantation 8.16 44.22 2 Dryland_forest 1.82 9.87 3 Agricultural_field 2.77 16.22 4 Shrubs 1.47 7.28 5 Natural_forest 1.35 7.28 6 Bare_land 2.47 13.38 7 Swamp_Mangrove 0.32 1.74

Gambar 7 menyajikan grafik jumlah hotspot tiap bulan selama kurun waktu 12 (dua belas) tahun dari tahun 2001 hingga 2012. Dapat dilihat bahwa bulan Agustus memiliki frekuensi hotspot paling banyak dibandingkan dengan frekuensi hotspot di bulan yang lainnya yaitu sebanyak 14.450 hotspot.

(19)

9

Gambar 7 Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012) Data bulan Agustus dan dua bulan sebelumnya menjadi titik fokus pengamatan karena bulan-bulan tersebut merupakan urutan bulan yang memiliki jumlah frekuensi hotspot paling banyak dibandingkan dengan total frekuensi pada urutan bulan–bulan lainnya. Sebanyak 39,484 hotspot ditemukan pada bulan-bulan tersebut. Gambar 8 menyajikan tampilan plot pada bulan-bulan Juni, Juli dan Agustus selama kurun waktu 12 (dua belas) tahun dari tahun 2001 hingga tahun 2012.

Gambar 8 Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001 hingga tahun 2012

Dari Gambar 8 dapat dilihat bahwa proses clustering menghasilkan dendrogram yang memiliki ketinggian yang menyatakan ketidaksamaan atau

dissimilarity antar dua cluster. Pada Tabel 3 dapat terlihat pembagian cluster

berdasarkan ketinggian dendrogram dan susunan objek anggota tiap-tiap cluster tersebut. 4773 12593 7882 1487 5577 12161 12873 14450 4229 3516 772 514 0 2000 4000 6000 8000 10000 12000 14000 16000 J um la h H o ts po t Bulan

(20)

10

Tabel 3 Cluster berdasarkan ketinggian dendrogram Ketinggian Dendrogram Banyak Cluster Anggota 300 4 Cluster 1 159, 161 Cluster 2 197, 217 Cluster 3 193, 213 Cluster 4 175, 212, 221, 166, 225, 227, 184, 198, 185, 194, 214, 216, 168, 205, 218, 220, 206, 199, 229, 157, 160, 169, 171, 231, 233, 195, 232, 228, 176, 222, 170, 164, 177, 209, 183, 186, 202, 190, 187, 189, 165, 182, 191, 178, 180, 163, 188, 192, 200, 201, 196, 154, 158, 153, 155, 244, 235, 243, 241, 203, 239, 240, 242, 238, 208, 237, 181, 204, 230, 173, 210, 162, 207, 215, 156, 211, 234, 179, 236, 174, 167, 172, 224, 226 200 4 Cluster 1 159, 161 Cluster 2 212, 221, 166, 225, 227 Cluster 3 198, 185, 194, 214, 216, 168, 205 Cluster 4 218, 220, 206, 199, 229, 157, 160, 169, 171, 231, 233, 195, 232, 228, 176, 222, 170, 164, 177, 209, 183, 186, 202, 190, 187, 189, 165, 182, 191, 178, 180, 163, 188, 192, 200, 201, 196, 154, 158, 153, 155, 244, 235, 243, 241, 203, 239, 240, 242, 238, 208, 237, 181, 204, 230, 173, 210, 162, 207, 215, 156, 211, 234, 179, 236, 174, 167, 172, 224, 226 Pada Tabel 3 dapat dilihat pemotongan dendrogram pada titik ketinggian 300 menghasilkan sebanyak 4 cluster dan pemotongan dendrogram pada titik ketinggian 200 juga menghasilkan 4 cluster.

Tabel 4 menyajikan persebaran jumlah hotspot per cluster pada pemotongan titik 300 dendrogram pada data bulan Juni, Juli dan Agustus periode tahun 2001 hingga 2012 tiap tipe penutupan lahan. Tipe penutupan lahan plantation (perkebunan) memiliki frekuensi tertinggi pada tiap cluster yang telah dihasilkan.

(21)

11

Tabel 4 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada ketinggian 300 per tipe penutupan lahan

Tipe penutupan lahan Jumlah Hotspot

Cluster 1 Cluster 2 Cluster 3 Cluster 4 Plantation 279 604 557 16,476 Dryland forest 80 146 160 3,757 Agricultural Field 95 254 212 6,011 Shrubs 61 157 82 3,233 Natural Forest 34 130 179 3,368 Bareland 42 134 55 2,748 Swamp mangrove 11 33 17 569 Tabel 5 menyajikan persebaran jumlah hotspot pada masing-masing cluster per tipe penutupan lahan pada pemotongan titik ketinggian 300 pada dendrogram data bulan Juni, Juli, dan Agustus periode tahun 2001 hingga 2012. Tipe penutupan lahan plantation (perkebunan) memiliki frekuensi tertinggi pada tiap

cluster yang telah dihasilkan.

Tabel 5 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada ketinggian 200 per tipe penutupan lahan

Tipe penutupan lahan

Jumlah Hotspot

Cluster 1 Cluster 2 Cluster 3 Cluster 4 Plantation 279 1,266 1,629 14,742 Dryland forest 80 383 269 3,411 Agricultural Field 95 527 715 5,235 Shrubs 61 214 408 2,850 Natural Forest 34 224 318 3,135 Bareland 42 172 295 2,470 Swamp mangrove 11 55 51 513

(22)

12

SIMPULAN DAN SARAN

Simpulan

Berdasarkan penelitian yang telah dilakukan terhadap data time series

hotspot, diambil kesimpulan sebagai berikut:

1 Dekomposisi data time series hotspot menghasilkan trend yang tidak linear maupun kuadratik. Jumlah hotspot signifikan naik dan signifikan turun di sekitar pergantian tahun.

2 Pada pemotongan titik ketinggian dendrogram 300 dari data bulan Juni, Juli dan Agustus hasilkan 4 buah Cluster dan 4 buah Cluster pada pemotongan di titik ketinggian dendrogram 200.

3 Pada pemotongan ketinggian dendrogram 300 dari data bulan Juni, Juli dan Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot paling banyak di setiap cluster.

4 Pada pemotongan ketinggian dendrogram 200 untuk data bulan Juni, Juli dan Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot paling banyak di setiap cluster.

5 Dalam kurun waktu 12 tahun persentase kemunculan hotspot terbanyak pada penutupan lahan perkebunan (plantation).

Saran

Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara lain:

1 Penggunaan metode clustering lain guna mendapatkan hasil cluster yang lebih baik.

2 Dilakukan validasi cluster untuk mendapatkan cluster terbaik dari data time

(23)

13

DAFTAR PUSTAKA

Han J, Kamber M. 2006. Data Mining Concepts and Techniques Second Edition. San Fransisco (US): Morgan Kaufmann Publisher.

Keogh E, Lin J, Truppel W. 2003. Clustering of time series subsequences is meaningless: Implications for past and future research. Di dalam: Proc. of the

3rd IEEE International Conference on Data Mining; 2003 Nov 19-22;

Melbourne, FL, USA. hlm 115–122.

Liao TW. 2005. Clustering of time series data—a survey. Pattern Recognition. 38(11): 1857-1874.

Makridakis S, Wheelwright SC, Hyndman RJ. 1998. Forecasting Methods and

Applications. New York (US): John Wiley & Sons, Inc.

Steinbach M, Karypis G, Kumar V. 2000. A comparisont of document clustering

techniques. Minnesota (US) [Internet]. [diunduh 2014 Jan 01]. Tersedia pada:

http://glaros.dtc.umn.edu/gkhome/fetch/papers/doccluster.pdf

Tak-Chung Fu. 2011. A review on time series data mining. Engineering

(24)

14

RIWAYAT HIDUP

Penulis dilahirkan di Nagari Taeh Baruah kecamatan Payakumbuh kabupaten Lima Puluh Kota provinsi Sumatera Barat pada tanggal 6 November 1990. Penulis adalah anak pertama dari tiga bersaudara, anak dari pasangan Putra Erial dan Ramona.

Penulis menempuh awal pendidikan di TK (Taman Kanak-kanak) Pertiwi Desa Surya Indah kecamatan Pangkalan Kuras kabupaten Pelalawan propinsi Riau pada tahun 1995. Penulis melanjutkan pendidikan sekolah dasar pada tahun 1996 hingga 2002 di SDN 028 Kecamatan Pangkalan Kuras. Kemudian penulis melanjutkan pendidikan Sekolah Menengah Pertama di SMPN 3 Kecamatan Payakumbuh Kabupaten Lima Puluh Kota Sumatera barat dari tahun 2002 hingga tahun 2005. Penulis menempuh pendidikan tingkat Sekolah Menengah Atas di SMAN 1 Kecamatan Guguk Kabupaten Lima Puluh Kota Sumatera Barat pada tahun 2005 hingga tahun 2008. Kemudian penulis melanjutkan pendidikan perguruan tinggi di Program Diploma Institut Pertanian Bogor, Program Keahlian Manajemen Informatika pada tahun 2008 hingga 2011.

Gambar

Gambar 2 Diagram alur praproses data
Gambar 3  Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012  Dari  Gambar  3  terlihat  bahwa  tahun  2005,  2006  dan  2009  merupakan  tahun–tahun yang memiliki catatan jumlah hotspot tinggi
Gambar 5 menyajikan dekomposisi data time series hotspot di wilayah Riau  pada  kurun  waktu  2001  hingga  2012
Gambar 6  Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun  2012
+4

Referensi

Dokumen terkait

Analisis data dalam penelitian ini akan dilakukan berdasarkan tanda atau system tanda yang tampak dalam scene yang menggambarkan wujud sosok Tuhan dalam film “Bruce

melihat elemen apa saja yang membentuk ruang permukiman, pengaruhnya terhadap pemanfaatan guna lahan, dan peletakan elemen berdasarkan konsep yang dikenal dalam pola

Proses demineralisasi dimaksudkan untuk mengurangi kadar mineral dengan menggunakan asam konsentrasi rendah untuk mendapatkan kitin, sedangkan proses deasetilasi

Menu yang ada di cermin cembung sama dengan menu yang ada di cermin cekung, yaitu: menu untuk mencari jarak fokus, menu untuk mencari jarak benda, dan menu untuk

Jika panjang sisi pada persegi yang terbesar adalah 1 satuan panjang dan persegi berikutnya diperoleh dengan cara menghubungkan semua titik tengah pada keempat sisinya,

absolutely right that user testing is easy.You don't need a lab to do it, although many people think you do.You just need a computer and a person who doesn't know your software..

Hasil penelitian menunjukkan bahwa TWA Sibolangit memiliki potensi wisata alam yang layak untuk dikembangkan dan berada pada kuadran I analisis SWOT.. Hal ini berarti bahwa

Reaksi Glukosa dengan Reagen Benedict (WHO, 2012).. Memasukkan 5 ml reagen Benedict ke dalam tabung reaksi. Kemudian meneteskan sebanyak 5-8 tetes urin ke dalam tabung tersebut dan