• Tidak ada hasil yang ditemukan

KLASIFIKASI STATUS GUNUNG MERAPI DENGAN METODE NAIVE BAYES CLASIFIER DAN DECISION TREE

N/A
N/A
Protected

Academic year: 2022

Membagikan "KLASIFIKASI STATUS GUNUNG MERAPI DENGAN METODE NAIVE BAYES CLASIFIER DAN DECISION TREE"

Copied!
7
0
0

Teks penuh

(1)

KLASIFIKASI STATUS GUNUNG MERAPI DENGAN METODE NAIVE BAYES

CLASIFIER DAN DECISION TREE

Arik Achmad Efendi

1

, Fauzi Dwi Susanto

2

, Grandis Mahendra

3

, Rifqi Kurniawan

4

, Siti Hardiyanti

5

Program Teknologi Informasi & Ilmu Komputer, Universitas Brawijaya, Malang E-Mail:1[email protected], 2[email protected], 3[email protected],

4[email protected], 5[email protected]

Abstrak

Gunung berapi merupakan salah satu keindahan alam yang ada. Namun keberadaan gunung berapi juga sangat meresahkan masyarakat yang ada disekitar jika terjadi gunung meletus. Untuk menghindari hal – hal yang tidak diinginkan, maka dibuatlah sebuah program dimana bisa mengklasifikasikan keadaan gunung berapi apakah normal, siaga, waspada atau awas. Program ini dibuat dengan menggunakan 2 metode yaitu metode Naïve Bayes Clasifier dan Decision Tree. Dimana program yang kita buat ini untuk membandingkan hasil kedua metode ini. Membandingkan kedua metode ini kita mencari metode mana yang hasilnya alebih akurat, apakah Naïve Bayes Clasifier atau metode Decision Tree. Ke dua algoritnma ini, mampu mengklasifikasi status keadaan gunung, namun keakuratan data hasil kedua metode ini berbeda dimana data pada metode Decision Tree lebih akurat dibandingkan pada metode Naïve Bayes Clasifier. Hal ini terjadi karena pengklasifikasian menggunakan Decision Tree lebih cermat dan teliti perfiturnya dibandingkan dengan Naïve Bayes Clasifier.

Kata kunci: Gunung berapi, Naïve Bayes Clasifier, Decision Tree

Abstract

The volcano is one of the natural beauty. But the existence of the volcano is also very disturbing that there are people around in case of volcanic eruption. To avoid this - things that are not desirable, then made a program which can classify the state of the volcano is normal, alert, vigilant or alert. This program is made using two methods ie methods Clasifier Naive Bayes and Decision Tree. Where is the program that we created to compare the results of both methods. Comparing these two methods we find which method alebih accurate results, whether or method Clasifier Naive Bayes Decision Tree.

Second algoritnma, was able to classify the status of the state of the mountain, but the accuracy of the data from these two different methods by which data on Decision Tree method is more accurate than the Naive Bayes method Clasifier. This occurs because the classification using Decision Tree more carefully and thoroughly than the Naive Bayes perfiturnya Clasifies.

Keyword: Gunung berapi, Naïve Bayes Clasifier, Decision Tree

(2)

1. PENDAHULUAN

Informasi bencana alam sangat dibutuhkan dalam upaya pengelolaan bencana alam terutama pada langkah-langkah mitigasi dan persiapan menghadapi bencana. Mitigasi ini merupakan proses pencegahan atau pengurangan akan kemungkinan terjadinya bencana dan pengurangan kerugian akibat terjadinya bencana, sedangkan langkah persiapan menghadapi bencana ini termasuk pula melakukan prediksi, dan peringatan dini akan terjadinya bencana (early warning). …[3]

Oleh karena itu maka diperlukan sistem informasi yang jelas, akurat dan siap pada saat diperlukan, apalagi pada sebuah instansi pemerintahan, kemudahan serta kecepatan dalam menghasilkan informasi yang berkualitas adalah hal yang sangat penting.

Untuk memperoleh informasi yang berkualitas dan hasil seperti yang diharapkan diatas, tentunya kita harus memiliki sistem informasi data yang baik. Maka diperlukan sistem informasi mitigasi bencana alam yang bertujuan untuk memberikan informasi status gunung berapi dan media publikasi informasi data dasar gunung api untuk sosialisasi dan distribusi dalam bentuk program aplikasi yang bisa dipakai oleh pengguna secara mudah melalui inputan-inputan tertentu.

Oleh karena itu diperlukannya penelitian pada Badan Peneletian Gunung, Bromo Tengger Semeru kota Malang, sehingga dapat dibuatnya system informasi status Gunung Berapi yang terdiri dari status Normal, Waspada, Siaga dan Awas.

2. LANDASAN TEORI

A. Klasifikasi

Klasifikasi adalah pemecahan suatu kelas tertentu ke dalam kelas-kelas bawahan berdasarkan ciri-ciri khas yang dimiliki oleh angota-anggota kelas itu. Klasifikasi merupakan suatu metode untuk menempatkan sejumlah hal dalam suatu sistem kelas, sehingga dapat dilihat hubungannya ke samping, ke atas dan ke bawah. Tujuan klasifikasi adalah untuk mengetahui keseluruhan logis dari suatu konsep dan bagian-bagiannya dengan lebih baik. Atau secara lebih sederhana adalah untuk memudahkan kita dalam berhubungan dengan hal yang kita cari. …[4]

Pada penelitian ini akan dilakukan klasifikasi ke dalam beberapa kelas status gunung berapi yang terdiri dari Normal, Waspada, Siaga, dan Awas. Status tersebut dapat diklasifikasikan setelah menginputkan data beberapa fitur yang terdiri dari 1 data kontinyu yakni Sismograf dan 7 data diskrit yakni Awan Panas, Suhu Meningkat, Gas Beracun, Lahar Letusan, Lava, Lontaran Batu Pijar, Lumpur Panas, dan Hujan Abu.

Dari beberapa hasil inputan data kontinyu dan diskrit tersebut maka status gunung tersebut sudah bisa diklasifikasikan pada salah satunya.

B. Tingkatan Status Gunung

Secara umum, status gunung berapi di Indonesia dibagi atas 4 status, yakni Normal, Waspada, Siaga dan Awas. …[2]

• Aktif Normal (Level I)

Kegiatan gunung api berdasarkan pengamatan dari hasil visual, kegempaan dan gejala vulkanik lainnya tidak memperlihatkan adanya kelainan

• Waspada (Level II)

Terjadi peningkatan kegiatan berupa kelainan yang tampak secara visual atau hasil pemeriksaan kawah, kegempaan dan gejala vulkanik lainnya

• Siaga (Level III)

Peningkatan semakin nyata hasil pengamatan visual/pemeriksaan kawah, kegempaan dan metoda lain saling mendukung. Berdasarkan analisis, perubahan kegiatan cenderung diikuti letusan.

• Awas (Level IV)

Menjelang letusan utama, letusan awal mulai terjadi berupa abu/asap. Berdasarkan analisis data pengamatan, segera akan diikuti letusan utama.

C. Naïve Bayes Clasisifier

Untuk mengatasi berbagai permasalahan diatas, berbagai varian dari pengklasifikasian yang menggunakan teorema bayes diajukan, salah satunya adalah Naïve Bayes, Naive Bayes Classifier adalah metode

(3)

pengklasifikasian paling sederhana dari model pengklasifikasian dengan peluang, dimana diasumsikan bahwa setiap atribut contoh (data sampel) bersifat saling lepas satu sama lain berdasarkan atribut kelas.

Naive bayes classifier juga dapat menangani atribut bertipe kontinyu. Salah satu caranya adalah menggunakan distribusi Gaussian. Distribusi ini dikarakterisasi dengan dua parameter yaitu mean (µ), dan variansi(σ2), untuk setiap kelas yj, peluang kelas bersyarat untuk atribut Xi dinyatakan pada persamaan. Fungsi densitas mengekspresikan probabilitas relatif. fungsi densitas probabilitasnya adalah :

… pers 1

D. Decision Tree

Decision Tree pada intinya adalah mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule). Decision tree adalah algoritma yang paling banyak digunakan untuk masalah klasifikasi.

Gambar 1. Algoritma Decision Tree Sebuah decision tree terdiri dari beberapa simpul yaitu tree’s roo, internal nod dan leafs. Konsep entropi digunakan untuk penentuan pada atribut mana sebuah pohon akan terbagi (split). Semakin tinggi entropy sebuah sampel, semakin tidak murni sampel tersebut. Rumus yang digunakan untuk menghitung entropy sampel S adalah :

Entropi(S) = -p1log2p1-p2log2p2-p3log2p3-p4log2p4

Pada persamaan 1, p1 adalah proporsi sampel atau grup yang akan berstatus normal, p2 adalah proporsi untuk status yang waspada, p3 adalah proporsi untuk status siaga, dan p4 adalah proporsi untuk status yang awas.

3. METODOLOGI PENELITIAN

A. Pengumpulan Data

Pengumpulan data dilakukan dengan cara mencari sumber datasheet dari badan informasi status gunung Bromo di Bromo Tengger Semeru, Malang serta informasi- informasi yang ada pada internet. Data-data yang muncul pada internet sebagian besar berasal dari jurnal-jurnal yang sudah teruji kebenerannya. Untuk tambahan data-data yang lain dengan melakukan pendekatan data dengan data-data yang sudah ada.

Kami menggunakan 199 data training dan 10, 20 serta 30 data uji yang nantinya digunakan untuk proses testing program baik dengan metode naive bayes atupun decision tree. Pada akhirnya akan dihitung prosentase akurasi dari masing-masing metode dan perbedaan akurasi antara kedua metode tersebut.

B. Fitur dan Jenis

Untuk mengelompokkan jenis status pada gunung merapi kita menggunakan cara pemilihan fitur – fitur dan jenis – jenis status gunung agar lebih mudah.

• Fitur yang digunakan pada penelitian ini ada Sembilan fitur, yaitu:

a) Sismograf b) Awan Panas c) Suhu Meningkat d) Gas Beracun e) Lahar Letusan f) Lava

g) Lontaran Batu Pijar h) Lumpur Panas i) Hujan Abu

• Keadaan tersebut akan dikelompokkan dalam empat kelas, yaitu:

a) Normal b) Waspada c) Siaga d) Awas

C. Analisis Data a. Naive Bayes

Secara umum metode Naive Bayes ini melakukan proses klasifikasi dengan prosedur sebagai berikut :

a. Menghitung nilai likehood masing- masing fitur, baik yang diskrit maupun kontinyu

(4)

b. Menghitung nilai prior masing-masing kelas.

c. Mengalikan nilai prior dan nilai likehood yang sudah dihitung pada langkah sebelumnya.

b. Decision Tree

Secara umum metode Decision Tree ini melakukan proses klasifikasi dengan prosedur sebagai berikut :

a. Memilih node awal tree

b. Mengubah bentuk data (tabel) menjadi model tree.

c. Mengubah model tree menjadi rule

4. PENGUJIAN DAN ANALISA

Data yang digunakan untuk melakukan uji coba ini diambil secara random dari sample dari tiap status gunung. Masing-masing status gunung ini memiliki sismograf, awan panas, suhu meningkat, gas beracun, lahar letusan, lava, lontaran batu pijar, lumpur panas, dan hujan abu yang berbeda.

Tabel 1. Datauji …[5]

Berikut ini merupakan langkah-langkah yang digunakan untuk mengklasifikasikan data tersebut di atas ke dalam kelas-kelas.

a. Naïve Bayes

Bayesian filter atau Naïve Bayes Clasifier merupakan metode terbaru yang digunakan unutk mengklasifikasian. Algoritma ini memanfaatkan metode probabilitas dan

statististik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi probabilitas dimasa depan berdasarkan pengalaman sebelumnya. … [1]

Dasar dari teorema Naïve Bayes yang digunakan dalam pemrograman adalah rumus Bayes berikut ini :

… pers 2

Peluang kejadian A sebagai B ditentukan dari peluang B saat A, Peluang A dan peluang B.

pada pengaplikasiannya nanti rumus ini berubah menjadi :

... pers 3

Naïve Bayes Clasifies atau biasa disebut sebagai multinominal naïve bayes merupakan model penyederhanaan dari algoritma bayes yang cocok dalam pengklasifian status gunung berapi.

Persamaannya adalah :

... pers 4

P(a1,a2,…. an) konstan, sehingga dapat dihilangakan menjadi

… pers 5

Karena P(a1,a1, ……. an | vj) sulit untuk dihitung, maka akan diasumsikan bahwa setiapfitur pada datasheet tidak mempunyai keterkaitan.

… pers 6

Keterangan :

P(vj) : probabilitas setiap kelas (prior) P(aj|vj) : probabilitas kemunculan kemungkinan a pada kelas v.

Pada Pengimplementasian nya kita akan menggunkan rumus :

... pers 7

(5)

Pada aplikasi ini tahapan dalam perhitungan Naïve Bayes Clasifier adalah :

1. Kita mencari nilai prior dari masing – masing kelas

2. Setelah itu kita mencari nilai posterior pada masing – masing nilai fitur yang di ingin kan terhadap masing – masing kelas nya.

3. Setelah prior dan posterior didapatkan maka smua nya dihitung berdasarkan rumus pada masing – masing kelasnya. Dimana data itu digolongkan dilihat dari nilai yang terbesar.

Contoh perhitungan :

Jika nilai sismograf 42,5, awan panas tidak, suhu meningkat iya, gas beracun tidak, lahar letusan iya, lava tidak, lontaran batu pijar tidak, hujan abu tidak maka status nya adalah Karena data sismograf adalah continue maka kita gunakan rumus

… pers 8

Dilihat dari hasil maka dia digolongkan kelas Siaga karena memiliki nilai terbesar

Dari salah satu data uji yang kedua yang kita coba sebanyak 20 data, pada percobaan sebnyak 17 data yang benar dan 3 data yang tidak sesuai hasilnya.

Setelah selesai melakukan proses perhitungan data beberapa sample uji di atas dengan metode naive bayes didapatkan akurasinya sebagai berikut :

Tabel 2. Akurasi Naive Bayes

Data Jumlah Data Akurasi (%)

Test1 10 100%

Test2 20 80%

Test3 30 76.5%

b. Decision Tree Langkah 1

Memilih node awal tree.

 Untuk menentukan node awal tree digunakan nilai entropi dari setiap

kriteria dengan data sample yang ditentukan sebelumnya.

 Node terpilih adalah kriteria dengan entropi paling kecil.

 Besarnya entropi pada ruang sample S didefinisikan dengan :

Entropi(S) = -p1log2p1-p2log2p2-p3log2p3-p4log2p4

Keterangan :

- S adalah ruang (data) sample yang digunakan untuk training.

- Pn adalah jumlah yang bersolusi positif (mendukung) pada data sample untuk kriteria tertentu.

- Pn adalah jumlah yang bersolusi negatif (tidak mendukung) pada data sample untuk kriteria tertentu.

Berikut salah satu contoh hasil perhitungan nilai entropi dari fitur tertentu. Disini, kami mengambil fitur dari awan panas. Berikut adalah hasil jumlah data dari setiap kelasnya.

Tabel 3. Hasil Jumlah Data Dari setiap Kelas

Dari hasil data tersebut, maka akan dihitung nilai entropi dari masing-masing kelas, yakni kelas normal, waspada, siaga dan awas.

Langkah menghitung entropi(S) tersebut dilakukan pada semua fitur dengan cara menjumlahkan jumlah kemunculan masing- masing kelas baik yang "ya" maupun "tidak".

Setelah dilakukan penghitungan nilai entropi setiap fitur maka kita ambil nilai entropi yang terkecil. Didapatkan hasil nilai entropi terkecil adalah fitur "lumpur panas". Berikut adalah tabel hasil nilainya dari entropi yang terkecil :

Tabel 4. Hasil Nilai Entropi

Node Nilai entropi

Lumpur Panas 0.662

Lontaran Batu Pijar 0.664

Hujan Abu 0.62

(6)

Lahar Letusan 0.703

Lava 0.705

Awan Panas 0.881

Gas Beracun 0.882

Suhu Meningkat 0.955

Hasil perhitungan nilai entropi dari fitur data diskrit diatas juga akan menentukan fitur data kontinyu, yaitu fitur "sismograf". Pada fitur data kontinyu ini digunakan rentang nilai terhadap masing-masing kelas, rentang nilainya sebagai berikut :

Tabel 5. Rentang Nilai Tiap – Tiap Kelas Status Rentang Nilai

Normal 0.5-7.5

4.75-8.5 8 8.25

8.5 9.5-10 9-9.25

Waspada 0.5-2.5

3-4.5 5 5.5 27-29 29.5-34.5

35-35.5 36 36.5

37

Siaga 25-47.5

30-52.5 50-52.5 55-65

Awas 37.5

37.5-47.5 42.5 47.5 37.5-47.5 52.5-57.5 52.5-72.5 82.5-87.5

77.5

Langkah 2

Mengubah bentuk data (tabel) menjadi model tree.

Setelah kita mendapatkan nilai entropi terkecil dari semua fitur, kita buat tree nya, dibawah ini adalah bentuk tree dari status kelas

ya

Tidak Tidak

ya Tidak

ya

Tidak

ya

Tidak ya

Tidak

ya

Tidak Suhu meningkat

ya

Sismograf 0.5-7.5 Tidak

normal Sismograf

8 Sismograf

9.5-10 Sismograf

9-9.25

Sismograf 4.75-8.5 Sismograf

8.5 Sismograf

8.25 Lumpur panas

Lontaran batu pijar Hujan abu

Lahar letusan lava

Awan panas Gas beracun

Suhu meningkat Lahar letusan

lava Awan panas

Gas beracun Suhu meningkat

normal

Tidak ya ya ya ya ya Tidak

Tidak Tidak

Tidak Tidak

Gas beracun Suhu meningkat

Tidak

Tidak

normal ya

ya

ya lava

Awan panas ya

Gas beracun Suhu meningkat

normal Hujan abu

Lahar letusan lava

Awan panas Tidak

Tidak Tidak

Gas beracun

normal

ya ya

ya

ya Hujan abu

ya ya

Lahar letusan lava Awan panas Gas beracun Gas beracun

Suhu meningkat

ya ya

Tidak Tidak

Tidak Tidak

Tidak

ya ya

ya ya ya

Tidak

Tidak

Tidak ya ya

Tidak

Tidak

normal Tidak Suhu meningkat

ya

ya

normal

Tidak

Gambar 2. Tree Kelas Normal Langkah 3

Mengubah model tree menjadi rule.

Setelah kita membuat tree dari masing-masing kelas kita harus menjadikannya "rule".

Berikut ini adalah salah satu contoh rule nya.

Dibawah ini merupakan salah satu rule dari masing-masing kelas.

Rule kelas ”normal”

If((awan_panas=='tidak')&&(suhu_mening kat=='tidak')&&(gas_beracun']=='tida k')&&(lahar_letusan)=='tidak')&&(lav a=='tidak')&&(lontaran_batu_pijar==' tidak')&&(lumpur_panas=='tidak')&&(h ujan_abu=='tidak')&&(sismograf>=0.5)

&&(sismograf']<=7.75)) then ”Normal”

Setelah selesai melakukan proses perhitungan data beberapa sample uji di atas dengan metode decision tree didapatkan akurasinya sebagai berikut :

Tabel 6. Akurasi Decision Tree

Data Jumlah Data Akurasi (%)

Test1 10 100%

Test2 20 85%

Test3 30 83.33%

(7)

5. KESIMPULAN

Dari program yang kita buat dan setelah kita uji menggunakan data uji menghasilkan bahwa data yang diuji menggunakan Decision Tree lebih akurat dibandingkan dengan menggunakan Naïve Bayes Clasifier. Karena pada metode Decision Tree penulusuran data nya dari satu fitur ke fitur yang lainnya sehingga hasilnya dan pengklasifikasiannya lebih akurat

6. DAFTAR PUSTAKA

Artikel Jurnal

[1] T. Nathan Mundhenk, “ A Tutorial on Simple Bayesian Inference and Classification Using Sampling”, University of Southern California

[2] Deddy Mulyadi. Peringatan Dini Bahaya Gunung Kelut, Jawa TImur. Bandung. 2006.

Publikasi Elektronik, informasi dari internet [3] http://id.wikipedia.org/wiki/Gunung_bera

pi

[4] http://ti.ukdw.ac.id/ojs/index.php/informa tika/article/download/60/12

[5] http://proxy.vsi.esdm.go.id/1- 1.php?id_deskripsi=205

Gambar

Tabel 1. Datauji …[5]
Tabel 2. Akurasi Naive Bayes
Tabel 5. Rentang Nilai Tiap – Tiap Kelas  Status  Rentang Nilai

Referensi

Dokumen terkait

kan saya seneng dik bisa ngeusahain ngasih ASI Eksklusif soalnya kan saya mau ngasih yang.. terbaik buat anak

Hasil dari penelitian adalah diperoleh hasil yang signifikan dimana variabel independen berpengaruh terhadap variabel dependen yaitu kualitas informasi (information

Penulis menyusun tugas akhir dengan judul “Analisis Karakteristik Marshall Pada Aspal Beton Campuran Panas dengan Bahan Tambah Asbuton Butir”, yang bertujuan untuk

Dua buah segitiga dikatakan kongruen jika dua pasang sisi yang bersesuaian sama

Melalui penelitian ini terbukti dua hal, pertama bahwa penerapan kebijakan moratorium TAPS tidak hanya berdampak positif terhadap menurunya pajanan iklan rokok ke

[r]

Dewi dan Ardiana (2014) menyatakan apabila manajemen juga sebagai pemegang saham, masalah keagenan akan semakin kecil karena dalam kondisi seperti ini manajer

Sehubungan dengan masalah yang dikemukakan sebelumnya, maka yang menjadi tujuan dari penelitian ini adalah untuk menganalisis bentuk pemarkah kohesi leksikal dan