Prosedur Pembentukan Cluster dengan Algoritma Self Organizing Map

A. Arsitektur dan Algoritma Pembelajaran Self Organizing Map

2. Prosedur Pembentukan Cluster dengan Algoritma Self Organizing Map

a. Deskripsi data

Berdasarkan penelitan yang dilakukan oleh Naryanto (2011), Dinata (2013) dan Insani (2016), penanggulangan bencana yang mencakup tiga tahap, yaitu pra bencana, saat bencana, dan pasca bencana akan berjalan secara efisien jika diketahui informasi terkait tentang faktor terjadinya bencana tanah longsor dan dampak dari peristiwa bencana tanah longsor di Indonesia. Informasi terkait denga faktor terjadinya bencana tanah longsor dan dampak dari peristiwa bencana tanah longsor dapat dijadikan pertimbangan untuk menentukan jenis penanggulangan pra bencana dan pasca bencana. Oleh karena itu, pada penelitian ini faktor terjadinya bencana tanah longsor dan dampak dari peristiwa bencana tanah longsor akan digunakan sebagai variabel dengan 33 provinsi di Indonesia yang digunakan sebagai sampel. Hal ini disebabkan karena pengambilan data pada provinsi di Indonesia yang hanya mengambil pada tahun-tahun tertentu dengan yang didasarkan pada kelengkapan data dari sumber data. Variabel ditentukan dari hasil penelitian terdahulu terkait bencana tanah longsor dan berita acara yang dirilis oleh BNPB. Adapun variabel yang digunakan adalah :

Tabel 3.1 Variabel Input dan Satuan yang Digunakan

Kode Variabel Satuan Keterangan

Persentase keluarga yang tidak memiliki kendaraan bermotor

Persen (%) Kendaraan bermotor yang dihitung mencakup mobil dan motor. Data diambil pada tahun 2014 Persentase keluarga yang

memiliki kendaraan bermotor

Persen (%) Kendaraan bermotor yang dihitung mencakup mobil dan motor. Data diambil pada tahun 2014

Kode Variabel Satuan Keterangan

Lokasi kemiringan lahan curam

Unit Lahan curam adalah lahan dengan kemiringan lebih dari 25 derajat yang diambil pada tahun 2011.

Lokasi kemiringan lahan landai

Unit Lokasi yang masuk dalam kategori ini memiliki kemiringan kurang dari 15 derajat. Data diambil pada tahun 2011.

Lokasi kemiringan lahan sedang

Unit Lokasi yang masuk dalam kategori ini memiliki kemiringan antara 15 sampai 25 derajat. Data diambil pada tahun 2011.

Persentase keluarga yang memilah sampah dan sebagian dimanfaatkan

Persen (%) Jenis sampah yang dihitung adalah sampah organic maupun non organik. Keluarga yang masuk dalam kategori ini adalah keluarga yang secara rutin memilah dan memanfaatkan sampah. Data diambil pada tahun 2014

Persentase keluarga yang memilah sampah kemudian dibuang

Persen (%) Jenis sampah yang dihitung adalah sampah organic maupun non organik. Keluarga yang masuk dalam kategori ini adalah keluarga yang secara rutin memilah sampah. Data diambil pada tahun 2014.

Persentase keluarga yang tidak memilah sampah

Persen (%) Jenis sampah yang dihitung adalah sampah organik maupun non organik. Data diambil pada tahun 2014

Kode Variabel Satuan Keterangan

Frekuensi terjadinya gempa bumi

Jumlah Kejadian

Kejadian gempa bumi dihitung seluruhnya, baik tektonik maupun vulkanik.

Frekuensi jumlah hujan mm Frekuensi yang dihitung adalah kerapatan curah

hujan yang dihiung dengan satuan mm

Frekuensi jumlah hari hujan Jumlah Hari Jumlah hari hujan yang dihitung adalah jumlah

hari dimana hujan turun dengan mengabaikan volume curah hujan

Frekuensi terjadi kebakaran

hutan dan lahan

Jumlah kejadian

Jumlah kejadian kebakaran hutan dan lahan yang dihitung adalah kejadian bencana kebakaran yang terjadi karena fenomena alam ataupun karena kesalahan manusia dengan mengabaikan besar dampak yang ditimbulkan.

Jumlah luas lahan sangat kritis Hektar (Ha) Lahan yang masuk dalam kategori sangat kritis

adlah lahan yang sama sekali tidak dapat dikelola, bersifat gundul dan tingkat kesuburan sangat rendah

Jumlah luas lahan kritis Hektar (Ha) Lahan yang masuk dalam kategori lahan kritis

adalah lahan yang tidak produktif mski telah dikelola, bersifat gundul dan tingkat kesuburan rendah.

Kode Variabel Satuan Keterangan

Persentase keluarga dengan

kepemilikian sumur resapan air

Persen (%) Sumur resapan air yang dihitung adalah sumur resapan air yang berada di tanah warga dengan mengabaikan jumlah sumur resapan. Data Diambil pada tahun 2014.

Persentase keluarga dengan

kepemilikian lubang resapan biopori

Persen (%) Lubang resapan biopori yang dihitung adalah lubang resapan yang berada di tanah warga dengan mengabaikan luas area lubang resapan air. Data Diambil pada tahun 2014

Persentase keluarga dengan

kepemilikan taman/ tanah berumput

Persen (%) Taman/ tanah berumput yang dihitung adalah Taman/ tanah berumput yang berada di tanah warga dengan mengabaikan luas taman/ tanah berumput. Data Diambil pada tahun 2014

Frekuensi terjadinya bencana

tanah longsor

Jumlah kejadian

Jumlah kejadian dihitung baik keseluruhan, baik yang menimbulkan korban dan kerusakan maupun yang tidak

Jumlah korban meninggal Jiwa Korban meninggal yang dihitung adalah yang

terkena dampak bencana, tidak termasuk relawan.

Jumlah korban hilang Jiwa Korban hilang dihitung adalah korban yang tidak

Kode Variabel Satuan Keterangan

Jumlah korban terluka Jiwa Korban terluka yang dihitung yaitu semua

korban luka dampak bencana, baik ringan maupun berat, dan tidak termasuk relawan.

Jumlah korban menderita Jiwa Korban menderita yang dihitung adalah yang

menderita secara finansial dan psikologis.

Jumlah korban mengungsi Jiwa Korban mengungsi yang dihitung adalah korban

bencana yang meninggalkan lokasi bencana pada waktu pasca bencana.

Jumlah rumah rusak berat Unit Rumah rusak berat adalah rumah yang

ditemukan kerusakan pada sebagian besar komponen bangunan, baik stuktural maupun non-struktural, seperti dinding rubuh, lantai retak merekah, dan lain sebagainya.

Jumlah rumah rusak sedang Unit Rumah rusak sedang adalah rumah ditemukan

kerusakan pada sebagian komponen non struktural atau komponen struktural seperti, struktur atap, struktur lantai dan lain sebagainya.

Jumlah rumah rusak ringan Unit Rumah rusak ringan adalah rumah yang

ditemukan kerusakan terutama pada komponen non-struktural, seperti penutup atap, langit- langit, penutup lantai, dan dinding pengisi.

Kode Variabel Satuan Keterangan

Jumlah fasilitas peribadatan

yang rusak

Unit Fasilitas peribadatan mencakup masjid, gereja, vihara dan fasilitas peribadatan lainnya

Jumlah fasilitas pendidikan

yang rusak

Unit Fasilitas pendidikan meliputi sekolah, kampus, perpustakaan, dan fasilita pendidikan lainnya

Jumlah fasilitas kesehatan

yang rusak

Unit Fasilitas kesehatan meliputi rumah sakit, puskesmas, apotik dan fasilitas kesehatan lainnya.

Panjang jalan yang terkena

dampak bencana

KM Panjang jalan yang dihitung adalah yang terkena dampak longsoran, dan yang terkena dampak tidak langsung (timbulnya retakan karena bencana). Adapun jalan yang diukur adalah jalan utama, seperti jalan penghubung antar desa.

b. Normalisasi Data

Sebelum dilakukan proses pembelajaran (training), data input harus dinormalisasi terlebih dahulu. Normalisasi adalah penskalaan terhadap nilai-nilai input sedemikian sehingga data-data input masuk dalam suatu range tertentu. Pada pembelajaran algoritma Self Organizing Map proses normalisasi perlu dilakukan agar rentang nilai pada masing-masing variabel tidak terpaut jauh.

Proses normalisasi dapat dilakukan dengan metode Min-Max Normalization

dengan range nilai minimum dan nilai maksimum dari atribut tersebut ke range nilai yang baru, dilakukan perhitungan sebagai berikut

dengan :

: nilai yang baru setelah dinormalisasi : nilai yang lama sebelum dinormalisasi

: nilai maksimum dari variabel

: nilai minimum dari variabel

: nilai maksimum yang baru pada variabel

: nilai minimum yang baru pada variabel Berikut akan digunakan persamaan 3.2 dengan memanfaatkan variabel persentase keluarga yang tidak memiliki kendaraan bermotor di Indonesia ( ). Berikut adalah data persentase keluarga yang tidak memiliki kendaraan bermotor:

Tabel 3.2 Persentase Keluarga yang tidak memiliki kendaraan bermotor

Provinsi Persentase Provinsi Persentase

Aceh 24.63 Nusa Tenggara Barat 45.87

Sumatera Utara 26.61 Nusa Tenggara Timur 67.29 Sumatera Barat 23.81 Kalimantan Barat 20.95

Riau 12.07 Kalimantan Tengah 17.22

Provinsi Persentase Provinsi Persentase

Jambi 16.06 Kalimantan Selatan 16.29

Sumatera Selatan 19.92 Kalimantan Timur 8.68

Bengkulu 18.94 Sulawesi Utara 49.42

Lampung 18.90 Sulawesi Tengah 30.02

Kep, Bangka Belitung 9.51 Sulawesi Selatan 29.56 Kepulauan Riau 9.53 Sulawesi Tenggara 33.10

DKI Jakarta 18.75 Gorontalo 45.43

Jawa Barat 36.08 Sulawesi Barat 38.37

Jawa Tengah 26.85 Maluku 58.08

DI Yogyakarta 18.54 Maluku Utara 49.19

Jawa Timur 23.20 Papua Barat 44.54

Banten 24.09 Papua 71.39

Bali 13.69

Dari tabel 3.2 diperoleh persentase keluarga yang tidak memiliki kendaraan bermotor dengan nilai minimum 8.68 persen dan nilai maksimum 71.39 persen. Dengan menggunakan persamaan 3.2 data akan dinormalkan dengan nilai maksimum 1 dan nilai minimum 0. Maka untuk normalisasi data variabel pada Provinsi Aceh adalah sebagai berikut :

Sehingga diperoleh bahwa hasil normalisasi data variabel pada Provinsi Aceh adalah 0.23453. Hasil selanjutnya untuk normalisasi data pada variabel

adalah sebagai berikut

Tabel 3.3 Hasil Normalisasi Data Variabel

Provinsi Persentase Provinsi Persentase

Aceh 0.254345 Nusa Tenggara Barat 0.593047 Sumatera Utara 0.285919 Nusa Tenggara Timur 0.93462 Sumatera Barat 0.241269 Kalimantan Barat 0.195663

Riau 0.054058 Kalimantan Tengah 0.136182

Jambi 0.117685 Kalimantan Selatan 0.121352 Sumatera Selatan 0.179238 Kalimantan Timur 0

Bengkulu 0.16361 Sulawesi Utara 0.649657

Lampung 0.162972 Sulawesi Tengah 0.340297

Kep, Bangka Belitung 0.013236 Sulawesi Selatan 0.332961 Kepulauan Riau 0.013554 Sulawesi Tenggara 0.389412

DKI Jakarta 0.16058 Gorontalo 0.586031

Jawa Barat 0.436932 Sulawesi Barat 0.473449

Jawa Tengah 0.289746 Maluku 0.787753

DI Yogyakarta 0.157232 Maluku Utara 0.645989

Jawa Timur 0.231542 Papua Barat 0.571839

Banten 0.245734 Papua 1

Penentuan nilai maksimum dan minimum yang baru untuk variabel akan disamakan pada rentang 0 sampai dengan 1. Hasil selanjutnya untuk normalisasi seluruh variabel data input akan ditampilkan pada lampiran 2.

c. Pembentukan Cluster

Pembentukan cluser terbaik meliputi penentuan jumlah neuron output yang akan digunakan dalam mengklasifikasikan data input. Penentuan jumlah neuron ini menjadi penting karena pada output, data akan diklasifikasi menjadi cluster- cluster yang jumlahnya sama dengan jumlah neuron input. Tidak ada aturan pasti dalam menentukan jumlah neuron, maka dari itu penentuan jumlah neuron dilakukan dengan cara mengelompokkan data dengan pembentukan kelompok yang mungkin dilakukan pada data input.

Setelah menentukan banyak neuron, melakukan pelatihan (training) pada jaringan yang telah dibangun dan dikonfigurasikan dengan data input. Hal ini dilakukan agar bobot awal yang sebelumnya ditentukan secara random (acak) akan diupdate bobotnya dengan dilakukan pelatihan (training) pada jaringan. Pelatihan jaringan pada algoritma Self Organizing Map akan berhenti apabila telah mencapai iterasi maksimum. Pada skripsi ini, iterasi maksimum ditentukan sebanyak 1000 iterasi untuk seluruh model yang akan dibentuk. Untuk pelatihan jaringan dengan 1000 iterasi pada software Matlab digunakan sintaks

net.trainparam.epochs=1000; net=train(net,data)

Setelah pelatihan jaringan telah mencapai iterasi maksimum, maka dapat dimunculkan nilai dari bobot akhir. Kemudian langkah selanjutnya adalah menentukan jarak antara salah satu data input ke masing-masing neuron yang telah ditentukan. Masing-masing input dihitung jaraknya dengan neuron dengan menggunakan persamaan eucledian distance. Setelah diperoleh jarak antara input dengan masing-masing neuron, kemudian jarak antara data input dengan salah satu neuron dibandingkan dengan jarak antara data input dengan neuron lainnya yang masih dalam satu pelatihan (training). Pemilihan cluster terbaik dilakukan dengan menentukan nilai Davies Bouldin Index dari masing masing model, kemudian dibandingkan dengan nilai Davies Bouldin Index dari model yang lainnya.

Dalam rangka penentuan jarak, diperlukan bobot akhir yang telah memenuhi

treshold pelatihan (training). Pada Matlab2011b, digunakan sintaks net.WI{1,1} untuk memunculkan bobot akhir. Dalam penelitian ini, akan dijelaskan lebih lanjut mengenai penentuan jarak dan penentuan nilai Davies Bouldin Index. Indeks ini menjadi penting nantinya karena meskipun tidak ada aturan dalam menentukan jumlah cluster, akan tetapi dengan menggunakan indeks ini maka akan ditentukan satu model pembentukan cluster terbaik dari proses algoritma Self Organizing Map.

Pada algoritma Self Organizing Map, pembentukan cluster didasarkan pada pengukuran jarak dari data input menuju neuron yang ditentukan untuk meminimumkan jarak. Pengukuran jarak dilakukan pada seluruh data input

pembentukan cluster. Berikut ini akan digunakan persamaan 2.3 dengan memanfaatkan hasil normalisasi data pada lampiran 2. Berikut adalah data hasil normalisasi untuk Provinsi Aceh (lampiran 2)

Tabel 3.4 Data Hasil Normalisasi untuk Provinsi Aceh

Variabel Data Normalisasi Variabel Data Normalisasi

0.254345 0.09894 0.805546 0.787703 0.693285 0.045842 0.545854 0.02904 0.279379 0.050633 0.294657 0.027397 0.295789 0.057674 0.618305 0.375738 0.709677 0.021185 0.24564 0.024096 0.027742 0.028302 0.146739 0 0.106234 0 0.17012 0 0.073973 0.028395

Kemudian berikut adalah bobot akhir untuk model 2 cluster yang diperoleh dengan menggunakan sintaks net.IW{1,1} pada Matlab R2011b (lampiran 3):

Tabel 3.5 Bobot Akhir untuk Model 2 Cluster

Variabel Neuron 1 Neuron 2 Variabel Neuron 1 Neuron 2

0.348914 0.363339 0.175183 0.393993 0.665662 0.702639 0.56635 0.342393 0.119897 0.713447 0.02488 0.943117 0.198274 0.988293 0.040307 0.854798 0.169282 0.845898 0.030185 0.968354 0.234277 0.50054 0.043783 0.89863 0.38042 0.361492 0.029688 0.588159 0.595059 0.402784 0.021627 0.8103 0.187345 0.516129 0.019995 0.979767 0.399001 0.457728 0.008526 0.954217 0.511798 0.54908 0.017537 0.746855 0.081313 0.057065 0.016983 0.62987 0.150604 0.03468 0.037475 0.858974 0.179882 0.064477 0.038462 0.555556 0.126712 0.14589 0.059165 0.165092

Berdasarkan data hasil normalisasi dan bobot akhir dari data input Provinsi Aceh, maka dapat ditentukan jarak antara neuron 1 dan neuron 2 dengan data

input Provinsi Aceh. Dengan menggunakan Eulcedian Distance maka dapat ditentukan jarak inter-cluster data pada Provinsi Aceh ke masing-masing cluster.

Berdasarkan hasil perhitungan diatas, dapat ditentukan bahwa jarak data input

Provinsi Aceh dengan neuron 1 adalah 1.22873 dan 8.355261987 menuju neuron 2. Hasil selanjutnya untuk pengukuran jarak inter-cluster dengan model 2 cluster

pada data Provinsi di Indonesia ditampilkan pada tabel 3.6

Tabel 3.6 Hasil Penentuan jarak inter-cluster untuk model 2 Cluster

Provinsi Jarak inter-cluster Provinsi Jarak inter-cluster

Neuron 1 Neuron2 Neuron 1 Neuron2

Aceh 1.228073 8.622531106 Nusa Tenggara Barat 1.006555 10.4494678 Sumatera Utara 1.059239 7.980898251 Nusa Tenggara Timur 2.564208 9.88624854 Sumatera Barat 1.861766 8.903682686 Kalimantan Barat 0.979144 11.3273205 Riau 0.646923 11.04041274 Kalimantan Tengah 1.889993 12.6025547 Jambi 0.878249 10.47028513 Kalimantan Selatan 0.463075 10.6796804 Sumatera Selatan 1.155025 10.92125456 Kalimantan Timur 1.342332 11.2183817

Bengkulu 1.519668 11.3323463 Sulawesi Utara 1.12292 10.1252997 Lampung 0.535926 9.861366374 Sulawesi Tengah 0.584682 10.2615239 Kep, Bangka

Belitung 0.633345 11.54353969 Sulawesi Selatan 1.315625 8.18669635 Kepulauan Riau 0.617065 11.27028711 Sulawesi Tenggara 1.295533 10.8805594

DKI Jakarta 1.695931 11.79594585 Gorontalo 0.645623 11.3853839 Jawa Barat 12.96255 1.074597879 Sulawesi Barat 0.395872 10.8227673 Jawa Tengah 8.149487 1.091968726 Maluku 0.821558 10.5994132 DI Yogyakarta 2.49624 11.45160779 Maluku Utara 0.877804 11.0061983 Jawa Timur 3.352092 5.696632716 Papua Barat 0.980984 11.3638504 Banten 0.938294 10.11591651 Papua 1.556857 9.86020501

51 dengan bentuk topologi bobot sebagai berikut

Gambar 3. 4. Topologi Bobot Model 2 cluster

Berdasarkan gambar 3.4, dapat terlihat bahwa neuron dan data input provinsi di Indonesia di representasikan ke dalam dua dimensi. Pada gambar 3.4, neuron ditampilkan dalam bentuk dot berwarna biru, sedangkan untuk data input provinsi di Indonesia ditampilkan dalam bentuk dot berwarna hijau. Adapun bobot penghubung antar neuron ditampilkan dalam bentuk garis berwarna merah.

Berdasarkan tabel 3.6 diketahui jarak inter-cluster untuk masing masing neuron pada model pembentukan cluster dengan 2 cluster. Karena tujuan pembentukan cluster sendiri adalah untuk mengelompokkan unit-unit yang hampir sama pada suatu daerah tertentu dan memaksimumkan perbedaan antar cluster yang dibentuk. Sehingga unit-unit input akan dikelompokkan ke neuron yang paling dekat dengan unit input.

Tabel 3.7 Hasil Pembentukan Model 2 Cluster

Provinsi Eucledian

distance Cluster Provinsi

Eucledian

distance Cluster

Aceh 1.228073 1 Nusa Tenggara Barat 1.006555 1

Sumatera Utara 1.059239 1 Nusa Tenggara

Provinsi Eucledian

distance Cluster Provinsi

Eucledian

distance Cluster

Sumatera Barat 1.861766 1 Kalimantan Barat 0.979144 1

Riau 0.646923 1 Kalimantan Tengah 1.889993 1

Jambi 0.878249 1 Kalimantan Selatan 0.463075 1

Sumatera Selatan 1.155025 1 Kalimantan Timur 1.342332 1

Bengkulu 1.519668 1 Sulawesi Utara 1.12292 1

Lampung 0.535926 1 Sulawesi Tengah 0.584682 1

Kep, Bangka

Belitung 0.633345 1 Sulawesi Selatan 1.315625 1

Kepulauan Riau 0.617065 1 Sulawesi Tenggara 1.295533 1

DKI Jakarta 1.695931 1 Gorontalo 0.645623 1

Jawa Barat 1.074597879 2 Sulawesi Barat 0.395872 1

Jawa Tengah 1.091968726 2 Maluku 0.821558 1

DI Yogyakarta 2.49624 1 Maluku Utara 0.877804 1

Jawa Timur 3.352092 1 Papua Barat 0.980984 1

Banten 0.938294 1 Papua 1.556857 1

Bali 0.911133 1

Tabel 3.7 menunjukkan model pembentukan cluster dengan 2 cluster. Pada

cluster 1, terdapat 31 anggota dan untuk cluster 2 terdapat 2 anggota. Hasil selanjutnya untuk model pembentukan cluster ditampilkan pada lampiran 4.

B. Penerapan Metode Davies Bouldin Index (DBI) dalam Menentukan

Dalam dokumen PENERAPAN ALGORITMA SELF ORGANIZING MAP DALAM MEMETAKAN DAERAH RAWAN BENCANA TANAH LONGSOR DI INDONESIA. (Halaman 37-52)