METODE PENELITIAN - Application of Spatial Decision Tree in Identifiying Mangrove Area Using C4

Penelitian ini dilaksanakan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 4.

Gambar 4 Tahapan penelitian. Pengadaan Data

Data yang akan digunakan pada penelitian ini adalah data spasial wilayah pesisir di provinsi Kalimantan Timur, yaitu Kabupaten Kutai Timur dan Kota Tarakan. Data yang akan digunakan diperoleh dari Ditjen Kelautan Pesisir dan Pulau-pulau Kecil Departemen

4 3 Jika daftar atribut kosong, Maka jadikan

node N sebagai leaf node dengan label = nilai kelas yang terbanyak pada sampel; 4 Pilih atribut uji, atribut dalam daftar yang

memiliki information gain tertinggi; 5 Beri label node N dengan atribut uji; 6 Untuk setiap nilai ai dalam atribut uji yang

diketahui,

7 Tambahkan cabang di bawah node N untuk atribut uji = ai;

8 Tentukan si sebagai subset dari sampel

dimana atribut uji = ai;

9 Jika sampel si kosong,

10 Tambahkan leaf node dengan label = nilai kelas yang terbanyak pada sampel;

11 Selainnya, tambah cabang baru di bawah cabang yang sekarang dengan memanggil fungsi ID3 (si,daftar

atribut-atribut uji); Algoritme C4.5 (Quinlan 1993)

1 Bangun pohon keputusan dari data latih. (ID3 konvensional).

2 Ubah pohon ke dalam bentuk aturan-aturan. Jumlah aturan sama dengan jumlah kemungkinan path dari akar ke daun.

3 Pangkas setiap aturan dengan

menghilangkan precondition sehingga meningkatkan nilai akurasi.

4 Urutkan aturan yang dipangkas berdasar nilai akurasinya, dan gunakan aturan-aturan tersebut pada data uji.

2.8 Confusion Matrix

Evaluasi dari kinerja model didasarkan pada banyaknya (count) dari test record secara benar dan secara tidak benar oleh model klasifikasi.

Count ini ditabulasikan ke dalam matrik yang diilustrasikan pada Tabel 1 (Tan et al. 2006). Tabel 1 Confusion matrix

Kelas hasil prediksi Kelas = 1 Kelas = 0 Kelas

aktual

Kelas=1 f11 f10

Kelas = 0 f01 f00

Setiap entri fijdi dalam tabel menyatakan

banyaknya record dari kelas i yang diprediksi menjadi kelas j. Berdasar entri-entri yang terdapat pada confusion matrix, total banyaknya prediksi yang benar oleh model adalah (f11 + f00) dan total banyaknya prediksi yang salah oleh model adalah (f10 + f01), sehingga akurasi didapatkan dengan cara (Tan et al. 2006) :

Akurasi = banyaknya total prediksi yang benar total banyaknya prediksi

METODE PENELITIAN

Penelitian ini dilaksanakan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 4.

Gambar 4 Tahapan penelitian. Pengadaan Data

5 Perikanan dan Kelautan (KP3K DKP) dan dari

mahasiswa jenjang S3 yang sedang melakukan penelitian di provinsi Kalimantan Timur. Data yang diperoleh dari KP3K DKP adalah tahun 2006 dan data yang diperoleh dari mahasiswa penelitian adalah data tahun 2008.

Seleksi Data

Pada tahap ini, memilih data pada sumber data yang akan dijadikan atribut pada dataset. Praproses Data

Beberapa tahapan yang dilakukan pada tahap praproses secara rinci terdapat pada Lampiran 1 dan diilustrasikan pada Gambar 5. Proses ini dilakukan oleh semua objek spasial yang terkait. Pada Gambar 5, objek spasial yang dijadikan contoh adalah landuse.

1 Perhitungan luas area

Pada tahap ini dilakukan perhitungan luas area objek kelurahan untuk hubungan spasial dengan objek lain dan untuk membentuk kelas target.

2 Penentuan hubungan spasial

Pada tahap ini, ditentukan hubungan spasial antara dua objek spasial, yaitu menggunakan hubungan topological. Operasi yang digunakan adalah operasi intersection

menggunakan perangkat lunak Arcview, sehingga didapatkan luas area yang berpotongan diantara dua objek tersebut. Hasil dari tahap ini adalah tabel spatial join index dalam format xls yang berisi ID_kel, ID_objeklain, hubungan_spasial, dan luas area.

3 Penyerdehanaan tabel SJI (Spatial Join Index)

Pada tahap ini, hasil dari tabel spatial join index diurutkan berdasar wilayah, hubungan

topological, dan jenis atributnya. Kemudian dihitung total luas area masing-masing wilayah berdasar hubungan topological dan jenis atribut. Luas area selanjutnya dinyatakan dalam persentase terhadap luas wilayah kelurahan. Setelah itu, dilakukan penggunaan operator complete dengan

fungsi agregasi MAX untuk

menyederhanakan tabel spasial join index,

yaitu dengan mengambil nilai terbesar persentase luas area pada setiap jenis atribut. Hasil dari tahap ini adalah tabel SJI yang telah sederhana dalam format xls, berisi ID_kel, jenis, dan luas area.

Gambar 5 Tahapan praproses. 4 Penentuan kategori

Pada tahap ini, dilakukan pengkategorian jenis atribut pada tabel SJI yang telah sederhana berdasar luas area. Proses ini dilakukan menggunakan teknik clustering, yaitu K-means dengan mengelompokkan data ke dalam 3 cluster.

5 Pemberian label kategori

Pada tahap ini, dilakukan pemberian label kategori pada tabel SJI yang telah sederhana sebagai identitas dari atribut jenis dan atribut luas area yang digabungkan berdasar hasil clustering luas area.

6 Penentuan kelas target

Pada tahap ini, dilakukan beberapa proses yang diilustrasikan pada Gambar 6. Objek spasial yang diproses adalah kelurahan dan mangrove.

6 Gambar 6 Penentuan kelas target.

 Clustering luas area

Pada tahap ini, dilakukan proses clustering

luas area mangrove (dalam %) terhadap kelurahan menggunakan teknik clustering, yaitu K-means. Nilai ini dikelompokkan ke dalam 3 cluster (sedikit, sedang, banyak). Luas area yang bernilai 0 tidak dimasukkan ke dalam proses clustering dan dianggap masuk ke dalam label kelas tidak, sehingga diperoleh empat label kelas yaitu ‘tidak’, ‘sedikit’, ‘sedang’, dan ‘banyak’.

 Pemberian label kelas

Pada tahap ini, dilakukan penambahan atribut kelas pada objek kelurahan. Atribut kelas ini berisi kategori tidak, sedikit, sedang, dan banyak berdasar hasil clustering

rasio.

7 Penggabungan tabel SJI

Pada tahap ini, dilakukan penggabungan tabel SJI objek lain dengan tabel kelurahan yang telah memiliki atribut kelas.

8 Transformasi data

Pada tahap ini, dilakukan perubahan tabel format xls menjadi format arff agar dapat diproses ke tahap selanjutnya yaitu proses klasifikasi menggunakan perangkat lunak Weka 3.6.0.

Penentuan Data Latih dan Data Uji

Pada tahap ini, dilakukan pemisahan data uji dan data latih menggunakan 10-fold cross validation untuk mengevaluasi classifier. Klasifikasi Menggunakan Spatial Decision Tree

Data hasil praproses diolah menggunakan

perangkat lunak Weka 3.6.0 dengan

menggunakan Algoritme C4.5. Implementasi dari algoritme C4.5 dalam Weka 3.6.0 adalah J48.

Akurasi Classifier

Akurasi dari model pohon yang dihasilkan dihitung menggunakan confusion matrix, yaitu menghitung banyaknya label kelas yang diprediksi benar dibagi total banyaknya prediksi. Jika hasilnya melebihi threshold, yaitu sebesar 60% maka akan diproses ke tahap berikutnya, apabila kurang dari threshold maka akan kembali diproses pada tahap praproses atau tahap penentuan dataset.

Penggunaan Classifier pada Data Baru Classifier yang terbentuk dapat diterapkan pada data baru, dimana data tersebut belum memiliki label kelas. Label kelas didapatkan dengan menelusuri model pohon yang terbentuk atau aturan yang telah diturunkan dari model pohon yang dihasilkan pada data latih.

Pengembangan Sistem

Perangkat lunak dan perangkat keras yang digunakan dalam mengembangkan sistem adalah sebagai berikut :

 Perangkat Lunak :

1 Arcview 3.3 untuk pemrosesan data spasial.

2 Matlab 7.0 untuk proses clustering.

3 Microsoft Excel 2007 untuk melakukan proses operator complete

4 Weka 3.6.0 untuk proses klasifikasi.

 Perangkat keras

1 Processor Intel(R) Pentium(R) 4 CPU 3.06GHz

2 Memory 1280 MB RAM 3 Mouse

4 Keyboard

HASIL DAN PEMBAHASAN

Dalam dokumen Application of Spatial Decision Tree in Identifiying Mangrove Area Using C4.5 Algorithm. (Halaman 66-69)