Penelitian ini dilaksanakan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 4.
ka
n
Gambar 4 Tahapan penelitian. Pengadaan Data
Data yang akan digunakan pada penelitian ini adalah data spasial wilayah pesisir di provinsi Kalimantan Timur, yaitu Kabupaten Kutai Timur dan Kota Tarakan. Data yang akan digunakan diperoleh dari Ditjen Kelautan Pesisir dan Pulau-pulau Kecil Departemen
4 3 Jika daftar atribut kosong, Maka jadikan
node N sebagai leaf node dengan label = nilai kelas yang terbanyak pada sampel; 4 Pilih atribut uji, atribut dalam daftar yang
memiliki information gain tertinggi; 5 Beri label node N dengan atribut uji; 6 Untuk setiap nilai ai dalam atribut uji yang
diketahui,
7 Tambahkan cabang di bawah node N untuk atribut uji = ai;
8 Tentukan si sebagai subset dari sampel
dimana atribut uji = ai;
9 Jika sampel si kosong,
10 Tambahkan leaf node dengan label = nilai kelas yang terbanyak pada sampel;
11 Selainnya, tambah cabang baru di bawah cabang yang sekarang dengan memanggil fungsi ID3 (si,daftar
atribut-atribut uji); Algoritme C4.5 (Quinlan 1993)
1 Bangun pohon keputusan dari data latih. (ID3 konvensional).
2 Ubah pohon ke dalam bentuk aturan-aturan. Jumlah aturan sama dengan jumlah kemungkinan path dari akar ke daun.
3 Pangkas setiap aturan dengan
menghilangkan precondition sehingga meningkatkan nilai akurasi.
4 Urutkan aturan yang dipangkas berdasar nilai akurasinya, dan gunakan aturan-aturan tersebut pada data uji.
2.8 Confusion Matrix
Evaluasi dari kinerja model didasarkan pada banyaknya (count) dari test record secara benar dan secara tidak benar oleh model klasifikasi.
Count ini ditabulasikan ke dalam matrik yang diilustrasikan pada Tabel 1 (Tan et al. 2006). Tabel 1 Confusion matrix
Kelas hasil prediksi Kelas = 1 Kelas = 0 Kelas
aktual
Kelas=1 f11 f10
Kelas = 0 f01 f00
Setiap entri fijdi dalam tabel menyatakan
banyaknya record dari kelas i yang diprediksi menjadi kelas j. Berdasar entri-entri yang terdapat pada confusion matrix, total banyaknya prediksi yang benar oleh model adalah (f11 + f00) dan total banyaknya prediksi yang salah oleh model adalah (f10 + f01), sehingga akurasi didapatkan dengan cara (Tan et al. 2006) :
Akurasi = banyaknya total prediksi yang benar total banyaknya prediksi
METODE PENELITIAN
Penelitian ini dilaksanakan dalam beberapa tahap seperti yang diilustrasikan pada Gambar 4.
ka
n
Gambar 4 Tahapan penelitian. Pengadaan Data
Data yang akan digunakan pada penelitian ini adalah data spasial wilayah pesisir di provinsi Kalimantan Timur, yaitu Kabupaten Kutai Timur dan Kota Tarakan. Data yang akan digunakan diperoleh dari Ditjen Kelautan Pesisir dan Pulau-pulau Kecil Departemen
5 Perikanan dan Kelautan (KP3K DKP) dan dari
mahasiswa jenjang S3 yang sedang melakukan penelitian di provinsi Kalimantan Timur. Data yang diperoleh dari KP3K DKP adalah tahun 2006 dan data yang diperoleh dari mahasiswa penelitian adalah data tahun 2008.
Seleksi Data
Pada tahap ini, memilih data pada sumber data yang akan dijadikan atribut pada dataset. Praproses Data
Beberapa tahapan yang dilakukan pada tahap praproses secara rinci terdapat pada Lampiran 1 dan diilustrasikan pada Gambar 5. Proses ini dilakukan oleh semua objek spasial yang terkait. Pada Gambar 5, objek spasial yang dijadikan contoh adalah landuse.
1 Perhitungan luas area
Pada tahap ini dilakukan perhitungan luas area objek kelurahan untuk hubungan spasial dengan objek lain dan untuk membentuk kelas target.
2 Penentuan hubungan spasial
Pada tahap ini, ditentukan hubungan spasial antara dua objek spasial, yaitu menggunakan hubungan topological. Operasi yang digunakan adalah operasi intersection
menggunakan perangkat lunak Arcview, sehingga didapatkan luas area yang berpotongan diantara dua objek tersebut. Hasil dari tahap ini adalah tabel spatial join index dalam format xls yang berisi ID_kel, ID_objeklain, hubungan_spasial, dan luas area.
3 Penyerdehanaan tabel SJI (Spatial Join Index)
Pada tahap ini, hasil dari tabel spatial join index diurutkan berdasar wilayah, hubungan
topological, dan jenis atributnya. Kemudian dihitung total luas area masing-masing wilayah berdasar hubungan topological dan jenis atribut. Luas area selanjutnya dinyatakan dalam persentase terhadap luas wilayah kelurahan. Setelah itu, dilakukan penggunaan operator complete dengan
fungsi agregasi MAX untuk
menyederhanakan tabel spasial join index,
yaitu dengan mengambil nilai terbesar persentase luas area pada setiap jenis atribut. Hasil dari tahap ini adalah tabel SJI yang telah sederhana dalam format xls, berisi ID_kel, jenis, dan luas area.
Gambar 5 Tahapan praproses. 4 Penentuan kategori
Pada tahap ini, dilakukan pengkategorian jenis atribut pada tabel SJI yang telah sederhana berdasar luas area. Proses ini dilakukan menggunakan teknik clustering, yaitu K-means dengan mengelompokkan data ke dalam 3 cluster.
5 Pemberian label kategori
Pada tahap ini, dilakukan pemberian label kategori pada tabel SJI yang telah sederhana sebagai identitas dari atribut jenis dan atribut luas area yang digabungkan berdasar hasil clustering luas area.
6 Penentuan kelas target
Pada tahap ini, dilakukan beberapa proses yang diilustrasikan pada Gambar 6. Objek spasial yang diproses adalah kelurahan dan mangrove.
6 Gambar 6 Penentuan kelas target.
Clustering luas area
Pada tahap ini, dilakukan proses clustering
luas area mangrove (dalam %) terhadap kelurahan menggunakan teknik clustering, yaitu K-means. Nilai ini dikelompokkan ke dalam 3 cluster (sedikit, sedang, banyak). Luas area yang bernilai 0 tidak dimasukkan ke dalam proses clustering dan dianggap masuk ke dalam label kelas tidak, sehingga diperoleh empat label kelas yaitu ‘tidak’, ‘sedikit’, ‘sedang’, dan ‘banyak’.
Pemberian label kelas
Pada tahap ini, dilakukan penambahan atribut kelas pada objek kelurahan. Atribut kelas ini berisi kategori tidak, sedikit, sedang, dan banyak berdasar hasil clustering
rasio.
7 Penggabungan tabel SJI
Pada tahap ini, dilakukan penggabungan tabel SJI objek lain dengan tabel kelurahan yang telah memiliki atribut kelas.
8 Transformasi data
Pada tahap ini, dilakukan perubahan tabel format xls menjadi format arff agar dapat diproses ke tahap selanjutnya yaitu proses klasifikasi menggunakan perangkat lunak Weka 3.6.0.
Penentuan Data Latih dan Data Uji
Pada tahap ini, dilakukan pemisahan data uji dan data latih menggunakan 10-fold cross validation untuk mengevaluasi classifier. Klasifikasi Menggunakan Spatial Decision Tree
Data hasil praproses diolah menggunakan
perangkat lunak Weka 3.6.0 dengan
menggunakan Algoritme C4.5. Implementasi dari algoritme C4.5 dalam Weka 3.6.0 adalah J48.
Akurasi Classifier
Akurasi dari model pohon yang dihasilkan dihitung menggunakan confusion matrix, yaitu menghitung banyaknya label kelas yang diprediksi benar dibagi total banyaknya prediksi. Jika hasilnya melebihi threshold, yaitu sebesar 60% maka akan diproses ke tahap berikutnya, apabila kurang dari threshold maka akan kembali diproses pada tahap praproses atau tahap penentuan dataset.
Penggunaan Classifier pada Data Baru Classifier yang terbentuk dapat diterapkan pada data baru, dimana data tersebut belum memiliki label kelas. Label kelas didapatkan dengan menelusuri model pohon yang terbentuk atau aturan yang telah diturunkan dari model pohon yang dihasilkan pada data latih.
Pengembangan Sistem
Perangkat lunak dan perangkat keras yang digunakan dalam mengembangkan sistem adalah sebagai berikut :
Perangkat Lunak :
1 Arcview 3.3 untuk pemrosesan data spasial.
2 Matlab 7.0 untuk proses clustering.
3 Microsoft Excel 2007 untuk melakukan proses operator complete
4 Weka 3.6.0 untuk proses klasifikasi.
Perangkat keras
1 Processor Intel(R) Pentium(R) 4 CPU 3.06GHz
2 Memory 1280 MB RAM 3 Mouse
4 Keyboard
HASIL DAN PEMBAHASAN