METODOLOGI PENELITIAN
3.2. Perancangan Cepat
Perancangan cepat (quick design) memfokuskan representasi aspek-aspek dari sistem yang terlihat oleh pengguna, misalkan pendekatan yang akan digunakan untuk memberikan masukan ke sistem dan format keluaran yang dihasilkan oleh sistem. Gambaran umum prototipe sistem disajikan dalam diagram konteks yang diilustrasikan pada Gambar 13.
Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial.
Sistem akan mengolah masukan yang diberikan dan memberikan keluaran berupa wilayah yang diperluas dan aturan karakterisasi (characteristic rule). Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi disajikan dalam bentuk teks.
Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu modul pengolahan awal (praproses), modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat dilihat pada Gambar 14.
Gambar 14. Arsitektur aplikasi. Sistem
Karakterisasi Spasial
Pengguna Obyek target Wilayah yang diperluas dan
aturan karakteristik Pengguna Data Podes Jabar 1996 Peta Desa Jabar 2000 Modul Pengolahan Awal Modul Basisdata Modul
Spatial Data Mining • neighbourhood graph • spatial filter • neighbourhood index • algoritme karakterisasi spasial Modul Visualisasi Data Sumber
21
Data Sumber
Spatial data mining melibatkan data spasial dan data non-spatial (atribut). Data spasial yang digunakan dalam penelitian ini adalah peta batas administrasi desa Propinsi Jawa Barat tahun 2000, termasuk Banten yang sekarang menjadi propinsi tersendiri. Jumlah desa yang terlibat adalah 7327 desa (Gambar 15). Peta batas administrasi desa didapat dalam format ESRI shapefile (shp).
Gambar 15. Peta batas administrasi desa Propinsi Jawa Barat tahun 2000
Pada peta batas administrasi desa melekat beberapa atribut yaitu:
• ID2000 : nomor identitas desa yang ditetapkan BPS tahun 2000
• Propinsi : nama propinsi
• Kab_Kota : nama kabupaten atau kota
• Kecamatan : nama kecamatan
• Desa : nama desa
Data atribut yang digunakan adalah data Podes 2003 yang didapat dalam format SAS (SSD). Secara umum data Podes 2003 berisi:
• Karakteristik desa
• Populasi, perumahan dan lingkungan
• Fasilitas Sosial-budaya
• Fasilitas Rekreasi dan hiburan
• Fasilitas Kesehatan
• Fasilitas Transportasi
• Penggunaan Lahan
• Kondisi Ekonomi
• Unit Finansial Desa
• Karakteristik Kepala Desa
Modul Pengolahan Awal
Dalam pengolahan awal (pra-proses) terdapat kegiatan data cleaning, integrasi, seleksi dan transformasi.
a. Data cleaning dilakukan untuk menangani data yang hilang atau data yang tidak benar.
Jumlah poligon pada peta Jabar 2000 adalah 7327 sedangkan jumlah kode desa yang berbeda pada Podes 2003 adalah 7234 , untuk itu perlu dilakukan data cleaning.
b. Integrasi dilakukan untuk menggabungkan data dari berbagai sumber yang berbeda.
Penelitian menggunakan data atribut desa dan data spasial desa. Agar dapat menggabungkan data atribut desa dengan data spasial desa maka diperlukan atribut kunci yaitu kode desa. Untuk itu dilakukan pemeriksaan kode desa pada kedua data agar sesuai.
c. Seleksi digunakan untuk memilih data yang relevan untuk analisis. Santoso A pada tahun 2000. melakukan penelitian tentang kriteria desa miskin berdasarkan konsumsi kalori keluarga dan hubungannya dengan potensi desa. Data yang digunakan pada penelitian tersebut adalah Podes 196. Penelitian tersebut menghasilkan model regresi prediksi persentase keluarga miskin (Y) untuk desa di propinsi Jawa Barat sebagai berikut :
Y= 40.00 + 4.99 X2 – 0.115 X4 + 0.00850 X8 + 0.466 X9 + 3.45 X13 – 6.18 X14 + 4.26 X15 + 0.835 X17 - 0.078 X19 – 1.65 X21+ 0.707 X22 + 2.84 X23
23
Daftar kelompok/nama dan jenis peubah yang terlibat dalam penelitian Santoso (2000) terdapat pada Tabel 1.
Tabel 1. Daftar kelompok/nama dan jenis peubah Podes (Santoso A, 2000) Kelompok
Peubah
Nama Peubah/Jenis Kode
1. Potensi / fasilitas sosial ekonomi desa
1. Tipe LKMD (1 = aktif, 0 = tidak aktif) X1 2. jalan utama desa (1 = aspal, 0 = non aspal) X2 3. Sumber penghasilan sebagian besar
penduduk (1 = pertanian, 0 = non-pertanian) X3 4. Jarak ke rumah sakit terdekat (km) X4 5. Fasilitas pendidikan (1 = lebih dari SD, 0 = SD)
X5 6.Fasilitas kesehatan (1 = ada, 0 = tidak ada) X6 7. Pasar (1= ada, 0 = tidak ada) X7 8. Kepadatan penduduk (km persegi) X8 9. Rasio banyaknya tempat ibadah per 1000 penduduk
X9 2. Fasilitas
perumahan dan lingkungan
10. Sumber air minum buatan (1 = ada, 0 = tidak ada)
X10 11. Wabah penyakit (1 = ada, 0 = tidak ada) X11 12. Bahan bakar (1 = bahan bakar minyak dan gas, 0 = non BBMG)
X12 13. Pembuangan sampah (1= ada, 0 = tidak
ada)
X13 14. Jamban (1 = jamban sendiri, 0 = jamban
bersama)
X14 15. Keberadaan pelanggan koran/majalah (1= ada, 0 = tidak ada)
X15 3.
Kependudukan
16. Persentase rumah tangga tani X16 17. Persentase rumah tangga yang
menyekolahkan anak/famili ke perguruan tinggi
X17
18. Persentase rumah tangga yang menggunakan listrik
X18 19. Persentase rumah tangga yg memiliki TV X19
20.Persentase rumah tangga yang memiliki telepon
X20 21. Persentase rumah tangga yang memiliki
kendaraan roda 4
X21 22. Persentase rumah tangga yang memiliki
kendaraan roda 2 atau 3
X22 23. Rata-rata anggota rumah tangga X23 24. Persentase rumah sederhana X24
Dari 17 atribut Podes yang digunakan dalam penelitian Santoso (2000), untuk pengembangan prototipe ini dicobakan lima atribut yaitu.
1. Tipe jalan utama desa
2. Jarak desa ke rumah sakit terdekat 3. Cara pembuangan sampah
4. Tempat buang air besar
5. Keberadaan pelanggan koran/majalah
Atribut lainnya dapat dilibatkan jika prototipe ini telah terbukti dapat bekerja dengan baik.
d. Transformasi dimana data dari beberapa sumber yang berbeda dikonversi ke dalam bentuk yang dapat diproses.
Algoritma karakterisasi spasial bekerja dengan atribut kategorik, sehingga atribut yang memiliki tipe numerik harus ditransformasi menjadi kategorik (diskretisasi). Dari lima atribut yang dipilih, hanya satu yang bertipe numerik yaitu jarak desa ke rumah sakit terdekat. Gambar 16 memperlihatkan histogram dari peubah ini. Dari histogram tersebut, jarak desa ke rumah sakit dibagi ke dalam tiga kelas yaitu dekat ( 0-30 km), sedang (30 – 60 km) dan jauh ( > 60 km)
100 80 60 40 20 0 X4 500 400 300 200 100 0 Fr equency Mean = 23.4 Std. Dev. = 22.755 N = 6,248
25
Modul Spatial Data Mining
Proses-proses dalam modul spasial diperlihatkan pada Gambar 17.
Gambar 17. Proses dalam modul spasial Menghitung frequency factor Loading Data Peta Peta Jabar Jabar Membangun neighbourhood graph Adjacency Membangun neighbourhood index Index Membentuk path Obyek Target path
Data Atribut Desa
Membentuk aturan karakterisasi spasial Aturan karakterisasi spasial
a. Loading Data Peta
Peta desa dimuat ke dalam lingkungan Matlab menggunakan fungsi shaperead yang terdapat dalam Mapping Toolbox. Fungsi shaperead akan membaca file shapefile (shp) dan menyimpannya sebagai struc array dengan field sebagai berikut:
• Geometry : tipe obyek spasial (misal point, line atau polygon)
• BoundingBox : berisi koordinat dua titik MBR (Minimum Bounding Rectangle) yaitu (x-min, y-min) dan (x-max,y-max)
• X : merupakan array dari koordinat X titik-titik yang menyusun obyek
• Y : merupakan array dari koordinat Y titik-titik yang menyusun obyek
• X1 : merupakan koordinat X titik tengah obyek
• Y1 : merupakan koordinat Y titik tengah obyek
• Serta atribut yang melekat pada shapefile (misal kode_desa, nama_desa dan sebagainya)
b. Membangun neighbourhood graph
Neighbourhood graph disimpan dalam sebuah matriks NxN. Elemen pada baris i dan kolom j bernilai 1 jika obyek ke-i dan obyek ke-j merupakan tetangga dan bernilai 0 jika selainnya. Untuk membentuk neighbourhood graph dilakukan pekerjaan berikut ini
• Untuk semua obyek ke-i periksa apakah MBR obyek ke-i berpotongan dengan MBR obyek ke-k. Gambar 18(a) memperlihatkan sebuah obyek dengan MBR-nya, sedangkan Gambar 18(b) memperlihatkan tiga kemungkinan dimana MBR dua buah obyek berpotongan.
(a) (b)
27
• Untuk semua obyek ke-i dan obyek ke-k yang memenuhi syarat di atas, periksa apakah kedua obyek merupakan tetangga. Dalam penelitian ini didefinisikan dua buah desa merupakan tetangga jika dan hanya jika poligon batas kedua desa berpotongan di lebih satu titik. Gambar 19 merupakan visualisasi dari neighbourhood graph.
Gambar 19. Visualisasi neighbourhood graph.
c. Membangun neighbourhood index
Karena Neighbourhood graph berukuran N x N maka diperlukan sebuah indeks agar proses pembacaan hubungan antara dua obyek lebih cepat, tidak dihitung berkali-kali setiap diminta. Hubungan spasial yang disimpan dalam neighbourhood index dalam penelitian ini adalah hubungan jarak dan hubungan arah. Hubungan topologi tidak disimpan dalam indeks karena berdasarkan batasan yang diterapkan pada pembentukan neighbourhood graph maka hanya memiliki satu hubungan topologi yaitu berdampingan (adjacent).
d. Membentuk path
Proses pembentukan path dilakukan melalui tahapan berikut
• Tentukan obyek target.
Dalam penelitian ini, obyek target merupakan subset dari desa yang termasuk kelas miskin berdasarkan Santoso A (2000). Sumber data penelitian Santoso A (2000) meliputi 7 kabupaten di Jawa Barat yaitu
: Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan bahwa kabupaten yang dipilih merupkan kabupaten dengan persentase desa miskin (menurut kriteria BPS tahun 1995) dari desa yang terkena Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di pulau Jawa. Disamping pertimbangan di atas ada pertimbangan lain, misalnya topografi dan kondisi geografis. Data desa miskin menurut Santoso A (2000) terdapat di Lampiran 1.
• Bentuk path dengan panjang 2 node
Gambar 20 merupakan visualisasi path dengan panjang 2 node untuk dua buah titik target.
Gambar 20. Visualisasi path dengan panjang 2 node
• Bentuk path perluasan dengan menerapkan filter spasial
Gambar 21 merupakan visualisasi path dengan panjang 3 node untuk dua buah titik target.
29
Gambar 21. Visualisasi path dengan panjang 3 node
e. Menghitung frequency factor
Dalam menghitung frequency factor dari atribut akan diperhatikan pengaruh dari panjang path max-neighbours s dan nilai ambang significance
f. Membentuk aturan karakterisasi spasial
Selanjutkan dilakukan pembentukan aturan klasifikasi spasial dengan pola sebagai berikut
Modul Basisdata
Sistem manajemen basis data SQL Server 2000 akan digunakan untuk menyimpan neighbourhood indeks agar proses pencarian hubungan antar dua obyek lebih cepat.
Modul Visualisasi
Visualisasi diperlukan untuk mempermudah pemahaman dan pengecekan proses. Visualisasi akan menggunakan Mapping Toolbox pada Matlab.