Perancangan Cepat - METODOLOGI PENELITIAN

METODOLOGI PENELITIAN

3.2. Perancangan Cepat

Perancangan cepat (quick design) memfokuskan representasi aspek-aspek dari sistem yang terlihat oleh pengguna, misalkan pendekatan yang akan digunakan untuk memberikan masukan ke sistem dan format keluaran yang dihasilkan oleh sistem. Gambaran umum prototipe sistem disajikan dalam diagram konteks yang diilustrasikan pada Gambar 13.

Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial.

Sistem akan mengolah masukan yang diberikan dan memberikan keluaran berupa wilayah yang diperluas dan aturan karakterisasi (characteristic rule). Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi disajikan dalam bentuk teks.

Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu modul pengolahan awal (praproses), modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat dilihat pada Gambar 14.

Gambar 14. Arsitektur aplikasi. Sistem

Karakterisasi Spasial

Pengguna Obyek target _{Wilayah yang diperluas dan}

aturan karakteristik Pengguna Data Podes Jabar 1996 Peta Desa Jabar 2000 Modul Pengolahan Awal Modul Basisdata Modul

Spatial Data Mining • neighbourhood graph • spatial filter • neighbourhood index • algoritme karakterisasi spasial Modul Visualisasi Data Sumber

Data Sumber

Spatial data mining melibatkan data spasial dan data non-spatial (atribut). Data spasial yang digunakan dalam penelitian ini adalah peta batas administrasi desa Propinsi Jawa Barat tahun 2000, termasuk Banten yang sekarang menjadi propinsi tersendiri. Jumlah desa yang terlibat adalah 7327 desa (Gambar 15). Peta batas administrasi desa didapat dalam format ESRI shapefile (shp).

Gambar 15. Peta batas administrasi desa Propinsi Jawa Barat tahun 2000

Pada peta batas administrasi desa melekat beberapa atribut yaitu:

• ID2000 : nomor identitas desa yang ditetapkan BPS tahun 2000

• Propinsi : nama propinsi

• Kab_Kota : nama kabupaten atau kota

• Kecamatan : nama kecamatan

• Desa : nama desa

Data atribut yang digunakan adalah data Podes 2003 yang didapat dalam format SAS (SSD). Secara umum data Podes 2003 berisi:

• Karakteristik desa

• Populasi, perumahan dan lingkungan

• Fasilitas Sosial-budaya

• Fasilitas Rekreasi dan hiburan

• Fasilitas Kesehatan

• Fasilitas Transportasi

• Penggunaan Lahan

• Kondisi Ekonomi

• Unit Finansial Desa

• Karakteristik Kepala Desa

Modul Pengolahan Awal

Dalam pengolahan awal (pra-proses) terdapat kegiatan data cleaning, integrasi, seleksi dan transformasi.

a. Data cleaning dilakukan untuk menangani data yang hilang atau data yang tidak benar.

Jumlah poligon pada peta Jabar 2000 adalah 7327 sedangkan jumlah kode desa yang berbeda pada Podes 2003 adalah 7234 , untuk itu perlu dilakukan data cleaning.

b. Integrasi dilakukan untuk menggabungkan data dari berbagai sumber yang berbeda.

Penelitian menggunakan data atribut desa dan data spasial desa. Agar dapat menggabungkan data atribut desa dengan data spasial desa maka diperlukan atribut kunci yaitu kode desa. Untuk itu dilakukan pemeriksaan kode desa pada kedua data agar sesuai.

c. Seleksi digunakan untuk memilih data yang relevan untuk analisis. Santoso A pada tahun 2000. melakukan penelitian tentang kriteria desa miskin berdasarkan konsumsi kalori keluarga dan hubungannya dengan potensi desa. Data yang digunakan pada penelitian tersebut adalah Podes 196. Penelitian tersebut menghasilkan model regresi prediksi persentase keluarga miskin (Y) untuk desa di propinsi Jawa Barat sebagai berikut :

Y= 40.00 + 4.99 X2 – 0.115 X4 + 0.00850 X8 + 0.466 X9 + 3.45 X13 – 6.18 X14 + 4.26 X15 + 0.835 X17 - 0.078 X19 – 1.65 X21+ 0.707 X22 + 2.84 X23

Daftar kelompok/nama dan jenis peubah yang terlibat dalam penelitian Santoso (2000) terdapat pada Tabel 1.

Tabel 1. Daftar kelompok/nama dan jenis peubah Podes (Santoso A, 2000) Kelompok

Peubah

Nama Peubah/Jenis Kode

1. Potensi / fasilitas sosial ekonomi desa

1. Tipe LKMD (1 = aktif, 0 = tidak aktif) X1 2. jalan utama desa (1 = aspal, 0 = non aspal) X2 3. Sumber penghasilan sebagian besar

penduduk (1 = pertanian, 0 = non-pertanian) X3 4. Jarak ke rumah sakit terdekat (km) X4 5. Fasilitas pendidikan (1 = lebih dari SD, 0 = SD)

X5 6.Fasilitas kesehatan (1 = ada, 0 = tidak ada) X6 7. Pasar (1= ada, 0 = tidak ada) X7 8. Kepadatan penduduk (km persegi) X8 9. Rasio banyaknya tempat ibadah per 1000 penduduk

X9 2. Fasilitas

perumahan dan lingkungan

10. Sumber air minum buatan (1 = ada, 0 = tidak ada)

X10 11. Wabah penyakit (1 = ada, 0 = tidak ada) X11 12. Bahan bakar (1 = bahan bakar minyak dan gas, 0 = non BBMG)

X12 13. Pembuangan sampah (1= ada, 0 = tidak

ada)

X13 14. Jamban (1 = jamban sendiri, 0 = jamban

bersama)

X14 15. Keberadaan pelanggan koran/majalah (1= ada, 0 = tidak ada)

X15 3.

Kependudukan

16. Persentase rumah tangga tani X16 17. Persentase rumah tangga yang

menyekolahkan anak/famili ke perguruan tinggi

X17

18. Persentase rumah tangga yang menggunakan listrik

X18 19. Persentase rumah tangga yg memiliki TV X19

20.Persentase rumah tangga yang memiliki telepon

X20 21. Persentase rumah tangga yang memiliki

kendaraan roda 4

X21 22. Persentase rumah tangga yang memiliki

kendaraan roda 2 atau 3

X22 23. Rata-rata anggota rumah tangga X23 24. Persentase rumah sederhana X24

Dari 17 atribut Podes yang digunakan dalam penelitian Santoso (2000), untuk pengembangan prototipe ini dicobakan lima atribut yaitu.

1. Tipe jalan utama desa

2. Jarak desa ke rumah sakit terdekat 3. Cara pembuangan sampah

4. Tempat buang air besar

5. Keberadaan pelanggan koran/majalah

Atribut lainnya dapat dilibatkan jika prototipe ini telah terbukti dapat bekerja dengan baik.

d. Transformasi dimana data dari beberapa sumber yang berbeda dikonversi ke dalam bentuk yang dapat diproses.

Algoritma karakterisasi spasial bekerja dengan atribut kategorik, sehingga atribut yang memiliki tipe numerik harus ditransformasi menjadi kategorik (diskretisasi). Dari lima atribut yang dipilih, hanya satu yang bertipe numerik yaitu jarak desa ke rumah sakit terdekat. Gambar 16 memperlihatkan histogram dari peubah ini. Dari histogram tersebut, jarak desa ke rumah sakit dibagi ke dalam tiga kelas yaitu dekat ( 0-30 km), sedang (30 – 60 km) dan jauh ( > 60 km)

100 80 60 40 20 0 X4 500 400 300 200 100 0 Fr equency Mean = 23.4 Std. Dev. = 22.755 N = 6,248

Modul Spatial Data Mining

Proses-proses dalam modul spasial diperlihatkan pada Gambar 17.

Gambar 17. Proses dalam modul spasial Menghitung frequency factor Loading Data Peta Peta Jabar Jabar Membangun neighbourhood graph Adjacency Membangun neighbourhood index Index Membentuk path Obyek Target path

Data Atribut Desa

Membentuk aturan karakterisasi spasial Aturan karakterisasi spasial

a. Loading Data Peta

Peta desa dimuat ke dalam lingkungan Matlab menggunakan fungsi shaperead yang terdapat dalam Mapping Toolbox. Fungsi shaperead akan membaca file shapefile (shp) dan menyimpannya sebagai struc array dengan field sebagai berikut:

• Geometry : tipe obyek spasial (misal point, line atau polygon)

• BoundingBox : berisi koordinat dua titik MBR (Minimum Bounding Rectangle) yaitu (x-min, y-min) dan (x-max,y-max)

• X : merupakan array dari koordinat X titik-titik yang menyusun obyek

• Y : merupakan array dari koordinat Y titik-titik yang menyusun obyek

• X1 : merupakan koordinat X titik tengah obyek

• Y1 : merupakan koordinat Y titik tengah obyek

• Serta atribut yang melekat pada shapefile (misal kode_desa, nama_desa dan sebagainya)

b. Membangun neighbourhood graph

Neighbourhood graph disimpan dalam sebuah matriks NxN. Elemen pada baris i dan kolom j bernilai 1 jika obyek ke-i dan obyek ke-j merupakan tetangga dan bernilai 0 jika selainnya. Untuk membentuk neighbourhood graph dilakukan pekerjaan berikut ini

• Untuk semua obyek ke-i periksa apakah MBR obyek ke-i berpotongan dengan MBR obyek ke-k. Gambar 18(a) memperlihatkan sebuah obyek dengan MBR-nya, sedangkan Gambar 18(b) memperlihatkan tiga kemungkinan dimana MBR dua buah obyek berpotongan.

(a) (b)

• Untuk semua obyek ke-i dan obyek ke-k yang memenuhi syarat di atas, periksa apakah kedua obyek merupakan tetangga. Dalam penelitian ini didefinisikan dua buah desa merupakan tetangga jika dan hanya jika poligon batas kedua desa berpotongan di lebih satu titik. Gambar 19 merupakan visualisasi dari neighbourhood graph.

Gambar 19. Visualisasi neighbourhood graph.

c. Membangun neighbourhood index

Karena Neighbourhood graph berukuran N x N maka diperlukan sebuah indeks agar proses pembacaan hubungan antara dua obyek lebih cepat, tidak dihitung berkali-kali setiap diminta. Hubungan spasial yang disimpan dalam neighbourhood index dalam penelitian ini adalah hubungan jarak dan hubungan arah. Hubungan topologi tidak disimpan dalam indeks karena berdasarkan batasan yang diterapkan pada pembentukan neighbourhood graph maka hanya memiliki satu hubungan topologi yaitu berdampingan (adjacent).

d. Membentuk path

Proses pembentukan path dilakukan melalui tahapan berikut

• Tentukan obyek target.

Dalam penelitian ini, obyek target merupakan subset dari desa yang termasuk kelas miskin berdasarkan Santoso A (2000). Sumber data penelitian Santoso A (2000) meliputi 7 kabupaten di Jawa Barat yaitu

: Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan bahwa kabupaten yang dipilih merupkan kabupaten dengan persentase desa miskin (menurut kriteria BPS tahun 1995) dari desa yang terkena Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di pulau Jawa. Disamping pertimbangan di atas ada pertimbangan lain, misalnya topografi dan kondisi geografis. Data desa miskin menurut Santoso A (2000) terdapat di Lampiran 1.

• Bentuk path dengan panjang 2 node

Gambar 20 merupakan visualisasi path dengan panjang 2 node untuk dua buah titik target.

Gambar 20. Visualisasi path dengan panjang 2 node

• Bentuk path perluasan dengan menerapkan filter spasial

Gambar 21 merupakan visualisasi path dengan panjang 3 node untuk dua buah titik target.

Gambar 21. Visualisasi path dengan panjang 3 node

e. Menghitung frequency factor

Dalam menghitung frequency factor dari atribut akan diperhatikan pengaruh dari panjang path max-neighbours s dan nilai ambang significance

f. Membentuk aturan karakterisasi spasial

Selanjutkan dilakukan pembentukan aturan klasifikasi spasial dengan pola sebagai berikut

Modul Basisdata

Sistem manajemen basis data SQL Server 2000 akan digunakan untuk menyimpan neighbourhood indeks agar proses pencarian hubungan antar dua obyek lebih cepat.

Modul Visualisasi

Visualisasi diperlukan untuk mempermudah pemahaman dan pengecekan proses. Visualisasi akan menggunakan Mapping Toolbox pada Matlab.

Dalam dokumen Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat (Halaman 43-54)