• Tidak ada hasil yang ditemukan

Penulis dilahirkan di Jakarta pada tanggal 17 September 1976 dari ayah Amir Hidayat, S.H. dan ibu Muryati. Penulis merupakan anak kedua dari empat bersaudara.

Pendidikan sarjana ditempuh di Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB dan lulus pada tahun 2000. Sejak tahun 2001 penulis bekerja sebagai staf pengajar honorer di Departemen Ilmu Komputer IPB dan pada tahun 2006 diangkat sebagai PNS di lingkungan Institut Pertanian Bogor.

DAFTAR ISI

Halaman

DAFTAR TABEL ... xi DAFTAR GAMBAR ... xii PENDAHULUAN Latar Belakang ... 1 Formulasi Permasalahan ... 3 Ruang Lingkup ... 3 Keaslian Penelitian ... 3 Manfaat Penelitian ... 4 Tujuan Penelitian ... 4 TINJAUAN PUSTAKA

Konsep dan Definisi Kemiskinan ... 5 Susenas dan Podes ... 5 Prototyping ... 6 Basis data spasial ... 8 Spatial Data Mining ... 9 Teknik Spatial Data Mining ... 10 Karakterisasi Spasial ... 11

METODOLOGI PENELITIAN

Penentuan Kebutuhan Sistem ... 19 Perancangan Cepat ... 19

Data Sumber ... 21 Modul Pengolahan Awal ... 22 Modul Spatial Data Mining ... 25 Modul Basisdata ... 29

Modul Visualisasi ... 29 Pembangunan Prototipe ... 30

Pengujian Prototipe oleh Pengguna ... 30 Perbaikan Prototipe ... 30

HASIL DAN PEMBAHASAN

Loading data peta ... 31 Membangun neighborhood graph ... 32

Cek MBR ... 33 Membangun List ... 34 Periksa Adjacency ... 35 Membangun neigborhood index ... 36 Hitung Jarak ... 37 Cari Arah ... 37 Pembentukan File Topologi ... 39 Loading ke SQL Server ... 39 Membentuk path ... 40 Penentuan Obyek Target ... 40 Membangun Path dengan k=2 ... 43 Membangun Filter Predikat ... 44 Membangun Path dengan k=n ... 46 Menghitung frequency factor ... 47 Membentuk aturan karakterisasi spasial ... 48

SIMPULAN DAN SARAN ... 50

DAFTAR PUSTAKA ... 52 LAMPIRAN ... 54

DAFTAR TABEL

Halaman

1 Daftar kelompok/nama dan jenis peubah Podes (Santoso A, 2000) ... 23 2 Hubungan antara peubah dalam Santoso A. (2000) dengan peubah

dalam Podes 1996 ... 25 3 Transformasi peubah Podes 1996 ... 26 4 Nilai untuk masing-masing peubah ... 26 5 Desa Target ... 41 6 Frequency-Factor ... 48 DAFTAR GAMBAR Halaman 1 Proses Prototyping ... 7 2 Arsitektur SDBMS tiga-layer ... 8 3 Proses Spatial Data Mining (Chawla et al. 2001) ... 10 4 Frekuensi sampel dan perbedaannya ... 12 5 Atribut Spasial dan Non-spasial ... 12 6 Contoh Hubungan Topologi ... 13 7 Contoh Hubungan Jarak ... 14 8 Contoh Hubungan Arah ... 14 9 Contoh Neighbourhood Graph ... 14 10 Filter Predicates ... 16 11 Contoh Neighbourhood Index ... 16 12 Objek Target dan Wilayah yang Diperluas ... 18 13 Diagram Konteks Prototipe Sistem Karakterisasi Spasial ... 20 14 Arsitektur Aplikasi ... 20

15 Peta batas administrasi desa Propinsi Jawa Barat tahun 1996 ... 21 16 Histogram jarak desa ke rumah sakit ... 24 17 Proses dalam modul spasial ... 25 18 Minimum Bounding Rectangle (MBR) ... 26 19 Visualisasi neighbourhood graph ... 27 20 Visualisasi path dengan panjang 2 node ... 28 21 Visualisasi path dengan panjang 3 node ... 29 22 Alur loading data peta ... 31 23 Struktur Variabel S ... 31 24 Desa Miskin/Tidak Miskin di Pandeglang, Serang, Bogor, Bandung,

Cirebon, Indramayu dan Garut ... 32 25 Sebagian desa di Jawa Barat ... 33 26 MBR desa ... 33 27 Matriks not_separate ... 34 28 Not_Separate_List ... 34 29 Matriks Adjacence ... 35 30 Desa yang memenuhi hubungan Meet. ... 35 31 Alur pembentukan Neighbourhood Graph ... 36 32 . Alur pembangunan Neighbourhood Index ... 36 33 Visualisasi jarak antardesa ... 37 34 Get_direction (S,1,4) ... 37 35 Get_direction (S,1,6) ... 38 36 Struktur file topologi ... 39 37 Struktur tabel NeighbourhoodIndex ... 40 38 Alur proses pembentukan path ... 41 39 Desa Target ... 42 40 Path k=2 ... 43 41 Perluasan Path ... 44 42 Path k =3 dengan filter starlike ... 46 43 Path k=3 dengan filter variable starlike ... 46 44 Jumlah Path dan Jumlah Desa ... 47

PENDAHULUAN

1.1. Latar Belakang

Banyak sekali data yang telah disimpan dalam basisdata, data warehouse, sistem informasi geografis, serta fasilitas penyimpanan informasi lainnya, dan data tersebut terus bertambah banyak dengan cepat. Dengan perkembangan teknologi penyimpnan data, kemampuan manusia untuk menyimpan data sangat jauh melampaui kemampuan untuk melakukan analisis dan ekstraksi informasi yang bermakna dari data yang tersimpan tersebut secara otomatis.

Knowledge Discovery in Databases (KDD) muncul sebagai bidang riset dan teknologi baru untuk melakukan pencarian pengetahuan yang menarik, implisit, dan belum diketahui sebelumnya dari basisdata yang besar. Menurut Frawley et al. (1991) yang diacu dalam Fayyad et al. (1996) KDD adalah non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data. Bagian dari KDD adalah data mining, yaitu kegiatan penyulingan data menjadi informasi atau fakta tentang kenyataan yang dijelaskan oleh basisdata. Dalam prosesnya data mining melibatkan beberapa bidang riset seperti sistem basisdata, machine learning, visualisasi data, statistika, dan information theory (Fayyad et al. 1996).

Di Indonesia, Badan Pusat Statistik secara teratur melakukan pengumpulan data memantau kondisi penduduk dan sosial ekonomi Indonesia, misalnya melalui Survei Sosial Ekonomi Nasional (Susenas) dan Potensi Desa (Podes). Sejak tahun 1993 jumlah contoh data Susenas sebanyak 202.000 rumah tangga (Surbakti 1995) sedang data Podes mencakup seluruh desa di Indonesia. Salah satu data yang dapat diperoleh setiap tiga tahun dari Susenas adalah konsumsi dan pengeluaran rumah tangga. Data konsumsi dan pengeluaran rumah tangga digunakan untuk menentukan penduduk miskin, sedangkan data Podes digunakan untuk menentukan desa miskin.

Data Susenas dan Podes memiliki referensi geografis dan waktu. Referensi geografis bisa dinyatakan dalam kode propinsi, kode kabupaten, kode kecamatan, kode desa, kode pos, atau kode wilayah tertentu. Saat ini telah tersedia peta batas wilayah administratif dalam bentuk digital yang memungkinkan analisis fenomena sosial-ekonomi dan kaitannya dengan lokasi geografis wilayah pencacahan. Hal ini menyebabkan meningkatnya kebutuhan akan teknik analisis data yang handal yang dapat mengkaitkan data sensus dengan distribusi geografisnya.

Perkembangan dalam struktur data spasial (Güting 1994), spatial reasoning (Egenhofer 1991) dan Computational Geometry telah merintis jalan bagi spatial data mining. Spatial data mining merupakan the extraction of implicit knowledge, spatial relations, or other patterns not explicitly stored in spatial databases (Koperski dan Han 1995 diacu dalam Koperski et al. 1996).

Spatial data mining telah digunakan oleh Ester et al. (1998) untuk menganalisis karakteristik spasial serta deteksi kecenderungan spasial pada data sensus penduduk daerah Bavaria, Jerman tahun 1987. Sedangkan Appice et al. (2003) menggunakan teknik spatial association rule untuk mendapatkan pengetahuan baru dari data sensus ekonomi UK.

Salah satu teknik dalam spatial data mining adalah karakterisasi spasial (spatial characterization). Karakterisasi spasial digunakan untuk mengungkap karakteristik atau deskripsi ringkas spasial dari properties yang menarik pada sebuah komunitas, misalnya bagaimana karakteristik daerah yang memiliki tingkat pertumbuhan ekonomi tinggi, atau bagaimana karakteristik daerah yang memiliki jumlah penduduk usia lanjut tinggi dan sebagainya.

Penelitian ini akan menggunakan teknik spatial data mining untuk mengungkap karakteristik spasial dari kondisi kemiskinan di Jawa Barat. Diharapkan dari proses karekterisasi spasial tersebut dapat terbentuk sebuah basis pengetahuan (knowledge-bases) spasial baru yang bermanfaat bagi penentuan kebijakan pengentasan kemiskinan di Jawa Barat.

3

1.2. Formulasi Permasalahan

Badan Pusat Spasial telah melakukan penghimpunan sejumlah besar data sosial ekonomi di Indonesia secara teratur, diantaranya melalui Susenas dan Podes. Dengan jumlah data yang besar tersebut dirasa perlu adanya sebuah sistem yang dapat melakukan analisis dan ekstraksi informasi yang bermakna dari data yang tersimpan tersebut secara otomatis. Karena data Susenas maupun Podes memiliki referensi geografis maka analisis yang dilakukan sebaiknya memperhatikan Hukum I Geografi yaitu “everything is related to everything else, but near things are more related than distant thing” (Tobler 1979). Agar proses analisis dapat dilakukan dengan lebih cepat dan akurat, maka sebaiknya menggunakan sistem manajemen basisdata yang mendukung data spasial dan non- spasial.

1.3. Ruang Lingkup

Teknik spatial data mining yang akan diterapkan pada prototipe adalah spatial characterization. Data spasial yang digunakan adalah batas administrasi desa Jawa Barat dan Banten tahun 2003. Data atribut desa diperoleh dari data Potensi Desa (Podes) tahun 2003. Karena atribut dalam data Podes sangat banyak, maka hanya beberapa atribut saja yang dilibatkan dalam pengembangan prototipe ini. Dalam memberikan sebuah label kepada sebuah objek berdasarkan nilai tertentu digunakan pendekatan crips (tidak fuzzy).

1.4. Keaslian Penelitian

Analisis data sensus dengan menggunakan spatial data mining telah ditunjukkan oleh Ester et al. (1998) dan Appice et al. (2003). Sedangkan Sugiyono (2003) telah melakukan penelitian tentang karakteristik kemiskinan dan pemetaan penduduk miskin Propinsi Jawa Barat. Penelitian Sugiyono (2003) menggunakan analisis statistik spasial. Sejauh ini penulis belum menemukan sistem spatial data mining untuk analisis karakteristik spasial desa miskin di Propinsi Jawa Barat.

1.5. Manfaat Penelitian

Dari penelitian ini diharapkan terbentuk prototipe sistem spatial data mining Prototipe tersebut diharapkan dengan mudah dan cepat mendapatkan pengetahuan implisit, hubungan spasial, atau pola-pola lainnya yang tidak secara eksplisit tersimpan dalam basisdata. Prototipe tersebut akan digunakan untuk mengungkap karakteristik spasial dari desa miskin di Jawa Barat.

1.6. Tujuan Penelitian

Penelitian ini memiliki tujuan yaitu:

1. Memahami konsep salah satu teknik dalam spatial data mining yaitu spatial characterization.

2. Membangun prototipe sistem spatial data mining yang mampu menjalankan teknik spatial characterization.

3. Memanfaatkan prototipe spatial characterization untuk mendapatkan karakter desa miskin di Propinsi Jawa Barat berdasarkan data Potensi Desa

TINJAUAN PUSTAKA

2.1. Konsep dan Definisi Kemiskinan

Konsep kemiskinan yang digunakan dalam penelitian ini merujuk kepada metode BPS, yaitu menggunakan pendekatan kemampuan dalam memenuhi kebutuhan dasar (basic need) yang meliputi kebutuhan makanan dan kebutuhan bukan makanan. Selanjutnya dengan penetapan batas garis kemiskinan (proverty line), suatu rumah tangga dapat dikelompokkan ke dalam rumah tangga miskin atau tidak miskin.

Garis kemiskinan didefinisikan sebagai besarnya nilai rupiah yang harus dikeluarkan oleh seseorang untuk memenuhi kebutuhan hidup minimumnya. Kebutuhan hidup minimum terdiri dari kelompok makanan maupun kelompok bukan makanan. Batas miskin untuk kebutuhan makanan dikonsepkan setara 2.100 kalori per hari. Batasan ini mengacu pada hasil Widyakarya Pangan dan Gizi 1978. Pemenuhan energi setara 2.100 kalori diperoleh dari konsumsi berbagai jenis kelompok makanan, yaitu : beras, umbi-umbian, ikan, daging dan sebagainya.

Sedangkan batas miskin untuk kebutuhan bukan makanan tercermin dari besarnya nilai rupiah yang harus dikeluarkan untuk memenuhi kebutuhan minimum bukan makanan. Kebutuhan bukan makanan terdiri dari perumahan, pendidikan, kesehatan, pakaian, serta aneka barang dan jasa lainnya (Sugiyono 2003).

2.2. Susenas dan Podes

Pengumpulan data Potensi Desa (Podes) adalah kegiatan rutin yang dilaksanakan setiap sensus, baik sensus penduduk, sensus pertanian , maupun sensus ekonomi. Sejak tahun 1994 Podes tidak hanya dilaksanakan pada tahun- tahun kegiatan sensus saja tetapi dilaksanakan setiap tahun. Tujuan pengumpulan data Podes antara lain untuk mendapatkan data tentang karakteristik desa secara lebih rinci, yang meliputi data mengenai sarana dan prasarana desa, potensi pertanian, pendidikan, kesehatan, dan potensi sosial-ekonomi lainnya.

Survei Sosial Ekonomi Nasional (Susenas) merupakan survei rumah tangga yang diselenggarakan setiap tahun. Susenas berfungsi sebagai wahana dalam menghimpun data sosial ekonomi penduduk. Keterangan yang dihimpun antara lain menyangkut aspek demografi, pendidikan, kesehatan/gizi, perumahan/lingkungan, kriminalitas, kegiatan sosial budaya, konsumsi/pengeluaran rumah tangga, perjalanan wisata dan kesejahteraan rumah tangga.

Peubah Susenas yang dikumpulkan dibagi menjadi dua kategori, yaitu peubah pokok (kor) dan peubah sasaran (modul). Peubah kor dikumpulkan setiap tahun, sedangkan peubah modul dikumpulkan setiap tiga tahun. Setiap tahun salah satu dari kelompok peubah modul ditetapkan, yaitu (1) konsumsi/pengeluaran rumah tangga, (2) pendidikan, kesehatan, dan perumahan serta lingkungan, (3) sosial budaya, kriminalitas, dan wisata nusantara dikumpulkan dari rumah tangga.

Pemilihan contoh Susenas umumnya dilakukan dalam 3 atau 4 tahap, yaitu (1) pemilihan sejumlah kecamatan, (2) pemilihan sejumlah desa pada setiap kecamatan terpilih, (3) pemilihan sejumlah wilayah pencacahan (wilcah) pada setiap desa terpilih, dan (4) pemilihan sejumlah rumah tangga pada setiap wilcah terpilih. Sejak tahun 1993 jumlah contoh Susenas sebanyak 202.000 rumah tangga. Sebanyak 65.000 rumah tangga diberikan daftar pertanyaan modul, sedangkan 137.000 rumah tangga diberikan pertanyaan modul saja. Santoso (2000) menggunakan data Susenas 1996 untuk menghasilkan daftar desa miskin di Jawa Barat.

2.3. Prototyping

Dalam pengembangan sebuah perangkat lunak, sering pengguna telah mendefinisikan tujuan umum dari perangkat lunak yang diinginkan, tetapi tidak melakukan identifikasi rinci dari kebutuhan masukan, pengolahan dan keluaran. Dalam kasus lain, pengembang mungkin tidak yakin tentang efisiensi algoritma yang digunakan, kemampuan adaptasi dari sistem operasi, atau bentuk interaksi antara manusia dengan komputer yang digunakan. Dalam kasus-kasus seperti di atas maka pendekatan pengembangan perangkat lunak yang paling sesuai adalah prototyping (Pressman 1992).

7

Prototyping adalah proses yang memungkinkan pengembang perangkat lunak untuk membuat model dari perangkat lunak yang akan dibangun. Model tersebut dapat dinyatakan dalam tiga bentuk: (1) prototipe berbentuk kertas atau model berbasis PC yang menggambarkan bagaimana interaksi antara manusia dan mesin terjadi, (2) workingprototype yang mengimplementasikan beberapa subset dari fungsionalitas yang diinginkan dari perangkat lunak, atau (3) program yang telah ada saat ini yang mengerjakan sebagian atau seluruh fungsionalitas yang diinginkan tetapi memiliki beberapa feature yang akan ditingkatkan dalam usaha pengembangan selanjutnya. Rangkaian kegiatan dalam prototyping digambarkan pada Gambar 1.

Gambar 1. Proses Prototyping (sumber: Laudon dan Laudon, 2005). Identifikasi Kebutuhan Dasar Langkah 1 Mengembangkan Working Prototype Langkah 2 Menggunakan Prototipe Langkah 3 Pengguna Puas? Prototipe Operasional Revisi dan Perbaikan Prototipe Langkah 4 TIDAK YA

2.4. Basisdata Spasial

Shekhar dan Chawla (2003) mendefinisikan sistem manajemen basisdata spasial (Spatial Database Management System - SDBMS) sebagai berikut:

1. SDBMS adalah modul perangkat lunak yang dapat bekerja dengan sistem manajemen basisdata dasar, seperti Object-Relational Database Management System (OR-DBMS) atau Object-Oriented Database Management System (OO-DBMS)

2. SDBMS mendukung beberapa model data spasial, tipe data abstrak (Abstract Data Type –ADT) dan bahasa query yang dapat memanggil ADT tersebut

3. SDBMS mendukung indeks spasial, algoritma yang efisien untuk melaksanakan operasi spasial, serta aturan-aturan yang spesifik bagi domain tertentu untuk optimasi query.

Gambar 2 menggambarkan arsitektur untuk membangun SDBMS berdasarkan OR-DBMS

9

2.5. Spatial Data Mining

Seperti berbagai bidang riset dan aplikasi lainnya, geografi telah berpindah dari lingkungan miskin-data dan miskin-komputasi ke lingkungan kaya-data dan kaya-komputasi. Bidang, cakupan, dan volume dataset geografik digital terus berkembang dengan cepat. Agen di sektor publik dan swasta mengadakan, memproses dan menyebarkan data digital tentang penggunaan lahan, peubah sosial-ekonomi dan infrastruktur dengan resolusi geografis yang rinci. Berbagai teknologi seperti penginderaan jarak jauh, global positioning sustem (GPS), perangkat yang peka lokasi – position aware devices (telepon selular, sistem navigasi kendaraan, wireless internet client) menyebabkan jumlah data geografik akan meningkat secara eksponensial dalam pertengahan abad ke-21 mendatang.

Metode analisis spasial tradisional dikembangkan pada saat biaya pengumpulan data sangat mahal serta tenaga komputasi yang tersedia masih lemah. Peningkatan jumlah data serta beragamnya sifat data geografik digital menyebabkan teknik analisis spasial tradisional kewalahan. Teknik analisis spasial tradisional berorientasi pada informasi sederhana yang berasal dari dataset yang kecil dan seragam. Metode statistik tradisional, khususnya statistik spasial, memiliki beban komputasi yang tinggi. Teknik-teknik tersebut memerlukan penegasan dari pakar (corfirmatory) dan mensyaratkan peneliti untuk mempunyai dugaan sebelumnya (a priori hypotheses). Dengan demikian, teknik analisis spasial tradisional tidak dapat dengan mudah menemukan pola (pattern), kecenderungan (pattern) dan hubungan (relationship) yang baru dan tidak terduga, yang mungkin tersembunyi jauh di dalam dataset geografik yang sangat besar dan beragam (Miller dan Han 2001). Penjelasan mendalam tentang analisis spasial dapat ditemukan dalam Anselin (2004) dan ESRI (2005), sedangkan penjelasan tentang statistik spasial dapat ditemukan dalam Cressie (1993).

Penggunaan sistem basisdata spasial yang makin meluas (Güting 1994, Worboy 1995, Shekhar dan Chawla 2003) telah merintis peningkatan perhatian bagi spatial data mining. Spatial data mining merupakan the extraction of implicit knowledge, spatial relations, or other patterns not explicitly stored in spatial databases (Koperski & Han 1995, diacu dalam Koperski et al. 1996).

Skema yang menggambarkan proses spatial data mining menurut Chawla et al. (2001) yang diilustrasikan pada Gambar 3.

Gambar 3. Proses Spatial Data Mining (sumber : Chawla et al. 2001).

2.6. Teknik Spatial Data Mining

Data mining merupakan area multidisiplin, dan terdapat banyak cara-cara baru untuk melakukan ekstraksi pola data. Ada tiga teknik data mining yang telah diterima secara umum, yaitu classification, clustering dan association rules (Shekhar & Chawla 2003).

Classification

Tujuan teknik klasifikasi adalah untuk menduga nilai sebuah atribut dari relasi berdasarkan nilai atribut-atribut lainnya dari relasi tersebut. Definisi lainnya menyatakan teknik klasifikasi memilih himpunan atribut dan nilai nilai atribut yang relevan, yang digunakan untuk secara efektif memetakan obyek spasial ke dalam kelas target yang telah didefinisikan sebelumnya.

Clustering

Teknik clustering merupakan contoh pembelajaran tak-terarahkan (unsupervised learning). Teknik ini berusaha mengelompokkan data tanpa memiliki pengetahuan awal tentang kluster atau jumlah kluster. Obyek spasial dikelompokkan sehingga obyek dalam satu kluster adalah mirip, dan obyek dalam kluster yang berbeda adalah tidak mirip. Clustering dapat dilakukan berdasarkan

11

kombinasi atribut non-spasial, atribut spasial, dan kedekatan obyek dalam ruang, waktu dan ruang-waktu.

Association Rules

Teknik ini bertujuan menemukan hubungan diantara atribut-atribut dalam sebuah relasi. Dalam konteks spasial, association rule melibatkan predikat spasial (topologi, jarak atau arah) dalam preseden atau anteseden-nya. Sebagai contoh rules dinyatakan dalam bentuk is_close (house, beach) Æ is_expensive(house) yang bermakna rumah yang dekat dengan pantai mungkin harganya mahal.

Disamping teknik classification, clustering dan association rules di atas, Miller dan Han (2001) menyebutkan beberapa teknik lain yaitu :

Outlier Detection, obyek spasial yang tidak masuk ke dalam kluster manapun disebut pencilan (outlier). Jadi outlier detection adalah masalah kebalikan dari clustering.

Spatial Trend Detection, teknik ini melibatkan pencarian pola perubahan dengan memperhatikan tetangga dari beberapa obyek spasial.

Geographic Characterization and Generalization, teknik ini menghasilkan deskripsi ringkas data berupa summary rules atau characteristics rule. Dalam data mining klasik (non-spasial), metode yang handal untuk menghasilkan summary rules adalah metode induksi berorientasi atribut (attribute-oriented induction).

2.7. Karakterisasi Spasial

Spatial association rule dinyatakan dalam bentuk:

P1 ^ ……….^ Pm Æ Q1^……….^Qn (c%)

Dimana paling tidak satu dari predikat P1, …. , Pm, Q1, …., Qn adalah predikat spasial dan c% adalah confidence yang mengindikasikan bahwa c% obyek yang memenuhi anteseden juga memenuhi konsekuen dari rule.

Untuk mengatasi keterbatasan tersebut, Ester et al. (2001) mendefinisikan karakterisasi spasial (spatial characterization) dari sekumpulan obyek target terhadap basisdata tempat obyek tersebut tersimpan sebagai “deskripsi dari sifat spasial dan non-spasial yang serupa bagi obyek target, tetapi bukan untuk

keseluruhan basisdata (a description of the spatial and non-spatial properties which are typical for the target objects, but not for the whole database)”. Sifat yang menjadi perhatian adalah frekuensi relatif nilai atribut non-spasial dan frekuensi relatif tipe obyek yang berbeda. Perbedaan frekuensi relatif dalam basisdata dengan frekuensi relatif dalam daerah target diperlihatkan pada Gambar 4.

Gambar 4. Frekuensi sampel dan perbedaannya

Atribut spasial dan non-spasial digambarkan dalam Gambar 5.

13

Berikut ini adalah beberapa batasan yang digunakan dalam teknik karakterisasi spasial :

Definisi 1 : Hubungan Spasial

Untuk melakukan karakterisasi spasial, tidak hanya sifat dari obyek target yang diperhatikan melainkan juga sifat obyek tetangga.Hubungan satu obyek dengan obyek tetangganya dapat dinyatakan dalam tiga bentuk (Ester et al, 2001): 1. Hubungan Topologi : berdasarkan batas, interior atau komplemen dari dua

obyek. Contoh hubungan yang mungkin terjadi adalah (Gambar 6):

Gambar 6. Contoh hubungan topologi

(sumber : Egenhofer et al. 1989 dalam Shekhar dan Chawla, 2003).

2. Hubungan Jarak : membandingkan jarak dua obyek dengan sebuah konstanta menggunakan operator pembanding aritmatik. Hubungan jarak dinyatakan sebagai Distance(O1,O2)σc dengan

O1 : obyek pertama, O2 : obyek kedua, σ : <, > atau =, c : konstanta.

Ilustrasi hubungan jarak diperlihatkan pada Gambar 7.

Gambar 7. Contoh hubungan jarak (sumber :Ester et al, 2001)

3. Hubungan Arah atau Orientasi : obyek pertama sebagai sistem koordinat virtual, quadrant dan half-plane menentukan arahnya (Gambar 8).

Gambar 8. Contoh hubungan arah (sumber :Ester et al, 2001)

Definisi 2 : (neighborhood graph and paths)

Ditetapkan neighborhood sebagai hubungan tetangga dan DB sebagai basisdata obyek spasial. Sebuah neighborhood graph GneighborDB =

(

N,E

)

adalah sebuah graph dengan node N=DB dan edge ENxN dimana sebuah edge e =(n1,n2) ada jika dan hanya jika terdapat neighbor(n1,n2). Hubungan neighbor(n1,n2) dapat berupa hubungan topologi, jarak atau arah. Gambar 9 memperlihatkan sebuah basisdata obyek spasial DB serta dua buah neighborhood graph dengan hubungan topologi meet dan hubungan arah north.

Gambar 9. Contoh Neighborhood Graph

Sebuah neighborhood path dengan panjang k didefinisikan sebagai untaian node [n1,n2,….nk] dimana neighbor (ni, ni+1) terjadi untuk semua niN,1≤i<k.

15

Definisi 3 : Operasi pada neighborhood graph

Terdapat beberapa operasi yang dilakukan pada sebuah neighborhood graph (graf tetangga) yaitu (Ester et al, 2001):

1. Neighbours:

Graphs x Objects x Predicates Æ Sets_of_objects

Operasi Neighbours menghasilkan himpunan semua obyek (set of objects) yang terhubung dengan object pada graph yang memenuhi kondisi yang dinyatakan dalam predicates.

2. Path:

Sets_of_objects Æ set_of_path

Operasi path menghasilkan semua path dengan panjang l yang dibentuk oleh sebuah elemen tunggal dari obyek.

3. Extensions:

Graphs x Sets_of_path x integer x predicates Æ sets_of_path

Operasi Extensions menghasilkan himpunan semua path (set_of_all_path) dengan panjang tertentu integer pada graph yang merupakan perpanjangan sebuah elemen dari path.

Definisi 4 : Filter Predikat (Predicates Filter)

Ketika bergerak dari sebuah obyek menuju obyek lainnya dalam graf, dapat digunakan beberapa filter yaitu (Ester et al, 2001):

1. Starlike Filter

Ketika memperpanjang sebuah path p = [n1,n2,….nk] dengan sebuah node nk+1, maka arah terakhir yang pasti (exact “final” direction) dari p tidak dapat digeneralisasi. Sebagai contoh, sebuah path dengan arah terakhir tenggara maka hanya dapat diperpanjang dengan sebuah node dari sebuah edge yang memiliki arah tenggara.

2. Variable Starlike Filter

Variable starlike filter memungkinkan path yang lebih halus, dengan hanya mensyaratkan ketika memperpanjang path p maka edge (nk, nk+1) paling tidak memenuhi arah awal yang pasti (exact “initial” direction) dari path p. Sebagai contoh, sebuah path dengan arah awal utara dapat diperpanjang sehingga arah path tersebut tetap utara atau menjadi tenggara.

3. Vertical Starlike Filter

Filter ini merupakan bentuk khusus dari starlike filter dimana filter kurang ketat ke arah vertikal dibandingkan ke arah horizontal. Filter ini digunakan jika memerlukan analisis lebih rinci ke arah vertikal.

Ilustrasi dari masing-masing filter dapat dilihat pada Gambar 10.

Gambar 10. Filter Predicates (sumber :Ester et al, 2001) Definisi 5 : Neighbourhood Index

Neighbourhood Index adalah sebuah tabel yang mencatat hubungan antarobyek dalam basisdata spasial. Neighbourhood index untuk DB dengan jarak

Dokumen terkait