IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006
SOFIYANTI INDRIASARI G64103046
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
ABSTRAK
SOFIYANTI INDRIASARI. Implementasi Fuzzy OLAPpada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan SRI NURDIATI.
Kurangnya pemanfaatan atau pengolahan terhadap gunung data yang sebenarnya dapat menghasilkan suatu informasi atau pengetahuan yang penting untuk mendukung pengambilan keputusan. Data Potensi Desa yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu sangat penting melakukan analisis data Podes secara efisien dan cepat. Data warehouse adalah tempat penyimpanan data terintegrasi yang dapat digunakan untuk query dan analisis. Operasi query ini dilakukan dengan On-line Analytical Processing (OLAP). Data real dijumpai sering kali mengandung informasi yang tidak tepat dan ketidakpastian (uncertain). Teori himpunan fuzzy digunakan untuk menangani masalah tersebut. Penelitian ini bertujuan membangun data warehouse untuk data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006 yang direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy dan mengimplementasikan operasi OLAP.
Ruang lingkup penelitian adalah dibatasi pada implementasi fuzzy OLAP untuk data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006. Sistem yang akan dibangun mengikuti arsitektur data warehouse tiga tingkat. Struktur data pada data warehouse digambarkan dengan skema galaksi. Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice, dice, dan pivot. Operasi untuk fuzzy OLAP dilakukan sesuai dengan konsep pengoperasian data multidimensi fuzzy.
Hasil penelitian ini adalah terbentukya data warehouse yang diimplementasikan dengan konsep fuzzy serta data warehouse untuk data crisp sebagai pelengkap penyajian informasi. Data warehouse yang dibangun menggunakan konsep fuzzy terlebih dahulu melalui tahapan praproses data dan proses clustering menggunakan algoritma FCM untuk mendapatkan himpunan fuzzy dan nilai derajat keanggotaan tiap atribut. Data warehouse tersebut memiliki 4 kubus data yaitu penduduk, rumah tangga, lahan, dan sekolah. Data dapat ditampilkan dalam bentuk crosstab atau grafik. Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp disajikan sebagai penunjang untuk mendapatkan informasi.
IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Oleh :
SOFIYANTI INDRIASARI G64103046
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul : Implementasi Fuzzy OLAPpada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Nama : Sofiyanti Indriasari
NIM : G64103046
Menyetujui:
Pembimbing I, Pembimbing II,
Imas S. Sitanggang, S.Si, M.Kom Dr. Ir. Sri Nurdiati, M.Sc
NIP 132 206 235 NIP 131 578 805
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131 473 999
PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil diselesaikan. Tema yang dipilih dalam
penelitian yang dilaksanakan sejak bulan Januari 2007 ini ialah data warehouse, dengan judul
Implementasi Fuzzy OLAPpada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Penyelesaian penelitian ini tidak terlepas dari bantuan berbagai pihak, karena itu penulis mengucapkan terima kasih sebesar-besarnya kepada:
1. Ayahanda Achmad Azhari dan Ibunda Syafa’atur Rofiah , Kakakku Sofyan Rizalanda, serta
adik-adikku Asrofi Hanafiah dan Asrofi Hanifah atas doa, kasih sayang, dan kehangatannya yang tidak pernah berhenti tercurah selama ini,
2. Ibu Imas S. Sitanggang, S.Si., M.Kom. selaku pembimbing I, Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku
pembimbing II dan Bapak Hari Agung Adrianto, S.Kom. selaku dosen penguji,
3. Keluarga besar Ibu Sri Nurdiati di Bogor yang telah menjadi keluarga kedua bagi penulis,
4. Kak Hendra dan Kak Ifnu atas kesabarannya menjawab pertanyaan penulis, serta Diku atas
tumpangannya mengangkut komputer untuk keperluan penelitian ini,
5. Sahabat penulis: Gibtha, Meynar, Firat, Pandi, Qwill, Ratih, Ghofar, Jemi, Hida, Dina, Vita, dan
Nanik atas saran, dukungan, kerjasama, bantuan, dan hiburannya,
6. Teman-teman seperjuangan Ilkomers 40 lainnya untuk pengalaman dan kenangan yang tak ternilai,
7. Mas Irvan atas bantuannya mencari referensi untuk penelitian ini dan Pak Soleh atas bantuan dan
nasehatnya,
8. Departemen Ilmu Komputer, staf dan dosen yang telah begitu banyak membantu baik selama
penelitian maupun pada masa perkuliahan.
Segala kesempurnaan hanya milik Allah SWT, semoga hasil penelitian ini dapat bermanfaat, Amin.
Bogor, Mei 2007
RIWAYAT HIDUP
Penulis dilahirkan di Blitar pada tanggal 5 Oktober 1984 dari ayah Achmad Azhari dan ibu Syafa’atur Rofiah. Penulis merupakan putri kedua dari empat bersaudara. Tahun 2003 penulis lulus dari SMU Negeri I Sidoarjo. Pada tahun yang sama penulis diterima di Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor melalui jalur USMI.
DAFTAR ISI
Halaman
DAFTAR TABEL... viii
DAFTAR GAMBAR... viii
DAFTAR LAMPIRAN ... viii
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan Penelitian ... 1
Ruang Lingkup Penelitian ... 1
Manfaat Penelitian ... 1
TINJAUAN PUSTAKA ... 1
Data Warehouse... 1
Model Data Multidimensi... 2
On-line Analytical Processing (OLAP) ... 2
Himpunan Fuzzy... 4
Fuzzy C-Means (FCM) ... 5
Ukuran Kevalidan Cluster... 5
Kubus Data Fuzzy... 6
Dimensi Fuzzy... 6
METODE PENELITIAN ... 7
Tahapan Penelitian... 7
Praproses Data... 7
Arsitektur Sistem ... 8
Lingkungan Pengembangan Sistem ... 8
HASIL DAN PEMBAHASAN ... 8
Praproses Data... 8
Tingkat Bawah (Bottom Tier)... 10
Tingkat Tengah (Middle Tier) ... 13
Tingkat Atas (Top Tier) ... 13
KESIMPULAN DAN SARAN ... 18
Kesimpulan ... 18
Saran... 19
DAFTAR PUSTAKA ... 19
DAFTAR TABEL
Halaman
1 Validasi atribut lahan bukan sawah untuk non pertanian 2006 ... 10
2 Validasi atribut lahan bukan sawah untuk non pertanian 2003 ... 10
3 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp... 10
4 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp... 10
5 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy... 11
6 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy... 11
DAFTAR GAMBAR
Halaman 1 Skema bintang (Han & Kamber 2001)... 22 Skema snowflake (Han & Kamber 2001)... 2
3 Skema galaksi (Han & Kamber 2001) ... 2
4 Contoh operasi roll-up (Han & Kamber 2001)... 3
5 Contoh operasi drill-down (Han & Kamber 2001) ... 3
6 Contoh operasi slice (Han & Kamber 2001)... 4
7 Contoh operasi dice (Han & Kamber 2001) ... 4
8 Contoh operasi pivot (Han & Kamber 2001) ... 4
9 Contoh kubus data fuzzy 3 dimensi (Alhajj & Mehmet 2003) ... 6
10 Contoh path pada dimensi fuzzy... 7
11 Tahap praproses data ... 7
12 Arsitektur tiga tingkat data warehouse (Han & Kamber 2001) ... 8
13 Skema galaksi untuk data crisp... 12
14 Skema galaksi untuk data fuzzy... 12
15 Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa... 14
16 Contoh operasi roll-up pada dimensi lokasi... 14
17 Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003. ... 15
18 Contoh tampilan modul_desa ... 16
19 Contoh tampilan modul_kecamatan... 17
20 Contoh tampilan modul_kabupaten ... 18
DAFTAR LAMPIRAN
Halaman 1 Atribut-atribut yang terpilih dari hasil ekstraksi ... 212 Hasil validasi cluster... 23
3 Contoh hasil clustering berupa linguistic dan derajat keanggotaan ... 29
4 Skema galaksi yang disesuaikan dengan kebutuhan software Oracle... 31
5 Skema relasi modul pendukung ... 32
6 Contoh tampilan fuzzy OLAP dan hasil operasinya... 35
7 Tampilan data yang dikombinasikan dengan bentuk visualisasi model graph... 38
8 Tampilan query builder... 38
PENDAHULUAN
Latar Belakang
Dewasa ini, ketersediaan data semakin melimpah, apalagi ditunjang dengan banyaknya kegiatan yang sudah dilakukan secara terkomputerisasi. Namun seringkali data tersebut hanya disimpan tanpa diolah lebih lanjut untuk keperluan di masa mendatang. Padahal jika dianalisis lebih dalam, data tersebut dapat menghasilkan informasi atau pengetahuan yang penting dan berharga. Data Potensi Desa (Podes) yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu sangat penting dilakukan analisis data Podes secara efisien dan cepat.
Data warehouse adalah tempat penyimpanan data terintegrasi yang dapat digunakan untuk query dan analisis. Operasi query ini dilakukan
dengan On-line Analytical Processing (OLAP).
OLAP akan menghasilkan data dalam bentuk
ringkasan. Dengan operasi ini query dapat
dijalankan lebih mudah dan lebih efisien. OLAP muncul dengan sebuah cara pandang data multidimensi. Cara pandang multimensi ini didukung oleh teknologi basis data multidimensi. Data warehouse dan On-Line Analytical Processing (OLAP) merupakan elemen penting dalam mendukung proses pengambilan keputusan.
Data real yang dijumpai sering kali mengandung informasi yang tidak tepat dan
ketidakpastian (uncertain). Teori himpunan
fuzzy digunakan untuk menangani masalah tersebut.
Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Membangun data warehouse untuk data
Potensi Desa tahun 2003 dan 2006. Aplikasi yang dibangun mengolah data yang direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy.
2. Mengimplementasikan operasi-operasi
OLAP, yaitu roll-up, drill-down, slice, dice, dan pivot dengan menggunakan pendekatan fuzzy.
Ruang Lingkup Penelitian
Penelitian ini dibatasi pada implementasi fuzzy OLAP pada data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006 yang bersumber dari Badan Pusat Statistik (BPS). Penelitian ini
akan menghasilkan aplikasi fuzzy OLAP yang
dapat menampilkan informasi untuk mendukung proses pengambilan keputusan.
Manfaat Penelitian
Aplikasi yang dihasilkan pada penelitian ini diharapkan dapat digunakan oleh pihak yang berkepentingan untuk mendapatkan informasi yang menarik dan akurat sebagai pendukung proses pengambilan keputusan terkait dengan data Potensi Desa. Sistem diharapkan dapat menyediakan informasi ringkas dan jelas secara cepat melalui operasi-operasi OLAP seperti roll-up, drill-down, slice,dice, dan pivot.
TINJAUAN PUSTAKA
Data Warehouse
Data Warehouse adalah sekumpulan data berorientasi subjek, terintegrasi, time-variant, dan non-volatile yang mendukung proses manajemen pembuatan keputusan (Inmon 1996).
Kata kunci dari pengertian data warehouse di
atas adalah (Han & Kamber 2001):
• Berorientasi subjek: data warehouse
diorganisasikan berdasarkan subjek-subjek utama, seperti pelanggan, produk atau
penjualan. Data warehouse menyediakan
tampilan yang sederhana dan ringkas untuk subjek tertentu dengan menghilangkan data yang tidak berguna dalam proses pembuatan keputusan.
• Terintegrasi: data warehouse dibangun
dengan mengintegrasikan berbagai sumber data yang heterogen, seperti basis data relasional, flat file, dan transaksi on-line. Teknik pembersihan dan integrasi data digunakan untuk memastikan data tetap konsisten.
• Time-variant: data disimpan untuk menyediakan informasi berdasarkan kejadian yang sudah lewat.
Model Data Multidimensi
Model data multidimensi menampilkan data dalam bentuk kubus data. Kubus data memungkinkan data dimodelkan dan ditampilkan dalam dimensi banyak. Kubus data
disebut juga cuboid. Pola-pola cuboid dapat
dibuat apabila diberikan satu kumpulan dimensi. Masing-masing pola menampilkan data pada tingkat kesimpulan yang berbeda-beda (Han & Kamber 2001).
Untuk menggambarkan hubungan antardata pada data multidimensi digunakan skema
multidimensi. Pada data warehouse, skema
merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema
ditentukan berdasarkan kebutuhan data
warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2001):
• Skema bintang (star schema)
Skema bintang adalah skema data
warehouse yang paling sederhana. Skema ini disebut skema bintang karena hubungan antara tabel dimensi dan tabel fakta menyerupai bintang di mana satu tabel fakta dihubungkan dengan beberapa tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan sudut-sudutnya adalah tabel-tabel dimensi. Bentuk skema bintang dapat dilihat pada Gambar 1. Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan
kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang cepat.
Gambar 1 Skema bintang (Han & Kamber 2001)
• Skema snowflake (snowflake schema)
Skema snowflake adalah variasi dari skema bintang di mana beberapa tabel dimensi dinormalisasi, jadi dihasilkan beberapa tabel
tambahan. Bentuk skema snowflake dapat
dilihat pada Gambar 2. Keuntungan yang didapat dengan menggunakan skema ini
adalah penghematan memory, tapi waktu yang
dibutuhkan untuk pemrosesan query menjadi
lebih lama.
Gambar 2 Skema snowflake (Han & Kamber 2001)
• Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel fakta berbagi tabel dimensi. Bentuk skema galaksi dapat dilihat pada Gambar 3. Keuntungan menggunakan skema ini adalah menghemat memory dan mengurangi kesalahan yang mungkin terjadi.
Gambar 3 Skema galaksi (Han & Kamber 2001)
On-line Analytical Processing (OLAP)
OLAP adalah operasi basis data untuk mendapatkan data dalam bentuk ringkasan dengan menggunakan agregasi sebagai mekanisme utama. OLAP menyediakan tampilan data yang fleksibel dari sudut pandang yang
berbeda dan menyediakan lingkungan yang
user-friendly untuk membantu analisis data.
• Roll-up
Operasi ini melakukan pengelompokan pada kubus data dengan cara mengurutkan suatu hirarki konsep secara menaik (ascending) atau mereduksi dimensi. Contoh
operasi roll-up untuk kubus data penjualan
dapat dilihat pada Gambar 4.
Contoh :
Suatu hirarki lokasi: kota < provinsi < negara
Operasi roll-up melakukan pengelompokan
dengan mengurutkan hirarki lokasi dari tingkat kota sampai pada tingkat negara.
• Drill-down
Drill-down adalah kebalikan dari roll-up. Drill-down dapat dilakukan dengan cara mengurutkan suatu hirarki konsep secara
menurun (descending) atau dengan
menambahkan nilai dimensi. Contoh operasi drill-down untuk kubus data penjualan dapat dilihat pada Gambar 5.
Contoh :
Suatu hirarki waktu: bulan < kuartal < tahun
Drill-down melakukan pengelompokan dengan mengurutkan hirarki waktu dari tingkat tahun ke tingkat yang lebih detil yaitu tingkat bulan.
• Slice dan dice
Operasi slice melakukan pemilihan satu
dimensi dari kubus data sehingga
menghasilkan bagian kubus (subcube). Contoh
operasi slice untuk kubus data penjualan dapat
dilihat pada Gambar 6. Operasi dice
menghasilkan bagian kubus (subcube) dengan
melakukan pemilihan dua atau lebih dimensi.
Contoh operasi dice untuk kubus data
penjualan dapat dilihat pada Gambar 7. • Pivot (rotate)
Pivot adalah operasi yang memutar koordinat data pada tampilan dengan tujuan untuk menyediakan alternatif tampilan data.
Contoh operasi pivot untuk kubus data
penjualan dapat dilihat pada Gambar 8.
Gambar 4 Contoh operasi roll-up (Han & Kamber 2001)
Gambar 6 Contoh operasi slice (Han & Kamber 2001)
Gambar 7 Contoh operasi dice (Han & Kamber 2001)
Gambar 8 Contoh operasi pivot (Han & Kamber 2001)
Himpunan Fuzzy
Konsep logika fuzzy pertama kali
diperkenalkan oleh Prof. Lutfi A Zadeh dari Universitas California pada bulan Juni 1965. Logika fuzzy merupakan generalisasi dari logika klasik yang hanya memiliki dua nilai
keanggotaan 0 dan 1. Dalam logika fuzzy nilai
kebenaran suatu pernyataan berkisar dari sepenuhnya benar ke sepenuhnya salah. Inti dari
himpunan fuzzy yaitu fungsi keanggotaan yang
menggambarkan hubungan antara domain
himpunan fuzzy dengan nilai derajat
keanggotaan. Dengan teori himpunan fuzzy
berbeda dalam masing-masing himpunan. Derajat keanggotaan menujukkan nilai keanggotaan suatu objek pada suatu himpunan. Nilai keanggotaan ini berkisar antara 0 sampai 1 (Cox 2005). Teori himpunan fuzzy telah banyak
digunakan dalam pembangunan sistem data
mining. Alhajj dan Mehmet (2003) telah
menggunakan himpunan fuzzy untuk
membangun kubus data fuzzy.
Fuzzy C-Means (FCM)
Menurut Jang et al. (1997), Fuzzy C-Means
merupakan algoritma clustering data di mana
setiap titik data masuk dalam sebuah cluster
dengan ditandai oleh derajat keanggotaan. FCM
membagi sebuah koleksi dari n data vektor xj
(j=1, 2, …, n) menjadi c cluster, dan
menemukan sebuah pusat cluster (center) untuk tiap kelompok dengan meminimalisasi ukuran dari fungsi objektif. Pada FCM hasil dari clustering adalah sebuah titik data dapat
menjadi anggota untuk beberapa cluster yang
ditandai oleh derajat keanggotaannya antara 0 dan 1.
Berikut tahapan clustering menggunakan
algoritma FCM:
1. Inisialisasi keanggotaan matriks U yang
berisi derajat keanggotan terhadap cluster dengan nilai antara 0 dan 1, sehingga
n u
c
i
j ij 1, 1,...,
1 = ∀ =
∑
= .2. Penghitungan c sebagai pusat cluster, ci , i = 1, …, c dengan menggunakan
∑
∑
= = = n j m ij n j j m ij i u x u c 1 1 ) ( ) ) (( .3. Penghitungan fungsi objektif (Ji):
∑∑
∑
= = = = c i n j ij m ij c i ic J u d
c c U J 1 2 1 1,..., )
,
(
di mana:
• uij adalah elemen matriks U yang
bernilai antara 0 dan 1,
• dij = ||ci - xj|| adalah jarak antara pusat cluster ke-i dan titik data ke-j,
• ci adalah pusat cluster ke-i,
• m
∈
[1,∞
] adalah parameterfuzzifikasi. Nilai m yang umum
digunakan untuk clustering data
fuzzy adalah sama dengan 2. Kemudian melihat kondisi berhenti : • Jika (|Jt –Jt-1| < nilai toleransi
terkecil yang diharapkan) atau (t > maksimal iterasi) maka proses berhenti.
• Jika tidak : t = t + 1, mengulangi
langkah 3.
4. Penghitungan matriks U baru menggunakan
formula berikut: ( ) ∑ ⎟⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = − = c k m ij d d u kj ij 1 1 2 1
Ukuran Kevalidan Cluster
Menurut Xie dan Beni (1991), ukuran
kevalidan cluster merupakan proses evaluasi
hasil clustering untuk menentukan cluster mana
yang terbaik. Kevalidan sebuah cluster (S)
ditentukan oleh dua hal yaitu: ukuran kedekatan antaranggota pada tiap cluster (compactness),
dan ukuran keterpisahan antarcluster satu
dengan cluster yang lainnya (separation).
Semakin kecil nilai S, maka cluster tersebut
semakin valid. 2 , 1 1 2 2
min i j
j i c i n j j i ij V V n X V S − − =
∑∑
= = µ . dengan: • n X V c i n j j i ij∑ ∑
= = − 1 1 2 2 || || µadalah nilai
compactness,
• n adalah banyaknya titik data,
• V adalah pusat cluster,
•
∑
= n j j i d 12 adalah variation dari cluster
ke-i,
• dij adalah jarak antara Xj dan Vi yang diboboti oleh derajat keanggotaan fuzzy titik ke-j pada cluster ke-i,
• 2
,
min i j j i
V
V − adalah separation yang
merupakan jarak minimum antarpusat cluster.
Kubus Data Fuzzy
Himpunan fuzzy dapat didefinisikan untuk
atribut kuantitatif, misalkan x, dengan fungsi
keanggotaan setiap himpunan fuzzy sedemikian
sehingga nilai dari x memenuhi persyaratan berada dalam satu atau lebih
himpunan-himpunan fuzzy tersebut. Misalkan Fx =
} ,..., , { 1 2 n
x x x f f
f adalah himpunan dari n himpunan
fuzzy untuk atribut x. Fungsi keanggotaan dari
himpunan fuzzy ke-j dalam Fx, dinotasikan
dengan j
x
f
µ , menyatakan pemetaan dari
domain untuk x ke dalam interval [0, 1]. Jika ) v ( j x f
µ = 1 maka nilai v dari x secara penuh
merupakan anggota untuk himpunan fuzzy fxj. Jika j(v)
x
f
µ = 0 berarti bahwa v bukanlah
anggota dari fxj. Semua nilai yang lain di
antara 0 dan 1, menentukan keanggotaan parsial (Alhajj & Mehmet 2003). Konsep tersebut selanjutnya digunakan untuk membangun kubus data fuzzy.
Gambar 9 menunjukkan kubus data fuzzy 3
dimensi, di mana setiap dimensi memiliki dua atribut dan banyaknya fungsi keanggotaan dari setiap atribut berkisar 2 dan 3. Dalam Gambar 9, setiap dimensi dari kubus data mengandung
∑
= + k i i n 11 nilai dengan ni adalah banyaknya
fungsi keanggotaan dari atribut xi, k adalah
banyaknya atribut, keduanya dalam dimensi X, dan “+1” menunjukkan nilai total di mana setiap sel menyimpan nilai agregasi dari baris-baris sebelumnya. Seperti halnya dalam kubus data crisp, terhadap kubus data fuzzy dapat diaplikasikan operasi-operasi seperti dice, slice, roll-up dan drill-down.
Gambar 9 Contoh kubus data fuzzy 3 dimensi (Alhajj & Mehmet 2003)
Dimensi Fuzzy
Elemen (sel) pada dimensi data crisp dapat digabungkan menjadi satu elemen pada level di atasnya. Untuk kasus fuzzy, suatu elemen dapat direlasikan dengan lebih dari satu elemen pada level di atasnya dan derajat dari relasi tersebut
berada pada interval [0,1]. Kinship relation
mendefinisikan derajat dari relasi tersebut sebagai berikut (Molina et al. 2006 ):
Untuk tiap pasangan level li dan lj di mana lj
∈
Hi, didefinisikanµ
ij : li × l j → [0,1]Setiap derajat dari elemen-elemen dimasukkan di dalam satu elemen pada level parent dapat dilakukan dengan menggunakan relasi tersebut. Dengan menggunakan relasi antarelemen dalam dua level berurutan, dapat didefinisikan relasi antara tiap-tiap pasangan nilai dalam level yang berbeda di suatu dimensi
yang disebut extended kinship relation. Untuk
menghasilkan suatu nilai agregasi, dilakukan pertimbangan terhadap semua kemungkinan
path antarelemen dalam hirarki. Masing-masing
nilai dikalkulasikan dengan mengagregasikan kinship relation pada dua level menggunakan
operator
⊗
dan⊕
di mana operator tersebutsecara berurutan adalah t-norm dan t-conorm
Gambar 10 Contoh path pada dimensi fuzzy
Gambar 10 menunjukkan path yang akan
menjadi alur untuk mengkalkulasikan nilai agregasi. Proses kalkulasi nilai-nilai dari contoh tersebut adalah sebagai berikut:
(1
⊗
0.7)⊕
(1⊗
0.3)⊕
(1⊗
0) = 0.7METODE PENELITIAN
Tahapan Penelitian
Tahapan penelitian terdiri dari empat tahapan yaitu:
1. Pengumpulan dataset yang terdiri dari
atribut numerik
2. Tahapan praproses data meliputi ekstraksi,
pembersihan, transformasi, dan pemuatan
(load). Tahap-tahap praproses data dapat
dilihat pada Gambar 11.
Gambar 11 Tahap praproses data
3. Perancangan dan konstruksi data
multidimensi fuzzy
4. Perancangan antarmuka kueri Fuzzy OLAP.
Praproses Data
Praproses data adalah proses yang harus
dilakukan sebelum membuat data warehouse.
Proses-proses tersebut adalah:
1 Ekstraksi (extraction)
Ekstraksi adalah pengambilan data yang relevan untuk analisis dari basis data
operasional sebelum masuk ke data
warehouse. Pada ekstraksi, atribut-atribut dan record-record yang diinginkan dipilih dan diambil dari basis data operasional. Hal ini perlu dilakukan karena tidak semua elemen data berguna dalam analisis dan pembuatan keputusan. Elemen data yang diperlukan adalah atribut pada data Podes Jawa Barat tahun 2003 dan 2006 yang bersifat numerik agar dapat
diimplementasikan konsep fuzzy dan
merupakan atribut data yang mengandung konsep hirarki agar dapat terlihat pola agregasi pada saat pengimplementasian operasi OLAP, serta atribut yang terdapat pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 antartahun.
2 Pembersihan (cleaning)
Pada pembersihan semua kesalahan dihilangkan dan diperbaiki. Pembersihan dilakukan untuk menghilangkan kesalahan (error). Kesalahan yang umum terjadi adalah nilai yang hilang (missing values), noise, dan data yang tidak konsisten. Pembersihan dilakukan dengan mengisi nilai yang kosong dan menghilangkan noise.
3 Transformasi (transformation)
Pada transformasi, data Podes Jawa Barat tahun 2003 dan 2006 yang terpilih diberikan format dan nama yang umum. Proses transformasi dilakukan agar data tetap konsisten. Transformasi yang paling penting adalah transformasi nama agar tidak ada nama atribut yang sama atau atribut yang sama memiliki nama yang berbeda pada basis data yang berbeda. Setelah transformasi nama, semua elemen data harus dikonversikan ke format yang sama.
Transformasi selanjutnya adalah transformasi nilai dari data crisp ke data fuzzy. Pembentukan data fuzzy dilakukan
melalui proses clustering menggunakan
himpunan fuzzy dan derajat keanggotaannya. Langkah selanjutnya adalah menentukan
validitas cluster. Tujuan dilakukannya
validasi terhadap fuzzy clustering yaitu
untuk mencari skema clustering di mana
sebagian besar vektor dari suatu himpunan
datamenunjukkan derajat keanggotaan yang
tinggi dalam suatu cluster. Pengukuran
kevalidan cluster dilakukan menurut metode Xie dan Beni (1991) yang menjelaskan
bahwa kevalidan sebuah cluster (S)
ditentukan oleh dua hal yaitu: ukuran
kedekatan antaranggota pada tiap cluster
(compactness), dan ukuran keterpisahan
antarcluster satu dengan cluster yang
lainnya (separation). Semakin kecil nilai S, maka cluster tersebut semakin valid.
4 Pemuatan (loading)
Setelah tahap ekstraksi, pembersihan, dan transformasi dilakukan, maka data
dapat dimasukkan ke data warehouse.Data
yang dimasukkan ke dalam data warehouse
adalah data crisp dan data fuzzy.
Arsitektur Sistem
Sistem yang akan dibangun mengikuti arsitektur data warehouse tiga tingkat seperti terlihat pada Gambar 12:
Gambar 12 Arsitektur tiga tingkat data warehouse (Han & Kamber 2001)
1 Tingkat bawah (bottom tier)
Tingkat bawah arsitektur data
warehouse adalah server basis data warehouse yang biasanya sebuah sistem basis data relasional. Tahap ini data
diambil dari basis data operasional dan sumber eksternal lainnya. Data disimpan sebagai data warehouse.
2 Tingkat tengah (middle tier)
Pada tingkat tengah, operasi OLAP
dilakukan pada data warehouse yang
sudah terbentuk. Implementasi operasi
OLAP disesuaikan dengan struktur data
Podes Jawa Barat 2003 dan 2006, yang mencakup struktur hirarki data. Pada penelitian ini, operasi OLAP diimplementasikan sesuai dengan
aturan-aturan pada konsep fuzzy, termasuk
fungsi agregasi fuzzy yang digunakan.
3 Tingkat atas (top tier)
Pada tingkat atas, data warehouse
telah terbentuk dan digunakan oleh pengguna. Perangkat analisis berupa perangkat query dan grafik dibuat untuk memudahkan analisis data.
Lingkungan Pengembangan Sistem
Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam pengembangan sistem adalah sebagai berikut:
a. Perangkat keras berupa komputer personal dengan spesifikasi:
- Processor: AMD AthlonTM XP 2700+ - Memory: 768 MB
- Harddisk 40 GB - Keyboard dan mouse
- Monitor
b. Perangkat lunak:
- Sistem operasi: Microsoft Windows
XP Professional
- DBMS: Oracle 10g Release 2
- Data Warehouse dan OLAP: Analytic Workspace Manager dan Measure Data Viewer
- MATLAB 7 untuk clustering data
- Microsoft SQL Server 2000 dan
Microsoft Excel untuk praproses data.
HASIL DAN PEMBAHASAN
Praproses Data
1. Ekstraksi
Tahapan ekstraksi adalah melakukan pemilihan atribut yang relevan untuk analisis yaitu atribut numerik, atribut berhirarki, dan atribut yang ada pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 antartahun. Atribut pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 yang terpilih adalah atribut lokasi meliputi desa, kecamatan, dan kabupaten di Jawa Barat, serta atribut yang berhubungan dengan kependudukan yang meliputi jumlah penduduk dan jumlah rumah tangga prasejahtera 1 serta jumlah keluarga keseluruhan di masing-masing desa, luasan lahan, dan pendidikan yang meliputi jumlah sekolah dari TK sampai SMA. Atribut-atribut yang terpilih dan deskripsinya dapat dilihat pada Lampiran 1.
2. Pembersihan
Tahap pembersihan data tidak perlu dilakukan, karena data yang digunakan sudah bersih.
3. Transformasi
Tahap transformasi adalah memberikan format yang umum pada data, meliputi menyamakan nama atribut yang sama pada data tahun 2003 dan 2006 atau memberikan nama atribut dengan nama yang umum sehingga atribut antartahun menjadi seragam dan lebih informatif. Selain itu, juga dilakukan penggabungan atribut pada data tahun 2003 karena pada data tahun 2006 beberapa atribut yang sesuai dengan atribut data tahun 2003 dijadikan satu. Pembentukan atribut baru juga dilakukan yang bertujuan untuk mendefinisikan secara lengkap hirarki data. Atribut baru yang dibuat adalah atribut ”Keluarga bukan Prasejahtera I ”. Nilai-nilai atribut tersebut didapatkan dari mengurangi nilai atribut jumlah keluarga keseluruhan dengan nilai atribut jumlah keluarga Prasejahtera I, sehingga nantinya akan dapat didefinisikan hirarki data untuk dimensi rumah tangga.
Pada penelitian kali ini, data yang akan
dimasukkan ke dalam data warehouse
bukan hanya data fuzzy tetapi juga data
dalam bentuk crisp. Praproses data yang
telah dilakukan sebelumnya adalah
menghasilkan data crisp, untuk itu perlu
adanya proses lanjutan untuk menghasilkan
data dalam bentuk fuzzy. Pembentukan data
fuzzy dilakukan dengan proses clustering terhadap seluruh atribut yang telah terpilih dengan menggunakan algoritma FCM untuk
menentukan himpunan fuzzy dan fungsi
keanggotaannya.
Proses clustering menggunakan algoritma
FCM dapat menentukan jumlah cluster yang
diinginkan. Akan tetapi, untuk memilih cluster
yang terbaik dilakukan pengukuran kevalidan cluster, sehingga proses clustering dicobakan
berulang-ulang dengan jumlah cluster yang
berbeda-beda kemudian dilihat nilai kevalidan cluster. Cluster yang valid adalah yang memiliki nilai kevalidan cluster (S) terkecil.
Pada penelitian kali ini, penentuan
himpunan fuzzy tidak hanya berdasarkan pada
ukuran kevalidan cluster tetapi juga
memperhatikan kesamaan jumlah cluster pada
dimensi yang sama. Hal ini dilakukan dengan
pertimbangan bahwa dalam struktur data
warehouse atribut dalam satu dimensi yang
sama harus sama jumlahnya termasuk measure
yang digunakan juga harus sama.
Clustering dilakukan terpisah antara atribut-atribut dalam data tahun 2003 dan 2006, sehingga memungkinkan terjadinya
ketidaksamaan jumlah cluster yang valid
antartahun pada dimensi yang sama. Jika terjadi ketidaksesuaian maka dilakukan penyesuaian dengan memilih selisih nilai S terkecil. Atribut yang memiliki selisih S terkecil
akan dipilih cluster yang jumlahnya sama
dengan atribut yang berada pada dimensi yang sama dan memiliki selisih nilai S lebih besar.
Jadi pemilihan cluster pada atribut tersebut
bukan berdasarkan pada nilai S terkecilnya, tapi disesuaikan dengan nilai S terkecil atribut lain dalam satu dimensi. Selain itu, percobaan untuk
menentukan jumlah cluster hanya dibatasi
sampai lima cluster saja. Hal ini disebabkan jika
lebih dari lima cluster yang terbentuk maka
variabel linguistic yang dihasilkan menjadi
kurang informatif.
Pada Tabel 1 nilai S terkecil sama dengan
0,00117 saat jumlah cluster yang digunakan
sama dengan 2, sedangkan pada Tabel 2 nilai S terkecil sama dengan 0,00003 yang terjadi pada
nilai S antara jumlah cluster dua dan tiga pada Tabel 1 sama dengan 0.10084. Selisih selisih nilai S antara jumlah cluster dua dan tiga pada Tabel 2 sama dengan 0.00001. Oleh karena selisih nilai S antara jumlah cluster dua dan tiga pada Tabel 2 lebih sedikit daripada selisih nilai S antara jumlah cluster dua dan tiga pada Tabel 1, maka pemilihan jumlah cluster untuk Tabel 2
disesuaikan dengan jumlah cluster valid yang
terbentuk pada Tabel 1, jadi jumlah cluster yang terpilih untuk dua atribut tersebut adalah sama dengan dua cluster.
Tabel 1 Validasi atribut lahan bukan sawah untuk non pertanian 2006
Tabel 2 Validasi atribut lahan bukan sawah untuk non pertanian 2003
Jumlah
Cluster Compactness Separation S
2 4,69E+05 1,19E+10 0,00004
3 7,70E+04 2,68E+09 0,00003
4 4,54E+04 6,15E+04 0,73807
5 2,78E+03 4,48E+04 0,06198
Hasil keseluruhan pengukuran kevalidan cluster dapat dilihat pada Lampiran 2 dan
beberapa contoh hasil dari proses clustering
yaitu derajat keanggotaan dan linguistic yang sesuai dengan jumlah cluster validyang terpilih dapat dilihat pada Lampiran 3.
4. Pemuatan (loading)
Tahap pemuatan atau loading adalah tahap
pemasukan data yang sudah siap ke data
warehouse.
Tingkat Bawah (Bottom Tier)
Pada tingkat ini data diambil dari basis data operasional. Selain itu, dilakukan penyesuaian
struktur data terhadap skema data warehouse.
Data yang dimasukkan ke dalam data
warehouse disesuaikan dengan rancangan skema data multidimensi yang dinginkan, untuk menggambarkan hubungan antardata. Sebelum skema didefinisikan, terlebih dahulu dilakukan
pembuatan tabel-tabel yang nantinya akan digunakan untuk mendefinisikan hubungan antardata yang digambarkan pada skema. Tabel-tabel yang perlu dibuat adalah Tabel-tabel dimensi yang terlihat pada Tabel 3 dan 5, serta dan tabel fakta yang terlihat pada Tabel 4 dan 6.
Tabel 3 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp
Nama Tabel Deskripsi
Dim_Lokasi_Crisp Berisikan kode dan
lokasi atau daerah dari tingkat desa sampai tingkat provinsi di Jawa Barat
Dim_Tahun_Crisp Berisikan kode dan
tahun data yang digunakan
Dim_Penduduk_Crisp Berisikan kode dan
penjelasan tentang struktur penduduk
Dim_Rt_Crisp Berisikan kode dan
penjelasan struktur rumah tangga
Dim_Lahan_Crisp Berisikan kode dan
penjelasan struktur atau macam-macam pengelompokan lahan
Dim_Sekolah_Crisp Berisikan kode dan
penjelasan struktur atau macam-macam sekolah
Tabel 4 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp
Nama Tabel Deskripsi
Fakta_Penduduk_Crisp Berisikan kode dan
nilai numerik atau measure data crisp penduduk yang berupa jumlah penduduk dalam satuan orang Jumlah
Cluster Compactness Separation S
2 4,E+04 3,E+07 0,00117
3 2,E+04 2,E+05 0,10201
4 9,E+03 1,E+05 0,06102
Tabel 4 lanjutan
Nama Tabel Deskripsi
Fakta_Lahan_Crisp Berisikan kode dan
nilai numerik atau measure data crisp lahan yang berupa luas lahan dalam satuan Ha
Fakta_Sekolah_Crisp Berisikan kode dan
nilai numerik atau measure data crisp sekolah yang berupa jumlah sekolah dalam satuan unit
Fakta_Rt_Crisp Berisikan kode dan
nilai numerik atau measure data crisp rumah tangga yang berupa jumlah rumah tangga dalam satuan keluarga
Tabel 5 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy
Nama Tabel Deskripsi
Dim_Lokasi Berisikan kode dan
lokasi atau daerah dari tingkat desa sampai tingkat provinsi di Jawa Barat
Dim_Tahun Berisikan kode dan
tahun data yang digunakan
Dim_Penduduk Berisikan kode dan
penjelasan tentang struktur penduduk termasuk linguistic penduduk
Dim_Rt Berisikan kode dan
penjelasan tentang struktur rumah tangga termasuk linguistic rumah tangga
Tabel 5 lanjutan
Nama Tabel Deskripsi
Dim_Lahan Berisikan kode dan
penjelasan struktur atau macam-macam pengelompokan lahan termasuk linguistic lahan
Dim_Sekolah Berisikan kode dan
penjelasan struktur atau macam-macam sekolah termasuk linguistic sekolah
Tabel 6 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy
Nama Tabel Deskripsi
Fakta_Penduduk Berisikan kode dan
nilai numerik atau measure yang berupa nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Rt Berisikan kode dan
nilai numerik atau measure yang berupa nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Lahan Berisikan kode dan
nilai numerik atau measure yang berupa nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Sekolah Berisikan kode dan
nilai numerik atau measure yang berupa nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Setelah itu, dilakukan perancangan skema yang digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema
ditentukan berdasarkan kebutuhan data
galaksi untuk menggambarkan hubungan antardata. Skema galaksi untuk data crisp yang
terbentuk dapat dilihat pada Gambar 13 dan
skema galaksi untuk data fuzzy terlihat pada
Gambar 14.
Skema yang terlihat pada Gambar 13 dan 14 akan digunakan sebagai kerangka untuk
pembangunan data warehouse utama.
Masing-masing skema memiliki enam tabel dimensi yang mendefinisikan atribut-atribut kategorik serta hirarki data dan memiliki 4 tabel fakta yang berisikan nilai-nilai numerik berupa primary key dari setiap dimensi yang
dihubungkan serta nilai measure yang akan
dioperasikan. Dimensi lokasi dan dimensi tahun
digunakan secara bersama-sama (shared). Pada
tiap-tiap skema terbentuk masing-masing empat kubus data sesuai dengan subjeknya. Kubus data dibentuk berdasarkan kombinasi dari beberapa tabel dimensi dan tabel fakta yang saling berhubungan seperti yang telah tergambarkan pada skema yang ditunjukkan pada Gambar 13 dan 14.
Untuk keperluan implementasi, dibuat skema galaksi yang menyesuaikan keperluan software Oracle. Skema tersebut merupakan pengembangan dari skema yang terlihat pada Gambar 13 dan 14. Skema yang dihasilkan dapat dilihat di Lampiran 4.
Data warehouse dalam bentuk crisp terdiri dari empat kubus data dengan masing-masing subjeknya yaitu penduduk, rumah tangga, lahan, dan sekolah. Pada tiap-tiap kubus data memiliki measure secara berurutan sesuai subjeknya adalah jumlah penduduk (orang), jumlah rumah tangga (keluarga), luas (Ha), dan jumlah sekolah (unit)
Data warehouse dalam bentuk fuzzy juga terdiri dari empat kubus data dengan subjek
yang sama dengan data warehouse crisp. Hal
yang membedakan adalah pada data warehouse
fuzzy memiliki measure yang merupakan nilai derajat keanggotaan pada tiap-tiap fungsi
keanggotaan hinpunan fuzzy yang telah
didefinisikan pada masing-masing dimensinya.
Misalnya nilai fuzzy penduduk pada kubus data
penduduk merupakan nilai derajat keanggotaan terhadap variabel linguistic banyak dan sedikit yang telah terdefinisi pada dimensi penduduk.
Gambar 13 Skema galaksi untuk data crisp
Selain melakukan loading data crisp dan
data fuzzy ke dalam dua warehouse yang
terpisah, dibuat juga modul tambahan berisi table-tabel pendukung yang bertujuan untuk menjelaskan tentang pemaknaan nilai-nilai agregasi yang terdapat pada kubus data fuzzy, serta penggabungan antara nilai crisp dan fuzzy. Modul yang dibangun ada tiga yaitu modul_desa, modul_kecamatan, dan modul_kabupaten. Rancangan skema relasi untuk masing-masing modul dapat dilihat pada Lampiran 5.
Tingkat Tengah (Middle Tier)
Pada tingkat tengah adalah implementasi
operasi OLAP pada data warehouse yang sudah
terbentuk. Operasi OLAP yang
diimplementasikan meliputi operasi roll-up,
drill-down, slice, dice, dan pivot. Pada
penelitian ini, operasi OLAP pada data crisp
menggunakan fungsi agregasi biasa yaitu
menggunakan operator agregasi berupa sum,
seperti yang terlihat pada Gambar 17 bahwa untuk nilai di level kecamatan, kabupaten, dan provinsi adalah hasil penjumlah nilai sel-sel di
level bawahnya. Untuk data fuzzy operasi
OLAPdiimplementasikan sesuai dengan
aturan-aturan pada konsep fuzzy. Untuk menghasilkan
suatu nilai agregasi, dilakukan pertimbangan
terhadap semua kemungkinan path antarelemen
dalam hirarki. Masing-masing nilai
dikalkulasikan dengan mengagregasikan kinship
relation menggunakan operator
⊗
dan⊕
di mana operator tersebut secara berurutan adalah t-norm dan t-conorm. Nilai pada level yangsaling berurutan di suatu path dikalkulasikan
dengan menggunakan operator t-norm
kemudian hasil dari kalkulasi tiap-tiap path
diagregasikan menggunakan operator t-conorm
untuk mendapatkan nilai agregasi pada level
yang lebih tinggi. Fungsi t-norm adalah
mengambil nilai minimum dari path yang
levelnya berurutan, sedangkan fungsi t-conorm adalah mengambil nilai maksimum dari hasil
kalkulasi pada tiap-tiap path yang telah
dikalkulasikan dengan fungsi t-norm
sebelumnya. Misalnya seperti yang terlihat pada Gambar 15 desa Malasari untuk kasus penduduk laki-laki nilai pada linguistic banyak nilainya sama dengan 0.02 dan nilai pada linguistic sedikit 0.98, maka nilai untuk derajat keanggotaan laki-laki secara keseluruhan adalah
0.98. Nilai tersebut adalah nilai maksimum antara linguistic banyak dan linguistic sedikit. Maksud dari ringkasan nilai laki-laki sama dengan 0.98 adalah menjelaskan bahwa jumlah penduduk laki-laki di desa Malasari masuk ke dalam kategori linguistic banyak.
Tingkat Atas (Top Tier)
Pada tingkat top tier adalah menampilkan
data warehouse yang telah terbentuk, sehingga
dapat digunakan oleh pengguna.Penyajian data
dapat dilakukan dari berbagai sudut pandang, misalnya ringkasan data yang menampilkan elemen-elemen yang merupakan potensi daerah di Provinsi Jawa Barat atau penyajian data secara detil di elemen terkecil yaitu tingkat desa. Gambar 15 adalah contoh tampilan kubus data fuzzy untuk subjek penduduk tahun 2003 di level paling bawah yaitu level desa. Operasi OLAP yang diimplementasikan salah satunya adalah operasi roll-up seperti yang terlihat pada
Gambar 16 yang merupakan hasil dari operasi
roll-up pada dimensi lokasi untuk contoh kasus yang terlihat pada Gambar 15, di mana nilai pada setiap sel di kecamatan adalah hasil agregasi yang merupakan nilai maksimum dari derajat keanggotaan di masing-masing desa. Contoh tampilan hasil operasi OLAP lainnya dapat dilihat pada Lampiran 6.
Tampilan yang terbentuk juga dilengkapi dengan grafik sebagai bentuk visualisasi data seperti yang terlihat pada Lampiran 7. Selain itu, juga dilengkapi dengan query builder dalam
bentuk query wizard yang dapat mempermudah
pengguna untuk menjalankan operasi OLAP.
Bentuk query builder dapat dilihat di Lampiran 8.
Nilai-nilai yang ditampilkan di setiap
elemen pada kubus data crisp adalah berupa
nilai numerik yang sesuai dengan sumber data aslinya. Nilai data crisp untuk level yang lebih tinggi merupakan hasil agregasi menggunakan
operator sum, yang memiliki makna jelas pada
masing-masing subjek dan measure yang telah
didefinisikan. Contoh tampilan data crisp
Gambar 15 Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa
Gambar 17 Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003.
Nilai-nilai yang ditampilkan pada kubus data fuzzy adalah nilai derajat keanggotaan terhadap himpunan fuzzy yang telah dibentuk dan diproses terlebih dahulu. Nilai derajat keanggotaan pada level lebih tinggi merupakan nilai maksimum dari level di bawahnya. Untuk memahami makna nilai agregasi tersebut adalah dengan mempertimbangkan perbandingan nilai derajat
keanggotaan antarlinguisticnya, misalnya jika
derajat keanggotaan pada linguistic A lebih besar daripada nilai derajat keanggotaan pada linguistic B maka nilai tersebut masuk ke dalam kategori A. Contohnya pada Gambar 15 derajat keanggotaan penduduk laki-laki di kecamatan Nanggung sama dengan 1 dan dikatakan panduduk laki-laki di kecamatan Nanggung termasuk sedikit. Hal ini diperoleh dari nilai maksimum antara linguistic banyak dan sedikit pada kecamatan tersebut. Oleh karena nilai linguistic banyak sama 0.32 dan nilai linguistic sedikit sama dengan 1 maka kecamatan Nanggung masuk ke kategori sedikit. Akan tetapi, jika nilai hasil agregasi menunjukkan
bahwa perbandingan nilai linguistic-nya adalah
sama, maka dilakukan pertimbangan dengan mengacu pada elemen-elemen di level yang paling bawah, yaitu jika nilai hasil agregasi pada
setiap linguistic-nya sama maka dilakukan
pertimbangan dengan melihat nilai maksimum jumlah derajat keanggotaan yang nilainya lebih
dari 0,5 pada masing-masing linguistic yang
telah didefinisikan. Linguistic yang memiliki
penduduk di kecamatan Nanggung masuk kategori sedikit.
Modul-modul tambahan yang telah dibuat untuk membantu dalam memahami makna nilai agregasi fuzzy terdiri dari:
• Modul_desa
Modul_desa menampilkan nilai crisp dan
nilai derajat keanggotaan. Contoh tampilan modul desa dapat dilihat pada Gambar 18.
Derajat keanggotaan yang ditampilkan adalah derajat keanggotaan dasar pada level terbawah untuk dimensi subjeknya yaitu dimensi penduduk dan dimensi lokasi. Selain itu, juga menampilkan nilai crisp yang dapat diagregasikan berdasarkan dimensi lokasi. Pada Gambar 18 terlihat di level desa dijelaskan secara rinci baik itu nilai cirsp maupun nilai di setiap linguistic-nya.
Gambar 18 Contoh tampilan modul_desa
• Modul_kecamatan
Modul_kecamatan menampilkan nilai crisp dan kategori umum untuk tingkat kecamatan. Beberapa keterangan mengenai kategori umum dapat dilihat pada Lampiran 9. Contoh tampilan modul_kecamatan dapat
dilihat pada Gambar 19. Nilai crisp dan
kategori umum yang ditampilkan tidak dapat langsung disimpulkan dengan menghubungkan keduanya. Pada Gambar 19 terlihat bahwa untuk kecamatan Majalaya jumlah penduduk laki-laki 61983 orang dan
yang lebih dari 0,5 pada linguistic sedikit, sehingga jumlah penduduk laki-laki di kecamatan Majalaya masuk kategori umum 1 yaitu banyak atau dapat dikatakan bahwa jumlah penduduk laki-laki di kecamatan Majalaya secara umum di masing-masing daerahnya masuk kategori banyak. Untuk kecamatan Rancaekek meskipun secara real jumlah penduduk laki-laki lebih besar daripada jumlah penduduk laki-laki di
kecamatan Majalaya, kecamatan Rancaekek masuk ke dalam ketegori umum 2 yaitu sedikit. Hal ini dikarenakan jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic sedikit lebih besar daripada jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic banyak atau secara umum jumlah penduduk laki-laki pada masing-masing daerah di kecamatan Rancaekek termasuk dalam kategori sedikit.
Gambar 19 Contoh tampilan modul_kecamatan
• Modul_kabupaten
Modul_kabupaten menampilkan nilai crisp dan kategori umum untuk tingkat kabupaten. Beberapa keterangan mengenai kategori umum dapat dilihat pada Lampiran 9. Contoh tampilan modul_ kabupaten dapat dilihat pada Gambar 20. Sama halnya seperti
pada modul_kecamatan, nilai crisp dan
kategori umum yang ditampilkan tidak dapat langsung disimpulkan dengan menghubungkan keduanya. Pada Gambar 20 terlihat bahwa untuk kabupaten Cimahi jumlah penduduk laki-laki 201781 orang dan
kabupaten Cimahi masuk kategori umum 1 yaitu banyak atau dapat dikatakan bahwa jumlah penduduk laki-laki di kabupaten Cimahi secara umum di masing-masing daerahnya masuk kategori banyak. Untuk kabupaten Cianjur meskipun secara real jumlah penduduk laki-laki lebih besar daripada jumlah penduduk laki-laki di kabupaten Cimahi, kabupaten Cianjur masuk
ke dalam ketegori umum 2 yaitu sedikit. Hal ini dikarenakan jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic sedikit lebih besar daripada jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic banyak atau secara umum jumlah penduduk laki-laki pada masing-masing daerah di kabupaten Cianjur termasuk dalam kategori sedikit.
Gambar 20 Contoh tampilan modul_kabupaten
KESIMPULAN DAN SARAN
Kesimpulan
Penelitian ini menghasilkan data warehouse
yang dibangun berdasarkan konsep fuzzy serta
data warehouse untuk data crisp sebagai
pelengkap penyajian informasi. Data warehouse
yang dibangun menggunakan konsep fuzzy selain
melalui tahapan praproses data juga melalui
proses clustering menggunakan algoritma FCM
untuk mendapatkan himpunan fuzzy dan nilai
derajat keanggotaan tiap atribut. Nilai derajat keanggotaan yang didapatkan merupakan measure, sedangkan linguistic yang
didefinisikan dari jumlah cluster merupakan
salah satu dari atribut pada level terbawah dalam
dimensi yang terkait. Data warehouse fuzzy
memiliki 4 kubus data yaitu penduduk, rumah tangga, lahan, dan sekolah.
Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice, dice, dan pivot. Operasi untuk fuzzy OLAP dilakukan sesuai dengan konsep pengoperasian data multidimensi fuzzy. Operator untuk mendapatkan
nilai agregasi pada konsep fuzzy adalah
menggunakan operator t-norm atau t-conorm
Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp disajikan sebagai penunjang untuk mendapatkan informasi.
Saran
Saran untuk pengembangan fuzzy OLAP
adalah mengembangkan sistem yang
mengintegrasikan fuzzy OLAP dengan beberapa
algoritma dalam data mining seperti algoritma
association rules. Sistem tersebut diharapkan
akan menyajikan report yang lebih lengkap dan
lebih bermakna untuk melihat pola atau model data dengan lebih jelas, sehingga lebih informatif untuk mendukung pengambilan keputusan.
DAFTAR PUSTAKA
Alhajj R, Mehmet K. 2003. Integrating
Fuzziness into OLAP for Multidimensional Fuzzy Association Rules Mining. Proceedings of the Third IEEE International Conference on Data mining.
Cox, E. 2005. Fuzzy Modeling and Algorithms
for Data mining and Exploration. USA: Academic Press.
Han J, Kamber M. 2001. Data Mining: Concepts
and Techniques. San Diego, USA: Morgan Kaufmann.
Inmon WH. 1996. Building the Data warehouse.
New York, USA: John Wiley & Sons.
Jang JSR, Sun CT, Mizutani Eiji. 1997.
Neuro-Fuzzy and Soft Computing. London: Prentice-Hall International, Inc.
Molina Carlos, Ariza LR, S Daniel, Vila
M.Amparo. 2006. A New Fuzzy
Multidimensional Model. IEEE Transaction On Fuzzy System.
Xie X, Beni G. 1991. A Validity Measure for
Lampiran 1 Atribut-atribut yang terpilih dari hasil ekstraksi
a.Atribut tentang lokasi untuk data tahun 2003 dan 2006
Atribut Deskripsi
Provinsi Berisikan nama provinsi
Kabupaten Berisikan nama kabupaten
Kecamatan Berisikan nama kecamatan
Desa Berisikan nama desa
b. Atribut tentang kependudukan yang terpilih untuk data tahun 2003
Atribut Deskripsi
V402A Berisikan jumlah penduduk laki-laki di tingkat desa
V402B Berisikan jumlah penduduk perempuan di tingkat desa
V402C Berisikan jumlah keluarga atau rumah tangga di tingkat desa
V403A1 Berisikan jumlah rumah tangga atau keluarga yang termasuk di dalam kategori keluarga prasejahtera I di tingkat desa
c.Atribut tentang kependudukan yang terpilih untuk data tahun 2006
Atribut Deskripsi
R401A Berisikan jumlah penduduk laki-laki di tingkat desa
R401B Berisikan jumlah penduduk perempuan di tingkat desa
R401C Berisikan jumlah rumah tangga atau keluarga di tingkat desa
R401E Berisikan jumlah rumah tangga atau keluarga yang termasuk di dalam kategori keluarga
prasejahtera I di tingkat desa
d.Atribut tentang luas lahan yang terpilih untuk data tahun 2003
Atribut Deskripsi
V1201 Berisikan luas desa
V1202 Berisikan luas lahan sawah di masing-masing desa
V1202A Berisikan luas lahan sawah berpengairan yang diusahakan di masing-masing desa
V1202B Berisikan luas lahan sawah tidak berpengairan yang diusahakan di masing-masing desa
V1202C Berisikan luas lahan sawah sementara yang tidak diusahakan di masing-masing desa
V1203 Berisikan luas lahan bukan sawah di masing-masing desa
V1203A Berisikan luas tambak/kolam/padang/rumput di masing-masing desa
V1203B Berisikan luas perkebunan di masing-masing desa
V1203C Berisikan luas hutan rakyat di masing-masing desa
V1203D Berisikan luas lahan perumahan dan pemukiman di masing-masing desa
V1203E Berisikan luas lahan untuk bangunan industri di masing-masing desa
Lampiran 1 lanjutan
Tabel d lanjutan
Atribut Deskripsi
V1203G Berisikan luas lahan lainnya diusahakan di masing-masing desa
V1203H Berisikan luas lahan bukan sawah sementara tdk diusahakan di masing-masing desa
e.Atribut tentang luas lahan yang terpilih untuk data tahun 2006
Atribut Deskripsi
R10011 Berisikan luas desa
R10021 Berisikan luas lahan sawah di masing-masing desa
R1002A1 Berisikan luas lahan sawah berpengairan yang diusahakan di masing-masing desa
R1002B1 Berisikan luas lahan sawah tidak berpengairan yang diusahakan di masing-masing desa
R1002C1 Berisikan luas lahan sawah sementara yang tidak diusahakan di masing-masing desa
R10031 Berisikan luas lahan bukan sawah di masing-masing desa
R1003A1 Berisikan luas lahan pertanian (kolam/tambak/perkebunan/
hutan rakyat/padang rumput) di masing-masing desa
R1003B1 Berisikan luas ladang yang diusahakan di masing-masing desa
R1003C1 Berisikan luas ladang yang tidak diusahakan di masing-masing desa
R1003D1 Berisikan luas lahan untuk non pertanian (permukiman/perumahan/
pertokoan/perkantoran/industri dan lainnya) di masing-masing desa
f.Atribut tentang pendidikan yang terpilih untuk data tahun 2003
Atribut Deskripsi
V601A2 Berisikan jumlah unit sekolah TK negri di tingkat desa
V601A3 Berisikan jumlah unit sekolah TK swasta di tingkat desa
V601B2 Berisikan jumlah unit sekolah SD negri dan yang sederajat di tingkat desa
V601B3 Berisikan jumlah unit sekolah SD swasta dan yang sederajat di tingkat desa
V601C2 Berisikan jumlah unit sekolah SMP negri dan yang sederajat di tingkat desa
V601C3 Berisikan jumlah unit sekolah SMP swasta dan yang sederajat di tingkat desa
V601D2 Berisikan jumlah unit sekolah SMA negri dan yang sederajat di tingkat desa
Lampiran 1 lanjutan
g.Atribut tentang pendidikan yang terpilih untuk data tahun 2006
Atribut Deskripsi
R601AK2 Berisikan jumlah unit sekolah TK negri di tingkat desa
R601AK3 Berisikan jumlah unit sekolah TK swasta di tingkat desa
R601BK2 Berisikan jumlah unit sekolah SD negri dan yang sederajat di tingkat desa
R601BK3 Berisikan jumlah unit sekolah SD swasta dan yang sederajat di tingkat desa
R601CK2 Berisikan jumlah unit sekolah SMP negri dan yang sederajat di tingkat desa
R601CK3 Berisikan jumlah unit sekolah SMP swasta dan yang sederajat di tingkat desa
R601DK2 Berisikan jumlah unit sekolah SMA negri dan yang sederajat di tingkat desa
R601DK3 Berisikan jumlah unit sekolah SMA swasta dan yang sederajat di tingkat desa
Lampiran 2 Hasil validasi cluster
Data Potensi Desa Provinsi Jawa Barat Tahun 2003
a.Atribut Penduduk Laki-Laki
b.Atribut Penduduk Perempuan
Jumlah Cluster Compactness Separation S
2 2,77E+06 5,38E+07 0,05157
3 1,27E+06 1,36E+07 0,09351
4 7,05E+05 4,13E+06 0,17069
5 4,76E+05 1,98E+06 0,24072
c.Atribut Keluarga Prasejahtera I
Jumlah Cluster Compactness Separation S
2 5,95E+04 5,38E+05 0,11058
3 2,87E+04 2,30E+05 0,12520
4 1,73E+04 1,35E+05 0,12818
5 1,18E+04 8,91E+04 0,13188
Jumlah Cluster Compactness Separation S
2 2,66E+06 4,84E+07 0,05498
3 1,26E+06 1,25E+07 0,10107
4 6,95E+05 4,36E+06 0,15960
Lampiran 2 lanjutan
d.Atribut Keluarga Bukan Prasejahtera I
Jumlah Cluster Compactness Separation S
2 3,59E+05 8,72E+06 0,04118
3 1,63E+05 1,49E+06 0,10973
4 9,40E+04 6,01E+05 0,15633
5 5,94E+04 3,26E+05 0,18216
e.Atribut Lahan Sawah Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 5,64E+05 7,75E+09 0,00007
3 4,98E+05 1,04E+05 4,81211
4 4,32E+05 4,35E+04 9,93646
5 4,17E+05 1,43E+04 29,07888
f.Atribut Lahan Sawah Tidak Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 6,47E+04 2,18E+09 0,00003
3 3,65E+04 7,25E+04 0,50291
4 2,49E+04 2,98E+04 0,83399
5 1,27E+03 1,58E+04 0,08048
g.Atribut Lahan Sawah Sementara Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 1,94E+02 2,09E+04 0,00928
3 9,86E+01 4,07E+03 0,02425
4 6,15E+01 2,45E+03 0,02507
5 4,35E+01 8,83E+02 0,04930
h.Atribut Lahan Bukan Sawah Untuk Pertanian (Tambak/Kolam/Tegal/Padang Rumput/Perkebunan/Hutan
Rakyat/dll)
Jumlah Cluster Compactness Separation S
2 1,03E+06 2,11E+06 0,48748
3 1,71E+05 1,34E+06 0,12744
4 1,09E+05 3,54E+05 0,30766
Lampiran 2 lanjutan
i.Atribut Lahan Bukan Sawah Berupa Ladang Diusahakan
Jumlah Cluster Compactness Separation S
2 1,54E+04 6,45E+05 0,02388
3 4,76E+03 4,97E+05 0,00958
4 2,44E+03 8,49E+04 0,02873
5 1,47E+03 2,93E+04 0,05018
j. Atribut Lahan Bukan Sawah Berupa Ladang Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 3,95E+03 2,26E+06 0,00175
3 1,07E+03 3,10E+05 0,00343
4 4,54E+02 4,97E+04 0,00913
5 2,29E+02 1,25E+04 0,01829
k.Atribut Lahan Bukan Sawah Untuk Non Pertanian (Perumahan/Industri/Pertokoan/dll)
Jumlah Cluster Compactness Separation S
2 4,69E+05 1,19E+10 0,00004
3 7,70E+04 2,68E+09 0,00003
4 4,54E+04 6,15E+04 0,73807
5 2,78E+03 4,48E+04 0,06198
l.Atribut Sekolah TK
Jumlah Cluster Compactness Separation S
2 9,55E-01 1,46E+01 0,06557
3 4,78E-01 4,13E+00 0,11597
4 2,47E-01 1,33E+00 0,18508
5 1,36E-01 1,05E+00 0,13005
m. Atribut Sekolah SD
Jumlah Cluster Compactness Separation S
2 2,69E+00 2,35E+01 0,11443
3 1,36E+00 9,05E+00 0,15056
4 8,06E-01 4,80E+00 0,16779
5 5,30E-01 3,30E+00 0,16086
n. Atribut Sekolah SMP
Jumlah Cluster Compactness Separation S
2 3,53E-01 4,60E+00 0,07689
3 1,24E-01 1,18E+00 0,10525
4 5,26E-02 1,01E+00 0,05219
Lampiran 2 lanjutan
o. Atribut Sekolah SMA
Jumlah Cluster Compactness Separation S
2 1,34E-01 2,21E+00 0,06072
3 3,94E-02 1,18E+00 0,03342
4 1,56E-02 1,01E+00 0,01553
5 6,94E-03 1,00E+00 0,00693
Data Potensi Desa Provinsi Jawa Barat Tahun 2006
a.Atribut Penduduk Laki-Laki
Jumlah Cluster Compactness Separation S
2 2,96E+06 5,72E+07 0,05182
3 1,47E+06 1,52E+07 0,09659
4 7,99E+05 5,47E+06 0,14622
5 5,17E+05 2,40E+06 0,21511
b.Atribut Penduduk Perempuan
Jumlah Cluster Compactness Separation S
2 3,12E+06 5,97E+07 0,05226
3 1,49E+06 1,86E+07 0,08029
4 8,04E+05 5,17E+06 0,15560
5 5,29E+05 2,36E+06 0,22396
c.Atribut Keluarga Prasejahtera I
Jumlah Cluster Compactness Separation S
2 6,73E+04 6,76E+05 0,09964
3 3,28E+04 2,63E+05 0,12494
4 2,00E+04 1,47E+05 0,13641
5 1,33E+04 9,04E+04 0,14677
d.Atribut Keluarga Bukan Prasejahtera I
Jumlah Cluster Compactness Separation S
2 5,08E+05 1,51E+07 0,03375
3 2,44E+05 2,34E+06 0,10427
4 1,42E+05 8,96E+05 0,15893
5 9,37E+04 4,07E+05 0,23031
e.Atribut Lahan Sawah Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 7,94E+03 1,06E+05 0,07516
3 4,09E+03 2,30E+04 0,17788
4 2,57E+03 1,36E+04 0,18938
Lampiran 2 lanjutan
f.Atribut Lahan Sawah Tidak Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 3,88E+03 7,64E+04 0,05078
3 1,80E+03 1,78E+04 0,10110
4 1,14E+03 1,04E+04 0,10953
5 7,47E+02 5,93E+03 0,12580
g.Atribut Lahan Sawah Sementara Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 1,02E+02 2,06E+04 0,00492
3 3,59E+01 7,15E+03 0,00503
4 1,83E+01 2,57E+03 0,00713
5 1,19E+01 5,63E+02 0,02107
h.Atribut Lahan Bukan Sawah Untuk Pertanian (Tambak/Kolam/Tegal/Padang Rumput/Perkebunan/Hutan
Rakyat/dll)
Jumlah Cluster Compactness Separation S
2 3,48E+04 7,45E+05 0,04665
3 1,77E+04 2,12E+05 0,08359
4 1,13E+04 8,24E+04 0,13702
5 7,46E+03 6,11E+04 0,12197
i.Atribut Lahan Bukan Sawah Berupa Ladang Diusahakan
Jumlah Cluster Compactness Separation S
2 1,18E+04 3,47E+05 0,03391
3 5,54E+03 6,77E+04 0,08194
4 2,93E+03 4,06E+04 0,07222
5 1,91E+03 1,96E+04 0,09742
j. Atribut Lahan Bukan Sawah Berupa Ladang Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 1,22E+03 2,04E+05 0,00598
3 5,42E+02 9,37E+04 0,00578
4 2,93E+02 7,89E+03 0,03719
5 1,99E+02 4,99E+03 0,03995
k.Atribut Lahan Bukan Sawah Untuk Non Pertanian (Perumahan/Industri/Pertokoan/dll)
Jumlah Cluster Compactness Separation S
2 3,91E+04 3,35E+07 0,00117
3 2,08E+04 2,04E+05 0,10201
4 9,04E+03 1,48E+05 0,06102
Lampiran 2 lanjutan
l.Atribut Sekolah TK
Jumlah Cluster Compactness Separation S
2 1,55E+00 2,01E+01 0,07706
3 7,74E-01 6,81E+00 0,11361
4 4,65E-01 1,62E+00 0,28794
5 2,74E-01 1,30E+00 0,21085
m. Atribut Sekolah SD
Jumlah Cluster Compactness Separation S
2 2,40E+00 2,05E+01 0,11704
3 1,22E+00 8,46E+00 0,14436
4 7,12E-01 4,40E+00 0,16163
5 4,76E-01 2,98E+00 0,15956
n. Atribut Sekolah SMP
Jumlah Cluster Compactness Separation S
2 3,71E-01 4,55E+00 0,08151
3 1,38E-01 1,23E+00 0,11209
4 5,51E-02 1,01E+00 0,05471
5 2,41E-02 1,00E+00 0,02404
o.Atribut Sekolah SMA
Jumlah Cluster Compactness Separation S
2 1,48E-01 2,07E+00 0,07179
3 4,47E-02 1,16E+00 0,03848
4 1,67E-02 1,01E+00 0,01655
Lampiran 3 Contoh hasil clustering berupa linguistic dan derajat keanggotaan
a. Penduduk laki-laki 2003
Id_lokasi Jumlah_Penduduk_Laki Banyak Sedikit
1 3249 0.015545 0.98445
2 4194 0.09752 0.90248
3 5180 0.28852 0.71148
4 3610 0.036796 0.9632
5 3374 0.021686 0.97831
6 3060 0.008443 0.99156
7 2301 0.000574 0.99943
8 3091 0.009439 0.99056
9 3796 0.052293 0.94771
10 5289 0.3161 0.6839
11 4436 0.13383 0.86617
12 3272 0.016585 0.98342
13 4409 0.12943 0.87057
14 2467 5.09E-07 1
15 4432 0.13317 0.86683
16 4170 0.094294 0.90571
17 3763 0.049297 0.9507
18 3997 0.072973 0.92703
19 4666 0.17483 0.82517
b. Penduduk laki-laki 2006
Id_Lokasi Jumlah_Penduduk_Laki Banyak Sedikit
1 3847 0.037796 0.9622
2 4621 0.11796 0.88204
3 3828 0.036486 0.96351
4 4393 0.088541 0.91146
5 3476 0.01704 0.98296
6 3129 0.005713 0.99429
7 2390 0.000704 0.9993
8 3084 0.004732 0.99527
9 4091 0.057231 0.94277
10 5421 0.26233 0.73767
11 5527 0.28599 0.71401
12 3831 0.036691 0.96331
13 4121 0.05997 0.94003
14 2709 0.000229 0.99977
15 5346 0.24617 0.75383
16 4772 0.1403 0.8597
17 4094 0.057501 0.9425
18 4445 0.094799 0.9052
Lampiran 3 lanjutan
c. Sekolah SD 2003
Id_Lokasi