IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006
SOFIYANTI INDRIASARI G64103046
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
ABSTRAK
SOFIYANTI INDRIASARI. Implementasi Fuzzy OLAPpada Data Potensi Desa di Provinsi Jawa
Barat Tahun 2003 dan 2006. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan SRI NURDIATI.
Kurangnya pemanfaatan atau pengolahan terhadap gunung data yang sebenarnya dapat menghasilkan suatu informasi atau pengetahuan yang penting untuk mendukung pengambilan keputusan. Data Potensi Desa yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu sangat penting melakukan analisis data Podes secara efisien dan cepat. Data warehouse adalah
tempat penyimpanan data terintegrasi yang dapat digunakan untuk query dan analisis. Operasi query ini dilakukan dengan On-line Analytical Processing (OLAP). Data real dijumpai sering kali
mengandung informasi yang tidak tepat dan ketidakpastian (uncertain). Teori himpunan fuzzy
digunakan untuk menangani masalah tersebut. Penelitian ini bertujuan membangun data warehouse untuk data Potensi Desa di Provinsi Jawa Barat tahun 2003 dan 2006 yang direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy dan
mengimplementasikan operasi OLAP.
Ruang lingkup penelitian adalah dibatasi pada implementasi fuzzy OLAP untuk data Potensi
Desa di Provinsi Jawa Barat tahun 2003 dan 2006. Sistem yang akan dibangun mengikuti arsitektur data warehouse tiga tingkat. Struktur data pada data warehouse digambarkan dengan
skema galaksi. Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice, dice, dan pivot. Operasi untuk fuzzy OLAP dilakukan sesuai dengan konsep pengoperasian data
multidimensi fuzzy.
Hasil penelitian ini adalah terbentukya data warehouse yang diimplementasikan dengan konsep fuzzy serta data warehouse untuk data crisp sebagai pelengkap penyajian informasi. Data warehouse yang dibangun menggunakan konsep fuzzy terlebih dahulu melalui tahapan praproses
data dan proses clustering menggunakan algoritma FCM untuk mendapatkan himpunan fuzzy dan
nilai derajat keanggotaan tiap atribut. Data warehouse tersebut memiliki 4 kubus data yaitu penduduk, rumah tangga, lahan, dan sekolah. Data dapat ditampilkan dalam bentuk crosstab atau
grafik. Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang
disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp
disajikan sebagai penunjang untuk mendapatkan informasi.
IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Oleh :
SOFIYANTI INDRIASARI G64103046
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Judul : Implementasi Fuzzy OLAP pada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Nama : Sofiyanti Indriasari NIM : G64103046
Menyetujui:
Pembimbing I, Pembimbing II,
Imas S. Sitanggang, S.Si, M.Kom Dr. Ir. Sri Nurdiati, M.Sc NIP 132 206 235 NIP 131 578 805
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, MS NIP 131 473 999
PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala
curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2007 ini ialah data warehouse, dengan judul
Implementasi Fuzzy OLAPpada Data Potensi Desa di Provinsi Jawa Barat Tahun 2003 dan 2006
Penyelesaian penelitian ini tidak terlepas dari bantuan berbagai pihak, karena itu penulis mengucapkan terima kasih sebesar-besarnya kepada:
1. Ayahanda Achmad Azhari dan Ibunda Syafa’atur Rofiah , Kakakku Sofyan Rizalanda, serta adik-adikku Asrofi Hanafiah dan Asrofi Hanifah atas doa, kasih sayang, dan kehangatannya yang tidak pernah berhenti tercurah selama ini,
2. Ibu Imas S. Sitanggang, S.Si., M.Kom. selaku pembimbing I, Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku pembimbing II dan Bapak Hari Agung Adrianto, S.Kom. selaku dosen penguji,
3. Keluarga besar Ibu Sri Nurdiati di Bogor yang telah menjadi keluarga kedua bagi penulis,
4. Kak Hendra dan Kak Ifnu atas kesabarannya menjawab pertanyaan penulis, serta Diku atas tumpangannya mengangkut komputer untuk keperluan penelitian ini,
5. Sahabat penulis: Gibtha, Meynar, Firat, Pandi, Qwill, Ratih, Ghofar, Jemi, Hida, Dina, Vita, dan Nanik atas saran, dukungan, kerjasama, bantuan, dan hiburannya,
6. Teman-teman seperjuangan Ilkomers 40 lainnya untuk pengalaman dan kenangan yang tak ternilai, 7. Mas Irvan atas bantuannya mencari referensi untuk penelitian ini dan Pak Soleh atas bantuan dan
nasehatnya,
8. Departemen Ilmu Komputer, staf dan dosen yang telah begitu banyak membantu baik selama penelitian maupun pada masa perkuliahan.
Segala kesempurnaan hanya milik Allah SWT, semoga hasil penelitian ini dapat bermanfaat, Amin.
Bogor, Mei 2007
RIWAYAT HIDUP
Penulis dilahirkan di Blitar pada tanggal 5 Oktober 1984 dari ayah Achmad Azhari dan ibu Syafa’atur Rofiah. Penulis merupakan putri kedua dari empat bersaudara. Tahun 2003 penulis lulus dari SMU Negeri I Sidoarjo. Pada tahun yang sama penulis diterima di Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor melalui jalur USMI.
Selama mengikuti perkuliahan, penulis pernah menjadi pengurus Korps Sukarela PMI Unit I IPB tahun kepengurusan 2004/2005. Selain itu, penulis juga pernah menjadi pengurus Himpunan Mahasiswa Ilmu Komputer (HIMALKOM) tahun kepengurusan 2005/2006. Pada tahun 2006, penulis pernah melakukan kegiatan praktik lapangan selama dua bulan di Pusat Data dan Informasi Kesejahteraan Sosial, Departemen Sosial Republik Indonesia.
DAFTAR ISI
Halaman
DAFTAR TABEL... viii
DAFTAR GAMBAR... viii
DAFTAR LAMPIRAN ... viii
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan Penelitian ... 1
Ruang Lingkup Penelitian ... 1
Manfaat Penelitian ... 1
TINJAUAN PUSTAKA ... 1
Data Warehouse... 1
Model Data Multidimensi... 2
On-line Analytical Processing (OLAP) ... 2
Himpunan Fuzzy... 4
Fuzzy C-Means (FCM) ... 5
Ukuran Kevalidan Cluster... 5
Kubus Data Fuzzy... 6
Dimensi Fuzzy... 6
METODE PENELITIAN ... 7
Tahapan Penelitian... 7
Praproses Data... 7
Arsitektur Sistem ... 8
Lingkungan Pengembangan Sistem ... 8
HASIL DAN PEMBAHASAN ... 8
Praproses Data... 8
Tingkat Bawah (Bottom Tier)... 10
Tingkat Tengah (Middle Tier) ... 13
Tingkat Atas (Top Tier) ... 13
KESIMPULAN DAN SARAN ... 18
Kesimpulan ... 18
Saran... 19
DAFTAR PUSTAKA... 19
DAFTAR TABEL
Halaman
1 Validasi atribut lahan bukan sawah untuk non pertanian 2006 ... 10
2 Validasi atribut lahan bukan sawah untuk non pertanian 2003 ... 10
3 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp... 10
4 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp... 10
5 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy... 11
6 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy... 11
DAFTAR GAMBAR
Halaman 1 Skema bintang (Han & Kamber 2001)... 22 Skema snowflake (Han & Kamber 2001)... 2
3 Skema galaksi (Han & Kamber 2001) ... 2
4 Contoh operasi roll-up (Han & Kamber 2001)... 3
5 Contoh operasi drill-down (Han & Kamber 2001) ... 3
6 Contoh operasi slice (Han & Kamber 2001)... 4
7 Contoh operasi dice (Han & Kamber 2001) ... 4
8 Contoh operasi pivot (Han & Kamber 2001) ... 4
9 Contoh kubus data fuzzy 3 dimensi (Alhajj & Mehmet 2003) ... 6
10 Contoh path pada dimensi fuzzy... 7
11 Tahap praproses data ... 7
12 Arsitektur tiga tingkat data warehouse (Han & Kamber 2001) ... 8
13 Skema galaksi untuk data crisp... 12
14 Skema galaksi untuk data fuzzy... 12
15 Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa... 14
16 Contoh operasi roll-up pada dimensi lokasi... 14
17 Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003. ... 15
18 Contoh tampilan modul_desa... 16
19 Contoh tampilan modul_kecamatan... 17
20 Contoh tampilan modul_kabupaten ... 18
DAFTAR LAMPIRAN
Halaman 1 Atribut-atribut yang terpilih dari hasil ekstraksi ... 212 Hasil validasi cluster... 23
3 Contoh hasil clustering berupa linguistic dan derajat keanggotaan ... 29
4 Skema galaksi yang disesuaikan dengan kebutuhan software Oracle... 31
5 Skema relasi modul pendukung ... 32
6 Contoh tampilan fuzzy OLAP dan hasil operasinya... 35
7 Tampilan data yang dikombinasikan dengan bentuk visualisasi model graph... 38
8 Tampilan query builder... 38
PENDAHULUAN
Latar Belakang
Dewasa ini, ketersediaan data semakin melimpah, apalagi ditunjang dengan banyaknya kegiatan yang sudah dilakukan secara terkomputerisasi. Namun seringkali data tersebut hanya disimpan tanpa diolah lebih lanjut untuk keperluan di masa mendatang. Padahal jika dianalisis lebih dalam, data tersebut dapat menghasilkan informasi atau pengetahuan yang penting dan berharga. Data Potensi Desa (Podes) yang bersumber dari Badan Pusat Statistik (BPS) memiliki peranan yang cukup strategis di masa yang akan datang dan merupakan produk unggulan BPS. Untuk itu sangat penting dilakukan analisis data Podes secara efisien dan cepat.
Data warehouse adalah tempat penyimpanan
data terintegrasi yang dapat digunakan untuk
query dan analisis. Operasi query ini dilakukan
dengan On-line Analytical Processing (OLAP).
OLAP akan menghasilkan data dalam bentuk ringkasan. Dengan operasi ini query dapat
dijalankan lebih mudah dan lebih efisien. OLAP muncul dengan sebuah cara pandang data multidimensi. Cara pandang multimensi ini didukung oleh teknologi basis data multidimensi.
Data warehouse dan On-Line Analytical
Processing (OLAP) merupakan elemen penting
dalam mendukung proses pengambilan keputusan.
Data real yang dijumpai sering kali mengandung informasi yang tidak tepat dan ketidakpastian (uncertain). Teori himpunan
fuzzy digunakan untuk menangani masalah
tersebut.
Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Membangun data warehouse untuk data
Potensi Desa tahun 2003 dan 2006. Aplikasi yang dibangun mengolah data yang direpresentasikan dalam model data multidimensi dengan menggunakan teori himpunan fuzzy.
2. Mengimplementasikan operasi-operasi OLAP, yaitu roll-up, drill-down, slice, dice,
dan pivot dengan menggunakan pendekatan
fuzzy.
Ruang Lingkup Penelitian
Penelitian ini dibatasi pada implementasi
fuzzy OLAP pada data Potensi Desa di Provinsi
Jawa Barat tahun 2003 dan 2006 yang bersumber dari Badan Pusat Statistik (BPS). Penelitian ini akan menghasilkan aplikasi fuzzy OLAP yang
dapat menampilkan informasi untuk mendukung proses pengambilan keputusan.
Manfaat Penelitian
Aplikasi yang dihasilkan pada penelitian ini diharapkan dapat digunakan oleh pihak yang berkepentingan untuk mendapatkan informasi yang menarik dan akurat sebagai pendukung proses pengambilan keputusan terkait dengan data Potensi Desa. Sistem diharapkan dapat menyediakan informasi ringkas dan jelas secara cepat melalui operasi-operasi OLAP seperti roll-up, drill-down, slice,dice, dan pivot.
TINJAUAN PUSTAKA
Data WarehouseData Warehouse adalah sekumpulan data
berorientasi subjek, terintegrasi, time-variant,
dan non-volatile yang mendukung proses
manajemen pembuatan keputusan (Inmon 1996). Kata kunci dari pengertian data warehouse di
atas adalah (Han & Kamber 2001):
• Berorientasi subjek: data warehouse
diorganisasikan berdasarkan subjek-subjek utama, seperti pelanggan, produk atau penjualan. Data warehouse menyediakan
tampilan yang sederhana dan ringkas untuk subjek tertentu dengan menghilangkan data yang tidak berguna dalam proses pembuatan keputusan.
• Terintegrasi: data warehouse dibangun
dengan mengintegrasikan berbagai sumber data yang heterogen, seperti basis data relasional, flat file, dan transaksi on-line.
Teknik pembersihan dan integrasi data digunakan untuk memastikan data tetap konsisten.
• Time-variant: data disimpan untuk
menyediakan informasi berdasarkan kejadian yang sudah lewat.
• Non-volatile: data warehouse adalah tempat
penyimpanan data yang terpisah dari basis data operasional.
Model Data Multidimensi
Model data multidimensi menampilkan data dalam bentuk kubus data. Kubus data memungkinkan data dimodelkan dan ditampilkan dalam dimensi banyak. Kubus data disebut juga cuboid. Pola-pola cuboid dapat
dibuat apabila diberikan satu kumpulan dimensi. Masing-masing pola menampilkan data pada tingkat kesimpulan yang berbeda-beda (Han & Kamber 2001).
Untuk menggambarkan hubungan antardata pada data multidimensi digunakan skema multidimensi. Pada data warehouse, skema
merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data
warehouse dan keinginan pembuat data
warehouse. Data warehouse membutuhkan
skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2001):
• Skema bintang (star schema)
Skema bintang adalah skema data
warehouse yang paling sederhana. Skema ini
disebut skema bintang karena hubungan antara tabel dimensi dan tabel fakta menyerupai bintang di mana satu tabel fakta dihubungkan dengan beberapa tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan sudut-sudutnya adalah tabel-tabel dimensi. Bentuk skema bintang dapat dilihat pada Gambar 1. Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang cepat.
Gambar 1 Skema bintang (Han & Kamber 2001)
• Skema snowflake (snowflake schema)
Skema snowflake adalah variasi dari skema
bintang di mana beberapa tabel dimensi dinormalisasi, jadi dihasilkan beberapa tabel tambahan. Bentuk skema snowflake dapat
dilihat pada Gambar 2. Keuntungan yang didapat dengan menggunakan skema ini adalah penghematan memory, tapi waktu yang
dibutuhkan untuk pemrosesan query menjadi
lebih lama.
Gambar 2 Skema snowflake (Han & Kamber
2001)
• Skema galaksi (fact constellation)
Pada skema galaksi, beberapa tabel fakta berbagi tabel dimensi. Bentuk skema galaksi dapat dilihat pada Gambar 3. Keuntungan menggunakan skema ini adalah menghemat
memory dan mengurangi kesalahan yang
mungkin terjadi.
Gambar 3 Skema galaksi (Han & Kamber 2001) On-line Analytical Processing (OLAP)
OLAP adalah operasi basis data untuk mendapatkan data dalam bentuk ringkasan dengan menggunakan agregasi sebagai mekanisme utama. OLAP menyediakan tampilan data yang fleksibel dari sudut pandang yang berbeda dan menyediakan lingkungan yang user-friendly untuk membantu analisis data.
Tipe-tipe operasi OLAP antara lain (Han & Kamber 2001):
• Roll-up
Operasi ini melakukan pengelompokan pada kubus data dengan cara mengurutkan suatu hirarki konsep secara menaik (ascending) atau mereduksi dimensi. Contoh
operasi roll-up untuk kubus data penjualan
dapat dilihat pada Gambar 4. Contoh :
Suatu hirarki lokasi: kota < provinsi < negara
Operasi roll-up melakukan pengelompokan
dengan mengurutkan hirarki lokasi dari tingkat kota sampai pada tingkat negara.
• Drill-down
Drill-down adalah kebalikan dari roll-up.
Drill-down dapat dilakukan dengan cara
mengurutkan suatu hirarki konsep secara menurun (descending) atau dengan
menambahkan nilai dimensi. Contoh operasi
drill-down untuk kubus data penjualan dapat
dilihat pada Gambar 5. Contoh :
Suatu hirarki waktu: bulan < kuartal < tahun
Drill-down melakukan pengelompokan
dengan mengurutkan hirarki waktu dari tingkat tahun ke tingkat yang lebih detil yaitu tingkat bulan.
• Slice dan dice
Operasi slice melakukan pemilihan satu
dimensi dari kubus data sehingga menghasilkan bagian kubus (subcube). Contoh
operasi slice untuk kubus data penjualan dapat
dilihat pada Gambar 6. Operasi dice
menghasilkan bagian kubus (subcube) dengan
melakukan pemilihan dua atau lebih dimensi. Contoh operasi dice untuk kubus data
penjualan dapat dilihat pada Gambar 7.
• Pivot (rotate)
Pivot adalah operasi yang memutar
koordinat data pada tampilan dengan tujuan untuk menyediakan alternatif tampilan data. Contoh operasi pivot untuk kubus data
penjualan dapat dilihat pada Gambar 8.
Gambar 4 Contoh operasi roll-up (Han & Kamber 2001)
Gambar 6 Contoh operasi slice (Han & Kamber 2001)
Gambar 7 Contoh operasi dice (Han & Kamber 2001)
Gambar 8 Contoh operasi pivot (Han & Kamber 2001)
Himpunan Fuzzy
Konsep logika fuzzy pertama kali
diperkenalkan oleh Prof. Lutfi A Zadeh dari Universitas California pada bulan Juni 1965. Logika fuzzy merupakan generalisasi dari logika
klasik yang hanya memiliki dua nilai keanggotaan 0 dan 1. Dalam logika fuzzy nilai
kebenaran suatu pernyataan berkisar dari sepenuhnya benar ke sepenuhnya salah. Inti dari himpunan fuzzy yaitu fungsi keanggotaan yang
menggambarkan hubungan antara domain himpunan fuzzy dengan nilai derajat
keanggotaan. Dengan teori himpunan fuzzy
suatu objek dapat menjadi anggota dari banyak himpunan dengan derajat keanggotaan yang
berbeda dalam masing-masing himpunan. Derajat keanggotaan menujukkan nilai keanggotaan suatu objek pada suatu himpunan. Nilai keanggotaan ini berkisar antara 0 sampai 1 (Cox 2005). Teori himpunan fuzzy telah banyak
digunakan dalam pembangunan sistem data
mining. Alhajj dan Mehmet (2003) telah
menggunakan himpunan fuzzy untuk
membangun kubus data fuzzy. Fuzzy C-Means (FCM)
Menurut Jang et al. (1997), Fuzzy C-Means
merupakan algoritma clustering data di mana
setiap titik data masuk dalam sebuah cluster
dengan ditandai oleh derajat keanggotaan. FCM membagi sebuah koleksi dari n data vektor xj
(j=1, 2, …, n) menjadi c cluster, dan
menemukan sebuah pusat cluster (center) untuk
tiap kelompok dengan meminimalisasi ukuran dari fungsi objektif. Pada FCM hasil dari
clustering adalah sebuah titik data dapat
menjadi anggota untuk beberapa cluster yang
ditandai oleh derajat keanggotaannya antara 0 dan 1.
Berikut tahapan clustering menggunakan
algoritma FCM:
1. Inisialisasi keanggotaan matriks U yang berisi derajat keanggotan terhadap cluster
dengan nilai antara 0 dan 1, sehingga n u c i j ij 1, 1,..., 1 = ∀ =
∑
= . 2. Penghitungan c sebagai pusat cluster,ci , i = 1, …, c dengan menggunakan
∑
∑
= = = n j m ij n j j m ij i u x u c 1 1 ) ( ) ) (( .3. Penghitungan fungsi objektif (Ji):
∑∑
∑
= = = = c i n j ij m ij c i i c J u d c c U J 1 2 1 1,..., ) , ( di mana:• uij adalah elemen matriks U yang
bernilai antara 0 dan 1,
• dij = ||ci - xj|| adalah jarak antara
pusat cluster ke-i dan titik data
ke-j,
• ci adalah pusat cluster ke-i,
• m
∈
[1,∞
] adalah parameterfuzzifikasi. Nilai m yang umum
digunakan untuk clustering data fuzzy adalah sama dengan 2.
Kemudian melihat kondisi berhenti :
• Jika (|Jt –Jt-1| < nilai toleransi
terkecil yang diharapkan) atau (t > maksimal iterasi) maka proses berhenti.
• Jika tidak : t = t + 1, mengulangi langkah 3.
4. Penghitungan matriks U baru menggunakan formula berikut: ( ) ∑ ⎟⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = − = c k m ij d d u kj ij 1 1 2 1
Ukuran Kevalidan Cluster
Menurut Xie dan Beni (1991), ukuran kevalidan cluster merupakan proses evaluasi
hasil clustering untuk menentukan cluster mana
yang terbaik. Kevalidan sebuah cluster (S)
ditentukan oleh dua hal yaitu: ukuran kedekatan antaranggota pada tiap cluster (compactness),
dan ukuran keterpisahan antarcluster satu
dengan cluster yang lainnya (separation).
Semakin kecil nilai S, maka cluster tersebut
semakin valid. 2 , 1 1 2 2 min i j j i c i n j j i ij V V n X V S − − =
∑∑
= = µ . dengan: • n X V c i n j j i ij∑ ∑
= = − 1 1 2 2|| || µ adalah nilai compactness,• n adalah banyaknya titik data,
• V adalah pusat cluster,
•
∑
= n j j i d 12 adalah variation dari cluster ke-i,
• dij =µij ||Xj−Vi|| adalah fuzzy deviation Xj dari cluster ke-i, dan
notasi ||y|| biasanya merupakan norma (panjang) penghitungan jarak
• dij adalah jarak antara Xj dan Vi yang
diboboti oleh derajat keanggotaan
fuzzy titik ke-j pada cluster ke-i,
• 2 , min i j j i V
V − adalah separation yang merupakan jarak minimum antarpusat
cluster. Kubus Data Fuzzy
Himpunan fuzzy dapat didefinisikan untuk
atribut kuantitatif, misalkan x, dengan fungsi keanggotaan setiap himpunan fuzzy sedemikian
sehingga nilai dari x memenuhi persyaratan berada dalam satu atau lebih himpunan-himpunan fuzzy tersebut. Misalkan Fx =
} ,..., , { 1 2 n x x x f f
f adalah himpunan dari n himpunan
fuzzy untuk atribut x. Fungsi keanggotaan dari
himpunan fuzzy ke-j dalam Fx, dinotasikan
dengan j x f
µ , menyatakan pemetaan dari domain untuk x ke dalam interval [0, 1]. Jika
) v ( j x f
µ = 1 maka nilai v dari x secara penuh merupakan anggota untuk himpunan fuzzy fxj.
Jika j(v) x f
µ = 0 berarti bahwa v bukanlah anggota dari fxj. Semua nilai yang lain di antara 0 dan 1, menentukan keanggotaan parsial (Alhajj & Mehmet 2003). Konsep tersebut selanjutnya digunakan untuk membangun kubus data fuzzy.
Gambar 9 menunjukkan kubus data fuzzy 3
dimensi, di mana setiap dimensi memiliki dua atribut dan banyaknya fungsi keanggotaan dari setiap atribut berkisar 2 dan 3. Dalam Gambar 9, setiap dimensi dari kubus data mengandung
∑
= + k i i n 11 nilai dengan ni adalah banyaknya
fungsi keanggotaan dari atribut xi, k adalah banyaknya atribut, keduanya dalam dimensi X, dan “+1” menunjukkan nilai total di mana setiap sel menyimpan nilai agregasi dari baris-baris sebelumnya. Seperti halnya dalam kubus data crisp, terhadap kubus data fuzzy dapat
diaplikasikan operasi-operasi seperti dice, slice, roll-up dan drill-down.
Gambar 9 Contoh kubus data fuzzy 3 dimensi
(Alhajj & Mehmet 2003)
Dimensi Fuzzy
Elemen (sel) pada dimensi data crisp dapat
digabungkan menjadi satu elemen pada level di atasnya. Untuk kasus fuzzy, suatu elemen dapat
direlasikan dengan lebih dari satu elemen pada level di atasnya dan derajat dari relasi tersebut berada pada interval [0,1]. Kinship relation
mendefinisikan derajat dari relasi tersebut sebagai berikut (Molina et al. 2006 ):
Untuk tiap pasangan level li dan lj di mana lj
∈
Hi, didefinisikanµ
ij : li × l j → [0,1]Setiap derajat dari elemen-elemen dimasukkan di dalam satu elemen pada level
parent dapat dilakukan dengan menggunakan
relasi tersebut. Dengan menggunakan relasi antarelemen dalam dua level berurutan, dapat didefinisikan relasi antara tiap-tiap pasangan nilai dalam level yang berbeda di suatu dimensi yang disebut extended kinship relation. Untuk
menghasilkan suatu nilai agregasi, dilakukan pertimbangan terhadap semua kemungkinan
path antarelemen dalam hirarki. Masing-masing
nilai dikalkulasikan dengan mengagregasikan
kinship relation pada dua level menggunakan
operator
⊗
dan⊕
di mana operator tersebut secara berurutan adalah t-norm dan t-conormyaitu implementasi dari operator minimum dan maksimum. Contoh sederhana dapat dilihat pada Gambar 10 (Molina et al. 2006 ).
Gambar 10 Contoh path pada dimensi fuzzy
Gambar 10 menunjukkan path yang akan
menjadi alur untuk mengkalkulasikan nilai agregasi. Proses kalkulasi nilai-nilai dari contoh tersebut adalah sebagai berikut:
(1
⊗
0.7)⊕
(1⊗
0.3)⊕
(1⊗
0) = 0.7METODE PENELITIAN
Tahapan Penelitian
Tahapan penelitian terdiri dari empat tahapan yaitu:
1. Pengumpulan dataset yang terdiri dari atribut numerik
2. Tahapan praproses data meliputi ekstraksi, pembersihan, transformasi, dan pemuatan (load). Tahap-tahap praproses data dapat
dilihat pada Gambar 11.
Gambar 11 Tahap praproses data
3. Perancangan dan konstruksi data multidimensi fuzzy
4. Perancangan antarmuka kueri Fuzzy OLAP.
Praproses Data
Praproses data adalah proses yang harus dilakukan sebelum membuat data warehouse.
Proses-proses tersebut adalah: 1 Ekstraksi (extraction)
Ekstraksi adalah pengambilan data yang relevan untuk analisis dari basis data operasional sebelum masuk ke data warehouse. Pada ekstraksi, atribut-atribut
dan record-record yang diinginkan dipilih
dan diambil dari basis data operasional. Hal ini perlu dilakukan karena tidak semua elemen data berguna dalam analisis dan pembuatan keputusan. Elemen data yang diperlukan adalah atribut pada data Podes Jawa Barat tahun 2003 dan 2006 yang bersifat numerik agar dapat diimplementasikan konsep fuzzy dan
merupakan atribut data yang mengandung konsep hirarki agar dapat terlihat pola agregasi pada saat pengimplementasian operasi OLAP, serta atribut yang terdapat pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 antartahun.
2 Pembersihan (cleaning)
Pada pembersihan semua kesalahan dihilangkan dan diperbaiki. Pembersihan dilakukan untuk menghilangkan kesalahan
(error). Kesalahan yang umum terjadi
adalah nilai yang hilang (missing values),
noise, dan data yang tidak konsisten.
Pembersihan dilakukan dengan mengisi nilai yang kosong dan menghilangkan noise.
3 Transformasi (transformation)
Pada transformasi, data Podes Jawa Barat tahun 2003 dan 2006 yang terpilih diberikan format dan nama yang umum. Proses transformasi dilakukan agar data tetap konsisten. Transformasi yang paling penting adalah transformasi nama agar tidak ada nama atribut yang sama atau atribut yang sama memiliki nama yang berbeda pada basis data yang berbeda. Setelah transformasi nama, semua elemen data harus dikonversikan ke format yang sama.
Transformasi selanjutnya adalah transformasi nilai dari data crisp ke data fuzzy. Pembentukan data fuzzy dilakukan
melalui proses clustering menggunakan
himpunan fuzzy dan derajat keanggotaannya.
Langkah selanjutnya adalah menentukan validitas cluster. Tujuan dilakukannya
validasi terhadap fuzzy clustering yaitu
untuk mencari skema clustering di mana
sebagian besar vektor dari suatu himpunan datamenunjukkan derajat keanggotaan yang tinggi dalam suatu cluster. Pengukuran
kevalidan cluster dilakukan menurut metode
Xie dan Beni (1991) yang menjelaskan bahwa kevalidan sebuah cluster (S)
ditentukan oleh dua hal yaitu: ukuran kedekatan antaranggota pada tiap cluster
(compactness), dan ukuran keterpisahan
antarcluster satu dengan cluster yang
lainnya (separation). Semakin kecil nilai S,
maka cluster tersebut semakin valid.
4 Pemuatan (loading)
Setelah tahap ekstraksi, pembersihan, dan transformasi dilakukan, maka data dapat dimasukkan ke data warehouse.Data
yang dimasukkan ke dalam data warehouse
adalah data crisp dan data fuzzy. Arsitektur Sistem
Sistem yang akan dibangun mengikuti arsitektur data warehouse tiga tingkat seperti
terlihat pada Gambar 12:
Gambar 12 Arsitektur tiga tingkat data warehouse (Han & Kamber 2001)
1 Tingkat bawah (bottom tier)
Tingkat bawah arsitektur data warehouse adalah server basis data
warehouse yang biasanya sebuah sistem
basis data relasional. Tahap ini data
diambil dari basis data operasional dan sumber eksternal lainnya. Data disimpan sebagai data warehouse.
2 Tingkat tengah (middle tier)
Pada tingkat tengah, operasi OLAP dilakukan pada data warehouse yang
sudah terbentuk. Implementasi operasi OLAP disesuaikan dengan struktur data Podes Jawa Barat 2003 dan 2006, yang mencakup struktur hirarki data. Pada penelitian ini, operasi OLAP diimplementasikan sesuai dengan aturan-aturan pada konsep fuzzy, termasuk
fungsi agregasi fuzzy yang digunakan.
3 Tingkat atas (top tier)
Pada tingkat atas, data warehouse
telah terbentuk dan digunakan oleh pengguna. Perangkat analisis berupa perangkat query dan grafik dibuat untuk
memudahkan analisis data.
Lingkungan Pengembangan Sistem
Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam pengembangan sistem adalah sebagai berikut:
a. Perangkat keras berupa komputer personal dengan spesifikasi:
- Processor: AMD AthlonTM XP 2700+
- Memory: 768 MB
- Harddisk 40 GB
- Keyboard dan mouse
- Monitor b. Perangkat lunak:
- Sistem operasi: Microsoft Windows XP Professional
- DBMS: Oracle 10g Release 2
- Data Warehouse dan OLAP: Analytic
Workspace Manager dan Measure Data Viewer
- MATLAB 7 untuk clustering data
- Microsoft SQL Server 2000 dan Microsoft Excel untuk praproses data.
HASIL DAN PEMBAHASAN
Praproses Data
Praproses dilakukan terhadap data Podes Jawa Barat 2003 dan 2006, tahapan praproses yang dilakukan adalah sebagai berikut:
1. Ekstraksi
Tahapan ekstraksi adalah melakukan pemilihan atribut yang relevan untuk analisis yaitu atribut numerik, atribut berhirarki, dan atribut yang ada pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 antartahun. Atribut pada data Potensi Desa Jawa Barat tahun 2003 dan 2006 yang terpilih adalah atribut lokasi meliputi desa, kecamatan, dan kabupaten di Jawa Barat, serta atribut yang berhubungan dengan kependudukan yang meliputi jumlah penduduk dan jumlah rumah tangga prasejahtera 1 serta jumlah keluarga keseluruhan di masing-masing desa, luasan lahan, dan pendidikan yang meliputi jumlah sekolah dari TK sampai SMA. Atribut-atribut yang terpilih dan deskripsinya dapat dilihat pada Lampiran 1.
2. Pembersihan
Tahap pembersihan data tidak perlu dilakukan, karena data yang digunakan sudah bersih.
3. Transformasi
Tahap transformasi adalah memberikan format yang umum pada data, meliputi menyamakan nama atribut yang sama pada data tahun 2003 dan 2006 atau memberikan nama atribut dengan nama yang umum sehingga atribut antartahun menjadi seragam dan lebih informatif. Selain itu, juga dilakukan penggabungan atribut pada data tahun 2003 karena pada data tahun 2006 beberapa atribut yang sesuai dengan atribut data tahun 2003 dijadikan satu. Pembentukan atribut baru juga dilakukan yang bertujuan untuk mendefinisikan secara lengkap hirarki data. Atribut baru yang dibuat adalah atribut ”Keluarga bukan Prasejahtera I ”. Nilai-nilai atribut tersebut didapatkan dari mengurangi nilai atribut jumlah keluarga keseluruhan dengan nilai atribut jumlah keluarga Prasejahtera I, sehingga nantinya akan dapat didefinisikan hirarki data untuk dimensi rumah tangga.
Pada penelitian kali ini, data yang akan dimasukkan ke dalam data warehouse
bukan hanya data fuzzy tetapi juga data
dalam bentuk crisp. Praproses data yang
telah dilakukan sebelumnya adalah
menghasilkan data crisp, untuk itu perlu
adanya proses lanjutan untuk menghasilkan data dalam bentuk fuzzy. Pembentukan data fuzzy dilakukan dengan proses clustering
terhadap seluruh atribut yang telah terpilih dengan menggunakan algoritma FCM untuk menentukan himpunan fuzzy dan fungsi
keanggotaannya.
Proses clustering menggunakan algoritma
FCM dapat menentukan jumlah cluster yang
diinginkan. Akan tetapi, untuk memilih cluster
yang terbaik dilakukan pengukuran kevalidan
cluster, sehingga proses clustering dicobakan
berulang-ulang dengan jumlah cluster yang
berbeda-beda kemudian dilihat nilai kevalidan
cluster. Cluster yang valid adalah yang
memiliki nilai kevalidan cluster (S) terkecil.
Pada penelitian kali ini, penentuan himpunan fuzzy tidak hanya berdasarkan pada
ukuran kevalidan cluster tetapi juga
memperhatikan kesamaan jumlah cluster pada
dimensi yang sama. Hal ini dilakukan dengan pertimbangan bahwa dalam struktur data
warehouse atribut dalam satu dimensi yang
sama harus sama jumlahnya termasuk measure
yang digunakan juga harus sama.
Clustering dilakukan terpisah antara
atribut-atribut dalam data tahun 2003 dan 2006, sehingga memungkinkan terjadinya ketidaksamaan jumlah cluster yang valid
antartahun pada dimensi yang sama. Jika terjadi ketidaksesuaian maka dilakukan penyesuaian dengan memilih selisih nilai S terkecil. Atribut yang memiliki selisih S terkecil akan dipilih cluster yang jumlahnya sama
dengan atribut yang berada pada dimensi yang sama dan memiliki selisih nilai S lebih besar. Jadi pemilihan cluster pada atribut tersebut
bukan berdasarkan pada nilai S terkecilnya, tapi disesuaikan dengan nilai S terkecil atribut lain dalam satu dimensi. Selain itu, percobaan untuk menentukan jumlah cluster hanya dibatasi
sampai lima cluster saja. Hal ini disebabkan jika
lebih dari lima cluster yang terbentuk maka
variabel linguistic yang dihasilkan menjadi
kurang informatif.
Pada Tabel 1 nilai S terkecil sama dengan 0,00117 saat jumlah cluster yang digunakan
sama dengan 2, sedangkan pada Tabel 2 nilai S terkecil sama dengan 0,00003 yang terjadi pada saat jumlah cluster sama dengan 3. Selisih
nilai S antara jumlah cluster dua dan tiga pada
Tabel 1 sama dengan 0.10084. Selisih selisih nilai S antara jumlah cluster dua dan tiga pada
Tabel 2 sama dengan 0.00001. Oleh karena selisih nilai S antara jumlah cluster dua dan tiga
pada Tabel 2 lebih sedikit daripada selisih nilai S antara jumlah cluster dua dan tiga pada Tabel
1, maka pemilihan jumlah cluster untuk Tabel 2
disesuaikan dengan jumlah cluster valid yang
terbentuk pada Tabel 1, jadi jumlah cluster yang
terpilih untuk dua atribut tersebut adalah sama dengan dua cluster.
Tabel 1 Validasi atribut lahan bukan sawah untuk non pertanian 2006
Tabel 2 Validasi atribut lahan bukan sawah untuk non pertanian 2003
Jumlah
Cluster Compactness Separation S
2 4,69E+05 1,19E+10 0,00004
3 7,70E+04 2,68E+09 0,00003
4 4,54E+04 6,15E+04 0,73807 5 2,78E+03 4,48E+04 0,06198 Hasil keseluruhan pengukuran kevalidan
cluster dapat dilihat pada Lampiran 2 dan
beberapa contoh hasil dari proses clustering
yaitu derajat keanggotaan dan linguistic yang
sesuai dengan jumlah cluster validyang terpilih
dapat dilihat pada Lampiran 3. 4. Pemuatan (loading)
Tahap pemuatan atau loading adalah tahap
pemasukan data yang sudah siap ke data warehouse.
Tingkat Bawah (Bottom Tier)
Pada tingkat ini data diambil dari basis data operasional. Selain itu, dilakukan penyesuaian struktur data terhadap skema data warehouse.
Data yang dimasukkan ke dalam data
warehouse disesuaikan dengan rancangan
skema data multidimensi yang dinginkan, untuk menggambarkan hubungan antardata. Sebelum skema didefinisikan, terlebih dahulu dilakukan
pembuatan tabel-tabel yang nantinya akan digunakan untuk mendefinisikan hubungan antardata yang digambarkan pada skema. Tabel-tabel yang perlu dibuat adalah Tabel-tabel dimensi yang terlihat pada Tabel 3 dan 5, serta dan tabel fakta yang terlihat pada Tabel 4 dan 6. Tabel 3 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data crisp
Nama Tabel Deskripsi
Dim_Lokasi_Crisp Berisikan kode dan
lokasi atau daerah dari tingkat desa sampai tingkat provinsi di Jawa Barat
Dim_Tahun_Crisp Berisikan kode dan
tahun data yang digunakan
Dim_Penduduk_Crisp Berisikan kode dan
penjelasan tentang struktur penduduk Dim_Rt_Crisp Berisikan kode dan
penjelasan struktur rumah tangga Dim_Lahan_Crisp Berisikan kode dan
penjelasan struktur atau macam-macam pengelompokan lahan Dim_Sekolah_Crisp Berisikan kode dan
penjelasan struktur atau macam-macam sekolah
Tabel 4 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data crisp
Nama Tabel Deskripsi
Fakta_Penduduk_Crisp Berisikan kode dan
nilai numerik atau
measure data crisp
penduduk yang berupa jumlah penduduk dalam satuan orang Jumlah
Cluster Compactness Separation S
2 4,E+04 3,E+07 0,00117
3 2,E+04 2,E+05 0,10201
4 9,E+03 1,E+05 0,06102
Tabel 4 lanjutan
Nama Tabel Deskripsi
Fakta_Lahan_Crisp Berisikan kode dan
nilai numerik atau
measure data crisp
lahan yang berupa luas lahan dalam satuan Ha
Fakta_Sekolah_Crisp Berisikan kode dan
nilai numerik atau
measure data crisp
sekolah yang berupa jumlah sekolah dalam satuan unit
Fakta_Rt_Crisp Berisikan kode dan
nilai numerik atau
measure data crisp
rumah tangga yang berupa jumlah rumah tangga dalam satuan keluarga
Tabel 5 Tabel dimensi yang terbentuk dalam pengembangan data warehouse untuk data fuzzy
Nama Tabel Deskripsi
Dim_Lokasi Berisikan kode dan lokasi atau daerah dari tingkat desa sampai tingkat provinsi di Jawa Barat
Dim_Tahun Berisikan kode dan tahun data yang digunakan
Dim_Penduduk Berisikan kode dan penjelasan tentang struktur penduduk termasuk linguistic
penduduk
Dim_Rt Berisikan kode dan penjelasan tentang struktur rumah tangga termasuk linguistic
rumah tangga
Tabel 5 lanjutan
Nama Tabel Deskripsi
Dim_Lahan Berisikan kode dan penjelasan struktur atau macam-macam pengelompokan lahan termasuk linguistic
lahan
Dim_Sekolah Berisikan kode dan penjelasan struktur atau macam-macam sekolah termasuk
linguistic sekolah
Tabel 6 Tabel fakta yang terbentuk dalam pengembangan data warehouse untuk data fuzzy
Nama Tabel Deskripsi
Fakta_Penduduk Berisikan kode dan nilai numerik atau
measure yang berupa
nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Rt Berisikan kode dan nilai numerik atau
measure yang berupa
nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Lahan Berisikan kode dan nilai numerik atau
measure yang berupa
nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Fakta_Sekolah Berisikan kode dan nilai numerik atau
measure yang berupa
nilai-nilai derajat keanggotaan sesuai dengan linguistic-nya
Setelah itu, dilakukan perancangan skema yang digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data
warehouse dan keinginan pembuat data
galaksi untuk menggambarkan hubungan antardata. Skema galaksi untuk data crisp yang
terbentuk dapat dilihat pada Gambar 13 dan skema galaksi untuk data fuzzy terlihat pada
Gambar 14.
Skema yang terlihat pada Gambar 13 dan 14 akan digunakan sebagai kerangka untuk pembangunan data warehouse utama.
Masing-masing skema memiliki enam tabel dimensi yang mendefinisikan atribut-atribut kategorik serta hirarki data dan memiliki 4 tabel fakta yang berisikan nilai-nilai numerik berupa
primary key dari setiap dimensi yang
dihubungkan serta nilai measure yang akan
dioperasikan. Dimensi lokasi dan dimensi tahun digunakan secara bersama-sama (shared). Pada
tiap-tiap skema terbentuk masing-masing empat kubus data sesuai dengan subjeknya. Kubus data dibentuk berdasarkan kombinasi dari beberapa tabel dimensi dan tabel fakta yang saling berhubungan seperti yang telah tergambarkan pada skema yang ditunjukkan pada Gambar 13 dan 14.
Untuk keperluan implementasi, dibuat skema galaksi yang menyesuaikan keperluan
software Oracle. Skema tersebut merupakan
pengembangan dari skema yang terlihat pada Gambar 13 dan 14. Skema yang dihasilkan dapat dilihat di Lampiran 4.
Data warehouse dalam bentuk crisp terdiri
dari empat kubus data dengan masing-masing subjeknya yaitu penduduk, rumah tangga, lahan, dan sekolah. Pada tiap-tiap kubus data memiliki
measure secara berurutan sesuai subjeknya
adalah jumlah penduduk (orang), jumlah rumah tangga (keluarga), luas (Ha), dan jumlah sekolah (unit)
Data warehouse dalam bentuk fuzzy juga
terdiri dari empat kubus data dengan subjek yang sama dengan data warehouse crisp. Hal
yang membedakan adalah pada data warehouse fuzzy memiliki measure yang merupakan nilai
derajat keanggotaan pada tiap-tiap fungsi keanggotaan hinpunan fuzzy yang telah
didefinisikan pada masing-masing dimensinya. Misalnya nilai fuzzy penduduk pada kubus data
penduduk merupakan nilai derajat keanggotaan terhadap variabel linguistic banyak dan sedikit
yang telah terdefinisi pada dimensi penduduk.
Gambar 13 Skema galaksi untuk data crisp
Selain melakukan loading data crisp dan
data fuzzy ke dalam dua warehouse yang
terpisah, dibuat juga modul tambahan berisi table-tabel pendukung yang bertujuan untuk menjelaskan tentang pemaknaan nilai-nilai agregasi yang terdapat pada kubus data fuzzy,
serta penggabungan antara nilai crisp dan fuzzy.
Modul yang dibangun ada tiga yaitu modul_desa, modul_kecamatan, dan modul_kabupaten. Rancangan skema relasi untuk masing-masing modul dapat dilihat pada Lampiran 5.
Tingkat Tengah (Middle Tier)
Pada tingkat tengah adalah implementasi operasi OLAP pada data warehouse yang sudah
terbentuk. Operasi OLAP yang diimplementasikan meliputi operasi roll-up,
drill-down, slice, dice, dan pivot. Pada
penelitian ini, operasi OLAP pada data crisp
menggunakan fungsi agregasi biasa yaitu menggunakan operator agregasi berupa sum,
seperti yang terlihat pada Gambar 17 bahwa untuk nilai di level kecamatan, kabupaten, dan provinsi adalah hasil penjumlah nilai sel-sel di level bawahnya. Untuk data fuzzy operasi
OLAPdiimplementasikan sesuai dengan aturan-aturan pada konsep fuzzy. Untuk menghasilkan
suatu nilai agregasi, dilakukan pertimbangan terhadap semua kemungkinan path antarelemen
dalam hirarki. Masing-masing nilai dikalkulasikan dengan mengagregasikan kinship
relation menggunakan operator
⊗
dan⊕
dimana operator tersebut secara berurutan adalah
t-norm dan t-conorm. Nilai pada level yang
saling berurutan di suatu path dikalkulasikan
dengan menggunakan operator t-norm
kemudian hasil dari kalkulasi tiap-tiap path
diagregasikan menggunakan operator t-conorm
untuk mendapatkan nilai agregasi pada level yang lebih tinggi. Fungsi t-norm adalah
mengambil nilai minimum dari path yang
levelnya berurutan, sedangkan fungsi t-conorm
adalah mengambil nilai maksimum dari hasil kalkulasi pada tiap-tiap path yang telah
dikalkulasikan dengan fungsi t-norm
sebelumnya. Misalnya seperti yang terlihat pada Gambar 15 desa Malasari untuk kasus penduduk laki-laki nilai pada linguistic banyak
nilainya sama dengan 0.02 dan nilai pada
linguistic sedikit 0.98, maka nilai untuk derajat
keanggotaan laki-laki secara keseluruhan adalah
0.98. Nilai tersebut adalah nilai maksimum antara linguistic banyak dan linguistic sedikit.
Maksud dari ringkasan nilai laki-laki sama dengan 0.98 adalah menjelaskan bahwa jumlah penduduk laki-laki di desa Malasari masuk ke dalam kategori linguistic banyak.
Tingkat Atas (Top Tier)
Pada tingkat top tier adalah menampilkan data warehouse yang telah terbentuk, sehingga
dapat digunakan oleh pengguna.Penyajian data dapat dilakukan dari berbagai sudut pandang, misalnya ringkasan data yang menampilkan elemen-elemen yang merupakan potensi daerah di Provinsi Jawa Barat atau penyajian data secara detil di elemen terkecil yaitu tingkat desa. Gambar 15 adalah contoh tampilan kubus data fuzzy untuk subjek penduduk tahun 2003 di
level paling bawah yaitu level desa. Operasi OLAP yang diimplementasikan salah satunya adalah operasi roll-up seperti yang terlihat pada
Gambar 16 yang merupakan hasil dari operasi
roll-up pada dimensi lokasi untuk contoh kasus
yang terlihat pada Gambar 15, di mana nilai pada setiap sel di kecamatan adalah hasil agregasi yang merupakan nilai maksimum dari derajat keanggotaan di masing-masing desa. Contoh tampilan hasil operasi OLAP lainnya dapat dilihat pada Lampiran 6.
Tampilan yang terbentuk juga dilengkapi dengan grafik sebagai bentuk visualisasi data seperti yang terlihat pada Lampiran 7. Selain itu, juga dilengkapi dengan query builder dalam
bentuk query wizard yang dapat mempermudah
pengguna untuk menjalankan operasi OLAP.
Bentuk query builder dapat dilihat di Lampiran
8.
Nilai-nilai yang ditampilkan di setiap elemen pada kubus data crisp adalah berupa
nilai numerik yang sesuai dengan sumber data aslinya. Nilai data crisp untuk level yang lebih
tinggi merupakan hasil agregasi menggunakan operator sum, yang memiliki makna jelas pada
masing-masing subjek dan measure yang telah
didefinisikan. Contoh tampilan data crisp
terlihat pada Gambar 17 dengan contoh kasus menampilkan subjek penduduk tahun 2003. Pada Gambar 17 nilai di setiap elemen adalah nilai real jumlah penduduk baik laki-laki maupun perempuan di masing-masing daerahnya.
Gambar 15 Contoh tampilan fuzzy OLAP untuk subjek penduduk tahun 2003 pada level desa
Gambar 17 Contoh tampilan data crisp untuk contoh kasus tampilan subjek penduduk tahun 2003.
Nilai-nilai yang ditampilkan pada kubus data
fuzzy adalah nilai derajat keanggotaan terhadap
himpunan fuzzy yang telah dibentuk dan diproses
terlebih dahulu. Nilai derajat keanggotaan pada level lebih tinggi merupakan nilai maksimum dari level di bawahnya. Untuk memahami makna nilai agregasi tersebut adalah dengan mempertimbangkan perbandingan nilai derajat keanggotaan antarlinguisticnya, misalnya jika
derajat keanggotaan pada linguistic A lebih besar
daripada nilai derajat keanggotaan pada
linguistic B maka nilai tersebut masuk ke dalam
kategori A. Contohnya pada Gambar 15 derajat keanggotaan penduduk laki-laki di kecamatan Nanggung sama dengan 1 dan dikatakan panduduk laki-laki di kecamatan Nanggung termasuk sedikit. Hal ini diperoleh dari nilai maksimum antara linguistic banyak dan sedikit
pada kecamatan tersebut. Oleh karena nilai
linguistic banyak sama 0.32 dan nilai linguistic
sedikit sama dengan 1 maka kecamatan Nanggung masuk ke kategori sedikit. Akan tetapi, jika nilai hasil agregasi menunjukkan
bahwa perbandingan nilai linguistic-nya adalah
sama, maka dilakukan pertimbangan dengan mengacu pada elemen-elemen di level yang paling bawah, yaitu jika nilai hasil agregasi pada setiap linguistic-nya sama maka dilakukan
pertimbangan dengan melihat nilai maksimum jumlah derajat keanggotaan yang nilainya lebih dari 0,5 pada masing-masing linguistic yang
telah didefinisikan. Linguistic yang memiliki
jumlah nilai keanggotaan lebih dari 0,5 yang paling besar akan menjadi kategori dari nilai tersebut. Contohnya pada Gambar 15 untuk kecamatan Nanggung penduduk memiliki derajat keanggotan sama dengan 1 dan dikatakan masuk kategori sedikit. Ringkasan ini diperoleh dari mengambil nilai derajat keanggotaan maksimum pada level penduduk laki-laki dan perempuan serta di setiap nilai pada linguistic-nya. Oleh
karena jumlah derajat keanggotan yang nilainya lebih dari 0.5 pada linguistic sedikit di
masing-masing level laki-laki dan perempuan jumlahnya lebih besar dari pada di linguistic banyak, maka
penduduk di kecamatan Nanggung masuk kategori sedikit.
Modul-modul tambahan yang telah dibuat untuk membantu dalam memahami makna nilai agregasi fuzzy terdiri dari:
• Modul_desa
Modul_desa menampilkan nilai crisp dan
nilai derajat keanggotaan. Contoh tampilan modul desa dapat dilihat pada Gambar 18.
Derajat keanggotaan yang ditampilkan adalah derajat keanggotaan dasar pada level terbawah untuk dimensi subjeknya yaitu dimensi penduduk dan dimensi lokasi. Selain itu, juga menampilkan nilai crisp yang dapat
diagregasikan berdasarkan dimensi lokasi. Pada Gambar 18 terlihat di level desa dijelaskan secara rinci baik itu nilai cirsp
maupun nilai di setiap linguistic-nya.
Gambar 18 Contoh tampilan modul_desa
• Modul_kecamatan
Modul_kecamatan menampilkan nilai
crisp dan kategori umum untuk tingkat
kecamatan. Beberapa keterangan mengenai kategori umum dapat dilihat pada Lampiran 9. Contoh tampilan modul_kecamatan dapat dilihat pada Gambar 19. Nilai crisp dan
kategori umum yang ditampilkan tidak dapat langsung disimpulkan dengan menghubungkan keduanya. Pada Gambar 19 terlihat bahwa untuk kecamatan Majalaya jumlah penduduk laki-laki 61983 orang dan
masuk kategori umum 1 yaitu banyak, sedangkan kecamatan Rancaekek jumlah penduduk laki-laki 63900 orang dan masuk kategori umum 2 yaitu sedikit. Kasus di atas akan terlihat tidak valid jika disimpulkan secara langsung. Pengambilan kesimpulan yang benar untuk nilai tersebut adalah kecamatan Majalaya memiliki jumlah penduduk laki-laki 61983 orang di mana jumlah derajat keanggotaan yang lebih dari 0,5 di level desa pada linguistic banyak lebih
yang lebih dari 0,5 pada linguistic sedikit,
sehingga jumlah penduduk laki-laki di kecamatan Majalaya masuk kategori umum 1 yaitu banyak atau dapat dikatakan bahwa jumlah penduduk laki-laki di kecamatan Majalaya secara umum di masing-masing daerahnya masuk kategori banyak. Untuk kecamatan Rancaekek meskipun secara real jumlah penduduk laki-laki lebih besar daripada jumlah penduduk laki-laki di
kecamatan Majalaya, kecamatan Rancaekek masuk ke dalam ketegori umum 2 yaitu sedikit. Hal ini dikarenakan jumlah derajat keanggotaan yang lebih dari 0,5 pada
linguistic sedikit lebih besar daripada jumlah
derajat keanggotaan yang lebih dari 0,5 pada
linguistic banyak atau secara umum jumlah
penduduk laki-laki pada masing-masing daerah di kecamatan Rancaekek termasuk dalam kategori sedikit.
Gambar 19 Contoh tampilan modul_kecamatan
• Modul_kabupaten
Modul_kabupaten menampilkan nilai
crisp dan kategori umum untuk tingkat
kabupaten. Beberapa keterangan mengenai kategori umum dapat dilihat pada Lampiran 9. Contoh tampilan modul_ kabupaten dapat dilihat pada Gambar 20. Sama halnya seperti pada modul_kecamatan, nilai crisp dan
kategori umum yang ditampilkan tidak dapat langsung disimpulkan dengan menghubungkan keduanya. Pada Gambar 20 terlihat bahwa untuk kabupaten Cimahi jumlah penduduk laki-laki 201781 orang dan
masuk kategori umum 1 yaitu banyak, sedangkan kabupaten Cianjur jumlah penduduk laki-laki 916495 orang dan masuk kategori umum 2 yaitu sedikit. Kasus di atas akan terlihat tidak valid jika disimpulkan secara langsung. Pengambilan kesimpulan yang benar untuk nilai tersebut adalah kabupaten Cimahi memiliki jumlah penduduk laki-laki 201781 orang di mana jumlah derajat keanggotaan yang lebih dari 0,5 di level desa pada linguistic banyak lebih
besar daripada jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic sedikit,
kabupaten Cimahi masuk kategori umum 1 yaitu banyak atau dapat dikatakan bahwa jumlah penduduk laki-laki di kabupaten Cimahi secara umum di masing-masing daerahnya masuk kategori banyak. Untuk kabupaten Cianjur meskipun secara real jumlah penduduk laki-laki lebih besar daripada jumlah penduduk laki-laki di kabupaten Cimahi, kabupaten Cianjur masuk
ke dalam ketegori umum 2 yaitu sedikit. Hal ini dikarenakan jumlah derajat keanggotaan yang lebih dari 0,5 pada linguistic sedikit
lebih besar daripada jumlah derajat keanggotaan yang lebih dari 0,5 pada
linguistic banyak atau secara umum jumlah
penduduk laki-laki pada masing-masing daerah di kabupaten Cianjur termasuk dalam kategori sedikit.
Gambar 20 Contoh tampilan modul_kabupaten
KESIMPULAN DAN SARAN
Kesimpulan
Penelitian ini menghasilkan data warehouse
yang dibangun berdasarkan konsep fuzzy serta
data warehouse untuk data crisp sebagai
pelengkap penyajian informasi. Data warehouse
yang dibangun menggunakan konsep fuzzy selain
melalui tahapan praproses data juga melalui proses clustering menggunakan algoritma FCM
untuk mendapatkan himpunan fuzzy dan nilai
derajat keanggotaan tiap atribut. Nilai derajat keanggotaan yang didapatkan merupakan
measure, sedangkan linguistic yang
didefinisikan dari jumlah cluster merupakan
salah satu dari atribut pada level terbawah dalam dimensi yang terkait. Data warehouse fuzzy
memiliki 4 kubus data yaitu penduduk, rumah tangga, lahan, dan sekolah.
Operasi-operasi yang diimplementasikan adalah operasi roll-up, drill-down, slice, dice,
dan pivot. Operasi untuk fuzzy OLAP dilakukan
sesuai dengan konsep pengoperasian data multidimensi fuzzy. Operator untuk mendapatkan
nilai agregasi pada konsep fuzzy adalah
menggunakan operator t-norm atau t-conorm
yang merupakan implementasi dari operator minimum atau maksimum. Tampilan data disajikan dalam bentuk crosstab dan graph.
Penelitian ini memberikan informasi berupa data fuzzy dan data crisp. Data fuzzy yang
disajikan memberikan informasi natural dengan mendefinisikan variabel linguistic. Data crisp
disajikan sebagai penunjang untuk mendapatkan informasi.
Saran
Saran untuk pengembangan fuzzy OLAP
adalah mengembangkan sistem yang mengintegrasikan fuzzy OLAP dengan beberapa
algoritma dalam data mining seperti algoritma
association rules. Sistem tersebut diharapkan
akan menyajikan report yang lebih lengkap dan
lebih bermakna untuk melihat pola atau model data dengan lebih jelas, sehingga lebih informatif untuk mendukung pengambilan keputusan.
DAFTAR PUSTAKA
Alhajj R, Mehmet K. 2003. Integrating
Fuzziness into OLAP for Multidimensional
Fuzzy Association Rules Mining. Proceedings
of the Third IEEE International Conference on Data mining.
Cox, E. 2005. Fuzzy Modeling and Algorithms
for Data mining and Exploration. USA:
Academic Press.
Han J, Kamber M. 2001. Data Mining: Concepts
and Techniques. San Diego, USA: Morgan
Kaufmann.
Inmon WH. 1996. Building the Data warehouse.
New York, USA: John Wiley & Sons.
Jang JSR, Sun CT, Mizutani Eiji. 1997. Neuro-Fuzzy and Soft Computing. London:
Prentice-Hall International, Inc.
Molina Carlos, Ariza LR, S Daniel, Vila M.Amparo. 2006. A New Fuzzy
Multidimensional Model. IEEE Transaction
On Fuzzy System.
Xie X, Beni G. 1991. A Validity Measure for Fuzzy Clustering. IEEE Trans Patt Anal Mach
Lampiran 1 Atribut-atribut yang terpilih dari hasil ekstraksi a.Atribut tentang lokasi untuk data tahun 2003 dan 2006
Atribut Deskripsi
Provinsi Berisikan nama provinsi Kabupaten Berisikan nama kabupaten Kecamatan Berisikan nama kecamatan Desa Berisikan nama desa
b. Atribut tentang kependudukan yang terpilih untuk data tahun 2003 Atribut Deskripsi
V402A Berisikan jumlah penduduk laki-laki di tingkat desa V402B Berisikan jumlah penduduk perempuan di tingkat desa V402C Berisikan jumlah keluarga atau rumah tangga di tingkat desa V403A1 Berisikan jumlah rumah tangga atau keluarga yang termasuk
di dalam kategori keluarga prasejahtera I di tingkat desa c.Atribut tentang kependudukan yang terpilih untuk data tahun 2006
Atribut Deskripsi
R401A Berisikan jumlah penduduk laki-laki di tingkat desa R401B Berisikan jumlah penduduk perempuan di tingkat desa R401C Berisikan jumlah rumah tangga atau keluarga di tingkat desa
R401E Berisikan jumlah rumah tangga atau keluarga yang termasuk di dalam kategori keluarga prasejahtera I di tingkat desa
d.Atribut tentang luas lahan yang terpilih untuk data tahun 2003 Atribut Deskripsi
V1201 Berisikan luas desa
V1202 Berisikan luas lahan sawah di masing-masing desa
V1202A Berisikan luas lahan sawah berpengairan yang diusahakan di masing-masing desa V1202B Berisikan luas lahan sawah tidak berpengairan yang diusahakan di masing-masing desa V1202C Berisikan luas lahan sawah sementara yang tidak diusahakan di masing-masing desa V1203 Berisikan luas lahan bukan sawah di masing-masing desa
V1203A Berisikan luas tambak/kolam/padang/rumput di masing-masing desa V1203B Berisikan luas perkebunan di masing-masing desa
V1203C Berisikan luas hutan rakyat di masing-masing desa
V1203D Berisikan luas lahan perumahan dan pemukiman di masing-masing desa V1203E Berisikan luas lahan untuk bangunan industri di masing-masing desa V1203F Berisikan luas lahan utk bangunan lainnya di masing-masing desa
Lampiran 1 lanjutan Tabel d lanjutan
Atribut Deskripsi
V1203G Berisikan luas lahan lainnya diusahakan di masing-masing desa
V1203H Berisikan luas lahan bukan sawah sementara tdk diusahakan di masing-masing desa e.Atribut tentang luas lahan yang terpilih untuk data tahun 2006
Atribut Deskripsi
R10011 Berisikan luas desa
R10021 Berisikan luas lahan sawah di masing-masing desa
R1002A1 Berisikan luas lahan sawah berpengairan yang diusahakan di masing-masing desa R1002B1 Berisikan luas lahan sawah tidak berpengairan yang diusahakan di masing-masing desa R1002C1 Berisikan luas lahan sawah sementara yang tidak diusahakan di masing-masing desa R10031 Berisikan luas lahan bukan sawah di masing-masing desa
R1003A1 Berisikan luas lahan pertanian (kolam/tambak/perkebunan/ hutan rakyat/padang rumput) di masing-masing desa
R1003B1 Berisikan luas ladang yang diusahakan di masing-masing desa R1003C1 Berisikan luas ladang yang tidak diusahakan di masing-masing desa R1003D1 Berisikan luas lahan untuk non pertanian (permukiman/perumahan/
pertokoan/perkantoran/industri dan lainnya) di masing-masing desa f.Atribut tentang pendidikan yang terpilih untuk data tahun 2003
Atribut Deskripsi
V601A2 Berisikan jumlah unit sekolah TK negri di tingkat desa V601A3 Berisikan jumlah unit sekolah TK swasta di tingkat desa
V601B2 Berisikan jumlah unit sekolah SD negri dan yang sederajat di tingkat desa V601B3 Berisikan jumlah unit sekolah SD swasta dan yang sederajat di tingkat desa V601C2 Berisikan jumlah unit sekolah SMP negri dan yang sederajat di tingkat desa V601C3 Berisikan jumlah unit sekolah SMP swasta dan yang sederajat di tingkat desa V601D2 Berisikan jumlah unit sekolah SMA negri dan yang sederajat di tingkat desa V601D3 Berisikan jumlah unit sekolah SMA swasta dan yang sederajat di tingkat desa
Lampiran 1 lanjutan
g.Atribut tentang pendidikan yang terpilih untuk data tahun 2006 Atribut Deskripsi
R601AK2 Berisikan jumlah unit sekolah TK negri di tingkat desa R601AK3 Berisikan jumlah unit sekolah TK swasta di tingkat desa
R601BK2 Berisikan jumlah unit sekolah SD negri dan yang sederajat di tingkat desa R601BK3 Berisikan jumlah unit sekolah SD swasta dan yang sederajat di tingkat desa R601CK2 Berisikan jumlah unit sekolah SMP negri dan yang sederajat di tingkat desa R601CK3 Berisikan jumlah unit sekolah SMP swasta dan yang sederajat di tingkat desa R601DK2 Berisikan jumlah unit sekolah SMA negri dan yang sederajat di tingkat desa R601DK3 Berisikan jumlah unit sekolah SMA swasta dan yang sederajat di tingkat desa Lampiran 2 Hasil validasi cluster
Data Potensi Desa Provinsi Jawa Barat Tahun 2003 a.Atribut Penduduk Laki-Laki
b.Atribut Penduduk Perempuan
Jumlah Cluster Compactness Separation S
2 2,77E+06 5,38E+07 0,05157
3 1,27E+06 1,36E+07 0,09351 4 7,05E+05 4,13E+06 0,17069 5 4,76E+05 1,98E+06 0,24072 c.Atribut Keluarga Prasejahtera I
Jumlah Cluster Compactness Separation S
2 5,95E+04 5,38E+05 0,11058
3 2,87E+04 2,30E+05 0,12520 4 1,73E+04 1,35E+05 0,12818 5 1,18E+04 8,91E+04 0,13188 Jumlah Cluster Compactness Separation S
2 2,66E+06 4,84E+07 0,05498
3 1,26E+06 1,25E+07 0,10107 4 6,95E+05 4,36E+06 0,15960 5 4,64E+05 1,91E+06 0,24237
Lampiran 2 lanjutan
d.Atribut Keluarga Bukan Prasejahtera I
Jumlah Cluster Compactness Separation S
2 3,59E+05 8,72E+06 0,04118
3 1,63E+05 1,49E+06 0,10973 4 9,40E+04 6,01E+05 0,15633 5 5,94E+04 3,26E+05 0,18216 e.Atribut Lahan Sawah Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 5,64E+05 7,75E+09 0,00007
3 4,98E+05 1,04E+05 4,81211 4 4,32E+05 4,35E+04 9,93646 5 4,17E+05 1,43E+04 29,07888 f.Atribut Lahan Sawah Tidak Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 6,47E+04 2,18E+09 0,00003
3 3,65E+04 7,25E+04 0,50291 4 2,49E+04 2,98E+04 0,83399 5 1,27E+03 1,58E+04 0,08048 g.Atribut Lahan Sawah Sementara Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 1,94E+02 2,09E+04 0,00928
3 9,86E+01 4,07E+03 0,02425 4 6,15E+01 2,45E+03 0,02507 5 4,35E+01 8,83E+02 0,04930
h.Atribut Lahan Bukan Sawah Untuk Pertanian (Tambak/Kolam/Tegal/Padang Rumput/Perkebunan/Hutan Rakyat/dll)
Jumlah Cluster Compactness Separation S
2 1,03E+06 2,11E+06 0,48748
3 1,71E+05 1,34E+06 0,12744
4 1,09E+05 3,54E+05 0,30766 5 7,66E+04 2,13E+05 0,36001
Lampiran 2 lanjutan
i.Atribut Lahan Bukan Sawah Berupa Ladang Diusahakan Jumlah Cluster Compactness Separation S
2 1,54E+04 6,45E+05 0,02388
3 4,76E+03 4,97E+05 0,00958
4 2,44E+03 8,49E+04 0,02873 5 1,47E+03 2,93E+04 0,05018 j. Atribut Lahan Bukan Sawah Berupa Ladang Tidak Diusahakan
Jumlah Cluster Compactness Separation S
2 3,95E+03 2,26E+06 0,00175
3 1,07E+03 3,10E+05 0,00343 4 4,54E+02 4,97E+04 0,00913 5 2,29E+02 1,25E+04 0,01829
k.Atribut Lahan Bukan Sawah Untuk Non Pertanian (Perumahan/Industri/Pertokoan/dll) Jumlah Cluster Compactness Separation S
2 4,69E+05 1,19E+10 0,00004
3 7,70E+04 2,68E+09 0,00003
4 4,54E+04 6,15E+04 0,73807 5 2,78E+03 4,48E+04 0,06198 l.Atribut Sekolah TK
Jumlah Cluster Compactness Separation S
2 9,55E-01 1,46E+01 0,06557 3 4,78E-01 4,13E+00 0,11597 4 2,47E-01 1,33E+00 0,18508
5 1,36E-01 1,05E+00 0,13005
m. Atribut Sekolah SD
Jumlah Cluster Compactness Separation S
2 2,69E+00 2,35E+01 0,11443 3 1,36E+00 9,05E+00 0,15056 4 8,06E-01 4,80E+00 0,16779
5 5,30E-01 3,30E+00 0,16086
n. Atribut Sekolah SMP
Jumlah Cluster Compactness Separation S
2 3,53E-01 4,60E+00 0,07689 3 1,24E-01 1,18E+00 0,10525 4 5,26E-02 1,01E+00 0,05219
Lampiran 2 lanjutan o. Atribut Sekolah SMA
Jumlah Cluster Compactness Separation S
2 1,34E-01 2,21E+00 0,06072 3 3,94E-02 1,18E+00 0,03342 4 1,56E-02 1,01E+00 0,01553
5 6,94E-03 1,00E+00 0,00693
Data Potensi Desa Provinsi Jawa Barat Tahun 2006 a.Atribut Penduduk Laki-Laki
Jumlah Cluster Compactness Separation S
2 2,96E+06 5,72E+07 0,05182
3 1,47E+06 1,52E+07 0,09659 4 7,99E+05 5,47E+06 0,14622 5 5,17E+05 2,40E+06 0,21511 b.Atribut Penduduk Perempuan
Jumlah Cluster Compactness Separation S
2 3,12E+06 5,97E+07 0,05226
3 1,49E+06 1,86E+07 0,08029 4 8,04E+05 5,17E+06 0,15560 5 5,29E+05 2,36E+06 0,22396 c.Atribut Keluarga Prasejahtera I
Jumlah Cluster Compactness Separation S
2 6,73E+04 6,76E+05 0,09964
3 3,28E+04 2,63E+05 0,12494 4 2,00E+04 1,47E+05 0,13641 5 1,33E+04 9,04E+04 0,14677 d.Atribut Keluarga Bukan Prasejahtera I
Jumlah Cluster Compactness Separation S
2 5,08E+05 1,51E+07 0,03375
3 2,44E+05 2,34E+06 0,10427 4 1,42E+05 8,96E+05 0,15893 5 9,37E+04 4,07E+05 0,23031 e.Atribut Lahan Sawah Berpengairan Diusahakan
Jumlah Cluster Compactness Separation S
2 7,94E+03 1,06E+05 0,07516
3 4,09E+03 2,30E+04 0,17788 4 2,57E+03 1,36E+04 0,18938 5 1,81E+03 8,34E+03 0,21760