• Tidak ada hasil yang ditemukan

METODE PENELITIAN Langkah-langkah yang dilakukan pada

penelitian ini adalah sebagai berikut:

Studi Pustaka

Pada tahap ini dilakukan pengumpulan informasi dan bahan pustaka yang berkaitan dengan data mining dan logika fuzzy khususnya Fuzzy C-Means.

Proses Knowledge Discovery in Databases

Pada penelitian ini, proses Knowledge Discovery in Databases (KDD) dilakukan sesuai dengan tahap KDD menurut Han & Kamber (2006). Tahap-tahap KDD yang dilakukan pada penelitian ini adalah:

1. Pembersihan data

Pembersihan data dilakukan dengan cara menghapus data yang tidak valid seperti data yang kurang lengkap nilai atributnya. Selain dari data yang kurang nilai atributnya, pembersihan data juga dilakukan dengan tidak mengikutsertakan data yang memiliki atribut daerah yang tidak terdapat pada peta. Daerah-daerah yang dianggap tidak valid karena tidak terdapat pada peta adalah: Babakan Fakultas, Bojong Enyod, Ceger, Desa Tengah, Graha Indah, Kalibata, Karang Asem, Komplek LPTI, Panggugah, Pulo Armin, dan Sampora.

2. Integrasi data

Proses integrasi data yang dilakukan adalah dengan menambahkan titik koordinat dummy (X dan Y) untuk setiap data, karena data sumber yang didapatkan tidak memiliki titik koordinat. Integrasi titik koordinat pada data diperlukan untuk visualisasi persebaran cluster penggunaan listrik pada peta.

Titik koordinat yang diberikan bersifat random pada satu daerah. Sebagai contoh, dalam satu daerah terdapat 100 data yang memiliki atribut lingkungan Babakan, maka disebar sebanyak 100 titik koordinat pada daerah Babakan. Kemudian 100 titik koordinat tersebut diintegrasikan pada 100 data yang memiliki atribut daerah Babakan.

3. Seleksi data

Tahap seleksi data pada penelitian ini terdapat dua tahap seleksi, yaitu seleksi berdasarkan daerah dan seleksi berdasarkan jam penggunaan listrik. Sebelum melakukan seleksi berdasarkan daerah, dilakukan pengelompokan daerah terlebih dahulu. Proses pengelompokan daerah dilakukan dengan menggabungkan beberapa daerah ke dalam satu kelurahan. Sebagai contoh, data yang memiliki atribut daerah Kedung Halang, Nanggrak Indah, Nanggrak Mekar, dan Pasir Jambu dijadikan satu daerah, yaitu daerah kelurahan Kedung Halang.

Tahap seleksi data pertama adalah seleksi berdasarkan daerah. Pada tahap ini, data yang dipilih adalah data pelanggan PLN UPJ Bogor Timur yang dikategorikan sebagai daerah PLN UPJ Bogor Timur. Hal ini dilakukan karena PLN UPJ Bogor Timur tidak hanya melayani pelanggan di daerah Bogor Timur saja, melainkan juga

7 Iterasi ke- Fungsi Objektif

11 233,635708 12 231,262171 13 230,004460 14 229,165714 15 228,876866 16 288,800946 17 288,783573 18 288,779830 19 288,779041 20 288,778876 21 288,778842 22 288,778835

Hasil clustering dengan FCM untuk data contoh dapat dilihat pada Gambar 5. Cluster 1 ditunjukkan oleh warna cyan, cluster 2 ditunjukkan oleh warna magenta, dan cluster 3 ditunjukkan oleh warna biru. Pusat cluster ditunjukkan oleh titik berbentuk kotak dengan warna yang sejenis dengan cluster-nya.

Gambar 5 Plot 2 dimensi pada program FCM untuk data contoh

METODE PENELITIAN

Langkah-langkah yang dilakukan pada penelitian ini adalah sebagai berikut:

Studi Pustaka

Pada tahap ini dilakukan pengumpulan informasi dan bahan pustaka yang berkaitan dengan data mining dan logika fuzzy khususnya Fuzzy C-Means.

Proses Knowledge Discovery in Databases

Pada penelitian ini, proses Knowledge Discovery in Databases (KDD) dilakukan sesuai dengan tahap KDD menurut Han & Kamber (2006). Tahap-tahap KDD yang dilakukan pada penelitian ini adalah:

1. Pembersihan data

Pembersihan data dilakukan dengan cara menghapus data yang tidak valid seperti data yang kurang lengkap nilai atributnya. Selain dari data yang kurang nilai atributnya, pembersihan data juga dilakukan dengan tidak mengikutsertakan data yang memiliki atribut daerah yang tidak terdapat pada peta. Daerah-daerah yang dianggap tidak valid karena tidak terdapat pada peta adalah: Babakan Fakultas, Bojong Enyod, Ceger, Desa Tengah, Graha Indah, Kalibata, Karang Asem, Komplek LPTI, Panggugah, Pulo Armin, dan Sampora.

2. Integrasi data

Proses integrasi data yang dilakukan adalah dengan menambahkan titik koordinat dummy (X dan Y) untuk setiap data, karena data sumber yang didapatkan tidak memiliki titik koordinat. Integrasi titik koordinat pada data diperlukan untuk visualisasi persebaran cluster penggunaan listrik pada peta.

Titik koordinat yang diberikan bersifat random pada satu daerah. Sebagai contoh, dalam satu daerah terdapat 100 data yang memiliki atribut lingkungan Babakan, maka disebar sebanyak 100 titik koordinat pada daerah Babakan. Kemudian 100 titik koordinat tersebut diintegrasikan pada 100 data yang memiliki atribut daerah Babakan.

3. Seleksi data

Tahap seleksi data pada penelitian ini terdapat dua tahap seleksi, yaitu seleksi berdasarkan daerah dan seleksi berdasarkan jam penggunaan listrik. Sebelum melakukan seleksi berdasarkan daerah, dilakukan pengelompokan daerah terlebih dahulu. Proses pengelompokan daerah dilakukan dengan menggabungkan beberapa daerah ke dalam satu kelurahan. Sebagai contoh, data yang memiliki atribut daerah Kedung Halang, Nanggrak Indah, Nanggrak Mekar, dan Pasir Jambu dijadikan satu daerah, yaitu daerah kelurahan Kedung Halang.

Tahap seleksi data pertama adalah seleksi berdasarkan daerah. Pada tahap ini, data yang dipilih adalah data pelanggan PLN UPJ Bogor Timur yang dikategorikan sebagai daerah PLN UPJ Bogor Timur. Hal ini dilakukan karena PLN UPJ Bogor Timur tidak hanya melayani pelanggan di daerah Bogor Timur saja, melainkan juga

8 mendapat limpahan pelanggan dari daerah

lain seperti daerah Citeureup, Semplak, dan Bogor Kota. Selain itu, pembagian daerah Bogor menurut PLN berbeda dengan pembagian daerah Bogor menurut pemerintah, karena beberapa daerah di sekitar Bogor Timur menurut pemerintah dimasukkan sebagai daerah Bogor Timur oleh PLN UPJ Bogor Timur. Sebagai contoh, daerah Kedung Halang yang terdapat di Bogor Utara termasuk sebagai daerah Bogor Timur oleh PLN UPJ Bogor Timur. Data pelanggan yang tidak dianggap sebagai pelanggan PLN UPJ Bogor Timur tidak diikutsertakan dalam proses clustering. Untuk membedakan pelanggan tersebut, dapat dilihat dari lima digit pertama kode pelanggan. Lima digit pertama yang digunakan untuk pelanggan PLN UPJ Bogor Timur adalah 53821xxxxxxx.

Seleksi data dengan menggunakan kode pelanggan ternyata masih belum bersih dari daerah selain Bogor. Oleh karena itu, seleksi daerah juga dilakukan secara manual dengan tidak memasukkan data yang daerahnya tidak dianggap sebagai daerah Bogor seperti daerah Citeurep. Tahap seleksi data kedua adalah seleksi berdasarkan jam penggunaan listrik. Pada tahap ini, data pelanggan yang dipilih adalah data pengguna yang menggunakan KWH ≥ 150 jam. Alasannya adalah, penggunaan listrik dengan KWH < 150 jam dianggap sebagai rumah kosong atau tidak aktif menggunakan listrik. Data sumber yang didapat tidak terdapat keterangan jumlah jam penggunaan listrik. Cara mendapatkan jam penggunaan listrik dari data pelanggan adalah dengan menggunakan persamaan nomor 10.

... (10) 4. Transformasi data

Tahap transformasi data dilakukan untuk mengubah data agar dapat digunakan dalam proses data mining. Transformasi data yang dilakukan pada penelitian ini adalah melakukan normalisasi data dengan normalisasi z-score.

5. Data mining

Proses data mining yang dilakukan pada penelitian ini adalah menerapkan teknik clustering dengan algoritme Fuzzy C- Means untuk mendapatkan karakteristik

dari data. Cluster yang digunakan pada penelitian ini sebanyak empat cluster. Empat cluster tersebut akan dijadikan empat kelas penggunaan listrik, yaitu rendah, sedang, tinggi, dan sangat tinggi. 6. Evaluasi pola

Setelah melakukan data mining, dilakukan evaluasi pola yang dilakukan dengan cara melihat karakteristik dari setiap cluster yang sudah dibentuk.

7. Representasi pengetahuan

Representasi pengetahuan yang digunakan pada penelitian ini adalah dengan visualisasi persebaran titik pelanggan pada peta. Setiap anggota cluster akan ditampilkan dalam warna yang berbeda pada peta menurut cluster-nya.

Diagram alur penelitian yang digunakan dapat dilihat pada Gambar 6.

Gambar 6 Diagram alur penelitian Perancangan Sistem

Pada tahap ini dilakukan pemilihan atribut-atribut yang akan digunakan pada penelitian. Atribut-atribut yang terpilih digunakan untuk diaplikasikan pada proses clustering dengan Fuzzy C-Means (FCM). Evaluasi pola dan representasi pengetahuan ditampilkan dalam bentuk visualisasi pada peta digital. Data KWH Pembersihan, Integrasi, & Seleksi data Transfromasi Data Penerapan Fuzzy C-Means Plot Hasil Clustering Pr ap ro ses D ata M in in g R e p re sen tasi Pen g e tah u an

9 Implementasi Sistem

Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkah- langkah melakukan clustering dengan FCM, yaitu:

1. Memilih data yang akan di-cluster 2. Menetapkan parameter-parameter untuk:

 Jumlah cluster (n > c ≥ 2)  Pangkat pembobot (w > 1)  Maksimum iterasi (i)  Kriteria penghentian (ɛ)

3. Menghitung pusat cluster, fungsi objektif, dan perubahan derajat keanggotaan pada matriks U.

Tahap representasi pengetahuan dengan peta diimplementasikan menggunakan perangkat lunak Quantum GIS v.1.6.0.

HASIL DAN PEMBAHASAN

Dokumen terkait