ABSTRAK
MUHAMAD HAIKAL. Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Dibimbing oleh Aziz Kustiyo, S.Si., M.Kom.
Program Adipura merupakan program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup (KLH). Program ini bertujuan untuk mewujudkan kota yang bersih dan teduh (KLH 2007). Penilaian Program Adipura terdiri atas penilaian Fisik dan penilaian Non Fisik. Penilaian Fisik terdiri atas Pemantauan I, Pemantauan II, dan Pemantauan Verifikasi. Penilaian Non Fisik berupa penilaian terhadap kuesioner yang diisi oleh kabupaten/kota. Mekanisme kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan mekanisme kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Periode pelaksanaan Program Adipura adalah satu tahun. Pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya dilaksanakan setelah seluruh data hasil penilaian Fisik dan penilaian Non Fisik tersedia. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit. Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal.
Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura menggunakan algoritme klasifikasi VFI5. Data yang digunakan merupakan data Fisik hasil Pemantauan I dan Pemantauan II kategori kota Sedang dan kota Kecil regional Jawa periode 2007-2008. Metode klasifikasi yang digunakan adalah klasifikasi VFI5 biasa dan klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature satu dan bobot yang telah ditentukan KLH. Klasifikasi VFI5 modifikasi merupakan klasifikasi VFI5 biasa dengan penambahan batas bawah dan batas atas interval dengan nilai minimum dan nilai maksimum skala nilai Program Adipura,
vote pada nilai minimum dan nilai maksimum tersebut sama dengan vote batas bawah dan batas atas skala nilai Program Adipura.
Hasil penelitian ini menunjukan tingkat akurasi tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan II dengan metode klasifikasi VFI5 modifikasi dan bobot masing-masing feature satu. Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.
1
PENDAHULUAN
Latar Belakang
Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).
Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :
1 Pemantauan I pada bulan Agustus sampai dengan bulan September.
2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.
Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).
Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.
Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.
Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).
Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura
diharapkan dapat membantu permasalahan tersebut.
Tujuan
Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.
Ruang Lingkup
Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.
2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.
Manfaat
Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.
Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.
TINJAUAN PUSTAKA
Program Adipura
Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).
Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.
1
PENDAHULUAN
Latar Belakang
Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).
Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :
1 Pemantauan I pada bulan Agustus sampai dengan bulan September.
2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.
Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).
Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.
Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.
Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).
Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura
diharapkan dapat membantu permasalahan tersebut.
Tujuan
Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.
Ruang Lingkup
Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.
2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.
Manfaat
Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.
Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.
TINJAUAN PUSTAKA
Program Adipura
Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).
Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.
2
Tabel 1 Kategori kota Program Adipura
Kategori Jumlah Penduduk
Metropolitan Lebih dari 1.000.000 Besar 500.001 – 1.000.000 Sedang 100.001 – 500.000 Kecil 20.001 – 100.000
Penghargaan anugerah Adipura diberikan kepada walikota/bupati yang telah berhasil mengelola lingkungannya dengan baik. Kriteria penilaian Program Adipura terdiri atas dua penilaian, yaitu Penilaian Fisik dan Penilaian Non Fisik.
1 Penilaian Fisik
Penilaian Fisik merupakan pemantauan terhadap kondisi fisik kawasan perkotaan suatu kabupaten/kota. Pemantauan dilaksanakan paling sedikit dua kali dalam satu periode penilaian. Pemantauan verifikasi dilaksanakan jika diperlukan (KLH 2006).
Jumlah kriteria Penilaian Fisik Program Adipura adalah 16 kriteria. Masing-masing kriteria memiliki bobot yang telah ditentukan oleh KLH. Kriteria Penilaian Fisik Program Adipura disajikan pada Tabel 2.
Tabel 2 Kriteria Penilaian Fisik Program Adipura
No Kriteria Penilaian Bobot
1 Perumahan 7
7 Rumah Sakit/Puskesmas 6
8 Hutan kota 3
9 Taman kota 7
10 Terminal bus/angkot 8
11 Stasiun kereta 5
12 Pelabuhan penumpang 5 13 Perairan terbuka 8 14 Tempat pembuangan akhir 10 15 Pemanfaatan sampah 3
16 Pantai wisata 4
Penilaian Program Adipura menggunakan skala nilai yang telah ditentukan. Skala nilai yang digunakan pada Program Adipura disajikan pada Tabel 3.
2 Penilaian Non Fisik
Penilaian Non Fisik merupakan penilaian terhadap dokumen berupa kuisioner yang telah diisi oleh kota peserta Program Adipura.
Penilaian Non Fisik dilaksanakan satu kali dalam satu periode penilaian.
Tabel 3 Skala nilai Program Adipura
Skala Nilai
Klasifikasi merupakan proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001).
Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance
yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Guvenir et al. 1998).
K-Fold Cross Validation
Sebelum digunakan sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek tersebut, validasi kinerja bisa menjadi yang paling penting.
Cross validation dan bootstrapping
merupakan metode untuk memperkirakan
error generalisasi berdasarkan “resampling” (Weiss and Kulikowski, 1991; Efron and Tibshirani, 1993; Hjorth, 1994; Plutowski, Sakata and White, 1994; Shao and Tu, 1995 diacu dalam Sarle 2004)
K-Fold Cross Validation membagi himpunan contoh ke dalam k himpunan bagian secara acak. Pengulangan dilakukan sebanyak k kali dan pada setiap ulangan, satu subset untuk pengujian dan subset lainnya untuk pelatihan.
3
iterasi ke-i, subset Si diperlakukan sebagai data pengujian dan subset lainnya diperlakukan sebagai data pelatihan. Pada iterasi pertama S2,…,Sk menjadi data pelatihan dan S1 menjadi data pengujian, pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan S2 menjadi data pengujian dan seterusnya.
VFI5 (Voting Feature Intervals 5)
Voting Feature Intervals 5 (VFI5) adalah salah satu algoritme yang digunakan dalam pengklasifikasian data. Algoritme tersebut dikembangkan oleh Demiröz dan Gűvenir (Gűvenir dan Demiröz 1997). Algoritme VFI5 merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature
atau atribut. Semua instance pelatihan diproses bersamaan. Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi.
1 Pelatihan
Pada tahap Pelatihan dilakukan pencarian nilai end point suatu feature f pada kelas data c. End point yaitu nilai minimum dan nilai maksimum setiap kelas c pada feature f. Kemudian setiap nilai end point tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval yang terdiri atas semua nilai end point yang diperoleh dan range interval yang terdiri atas nilai-nilai antara dua end point
yang berdekatan tidak termasuk end point
tersebut.
Tahap selanjutnya adalah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i yang direpsentasikan sebagai
interval_class_count[f,i,c]. untuk setiap
instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi antar kelas. Hasil normalisasi direpresentasikan dalam
interval_class_vote[f,i,c]. Nilai-nilai pada
interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Pseudocode
tahap pelatihan dari algoritme VFI5 disajikan pada Gambar 1.
2 Klasifikasi
Tahap klasifikasi algoritme VFI5 dilakukan proses inisialisasi awal nilai vote
masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari nilai interval i dimana ef jatuh, dimana ef adalah nilai feature f dari instance tes e. jika ef tidak diketahui (hilang), maka feature tersebut tidak disertakan dalam
voting (member nilai vote 0 untuk masing-masing kelas) sehingga feature yang nilainya tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan.
Feature tersebut akan memberikan nilai vote
untuk masing-masing kelas dengan prosedur (Guvenir 1998):
feature_vote[f,c] = interval_class_vote[f,i,c]. Setiap feature f mengumpulkan nilai vote
kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote
tertinggi diprediksi sebagai kelas dari instance
tes c. Pseudocode tahap klasifikasi dari algoritme VFI5 disajikan pada Gambar 2.
Confusion Matrix
Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matiks dan kelas data hasil prediksi suatu algoritme klasifikasi. Kemampuan dari algoritme klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Confusion matrix untuk data dengan dua kelas disajikan pada Tabel 4 (Hamilton et al. 2002). berhasil diprediksi dengan benar sebagai kelas 1.
b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2. c adalah jumlah instance kelas 2 yang
4
d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
METODE PENELITIAN
Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.
Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote
masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.
Data
Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.
Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan
I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.
Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah
instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature
sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.
Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).
Data latih dan data uji
Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.
Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.
train (TrainingSet);
begin
for each feature f
if f is linear
for each class c
EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);
sort(EndPoints[f]);
for each end point p in EndPoints[f]
from a point interval from end point p
from a range interval between p and the next endpoint ≠ p else /* f is nominal */
from a point interval for each value of f
for each interval i on feature f
for each class c
interval_class_count[f,i,c]=0;
count_instances(f,TrainingSet);
for each interval i on feature dimension f
4
d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
METODE PENELITIAN
Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.
Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote
masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.
Data
Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.
Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan
I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.
Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah
instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature
sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.
Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).
Data latih dan data uji
Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.
Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.
train (TrainingSet);
begin
for each feature f
if f is linear
for each class c
EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);
sort(EndPoints[f]);
for each end point p in EndPoints[f]
from a point interval from end point p
from a range interval between p and the next endpoint ≠ p else /* f is nominal */
from a point interval for each value of f
for each interval i on feature f
for each class c
interval_class_count[f,i,c]=0;
count_instances(f,TrainingSet);
for each interval i on feature dimension f
5
Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5.
Pelatihan
Pelatihan VFI5 dilakukan pada tiga data, yaitu data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data tersebut masing-masing dibagi menjadi 2/3 data training dan 1/3 data
testing. Kriteria penilaian Program Adipura menjadi feature dalam VFI5. Hasil evaluasi di akhir periode pelaksanaan Program Adipura yang menunjukan suatu kota berhasil meraih penghargaan anugerah Adipura atau tidak menjadi kelas dalam VFI5. Ilustrasi pada tahap pelatihan dapat dilihat pada Lampiran 3.
Tabel 5 3-Fold Cross Validation data Program Adipura
Gambar 3 Metode penelitian.
Klasifikasi
Pada tahap ini dilakukan klasifikasi data
testing berdasarkan pola yang telah diperoleh pada tahap pelatihan. ilustrasi pada tahap klasifikasi dapat dilihat pada Lampiran 4. Klasifikasi yang digunakan terdapat empat cara, yaitu :
for each feature f
for each class c
feature_vote[f,c] = 0;
/* vote of feature f for class c */
if ef value is known
i = find_interval(f,ef)
feature_vote[f,c] = interval_class_vote[f,ic]
for each class c
vote[c] = vote[c] + feature_vote[f,c]*weight[f];
return class c with highes vote[c]
6
1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).
2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing
feature adalah satu (VFI5b).
3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).
4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).
Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval
diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih
anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.
Akurasi
Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :
= ∑
∑
Lingkup Pengembangan
Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook
dengan spesifikasi:
1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan
3 Harddisk 250 GB.
Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.
HASIL DAN PEMBAHASAN
Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.
Data Pemantauan I
Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.
6
1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).
2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing
feature adalah satu (VFI5b).
3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).
4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).
Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval
diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih
anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.
Akurasi
Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :
= ∑
∑
Lingkup Pengembangan
Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook
dengan spesifikasi:
1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan
3 Harddisk 250 GB.
Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.
HASIL DAN PEMBAHASAN
Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.
Data Pemantauan I
Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.
7
iterasi ini berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 5.
Tabel 7 Confusion matrix pada iterasi pertama data Pemantauan I.
Data Prediksi pertama data Pemantauan I
Metode Prediksi
Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 9. Seluruh kota salah prediksi pada iterasi kedua adalah sama untuk seluruh metode klasifikasi. Daftar kota salah prediksi seluruh metode pada iterasi kedua dapat dilihat pada Lampiran 6.
Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I ini tidak menunjukan perbedaan akurasi terhadap masing-masing metode (84.85%). Tingkat akurasi pada iterasi ini lebih tinggi dari iterasi sebelumnya.
Tabel 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I
Metode Prediksi
Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 10. Jumlah kota salah prediksi pada iterasi ketiga berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 7.
Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I menunjukan beberapa kota salah diprediksi. Salah satu kota tersebut adalah kota Pasuruan dengan kategori kota Sedang. Vote untuk kelas Bukan Adipura 48.70, sedangkan vote untuk kelas Adipura 51.30. Selisih vote dengan nilai yang kecil (selisih 2.60) menjadi salah satu penyebab
kesalahan prediksi kota Pasuruan. Detail vote
untuk masing-masing instance dapat dilihat pada Lampiran 8.
Tabel 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I
Metode Prediksi
Tahap klasifikasi data Pemantauan I menggunakan 3-fold cross validation
menunjukan penggunaan bobot masing-masing feature adalah satu memiliki akurasi rata-rata yang lebih tinggi dibandingkan dengan bobot yang telah ditentukan KLH, sedangkan penggunaan metode klasifikasi VFI5 (VFI5a) dan VFI5 modifikasi (VFI5b) tidak menunjukan perbedaan tingkat akurasi. Tingkat akurasi rata-rata hasil tahap klasifikasi data Pemantauan I disajikan pada Tabel 11. Grafik akurasi prediksi pada data Pemantauan I dapat dilihat pada Lampiran 9.
Hasil tahap klasifikasi data Pemantauan I menunjukan tingkat akurasi tertinggi pada metode VFI5a dan VFI5b sebesar 85.70 %. Metode ini merupakan menggunakan algoritme klasifikasi VFI5 dan algoritme VFI5 modifikasi dengan bobot masing-masing feature sama. Pada tahap klasifikasi ini penggunaan bobot yang ditentukan KLH tidak memberikan hasil yang lebih baik daripada bobot masing-masing feature sama.
Tabel 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I
Metode Akurasi rata-rata
VFI5a 85.70 %
VFI5b 85.70 %
VFI5c 82.64 %
VFI5d 85.67 %
Data Pemantauan II
Jumlah instance data Pemantauan II Program Adipura sama dengan jumlah
instance pada data Pemantauan I. Data ini selanjutnya dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji pada data Pemantauan II sama dengan pada data Pemantauan I.
8
pada Tabel 12. Seluruh kota salah prediksi pada iterasi ini adalah sama untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi pertama data Pemantauan II dapat dilihat pada Lampiran 10.
Tabel 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II
Metode Prediksi
Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 13. Kota salah prediksi pada iterasi kedua dapat dilihat pada Lampiran 11. Detail vote kota Pasuruan pada kota salah prediksi iterasi pertama dapat dilihat pada Lampiran 12, detail vote
kabupaten Temanggung pada Lampiran 13, dan detail vote kabupaten Wonogiri pada Lampiran 14.
Tabel 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II
Metode Prediksi
Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 14. Jumlah kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 15.
Tabel 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II
Metode Prediksi
Hasil tahap klasifikasi data Pemantauan II menunjukan tingkat akurasi yang lebih tinggi dibandingkan dengan setiap iterasi pada tahap klasifikasi data Pemantauan I. Akurasi tertinggi pada tahap ini adalah pada iterasi ketiga menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Tingkat akurasi yang diperoleh pada metode tersebut adalah 96.97 %.
Tingkat akurasi rata-rata tertinggi pada tahap klasifikasi data Pemantauan II sebesar 91.82 % menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Secara umum, tingkat akurasi tahap klasifikasi data Pemantauan II lebih tinggi dari tahap klasifikasi data Pemantauan I. Tingkat akurasi rata-rata pada tahap klasifikasi data Pemantauan II disajikan pada Tabel 15. Grafik akurasi prediksi pada data Pemantauan II dapat dilihat pada Lampiran 16.
Tabel 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II
Metode Akurasi rata-rata
VFI5a 90.81 % VFI5b 91.82 % VFI5c 89.80 % VFI5d 89.80 %
Data rata-rata Pemantauan I dan Pemantauan II
Data yang digunakan merupakan rata-rata Pemantauan I dan Pemantauan II Program Adipura. Data tersebut dihitung nilai rata-rata Pemantauan I dan Pemantauan II untuk setiap kriteria penilaian seluruh kota peserta Program Adipura. Selanjutnya data ini dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji sama dengan pada data sebelumnya.
Metode yang digunakan pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II sama dengan tahap klasifikasi data sebelumnya. Hasil tahap klasifikasi pada iterasi pertama disajikan pada Tabel 16, sedangkan daftar kota salah prediksi pada iterasi pertama dapat dilihat pada Lampiran 17.
Tabel 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II
9
yaitu 93.94 % untuk seluruh metode. Penggunaan masing-masing metode dan bobot pada tahap klasifikasi iterasi ini tidak mempengaruhi tingkat akurasi.
Tabel 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I
Hasil tahap klasifikasi iterasi ketiga disajikan pada Tabel 18. Kota salah prediksi pada iterasi ketiga dapat dilihat pada Lampiran 18.
Tabel 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I
Hasil klasifikasi seluruh seluruh iterasi pada data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi rata-rata tertinggi sebesar 91.82 %. Tingkat akurasi ini dicapai dengan menggunakan metode klasifikasi modifikasi dengan bobot masing-masing feature adalah satu. Tingkat akurasi rata-rata pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II disajikan pada Tabel 19. Grafik akurasi prediksi pada data rata-rata Pemantauan I dan Pemantauan II dapat dilihat pada Lampiran 19.
Tabel 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II
Metode Akurasi rata-rata
VFI5a 89.77 % VFI5b 91.82 % VFI5c 89.74 % VFI5d 90.78 %
Hasil tahap klasifikasi menggunakan data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi tertinggi pada
metode klasifikasi VFI5 modifikasi dengan bobot masing-masing feature sama (VFI5b). Tingkat akurasi rata-rata tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II yaitu 91.82 %. Daftar tingkat akurasi untuk setiap data, iterasi dan metode klasifikasi dapat dilihat pada Lampiran 20. Grafik tingkat akurasi setiap metode dan data pemantauan disajikan pada Gambar 5.
Gambar 5 Grafik tingkat akurasi prediksi.
Penggunaan kombinasi metode klasifikasi dan bobot bertujuan untuk mengetahui tingkat akurasi tertinggi prediksi kota peraih anugerah Adipura, sehingga dapat diketahui metode yang paling tepat. Tingkat akurasi rata-rata tertinggi untuk seluruh data pemantauan Program Adipura diperoleh menggunakan metode klasifikasi modifikasi dengan menggunakan bobot masing-masing
feature sama (VFI5b) yaitu sebesar 89.78 %. Grafik tingkat akurasi rata-rata setiap metode disajikan pada Gambar 6.
10
KESIMPULAN DAN SARAN
Kesimpulan
Prediksi anugerah Adipura dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, selain itu hasil prediksi tersebut dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura.
Penelitian ini menunjukkan tingkat akurasi tertinggi dihasilkan pada data hasil Pemantauan II dengan menggunakan metode klasifikasi modifikasi dan bobot masing-masing feature sama dengan satu (VFI5b). Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.
Saran
Penelitian ini dapat dikembangkan lebih lanjut melalui peningkatan akurasi prediksi dengan melakukan eksplorasi terhadap bobot
feature.
DAFTAR PUSTAKA
Demiröz G dan Gűvenir HA. 1997.
Classification by Voting Feature Intervals. http://www.cs.ucf.edu/~ecl/ papers/demiros97classification.pdf. [November 2008].
Gűvenir HA, Demiröz G, Ilter N. 1998.
Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13(3), 147-165.
Hamilton H, Gurak E, Findlater L. 2003.
Confusion Matrix. http://www2.cs. uregina.ca/~dbd/cs831/notes/confusion_ matrix/confusion_matrix.html. [Februari 2009].
Han J, Kamber M. 2001. Data Mining Concept & Technique. USA:Academic Press.
[KLH] Kementerian Lingkungan Hidup. 2006. Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006. Jakarta.
[KLH] Kementerian Lingkungan Hidup. 2007. ADIPURA Menuju Kota Bersih dan Teduh. Jakarta.
[KLH] Kementerian Lingkungan Hidup. 2008. Laporan Tahun 2007 Deputi Bidang Pengendalian Pencemaran
Lingkungan Kementerian Lingkungan Hidup. Jakarta.
PREDIKSI KOTA PERAIH ANUGERAH ADIPURA
MENGGUNAKAN ALGORITME KLASIFIKASI VFI5
MUHAMAD HAIKAL
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
10
KESIMPULAN DAN SARAN
Kesimpulan
Prediksi anugerah Adipura dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, selain itu hasil prediksi tersebut dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura.
Penelitian ini menunjukkan tingkat akurasi tertinggi dihasilkan pada data hasil Pemantauan II dengan menggunakan metode klasifikasi modifikasi dan bobot masing-masing feature sama dengan satu (VFI5b). Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.
Saran
Penelitian ini dapat dikembangkan lebih lanjut melalui peningkatan akurasi prediksi dengan melakukan eksplorasi terhadap bobot
feature.
DAFTAR PUSTAKA
Demiröz G dan Gűvenir HA. 1997.
Classification by Voting Feature Intervals. http://www.cs.ucf.edu/~ecl/ papers/demiros97classification.pdf. [November 2008].
Gűvenir HA, Demiröz G, Ilter N. 1998.
Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13(3), 147-165.
Hamilton H, Gurak E, Findlater L. 2003.
Confusion Matrix. http://www2.cs. uregina.ca/~dbd/cs831/notes/confusion_ matrix/confusion_matrix.html. [Februari 2009].
Han J, Kamber M. 2001. Data Mining Concept & Technique. USA:Academic Press.
[KLH] Kementerian Lingkungan Hidup. 2006. Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006. Jakarta.
[KLH] Kementerian Lingkungan Hidup. 2007. ADIPURA Menuju Kota Bersih dan Teduh. Jakarta.
[KLH] Kementerian Lingkungan Hidup. 2008. Laporan Tahun 2007 Deputi Bidang Pengendalian Pencemaran
Lingkungan Kementerian Lingkungan Hidup. Jakarta.
PREDIKSI KOTA PERAIH ANUGERAH ADIPURA
MENGGUNAKAN ALGORITME KLASIFIKASI VFI5
MUHAMAD HAIKAL
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PREDIKSI KOTA PERAIH ANUGERAH ADIPURA
MENGGUNAKAN ALGORITME KLASIFIKASI VFI5
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
MUHAMAD HAIKAL
G64066018
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRAK
MUHAMAD HAIKAL. Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Dibimbing oleh Aziz Kustiyo, S.Si., M.Kom.
Program Adipura merupakan program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup (KLH). Program ini bertujuan untuk mewujudkan kota yang bersih dan teduh (KLH 2007). Penilaian Program Adipura terdiri atas penilaian Fisik dan penilaian Non Fisik. Penilaian Fisik terdiri atas Pemantauan I, Pemantauan II, dan Pemantauan Verifikasi. Penilaian Non Fisik berupa penilaian terhadap kuesioner yang diisi oleh kabupaten/kota. Mekanisme kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan mekanisme kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Periode pelaksanaan Program Adipura adalah satu tahun. Pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya dilaksanakan setelah seluruh data hasil penilaian Fisik dan penilaian Non Fisik tersedia. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit. Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal.
Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura menggunakan algoritme klasifikasi VFI5. Data yang digunakan merupakan data Fisik hasil Pemantauan I dan Pemantauan II kategori kota Sedang dan kota Kecil regional Jawa periode 2007-2008. Metode klasifikasi yang digunakan adalah klasifikasi VFI5 biasa dan klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature satu dan bobot yang telah ditentukan KLH. Klasifikasi VFI5 modifikasi merupakan klasifikasi VFI5 biasa dengan penambahan batas bawah dan batas atas interval dengan nilai minimum dan nilai maksimum skala nilai Program Adipura,
vote pada nilai minimum dan nilai maksimum tersebut sama dengan vote batas bawah dan batas atas skala nilai Program Adipura.
Hasil penelitian ini menunjukan tingkat akurasi tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan II dengan metode klasifikasi VFI5 modifikasi dan bobot masing-masing feature satu. Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.
Judul : Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5 Nama : Muhamad Haikal
NIM : G64066018
Menyetujui:
Pembimbing
Aziz Kustiyo, S.Si., M.Kom.
NIP. 197007191998021001
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA.
NIP. 196103281986011002
RIWAYAT HIDUP
PRAKATA
Bismillahirrahmanirrahim
Puji dan syukur penulis panjatkan kepada Allah SWT atas rahmat dan karuniaNya. Shalawat dan salam penulis curahkan kepada nabi Muhammad SAW sehingga penulis dapat menyelesaikan skripsi tugas akhir dengan judul Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5.
Penulis mengucapkan terimakasih kepada seluruh pihak sehingga penelitian ini dapat diselesaikan, diantaranya :
Kedua orangtua tercinta yang selalu memberikan doa dan motivasi kepada penulis. Bapak Aziz Kustiyo, S.Si., M.Kom. selaku dosen pembimbing yang telah memberikan
arahan, masukan, dan semangat kepada penulis sehingga penelitian ini dapat diselesaikan. Ibu Dra. Melda Mardalina, M.Sc. dan Bapak Dr. Ir. Agus Buono, M.Si., M.Kom. selaku
dosen penguji yang telah memberikan masukan kepada penulis dalam menyelesaikan penelitian ini.
Adik-adikku tercinta, Haiva, Sumaya, Rania, dan Nadia yang selalu memberikan motivasi dan dukungan.
Seluruh dosen pengajar dan staf Departemen Ilmu Komputer, FMIPA, IPB.
Ibu Ir. Ratna Kartikasari, M.Sc. dan Bapak Drs. Tri Bangun L. Sony selaku pimpinan yang telah mendukung dalam proses pendidikan penulis.
Octo Mulyanto, Rion Evrian Adwanosa, Sandi Wasmana, Vanny Zaenudin, Dhilla Hapsari, Sekar Tangi, Anggita Dhiny dan seluruh teman kerja yang telah memberikan motivasi dan dukungan.
Bapak Trias Hermanu dan keluarga yang telah memberikan motivasi dan dukungan. Seta Baehera, Abdul Rosyid, Tuti dan teman-teman angkatan I, II, dan III ILKOM
Ekstensi IPB yang tidak dapat disebutkan satu per satu.
Seluruh pihak lain yang membantu penelitian ini yang tidak dapat disebutkan satu per satu. Akhirnya penulis berharap semoga penelitian ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin.
Bogor, Juli 2009
iv
DAFTAR ISI
Halaman
v
DAFTAR TABEL
Halaman
1 Kategori kota Program Adipura ... 2 2 Kriteria Penilaian Fisik Program Adipura ... 2 3 Skala nilai Program Adipura ... 2 4 Confusion matrix ... 3 5 3-FoldCross Validation data Program Adipura ... 5 6 Jumlah data latih dan data uji Pemantauan I ... 5 7 Confusion matrix pada iterasi pertama data Pemantauan I. ... 7 8 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I ... 7 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I... 7 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I ... 7 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I... 7 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II ... 8 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II ... 8 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II ... 8 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II ... 8 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II ... 8 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I dan Pemantauan II ... 9 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I dan Pemantauan II ... 9 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II ... 9
DAFTAR GAMBAR
Halaman
vi
DAFTAR LAMPIRAN
1
PENDAHULUAN
Latar Belakang
Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).
Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :
1 Pemantauan I pada bulan Agustus sampai dengan bulan September.
2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.
Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).
Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.
Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.
Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).
Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura
diharapkan dapat membantu permasalahan tersebut.
Tujuan
Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.
Ruang Lingkup
Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.
2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.
Manfaat
Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.
Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.
TINJAUAN PUSTAKA
Program Adipura
Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).
Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.
2
Tabel 1 Kategori kota Program Adipura
Kategori Jumlah Penduduk
Metropolitan Lebih dari 1.000.000 Besar 500.001 – 1.000.000 Sedang 100.001 – 500.000 Kecil 20.001 – 100.000
Penghargaan anugerah Adipura diberikan kepada walikota/bupati yang telah berhasil mengelola lingkungannya dengan baik. Kriteria penilaian Program Adipura terdiri atas dua penilaian, yaitu Penilaian Fisik dan Penilaian Non Fisik.
1 Penilaian Fisik
Penilaian Fisik merupakan pemantauan terhadap kondisi fisik kawasan perkotaan suatu kabupaten/kota. Pemantauan dilaksanakan paling sedikit dua kali dalam satu periode penilaian. Pemantauan verifikasi dilaksanakan jika diperlukan (KLH 2006).
Jumlah kriteria Penilaian Fisik Program Adipura adalah 16 kriteria. Masing-masing kriteria memiliki bobot yang telah ditentukan oleh KLH. Kriteria Penilaian Fisik Program Adipura disajikan pada Tabel 2.
Tabel 2 Kriteria Penilaian Fisik Program Adipura
No Kriteria Penilaian Bobot
1 Perumahan 7
7 Rumah Sakit/Puskesmas 6
8 Hutan kota 3
9 Taman kota 7
10 Terminal bus/angkot 8
11 Stasiun kereta 5
12 Pelabuhan penumpang 5 13 Perairan terbuka 8 14 Tempat pembuangan akhir 10 15 Pemanfaatan sampah 3
16 Pantai wisata 4
Penilaian Program Adipura menggunakan skala nilai yang telah ditentukan. Skala nilai yang digunakan pada Program Adipura disajikan pada Tabel 3.
2 Penilaian Non Fisik
Penilaian Non Fisik merupakan penilaian terhadap dokumen berupa kuisioner yang telah diisi oleh kota peserta Program Adipura.
Penilaian Non Fisik dilaksanakan satu kali dalam satu periode penilaian.
Tabel 3 Skala nilai Program Adipura
Skala Nilai
Klasifikasi merupakan proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001).
Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance
yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Guvenir et al. 1998).
K-Fold Cross Validation
Sebelum digunakan sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek tersebut, validasi kinerja bisa menjadi yang paling penting.
Cross validation dan bootstrapping
merupakan metode untuk memperkirakan
error generalisasi berdasarkan “resampling” (Weiss and Kulikowski, 1991; Efron and Tibshirani, 1993; Hjorth, 1994; Plutowski, Sakata and White, 1994; Shao and Tu, 1995 diacu dalam Sarle 2004)
K-Fold Cross Validation membagi himpunan contoh ke dalam k himpunan bagian secara acak. Pengulangan dilakukan sebanyak k kali dan pada setiap ulangan, satu subset untuk pengujian dan subset lainnya untuk pelatihan.
3
iterasi ke-i, subset Si diperlakukan sebagai data pengujian dan subset lainnya diperlakukan sebagai data pelatihan. Pada iterasi pertama S2,…,Sk menjadi data pelatihan dan S1 menjadi data pengujian, pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan S2 menjadi data pengujian dan seterusnya.
VFI5 (Voting Feature Intervals 5)
Voting Feature Intervals 5 (VFI5) adalah salah satu algoritme yang digunakan dalam pengklasifikasian data. Algoritme tersebut dikembangkan oleh Demiröz dan Gűvenir (Gűvenir dan Demiröz 1997). Algoritme VFI5 merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature
atau atribut. Semua instance pelatihan diproses bersamaan. Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi.
1 Pelatihan
Pada tahap Pelatihan dilakukan pencarian nilai end point suatu feature f pada kelas data c. End point yaitu nilai minimum dan nilai maksimum setiap kelas c pada feature f. Kemudian setiap nilai end point tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval yang terdiri atas semua nilai end point yang diperoleh dan range interval yang terdiri atas nilai-nilai antara dua end point
yang berdekatan tidak termasuk end point
tersebut.
Tahap selanjutnya adalah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i yang direpsentasikan sebagai
interval_class_count[f,i,c]. untuk setiap
instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi antar kelas. Hasil normalisasi direpresentasikan dalam
interval_class_vote[f,i,c]. Nilai-nilai pada
interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Pseudocode
tahap pelatihan dari algoritme VFI5 disajikan pada Gambar 1.
2 Klasifikasi
Tahap klasifikasi algoritme VFI5 dilakukan proses inisialisasi awal nilai vote
masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari nilai interval i dimana ef jatuh, dimana ef adalah nilai feature f dari instance tes e. jika ef tidak diketahui (hilang), maka feature tersebut tidak disertakan dalam
voting (member nilai vote 0 untuk masing-masing kelas) sehingga feature yang nilainya tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan.
Feature tersebut akan memberikan nilai vote
untuk masing-masing kelas dengan prosedur (Guvenir 1998):
feature_vote[f,c] = interval_class_vote[f,i,c]. Setiap feature f mengumpulkan nilai vote
kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote
tertinggi diprediksi sebagai kelas dari instance
tes c. Pseudocode tahap klasifikasi dari algoritme VFI5 disajikan pada Gambar 2.
Confusion Matrix
Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matiks dan kelas data hasil prediksi suatu algoritme klasifikasi. Kemampuan dari algoritme klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Confusion matrix untuk data dengan dua kelas disajikan pada Tabel 4 (Hamilton et al. 2002). berhasil diprediksi dengan benar sebagai kelas 1.
b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2. c adalah jumlah instance kelas 2 yang
4
d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.
METODE PENELITIAN
Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.
Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote
masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.
Data
Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.
Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan
I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.
Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah
instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature
sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.
Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).
Data latih dan data uji
Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.
Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.
train (TrainingSet);
begin
for each feature f
if f is linear
for each class c
EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);
sort(EndPoints[f]);
for each end point p in EndPoints[f]
from a point interval from end point p
from a range interval between p and the next endpoint ≠ p else /* f is nominal */
from a point interval for each value of f
for each interval i on feature f
for each class c
interval_class_count[f,i,c]=0;
count_instances(f,TrainingSet);
for each interval i on feature dimension f
5
Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5.
Pelatihan
Pelatihan VFI5 dilakukan pada tiga data, yaitu data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data tersebut masing-masing dibagi menjadi 2/3 data training dan 1/3 data
testing. Kriteria penilaian Program Adipura menjadi feature dalam VFI5. Hasil evaluasi di akhir periode pelaksanaan Program Adipura yang menunjukan suatu kota berhasil meraih penghargaan anugerah Adipura atau tidak menjadi kelas dalam VFI5. Ilustrasi pada tahap pelatihan dapat dilihat pada Lampiran 3.
Tabel 5 3-Fold Cross Validation data Program Adipura
Gambar 3 Metode penelitian.
Klasifikasi
Pada tahap ini dilakukan klasifikasi data
testing berdasarkan pola yang telah diperoleh pada tahap pelatihan. ilustrasi pada tahap klasifikasi dapat dilihat pada Lampiran 4. Klasifikasi yang digunakan terdapat empat cara, yaitu :
for each feature f
for each class c
feature_vote[f,c] = 0;
/* vote of feature f for class c */
if ef value is known
i = find_interval(f,ef)
feature_vote[f,c] = interval_class_vote[f,ic]
for each class c
vote[c] = vote[c] + feature_vote[f,c]*weight[f];
return class c with highes vote[c]
6
1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).
2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing
feature adalah satu (VFI5b).
3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).
4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).
Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval
diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih
anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.
Akurasi
Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :
= ∑
∑
Lingkup Pengembangan
Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook
dengan spesifikasi:
1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan
3 Harddisk 250 GB.
Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.
HASIL DAN PEMBAHASAN
Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.
Data Pemantauan I
Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.