• Tidak ada hasil yang ditemukan

Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5

N/A
N/A
Protected

Academic year: 2017

Membagikan "Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5"

Copied!
57
0
0

Teks penuh

(1)

ABSTRAK

MUHAMAD HAIKAL. Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Dibimbing oleh Aziz Kustiyo, S.Si., M.Kom.

Program Adipura merupakan program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup (KLH). Program ini bertujuan untuk mewujudkan kota yang bersih dan teduh (KLH 2007). Penilaian Program Adipura terdiri atas penilaian Fisik dan penilaian Non Fisik. Penilaian Fisik terdiri atas Pemantauan I, Pemantauan II, dan Pemantauan Verifikasi. Penilaian Non Fisik berupa penilaian terhadap kuesioner yang diisi oleh kabupaten/kota. Mekanisme kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan mekanisme kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Periode pelaksanaan Program Adipura adalah satu tahun. Pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya dilaksanakan setelah seluruh data hasil penilaian Fisik dan penilaian Non Fisik tersedia. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit. Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal.

Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura menggunakan algoritme klasifikasi VFI5. Data yang digunakan merupakan data Fisik hasil Pemantauan I dan Pemantauan II kategori kota Sedang dan kota Kecil regional Jawa periode 2007-2008. Metode klasifikasi yang digunakan adalah klasifikasi VFI5 biasa dan klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature satu dan bobot yang telah ditentukan KLH. Klasifikasi VFI5 modifikasi merupakan klasifikasi VFI5 biasa dengan penambahan batas bawah dan batas atas interval dengan nilai minimum dan nilai maksimum skala nilai Program Adipura,

vote pada nilai minimum dan nilai maksimum tersebut sama dengan vote batas bawah dan batas atas skala nilai Program Adipura.

Hasil penelitian ini menunjukan tingkat akurasi tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan II dengan metode klasifikasi VFI5 modifikasi dan bobot masing-masing feature satu. Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.

(2)

1

PENDAHULUAN

Latar Belakang

Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).

Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :

1 Pemantauan I pada bulan Agustus sampai dengan bulan September.

2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.

Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).

Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.

Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.

Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).

Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura

diharapkan dapat membantu permasalahan tersebut.

Tujuan

Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.

2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.

Manfaat

Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.

Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.

TINJAUAN PUSTAKA

Program Adipura

Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).

Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.

(3)

1

PENDAHULUAN

Latar Belakang

Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).

Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :

1 Pemantauan I pada bulan Agustus sampai dengan bulan September.

2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.

Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).

Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.

Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.

Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).

Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura

diharapkan dapat membantu permasalahan tersebut.

Tujuan

Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.

2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.

Manfaat

Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.

Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.

TINJAUAN PUSTAKA

Program Adipura

Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).

Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.

(4)

2

Tabel 1 Kategori kota Program Adipura

Kategori Jumlah Penduduk

Metropolitan Lebih dari 1.000.000 Besar 500.001 – 1.000.000 Sedang 100.001 – 500.000 Kecil 20.001 – 100.000

Penghargaan anugerah Adipura diberikan kepada walikota/bupati yang telah berhasil mengelola lingkungannya dengan baik. Kriteria penilaian Program Adipura terdiri atas dua penilaian, yaitu Penilaian Fisik dan Penilaian Non Fisik.

1 Penilaian Fisik

Penilaian Fisik merupakan pemantauan terhadap kondisi fisik kawasan perkotaan suatu kabupaten/kota. Pemantauan dilaksanakan paling sedikit dua kali dalam satu periode penilaian. Pemantauan verifikasi dilaksanakan jika diperlukan (KLH 2006).

Jumlah kriteria Penilaian Fisik Program Adipura adalah 16 kriteria. Masing-masing kriteria memiliki bobot yang telah ditentukan oleh KLH. Kriteria Penilaian Fisik Program Adipura disajikan pada Tabel 2.

Tabel 2 Kriteria Penilaian Fisik Program Adipura

No Kriteria Penilaian Bobot

1 Perumahan 7

7 Rumah Sakit/Puskesmas 6

8 Hutan kota 3

9 Taman kota 7

10 Terminal bus/angkot 8

11 Stasiun kereta 5

12 Pelabuhan penumpang 5 13 Perairan terbuka 8 14 Tempat pembuangan akhir 10 15 Pemanfaatan sampah 3

16 Pantai wisata 4

Penilaian Program Adipura menggunakan skala nilai yang telah ditentukan. Skala nilai yang digunakan pada Program Adipura disajikan pada Tabel 3.

2 Penilaian Non Fisik

Penilaian Non Fisik merupakan penilaian terhadap dokumen berupa kuisioner yang telah diisi oleh kota peserta Program Adipura.

Penilaian Non Fisik dilaksanakan satu kali dalam satu periode penilaian.

Tabel 3 Skala nilai Program Adipura

Skala Nilai

Klasifikasi merupakan proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001).

Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance

yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Guvenir et al. 1998).

K-Fold Cross Validation

Sebelum digunakan sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek tersebut, validasi kinerja bisa menjadi yang paling penting.

Cross validation dan bootstrapping

merupakan metode untuk memperkirakan

error generalisasi berdasarkan “resampling” (Weiss and Kulikowski, 1991; Efron and Tibshirani, 1993; Hjorth, 1994; Plutowski, Sakata and White, 1994; Shao and Tu, 1995 diacu dalam Sarle 2004)

K-Fold Cross Validation membagi himpunan contoh ke dalam k himpunan bagian secara acak. Pengulangan dilakukan sebanyak k kali dan pada setiap ulangan, satu subset untuk pengujian dan subset lainnya untuk pelatihan.

(5)

3

iterasi ke-i, subset Si diperlakukan sebagai data pengujian dan subset lainnya diperlakukan sebagai data pelatihan. Pada iterasi pertama S2,…,Sk menjadi data pelatihan dan S1 menjadi data pengujian, pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan S2 menjadi data pengujian dan seterusnya.

VFI5 (Voting Feature Intervals 5)

Voting Feature Intervals 5 (VFI5) adalah salah satu algoritme yang digunakan dalam pengklasifikasian data. Algoritme tersebut dikembangkan oleh Demiröz dan Gűvenir (Gűvenir dan Demiröz 1997). Algoritme VFI5 merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature

atau atribut. Semua instance pelatihan diproses bersamaan. Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi.

1 Pelatihan

Pada tahap Pelatihan dilakukan pencarian nilai end point suatu feature f pada kelas data c. End point yaitu nilai minimum dan nilai maksimum setiap kelas c pada feature f. Kemudian setiap nilai end point tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval yang terdiri atas semua nilai end point yang diperoleh dan range interval yang terdiri atas nilai-nilai antara dua end point

yang berdekatan tidak termasuk end point

tersebut.

Tahap selanjutnya adalah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i yang direpsentasikan sebagai

interval_class_count[f,i,c]. untuk setiap

instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi antar kelas. Hasil normalisasi direpresentasikan dalam

interval_class_vote[f,i,c]. Nilai-nilai pada

interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Pseudocode

tahap pelatihan dari algoritme VFI5 disajikan pada Gambar 1.

2 Klasifikasi

Tahap klasifikasi algoritme VFI5 dilakukan proses inisialisasi awal nilai vote

masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari nilai interval i dimana ef jatuh, dimana ef adalah nilai feature f dari instance tes e. jika ef tidak diketahui (hilang), maka feature tersebut tidak disertakan dalam

voting (member nilai vote 0 untuk masing-masing kelas) sehingga feature yang nilainya tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan.

Feature tersebut akan memberikan nilai vote

untuk masing-masing kelas dengan prosedur (Guvenir 1998):

feature_vote[f,c] = interval_class_vote[f,i,c]. Setiap feature f mengumpulkan nilai vote

kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote

tertinggi diprediksi sebagai kelas dari instance

tes c. Pseudocode tahap klasifikasi dari algoritme VFI5 disajikan pada Gambar 2.

Confusion Matrix

Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matiks dan kelas data hasil prediksi suatu algoritme klasifikasi. Kemampuan dari algoritme klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Confusion matrix untuk data dengan dua kelas disajikan pada Tabel 4 (Hamilton et al. 2002). berhasil diprediksi dengan benar sebagai kelas 1.

 b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2.  c adalah jumlah instance kelas 2 yang

(6)

4

 d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.

METODE PENELITIAN

Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.

Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote

masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.

Data

Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.

Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan

I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.

Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah

instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature

sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.

Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).

Data latih dan data uji

Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.

Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.

train (TrainingSet);

begin

for each feature f

if f is linear

for each class c

EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);

sort(EndPoints[f]);

for each end point p in EndPoints[f]

from a point interval from end point p

from a range interval between p and the next endpoint ≠ p else /* f is nominal */

from a point interval for each value of f

for each interval i on feature f

for each class c

interval_class_count[f,i,c]=0;

count_instances(f,TrainingSet);

for each interval i on feature dimension f

(7)

4

 d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.

METODE PENELITIAN

Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.

Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote

masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.

Data

Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.

Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan

I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.

Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah

instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature

sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.

Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).

Data latih dan data uji

Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.

Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.

train (TrainingSet);

begin

for each feature f

if f is linear

for each class c

EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);

sort(EndPoints[f]);

for each end point p in EndPoints[f]

from a point interval from end point p

from a range interval between p and the next endpoint ≠ p else /* f is nominal */

from a point interval for each value of f

for each interval i on feature f

for each class c

interval_class_count[f,i,c]=0;

count_instances(f,TrainingSet);

for each interval i on feature dimension f

(8)

5

Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5.

Pelatihan

Pelatihan VFI5 dilakukan pada tiga data, yaitu data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data tersebut masing-masing dibagi menjadi 2/3 data training dan 1/3 data

testing. Kriteria penilaian Program Adipura menjadi feature dalam VFI5. Hasil evaluasi di akhir periode pelaksanaan Program Adipura yang menunjukan suatu kota berhasil meraih penghargaan anugerah Adipura atau tidak menjadi kelas dalam VFI5. Ilustrasi pada tahap pelatihan dapat dilihat pada Lampiran 3.

Tabel 5 3-Fold Cross Validation data Program Adipura

Gambar 3 Metode penelitian.

Klasifikasi

Pada tahap ini dilakukan klasifikasi data

testing berdasarkan pola yang telah diperoleh pada tahap pelatihan. ilustrasi pada tahap klasifikasi dapat dilihat pada Lampiran 4. Klasifikasi yang digunakan terdapat empat cara, yaitu :

for each feature f

for each class c

feature_vote[f,c] = 0;

/* vote of feature f for class c */

if ef value is known

i = find_interval(f,ef)

feature_vote[f,c] = interval_class_vote[f,ic]

for each class c

vote[c] = vote[c] + feature_vote[f,c]*weight[f];

return class c with highes vote[c]

(9)

6

1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).

2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing

feature adalah satu (VFI5b).

3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).

4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).

Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval

diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih

anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.

Akurasi

Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :

= ∑

Lingkup Pengembangan

Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook

dengan spesifikasi:

1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan

3 Harddisk 250 GB.

Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.

HASIL DAN PEMBAHASAN

Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.

Data Pemantauan I

Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.

(10)

6

1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).

2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing

feature adalah satu (VFI5b).

3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).

4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).

Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval

diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih

anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.

Akurasi

Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :

= ∑

Lingkup Pengembangan

Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook

dengan spesifikasi:

1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan

3 Harddisk 250 GB.

Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.

HASIL DAN PEMBAHASAN

Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.

Data Pemantauan I

Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.

(11)

7

iterasi ini berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 5.

Tabel 7 Confusion matrix pada iterasi pertama data Pemantauan I.

Data Prediksi pertama data Pemantauan I

Metode Prediksi

Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 9. Seluruh kota salah prediksi pada iterasi kedua adalah sama untuk seluruh metode klasifikasi. Daftar kota salah prediksi seluruh metode pada iterasi kedua dapat dilihat pada Lampiran 6.

Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I ini tidak menunjukan perbedaan akurasi terhadap masing-masing metode (84.85%). Tingkat akurasi pada iterasi ini lebih tinggi dari iterasi sebelumnya.

Tabel 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I

Metode Prediksi

Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 10. Jumlah kota salah prediksi pada iterasi ketiga berbeda untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 7.

Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I menunjukan beberapa kota salah diprediksi. Salah satu kota tersebut adalah kota Pasuruan dengan kategori kota Sedang. Vote untuk kelas Bukan Adipura 48.70, sedangkan vote untuk kelas Adipura 51.30. Selisih vote dengan nilai yang kecil (selisih 2.60) menjadi salah satu penyebab

kesalahan prediksi kota Pasuruan. Detail vote

untuk masing-masing instance dapat dilihat pada Lampiran 8.

Tabel 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I

Metode Prediksi

Tahap klasifikasi data Pemantauan I menggunakan 3-fold cross validation

menunjukan penggunaan bobot masing-masing feature adalah satu memiliki akurasi rata-rata yang lebih tinggi dibandingkan dengan bobot yang telah ditentukan KLH, sedangkan penggunaan metode klasifikasi VFI5 (VFI5a) dan VFI5 modifikasi (VFI5b) tidak menunjukan perbedaan tingkat akurasi. Tingkat akurasi rata-rata hasil tahap klasifikasi data Pemantauan I disajikan pada Tabel 11. Grafik akurasi prediksi pada data Pemantauan I dapat dilihat pada Lampiran 9.

Hasil tahap klasifikasi data Pemantauan I menunjukan tingkat akurasi tertinggi pada metode VFI5a dan VFI5b sebesar 85.70 %. Metode ini merupakan menggunakan algoritme klasifikasi VFI5 dan algoritme VFI5 modifikasi dengan bobot masing-masing feature sama. Pada tahap klasifikasi ini penggunaan bobot yang ditentukan KLH tidak memberikan hasil yang lebih baik daripada bobot masing-masing feature sama.

Tabel 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I

Metode Akurasi rata-rata

VFI5a 85.70 %

VFI5b 85.70 %

VFI5c 82.64 %

VFI5d 85.67 %

Data Pemantauan II

Jumlah instance data Pemantauan II Program Adipura sama dengan jumlah

instance pada data Pemantauan I. Data ini selanjutnya dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji pada data Pemantauan II sama dengan pada data Pemantauan I.

(12)

8

pada Tabel 12. Seluruh kota salah prediksi pada iterasi ini adalah sama untuk setiap metode klasifikasi. Daftar kota salah prediksi pada iterasi pertama data Pemantauan II dapat dilihat pada Lampiran 10.

Tabel 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II

Metode Prediksi

Hasil tahap klasifikasi pada iterasi kedua disajikan pada Tabel 13. Kota salah prediksi pada iterasi kedua dapat dilihat pada Lampiran 11. Detail vote kota Pasuruan pada kota salah prediksi iterasi pertama dapat dilihat pada Lampiran 12, detail vote

kabupaten Temanggung pada Lampiran 13, dan detail vote kabupaten Wonogiri pada Lampiran 14.

Tabel 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II

Metode Prediksi

Hasil tahap klasifikasi pada iterasi ketiga disajikan pada Tabel 14. Jumlah kota salah prediksi pada iterasi ini dapat dilihat pada Lampiran 15.

Tabel 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II

Metode Prediksi

Hasil tahap klasifikasi data Pemantauan II menunjukan tingkat akurasi yang lebih tinggi dibandingkan dengan setiap iterasi pada tahap klasifikasi data Pemantauan I. Akurasi tertinggi pada tahap ini adalah pada iterasi ketiga menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Tingkat akurasi yang diperoleh pada metode tersebut adalah 96.97 %.

Tingkat akurasi rata-rata tertinggi pada tahap klasifikasi data Pemantauan II sebesar 91.82 % menggunakan metode klasifikasi VFI5 modifikasi dengan bobot yang ditentukan KLH. Secara umum, tingkat akurasi tahap klasifikasi data Pemantauan II lebih tinggi dari tahap klasifikasi data Pemantauan I. Tingkat akurasi rata-rata pada tahap klasifikasi data Pemantauan II disajikan pada Tabel 15. Grafik akurasi prediksi pada data Pemantauan II dapat dilihat pada Lampiran 16.

Tabel 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II

Metode Akurasi rata-rata

VFI5a 90.81 % VFI5b 91.82 % VFI5c 89.80 % VFI5d 89.80 %

Data rata-rata Pemantauan I dan Pemantauan II

Data yang digunakan merupakan rata-rata Pemantauan I dan Pemantauan II Program Adipura. Data tersebut dihitung nilai rata-rata Pemantauan I dan Pemantauan II untuk setiap kriteria penilaian seluruh kota peserta Program Adipura. Selanjutnya data ini dibagi menjadi data latih dan data uji. Jumlah data latih dan data uji sama dengan pada data sebelumnya.

Metode yang digunakan pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II sama dengan tahap klasifikasi data sebelumnya. Hasil tahap klasifikasi pada iterasi pertama disajikan pada Tabel 16, sedangkan daftar kota salah prediksi pada iterasi pertama dapat dilihat pada Lampiran 17.

Tabel 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II

(13)

9

yaitu 93.94 % untuk seluruh metode. Penggunaan masing-masing metode dan bobot pada tahap klasifikasi iterasi ini tidak mempengaruhi tingkat akurasi.

Tabel 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I

Hasil tahap klasifikasi iterasi ketiga disajikan pada Tabel 18. Kota salah prediksi pada iterasi ketiga dapat dilihat pada Lampiran 18.

Tabel 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I

Hasil klasifikasi seluruh seluruh iterasi pada data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi rata-rata tertinggi sebesar 91.82 %. Tingkat akurasi ini dicapai dengan menggunakan metode klasifikasi modifikasi dengan bobot masing-masing feature adalah satu. Tingkat akurasi rata-rata pada tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II disajikan pada Tabel 19. Grafik akurasi prediksi pada data rata-rata Pemantauan I dan Pemantauan II dapat dilihat pada Lampiran 19.

Tabel 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II

Metode Akurasi rata-rata

VFI5a 89.77 % VFI5b 91.82 % VFI5c 89.74 % VFI5d 90.78 %

Hasil tahap klasifikasi menggunakan data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II menunjukan tingkat akurasi tertinggi pada

metode klasifikasi VFI5 modifikasi dengan bobot masing-masing feature sama (VFI5b). Tingkat akurasi rata-rata tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II yaitu 91.82 %. Daftar tingkat akurasi untuk setiap data, iterasi dan metode klasifikasi dapat dilihat pada Lampiran 20. Grafik tingkat akurasi setiap metode dan data pemantauan disajikan pada Gambar 5.

Gambar 5 Grafik tingkat akurasi prediksi.

Penggunaan kombinasi metode klasifikasi dan bobot bertujuan untuk mengetahui tingkat akurasi tertinggi prediksi kota peraih anugerah Adipura, sehingga dapat diketahui metode yang paling tepat. Tingkat akurasi rata-rata tertinggi untuk seluruh data pemantauan Program Adipura diperoleh menggunakan metode klasifikasi modifikasi dengan menggunakan bobot masing-masing

feature sama (VFI5b) yaitu sebesar 89.78 %. Grafik tingkat akurasi rata-rata setiap metode disajikan pada Gambar 6.

(14)

10

KESIMPULAN DAN SARAN

Kesimpulan

Prediksi anugerah Adipura dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, selain itu hasil prediksi tersebut dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura.

Penelitian ini menunjukkan tingkat akurasi tertinggi dihasilkan pada data hasil Pemantauan II dengan menggunakan metode klasifikasi modifikasi dan bobot masing-masing feature sama dengan satu (VFI5b). Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.

Saran

Penelitian ini dapat dikembangkan lebih lanjut melalui peningkatan akurasi prediksi dengan melakukan eksplorasi terhadap bobot

feature.

DAFTAR PUSTAKA

Demiröz G dan Gűvenir HA. 1997.

Classification by Voting Feature Intervals. http://www.cs.ucf.edu/~ecl/ papers/demiros97classification.pdf. [November 2008].

Gűvenir HA, Demiröz G, Ilter N. 1998.

Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13(3), 147-165.

Hamilton H, Gurak E, Findlater L. 2003.

Confusion Matrix. http://www2.cs. uregina.ca/~dbd/cs831/notes/confusion_ matrix/confusion_matrix.html. [Februari 2009].

Han J, Kamber M. 2001. Data Mining Concept & Technique. USA:Academic Press.

[KLH] Kementerian Lingkungan Hidup. 2006. Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006. Jakarta.

[KLH] Kementerian Lingkungan Hidup. 2007. ADIPURA Menuju Kota Bersih dan Teduh. Jakarta.

[KLH] Kementerian Lingkungan Hidup. 2008. Laporan Tahun 2007 Deputi Bidang Pengendalian Pencemaran

Lingkungan Kementerian Lingkungan Hidup. Jakarta.

(15)

PREDIKSI KOTA PERAIH ANUGERAH ADIPURA

MENGGUNAKAN ALGORITME KLASIFIKASI VFI5

MUHAMAD HAIKAL

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(16)

10

KESIMPULAN DAN SARAN

Kesimpulan

Prediksi anugerah Adipura dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, selain itu hasil prediksi tersebut dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura.

Penelitian ini menunjukkan tingkat akurasi tertinggi dihasilkan pada data hasil Pemantauan II dengan menggunakan metode klasifikasi modifikasi dan bobot masing-masing feature sama dengan satu (VFI5b). Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.

Saran

Penelitian ini dapat dikembangkan lebih lanjut melalui peningkatan akurasi prediksi dengan melakukan eksplorasi terhadap bobot

feature.

DAFTAR PUSTAKA

Demiröz G dan Gűvenir HA. 1997.

Classification by Voting Feature Intervals. http://www.cs.ucf.edu/~ecl/ papers/demiros97classification.pdf. [November 2008].

Gűvenir HA, Demiröz G, Ilter N. 1998.

Learning Differential Diagnosis of Erythemato-Squamous Diseases using Voting Feature Intervals. Artificial Intelligence in Medicine, 13(3), 147-165.

Hamilton H, Gurak E, Findlater L. 2003.

Confusion Matrix. http://www2.cs. uregina.ca/~dbd/cs831/notes/confusion_ matrix/confusion_matrix.html. [Februari 2009].

Han J, Kamber M. 2001. Data Mining Concept & Technique. USA:Academic Press.

[KLH] Kementerian Lingkungan Hidup. 2006. Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006. Jakarta.

[KLH] Kementerian Lingkungan Hidup. 2007. ADIPURA Menuju Kota Bersih dan Teduh. Jakarta.

[KLH] Kementerian Lingkungan Hidup. 2008. Laporan Tahun 2007 Deputi Bidang Pengendalian Pencemaran

Lingkungan Kementerian Lingkungan Hidup. Jakarta.

(17)

PREDIKSI KOTA PERAIH ANUGERAH ADIPURA

MENGGUNAKAN ALGORITME KLASIFIKASI VFI5

MUHAMAD HAIKAL

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(18)

PREDIKSI KOTA PERAIH ANUGERAH ADIPURA

MENGGUNAKAN ALGORITME KLASIFIKASI VFI5

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

MUHAMAD HAIKAL

G64066018

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(19)

ABSTRAK

MUHAMAD HAIKAL. Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5. Dibimbing oleh Aziz Kustiyo, S.Si., M.Kom.

Program Adipura merupakan program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup (KLH). Program ini bertujuan untuk mewujudkan kota yang bersih dan teduh (KLH 2007). Penilaian Program Adipura terdiri atas penilaian Fisik dan penilaian Non Fisik. Penilaian Fisik terdiri atas Pemantauan I, Pemantauan II, dan Pemantauan Verifikasi. Penilaian Non Fisik berupa penilaian terhadap kuesioner yang diisi oleh kabupaten/kota. Mekanisme kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan mekanisme kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut. Periode pelaksanaan Program Adipura adalah satu tahun. Pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya dilaksanakan setelah seluruh data hasil penilaian Fisik dan penilaian Non Fisik tersedia. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit. Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal.

Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura menggunakan algoritme klasifikasi VFI5. Data yang digunakan merupakan data Fisik hasil Pemantauan I dan Pemantauan II kategori kota Sedang dan kota Kecil regional Jawa periode 2007-2008. Metode klasifikasi yang digunakan adalah klasifikasi VFI5 biasa dan klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature satu dan bobot yang telah ditentukan KLH. Klasifikasi VFI5 modifikasi merupakan klasifikasi VFI5 biasa dengan penambahan batas bawah dan batas atas interval dengan nilai minimum dan nilai maksimum skala nilai Program Adipura,

vote pada nilai minimum dan nilai maksimum tersebut sama dengan vote batas bawah dan batas atas skala nilai Program Adipura.

Hasil penelitian ini menunjukan tingkat akurasi tertinggi diperoleh menggunakan data Pemantauan II dan data rata-rata Pemantauan I dan II dengan metode klasifikasi VFI5 modifikasi dan bobot masing-masing feature satu. Tingkat akurasi yang dihasilkan adalah sebesar 91.82 %.

(20)

Judul : Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5 Nama : Muhamad Haikal

NIM : G64066018

Menyetujui:

Pembimbing

Aziz Kustiyo, S.Si., M.Kom.

NIP. 197007191998021001

Mengetahui:

Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. drh. Hasim, DEA.

NIP. 196103281986011002

(21)

RIWAYAT HIDUP

(22)

PRAKATA

Bismillahirrahmanirrahim

Puji dan syukur penulis panjatkan kepada Allah SWT atas rahmat dan karuniaNya. Shalawat dan salam penulis curahkan kepada nabi Muhammad SAW sehingga penulis dapat menyelesaikan skripsi tugas akhir dengan judul Prediksi Kota Peraih Anugerah Adipura Menggunakan Algoritme Klasifikasi VFI5.

Penulis mengucapkan terimakasih kepada seluruh pihak sehingga penelitian ini dapat diselesaikan, diantaranya :

 Kedua orangtua tercinta yang selalu memberikan doa dan motivasi kepada penulis.  Bapak Aziz Kustiyo, S.Si., M.Kom. selaku dosen pembimbing yang telah memberikan

arahan, masukan, dan semangat kepada penulis sehingga penelitian ini dapat diselesaikan.  Ibu Dra. Melda Mardalina, M.Sc. dan Bapak Dr. Ir. Agus Buono, M.Si., M.Kom. selaku

dosen penguji yang telah memberikan masukan kepada penulis dalam menyelesaikan penelitian ini.

 Adik-adikku tercinta, Haiva, Sumaya, Rania, dan Nadia yang selalu memberikan motivasi dan dukungan.

 Seluruh dosen pengajar dan staf Departemen Ilmu Komputer, FMIPA, IPB.

 Ibu Ir. Ratna Kartikasari, M.Sc. dan Bapak Drs. Tri Bangun L. Sony selaku pimpinan yang telah mendukung dalam proses pendidikan penulis.

 Octo Mulyanto, Rion Evrian Adwanosa, Sandi Wasmana, Vanny Zaenudin, Dhilla Hapsari, Sekar Tangi, Anggita Dhiny dan seluruh teman kerja yang telah memberikan motivasi dan dukungan.

 Bapak Trias Hermanu dan keluarga yang telah memberikan motivasi dan dukungan.  Seta Baehera, Abdul Rosyid, Tuti dan teman-teman angkatan I, II, dan III ILKOM

Ekstensi IPB yang tidak dapat disebutkan satu per satu.

 Seluruh pihak lain yang membantu penelitian ini yang tidak dapat disebutkan satu per satu. Akhirnya penulis berharap semoga penelitian ini dapat bermanfaat bagi semua pihak yang membutuhkan. Amin.

Bogor, Juli 2009

(23)

iv

DAFTAR ISI

Halaman

(24)

v

DAFTAR TABEL

Halaman

1 Kategori kota Program Adipura ... 2 2 Kriteria Penilaian Fisik Program Adipura ... 2 3 Skala nilai Program Adipura ... 2 4 Confusion matrix ... 3 5 3-FoldCross Validation data Program Adipura ... 5 6 Jumlah data latih dan data uji Pemantauan I ... 5 7 Confusion matrix pada iterasi pertama data Pemantauan I. ... 7 8 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan I ... 7 9 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan I... 7 10 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan I ... 7 11 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I... 7 12 Hasil tahap klasifikasi pada iterasi pertama data Pemantauan II ... 8 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II ... 8 14 Hasil tahap klasifikasi pada iterasi ketiga data Pemantauan II ... 8 15 Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan II ... 8 16 Hasil tahap klasifikasi pada iterasi pertama data rata-rata Pemantauan I dan Pemantauan II ... 8 17 Hasil tahap klasifikasi pada iterasi kedua data rata-rata Pemantauan I dan Pemantauan II ... 9 18 Hasil tahap klasifikasi pada iterasi ketiga data rata-rata Pemantauan I dan Pemantauan II ... 9 19 Tingkat akurasi rata-rata tahap klasifikasi data rata-rata Pemantauan I dan Pemantauan II ... 9

DAFTAR GAMBAR

Halaman

(25)

vi

DAFTAR LAMPIRAN

(26)

1

PENDAHULUAN

Latar Belakang

Upaya pengendalian pencemaran lingkungan dilakukan dengan berbagai kegiatan, salah satunya melalui Program Adipura oleh Kementerian Lingkungan Hidup (KLH). Program Adipura merupakan salah satu program prioritas dalam pengendalian pencemaran dari kegiatan domestik (KLH 2008).

Periode pemantauan Program Adipura adalah satu tahun dimulai dari bulan Juni tahun berjalan sampai dengan bulan Juni tahun berikutnya. Pemantauan Program Adipura dilaksanakan setidaknya dua kali dalam satu periode, yaitu :

1 Pemantauan I pada bulan Agustus sampai dengan bulan September.

2 Pemantauan II pada bulan Januari sampai dengan bulan Februari.

Pemantauan Verifikasi dilaksanakan jika diperlukan (KLH 2006).

Mekanisme penentuan kota pantau pada Pemantauan I dan Pemantauan II telah diatur dalam Peraturan Menteri Negara Lingkungan Hidup nomor 14 tahun 2006 yaitu seluruh kota peserta Program Adipura, sedangkan penentuan kota pantau pada Pemantauan Verifikasi tidak diatur dalam peraturan tersebut.

Pengumuman kota peraih anugerah Adipura dilaksanakan pada tanggal 5 juni, bertepatan dengan hari lingkungan nasional maupun internasional. Penentuan kota peraih anugerah Adipura dapat dilaksanakan setelah seluruh data hasil pemantauan didapatkan, yaitu setelah data hasil Penilaian Fisik dan Penilaian Non Fisik dihasilkan antara bulan Maret sampai dengan bulan Mei. Jadwal pelaksanaan Program Adipura dapat dilihat pada Lampiran 1.

Setelah seluruh data hasil penilaian Fisik dan Non Fisik Program Adipura tersedia, selanjutnya yang dilakukan adalah pemeringkatan kota, penentuan kota peraih anugerah Adipura, dan persiapan lainnya. Waktu yang tersedia untuk menyelesaikan seluruh kegiatan tersebut sebelum pengumuman peraih anugerah Adipura sangat sempit (dua minggu).

Karena keterbatasan waktu dalam proses persiapan dan penentuan kota peraih anugerah Adipura, sehingga memerlukan penelitian untuk memprediksi kota peraih anugerah Adipura lebih awal. Penerapan algoritme VFI5 sebagai algorime klasifikasi untuk memprediksi kota peraih anugerah Adipura

diharapkan dapat membantu permasalahan tersebut.

Tujuan

Penelitian ini bertujuan untuk memprediksi kota peraih anugerah Adipura pada Program Adipura berdasarkan data fisik.

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada: 1 Data periode yang digunakan adalah data kategori kota Sedang dan kota Kecil regional Jawa Program Adipura periode 2007-2008.

2 Data yang digunakan merupakan data hasil pemantauan Fisik Program Adipura, yaitu Pemantauan I dan Pemantauan II.

Manfaat

Penelitian ini diharapkan dapat memberikan prediksi dengan tingkat akurasi tinggi terhadap kota peraih anugerah Adipura. Hasil penelitian ini juga dapat dijadikan alat perhitungan cepat (quick count) bagi pihak KLH untuk memprediksi kota peraih anugerah Adipura menggunakan data Pemantauan I dan Pemantauan II saja.

Hasil prediksi pada penelitian ini dapat digunakan pihak KLH untuk membantu menetapkan mekanisme kota pantau pada Pemantauan Verifikasi, sehingga mekanisme penentuan kota pada Pemantauan Verifikasi dapat dibuat suatu ketetapan.

TINJAUAN PUSTAKA

Program Adipura

Program Adipura adalah program kerja berlingkup nasional yang dikelola oleh Kementerian Lingkungan Hidup. Program Adipura bertujuan untuk mendorong pemerintah kabupaten/kota dan masyarakat dalam mewujudkan kota yang bersih dan teduh melalui penerapan prinsip-prinsip tata kepemerintahan yang baik dibidang pengelolaan lingkungan hidup (KLH 2007).

Pelaksanaan Program Adipura saat ini merupakan pengembangan dari Program Adipura pada kurun waktu 1986-1997. Program ini dilanjutkan kembali pada tahun 2002 sampai dengan saat ini.

(27)

2

Tabel 1 Kategori kota Program Adipura

Kategori Jumlah Penduduk

Metropolitan Lebih dari 1.000.000 Besar 500.001 – 1.000.000 Sedang 100.001 – 500.000 Kecil 20.001 – 100.000

Penghargaan anugerah Adipura diberikan kepada walikota/bupati yang telah berhasil mengelola lingkungannya dengan baik. Kriteria penilaian Program Adipura terdiri atas dua penilaian, yaitu Penilaian Fisik dan Penilaian Non Fisik.

1 Penilaian Fisik

Penilaian Fisik merupakan pemantauan terhadap kondisi fisik kawasan perkotaan suatu kabupaten/kota. Pemantauan dilaksanakan paling sedikit dua kali dalam satu periode penilaian. Pemantauan verifikasi dilaksanakan jika diperlukan (KLH 2006).

Jumlah kriteria Penilaian Fisik Program Adipura adalah 16 kriteria. Masing-masing kriteria memiliki bobot yang telah ditentukan oleh KLH. Kriteria Penilaian Fisik Program Adipura disajikan pada Tabel 2.

Tabel 2 Kriteria Penilaian Fisik Program Adipura

No Kriteria Penilaian Bobot

1 Perumahan 7

7 Rumah Sakit/Puskesmas 6

8 Hutan kota 3

9 Taman kota 7

10 Terminal bus/angkot 8

11 Stasiun kereta 5

12 Pelabuhan penumpang 5 13 Perairan terbuka 8 14 Tempat pembuangan akhir 10 15 Pemanfaatan sampah 3

16 Pantai wisata 4

Penilaian Program Adipura menggunakan skala nilai yang telah ditentukan. Skala nilai yang digunakan pada Program Adipura disajikan pada Tabel 3.

2 Penilaian Non Fisik

Penilaian Non Fisik merupakan penilaian terhadap dokumen berupa kuisioner yang telah diisi oleh kota peserta Program Adipura.

Penilaian Non Fisik dilaksanakan satu kali dalam satu periode penilaian.

Tabel 3 Skala nilai Program Adipura

Skala Nilai

Klasifikasi merupakan proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep atau kelas-kelas data, dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek atau data yang label kelasnya tidak diketahui (Han & Kamber 2001).

Klasifikasi terdiri atas dua tahap, yaitu pelatihan dan prediksi (klasifikasi). Pada tahap pelatihan, dibentuk sebuah model domain permasalahan dari setiap instance

yang ada. Penentuan model tersebut berdasarkan analisis pada sekumpulan data pelatihan, yaitu data yang label kelasnya sudah diketahui. Pada tahap klasifikasi, dilakukan prediksi kelas dari instance baru dengan menggunakan model yang telah dibuat pada tahap pelatihan (Guvenir et al. 1998).

K-Fold Cross Validation

Sebelum digunakan sebuah sistem berbasis komputer harus dievaluasi dalam berbagai aspek. Di antara aspek-aspek tersebut, validasi kinerja bisa menjadi yang paling penting.

Cross validation dan bootstrapping

merupakan metode untuk memperkirakan

error generalisasi berdasarkan “resampling” (Weiss and Kulikowski, 1991; Efron and Tibshirani, 1993; Hjorth, 1994; Plutowski, Sakata and White, 1994; Shao and Tu, 1995 diacu dalam Sarle 2004)

K-Fold Cross Validation membagi himpunan contoh ke dalam k himpunan bagian secara acak. Pengulangan dilakukan sebanyak k kali dan pada setiap ulangan, satu subset untuk pengujian dan subset lainnya untuk pelatihan.

(28)

3

iterasi ke-i, subset Si diperlakukan sebagai data pengujian dan subset lainnya diperlakukan sebagai data pelatihan. Pada iterasi pertama S2,…,Sk menjadi data pelatihan dan S1 menjadi data pengujian, pada iterasi kedua S1,S3,…,Sk menjadi data pelatihan dan S2 menjadi data pengujian dan seterusnya.

VFI5 (Voting Feature Intervals 5)

Voting Feature Intervals 5 (VFI5) adalah salah satu algoritme yang digunakan dalam pengklasifikasian data. Algoritme tersebut dikembangkan oleh Demiröz dan Gűvenir (Gűvenir dan Demiröz 1997). Algoritme VFI5 merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval nilai-nilai feature

atau atribut. Semua instance pelatihan diproses bersamaan. Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan klasifikasi.

1 Pelatihan

Pada tahap Pelatihan dilakukan pencarian nilai end point suatu feature f pada kelas data c. End point yaitu nilai minimum dan nilai maksimum setiap kelas c pada feature f. Kemudian setiap nilai end point tersebut diurutkan menjadi interval untuk feature f. Terdapat dua jenis interval, yaitu point interval yang terdiri atas semua nilai end point yang diperoleh dan range interval yang terdiri atas nilai-nilai antara dua end point

yang berdekatan tidak termasuk end point

tersebut.

Tahap selanjutnya adalah menghitung jumlah instance pelatihan setiap kelas c dengan feature f yang nilainya jatuh pada interval i yang direpsentasikan sebagai

interval_class_count[f,i,c]. untuk setiap

instance pelatihan, dicari interval i dimana nilai feature f dari instance pelatihan e (ef) tersebut jatuh. Jika interval i merupakan point interval dan nilai ef sama dengan nilai pada interval i dibagi dengan jumlah instance pada kelas c (class_count[c]) untuk menghilangkan perbedaan distribusi antar kelas. Hasil normalisasi direpresentasikan dalam

interval_class_vote[f,i,c]. Nilai-nilai pada

interval_class_vote[f,i,c] dinormalisasi sehingga jumlah vote dari beberapa kelas pada setiap feature sama dengan 1. Pseudocode

tahap pelatihan dari algoritme VFI5 disajikan pada Gambar 1.

2 Klasifikasi

Tahap klasifikasi algoritme VFI5 dilakukan proses inisialisasi awal nilai vote

masing-masing kelas dengan nilai 0. Untuk setiap feature f, dicari nilai interval i dimana ef jatuh, dimana ef adalah nilai feature f dari instance tes e. jika ef tidak diketahui (hilang), maka feature tersebut tidak disertakan dalam

voting (member nilai vote 0 untuk masing-masing kelas) sehingga feature yang nilainya tidak diketahui diabaikan. Jika ef diketahui maka interval tersebut dapat ditemukan.

Feature tersebut akan memberikan nilai vote

untuk masing-masing kelas dengan prosedur (Guvenir 1998):

feature_vote[f,c] = interval_class_vote[f,i,c]. Setiap feature f mengumpulkan nilai vote

kemudian dijumlahkan untuk memperoleh total vote. Kelas c yang memiliki nilai vote

tertinggi diprediksi sebagai kelas dari instance

tes c. Pseudocode tahap klasifikasi dari algoritme VFI5 disajikan pada Gambar 2.

Confusion Matrix

Confusion matrix mengandung informasi tentang kelas data yang aktual direpresentasikan pada baris matiks dan kelas data hasil prediksi suatu algoritme klasifikasi. Kemampuan dari algoritme klasifikasi biasanya dievaluasi dari data yang ada pada matriks. Confusion matrix untuk data dengan dua kelas disajikan pada Tabel 4 (Hamilton et al. 2002). berhasil diprediksi dengan benar sebagai kelas 1.

 b adalah jumlah instance kelas 1 yang tidak berhasil diprediksi dengan benar karena diprediksi sebagai kelas 2.  c adalah jumlah instance kelas 2 yang

(29)

4

 d adalah jumlah instance kelas 2 yang berhasil diprediksi dengan benar sebagai kelas 2.

METODE PENELITIAN

Beberapa tahapan proses yang dilalui untuk mengetahui hasil yang diperoleh algoritme VFI5 dalam memprediksi kota peraih anugerah Adipura. Tahapan proses tersebut disajikan pada Gambar 3.

Tahapan proses yang utama adalah tahap pelatihan dan klasifikasi, pada tahap tersebut data akan dilatih untuk menghasilkan vote

masing-masing feature. Sedangkan pada tahap klasifikasi, dilakukan prediksi kota peraih anugerah Adipura.

Data

Data yang digunakan merupakan data Program Adipura. Data tersebut diperoleh dari Asisten Deputi Urusan Pengendalian Pencemaran Limbah Domestik dan Usaha Skala Kecil, Kementerian Lingkungan Hidup.

Data yang digunakan merupakan data hasil pemantauan Program Adipura periode 2007-2008. Data tersebut adalah data Pemantauan

I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II.

Data Program Adipura terdiri atas dua kelas yaitu kelas kota peraih anugerah Adipura (Adipura) dan bukan kota peraih anugerah Adipura (Bukan Adipura). Jumlah

instance pada data Pemantauan I dan Pemantauan II adalah 98, dan jumlah feature

sebanyak 16. Data kabupaten/kota kategori kota Sedang dan kota Kecil regional Jawa dapat dilihat pada Lampiran 2.

Feature yang digunakan merupakan kriteria Penilaian Fisik untuk seluruh kabupaten/kota peserta Program Adipura. Kategori kota yang digunakan pada Program Adipura yaitu kategori kota Sedang (36 kota) dan kota Kecil (62 kota).

Data latih dan data uji

Pada tahap ini dilakukan pembagian data antara data latih dan data uji dengan menggunakan 3-fold cross validation. Pembagian data tersebut disajikan pada Tabel 5. Jumlah data latih dan data uji untuk setiap iterasi disajikan pada Tabel 6.

Gambar 1 Pseudocode tahap pelatihan algoritme VFI5.

train (TrainingSet);

begin

for each feature f

if f is linear

for each class c

EndPoints[f]= EndPoints[f] U find_end_points(TrainingSet,f,c);

sort(EndPoints[f]);

for each end point p in EndPoints[f]

from a point interval from end point p

from a range interval between p and the next endpoint ≠ p else /* f is nominal */

from a point interval for each value of f

for each interval i on feature f

for each class c

interval_class_count[f,i,c]=0;

count_instances(f,TrainingSet);

for each interval i on feature dimension f

(30)

5

Gambar 2 Pseudocode tahap klasifikasi algoritme VFI5.

Pelatihan

Pelatihan VFI5 dilakukan pada tiga data, yaitu data Pemantauan I, data Pemantauan II dan data rata-rata Pemantauan I dan Pemantauan II. Data tersebut masing-masing dibagi menjadi 2/3 data training dan 1/3 data

testing. Kriteria penilaian Program Adipura menjadi feature dalam VFI5. Hasil evaluasi di akhir periode pelaksanaan Program Adipura yang menunjukan suatu kota berhasil meraih penghargaan anugerah Adipura atau tidak menjadi kelas dalam VFI5. Ilustrasi pada tahap pelatihan dapat dilihat pada Lampiran 3.

Tabel 5 3-Fold Cross Validation data Program Adipura

Gambar 3 Metode penelitian.

Klasifikasi

Pada tahap ini dilakukan klasifikasi data

testing berdasarkan pola yang telah diperoleh pada tahap pelatihan. ilustrasi pada tahap klasifikasi dapat dilihat pada Lampiran 4. Klasifikasi yang digunakan terdapat empat cara, yaitu :

for each feature f

for each class c

feature_vote[f,c] = 0;

/* vote of feature f for class c */

if ef value is known

i = find_interval(f,ef)

feature_vote[f,c] = interval_class_vote[f,ic]

for each class c

vote[c] = vote[c] + feature_vote[f,c]*weight[f];

return class c with highes vote[c]

(31)

6

1 Metode klasifikasi VFI5 dengan bobot masing-masing feature adalah satu (VFI5a).

2 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot masing-masing

feature adalah satu (VFI5b).

3 Metode klasifikasi VFI5 dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5c).

4 Metode klasifikasi VFI5 yang telah dimodifikasi dengan bobot yang telah ditentukan oleh KLH untuk masing-masing feature (VFI5d).

Metode VFI5 yang telah dimodifikasi (VFI5b dan VFI5d) merupakan algoritme VFI5 dengan batas interval bawah dan batas interval atas dalam bentuk point interval

diubah menjadi range interval dengan batas nilai minimum dan nilai maksimum skala nilai Program Adipura. Perbandingan interval antara algoritme klasifikasi VFI5 dengan algoritme klasifikasi VFI5 modifikasi disajikan pada Gambar 4. Kelas yang digunakan untuk memprediksi kota peraih

anugerah Adipura terdiri atas kelas Adipura dan kelas Bukan Adipura.

Akurasi

Pada tahap ini dilakukan pengukuran tingkat akurasi berdasarkan data hasil klasifikasi. Tingkat akurasi diperoleh dengan perhitungan :

= ∑

Lingkup Pengembangan

Penelitian ini diimplementasikan dengan menggunakan Microsoft Access 2003 untuk komputasi algoritme VFI5. Perangkat keras yang digunakan adalah komputer notebook

dengan spesifikasi:

1 Prosesor AMD Turion64 X2 2.2GHz, 2 RAM 4 GB, dan

3 Harddisk 250 GB.

Gambar 4 Perbandingan interval VFI5 dengan VFI5 modifikasi.

HASIL DAN PEMBAHASAN

Penelitian ini menggunakan data hasil Pemantauan I dan Pemantauan II Program Adipura kategori kota Kecil dan kota Sedang regional Jawa periode 2007-2008. Klasifikasi yang digunakan adalah algoritme klasifikasi VFI5 dan algoritme klasifikasi VFI5 modifikasi. Bobot yang digunakan adalah bobot masing-masing feature yang ditentukan KLH dan bobot masing-masing feature sama.

Data Pemantauan I

Data Pemantauan I Program Adipura berjumlah 98 instance. Data ini selanjutnya dibagi menjadi data latih dan data uji (klasifikasi) sesuai dengan 3-fold cross validation. Confusion matrix pada iterasi pertama data Pemantauan I disajikan pada Tabel 7.

Gambar

Tabel 2  Kriteria Penilaian Fisik Program Adipura
Tabel 11  Tingkat akurasi rata-rata tahap klasifikasi data Pemantauan I
Tabel 13 Hasil tahap klasifikasi pada iterasi kedua data Pemantauan II
Tabel 17 Hasil tahap klasifikasi pada iterasi
+7

Referensi

Dokumen terkait

Tambahan Lembaran Negara Republik Indonesia Nomor 5105) sebagaimana telah diubah dengan Peraturan Pemerintah Nomor 66 Tahun 2010 tentang Perubahan Atas Peraturan Pemerintah Nomor

PENGEMBANGAN PASAR BARU DI MASA YANG AKAN DATANG Seperti yang kita ketahui melalui sejarah perkembangan Pasar Baru sebagai shopping street bahwa sebelum Pasar Baru

yaitu (1) siswa salah dalam mendefinisikan konsep dari prisma dan limas, (2) siswa salah dalam menerapkan rumus luas permukaan serta volume pada prisma dan limas

Menurut Abraham Maslow yang terpenting dalam melihat manusia adalah potensi yang dimilikinya. Pendekatan ini melihat bagaimana manusia membangun dirinya untuk

Terkait pandemi Covid 19, kampus Institut Seni Indonesia Surakarta pada tahun 2020 memfokuskan pelaksanaan KKN Mandiri berbasis Daring dan Luring untuk memudahkan

Penurunan kandungan lignin pada A3Y1 (pemberian dosis 2.000 ppm dengan lama 10 hari) disebabkan karena semakin tinggi pemberian mineral Ca hingga dosis 2000 ppm

a. Kelebihan metode scramble antara lain :.. Setiap anggota kelompok bertanggung jawab atas segala sesuatu yang dikerjakan dalam kelompoknya, setiap anggota kelompok

Penelitian tentang pengaruh defisit anggaran belanja pemerintah terhadap pertumbuhan ekonomi telah banyak dilakukan di berbagai negara. Hasil penelitian menunjukkan kesimpulan