KLASIFIKASI UJI EMISI KENDARAAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION
Ardyna Wahyu Hapsari¹, Arie Ardiyanti Suryani², Indwiarti Dra.³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Polusi kian akrab dengan lingkungan sekitar, bertambahnya kendaraan bermotor memberikan kontribusi besar terhadap polusi yang terjadi. Bagi mereka yang naik kendaraan pribadi khususnya mobil yang tertutup tentu tidak merasakan polusi tersebut. Namun, bagi para pengguna sepeda motor dan angkutan umum pasti sangat terganggu. Jika hari sudah siang, udara panas menyengat kulit, sinar matahari dan asap kendaraan membuat mata perih dan pernafasan kurang nyaman.
Menyadari kondisi kualitas udara yang cukup memprihatinkan berada di kawasan dengan tingkat kuantitas kendaraan cukup tinggi maka perlu adanya perhatian yang khusus terhadap emisi kendaraan bermotor. Hal ini telah dilakukan oleh Dinas Perhubungan dengan menghasilkan data begitu banyak. Data hasil uji emisi kendaraan terdiri data numeric dan nominal. Data numeric meliputi hasil uji emisi berupa kandungan CO, HC+NOx, partikel, konsumsi bahan bakar, umur kendaraan, dan kapasitas berat kendaraan. Sedangkan data nominal meliputi merk, tipe, dan jenis bahan bakar kendaraan.
Begitu banyaknya data yang dihasilkan diperlukan proses yang dapat dengan cepat menangani data tersebut salah satu algoritma yang mampu menangani hal tersebut adalah algoritma expectation maximization. Selain itu, algoritma expectation maximization mampu menangani dengan lebih baik dari data yang memiliki banyak sampel dengan komponen atribut yang sedikit seperti data uji emisi kendaraan. Terlebih lagi expectation maximization mampu untuk
menangani data nominal dan numeric yang terdapat pada data uji emisi kendaraan sekaligus secara mudah
Kata Kunci : emisi, kendaraan, algoritma expectation maximization
Abstract
Pollution becoming familiar with the environment, the increase in motor vehicles contributes to the pollution occurred. For those who ride personal vehicles, especially cars that are closed would not feel the pollution. However, for users of motorcycles and public transportation must be disrupted. If the morning the air skin heat, sunlight and smoke, vehicles make less eye irritation and breathing comfortably.
Recognizing that air quality in the area of concern is the quantity of vehicles with high enough levels it needs special attention to vehicle emissions. This has been done by the Department of Transportation to produce so much data. Vehicle emission test result data comprises numerical and nominal data. Numeric data include emission test results form the content of CO, HC + NOx, particles, fuel consumption, vehicle age and vehicle weight capacity. While the nominal data include brand, type, and type of fuel the vehicle.
Once the required amount of data produced by a process that can quickly handle the data is one of the algorithm is capable of handling this is the expectation maximization algorithm. In
addition, the expectation maximization algorithm is able to handle it better than the data that has many attributes that samples with small components such as vehicle emission test data. Moreover expectation maximization able to handle nominal and numeric data contained in the vehicle emissions test data easily.
Keywords : emissions, vehicles, expectation maximization algorithm
Powered by TCPDF (www.tcpdf.org)
1
1.
PENDAHULUAN
1.1 Latar belakang masalah
Pencemaran udara dapat didefinisikan , “sebagai hadirnya substansi di udara dalam konsentrasi yang cukup untuk menyebabkan gangguan pada manusia, hewan, tanaman maupun materiall” [3]. Menurut [6], diperkirakan pencemaran udara dan kebisingan akibat kegiatan industri dan kendaraan bermotor akan meningkat 2 kali pada tahun 2000 dari kondisi tahun 1990 dan 10 kali pada tahun 2020. Hasil studi yang dilakukan oleh Ditjen PPM & PL, tahun 1999 pada pusat keramaian di 3 kota besar di Indonesia seperti Jakarta, Yogyakarta dan Semarang menunjukkan gambaran sebagai berikut : kadar debu (SPM) 280 ug/m3, kadar SO2 sebesar 0,76 ppm, dan kadar NOx sebesar 0,50 ppm, dimana angka tersebut telah melebihi nilai ambang batas/standar kualitas udara.
Menyadari kondisi kualitas udara yang cukup memprihatinkan di kawasan dengan tingkat kuantitas kendaraan cukup tinggi, maka perlu adanya perhatian yang khusus terhadap uji emisi kendaraan bermotor. Hal ini telah dilakukan oleh Dinas Perhubungan dan menghasilkan data begitu banyak. Data hasil uji emisi kendaraan terdiri data numeric dan nominal. Data numeric meliputi hasil uji emisi berupa kandungan CO, HC+NOx, partikel, konsumsi bahan bakar, umur kendaraan, dan kapasitas berat kendaraan. Sedangkan data nominal meliputi merk, tipe, dan jenis bahan bakar kendaraan.
Begitu banyaknya data yang dihasilkan diperlukan proses yang dapat dengan cepat menangani data tersebut salah satu algoritma yang mampu menangani hal tersebut adalah algoritma expectation maximization. Selain itu, algoritma expectation maximization mampu menangani dengan lebih baik dari data yang memiliki banyak sampel dengan komponen atribut yang sedikit seperti data uji emisi kendaraan.
1.2 Perumusan masalah
Dalam proses clusterisasi uji emisi gas kendaraan bermotor, terdapat beberapa permasalahan yang akan dibahas, meliputi
1. Bagaimana proses prepocessing yang dilakukan agar data siap untuk diolah? 2. Bagaimana kombinasi atribut yang menentukan hasil uji emisi kendaraan? 1.3 Batasan Masalah
Batasan-batasan masalah pada tugas akhir meliputi:
1. Data dan informasi tentang uji emisi kendaraan di peroleh dari data Dinas Perhubungan.
2. Data uji emisi kendaraan bermotor hanya akan melibatkan kendaraan
bermotor roda empat atau lebih.
3. Data akan dikelompokkan hanya berdasarkan komponen yang ada pada hasil
uji emisi yang didapat dari Dinas perhubungan.
2 Data dengan nilai atribut yang tidak lengkap tidak diikutkan dalam proses klasifikasi.
1.4 Tujuan
Tujuan yang ingin dicapai dari tugas akhir ini adalah:
1. Mempersiapkan data uji emisi kendaraan melalui preprocessing sebelum dilakukan klasifikasi.
2. Mengelompokkan data menjadi beberapa kategori dengan memperhitungkan hasil uji emisi CO, HC + Nox, dan partikel yang sesuai dengan Baku Mutu Emisi.
3. Menguji kualitas klasifikasi berdasar standar Baku Mutu Emisi Kendaraan yang telah ditetapkan dan data hasil klasifikasi dengan precision dan recall. 1.5 Metodologi penyelesaian masalah
Metodologi yang akan digunakan untuk menyelesaikan tugas akhir ini adalah: 1. Tahap Pengumpulan Data dan Studi Literatur: metodologi dimulai dengan
pengumpulan data dari Dinas Perhubungan setempat selain itu juga dilakukan pengumpulan referensi yang dapat membantu dalam proses penyelesain tugas akhir. Referensi meliputi buku, jurnal, paper, ataupun media informasi lainnya yang memiliki kaitan dengan klasifikasi menggunakan model gaussian dan algoritma klasifikasi expectation maximization.
2. Tahap Persiapan: sebelum masuk kedalam proses klasifikasi maka data mengalami tahap preprocessing. Dalam hal ini data uji emisi kendaraan akan
3 disaring, data dengan nilai atribut tidak lengkap akan dibuang sedang yang lengkap akan masuk kedalam data sample.
3. Tahap Klasifikasi: memperkirakan kombinasi atribut yang digunakan dalam algoritma klasifikasi sehingga mampu memberikan hasil output yang bagus. 4. Tahap Analisis: hasil dari klasifikasi akan dianalisis apakah klasifikasi yang
dilakukan telah sesuai dengan harapan yang diinginkan, hasil klasifikasi dapat diuji dengan standar Baku Mutu Emisi dan precision recall. Bila belum sesuai atau hasil klasifikasi belum memuaskan maka dapat kembali pada proses klasifikasi.
5. Tahap Pembuatan Laporan: Pada tahap ini, akan dilakukan penyusunan laporan akhir dari tugas akhir ini dan pengumpulan dokumentasi yang diperlukan, format laporan akan mengikuti kaidah penulisan yang benar dan yang sesuai dengan ketentuan-ketentuan yang telah ditetapkan oleh institusi 1.6 Jadwal kegiatan
Powered by TCPDF (www.tcpdf.org)
30
5.
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Dalam setiap klasifikasi dengan melibatkan komponen uji tunggal, usia mampu memberikan nilai akurasi yang lebih tinggi dibandingkan dengan isis silinder (cc) dan JBI. Namun saat komponen uji dikombinasikan, kombinasi yang melibatkan komponen uji usia memiliki nilai akurasi yang lebih baik bila dibandingkan dengan kombinasi komponen uji yang tidak melibatkan usia dalam proses klasifikasi.
5.2. Saran
Kondisi berhenti proses klasifikasi terjadi apabila selisih nilai kualitas cluster sudah tidak menunjukkan perubahan yang signifikan. Hal ini membuat hasil cluster terkadang hanya mampu mencapai solusi local. Oleh karena itu untuk menghindarinya, setiap iterasi proses cluster juga diikuti iterasi perhitungan akurasi agar dapat mencapai solusi global.
Powered by TCPDF (www.tcpdf.org)
31
DAFTAR PUSTAKA
[1] Bappenas., Sumber-Sumber Pencemaran Udara (Sources) available at:
http://udarakota.bappenas.go.id/view.php?page=sumber diakses pada tanggal 12 Oktober 2009 pukul 03.39
[2] BPLHD Jawa Barat., Pencemaran Udara dari Sektor Transportasi available at:
http://www.bplhdjabar.go.id/index.php/bidang-pengendalian/subid-pemantauan-pencemaran/94-pencemaran-udara-dari-sektor-transportasi diakses pada tanggal 12 Oktober 2009 pukul 03.30
[3] C.Fleming, Michael and Joseph G.Nellis.1994.Principles of Applied Statistic. London: Routledge
[4] Dellaert, Frank., The Expectation Maximization Algorithm, College of
Computing, Georgia Institute of Technology.
[5] Departemen Kesehatan., Parameter Pencemaran Udara Dan Dampaknya
Terhadap Kesehatan available at: http://www.depkes.go.id/downloads/Udara.pdf diakses pada tanggal 12 Oktober 2009 pukul 05.02
[6] Dinas Perhubungan., Mengelola Masalah Transportasi Dan Dampaknya Bagi
Lingkungan available at:
http://dishub- diy.net/index.php?option=com_content&view=article&id=164:mengelola-
masalah-transportasi-dan-dampaknya-bagi-lingkungan-&catid=37:berita&Itemid=54 diakses pada tanggal 12 Oktober 2009 pukul 04.35
[7] E Walpole, Ronald and Raymond H Myers.1995.Ilmu Peluang untuk Insinyur dan Ilmuwan Edisi ke-4 terjemahan RK Sembiring. Bandung: Penerbit ITB [8] H.Witten, Ian and Iebe Frank. 2005. Data Mining Practical Machine Learning
Tools and Techniques.San Fransisco:Morgan Kaufman Publisher.
[9] Hamerly, Greg and Charles Elkan., Alternatives to the k-means algorithm that find better klasifikasis, Departement of Computer Science and Engineering, University of California.
[10] Han, Jiawei and Micheline Kamber.2006. Data Mining Concept and
Techniques.San Fransisco: Morgan Kaufmann Publisher. [11]
http://www.intisari-online.com/majalah.asp?tahun=2006&edisi=513&file=warna0701 diakses pada tanggal 25 Mei 2010 pukul 08.53
[12] Mustapha, Norwati and et al. Expectation Maximization Klasifikasi Algorithm for User Modeling in Web Usage Minning Systems. Faculty of Computer Science and Information Technology, Universitti Putra Malaysia.
[13] Prescher, Detlef., A Tutorial on The Expectation-Maximization Algorithm Including Maximum-Likelihood Estimation and EM Training of Probabilistic Context Free Grammer, Institute for Logic, Language, and Computation, University of Amsterdam.
[14] Rogers, Jim., Data Mining Using the EM Klasifikasi Algorithm on Places Rated Almanac Data, Departements of Statistic, George Mason University.
[15] Shental, Noam. and friends., Computing Gaussian Mixture Model with EM using Equivalence Constraints, School of Computer Science and Engineering and the Center for Neural Computation, The Hebrew University of Jerusalem. [16] Tan, Pang-Ning, Steinbach, Michael and Kumar, Vipin. 2006. Introduction to
Data Mining. Minnesota : Addison-Wesley, 2006.
32
[17] Witoelar, Ir.Rachmat. 2006. Peraturan Menteri Negara Lingkungan Hidup
Nomor 05 Tahun 2006 Tentang Ambang Batas Emisi Gas Buang Kendaraan Motor Lama.
[18] Wu, X. and et al., Top 10 algorithms in data mining, presents the top 10 data mining algorithms identified by the IEEE International Conference on Data Mining (ICDM) in December 2006, Springer Verlag London .
Powered by TCPDF (www.tcpdf.org)