APLIKASI SURVEY POLITIK UNIVERSITAS BRAWIJAYA MALANG (ASUPOL) :
STUDI KASUS PEMILIHAN BEM PTIIK 2012 (PEMILWA 2012)
Afiqie Fadhihansah
1*, Dio Dharmawan
1**, Fridha Agustina
1**, Irwan Nugrahanto
1*,
Maharani Putri S N
1**, Tri Halomoan S
1*1 Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang 65142, Indonesia
E-Mail: * {afiqie.fadhihansah, irwan.nugrahanto, trihalomoans} @yahoo.com, ** {vaiofreak16, fridha92, maharanipsn} @gmail.com.
Abstrak
Pemilihan BEM 2012 akan dilaksanakan untuk pertama kalinya di PTIIK. Mungkin saat ini terlalu dini untuk mengetahui siapa yang akan menjadi pemenang Pemilihan BEM 2012, namun tidak ada salahnya untuk mengetahui lebih cepat bagaimana pemilihan ini akan berjalan nantinya. Karena ini adalah pertama kalinya PTIIK melaksanakan Pemilihan BEM 2012 maka respon, tolok ukur serta pola dalam Pemilihan BEM 2012 masih belum diketahui. Respon, tolok ukur serta pola dalam Pemilihan BEM 2012 dapat diketahui, salah satunya dengan metode algoritma Naïve Bayes. Data yang diperoleh akan diolah dengan algoritma Naïve Bayes yang nantinya akan menghasilkan pola-‐pola yang akan dijadikan tolak ukur dalam memprediksi pilihan dari seorang mahasiswa berdasarkan atribut yang dimilikinya. Hasil akhir yang diperoleh dari aplikasi ini adalah Calon 1 mendapat 59 suara (25%), Calon 2 mendapat 129 suara (54,66%), Golput sebesar 49 suara (20,34%). Total pemilih sebesar 236 mahasiswa sehingga diperoleh pemenang yaitu Calon 2. Kata kunci: (6) Algoritma naïve bayes, BEM, pola, atribut
Abstract
The 2012 BEM Election will be held for the first time in PTIIK. It too soon to predict the 2012 BEM Presidential winner, but it is not too early to know the general election will look like. Since this is the first time the BEM Election 2012 PTIIK will be held, and the benchmark BEM’s patterns election is still unknown. Response, as well as patterns in the benchmark BEM Elections 2012 are known, one with a Naive Bayes algorithm method. The data obtained will be processed with a Naive Bayes algorithm will produce patterns to be used as benchmarks in predicting the choice of a student
based on its attributes. The final results obtained from this application is 25% Candidate 1, Candidate 2 for 54.66%, 20.34% Golput amount. Total turnout of 236 students that earned the
winner is Candidate 2.
Keywords: (6) naïve bayes algorithm, BEM, patterns, attributes.
1. PENDAHULUAN
Setiap orang memiliki pilihan tersendiri dalam menentukan seorang pemimpin, baik itu dari tingkat terendah seperti pemimpin lingkungan tempat tinggal hingga tingkat tertinggi seperti pemimpin suatu Negara.
Banyak faktor yang menentukan mengapa seseorang memutuskan untuk mengambil keputusan untuk memilih kandidat terbaik yang ia rasa layak untuk menjadi seorang pemimpin. Faktor-‐faktor ini bisa dipelajari dan diolah melalui sistem pengenalan pola.
2. METODE PENELITIAN
Pada aplikasi ini metode penelitian yang digunakan adalah Naïve Bayes Classifier yang merupakan bagian dari Teorema Bayes untuk menentukan ke kelas manakah data uji akan masuk.
Teorema Bayes. Teorema Bayes adalah suatu teorema mengenai peluang yang pertama kali diperkenalkan oleh Reverend Thomas Bayes [1]. Naïve Bayes Classifier
merupakan salah satu metode yang dapat
digunakan untuk melakukan
pengklasifikasian terhadap suatu data, dimana naïve bayes classifier merupakan bagian dari Teorema Bayes. Dengan menggunakan metode naïve bayes classifier, proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa yang cocok bagi sampel yang akan dianalisis.
Teorema Bayes memiliki bentuk umum seperti pada persamaan 1 berikut :
P(H|X) = 𝑷 𝑿 𝑯 𝑷(𝑯)𝑷(𝑿) ……. [4] Yang mana[3] :
X = data dengan class yang belum diketahui
H = hipotesis data X merupakan suatu class spesifik
P(H|X) = probabilitas hipotesis H berdasakan kondisi X (posteriori probability)
P(H) = probabilitas hipotesis H (prior probability)
P(X|H) = probabilitas X berdasarkan kondisi pada hipotesis H
P(X) = probabilitas dari X
Rumus di atas menjelaskan bahwa peluang masuknya sampel dengan karakteristik tertentu dalam kelas H (posterior) adalah munculnya kelas H (sebelum masuknya sampel ke dalam karakteristik tertentu dalam kelas H, atau biasa disebut sebagai prior) dikali dengan peluang kemunculan karakteristik-‐karakteristik sampel pada kelas H (disebut juga dengan likelihood), dibagi dengan peluang kemunculan karakteristik-‐karakteristik sampel secara global (disebut juga dengan evidence). Oleh karena itu, rumus diatas bisa juga dituliskan dengan sederhana, yakni seperti persamaan 2 berikut :
…. (2)(5) Keterangan :
Nilai evidence selalu tetap untuk setiap kelas pada suatu sampel. Nilai dari posterior tersebut yang nantinya akan dibandingkan dengan nilai-‐nilai posterior kelas lainnya untuk menentukan ke kelas apa suatu sampel akan diklasifikasikan. Prior digunakan untuk menghitung peluang awal dari θ untuk pengamatan data. Untuk klasifikasi dengan data kontinyu, maka digunakan rumus seperti persamaan 3 berikut :
… (3) Di mana:
·∙ P menyatakan peluang ·∙ Xi menyatakan atribut ke-‐i. ·∙ xi menyatakan nilai atribut ke-‐i. ·∙ Y menyatakan kelas yang dicari. ·∙ yi menyatakan sub kelas Y yang dicari. ·∙ µ menyatakan rata-‐rata dari seluruh atribut.
·∙ σ menyatakan varian dari seluruh atribut. Naïve Bayes Classifier. Klasifikasi adalah proses untuk menemukan model atau
fungsi yang menjelaskan atau
membedakan konsep atau kelas data,
dengan tujuan untuk dapat
memperkirakan kelas dari suatu obyek [2]. Oleh karena itu, kelas yang ada tentulah lebih dari satu. Penentuan kelas dari suatu dokumen dilakukan dengan cara membandingkan nilai probabilitas suatu sampel berada di kelas yang satu dengan nilai probabilitas suatu sampel berada di kelas yang lain.
Gambar 1. Ilustrasi pengklasifikasian data
Penentuan kelas yang cocok bagi suatu sampel dilakukan dengan cara membandingkan nilai Posterior untuk masing-‐masing kelas dan mengambil kelas dengan nilai Posterior yang tinggi.
Dari data training yang sudah terkumpul, kami akan memperhitungkan menggunakan naïve bayes. Kemudian aplikasi asupol akan memberikan hasil klasifikasi yang sesuai dengan kriteria data yang dimasukkan.
Terdapat 8 atribut yang digunakan, yakni : 1. Jenis Kelamin 2. Agama 3. Usia 4. SMA Asal 5. Kota Asal 6. Propinsi 7. Jurusan 8. Angkatan
Sedangkan kelas yang digunakan ada 3 kategori, yakni :
1. Calon 1 2. Calon 2
3. Tidak Memilih (Golput)
Data baru akan diolah dengan menggunakan 7 atribut dan nantinya akan di masukkan ke salah satu kelas dari 3 kelas yang ada sesuai dengan posteriornya.
Proses kerja pada sistem. Pertama-‐tama program akan mencari nilai kemungkinan tiap fitur dari tiap kelas. P(x | kelasN) dibaca jika x maka kelasN. ‘x’ merupakan jumlah data fitur yang termasuk kedalam kelasN, data fitur menyamakan data fitur pada data baru/input. Selanjutnya x akan dibagi dengan total keseluruhan jumlah data yang termasuk kedalam kelasN. selain itu dihitung juga nilai dari jumlah data tiap kelas dibagi dengan total jumlah data keseluruhan kelas. Dari perhitungan tersebut akan didapat nilai kemungkinan dari tiap fitur.
Langkah berikutnya program akan menghitung data kontinyu dari data baru/input dengan berpatokan pada data uji/training. Pada program ini digunakan fitur Usia sebagai perhitungan data kontinyu. Perhitungan data kontinyu ini menggunakan rumus gaussian seperti yang telah dijelaskan pada pendahuluan, hasil dari perhitungan ini akan didapatkan nilai dari data kontinyu.
Terakhir akan dilakukan perhitungan nilai dengan mengkalikan seluruh data pada tahap awal perhitungan dan juga data kontinyu sesuai dengan kelasnya, sehingga didapat nilai akhir dari tiap kelas. nilai dari tiap kelas ini kemudian akan dibandingkan dan diambil nilai maksimal/tertinggi. nilai maksimal ini yang
akan dijadikan sebagai patokan untuk mengklasifikasikan data baru termasuk kedalam kelas ke berapa.
3. HASIL DAN ANALISA
Hasil dari program ini, data
baru/input akan dimasukkan/
diklasifikasikan ke dalam kelas yang dianggap paling mendekati menurut dan berdasarkan perhitungan dari data uji/training. dari uji coba hasil dengan menginputkan data baru yang bernilai sama dengan salah satu data yang ada pada data uji/training, 3 dari 10 kali
percobaan dengan data random
didapatkan hasil yang berbeda pada pengklasifikasian. Hal ini bukan dikarenakan kesalahan pada program melainkan program mencari kedekatan paling maksimal dari seluruh hasil pada data uji/training yang ada.
Dari analisa 2 fitur yaitu propinsi dan angkatan dengan data “Jawa Timur” dan “2010” pada data uji/training lebih banyak masuk kedalam kelas 2 sehingga jika terdapat data baru/input dengan propinsi Jawa Timur dan angkatan 2010 akan lebih sering diklasifikasikan kedalam kelas 2 walaupun data baru/input yang di inputkan tersebut sama persis dengan salah satu data yang ada pada data uji/training, yang mana pada data training
data tersebut masuk kedalam kelas 1 atau 3.
Begitu pula pada propinsi dan angkatan dengan data “DKI Jakarta” dan “2010” pada data uji/training lebih banyak masuk kedalam kelas 1 sehingga jika terdapat data baru/input dengan propinsi DKI Jakarta dan angkatan 2010 akan lebih sering diklasifikasiakan kedalam kelas 1.
Penyebab lain dari masalah diatas kurang ter-‐covernya / kurang meratanya data tiap fitur yang ada pada data uji/training. Sehingga jika data baru/input dimasukkan dan salah satu fitur yang dimasukkan tidak ada dalam data uji/training, fitur tersebut menjadi kurang berpengaruh pada pengklasifikasian data, sehingga program kurang mendapatkan hasil maksimal.
Analisa lain diluar sistem, sistem merupakan program matematis yang menilai data dari pandangan subjektif dari data yang ada, sedangkan terkait pemilihan data uji/training yang ada terkandung aspek lain seperti emosi, perasaan, dan pikiran serta hal-‐hal lain yang lebih bersifat objektif, individu, dan personal sehingga sistem tidak dapat menyamai aspek-‐aspek tersebut.
Daftar pemilih yang sudah masuk :
Gambar 2. Data training pada asupol.tk Berikut hasil dari data training yang telah dikumpulkan :
Gambar 3. Statistik data training
Data uji yang masuk akan dimasukkan ke dalam database data uji.
Gambar 4.Data uji pada database
asupol.tk
Apabila dilakukan pengklasifikasian terhadap data tertentu, maka akan dihasilkan :
Gambar 5.Input data uji
Gambar 6.Hasil pengklasifikasian data uji Dari hasil uji coba, maka didapatkan : • Untuk pemilih asal “Kab. Sumenep”
pada semua angkatan, lebih diklasifikasikan ke dalam kelas 2. • Untuk pemilih asal “DKI Jakarta”
dan pada semua angkatan, dikalsifikasikan ke dalam kelas 1.
4. KESIMPULAN
Aplikasi yang digunakan untuk menghitung suara secara cepat. Dengan adanya aplikasi ini, 1 orang tidak bisa memberikan suaranya lebih dari 1 kali. Kita dapat melakukan klasifikasi data menggunakan Metode Naïve bayes pada Quick Count. Dengan metode Naïve Bayes, dapat diketahui seorang calon pemilih masuk dalam kategori kelas calon 1, 2, atau 3. Dari calon pemilih kita dapat mengetahui, kedekatan antara data pemilih dan calon, mempengaruhi siapa yang dipilih. Dari sini kita dapat mengetahui
persentase akurasi. Dari survey yang telah kami lakukan diketahui hasilnya adalah Calon 1 sebesar 59 suara (25%), Calon 2 sebesar 129 suara (54,66%), Golput sebesar 48 suara (20,34%), dan total pemilih sebesar 236 orang. Sedangkan dalam pemilwa yang telah diadakan PTIIK pada tanggal 20 Desember 2012, diketahui hasilnya adalah Calon 1 sebesar 94 suara (23,32%), Calon 2 sebesar 285 suara (70,71%), Golput sebesar 3 suara (0,7%), tidak sah sebesar 21 suara (5,21%) dan total pemilih sebesar 403 orang. Sehingga diperoleh hasil akurasi aplikasi asupol sebesar 83,95%.
5. REFERENSI
1) James Joyce, “Bayes Theorem”,
Stanford Encyclopedia of
Philosophy, June 2003, diakses
tanggal 19 Desember 2012 11.48 pm
<http://plato.stanford.edu/entries/ bayes-‐theorem/ >
2) Kevin P Murphy, “Naïve Bayes Classifiers”, October 2006, diakses tanggal 20 Desember 2012. <http://www.cs.ubc.ca/~murphyk/ Teaching/CS340Fall06/reading/NB. pdf>
3) Siti Winiarti, “Pemanfaatan Teorema Bayes Dalam Penentuan Penyakit THT”, Jurnal Informatika, Vol. 2, No.2, Juli 2008.
4) Ammar Shadiq, “Keoptimalan Naïve Bayes Dalam Klasifikasi”, Program Ilmu Komputer FPMIPA Universitas Pendidikan Indonesia.
5) Samuel Natalius, “Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen”, ITB, Bandung, 2010.