• Tidak ada hasil yang ditemukan

PREDIKSI HASIL PEMILU LEGISLATIF KABUPATEN LOMBOK TIMUR MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS PSO.

N/A
N/A
Protected

Academic year: 2021

Membagikan "PREDIKSI HASIL PEMILU LEGISLATIF KABUPATEN LOMBOK TIMUR MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS PSO."

Copied!
19
0
0

Teks penuh

(1)

1

PREDIKSI HASIL PEMILU LEGISLATIF KABUPATEN LOMBOK TIMUR MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS PSO

‘Alimuddin1

, Muhammad Sadali2, Muhammad Wasil3 1,2,3

Universitas Hamzanwadi alimuddin@gmail.com

Abstrak

Pemilihan Umum merupakan sarana pelaksanaan kedaulatan rakyat yang diselenggarakan secara langsung, umum, bebas, rahasia, jujur dan adil berdasarkan Pancasila dan Undang-Undang Dasar Negara Republik Indonesia Tahun 1945. Pemilu diselenggarakan adalah untuk memilih pimpinan baik presiden dan wakil presiden, anggota DPR, DPD, dan DPRD. Banyak penelitian yang menggunakan metode naïve bayes maupun classification tree dalam memprediksi hasil pemilu tetapi nilai akurasi yang dihasilkan masih kurang akurat.

Dalam penelitian ini digunakan model algoritma naïve bayes berbasis Particle Swarm Optimization untuk mendapatkan rule dalam memprediksi hasil pemilihan legislatif dan memberikan nilai akurasi yang lebih baik. Pengujian naïve bayes dalam prediksi hasil pemilu legislatif Kabupaten Lombok Timur diperoleh akurasi 85,14% dan nilai AUC 0,978. Setelah pengujian naïve bayes berbasis PSO sebagai fitur seleksi diperoleh nilai akurasi 96,62% dan nilai AUC 0,971. Setelah penggunaan PSO sebagai fitur seleksi dapat meningkatkan akurasi prediksi hasil pemilu legislatif Kabupaten Lombok Timur dengan tingkat diagnosa Excellent Classification, dan pengujian ROC Curve mendapatkan hasil lebih baik untuk algoritma tersebut.

Kata Kunci: Algorithma Naïve Bayes, PSO, Prediksi hasil pemilu legislative Kabupaten Lombok Timur

PENDAHULUAN

Pemilihan Umum merupakan sarana dan wadah pelaksanaan kedaulatan rakyat yang diselenggarakan secara langsung, umum, bebas, rahasia, jujur dan adil dalam Negara Kesatuan Republik Indonesia berdasarkan Pancasila dan Undang-Undang Dasar Negara Republik Indonesia (UUD RI) Tahun 1945[1]. Pemilu merupakan sarana untuk menentukan pemimpin dari sebuah negara demokrasi. Pasal 1 angka (1) Undang-Undang Nomor 10 Tahun 2008 Tentang Pemilihan Umum Anggota Dewan Perwakilan Rakyat, Dewan Perwakilan Daerah, dan Dewan Perwakilan Rakyat Daerah yang menyatakan “pemilihan umum untuk selanjutnya disebut pemilu. Undang-Undangan Nomor 25 Tahun 2011[2].

Peristiwa-peristiwa politik, seperti adanya pemilihan presiden (pilpres), pemilihan legislative (pileg), pergantian pemerintahan, pengumuman kabinet menteri, kerusuhan politik, peperangan dan peristiwa lainnya sangat mempengaruhi harga dan volume perdagangan dibursa efek karena peristiwa- peristiwa politik berkaitan erat dengan kestabilan perekonomian negara. Pada pemilu legislative tanggal 9 April 2014 sebanyak 588 calon anggota legislative dari 12 partai politik peserta pemilu bertarung untuk

(2)

2

memperebutkan 50 kursi anggota dewan perwakilan rakyat daerah kabupaten Lombok Timur. Dari jumlah data calon tetap (DCT) KPU tersebut dua (2) orang meninggal dunia

sebelum proses pemilihana sehingga penelitian ini menggunakan 588 data calon anggota Dewan Perwakilan Rakyat Daerah Kabupaten Lombok Timur. Naïve Bayes adalah metode Bayesian Learning yang paling cepat dan sederhana. Hal ini berasal dari teorema Bayes dan hipotesis kebebasan, menghasilkan klasifier statistik berdasarkan peluang. Ini adalah teknik sederhana. Naïve bayes merupakan algoritma klasifikasi yang efektif dalam mendapatkan hasil yang akurat dan efisien dalam proses penalaran memanfaatkan input yang ada dengan cara yang relatif cepat. Algoritma ini bertujuan untuk melakukan klasifikasi data pada klas tertentu. Kelebihan Naïve.

Domingos dan Pazzani (1997) pada papernya menjelaskan performa Naïve Bayes dalam fungsi zero-one loss. Fungsi zero-one loss ini mendefinisikan error hanya sebagai pengklasifikasian yang salah. Tidak seperti fungsi error yang lain seperti squared error, fungsi zero-one loss tidak memberi nilai suatu kesalahan perhitungan peluang selama peluang maksimum ditugaskan kedalam kelas yang benar. Ini berarti bahwa Naïve Bayes dapat mengubah peluang posterior dari tiap kelas, tetapi kelas dengan nilai peluang posterior maksimum jarang diubah [3]

Peneliti sebelumnya memprediksi pemilihan umum anggota legislative DKI Jakarta 2014 dengan menggunakan metode naïve bayes dengan Algoritma Genetika sebagai Fitur Seleksi dengan akurasi 97,84% dan nilai AUC 0,994 [4]. Prediksi pemilu legislative DKI Jakarta tahun 2012 menggunakan metode neural network berbasis particle swarm optimization dengan akurasi Algoritma neural network menghasilkan nilai akurasi sebesar 98,50 % dan nilai AUC sebesar 0,982, namun setelah dilakukan penambahan yaitu algoritma neural network berbasis particle swarm optimization nilai akurasi sebesar 98,85 % dan nilai AUC sebesar 0,996. Sehingga kedua metode tersebut memiliki perbedaan tingkar akurasi yaitu sebesar 0,35 % dan perbedaan nilai AUC sebesar 0,14.[5]

PSO sangat menarik untuk pemilihan fitur dimana kawanan partikel akan menemukan kombinasi fitur terbaik pada saat pencarian ruang masalah dan PSO dapat menemukan solusi yang optimal dengan cepat [6]. PSO banyak digunakan untuk memecahkan masalah optimasi, serta sebagai masalah seleksi fitur [7]. Dalam teknik PSO terdapat beberapa cara untuk melakukan pengoptimasian diantaranya, meningkatkan bobot atribut (attribute weight) terhadap semua atribut atau variabel yang dipakai, menseleksi atribut (attribute selection), dan feature selection.

(3)

3

Untuk dapat memberikan perbandingan akurasi salah satu algoritma optimasi yang cukup populer adalah PSO (Particle Swarm Optimization). Algoritma PSO terinspirasi dari kelompok yang dinamis, bersinergi dan dapat terorganisir dari simulasi komputer dari pergerakan koordinat. Particle swarm optimization (PSO) merupakan teknik komputasi evolusioner yang mampu menghasilkan solusi optimal secara global dalam ruang pencarian melalui interaksi individu dalam segerombolan partikel. Setiap partikel menyampaikan informasi berupa posisi terbaiknya kepada partikel yang lain dan menyesuaikan posisi dan kecepatan masing-masing berdasarkan informasi yang diterima mengenai posisi yang terbaik tersebut [8]. Particle swarm optimization dapat digunakan sebagai teknik optimasi untuk mengoptimalkan subset fitur dan parameter secara bersamaan [9]. Ketika algoritma naïve bayes digunakan dalam algoritma klasifikasi, Particle Swarm Optimization mampu meningkatkan akurasi lebih baik daripada sebelum digunakan Particle Swarm Optimization.

Penelitian ini akan melakukan prediksi untuk nilai akurasi pemilu legislative Lombok Timur dengan variable yang di tambahkan dapat berpengaruh meningkatkan akurasi pada model naïve bayes dan particle swarm optimization.

Pemilu

Pemilihan umum (pemilu) merupakan instrumen penting dalam negara demokrasi yang menganut sistem perwakilan [13]. Pemilu berfungsi sebagai alat penyaring bagi “politikus-politikus” yang akan mewakili dan membawa suara rakyat didalam lembaga perwakilan. Pemilu adalah sarana pelaksanaan kedaulatan rakyat yang dilaksanakan secara langsung, umum, bebas, rahasia, jujur, dan adil dalam Negara Kesatuan Republik Indonesia berdasarkan Pancasila dan Undang-Undang Dasar Negara Republik Indonesia Tahun 1945. (UU No. 10 Tahun 2008). Penyelenggaraan Pemilu yang baik dan berkualitas akan meningkatkan derajat kompetisi yang sehat, partisipatif, dan keterwakilan yang makin kuat dan dapat dipertanggungjawabkan.

Pemilu di Indonesia dapat dibedakan menjadi dua yakni: 1. Pemilu Orde Baru

Pemilu orde baru dimulai pada tahun 1955 sebagai pemilu pertama yang diselenggarakan di negara Republik Indonesia. Jumlah kursi tidak ditentukan oleh jumlah penduduk saja tetapi juga didasarkan pada wilayah administrasi atau dikenal dengan pemilihan proporsional atau tidak murni.

(4)

4 2. Pemilu Era Reformasi

Proses pemilu ditahun 1999 dilakukan sebelum habis masa kepemimpinan karena telah gagal dalam membangun system demokrasi sehingga pada tahun 1997 dianggap pemerintah dan lembaga lainnya tidak dapat dipercaya. Pemilu pada tahun 1997 menjadi tonggak era reformasi.

Data Mining

Data Mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data mereka. Data mining adalah aplikasi algoritma spesifik untuk mengekstrak pola dari data [14]. Beberapa aplikasi data mining fokus pada prediksi, mereka meramalkan apa yang akan terjadi dalam situasi baru dari data yang menggambarkan apa yang terjadi di masa lalu [15]. Data mining adalah proses menemukan korelasi baru yang bermakna, pola dan tren dengan memilah-milah sejumlah besar data yang tersimpan dalam repositoru, menggunakan teknologi penalaran pola serta teknik-teknik statistik dan matematika [16]. Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar [17].

Data Mining dapat berperan dalam: 1. Estimasi

Model dibangun dari data dengan record yang lengkap, yang menyediakan nilai dari variabel sebagai prediktor, kemudian estimasi nilai dari variable target ditentukan berdasarkan nilai dari variabel prediktor. Penentuan kebijakan atau suatu nilai pada proses yang akan dilakukan. Estimasi dapat dilakukan dari data-data lama yang akan diolah.

2. Prediksi

Algoritma prediksi sama dengan algoritma estimasi di mana label/ target/ class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentetan waktu (data time series). Sifat prediksi bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan. Penentuan hasil dari proses yang sedang berlangsung. Data-data yang digunakan untuk prediksi berasal dari data yang ada saat proses sedang berlangsung.

3. Klasifikasi

Algoritma yang menggunakan data dengan target/class/label berupa nilai kategorikal (nominal). Pengelompokan data-data yang ada menjadi dalam kelompok yang sudah ditentukan nama kelompoknya.

(5)

5 4. Klastering

Klastering merupakan mengelompokkan data, hasil observasi dan kasus ke dalam class yang mirip, koleksi data yang mirip antara satu dengan yang lain, dan memiliki perbedaan bila dibandingkan dengan data dari klaster lain. Pengelompokan data-data yang ada dan memiliki beberapa kesamaan menjadi dalam kelompok yang tidak perlu ditentukan nama kelompoknya.

5. Asosiasi

Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang “muncul bersamaan”. Pengelompokan data-data yang saling terkait dan berhubungan. Algoritma asosiasi akan mencari aturan yang menghitung hubungan diantara dua atau lebih atribut [18].

2.2.3 Pengertian Naïve Bayes

Naïve Bayes adalah metode Bayesian Learning yang paling cepat dan sederhana [19].

Algoritma Naive Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi.

Naïve bayes classifier adalah salah satu algoritma dalam teknik data mining yang

menerapkan teori Bayes dalam klasifikasi [20]. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas

Bayes, yaitu memprediksi peluang dimasa depan berdasarkan pengalaman dimasa

sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive Bayes dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naive

Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada

hubungannya dengan ciri dari kelas lainnya [21].

Teorema Bayes memiliki bentuk umum sebagai berikut. Keterangan:

X : data dengan class yang belum diketahui

H : hipotesis data X merupakan suatu class spesifik

P(H|X) : probabilitas hipotesis H berdasar kondisi X (posteriori probability) P(H) : probabilitas hipotesis H (prior probability)

P(X|H) : probabilitas X berdasar kondisi pada hipotesis H P(X) : probabilitas dari X

Tahapan dalam metode Naïve Bayes adalah [22]: 1. Penentuan kategori data

(6)

6

Naive Bayes melakukan klasifikasi pada nilai probabilitas p(C= ci | D=dj) yaitu probabilitas ci dan data dj. Klasifikasi dilakukan agar dapat menentukan c ɛ C dari data d ɛ D dimana C={c1, c2, c3, ..., ci} dan D={d1, d2, d3, d... dj} (Trisedya & Jais, 2009). Penentuan dari kategori sebuah data dilakukan dengan mencari nilai maksimal dari p(C=ci | D=dj) pada P={ p(C=ci | D=dj) | c ɛ C dan d ɛ D}. Nilai probabilitas p(C=ci | D=dj) dapat dihitung dengan persamaan Mitchell tahun 2005.

Dengan p(D=dj | C=ci) merupakan nilai probabilitas dari kemunculan dokumen dj jika diketahui data tersebut berkategori ci, p(C=ci) adalah nilai probabilitas kemunculan kategori ci dan p(D = dj) adalah nilai probabilitas kemunculan dokumen dj.

2. Menghitung probabilitas

Naive Bayes menganggap sebuah data sebagai sekumpulan dari kata-kata yang menyusun data tersebut, dan tidak memperhatikan urutan kemunculan kata pada data. Perhitungan probabilitas p(C = ci | D = dj) dapat dituliskan sebagai berikut:

Dengan adalah hasil perkalian dari probabilitas kemunculan semua kata pada data dj.

1. Proses klasifikasi

Proses klasifikasi dilakukan dengan membuat model probabilistik dari data training, yaitu dengan menghitung nilai p(wk | c). Un

2. Melakukan pengkategorian nilai

Contoh penerapan metode Naïve Bayes dalam pengolahan data KPU adalah sebagai berikut :

Tabel 1. Atribut dan Dataset DPRD KPU Lotim 2014

Terpilih Nama Calon Suara Sah

Jumlah Perolehan Kursi No.Urut Suara Sah TIDAK H. HULAIN, S.H. 14.265 3.0 1.0 3.304 TIDAK L. MHARUF, S.H. 14,265 3.0 2.0 1.359

(7)

7

TIDAK DIAH SUBEKTI HINDAYNI 14,265 3.0 3.0 159

YA MUSTAYIB 14,256 3.0 4.0 3410

TIDAK AHMAD ROFI’I 14,256 3.0 5.0 491

TIDAK NURAINIFITRIAH 14,256 3.0 6.0 46

TIDAK SAPOAN 14,256 3.0 7.0 839

TIDAK GULAM GAHTAN 14,256 3.0 8.0 2760

Dari data tabel 1 kemudian dilakukan pengolahan data yaitu mencari nilai accuracy dari data tersebut untuk dapat disimpulkan akurasi yang diperolah dari data tersebut, adapun hasil pengolahan selanjutnya antara lain :

Tabel 2. Model comfucition matrik untuk metode Naïve Bayes

2.2.4 Particle Swarm Optimization

Untuk menemukan solusi yang optimal, masing-masing partikel bergerak ke arah posisi yang terbaik sebelumnya dan posisi terbaik secara global. Sebagai contoh, partikel ke-i dinyatakan sebagai: xi = (xi1, xi2,....xid) dalam ruang dimensi. Posisi terbaik sebelumnya dari partikel ke-i dke-iske-impan dan dke-inyatakan sebagake-i pbestke-i = (pbestke-i,1, pbestke-i,2,...pbestke-i,d). Indeks partke-ikel terbaik diantara semua partikel dalam kawanan group dinyatakan sebagai gbestd. Kecepatan partikel dinyatakan sebagai: vi = (vi,1,vi,2,....vi,d). Modifikasi kecepatan dan posisi partikel dapat dihitung menggunakan kecepatan saat ini dan jarak pbesti, gbestd seperti ditunjukan persamaan berikut:

vi,d = w * vi,d + c1 * R * (pbesti,d - xi,d) + c2 * R * (gbestd - xi,d) (2.1) xid = xi,d + vi,d (2.2)

Dimana:

Vi, d : Kecepatan partikel ke-i pada iterasi ke-i

W : Faktor bobot inersia

c1, c2 : Konstanta akselerasi (learning rate)

(8)

8

Xi, d : Posisi saat ini dari partikel ke-i pada iterasi ke-i Pbesti : Posisi terbaik sebelumnya dari partikel ke-i

Gbesti :Partikel terbaik diantara semua partikel dalam satu kelompok atau populasi

N : Jumlah partikel dalam kelompok

D : Dimensi

METODE Desain Penelitian

Penelitian yang umum ada empat metode digunakan yaitu Action Reserch, Experiment, Case

Study, dan Survey . Adapun metode penelitian yang digunakan adalah bentuk penelitian Experiment. Penelitian eksperimen merupakan sebuah penyelidikan hubungan kausal

menggunakan test dikendalikan oleh peneliti [23].

Dalam penelitian ini akan dilakukan beberapa langkah-langkah atau tahapan-tahapan Penelitian seperti pada alur gambar dibawah ini;

1. Pengumpulan data 2. Pengolahan data awal

3. Model/metode yang diusulkan 4. Pengujian model

5. Evaluasi dan validasi hasil

Pengumpulan Data

Data penelitian ini bersumber dari Daftar Calon Tetap (DPT) anggota legislative kabupaten Lombok Timur, seperti pada table 3.

(9)

9

Dataset berjumlah 588 Orang calon anggota yang akan memperebutkan50 kursi DPRD tahun 2014

Pengolahan Data Awal

Data awal yang didapatkan dari KPU Kabupaten Lombok Timur tahun 2014 dan setelah diumumkan daftar calon tetap telah menjadi data public untuk diketahui dan diumumkan ke khalayak umum. Data awal berjumlah 590 dan meninggal sebelum pemilihan 2 orang sehingga dihilangkan sehingga menjadi 588 orang.

1. Data validation

2. Data integration dan transformation 3. Data size reduction and discritizaton

(10)

10 Metode Yang diusulkan

HASIL PENELITIAN DAN PEMBAHASAN Evaluasi dan Validasi

Hasil Pengujian Metode Naïve Bayes

1. Confusion Matrix

Berdasarkan data training sebanyak 588 record dengan 13 atribut diantaranya adalah nama parpol, nama caleg, jenis kelamin, usia caleg, pendidikan terakhir, pekerjaan, daerah pemilihan, no urut caleg, nomor urut parpol, suara sah caleg, suara sah partai, jumlah perolehan kursi, terpilih dan tidak terpilih, yang dimodelkan dengan algoritma naïve bayes diperoleh hasil sebagai berikut:

Table. 5. Eksperimen comfusion Matrix Naïve Bayes dan Particle Swarm Optimization

Jumlah true positive (tp) adalah 525 record diklasifikasikan sebagai TIDAK terpilih dan

False Negative (fn) sebanyak 7 record diklasifikasikan sebagai TIDAK terpilih tetapi YA

terpilih. Jumlah true negative (tn) adalah 43 record diklasifikasikan YA terpilih dan false

(11)

11

Dari confusion matrix diatas, terlihat bahwa akurasi dengan menggunakan algoritma naïve bayes adalah sebesar 85,14%. Perhitungan sensitivity, specifity, ppv, dan npv adalah sebagai berikut:

b. Evaluasi ROC curve

Gambar 5.1 Nilai AUC model naïve bayes

Berdasarkan grafik ROC diatas, terlihat bahwa nilai AUC (Area Under Curve) sebesar 0,967 dengan tingkat akurasi Excellent Classification.

(12)

12

Pada penambahan variable jenis kelamin sebagai predictor (nama parpol, nama caleg, suara sah caleg, dan Jenis Kelamin) dalam penelitian ini diperoleh nilai accuracy pada Naïve bayes dengan nilai tertinggi pada number of validation ke-80 yakni accuracy 90.74% dan AUC :unknown, dan setelah diterapkan Particle Swarm Optimization diperoleh accuracy lebih tinggi pada number of validation ke 90 dengan accuracy 95.59% dan AUC: 0.964.

Tabel 7. Pengaruh penambahan variable Usia dalam peningkatan accuracy Naïve Bayes dan Particle swarm Optimization

Pada penambahan variable usia sebagai predictor (nama parpol, nama caleg, suara sah caleg, dan usia) dalam penelitian ini diperoleh nilai accuracy pada Naïve bayes dengan nilai tertinggi pada number of validation ke-10 yakni accuracy 90.65% dan AUC :0.952, dan setelah diterapkan Particle Swarm Optimization diperoleh accuracy lebih tinggi pada number of validation ke 30 dengan accuracy 95.92% dan AUC: 0.961.

Tabel 8. Pengaruh penambahan variable Pendidikan dalam peningkatan accuracy Naïve Bayes dan Particle swarm Optimization

(13)

13

Pada penambahan variable tingkat pendidikan sebagai predictor (nama parpol, nama caleg, suara sah caleg, dan tingkat pendidikan) dalam penelitian ini diperoleh nilai accuracy pada Naïve bayes dengan nilai tertinggi pada number of validation ke-20 yakni accuracy 86.56% dan AUC : 0.884, dan setelah diterapkan Particle Swarm Optimization diperoleh accuracy lebih tinggi pada number of validation ke 80 dengan accuracy 95.58% dan AUC: 0.976. Tabel. 9. Pengaruh penambahan variable Pekerjaan dalam peningkatan accuracy Naïve Bayes

dan Particle swarm Optimization

Pada penambahan variable pekerjaan sebagai predictor (nama parpol, nama caleg, suara sah caleg, dan pekerjaan) dalam penelitian ini diperoleh nilai accuracy pada Naïve bayes dengan nilai tertinggi pada number of validation ke-30 yakni accuracy 86.75% dan AUC : 0.915, dan setelah diterapkan Particle Swarm Optimization diperoleh accuracy lebih tinggi pada number of validation ke 90 dengan accuracy 95.59% dan AUC: 0.977.

PEMBAHASAN HASIL PENGUJIAN

Berdasarkan penelitian yang telah dilakukan, bahwa prediksi Pemilu Legislative Kabupaten Lombok Timur menggunakan Data Calon Tetap (DCT) KPU Kabupaten Lombok Timur tahun 2014 sebanyak 588 record. Adapun atribut digunakan sebanyak 13 atribut yakni 1) nama parpol, 2) nama caleg, 3) jenis kelamin, 4) pendidikan terakhir, 5) usia, 6) pekerjaan, 7) nomor urut parpol,8) suara sah partai, 9) jumlah perolehan kursi, 10) daerah pemilihan, 11) no urut caleg, 12) suara sah caleg, dan 13) Terpilih atau tidak terpilih (Ya dan Tidak) sebagai

(14)

14

atribut predictor. Dataset di uji untuk mendapatkan nilai accuracy yang menyebabkan masing-masing atribut memiliki daya bobot sehingga terlihat atribut yang lebih berpengaruh dalam meningkatkan accuracy. Masing-masing memiliki kesempatan yang sama dengan dibantu model algoritma naïve bayes dengan fitur seleksi menggunakan algoritma particle

swarm optimization, diperoleh hasil sebagai berikut:

Tabel 10. Perbandingan nilai accuracy dari variable yang ditambahkan

Pada tabel 10 terdapat perbedaan akurasi dari hasil penambahan variable yang tentunya dapat berpengaruh pada nilai akurasi pada prediksi pemilu legislative kabupaten Lombok Timur. Peningkatan akan lebih baik tergambar dalam grafik bar dibawah ini:

(15)

15

Table. 11 Pengaruh penambahan Variabel Pada Naïve Bayes sebelum diberikan Particle Swarm Optimization fitur seleksi

Pada grafik bar diatas dari penambahan 4 variabel dalam penelitian ini dapat berpengaruh dengan diperoleh peningkatan accuracy pada model Naïve Bayes dengan berbasiskan particle

swarm optimization. Dari variable usia dengan accuracy naïve bayes 90.65% menjadi 95.93

terdapat peningkatan 5.27%. Pada variable jenis kelamin accuracy naïve bayes 90.74% menjadi 95. 59% terdapat peningkatan accuracy 4.85%. pada variable pekerjaan accuracy naïve bayes 86.75% menjadi 95.59% terdapat peningkatan accuracy 8.84%. pada variable pendidikan accuracy naïve bayes 86.56% menjadi 95.58%. sedangkan pada variable nomor urut caleg accuracy 89.79 menjadi 95.59% sehingga terdapat peningkatan accuracy 5.80%.

Jumlah true positive (tp) adalah 524 record diklasifikasikan sebagai TIDAK terpilih dan

False Negative (fn) sebanyak 10 record diklasifikasikan sebagai TIDAK terpilih tetapi YA

terpilih. Jumlah true negative (tn) adalah 40 record diklasifikasikan YA terpilih dan false

(16)

16

Dari confusion matrix di atas, terlihat bahwa akurasi dengan menggunakan algoritma naïve bayes adalah sebesar 95,59%.

Pada proses pengolahan accuracy true positif dijumlahkan dengan true negative kemudian dibagi dari hasil penjumlahan true positif, true negative, false positif, dan false negative sehingga menghasilkan nilai accuracy = , nilai sensitivity diperoleh , nilai specificitynya 0.419048. Sedangan PPV (positive predictive value) atau precision adalah proporsi kasus dengan hasil diagnosa positif menghasilkan dan Negative Predictive

Value adalah proporsi kasus dengan diagnose negative menghasilkan nilai 0.8.

c. Evaluasi ROC curve

(17)

17

Berdasarkan grafik ROC diatas, terlihat bahwa nilai AUC (Area Under Curve) sebesar 0,961 dari pengaruh penambahan variable usia pada dataset yang diolah baik pada naïve bayes dan particle swarm optimization dengan tingkat akurasi Excellent Classification.

KESIMPULAN DAN SARAN Kesimpulan

Penelitian ini dengan Naïve Bayes berbasis Algoritma Particle Swarm Optimization sebagai fitur seleksi dan algoritma naïve bayes tanpa fitur seleksi, dapat diterapkan pada prediksi pemilu legislatif Kabupaten Lombok Timur. Keduanya menghasilkan akurasi yang excellent. Prediksi hasil pemilu legislatif Kabupaten Lombok Timur dengan algoritma naïve bayes tanpa fitur seleksi memiliki akurasi 85,14% dengan nilai AUC 0.978, sedangkan prediksi hasil pemilu legislatif Kabupaten Lombok Timur menggunakan algoritma naïve bayes dengan algoritma particle swarm optimization sebagai fitur seleksi memiliki akurasi 96.61% dengan nilai AUC 0,972. Jadi prediksi pemilu legislatif Kabupaten Lombok Timur menggunakan algoritma naïve bayes berbasis Particle Swarm Optimization sebagai fitur seleksi lebih baik atau unggul dibandingkan menggunakan algoritma naïve bayes tanpa fitur seleksi.

Penambahan variable masing-masing memiliki pengaruh dalam meningkatkan akurasi naïve bayes, dan naïve bayes berbasis particle swarm optimization yang bermanfaat pada untuk menemukan output minimum atau maksimum atau hasil. Input terdiri dari variable. Dalam penelitian ini penambahan variable usia memberikan pengaruh lebih tinggi sebagaimana dapat diperhatikan dipembahasan eksperimen atau percobaan tersebut diatas. Variable usia memberikan akurasi 90.65% dan setelah diterapkan Particle swarm optimization meningkat accurasi 95.92% dengan rata-rata perbandingannya 0.6765%

Saran

Saran-saran dalam penelitian ini yang diusulkan sebagai berikut:

1. Penelitian ini dapat dikembangkan dengan menggunakan metode-metode klasifikasi data mining lainnya untuk melakukan perbaikan dan sebagai bahan perbandingan untuk dapat meningkatkan akurasi prediksi.

2. Penelitian ini dapat dikembangkan dengan menggunakan algoritma fitur seleksi atau dengan algoritma optimasi lainnya.

3. Penelitian ini diharapkan dapat sebagai parameter oleh para calon dewan untuk mempersiapkan amunisi informasi prediksi pemilu legislatif kabupaten Lombok Timur.

(18)

18

4. Beberapa variable sebagai indicator-indikator yang cukup besar menentukan keberhasilan adalah usia, nomor urut caleg, pendidikan sang calon anggota legislative.

DAFTAR PUSTAKA

[1] Santoso, T. (2004). Pelanggaran pemilu 2004 dan penanganannya. Jurnal demokrasi dan

Ham , 9-29.

[2] Kaelani, Prof.Dr.M.S., (2010), Pendidikan Pancasila, Edisi Reformasi. PT. Paradigma. Yogyakarta.

[3] Domingos, P., and Pazzani, M. (1997). On the optimality of the Simple Bayesian

Classifier under Zero-One Loss.

[4] Diana Tri Wahyuni, 2014. Prediksi Hasil Pemilu Legislatif DKI Jakarta menggunakan

Algoritma Naive Bayes dengan Algoritma Genetika sebagai Fitur Seleksi. Program Studi

Teknik Informatika - S1, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Semarang

[5] Muhammad Badrul (2012). Prediksi Hasil Pemilu Legislatif DPRD DKI Jakarta dengan

Neural Network berbasis Particle Swarm Optimization.

[6] Parimala, R., & Nallaswamy, R. (2012). Feature Selection using a Novel Particle Swarm Optimization and It’s Variants. I.J. Information Technology and Computer Science, , 16-24.

[7] Zhao, M., Fu, C., Ji, L., Tang, K., & Zhou, M. (2011). Feature Selection And Parameter Optimization For Support Vector Machines: A New Approach Based On Genetic Algorithm With Feature Chromosomes. School Of Computer Science And Technology , 5197–5204.

[8] Shuzhou, W., & Bo, M. (2011). Parameter Selection Algorithm for Support Vector Machine. Procedia Environmental Sciences, 11, 538-544.

[9] Yun, L., Qiu-yan, C. & Hua, Z. (2011). Application of the PSO-SVM model for Credit Scoring. Seventh International Conference on Computational Intelligence and Security, 47-51.

[10] Nagadevara, & Vishnuprasad. (2005). Building Predictive models for election result in india an application of classification trees and neural network. Journal of Academy of

Business and Economics Volume 5

[11] Borisyuk, R., Borisyuk, G., Rallings, C., & Thrasher, M. (2005). Forecasting the 2005

General Election:A Neural Network Approach. The British Journal of Politics & International Relations Volume 7, Issue 2 , 145-299.

(19)

19

[12] Rigdon, S. E., Jacobson, S. H., Sewell, E. C., & Rigdon, C. J. (2009). A Bayesian

Prediction Model For the United State Presidential Election. American Politics Research volume.37 , 700-724

[13] Mahfud MD, 2011, Politik Hukum di Indonesia, edisi revisi. Rajawali pers.PT.Rajagrapindo persada

[14] Abraham, A., Grosan, C., Ramos, V., (2006). Swarm Intelligence in Data Mining. Springer-Verlag Berlin Heidelberg

[15] Maimon, O., & Rokach, L. (2010). Data Mining and Knowledge Discovery Handbook. London: Springer.

[16] Larose, D. T. (2007). Data Mining Methods And Models. New Jersey: A John Wiley & Sons

[17] Davies, and Paul Beynon, 2004, “Database Systems Third Edition”, Palgrave

Macmillan, New York

[18] Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., Wirth, R. 2000. CRISP-DM 1.0 : Step-by-Step Data Mining Guide

[19] Ebranda A.W, Novi Triana, Mardiani, Tinaliah, Penerapan metode naïve bayes untuk

sistem Klasifikasi sms pada smartphone android. Jurusan Teknik Informatika STMIK

MDP.

[20] Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., Wirth, R. 2000. CRISP-DM 1.0 : Step-by-Step Data Mining Guide.

[21] Bustami, Penerapan algoritma naive bayes Untukmengklasifikasi data nasabah

Asuransi. Dosen Teknik Informatika Universitas Malikussaleh.

[22] Larose, D. T. (2007). Data Mining Methods And Models. New Jersey: A John Wiley & Sons.

[23] Sardini, N. H. (2011). Restorasi penyelenggaraan pemilu di Indonesia.Yogyakarta: Fajar Media Press.

Gambar

Tabel 1. Atribut dan Dataset DPRD KPU Lotim 2014
Tabel 2.  Model comfucition matrik untuk metode Naïve Bayes
Table 4. Tabel atribut yang digunakan (DPT Calon DPRD) dari KPU LOTIM
Gambar 5.1 Nilai AUC model naïve bayes
+3

Referensi

Dokumen terkait

Setelah ditemukan akurasi yang paling optimum dari hasil pembelajaran data training dengan menggunakan algoritma Naïve Bayes, tahap selanjutnya adalah melakukan

Hasil pengujian menunjukkan bahwa nilai akurasi Naive Bayes sebesar 89,08%, setelah dilakukan pemilihan fitur dengan menggunakan Backward Elimination didapatkan hasil

Dalam penelitian ini, akan dilakukan perbandingan hasil klasifikasi antara algoritma naïve bayes tanpa metode seleksi fitur forward selection, dengan algoritma naïve bayes

prediction(y), ini gambaran dari hasil prediksi yang dilakukan dengan menggunakan algoritma Naive Bayes berbasis Backward Elimination , contah data hasil prediksi

Melakukan prediksi tingkat pembayaran kredit merupakan hal penting karena menjadi landasan kebijakan msalah pembayaran kredit dan algoritma Naive Bayes berbasis

Kesimpulan dari penelitian ini yaitu algoritma Naïve Bayes dengan fitur seleksi Backward Elimination terbutki dapat meningkatkan hasil evaluasi pada prediksi waktu

Melakukan prediksi tingkat pembayaran kredit merupakan hal penting karena menjadi landasan kebijakan msalah pembayaran kredit dan algoritma Naive Bayes berbasis

Perbandingan Tingkat Akurasi Algoritma Naive Bayes Berdasarkan Metode Seleksi Fitur No Penulis Tahun Judul Jumlah Dataset Seleksi Fitur Tingkat Akurasi 1 Putri, Mubarok, &