• Tidak ada hasil yang ditemukan

IMPLEMENTASI ALGORITMA K-MEANS PADA DATA PELANGGARAN LALU LINTAS DI PENGADILAN NEGERI PURWODADI

N/A
N/A
Protected

Academic year: 2021

Membagikan "IMPLEMENTASI ALGORITMA K-MEANS PADA DATA PELANGGARAN LALU LINTAS DI PENGADILAN NEGERI PURWODADI"

Copied!
10
0
0

Teks penuh

(1)

IMPLEMENTASI ALGORITMA K-MEANS PADA DATA

PELANGGARAN LALU LINTAS DI PENGADILAN NEGERI

PURWODADI

IMPLEMENTATION OF K-MEANS ALGORITHM FOR DATA TRAFFIC VIOLATIONS DATA IN STATE COURT OF PURWODADI

Lestian Cahya Ardianata1, Ahmad Zainul Fanani2

Program Studi Teknik Informatika, Fakultas Teknik Ilmu Koomputer, UDINUS Jl. Imam Bonjol 207 dan Jl. Nakula 1 no 5-11, Semarang

e-mail: [email protected]

Abstrak

Ketertiban berlalu lintas dijalan sangatlah penting bagi pengendara di jalan raya, kurangnya kesadaran pengguna kendaraan bermotor di daerah Purwodadi dan buruknya pengendara akan kedisiplinan berlalu lintas serta rendahnya pengetahuan akan kedisiplinan berlalu lintas para pemakai jalan membuat tingkat pelanggaran tata tertib berlalu lintas dalam berkendara di jalan raya selalu meningkat sehingga mebuat banyaknya data tilang (bukti pelanggaran) yang diterima oleh Pengadilan Negeri Purwodadi dari pihak kepolisian semakin menumpuk. Pada penelitian ini bertujuan untuk mengelompokan dan mencari daerah ya ng sering paling banyak melanggar lalu intas dengan menggunakan data sebanyak 2371 data pelanggaran lalu lintas menggunakan metode K-Means dengan atribut alamat, pasal yang dilanggar, jenis, barang bukti dan denda. Hasil dari penelitian ini juga dapat dima nfaatkan untuk kemudian dapat ditindak lanjuti dengan diadakannya sosialisasi guna menekan angka pelanggaran berlalu lintas. Dari hasil pengujian, dapat disimpulkan bahwa dari tiga cluster yaitu cluster C1 dengan anggota data 861 dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 287, Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op.. C2 dengan anggota data 1179 dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 281 (1 s/d 6), Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op.. C3 dengan anggota data 331 dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 293 (1) (2), Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op.. Dan dengan pengujian cluster2 dan 3 diperoleh nilai pengujian DBI untuk cluster 2 yaitu 0,873 dan untuk cluster 3 yaitu 0,751, karena nilai DBI dari cluster 3 lebih kecil maka cluster tersebut bisa disebut optimal.

Kata kunci : K-means, Data Mining, Clustering, Pengadilan Negeri Purwodadi

Abstract

Road traffic order is very important for drivers in highway, lack of awareness motorist in Purwodadi and bad behavior drivers, also lack of discipline by drivers make traffic violations ranking up, so there will be many data traffic ticket (violation evidence) received by Distric Court of Purwodadi increasing. In this study aims to categorize and search fo r areas that are most widely violated with 2371 data traffic violations using the K-Means method that have address, article of violation, attributes types, evidences and fines. The result of this study can be used to be followed up by establish socialization to reduce the number of traffic violations. From the test result, can be concluded that there are three clusters, namely cluster C1 with 861 data members generated analysis of areas that are often violated, namely in the area of the Distric Purwodadi with a passage that violated: Article 287, Type: SPM, Evidence: Registration, Fines: Sub 3 hr.

(2)

Keywords : K-Means, Data mining, Clustering, State Court of Purwodadi

1. PENDAHULUAN

Meningkatnya penggunaan kendaraan bermotor menambah angka pelanggaran tata tertib lalu lintas dalam berkendara di jalan raya pada tahun 2013 jumlah pelanggaran lalu lintas mencapai 23478 pelanggaran dan bertambah ditahun 2014 menjadi 24987 pelanggaran lalu lintas. Setiap tahun pelaku pelanggaran berkendara semakin bertambah pesat. [1]

Dalam Penelitian ini, penerapan data mining pada data pelanggaran lalu lintas untuk mengetahui pelanggaran dan daerah yang sering melanggar. Selanjutnya dapat dilakukan analisa terhadap data tersebut dengan menggunakan metode clustering dan algoritma K-Means. Sedangkan Davies-Bouldin Index (DBI) digunakan sebagai validasi cluster sehingga dihasilkan kelompok cluster yang optimal atau sesuai dari cluster yang sudah dibentuk.

Pada penelitian Fenty Eka M. Agustin [2] tentang menentukan kelompok pengayaan materi mata pelajaran ujian nasional menggunakan 12 data dengan atribut (IPA, MTK, Bahasa Indonesia dan Bahasa Inggris) mengelompokan kedalam 4 kluster dengan hasil yaitu kelompok materi Bahasa Indonesia terdapat 64 siswa, Bahasa Inggris 93 siswa, IPA terdiri 46 siswa dan Matematika 72 siswa, dengan hasil tersebut bisa jadi ada siswa yang harus mengikuti seluruh materi pengayaan, ada juga yang hanya mengikuti satu atau dua materi pengayaan. [2]

2. METODE PENELITIAN

Metode yang digunakan dalam penelitian ini adalah metode deskriptif analisis dengan pendekatan kuantitatif, yaitu penelitian yang kemudian diolah dan dianalisis untuk diambil kesimpulan. Desain Penelitian ini merupakan gambaran alur sistem yang dikerjakan secara keseluruhan dalam proses pengolahan dataset pelanggaran lalu lintas dengan metode clustering dengan menggunakan algoritma K-Means (Gambar 1).

(3)

Gambar 1 Desain Penelitian Algoritma K-Means

Algoritma k-means adalah algoritma yang mempartisi data kedalam cluster – clusteri sehingga data yang memiliki kemiripan berada pada satu cluster yang sama dan data yang memiliki iketidaksamaan berada pada cluster yang lainnya. [3] K-Means itu sendiri mempunyai aturan didalamnya yaitu: iiii

1. Jumlah cluster yang diperlukan diinputkan. 2. Hanya memiliki atribut bertipe numerik.

Pada awal algoritma K-Means mengambil sebagian dari banyaknya komponen dari data untuk dipilih menjadi pusat cluster sesuai dengan yang diinginkan. Pusat cluster dipilih secara acak atau random dari sekumpulan komponen data. Didalam algoritma K-Means pada dasarnya melakukan 2 proses yaitu proses pendeteksian lokasi pusat cluster dan proses pencarian anggota dari tiap – tiap cluster tersebut. [4]ii

Langkah – langkah algoritma K-Means adalah sebagai berikut : 1. Menetukan k sebagai jumlah kluster yang ingin dibentuk.

2. Membangkitkan nilai random untuk pusat cluster (centroid) awal sebanyak k. 3. Menghitung jarak setiap data terhadap masing - masing cenroid menggunakan rumus

euclidien hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Persamaan yang digunakan untuk menghitung Euclidian Distance adalah :

𝒹(𝓍𝒾, 𝜇𝒿) = √∑(𝓍𝒾 − 𝜇𝒿) ( 1 ) Dimana :

𝓍𝒾 ∶ 𝑑𝑎𝑡𝑎 𝑘𝑟𝑖𝑡𝑒𝑟𝑖𝑎

𝜇𝒿 ∶ 𝑐𝑒𝑛𝑡𝑟𝑜𝑖𝑑 𝑝𝑎𝑑𝑎 𝑐𝑙𝑢𝑠𝑡𝑒𝑟 𝑘𝑒 − 𝒿

4. Mengklasifikasi setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil).

(4)

𝒩𝓈𝒿 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 𝑝𝑎𝑑𝑎 𝑐𝑙𝑢𝑠𝑡𝑒𝑟 𝒮𝒿

6. Melakukan perulangan dari langkah 2 hingga 5, sampai anggota cluster tidak ada yang berubah.

Jika langkah 6 telah terpenuhi, maka nilai pusat cluster pada iterasi terakhir akan digunakan sebagai parameter untuk menentukan klasifikasi data.

Validasi DBI (Davies Bouldin Index)

Indeks Davies-Bouldin (IDB) merupakan salah satu metode validasi cluster untuk evaluasi kuantitatif dari hasil clustering. Pengukuran ini bertujuan memaksimalkan jarak intercluster antara satu cluster dengan cluster yang lain. Dalam penelitian ini IDB akan digunakan untuk mendeteksi outlier pada masing-masing cluster yang terbentuk. [5]

Prsamaan yang digunakan untuk menguji DBI yaitu : var (x) = 1 𝑁−1∑ (𝓍𝒾 − 𝓍̅ ) 2 𝑁 𝑖=0

( 3 )

𝑅𝒾 =

𝑗=1,…𝑘,𝒾 ≠𝒿max ℛ𝒾𝒿

( 4 ) = 𝑣𝑎𝑟 (𝐶𝒾) +𝑣𝑎𝑟 (𝐶𝒿) ∥𝐶𝒾−𝐶𝒿∥ 𝒾 ≠ 𝒿 𝑅𝒾𝒿 ( 5 ) 𝐷𝐵𝐼 =1 𝑘. ∑ 𝑅𝒾 𝑘 𝑖=1 ( 6 ) Dimana

𝑥̅ : rata – rata dari cluster x dan N adalah jumlah anggota cluster Var : variance dari data

𝐶𝒾 : cluster i dan 𝐶𝒾 adalah centroid dari cluster i

Berikut merupakan langkah perhitungan DBI (Davies Bouldin Index) :

1. Data yang digunakan adalah data yang diperoleh dari proses pengklusteran k-means, yaitu data yang sudah ter-cluster.

2. Cari nilai rata – rata dari masing -masing nilai cluster. 3. Hitung variance data dari masing – masing dalam cluster. 4. Cari R max dari perhitungan langkah 2 dan 3.

5. Hasil akhir adalah nilai DBI dari cluster.

3. HASIL DAN PEMBAHASAN

Data yang digunakan pada penelitian ini adalah dataset pelanggaran lalu lintas pada Pengadilan Negeri Purwodadi. Data yang digunakan dengan jumlah 2371 dataset pelanggaran

(5)

lalu lintas yang akan di cluster menggunakan Matlab dengan algoritma K-Means yang kemudian akan dilakukan analisis untuk menentukan tujuan yang diinginkan. Berikut sample contoh beberapa dataset

Tabel 1 Data Sample

Data ke – i Atribut A B C D E 1 2 2 1 2 1 2 3 4 1 3 1 3 6 1 2 2 2 4 10 7 1 1 2 5 15 5 2 1 2 Perhitungan manual :

1. Pada dataset tersebut akan dibentuk 2 Klaster.

2. Membangkitkan nilai random untuk pusat cluster (centroid) awal sebanyak k, yang di ambil dari data 2 dan data 1.

C1 = (3 ; 4 ; 1 ; 3 ; 1) C2 = (2 ; 2 ; 1 ; 2 ; 1)

3. Menghitung jarak setiap data terhadap masing - masing cenroid menggunakan rumus euclidien (Persamaan 1) :

ITERASI KE-1 :

𝒹11 = √(2 − 3)2+ (2 − 4)2+ (1 − 1)2+ (2 − 3)2+ (1 − 1)2= 2,44

𝒹12 = √(2 − 2)2+ (2 − 2)2+ (1 − 1)2+ (2 − 2)2+ (1 − 1)2= 0

Dan seterusnya dilanjutkan untuk data ke 2, . . . N

4. Mengklasifikasi setiap data berdasarkan kedekatannya dengan centroid (jarak terkecil). Tabel 2 Keanggotaan Cluster Iterasi ke-1

Data ke - i Atribut C1 C2 C diikuti

A B C D E 1 2 2 1 2 1 2,44 0 C2 2 3 4 1 3 1 0 2,44 C1 3 6 1 2 2 2 4,58 4,35 C2 4 10 7 1 1 2 7,93 9,53 C1 5 15 5 2 1 2 12,28 13,45 C1

Anggota Cluster 1 dan Cluster 2 adalah : C1 = (Data 2 ; Data 4 ; Data 5) C2 = (Data 1 ; Data 3)

5. Memperbarui nilai centroid. Nilai centroid diperoleh dari rata – rata cluster yang bersangkutan (Persamaan 2) :

C1X1 = 3+10+15

3 = 9,33

C1X2 = 4+7+5

3 = 1,77

(6)

Ulangi langkah yang sama hingga posisi data tidak mengalami perubahan. Tabel 3 Keanggotaan Cluster Iterasi ke-2

Data ke - i Atribut C1 C2 C diikuti

A B C D E 1 2 2 1 2 1 7,37 2,17 C2 2 3 4 1 3 1 6,88 2,95 C2 3 6 1 2 2 2 3,51 2,17 C2 4 10 7 1 1 2 5,33 8,23 C1 5 15 5 2 1 2 6,60 11,60 C1

Tabel 4 Keanggotaan Cluster Iterasi ke-3

Data ke - i Atribut C1 C2 C diikuti

A B C D E 1 2 2 1 2 1 11,33 1,02 C2 2 3 4 1 3 1 9,97 2,57 C2 3 6 1 2 2 2 8,27 5,06 C2 4 10 7 1 1 2 2,73 10,06 C1 5 15 5 2 1 2 2,73 14,13 C1

Karena pada iterasi ke-2 dan iterasi ke-3 sudah konvergen atau anggota C1 dan C2 tidak berubah, maka proses iterasi dihentikaan, dan hasil yang diperoleh adalah :

C1 = (Data 4 ; Data 5)

C2 = (Data 1 ; Data 2 ; Data 3)

Tabel 5 Konvergen Data ke - i Atribut C1 C2 A B C D E 1 2 2 1 2 1 * 2 3 4 1 3 1 * 3 6 1 2 2 2 * 4 10 7 1 1 2 * 5 15 5 2 1 2 *

Data yang digunakan dengan jumlah 2371 dataset pelanggaran lalu lintas akan dikelompokan menjadi 3 klaster pelanggaran yaitu C1(Pelanggar Rambu), C2 (Pelanggar Perlengkapan), C3 (Pelanggar Lampu).

(7)

Tabel 6 Dataset

Buka dan cari file berekstensi .m yang telah dibuat, gambar lebih lengkap tertera seperti pada gambar dibawah ini.

Gambar 2 Kotak Dialog Open Untuk Membuka File Yang Diinginkan

Setelah itu akan keluar kotak dialog editor yang berisi script pembentukan aturan K-Means, dan setelah itu pilih icon Run atau juga bisa menekan tombol F5, yang tertera seperti gambar dibawah ini.

Gambar 3 Kotak Dialog Editor Pembentukan K-Means

Setelah program dijalankan maka akan menampilkan inputan clsuter yang tertera pada kotak dialog Command Windows dan diminta memasukkan jumlah centroid untuk memproses data nantinya, jumlah centroid juga merupakan jumlah cluster yang akan dibuat dalam proses

(8)

Gambar 4 Inputan Centroid Dalam Proses Cluster Tabel 7 Hasil Kluster

Dari hasil clustering menggunakan data sebanyak 2371 data dapat dianalisa dan menghasilkan tiga cluster yaitu cluster C1 (Pelanggar Rambu) mempunyai anggota 861 data. C2 (Pelanggar Perlengkapan) memiliki anggota 1179 data dan C3 (Pelanggar Lampu) mempunyai anggota 331 data.

Pengujian Validasi

Pengujian ini dilakukan untuk mengetahui seberapa tepat data yang dikelompokkan dengan algoritma k-means. Pengujiannya adalah dengan menggunakan DBI (Davies Bouldin Index).

1. Cari nilai rata -rata dari masing -masing nilai cluster dengan rumus (Persamaan 3) Cluster 1

= 8,87788 + 4,45799 + 4,62712 + 1,54463 + 5,63311 + 8,87788 + 5,45004 7

= 5,63838

(9)

2. Hitung variance data dari masing – masing cluster dengan rumus (Persamaan 4) Cluster 1 var (x) = 1 7−1(8,87788 − 5,63838) 2+ (4,45799 − 5,63838)2+ (4,62712 − 5,63838)2+ (1,54463 − 5,63838)2+ (5,63311 − 5,63838)2+ (8,87788 − 5,63838)2+ (5,45004 − 5,63838)2= 6,699829

Hitung dengan rumus yang sama untuk C selanjutnya. 3. Cari R max dengan rumus (Persamaan 5)

R123 =6,699829 + 0,724652 + 7,775424

‖5,63838 − 6,53636 − 6,14633‖ = 2,15776

4. Hasil akhir adalah nilai DBI dari cluster dengan rumus (Persamaan 6), berikut perhitungannya :

𝐷𝐵𝐼 =1

3(2,15776) = 0,71925

Dengan pengujian DBI (Davies Bouldin Index) untuk hasil clustering seluruh data dapat di lihat pada tabel 8.

Tabel 8 Hasil DBI

Jumlah Cluster Nilai DBI

2 Cluster 0,873

3 Cluster 0,751

Hasil Anlisa

Setelah melakukan pengklusteran dan pengujian, maka dapat disimpulkan bahwa : 1. Dari tiga cluster yaitu cluster C1 (Pelanggar Rambu) dengan anggota data 861

dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 287, Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op.. C2 (Pelanggar Perlengkapan) dengan anggota data 1179 dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 281 (1 s/d 6), Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op.. C3 (Pelanggar Lampu) dengan anggota data 331 dihasilkan analisa daerah yang sering melanggar yaitu pada daerah Kecamatan Purwodadi dengan pasal yang di langgar : pasal 293 (1) (2), Jenis : SPM, Barang Bukti : STNK, Denda : Sub. 3 hr. Kur. Op..

2. Pengujian cluster 2 dan 3 diperoleh nilai pengujian DBI untuk cluster 2 yaitu 0,873 dan untuk cluster 3 yaitu 0,751, karena nilai DBI dari cluster 3 lebih kecil maka cluster tersebut bisa disebut optimal.

(10)

(Pelanggar Lampu) dengan anggota data 331.

3. Pengujian cluster 2 dan 3 diperoleh nilai pengujian DBI untuk cluster 2 yaitu 0,873 dan untuk cluster 3 yaitu 0,751, karena nilai DBI dari cluster 3 lebih kecil maka cluster tersebut bisa disebut optimal.

5. SARAN

Beberapa Saran guna pengembangan sistem dan anlisa agar menjadi lebih baik lagi, yaitu : 1. Jumlah sample data harus diperbanyak dan diukur prosentase akurasinya.

2. Perlu dilakukan pengujian dengan algoritma clustering yang lain seperti K-Means++ atau KNN

DAFTAR PUSTAKA

[1] P. N. Purwodadi, "Data-data Jumlah Perkara Dalam Tahun 2013 dan 2014 Pada Pengadilan Negeri Purwodadi," Purwodadi, 2013.

[2] F. E. M.Agustin, "Implementasi Algoritma K-Means Untuk Menentukan Kelompok Pengayaan Materi Mata Pelajaran Ujian Nasional (Studi Kasus : SMP Negeri 101 Jakarat)," Jurnal Tek nik

Informatik a, vol. 8, p. 1, 1 April 2015.

[3] N. Rohmawati, "Implementasi Algoritma K-Means Dalam Pengklasteran Mahasiswa Pelamar Beasiswa," Jurnal Ilmiah Tek nologi Informasi Terapan, vol. 1, p. 3, 10 Agustus 2015.

[4] F. E. M.Agustin, "Implementasi Algoritma K-Means Untuk Menentukan Kelompok Pengayaan Materi Mata Pelajaran Ujian Nasional (Studi Kasus : SMP Negeri 101 Jakarta)," vol. 8, p. 1, 1 April 2015.

Gambar

Gambar  1 Desain Penelitian  Algoritma K-Means
Tabel  1 Data Sample
Tabel  4 Keanggotaan  Cluster Iterasi  ke-3
Gambar  2 Kotak Dialog  Open Untuk Membuka File  Yang Diinginkan
+2

Referensi

Dokumen terkait

Berdasarkan perspektif teori kultivasi media, terdapat perbedaan dimensi brand personality antara pemirsa yang sering menonton dengan yang jarang menonton

Namun pada indikator-indikator lain, selalu ada jawaban negatif dari responden yang berarti beberapa pustakawan memang merasa belum puas dengan kondisi motivasi yang sudah

Hasil yang diperoleh menunjukkan aplikasi matriks sediaan transdermal daun angsana ( Pterocarpus indicus Willd.) dalam dosis 2,88 mg/cm 2 dan 5,77 mg/cm 2 dengan enhancer

Mengacu pada tabel 1 hasil pengukuran suhu, kelembaban dan pencahayaan dengan angka kuman lantai ruangan sebelum dan sesudah desinfeksi dengan menggunakan desinfektan fenol

Adapun untuk akibat hukum yang ditimbulkan dari tidak diterapkannya kafa‟ah dalam pernikahan, berdasarkan dengan keadaan masyarakat yang telah ditemukan dalam

Salisburry and Ross (1995) menyatakan sitokinin mampu memperlambat penuaan daun dengan cara mempertahankan keutuhan membran tonoplas, sehingga proses fotosintesis tanaman gandum

Sudah 100 b Apakah telah digunakan standard, teknik, dan tool dalam pengadaan, pengembangan, dan pemeliharaan database atau data war 100 c Apakah pengelolaan proyek

EPIC Rate yang diperoleh yaitu 3,66 yang masih dapat ditingkatkan menjadi 4,285 yang berada pada rentang skala sangat efektif dengan meningkatkan nilai skor