• Tidak ada hasil yang ditemukan

Implementasi Particle Swarm Optimization pada K-Means untuk Clustering Data Automatic Dependent Surveillance- Broadcast

N/A
N/A
Protected

Academic year: 2018

Membagikan "Implementasi Particle Swarm Optimization pada K-Means untuk Clustering Data Automatic Dependent Surveillance- Broadcast"

Copied!
6
0
0

Teks penuh

(1)

Implementasi

Particle Swarm Optimization

pada K-Means

untuk

Clustering

Data

Automatic Dependent

Surveillance-Broadcast

Achmad Saiful1, Joko Lianto Buliali2

Departemen Informatika, Institut Teknologi Sepuluh Nopember Surabaya Jl. Teknik Kimia - Gedung Informatika ITS Surabaya, Telp. 031-5939212

e-mail: 1achmads123@gmail.com, 2joko@cs.its.ac.id

Abstrak

Investigasi kecelakaan penerbangan di Indonesia pada tahun 2010 sampai 2016 sebesar 212 investigasi. Hal tersebut dapat dihindari apabila ada sistem penerbangan yang dapat memastikan penerbangan berjalan aman, seperti sistem lalu lintas udara yang dapat mendeteksi apabila pesawat bergerak menuju ke arah yang salah. Penelitian ini bertujuan untuk mengelompokkan rute penerbangan pada data Automatic Dependent Surveillance-Broadcast menggunakan metode clustering untuk mendapatkan similaritas rute penerbangan. Penulis mengusulkan metode particle swarm optimization untuk mengoptimalkan metode k-means, yang berguna untuk menentukan titik centroid awal dengan silhouette coefficient sebagai fitness function. Hasil dari penelitian ini menghasilkan zona terbang berdasarkan kebiasaan sehingga dapat digunakan sebagai panduan penerbangan. Pengujian dilakukan dengan membandingkan nilai Davies-Bouldin index dengan metode k-means, k-medoids dan fuzzy c-means. Pada uji coba yang dilakukan, metode yang diusulkan menjadi kelompok metode terbaik pada lima dari enam segmen yang ada serta menghasilkan nilai Davies-Bouldin index lebih baik pada satu segmen sebesar 0,779.

Kata kunci: Clustering, K-Means, Particle Swarm Optimization, Davies-Bouldin Index.

Abstract

There are 212 investigations on aviation accident from 2010 to 2016 in Indonesia. The accidents can be avoided by providing a flight system that can ensure safety, such as air traffic systems that able to detect the movement of the plane in the wrong direction. This research clusters the data from the Automatic Dependent Surveillance-Broadcast (ADS-B) using clustering method to get the similarities of the flight route and proposes particle swarm optimization to determine the initial cluster in order to get the optimum of k-means and k-medoids. Output of this research produce flight zones based on habits that can be used as flight guides. The test is done by comparing davies-bouldin index values with k-means, k-medoids and fuzzy c-means method. Based on the experiments, the proposed method becomes the best group method on five of six existing segments and obtains better davies-bouldin index values (0,779) on one segment.

Keywords: Clustering, K-Means, Particle Swarm Optimization, Davies-Bouldin Index.

1. Pendahuluan

Berdasarkan investigasi yang dilakukan oleh Komite Nasional Keselamatan Kerja (KNKT), kecelakaan penerbangan dari tahun 2010 hingga 2016 sebesar 212 investigasi. Hal tersebut seharusnya tidak terjadi dikarenakan setiap tahapan yang dilakukan pada dunia penerbangan dilaporkan dengan baik. Untuk menghindari hal tersebut diperlukan suatu sistem penerbangan yang dapat mengurangi kecelakaan, seperti sistem yang dapat mendeteksi apabila pesawat bergerak menuju ke arah yang salah.

(2)

k-means dengan studi kasus pada penerbangan dan karya Pusadan, et all [4] meneliti tentang penentuan waypoint yang optimal berdasarkan kebiasaan data yang akan digunakan sebagai deteksi anomali suatu penerbangan.

Berdasarkan data dan penelitian di atas, penelitian ini melakukan pengelompokan rute penerbangan berdasarkan kebiasaan data dari penerbangan yang ada. Pengelompokan dilakukan dengan menggunakan metode clustering berbasis jarak yaitu k-means clustering. K-means clustering adalah suatu algoritma pengelompokan data berdasarkan kedekatan jarak dengan titik utamanya atau centroid sehingga menghasilkan beberapa kelompok data tertentu [5]. Kelemahan dari k-means clustering adalah penetapan titik centroid awal ditentukan secara acak. Untuk mengatasi kelemahan tersebut, digunakan particle swarm optimization [6] dengan fitness function silhoutte coefficient untuk menentukan titik centroid awal. Hasil dari pengelompokan tersebut berupa zona terbang berdasarkan kebiasaan data yang ada sehingga dapat menjadi panduan penerbangan.

Data yang digunakan adalah rute Surabaya-Palu dengan kode penerbangan LNI860. Implementasi metode dilakukan pada tiap segmen yang terbagi berdasarkan waypoint, Evaluasi cluster berdasarkan pengukuran internal validity cluster menggunakan Davies-Bouldin index. Pengujian dilakukan dengan 10 variasi dari 70% data yang dipilih secara acak, setiap variasi akan dilakukan percobaan sebanyak 50 kali percobaan dan dibandingkan dengan metode k-means, k-medoids serta fuzzy c-means.

2. Metodologi Penelitian 2.1. Pre-Processing

Penelitian ini dimulai dengan memilih data latitude dan longitude dengan ketinggian yang tetap. Data yang digunakan adalah data penerbangan rute Surabaya-Palu pada bulan September, November dan Desember sebanyak 90 penerbangan. Pada Tabel 1 merupakan sampel data nomor 80-85 pada satu penerbangan pada ketinggian 33000, jumlah data dan ketinggian tetap pada tiap penerbangan berbeda-beda.

Tabel 1. Sampel data satu penerbangan pada ketinggian 33000.

1 Timestamp, UTC, Callsign, Position, Altitude, Speed, Direction

80 1481275496, 2016-12-09T09:24:56Z, LNI860, "-1.968554,118.71978", 33000, 447,35 81 1481275433, 2016-12-09T09:23:53Z, LNI860, "-2.074182,118.64505", 33000, 447,35 82 1481275344, 2016-12-09T09:22:24Z, LNI860, "-2.221473,118.541153", 33000, 448,35 83 1481275270, 2016-12-09T09:21:10Z, LNI860, "-2.349072,118.450943", 33000, 448,35 84 1481275076, 2016-12-09T09:17:56Z, LNI860, "-2.67424,118.221367", 33000, 444,35 85 1481275015, 2016-12-09T09:16:55Z, LNI860, "-2.778656,118.147591", 33000, 445,35

(3)

Gambar 1. Visualisasi data awal.

2.2. Implementasi Particle Swarm Optimization pada K-means

Implementasi particle swarm optimization [7] pada k-means berfungsi untuk menentukan titik centroid awal dari k-means yang sebelumnya ditentukan secara acak. Fitness function yang digunakan berdasarkan nilai silhouette coefficient [8].

Tahapan pertama yang dilakukan adalah menentukan titik centroid secara acak serta mengelompokkan data pada titik centroid terdekat. kemudian dalam setiap iterasinya, dihitung fitness function menggunakan dari cluster yang terbentuk tersebut menggunakan silhouette coefficient berikut:

𝑏(𝑖) = min

𝑑

∑𝑁𝑗=1,𝑗≠𝑖𝑐𝑛𝑜𝑡 𝑖 𝑑(𝑖, 𝑗) 𝑁𝑐𝑖

(1)

𝑎(𝑖) = 𝜇𝑖=

∑𝑁𝑗=1,𝑗≠𝑖𝑐𝑖 𝑑(𝑖, 𝑗) 𝑁𝑐𝑖

(2)

𝑠(𝑖) = max{𝑎(𝑖),𝑏(𝑖)}𝑏(𝑖)−𝑎(𝑖) , −1 ≤ 𝑠(𝑖) ≤ 1 (3)

Keterangan dari rumus tersebut adalah:

𝑑(𝑖, 𝑗) = jarak eulcidean distance antara titik 𝑖 dengan 𝑗

𝑁𝑐𝑖 = jumlah data pada cluster 𝑖

Kemudian hitung local best menggunakan persamaan (4) dan hitung global best menggunakan persamaan (5).

𝑙𝑜𝑐𝑎𝑙𝑏𝑒𝑠𝑡(𝑐) = max

𝑖=1,2,…,𝑛𝑐𝑠(𝑖) (4)

𝑔𝑙𝑜𝑏𝑎𝑙𝑏𝑒𝑠𝑡 = max

𝑖=1,2,…,𝑐𝑙𝑜𝑐𝑎𝑙𝑏𝑒𝑠𝑡(𝑖) (5)

Setelah itu hitung kecepatan 𝑣 menggunakan persamaan (6) dan hitung partikel 𝑥 berdasarkan kecepatan menggunakan (7). Iterasi berhenti apabila jumlah iterasi sudah melalui batas maksimal iterasi, iterasi yang digunakan penulis sebesar 15 iterasi.

𝑣𝑖𝑘= 𝑣𝑖𝑘+ 𝑐1 𝑟1 (𝑙𝑜𝑐𝑎𝑙𝑏𝑒𝑠𝑡𝑖𝑘− 𝑥𝑖𝑘) + 𝑐2 𝑟2 (𝑔𝑙𝑜𝑏𝑎𝑙𝑏𝑒𝑠𝑡𝑖𝑘), 𝑐1= 0.005, 𝑐2= 0.005 (6)

𝑥𝑖𝑘 = 𝑥𝑖𝑘+ 𝑣𝑖𝑘 (7)

(4)

Gambar 2. Flowchart tradisional K-means. Gambar 3. FlowchartParticle Swarm Optimization.

2.3. Evaluasi

Setelah proses pengelompokan selesai dilakukan kemudian dihitung nilai kualitas cluster yang terbentuk menggunakan pengukuran internal validitas clusterDavies-Bouldin [9] berikut:

𝐷𝐵(𝑐) = 1𝐿 ∑ max𝑖≠𝑗 {∆(𝑐𝛿(𝑐𝑖) + ∆(𝑐𝑗)

𝑖, 𝑐𝑗) } 𝐿

𝑖=1

(8)

Dimana ∆(𝑐𝑖) adalah similaritas antar cluster/jarak rata rata semua titik ke centroid. 𝛿(𝑐𝑖, 𝑐𝑗) adalah perbedaan antar cluster atau jarak dari centroidclusteri ke centroidclusterj.

3. Hasil dan Analisis 3.1. Pengujian Metode

Pengujian dilakukan sebanyak 500 kali dengan 10 variasi data set. Variasi data set yang dimaksud adalah 70% dari data set yang diacak secara random pada setiap 50 kali pengujian. Metode yang diusulkan dibandingkan dengan metode tradisional k-means, tradisional k-medoids dan fuzzy c-means.

Pengujian dilakukan pada segmen dua sampai segmen tujuh karena pada segmen satu tidak dalam posisi crusing (mengalami perubahan ketinggian). Dalam pengujian ini didapatkan hasil evaluasi cluster berdasarkan nilai Davies-Bouldin index.

3.2. Analisis Hasil Evaluasi Cluster

Analisis hasil evaluasi cluster dilakukan untuk mendapatkan metode yang terbaik di antara yang lain, metode yang digunakan untuk analisis adalah metode uji statistik one-wayanalysis of variance (one-way anova). Hipotesis awal dari one-way anova adalah ada perbedaan di antara metode yang digunakan. Contohnya pada segmen 6, hasil perhitungan anova pada Tabel 3 menghasilkan nilai p-value sebesar 2,51e-244, hal tersebut menunjukkan bahwa hipotesis bernilai benar, karena nilai yang dihasilkan di bawah threshold yaitu 0.05.

Tabel 3. Hasil Analysis of Variance pada segmen 6.

(5)

Error 0,9458 3493 0,0002

Total 1,3128 3499

Setelah hipotesis awal memenuhi maka dilakukan uji statistik lanjut menggunakan tukey-kramer method dimana hasil dari metode tersebut berupa kelompok metode terbaik dan satu metode terbaik berdasarkan nilai Davies-Bouldin index. Hasil tukey-kramer method pada Gambar 4 menunjukkan bahwa pada segmen 6 terbentuk 3 kelompok metode terbaik yaitu metode k-means dan pso-kmeans sebagai kelompok metode terbaik, dengan metode yang diusulkan menjadi metode terbaik dengan nilai Davies-Bouldin index sebesar 0.779. Keseluruhan hasil analisis mulai dari segmen 2 sampai segmen 7 dapat dilihat pada Tabel 2.

Gambar 4. Hasil tukey-kramer method pada segmen 6.

Hasil metode terbaik pada Tabel 4 dijadikan dasar untuk mengelompokkan rute penerbangan pada segmen 2 sampai segmen 7. Hasil cluster berupa zona terbang pada Gambar 5 yang membagi menjadi 3 zona yang dapat digunakan sebagai panduan penerbangan atau deteksi anomali. Pada Gambar 5 warna hijau menandakan zona tersebut paling banyak dilalui oleh pesawat, warna biru menandakan zona terbanyak kedua yang dilalui oleh pesawat dan yang terakhir yaitu warna merah, zona yang jarang dilalui oleh pesawat.

Tabel 4. Keseluruhan hasil analisis.

Segmen Kelompok Metode Terbaik Metode Terbaik Davies-Bouldin index

Segmen 2 K-means

Particle swarm optimization k-means Fuzzy c-means

K-means 0.668

Segmen 3 Fuzzy c-means Fuzzy c-means 0,803

Segmen 4 Fuzzy c-means

K-means

Particle swarm optimization k-means

Fuzzy c-means 0,685

Segmen 5 Fuzzy c-means

K-means

Particle swarm optimization k-means

Fuzzy c-means 0,683

Segmen 6 Particle swarm optimization k-means K-means

Particle swarm optimization k-means

0,779

Segmen 7 K-means

Particle swarm optimization k-means

K-means 0,850

(6)

4. Kesimpulan

Berdasarkan pada uji coba dan analisis yang dilakukan, optimasi pada k-means menggunakan particle swarm optimization dengan fitness function silhouette coefficient berhasil dilakukan. Hal tersebut dapat dilihat pada pengelompokan pada Automatic Dependent Surveillance-Broadcast (ADS-B), metode tersebut menjadi kelompok metode terbaik pada lima dari enam segmen yang ada serta menghasilkan nilai Davies-Bouldin index lebih baik pada satu segmen dibandingkan dengan metode k-means, k-medoids dan fuzzy c-means sebesar 0.779.

Daftar Pustaka

[1] H. Wang and R. Wen, "Analysis of Air Traffic Network of China," in 24th Chinese Control and Decision Conference (CCDC), Taiyuan, China, 2012.

[2] J. DeArmon, C. Taylor, T. Masek and C. Wanke, "Air Route Clustering for a Queuing Network Model of the," in 14th AIAA Aviation Technology, Integration, and Operations Conference, Atlanta, GA, 2014.

[3] O. Ossama, H. M. Mokhtar and M. E. El-Sharkawi, "An Extended K-means Technique for Clustering," Egyptian Informatics Journal, vol. 12, no. 1, pp. 45-51, 2011.

[4] M. Y. Pusadan, J. L. Buliali and R. V. H. Ginardi, "Anomaly Detection of Flight Routes through Optimal Waypoint," Journal of Physics: Conference Series, vol. 801, no. 1, 2017.

[5] P. Kaur, "Outlier Detection Using Kmeans and Fuzzy Min Max Neural Network in Network Data," in International Conference on Computational Intelligence and Communication Networks (CICN), Tehri, India, 2016.

[6] Tan, Long, “A Clustering K-means Algorithm Based on Imporved PSO Algorithm”, in International Conference on Communication Systems and Network Technologies, Gwalior, India, 2015.

[7] Dhote, C. A., Anuradha D. Thakare and Shruti M. Chaudhari, “Data Clustering using Particle Swarm

Optimization and Bee Algorithm” in International Conference on Computing, Communications and Networking Technologies (ICCCNT), Tiruchengode, India, 2013

[8] Li, Ting, Peng Ye and Shikai Zheng, “State Grid Office System User Clustering Analysis based on K-means Algorithm”, in IEEE 3rd International Conference on Big Data Analysis (ICBDA), Shanghai, China, 2018.

Gambar

Tabel 2. Waypoint Surabaya-Palu.
Gambar 1. Visualisasi data awal.
Gambar 2. Flowchart tradisional K-means.
Tabel 4. Keseluruhan hasil analisis.

Referensi

Dokumen terkait

Berdasarkan data primer yang diperoleh melalui pengamatan lapangan dan data-data sekunder yang didapatkan dari literatur dan instansi terkait maka dilakukan

dengan perhitungan dan jenis plat, serta tombol bersihkan layar untuk membersihkan output apabila user ingin mengubah input data yang berbeda dari input data sebelumnya.

Sesuai dengan Program Seksi Bapa GKPS Cikoko Tahun 2015, yaitu untuk meningkatkan pertumbuhan rohani Anggota Seksi Bapa GKPS Cikoko melalui Pembelajaran Firman Tuhan, maka

Pada sisi kanan Tebing Hanyawong terdapat Gua terbuka dengan aliran Sungai Cibitung yang mengalir di dasar penampangnya.. Jika anda menyusuri gua ini emnuju ke arah hulu, anda

Berdasarkan hasil analisis dalam penelitian ini, literasi, inklusi dan tata kelola wakaf merupakan faktor positif dan signifikan yang memengaruhi preferensi publik

Angket adalah pengumpulan data yang berupa daftar pertanyaan tertulis yang digunakan untuk memperoleh keterangan dari sejumlah responden. Dalam penelitian ini metode

Optimasi centroid K-means menggunakan Ant Lion Optimizer belum bisa meningkatkan performa penge- lompokan data pada semua segmen karena similaritas data yang

Penurunan kasus Penyakit yang Dapat Dicegah Dengan Imunisasi (PD3I) tertentu sebesar 40%. Kab/Kota yang mampu melaksanakan kesiapsiagaan dalam penanggulangan