Implementasi Data Mining Clustering Tingkat Kepuasan
Konsumen Terhadap Pelayanan Go-Jek
Sinta Maria Sinaga
1,Jaya Tata Hardinata
2,M.Fauzan
31,2,3
STIKOM Tunas Bangsa, Pematangsiantar, Sumatera Utara, Indonesia
Jln. Sudirman Blok A No. 1-3 Pematangsiantar, Sumatera Utara
1
mariasintaa@gmail.com,
2jayatatahardinata@gmail.com,
3mfauzan57@yahoo.com
Abstract
Increasingly high demands for mobility in today's society, activities are also increasingly crowded, especially parents, employees, and even students so it is increasingly difficult to find free time to meet the needs of daily life. So that people need something that can answer and be a solution to the complaint without having to drain time and energy with results that do not disappoint. Gojek is a solution to the complaints of people who do not have much free time and want to relax while waiting for their needs to be met, Gojek is an online application that can be downloaded via a smartphone, has more than six services provided therein but the author only takes some of the services to be standard the level of community satisfaction with Gojek services. The purpose of this study was to determine the level of community satisfaction with Gojek services. One method contained in Data Mining used in this study is the Clustering method. To find out the level of community satisfaction done with interviews / questionnaires 120 people in the city of Pematangsiantar. The benefits are to make it easier for Gojek companies to know how the quality of services provided to the community is based on the level of community satisfaction and improve the quality of services provided to the community.
Keywords: Service Quality, Data Mining, K-Means, Clustering, Gojek
Abstrak
Semakin tingginya tuntutan mobilitas masyarakat di jaman sekarang ini, aktivitas juga semakin padat terutama orangtua, karyawan, bahkan pelajar sehingga semakin sulit menemukan waktu luang untuk memenuhi kebutuhan hidup sehari-harinya. Sehingga masyarakat membutuhkan sesuatu yang bisa menjawab serta menjadi solusi atas keluhan tersebut tampa harus menguras waktu dan tenaga dengan hasil yang tidak mengecewakan . Gojek adalah solusi dari keluhan masyarakat yang tidak memiliki banyak waktu luang dan ingin bersantai sambil menunggu kebutuhan mereka dipenuhi, Gojek merupakan sebuah aplikasi online yang dapat di download melalui smartphone, memiliki lebih dari enam layanan yang disediakan didalamnya namun penulis hanya mengambil sebagian layanan untuk dijadikan standar tingkat kepuasan masyarakat terhadap pelayanan Gojek. Tujuan dari penelitian ini untuk mengetahui tingkat kepuasan masyarakat terhadap pelayanan Gojek. Salah satu metode yang terdapat dalam Data Mining yang digunakan dalam penelitian ini adalah metode Clustering (Pengelompokkan). Untuk mengetahui tingkat kepuasan masyarakat dilakukan dengan wawancara/ kuisioner 120 masyarakat di kota Pematangsiantar. Manfaatnya untuk mempermudah perusahaan Gojek mengetahui bagaimana kualitas pelayanan yang diberikan kepada masyarakat berdasarkan tingkat kepuasan masyarakat dan meningkatkan kualitas pelayanan yang diberikan kepada masyarakat.
1.
Pendahuluan
Perkembangan IPTEK (ilmu pengetahuan dan teknologi) menjadikan Data
Mining menjadi alat yang semakin penting untuk mengubah data menjadi
informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti
pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Dan telah
digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk
menyaring jumlah data seperti catatan perjalanan penumpang penerbangan, data
sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining K-Means Clustering adalah suatu
metode penganalisaan data atau metode Data Mining yang melakukan proses
pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang
melakukan pengelompokan data dengan sistem partisi. kemampuan data mining
saat ini sangat membantu banyak perusahaan untuk mencari informasi bisnis yang
berharga dari basis data yang besar ataupun kecil, kemampuan data mining
dipakai untuk memprediksi trend dan sifat-sifat bisnis, dimana data mining
‘’menyapu’’ basis data kemudian mengindentifikasikan pola-pola yang
sebelumnya tersembunyi dalam satu sapuan.
Seiring dengan pertumbuhan teknologi informasi membuka peluang terhadap
pertumbuhan data yang terakumulasi dalam jumlah besar namun belum tentu
semua data yang ada memiliki nilai dan tervalidasi kebenarannya. Untuk dapat
memfasilitasi seluruh data tersebut, dibutuhkan sesuatu untuk memproses seluruh
data. Selama ini banyak perusahaan telah mengumpulkan data sekian tahun
lamanya termasuk perusahaan GOJEK yang dimana data kepuasan konsumen
(rating) terhadap pelayanan yang diberikan pihak perusahaan dan hanya
berpatokan pada rating yang diberikan konsumen pada aplikasi yang tersedia
untuk mengatahui kualitas pelayanan yang diberikan. Tetapi tidak melakukan
mengelompokkan rating berdasarkan tingkat kepuasan yang sama untuk
mengetahui secara jelas tingkatan kepuasan kemudian data diolah menjadi suatu
informasi yang berguna untuk sesuatu hal yang memiliki nilai tambah untuk
perusahaan sehingga dibutuhkan sesuatu untuk mengolah pembagian kelas
berdasarkan tingkatan kepuasan konsumen.
Maka perlu menerapkan metode Data Mining Clustering sehingga
menghasilkan suatu informasi yang penting serta menjadi solusi. Data yang telah
dikumpulkan akan diolah menggunakan Data Mining untuk mengetahui tingkat
kepuasan masyarakat terhadap pelayanan yang diberikan. Data Mining yang
digunakan
dalam
penelitian ini adalah metode
K-Means
Clustering
(Pengelompokkan) sehingga jelas diketahui bagaimana kualitas pelayanan yang
diberikan kepada konsumen berdasarkan hasil akhir data yang telah diolah.
Berdasarkan permasalahan yang terjadi maka penulis mengangkat judul
“Implementasi Data Mining Clustering Tingkat Kepuasan Konsumen Terhadap
Pelayanan Gojek Menggunakan K-Means ”. Seluruh data yang ada akan diolah
melalui metode K-Means sehingga mempermudah perusahaan GOJEK
mengetahui bagaimana kualitas pelayanan yang diberikan kepada masyarakat di
kota Pematangsiantar berdasarkan hasil akhir yang diperoleh berdasarkan
tingkatan kepuasan masyarakat.
2. Metodologi Penelitian
2.1. Data Mining
Data mining adalah serangkaian proses untuk menggali nilai tambah terutama informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang dihasilkan dengan cara mengekstraksi dan mengenali pola yang penting atau menarik data dari yang terdapat basis data. Data Mining digunakan untuk mencari pengetahuan yang terdapat pada basis data yang besar sehingga sering disebut Knowledge Discovery Databases (KDD) [1][2].
[3] Data Mining adalah suatu proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari sekumpulan data besar yang membantu dalam penggambilan keputusan.
2.2. Clustering
Clustering adalah suatu metode penganalisaan data atau metode Data Mining yang
melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Clustering (pengelompokan data) mempertimbangkan sebuah pendekatan penting untuk mencari kesamaan dalam data dan menempatkan data yang sama kedalam kelompok-kelompok. Clustering membagi kumpulan data ke dalam beberapa kelompok dimana kesamaan dalam sebuah kelompok adalah lebih besar daripada diantara kelompok-kelompok [4][5]. 2.3. Metode K-Means
K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Metode k-means berusaha mengelompokkan data yang ada kedalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya [6][7]
3. Hasil Dan Pembahasan
Penelitian ini menggunakan data mining metode K-means Clustering, Pada tahap ini dilakukan analisa data hasil kuisioner tingkat kepuasan konsumen Gojek di Kota Pematangsiantar dengan tool Rapidminer. Rapidminer adalah sebuah software pilihan untuk melakukan ekstraksi data dengan metode-metode data mining. Berikut adalah data penilaian konsumen yang diperoleh penulis melalui wawancara dan kuesioner. Berikut ini adalah data hasil dari kuesioner 120 konsumen Gojek yang ada di Kota Pematangsiantar:
Tabel 1. Data Hasil Kuisioner Pengguna Gojek
Responden Kualitas Harga Kepuasan Word Of Mouth
1 4 3 4 5 2 4 3 3 5 3 3 4 4 4 4 4 5 4 5 5 4 4 3 4 6 5 4 4 5 7 4 3 2 5 8 3 4 2 5 9 4 5 4 5 10 4 3 4 5
Responden Kualitas Harga Kepuasan Word Of Mouth 11 5 4 3 4 12 4 3 4 4 13 4 4 4 5 14 4 3 4 5 15 3 4 4 4 16 4 4 5 4 17 5 4 4 4 … … … … … … … … … … … … … … … 116 3 3 3 3 117 3 4 3 4 118 5 3 4 4 119 4 4 3 3 120 3 4 4 4
Berikut ini langkah- langkah perhitungan metode K-means Clustering. a) Pertama menentukan Jumlah cluster dan Centorid.
Data tersebut akan masuk ke tahapan clustering dengan menerapkan algoritma
K-Means menggunakan rapidminer untuk mengcluster data menjadi dua cluster. Data yang
sudah dipilih akan dimasukkan kedalam tool rapidminer. Kemudian Dalam penerapan algoritma K-Means dihasilkan nilai titik tengah atau centroid dari data yang didapat dengan ketentuan bahwa clusterisasi yang diinginkan adalah 2, Penentuan cluster dibagi menjadi 2 bagian yaitu cluster tingkat tinggi (C1), cluster tingkat rendah (C2). Penentuan titik cluster ini dilakukan dengan mengambil nilai terbesar (maksimum) untuk cluster tingkat tinggi (C1), nilai terkecil (minimum) untuk cluster tingkat rendah (C2). Nilai titik tersebut dapat kita ketahui pada tabel berikut ini :
Tabel 2. Tabel nilai Centroid
Nilai Centroid tertinggi 5 5 5 5 Nilai Centroid awal 3 3 2 3 b) Menghitung Jarak dari Centroid.
Untuk menghitung jarak antara titik Centroid dengan titik tiap objek menggunakan
Euclidian Distance. Rumus untuk menghitung jarak dari Centroid adalah :
Maka perhitungan untuk jarak dari Centroid ke-1 adalah sebagai berikut DA1,c1 = = 2,4494 DA2,c1 = = 3 DA3,c1 = = 2,6457
Dan selanjutnya sampai dengan DA120,c1 . Kemudian untuk perhitungan jarak dari
Centroid ke-2 adalah sebagai berikut :
DA1,c2 =
= 3 DA2,c2 =
DA3,c2 =
= 2,4494
Dan seterusnya sampai dengan DA120,c2. Sehingga didapat tabel jarak dari Centroid dan
mencari nilai minimal dari kedua centroid. Tabel jarak dari centroid dapat dilihat pada table berikut ini :
Tabel 3. Tabel nilai Centroid
C1 C2 Jarak Terpendek 2,449489743 3 2,449489743 3 2,449489743 2,449489743 2,645751311 2,449489743 2,449489743 1,414213562 3,605551275 1,414213562 2,645751311 2 2 1,414213562 3,605551275 1,414213562 3,741657387 2,236067977 2,236067977 3,741657387 2,236067977 2,236067977 1,414213562 3,605551275 1,414213562 2,449489743 3 2,449489743 2,449489743 2,645751311 2,449489743 2,645751311 2,449489743 2,449489743 1,732050808 3,16227766 1,732050808 2,449489743 3 2,449489743 2,645751311 2,449489743 2,449489743 1,732050808 3,464101615 1,732050808 1,732050808 3,16227766 1,732050808 2,645751311 2,449489743 2,449489743 3,16227766 1,732050808 1,732050808 2,645751311 2,449489743 2,449489743 2,645751311 2,449489743 2,449489743 3,16227766 1,732050808 1,732050808 2,645751311 2,449489743 2,449489743 3,16227766 1,732050808 1,732050808 2,645751311 2,449489743 2,449489743 3,16227766 1,732050808 1,732050808 3 2,828427125 2,828427125 1,414213562 3,872983346 1,414213562 … … … … … … 3,605551275 1,414213562 1,414213562 2,645751311 2,449489743 2,449489743 3,605551275 2 2 4 1 1 3,16227766 1,732050808 1,732050808 2,449489743 3 2,449489743 3,16227766 1,732050808 1,732050808 2,645751311 2,449489743 2,449489743 c) Menentukan Cluster atau Pengelompokkan
Dalam menentukan Cluster dengan nilai Cluster berdasarkan nilai yang sama dari nilai
Cluster dan diletakkan pada Cluster yang sesuai dengan nilai sama pada Iterasi 1.
Selanjutnya dalam metode K-Means, perhitungan berhenti apabila Cluster pada iterasi yang dihasilkan sama pada iterasi sebelumnya. Maka selanjutnya mencari Cluster pada iterasi selanjutnya sampai nilai iterasinya sama.
Tabel 4. Tabel hasil Clustering C1 C2 1 1 1 1 1 1 1 1 1 1 … … … … 1 1 1 1 1 1 1 43 77
Dari tabel Cluster Iterasi ke-1 memiliki nilai Cluster yang sama atau tidak berubah pada
cluster terakhir maka perhitungan distop dan hasil yang diperoleh yaitu : Cluster 1 (C1)
mendapatkan 120 Responden dalam artian bahwa kelompok pertama termasuk kategori Seluruh responden merasa puas dengan Pelayanan Gojek.
Gambar 1. Grafik clustering
Berdasarkan hasil dari percobaan dalam pengujian data menggunakan aplikasi Rapidminer berhasil menunjukkan hasil yang sama dengan penerapan perhitungan manual K-Means dari Microsoft Excel sebanyak 120 konsumen dengan hasil cluster tertinggi 43 konsumen merasa puas dengan pelayanan yang diberikan perusahaan Gojek sedangkan cluster terendah sebanyak 77 konsumen yang merasa tidak puas. Berdasarkan hasil akhir dari data yang diperoleh disimpulkan bahwa konsumen Gojek di Kota Pematangsiantar lebih banyak merasa tidak puas dengan pelayanan yang diberikan.
4. Kesimpulan
Berdasarkan hasil dari penelitian dan pembahasan tingkat kepuasan konsumen
Gojek di Kota Pematangsiantar dengan menggunakan metode K-Means Clustering
maka didapat kesimpulan sebagai berikut:
a) Pada hasil perhitungan akhir, Centroid tertinggi (C1) adalah 43 sedangkan
Centroid terendah (C2) adalah 77.
b) Berdasarkan hasil dari penelitian 120 konsumen Gojek Di Kota
Pematangsiantar yang merasa puas sebanyak 43 konsumen dan 77
konsumen merasa tidak puas.
c) Berdasarkan perhitungan manual dan aplikasi rapidminer hasilnya sama.
Daftar Pustaka
[1] A. P. Windarto, “Implementation Of Data Mining On Rice Imports By Major Country Of Origin Using Algorithm Using K-Means Clustering Method,” Int. J.
Artif. Intell. Res., Vol. 1, No. 2, Pp. 26–33, 2017.
[2] Linda Maulida, “Penerapan Datamining Dalam Mengelompokkan Kunjungan Wisatawan Ke Objek Wisata Unggulan Di Prov. Dki Jakarta Dengan K-Means,”
Jiska (Jurnal Inform. Sunan Kalijaga), Vol. 2, No. 3, Pp. 167–174, 2018.
[3] Nurdin And D. Astika, “Penerapan Data Mining Untuk Menganalisis Penjualan Barang Dengan Pada Supermarket Sejahtera,” Techsi, Vol. 6, No. April, Pp. 134– 155, 2015, Doi: 10.3389/Fnsys.2011.00002.
[4] S. Agustina, D. Yhudo, H. Santoso, N. Marnasusanto, A. Tirtana, And F. Khusnu, “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan Metode K-Means Algoritma,” Clust. K-Means, Pp. 1–7, 2012.
[5] R. A. Asroni, “Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika Umm Magelang,” Ilm. Semesta Tek., Vol. 18, No. 1, Pp. 76– 82, 2015, Doi: 10.1038/Hdy.2009.180.
[6] Y. R. Nasution Et Al., “Penerapan Algoritma K-Means Clustering Pada Aplikasi Menentukan Berat Badan Ideal,” Vol. 6341, No. April, Pp. 77–81, 2018.
[7] B. R. C.T.I. Et Al., “Implemetasi K-Means Clustering Pada Rapidminer Untuk Analisis Daerah Rawan Kecelakaan,” Semin. Nas. Ris. Kuantitatif Terap. 2017, No. April, Pp. 58–60, 2017.