PENERAPAN DATA MINING PENGELOMPOKAN JAMINAN HARI TUA (JHT) BERDASARKAN WILAYAH DALAM MASA PANDEMI (STUDI
KASUS : BPJS KETENAGAKERJAAN CABANG LANGKAT)
Tata Mustika Dewi1), Rusmin Saragih2), Siswan Syahputra3)
Mahasiswa Program Studi Sistem Informasi, STMIK KAPUTAMA Binjai Jl.Veteran No. 4A-9A, Binjai 20714, Sumatra Utara
www.kaputama.ac.id // e-mail: info@kaputama.ac.id
ABSTRACT
During the COVID-19 pandemic, many companies experienced a decline or went bankrupt, so they had to reduce the number of workers and even close the company. BPJS Ketenagakerjaan is a public legal entity that is responsible to the president and functions to administer four programs, namely Work Accident Insurance (JKK), Death Insurance (JKM), Old Age Security (JHT), with the addition of the Pension Guarantee program (JP). One of them is the submission of claims from too many participants of the Old Age Security program from various regions, especially the Langkat sub-district, so that it becomes a big problem to provide good service or information for the participants. For this reason, the author tries to create a system to support a computerized grouping process that can help automatically classify JHT claims by region, so there is an opportunity to design a grouping data mining system in it. Data mining is a process of mining data in very large amounts of data using statistical, mathematical methods, to utilizing the latest artificial intelligence technology. Clustering is a method that is applied in creating a grouping data mining system to make it easier for employees to group JHT by region. Based on the analysis that has been done in the grouping of old-age insurance data using the clustering method, it is necessary to do the cluster process several times to get the same results according to the process that was first carried out, namely in cluster 1 : 2 3 2 cluster 2 : 2 8 2, cluster 3 : 2 13 2 with 545 data in cluster 1, 308 data in cluster 2 and 421 data in cluster 3.
Keywords: Data Mining, Clustering, Old Age Security, Region.
ABSTRAK
Pada masa pandemi covid19 banyak perusahaan yang mengalami penurunan atau kebangkrutan sehingga harus mengurangi jumlah tenaga kerja bahkan menutup perusahaan. BPJS Ketenagakerjaan adalah suatu badan hukum publik yang bertanggungjawab kepada presiden dan berfungsi untuk menyelenggarakan empat program yaitu Jaminan Kecelakaan Kerja (JKK), Jaminan Kematian (JKM), Jaminan Hari Tua (JHT), dengan penambahan program Jaminan Pensiun (JP). Salah satunya Pengajuan klaim dari peserta program jaminan Jaminan Hari Tua yang terlalu banyak dari berbagai wilayah khususnya kecamatan langkat, Sehingga menjadi masalah yang besar untuk memberikan pelayanan atau informasi yang baik untuk para peserta.Untuk itu penulis mencoba membuat suatu sistem untuk mendukung proses pengelompokan yang terkomputerisasi yang dapat membantu mengelompokan secara otomatis pengeklaiman jht berdasarkan wilayah, sehingga ada peluang untuk merancang sistem data mining pengelompokan didalamnya. Data mining merupakan suatu proses penambangan data dalam jumlah data yang sangat besar dengan menggunakan metode statistika, matematika, hingga memanfaatkan teknologi artificial intelligence terkini. Clustering adalah sebuah metode yang diterapkan dalam membuat suatu sistem data mining
131 pengelompokan untuk memudahkan para karyawan dalam mengelompokan JHT berdasarkan wilayah. Berdasarkan analisis yang telah dilakukan dalam pada pengelompokan data jaminan hari tua dengan menggunakan metode clustering, maka perlu dilakukan proses cluster beberapa kali untuk mendapatkan hasil yang sama sesuai dengan proses yang pertama kali dilakukan yaitu pada cluster 1 : 2 3 2 cluster 2 : 2 8 2 dan cluster 3 : 2 13 2 dengan jumlah pada cluster 1 sebanyak 545 data, cluster 2 sebanyak 308 data dan cluster 3 sebanyak 421 data.
Kata Kunci : Data Mining, Clustering, Jaminan Hari Tua, Wilayah.
1. PENDAHULUAN
Tenaga kerja mempunyai peran penting sebagai suatu unsur penunjang untuk berhasilnya pembangunan nasional serta dalam rangka pelaksanaan pembangunan Indonesia. Pekerjayang mempunyai hubungan kerja dengan perusahaan ditempat ia bekerja merupakan potensi untuk meningkatkan produktifitas pada perusahaan tersebut. Untuk itu, sudah sewajarnya apabila kepada mereka diberikan hak perlindungan, pemeliharaan kesejahteraaan dan pengembangan terhadap keberlangsungan hidup, sehingga diperlukanlah jaminan sosial bagi tenaga kerja.
BPJS Ketenagakerjaan adalah suatu badan hukum publik yang bertanggungjawab kepada presiden dan berfungsi untuk menyelenggarakan empat program yaitu Jaminan Kecelakaan Kerja (JKK), Jaminan Kematian (JKM), Jaminan Hari Tua (JHT), dengan penambahan program Jaminan Pensiun (JP). Salah satu upaya pemerintah dalam menjamin tenaga kerja yaitu program yang diselenggarakan yang saat ini paling besar manfaatnya oleh peserta adalah jaminan hari tua (JHT).
Dengan adanya program ini, tentunya jumlah tenaga kerja yang melakukan pencairan dana JHT semakin banyak. Hal ini dikarenakan pada masa pandemi covid19 banyak perusahaan yang mengalami penurunan atau kebangkrutan sehingga harus mengurangi jumlah tenaga kerja bahkan menutup perusahaan tersebut. Khususnya di wilayah Langkat banyak sekali tenaga kerja yang mengklaim JHT karena dampak tersebut.
Klaim adalah tuntutan dari pihak tertanggung sehubungan dengan adanya
jaminan dengan pihak tertanggung yang masing-masing pihak mengikatkan diri untuk menjamin pembayaran oleh penanggung jika pembayaran telah dilakukan oleh pihak tertanggung, ketika terjadi resiko oleh pihak tertanggung. Program JHT adalah manfaat uang tunai yang diberikan ketika peserta tidak bekerja lagi atau meninggal dunia. JHT dapat diterima ketika peserta berhenti bekerja dengan masa tunggu 1 (satu) bulan setelah berhenti bekerja, dan tidak lagi harus menunggu kepesertaan minimal 10 (sepuluh) tahun.
Permasalahan yang menghambat kantor BPJS Ketenagakerjaan Cabang Langkat yaitu pengajuan klaim dari peserta program Jaminan Hari Tua yang terlalu banyak dari berbagai wilayah khususnya kecamatan langkat, Sehingga menjadi masalah yang besar untuk memberikan pelayanan atau informasi yang baik untuk para peserta dan banyaknya jumlah data Jaminan Hari Tua mengakibatkan data-data JHT semakin lama semakin terus menambah yang biasanya hanya tersimpan dalam sebuah arsip atau database saja. Tanpa menyadari dari tumpukan data – data tersebut masih dapat diambil sebuah informasi yang dapat membantu pihak BPJS Ketenagakerjaan.
Pengelompokan data yang sangat efesien dapat dilakukan dengan pengelompokan berdasarkan variabel yang ditentukan yaitu wilayah. Salah satu proses pengelompokan data yang dapat digunakan adalah penerapan data mining.
Data mining merupakan suatu proses penambangan data dalam jumlah data yang sangat besar dengan menggunakan metode statistika, matematika, hingga memanfaatkan
teknologi artificial intelligence terkini. Data
mining dalam proses pengelompokan data dapat menggunkan metode pengelompokan yaitu metode Clustering. Metode Clustering merupakan proses analisa objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain.
Dengan memanfaatkan proses data mining menggunakan metode Clustering diharapkan sistem yang akan dibangun dapat menyelesaikan masalah pengelompokan data peserta BPJS Ketenagakerjaan.
Penelitian ini diperkuat dengan beberapa penelitian terdahulu berkaitan dengan judul, penelitian pertama yang dilakukan oleh (Achmad Fikri Sallaby dan Eko Suryana) dengan judul “Penerapan Data Mining untuk Menentukan Jumlah Pencari Kerja Terdaftar Berdasarkan Umur dan Pendidikan Menggunakan K-Means Clustering (Studi Kasus di Dinas Tenaga Kerja Dan Transmigrasi Provinsi Bengkulu)”
menyimpulkan bahwa Hasil pengolahan dengan Data Mining memudahkan pengelompokan jumlah pencari kerja terdaftar berdasarkan umur dan pendidikannya, sehingga memudahkan pencari kerja memperoleh informasi.
2. METODOLOGI PENELITIAN Metodologi penelitian adalah proses atau cara ilmiah untuk mendapatkan data yang akan digunakan untuk penelitian. Dalam melakukan penelitian ini, penulis mengikuti tahapan metodologi dalam penelitian ini yaitu sebagai berikut :
Gambar 1. Metodologi Penelitian Untuk memperjelas struktur metodologi penelitian diatas, maka penulis membuat keterangannya sebagai berikut :
1. Rumusan Masalah
Tahap ini merupakan tahapan awal dalam penelitian yaitu dengan menetukan latar belakang masalah, tujuan dan manfaat agar tidak keluar dari fokus pembahasan atau penyusunan skripsi.
2. Kajian Teori
Tahap ini adalah mencari informasi, sumber-sumber yang berkaitan dengan masalah yang dihadapi baik dari studi pustaka, jurnal dan internet sebagai pendukung dan landasan dasar penulis skripsi.
3. Pengumpulan Data
Tahap ini merupakan pengumpulan data yang diperlukan dalam pembuatan skrpsi seperti wawancara, obsevasi yang kemudian dapat diolah ke tahap selanjutnya.
4. Analisa Data
Tahap ini merupakan tahapan mengolah dan meganasis data yang telah diperoleh sehingga data tersebut dapat dikelompokan sesuai dengan variabel yang telah ditentukan.
5. Pengujian dan Implementasi
Tahap ini merupakan tahapan yang melakukan pengujian validasi dan implementasi data yang telah dianalisa sebelumnya serta penyusunan program.
6. Evaluasi
Tahap ini merupakan tahapan mengambil kesimpulan dan saran yang dapat dilakukan dalam penyusunan skrpsi.
Dengan adanya kesimpulan maka akan diketahui hasil dari keseluruhan skrpsi dan diharapkan dengan saran akan perbaikan- perbaikan dan manfaat bagi yang lain.
3. HASIL DAN PEMBAHASAN
133 3.1 Hasil
Dalam analisa pengujian metode Clustering dalam sistem pengelompokan data yang digunakan diperlukan sebagai input proses dan analisa, setelah melakukan riset di Kantor BPJS Ketenagakerjaan Cabang langkat, penulis mendapatkan data peserta BPJS Ketenagakerjaan Jaminan Hari Tua yang melakukan pengajuan klaim pada Kantor BPJS Ketenagakerjaan Langkat. Data JHT tersebut telah dibuat menjadi tabel sesuai dengan variabel pengolahan yang akan di analisa dengan mengggunakan metode Clustering algoritma K-Means, data yang sudah ditransformasikan tersebut adalah sebagai berikut:
Tabel 1. Data Penelitian No Alternatif X Y Z
1 A 1 17 1
2 B 2 3 2
3 C 1 6 1
4 D 1 2 2
5 E 2 1 1
6 F 3 7 1
7 G 4 6 3
8 H 4 6 3
9 I 4 6 3
10 J 1 5 2
11 K 1 5 2
12 L 1 2 1
13 M 4 5 3
14 N 2 4 1
15 O 1 8 2
16 P 1 2 1
17 Q 1 3 2
18 R 4 15 3
19 S 1 7 2
20 T 4 9 2
Berdasarkan data alternatif di atas, variabel yang digunakan adalah Usia (X), Wilayah (Y) dan Sebab Klaim (Z), dengan nilai transformasi data sebagai berikut:
Tabel 2. Nilai Transformasi Data
Kode Usia
1 20 tahun – 30 tahun 2 2
31 tahun – 40 tahun 2 3
41 tahun – 50 tahun 4 4
Lebih dari 50 tahun
Kode Wilayah
1 Gebang
2 stabat
3 wampu
4 Kuala
5 Sirapit
6 Bahorok
7 Pkl susu
8 selesai
9 Brandan
10 Salapian
11 Binjai
12 Tanjung Pura
13 Sawit seberang 14 Batang Serangan
15 Secanggang
16 Besitang
17 Hinai
18 Padang Tualang Kode Sebab klaim
1 Mengundurkan diri
2 PHK
3 Pensiun
4 Meninggal dunia
Perhitungan :
Jumlah cluster (K) adalah 3 cluster.
Pusat cluster (Centroid) yang digunakan berjumlah 3, yaitu sebgai berikut :
Centroid1 diambil dari data ke-1 yaitu alternatif F : C1 = (3,7,1)
Centroid2 diambil dari data ke-7 yaitu alternatif H : C2 = (4,6,3)
Centroid3 diambil dari data ke-20 yaitu alternatif J : C3 = (1,5,2)
Mengitung Nilai Jarak Antardata Dengan Persamaan Euclidean Distance
Perhitungan nilai jarak terdekat antardata
dengan menggunakan persamaan D(𝑖𝑗) =
√(𝑋1𝑖 − 𝑋1𝑗)2+ (𝑋2𝑖 − 𝑋2𝑗)2+ (𝑋3𝑖 − 𝑋3𝑗)2, Proses Perhitugan tersebut adalah sebagai berikut :
PROSES ITERASI I
- A (1,17,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (17 − 7)2+ (1 − 1)2=10,198 C2 = √(1 − 4)2+ (17 − 6)2+ (1 − 3)2= 11,576 C3 = √(1 − 1)2+ (17 − 2)2+ (1 − 1)2= 12,042 - B (2,3,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(2 − 3)2+ (3 − 7)2+ (2 − 1)2= 4,243 C2 = √(2 − 4)2+ (3 − 6)2+ (2 − 3)2= 3,742 C3 = √(2 − 1)2+ (3 − 2)2+ (2 − 1)2= 2,236 - C (1,6,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (6 − 7)2+ (1 − 1)2= 2,236 C2 = √(1 − 4)2+ (6 − 6)2+ (1 − 3)2= 3,606 C3 = √(1 − 1)2+ (6 − 2)2+ (1 − 1)2= 1,414 - D (4,3,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (2 − 7)2+ (2 − 1)2= 5,477 C2 = √(1 − 4)2+ (2 − 6)2+ (2 − 3)2= 5,099 C3 = √(1 − 1)2+ (2 − 2)2+ (2 − 1)2= 3,000 - E (2,1,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(2 − 3)2+ (1 − 7)2+ (1 − 1)2= 6,083 C2 = √(2 − 4)2+ (1 − 6)2+ (1 − 3)2= 5,745 C3 = √(2 − 1)2+ (1 − 2)2+ (1 − 1)2= 2,243 - F (3,7,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(3 − 3)2+ (7 − 7)2+ (1 − 1)2= 0,000 C2 = √(3 − 4)2+ (7 − 6)2+ (1 − 3)2= 2,449 C3 = √(3 − 1)2+ (7 − 2)2+ (1 − 1)2= 3,000 - G (4,6,3)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (6 − 7)2+ (3 − 1)2= 2,449 C2 = √(4 − 4)2+ (6 − 6)2+ (3 − 3)2= 0,000 C3 = √(4 − 1)2+ (6 − 2)2+ (3 − 1)2= 3,317 - H (4,6,3)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (6 − 7)2+ (3 − 1)2= 2,449 C2 = √(4 − 4)2+ (6 − 6)2+ (3 − 3)2= 0,000 C3 = √(4 − 1)2+ (6 − 2)2+ (3 − 1)2= 3,317 - I (4,6,3)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (6 − 7)2+ (3 − 1)2= 2,449 C2 = √(4 − 4)2+ (6 − 6)2+ (3 − 3)2= 0,000 C3 = √(4 − 1)2+ (6 − 2)2+ (3 − 1)2= 3,317 - J (1,5,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(3 − 1)2+ (7 − 2)2+ (1 − 1)2= 3,000
C2 = √(1 − 4)2+ (5 − 6)2+ (2 − 3)2= 3,317 C3 = √(1 − 1)2+ (5 − 2)2+ (1 − 1)2= 0,000 - K (1,5,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(3 − 1)2+ (7 − 2)2+ (1 − 1)2= 3,000 C2 = √(1 − 4)2+ (5 − 6)2+ (2 − 3)2= 3,317 C3 = √(1 − 1)2+ (5 − 2)2+ (1 − 1)2= 0,000 - L (1,2,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (2 − 7)2+ (1 − 1)2= 5,385 C2 = √(1 − 4)2+ (2 − 6)2+ (1 − 3)2= 5,385 C3 = √(1 − 1)2+ (2 − 2)2+ (1 − 1)2= 3,162 - M (4,5,3)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (5 − 7)2+ (3 − 1)2= 3,000 C2 = √(4 − 4)2+ (5 − 6)2+ (3 − 3)2= 1,000 C3 = √(4 − 1)2+ (5 − 2)2+ (3 − 1)2= 3,162 - N (2,4,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(2 − 3)2+ (4 − 7)2+ (1 − 1)2= 3,162 C2 = √(2 − 4)2+ (4 − 6)2+ (1 − 3)2= 3,464 C3 = √(2 − 1)2+ (4 − 2)2+ (1 − 1)2= 1,732 - O (1,8,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (8 − 7)2+ (2 − 1)2= 2,449 C2 = √(1 − 4)2+ (6 − 6)2+ (2 − 3)2= 3,742 C3 = √(1 − 1)2+ (8 − 2)2+ (2 − 1)2= 3,000 - P (1,2,1)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (2 − 7)2+ (1 − 1)2= 5,385 C2 = √(1 − 4)2+ (2 − 6)2+ (1 − 3)2= 5,385 C3 = √(1 − 1)2+ (2 − 2)2+ (1 − 1)2= 3,162 - Q (1,3,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (3 − 7)2+ (2 − 1)2= 4,583 C2 = √(1 − 4)2+ (3 − 6)2+ (2 − 3)2= 4,359 C3 = √(1 − 1)2+ (3 − 2)2+ (2 − 1)2= 2,000 - R (4,15,3)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (15 − 7)2+ (3 − 1)2= 8,307 C2 = √(4 − 4)2+ (15 − 6)2+ (3 − 3)2= 9,000 C3 = √(4 − 1)2+ (15 − 2)2+ (3 − 1)2= 10,488 - S (1,7,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(1 − 3)2+ (7 − 7)2+ (2 − 1)2= 2,236 C2 = √(1 − 4)2+ (7 − 6)2+ (2 − 3)2= 3,317 C3 = √(1 − 1)2+ (7 − 2)2+ (2 − 1)2= 2,000 - T (4,9,2)
Centroid : C1 = (3,7,1); C2 = (4,6,3) dan C3 = (1,2,1) C1 = √(4 − 3)2+ (9 − 7)2+ (2 − 1)2= 2,449 C2 = √(4 − 4)2+ (9 − 6)2+ (2 − 3)2= 3,162 C3 = √(4 − 1)2+ (9 − 2)2+ (2 − 1)2= 5,000
Hasil perhitungan nilai euclidean distance pada iterasi I diatas dapat dilihat pada tabel
135 berikut :
Tabel 3. Nilai Euclidean Distance Pada Iterasi I
No Alternatif C1 C2 C3 Grup 1 A 10,198 11,576 12,042 1 2 B 4,243 3,742 2,236 3 3 C 2,236 3,606 1,414 3 4 D 5,477 5,099 3,000 3 5 E 6,083 5,745 4,243 3 6 F 0,000 2,449 3,000 1 7 G 2,449 0,000 3,317 2 8 H 2,449 0,000 3,317 2 9 I 2,449 0,000 3,317 2 10 J 3,000 3,317 0,000 3 11 K 3,000 3,317 0,000 3 12 L 5,385 5,385 3,162 3 13 M 3,000 1,000 3,162 2 14 N 3,162 3,464 1,732 3 15 O 2,449 3,742 3,000 1 16 P 5,385 5,385 3,162 3 17 Q 4,583 4,359 2,000 3 18 R 8,307 9,000 10,488 1 19 S 2,236 3,317 2,000 3 20 T 2,449 3,162 5,000 1
Pada tabel hasil proses iterasi I pengelompokkan diatas untuk menentukan grup pengelompokkan data dapat ditentukan dengan ketentuan berikut ini :
- Grup 1 didapat dengan membandingkan nilai terkecil dari 3 centroid, jika nilai terkecil terdapat di C1 (Centroid1), maka data masuk pada grup 1.
- Grup 2 didapat dengan membandingkan nilai terkecil dari 3 centroid, jika nilai terkecil terdapat di C2 (Centroid2), maka data masuk pada grup .
- Grup 3 didapat dengan membandingkan nilai terkecil dari 3 centroid, jika nilai terkecil terdapat di C3 (Centroid3), maka data masuk pada grup 3.
Selanjutnya melakukan hitungan untuk iterasi II, sebelum melakukan hitungan iterasi II, maka perlu dibuat terlebih dahulu untuk pusat Centroid dari ketiga Cluster.
Berikut ini adalah 3 Centroid yang baru :
- C1 (5 data) : X = (1+3+1+4+4)
5 = 13
5 = 2,600 Y = (17+7+8+15+9)
5 = 56
5 = 11,200 Z = (1+1+2+3+2)
5 = 9
5 = 1,800
Hasil Centroid1 : C1(2,600; 11,200; 1,800) - C2 (4 data) :
X = (4+4+4+4)
5 = 16
4 = 4,000 Y = (6+6+6+5)
4 = 23
4 = 5,750 Z = (3+3+3+3)
4 = 12
4 = 3,000
Hasil Centroid2 : C2(4,000; 5,750; 3,000) - C3 (3 data):
X = (2+1+1+2+1+1+1+2+1+1+1)
11 =14
11 =1,273 Y = (3+6+2+1+5+5+2+4+2+3+7)
11 =40
11 =3,636 Z = (2+1+2+1+2+2+1+1+1+2+2)
11 = 17
11 =1,545 Hasil Centroid3 : C3(1,273; 2,636; 1,545) PROSES ITERASI II
- A (1,17,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (17 − 11,200)2+ (1 − 1,800)2= 10,229
C2 = √(1 − 4,000)2+ (17 − 5,750)2+ (1 − 3,000)2= 11,576
C3 = √(1 − 1,273)2+ (17 − 3,636)2+ (1 − 1,545)2= 12,042
- B (2,3,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(2 − 2,600)2+ (3 − 11,200)2+ (2 − 1,800)2= 4,128
C2 = √(2 − 4,000)2+ (3 − 5,750)2+ (2 − 3,000)2= 3,742
C3 = √(2 − 1,273)2+ (3 − 3,636)2+ (2 − 1,545)2= 2,236
- C (1,6,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (6 − 11,200)2+ (1 − 1,800)2= 2,375
C2 = √(1 − 4,000)2+ (6 − 5,750)2+ (1 − 3,000)2= 3,606
C3 = √(1 − 1,273)2+ (6 − 3,636)2+ (1 − 1,545)2= 1,414
- D (1,2,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (2 − 11,200)2+ (2 − 1,800)2= 5,389
C2 = √(1 − 4,000)2+ (2 − 5,750)2+ (2 − 3,000)2= 5,099
C3 = √(1 − 1,273)2+ (2 − 3,636)2+ (2 − 1,545)2= 3,000
- E (2,1,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(2 − 2,600)2+ (1 − 11,200)2+ (1 − 1,800)2= 6,135
C2 = √(2 − 4,000)2+ (1 − 5,750)2+ (1 − 3,000)2= 5,745
C3 = √(2 − 1,273)2+ (1 − 3,636)2+ (1 − 5,545)2= 4,243
- F (3,7,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(3 − 2,600)2+ (7 − 11,200)2+ (1 − 1,800)2= 0,800
C2 = √(3 − 4,000)2+ (7 − 3,223)2+ (1 − 3,000)2= 2,449
C3 = √(3 − 1,273)2+ (7 − 3,636)2+ (1 − 1,545)2= 3,000
- G (4,6,3)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (6 − 11,200)2+ (3 − 1,800)2= 1,855
C2 = √(4 − 4,000)2+ (6 − 5,750)2+ (3 − 3,000)2= 0,000
C3 = √(4 − 1,273)2+ (6 − 3,636)2+ (3 − 1,545)2= 3,217
- H (4,6,3)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (6 − 11,200)2+ (3 − 1,800)2= 1,855
C2 = √(4 − 4,000)2+ (6 − 5,750)2+ (3 − 3,000)2= 0,000
C3 = √(4 − 1,273)2+ (6 − 3,636)2+ (3 − 1,545)2= 3,217
- I (4,6,3)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (6 − 11,200)2+ (3 − 1,800)2= 1,855
C2 = √(4 − 4,000)2+ (6 − 5,750)2+ (3 − 3,000)2= 0,000
C3 = √(4 − 4,000)2+ (6 − 5,750)2+ (3 − 3,000)2= 3,217
- J (1,5,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (5 − 11,200)2+ (2 − 1,800)2= 2,835
C2 = √(1 − 4,000)2+ (5 − 5,750)2+ (2 − 3,000)2= 3,317
C3 = √(1 − 1,273)2+ (5 − 3,636)2+ (2 − 1,545)2= 0,000
- K (1,5,2)
Centroid C1(2,600; 11,200; 1,800); C2(4,000; 5,750; 3,000);
C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (5 − 11,200)2+ (2 − 1,800)2= 2,835
C2 = √(1 − 4,000)2+ (5 − 5,750)2+ (2 − 3,000)2= 3,317
C3 = √(1 − 1,273)2+ (5 − 3,636)2+ (2 − 3,636)2= 0,000
- L (2,1,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(2 − 2,6005)2+ (1 − 11,200)2+ (2 − 1,800)2= 5,444
C2 = √(2 − 4,000)2+ (1 − 5,750)2+ (2 − 3,000)2= 5,385
C3 = √(2 − 1,273)2+ (1 − 3,636)2+ (2 − 1,545)2= 3,162
- M (4,5,3)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (5 − 11,200)2+ (3 − 1,800)2= 2,538
C2 = √(4 − 4,000)2+ (5 − 5,750)2+ (3 − 3,000)2= 1,000
C3 = √(4 − 1,273)2+ (5 − 3,636)2+ (3 − 1,545)2= 3,162
- N (2,4,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(2 − (2,600)2+ (4 − 11,200)2+ (1 − 1,800)2= 3,262
C2 = √(2 − 4,000)2+ (4 − 5,750)2+ (1 − 3,000)2= 3,464
C3 = √(2 − 1,273)2+ (4 − 3,636)2+ (1 − 1,545)2= 1,732
- O (1,8,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − (2,600)2+ (8 − 11,200)2+ (2 − 1,800)2= 2,245
C2 = √(1 − 4,000)2+ (8 − 5,750)2+ (2 − 3,000)2= 3,742
C3 = √(1 − 1,273)2+ (8 − 3,636)2+ (2 − 1,545)2= 3,000
- P (1,2,1)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − (2,600)2+ (2 − 11,200)2+ (1 − 1,800)2= 5,444
C2 = √(1 − 4,000)2+ (2 − 5,750)2+ (1 − 3,000)2= 5,385
C3 = √(1 − 1,273)2+ (2 − 3,636)2+ (1 − 1,545)2=
137
3,162 - Q (1,3,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (3 − 11,200)2+ (2 − 1,800)2= 4,477
C2 = √(1 − 4,000)2+ (3 − 5,750)2+ (2 − 3,000)2= 4,359
C3 = √(1 − 1,273)2+ (3 − 3,636)2+ (2 − 1,545)2= 2,000
- R (4,15,3)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (15 − 11,200)2+ (3 − 1,800)2= 8,151
C2 = √(4 − 4,000)2+ (15 − 5,750)2+ (3 − 3,000)2= 9,000
C3 = √(4 − 1,273)2+ (15 − 3,636)2+ (3 − 1,545)2= 10,488
- S (1,7,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(1 − 2,600)2+ (7 − 11,200)2+ (2 − 1,800)2= 2,010
C2 = √(1 − 4,000)2+ (7 − 5,750)2+ (2 − 3,000)2= 3,317
C3 = √(1 − 1,273)2+ (7 − 3,636)2+ (2 − 1,545)2= 2,000
- T (4,9,2)
Centroid : C1(2,600; 11,200; 1,800); C2(4,000; 5,750;
3,000); C3(1,273; 3,636; 1,545)
C1 = √(4 − 2,600)2+ (9 − 11,200)2+ (2 − 1,800)2= 2,245
C2 = √(4 − 4,000)2+ (9 − 5,750)2+ (2 − 3,000)2= 3,162
C3 = √(4 − 1,273)2+ (9 − 3,636)2+ (2 − 1,545)2= 5,000
Hasil perhitungan nilai euclidean distance pada iterasi II diatas dapat dilihat pada tabel berikut:
Tabel 4. Nilai Euclidean Distance Pada Iterasi II
No Alternatif C1 C2 C3 Grup 1 A 10,229 11,576 12,042 1 2 B 4,128 3,742 2,236 3 3 C 2,375 3,606 1,414 3 4 D 5,389 5,099 3,000 3 5 E 6,135 5,745 4,243 3 6 F 0,800 2,449 3,000 1 7 G 1,855 0,000 3,317 2 8 H 1,855 0,000 3,317 2 9 I 1,855 0,000 3,317 2 10 J 2,835 3,317 0,000 3
11 K 2,835 3,317 0,000 3 12 L 5,444 5,385 3,162 3 13 M 2,538 1,000 3,162 2 14 N 3,262 3,464 1,732 3 15 O 2,245 3,742 3,000 1 16 P 5,444 5,385 3,162 3 17 Q 4,477 4,359 2,000 3 18 R 8,151 9,000 10,488 1 19 S 2,010 3,317 2,000 3 20 T 2,245 3,162 5,000 1
Selanjutnya memastikan kesamaan antara grup awal dengan grup baru, yaitu pada grup data iterasi I dengan data pada iterasi II, proses ini untuk memeriksa apakah terjadi perubahan pada grup cluster atau tidak, berikut perbandingan kesamaan antar grup awal dengan grup baru:
Tabel 5. Perbandingan Grup Iterasi I dan Iterasi II
No Alternatif
Grup Pada Iterasi
I
Grup Pada Iterasi
II
1 A 1 1
2 B 3 3
3 C 3 3
4 D 3 3
5 E 3 3
6 F 1 1
7 G 2 2
8 H 2 2
9 I 2 2
10 J 3 3
11 K 3 3
12 L 3 3
13 M 2 2
14 N 3 3
15 O 1 1
16 P 3 3
17 Q 3 3
18 R 1 1
19 S 3 3
20 T 1 1
Hasil perbandingan dari grup awal
(iterasi I) dan grup baru (iterasi II) sama,
perhitungan iterasi selesai.
Membuat Grafik Clustering:
Grafik Clustering merupakan grafik yang menampilkan titik-titik koordinat dari sebuah data setelah proses pengelompokkan data. Dengan menggunakan aplikasi
pemrograman MATLAB, berikut ini adalah hasil grafik Clustering pengelompokan data:
Gambar 2. Grafik Clustering Data JHT BPJS Ketenagakerjaan
Dari 20 data peserta yang diolah menjadi alternatif pengelompokkan data menggunakan metode Clustering pada penelitian ini, diperoleh 3 grup, grup 1 (Cluster 1) terdapat 4 data, grup 2 (Cluster 2) terdapat 4 data dan grup 12 (Cluster 3) terdapat 3 data.
1. Cluster 1 (2,600;11,200;1,800):
berdasarkan perhitungan diatas dapat di ketahui bahwasanya pada cluster 1 Jumlah Jaminan Hari Tua Berdasarkan Wilayah Dalam Masa Pandemi umur 41 - 50 tahun wilayah Binjai dan sebab klaim PHK.
2. Cluster 2 (4,000;5,750;3,000):
berdasarkan perhitungan diatas dapat di ketahui bahwasanya pada cluster 2 Jumlah Jaminan Hari Tua Berdasarkan Wilayah Dalam Masa Tidak Pandemi umur lebih dari 50 tahun wilayah Selesai dan sebab klaim Pensiun.
3. Cluster 3 (1,273;3,636;1,545):
Berdasarkan perhitungan diatas dapat di ketahui bahwasanya pada cluster 3 Jumlah Jaminan Hari Tua Berdasarkan Wilayah Dalam Masa Tidak Pandemi umur 20-30
tahun wilayah Kuala sebab klaim Mengundurkan Diri.
3.2 Pembahasan
Sistem yang dibangun merupakan sistem pengelompokan data JHT yang dikelompokan berdasarkan wilayah pada masa pandemi. Jaminan Hari Tua ditujukan sebagai pengganti terputusnya penghasilan tenaga kerja karena meninggal, cacat, atau hari tua dan diselenggarakan dengan sistem tabungan hari tua. Program Jaminan Hari Tua memberikan kepastian penerimaan penghasilan yang dibayarkan pada saat tenaga kerja mencapai usia 56 tahun atau telah memenuhi persyaratan tertentu. Jaminan Hari Tua akan dikembalikan/dibayarkan sebesar iuran yang terkumpul ditambah dengan hasil pengembangannya (paling sedikit sebesar rata-rata bunga deposito counter rate bank pemerintah). Setelah melakukan implementasi metode pada rancangan sistem terhadap sistem pengelompokan data, untuk mengetahui hasil dari implementasi sistem tersebut, perlu dilakukan uji coba terhadap sistem yang telah selesai dirancang. Pengujian akan dilakukan dengan memproses data input sistem, proses pengelompokan data yang akan dilakukan adalah sebagai berikut:
1. Tahap Clustering Data
Tahapan pengelompokan data JHT dapat dilakukan pada menu “PROSES”. Berikut ini adalah proses pengelompokan data jht dengan sistem yang telah dirancang dengan penerapan metode Clustering menggunakan aplikasi pemrograman MATLAB R2014a:
a. Inputkan data JHT
Data peserta dapat diinputkan pada sistem dengan menggunakan tombol “Input” pada halaman proses clustering di sistem. Setelah data di inputkan pada sistem, data akan di tampilkan pada tabel data input dan sistem akan menampilkan jumlah data yang telah di inputkan. Berikut ini tampilan halaman setelah data berhasil di inputkan pada sistem:
0 2
4
0 4 2
6 10 8
12 14 18 16
1 1.5 2 2.5 3 3.5 4
Usia(X) Pusat Centroid 1 Pusat Centroid 3
Wilayah(Y) Grafik Pengelompokan Data
Pusat Centroid 2
Sebab Kalim(Z)
Cluster 1 Cluster 2 Cluster 3 Centroids
139 Gambar 3. Tampilan Setelah Input Data
Pada Sistem
b. Menentukan cluster data pada sistem Pada pengujian ini jumlah cluster yang digunakan adalah 3 cluster.
c. Proses clustering data
Pada tahap ini pengguna akan melakukan proses pengelompokan data yang telah diinputkan pada sistem. Proses pengelompokan data pada sistem dapat dilakukan dengan menekan tombol “Proses”
pada halaman proses cluster data. Proses akan memanfaatkan data yang telah diinputkan dan jumlah cluster yang telah di tentukan. Setelah proses pengelompokan data selesai, maka pada tampilan ini sistem akan menampilkan keterangan pusat cluster data pada tabel result proses data sesuai dengan jumlah cluster yang digunakan. Berikut ini tampilan setelah proses penngelompokan data pada sistem:
Gambar 4. Tampilan Setelah Proses Uji Pengelompokan Data
Dapat dilihat pada gambar diatas dalam proses pengujian pertama pengelompokan data, dihasilkan pusat cluster data sebagai berikut:
- Centroid 1 : (1.9266 2.8807 1.9431) - Centroid 2 : (1.7987 7.6948 1.9286)
- Centroid 3 : (1.8337 12.8076 1.9074) Tampilan ini adalah tampilan hasil proses pengelompokan data yang telah dilakukan pada sistem pengelompokan data dengan metode Clustering yang telah di proses, halaman ini terdapat pada menu “HASIL CLUSTERING DATA” pada sistem, pada tampilan ini juga sistem akan menampilkan keterangan hasil cluster data yang menjadi pusat cluster pengelompokan data.
d. Hasil Proses Pengelompokan Data
data hasil pengelompokan yang memberikan keterangan berupa titik koordinat pengelompokan data serta pusat cluster data, tampilan hasil sebagai pengelompokan data tersebut adalah sebagai berikut:
Gambar 6. Grafik Proses Pengelompokan Data
Gambar 7. Hasil Proses Pengelompokan Data
4. KESIMPULAN
Penulis mengambil kesimpulan terhadap pengelompokan Jaminan Hari Tua berasarkan wilayah pada masa pandemi adalah sebagai berikut:
1. Penerapan data mining untuk pengelompokan jaminan hari tua berdasarkan wilayah dalam masa
pandemi dengan menggunakan metode
clustering dapat diterapkan dan menghasilkan inforrmasi dengan menggunakan Matlab GUI.
2. Dari data 1247 data terdapat 3 cluster yang dikelompokan, Berdasarkan perhitungan yang telah maka diperoleh hasil jumlah anggota group 1 sebanyak 545 data, jumlah anggota group 2 Sebanyak 308 data dan jumlah anggota group 3 Sebanyak 421 data. Dengan hasil centroid 1 : 1.9266 2.8807 1.9431, centroid 2 : 1.7987 7.6948 1.9286 dan centroid 3 : 1.8337 12.8076 1.9074.
3. Berdasarkan proses cluster yang telah dilakukan bahwa pengelompokan data jaminan hari tua pada C1, C2 dan C3 yaitu dengan usia 31 – 40 T dengan wilayah wampu, selesai, dan sawit seberang dan dengan sebab klaim dikarenakan di PHK.
5. SARAN
Ada beberapa saran yang dapat berguna untuk kedepan dari hasil pembahasan pada bab sebelumnya yaitu sebagai berikut:
1. Skripsi ini dapat dilanjutkan dengan menambahkan data-data yang lebih banyak dari skripsi ini, dan diharapkan untuk dapat mengimplementasikan sistem ini dengan menggunakan software lain selain Matlab GUI misalnya bahas pemograman php atau visual studio.
2. Diharapkan untuk peneliti lebih lanjut untuk dapat membuat dengan menggunakan metode lain agar diperoleh informasi yang lebih baik lagi dan sebagai bahan perbandingan.
3. Diharapkan untuk pengembangan dari sistem, Perlu dilakukan beberpa kali proses untuk mendapatkan hasil informasi yang tepat dapat maksimal,
karena banyak data mempengaruhi hasil pengelompokan.
DAFTAR PUSTAKA
[1]. Agusta, Yudi. 2007. K-Means – Penerapan, Permasalahan dan Metode Terkait.
[2]. Budi Sutedjo, Dharma Oetomo dkk.
2006. Konsep dan Aplikasi Pemrograman Client Server dan Sistem Terdistribusi. Yogyakarta:
Penerbit ANDI..
[3]. Informasi, J., Wandana, J., & Defit, S.
(2020). Klasterisasi Data Rekam Medis Pasien Pengguna Layanan BPJS Kesehatan Menggunakan Metode K-
Means. 2, 4–9.
https://doi.org/10.37034/jidt.v2i4.73
[4]. Manaor, A., Pardede, H., Ginting, B. S., Studi, P., & Informatika, T. (2012).
ANALISIS PENGELOMPOKKAN
PERFORMANCE DOSEN DENGAN METODE CLUSTERING PADA STMIK KAPUTAMA BINJAI. 5(2), 41–49.
[5]. Prasetyo, Eko (2012). Data Mining Konsep dan Aplikasi Menggunakan Matlab. Yogyakarta; Andi.
[6]. Sallaby, A. F., & Suryana, E. (2018).
Penerapan Data Mining untuk Menentukan Jumlah Pencari Kerja Terdaftar Berdasarkan Umur dan Pendidikan Menggunakan K-Means Clustering (Studi Kasus di Dinas Tenaga Kerja Dan Transmigrasi Provinsi Bengkulu). Journal of Technopreneurship and Information [7]. Sylvia, C. (2020). Pengelompokkan
Data Bencana Alam Berdasarkan Wilayah , Waktu , Jumlah Korban dan Kerusakan Fasilitas Dengan Algoritma
K-Means. 4, 744–752.
https://doi.org/10.30865/mib.v4i3.2213
https://doi.org/10.36085/jtis.v1i2.28 K-Means. 4, 744–752.
https://doi.org/10.30865/mib.v4i3.221 [8]. Widodo, Prabowo P(2013). Penerapan Data Mining Dengan Matlab, Rekayasa Sains:
141 Bandung.