Analisis Algoritma K-Means Clustering Penilaian Prestasi Kinaerja Karyawan
Muhammad Mahmudi¹, Aswan Supriadi Sunge², dan Prasetyo Harisandi³
Program Studi Teknik Industri Universitas Pelita Bangsa Korespondensi Email:
Abstrak
With the technology that is developing rapidly at this time, it will certainly affect the world of work. Employees are Human Resources (HR) which is a very valuable company asset and must be managed properly in order to make an optimal contribution to the progress of the company or agency, has more than 451employees production, the problem faced is the company has difficulty in conduct the selection process of employee performance appraisal. Performance appraisal is carried out to measure an employee's performance on the work done. The company conducts performance appraisals on employees every 6 months, which involves all employees, both permanent employees and contract employees. The purpose of this research is to analyze the performance of the K-Means algorithm in the clustering process. Clustering will be grouped into 4 clusters, namely: very good performance level, good performance level, moderate performance level and poor performance level. The clustering process will be carried out using rapidminer software. Algorithm performance measurement in rapidminer is carried out using the Confusion Matrix method with parameters of accuracy rate, recall and precision. From the research conducted, the results of the K-Means algorithm have 0,28% accuracy rate. With these results, it can be concluded that the K-Means algorithm has better and more accurate performance.
Keywords: Data Mining, K-Mean Clustering, Employees Production Assessment
I. Pendahuluan
Sumber daya manusia merupakan suatu faktor yang sangat penting dalam suatu organisasi atau perusahaan, semakin banyak karyawan yang dimiliki oleh suatu
perusahaan, akan semakin berat beban Divisi
Sumber Daya Manusia (SDM) dalam
menjalankan tugas untuk melakukan
pengelolaan karyawan, untuk mengukur
kinerja karyawan terhadap perusahaan, Divisi
SDM telah melakukan penilaian kinerja terhadap masing-masing karyawan setiap 6 bulan, namun hasil dari penilaian tersebut belum dilakukan pengelompokan sesuai dengan kelas-kelas tertentu. Mengenai lingkungan kerja, dewasa ini belum begitu banyak diperhatikan oleh perusahaan sebagai salah satu faktor yang cukup besar dalam mempengaruhi kinerja karyawan. Lingkungan kerja yang baik akan berdampak pada kondisi fisik maupun pada kondisi mental karyawan itu sendiri. Penciptaan lingkungan kerja yang baik akan membantu memelihara kondisi karyawan, baik fisik maupun psikis. Hal ini akan membuat kinerja karyawan akan semakin membaik, Dalam melakukan perbandingan kinerja algoritma K-Means peneliti akan mengunakan parameter untuk melakukan pengukuran dari kinerja kedua algoritma, parameter yang digunakan adalah: Accuracy rate dan aplikasi rapid miner. Dengan banyaknya parameter yang digunakan untuk melakukan pengukuran kinerja algoritma, diharapkan dapat memberikan hasil yang lebih akurat bila dibandinkan dengan hanya mengunakan 1 parameter, dari hasil penelitian tersebut diharapkan dapat menentukan algoritma mana yang lebih baik, apabila digunakan dalam melakukan pengelompokan data kinerja karyawan. Data Mining untuk pengelompokkan data kinerja karyawan
menggunakan metode K-Means Clustering.
Metode ini membantu pihak manajemen dalam melakukan pengelompokkan karyawan sehingga dari beberapa kriteria yang telah ditentukan sehingga hasil penilaiannya lebih obyektif dan akurat.
II. Metode Penilitian 1. Objek Penelitian
Penelitian ini dilakukan menggunakan data penilaian kinerja karyawan produksi PT.
Citra Nugerah Karya selama 1 semeter tahun 2021.Pada penelitian ini digunakan data yang diperoleh secara langsung dari sumber penelitian atau disebut juga sebagai data primer yang berjumlah 451 karyawan produksi terdiri dari 2 label dan 10 atribut.
PT. Citra Nugerah Karya sangat menghargai kepercayaan klien dan mitra usaha, dengan bertekad memberikan pelayanan yang terbaik untuk pelanggan maupun kandidat karyawan yang dikelola.
perusahaan senantiasa menjalankan usaha
dengan memenuhi komitmen, memberikan
kepastian dan menjamin kepuasan bagi
pelanggan dan mitra usaha sehingga
memajukan usaha yang harmonis, dinamis,
dan dapat terwujud dengan hasil yang
optimal. Sebagai perusahaan yang baik dan
ingin maju haruslah mempunyai visi dan misi
kedepan guna mencapai tujuan dari
perusahaan.
1. Visi
Menjadi perusahaan manufactur perlengkapan asli untuk part otomotive dan industri logam dengan kualitas terbaik.
2. Misi
Menerapkan sistem manajemen mutu, lingkungan dan K3 dengan konsisten untuk mengutamakan kepuasan pelanggan dengan meningkatkan kualitas, teknologi dan sumber daya manusia.
2. Kerangka Pemikiran
Kerangka pemikiran merupakan garis besar dari langkah langkah penilitian yang sedang dilakukan, kerangka pemikiran dijadikan acuan yang sedang dilakukan penelitian.
Berikut diagram kerangka pemikiran:
Rumusan Masalah
1. Bagaimana mengelola data data karyawan yang terkait dengan penilaian kinerja karyawan
2. Bagaimana dalam penilaian kinerja karyawan menggunakan metode Algoritma K-Means Clustering dan aplikasi kinerja karyawan?
3. Apakah Aplikasi K-Means Clustering dapat menjadikan parameter dalam penilaian prestasi kinerja karyawan?
Tujuan
1. Untuk menentukan hasil Analisis prestasi kinerja karyawan dengan metode K-Means Clustering.
2. Menganalisa metode Algoritma K- Means clustering dengan rapidminer memudahkan perusahaan dalam penilaian prestasi kinerja keryawan.
3. Adanya metode Algoritma K-Mean clustering menjadikan parameter di penilaian prestasi kinerja karyawan.
Eksperimen Data:
penilaian kinerja karyawan
produksi
semester1 tahun 2021
Metode:
K-Mean Clustering
Implementasi:
Rapidminer versi 5.3
Hasil
Data penialian dikelompokkan menjadi 4
(empat) cluster (sangat baik, baik, cukup
dan kurang). Hasil akurasi yang didapatkan
setelah dihitung adalah (1) 0,06% untuk
cluster 1 kategori (SB) sangat baik yang
terdiri dari 100 data karyawan, (2) 0,21%
untuk cluster 2 kategori (B) baik yang terdiri dari 214 data karyawan, (3) 0,46% untuk cluster 3 kategori (C) cukup yang terdiri dari 77 data karyawan dan (4) 0,25% untuk katagori (K) kurang yang terdiri dari 60 data karyawan.
Manfaat
Perusahaan sebagai objek penelitian yang dapat membantu mempermudah perusahaan dalam melakukan analisis data dengan tepat data kinerja karyawan tetap bisa lebih Akurat dan efisien.
Gambar 1. Giagram Kerangka Berfikir
3. Tahapan Penelitian
Adapun langkah- langkah dalam tahapan penelitian yang digunakan dalam prosedur pengumpulan data yang dilakukan untuk penelitian:
I. Studi Pustaka
Penelitian dimulai dengan mempelajari informasi serta algoritma yang bersangkutan dengan penelitian ini dengan cara mendownload serta membaca e book, e- journal, dan beberapa referensi pembelajaran lain yang berkaitan dengan permasalahan yang dibahas sebagai acuan penelitian.
II. Metode Observasi
Teknik melihat dan mempelajari serta mewawancarai beberapa karyawan tentang permasalahan pada perusahaan yang berkaitannya dengan objek yang diteliti yaitu proses seleksi penilaian untuk mengetahu penilaian prestasi kinerja karyawan produksi.
3. Analisa data
Proses seleksi penilaian karyawan dengan menggunakan algoritma K-MEANS untuk menentukan diperpanjang atau tidaknya kontrak kerja berdasarkan kriteria penilaian yang sudah ditentukan oleh perusahaan.
Setelah mendapatkan data yang diberikan oleh perusahaan kemudian dilakukan perhitungan nilai entrophy dan gain untuk mendapatkan gambaran umun dari suatu riset data.
4. Persiapan Data
Persiapan data yang dilakukan dalam penelitian ini adalah mengolah data mentah menjadi data yang dapat diolah dengan data mining, yaitu pengelompokan. Sampel data asli untuk data status penilaian kinerja karyawan dapat dilakukan data preparation.
Memperoleh representasi dalam bentuk
volume data tanpa mengurangi jumlahnya
sehingga mendapatkan hasil analisis yang
sama, berikut adalah keseluruhan atribut
tanpa dilakukan reduction data.
Tabel 1 Unsur unsur penilaian karyawan Kreterian penilaian
I. Hasil Kerja P1 1. Kuantitas Hasil kerja P2 2. Kualitas hasil kerja II.
Kedisipilinan
P3 1. Tidak hadir satu hari penuh
P4 2. Ijin meninggalkan pekerjaan
P5 3. Terlambat P6 4. Pelanggaran
peraturan
P7 5. Disiplin terhadap peraturan 5K2S III.
Penguasaan Pekerjaan
P8 1. Mengetahuai Part &
Proses Knowladge
IV.
IdeProposal
P9 1. Mau mengusulkan ide-ide perbaikan V. Gugus
Kendali Mutu
P
101. Improvement Individu maupun team work
Pencapaian Hasil kerja dibandingkan dengan target yang telah di tentukan selama periode penilaian. Kuantitas disini adalah bentuk penilaian dalam jumlah hasil kerja yang dinyatakan dalam bentuk ukuran angka atau padanan angka lainnya. Kualitas adalah bentuk penilaian satuan ukuran yang berhubungan dengan kualitas atau mutu hasil kerja yang dapat dinyatakan dengan ukuran angka. Parameter penilaian kinerja Hasil kerja karyawan produksi
Tabel 2 Parameter penilaian karyawan
Kreteria Petunjuk Penilaian Kinaerja
A. HASIL KERJA
Kriteria untuk Pelaksana ( yang kerjanya bergantung dg mesin/due
date )
Kriteria untuk level
Pelaksana ( yang kerjanya
tidak bergantung
dg mesin)
Kriteria untuk staff level operator / Administrasi
Pencapaian hasil kerja dibandingkan dengan target yang telah ditentukkan selama periode penilaian mencapai :
Penyelesaian tugas/laporan selama periode penilaian
I.
KUANTITAS [ 1 ] Dibawah 85
% dari target
[ 1 ] Dibawah 85
% dari target
[ 1 ] > 3 x tidak tepat waktu
[ 2 ] 85 - 90
% dari target
[ 2 ] 85 - 95
% dari target
[ 2 ] 3 x tidak tepat waktu
[ 3 ] 91 - 95
% dari
target [ 3 ] 96 - 99
% dari target [ 3 ] 2 x tidak tepat waktu
[ 4 ] 96 - 99
% dari
target [ 4 ] 100 %
dari target [ 4 ] 1 x tidak tepat waktu
[ 5 ] 100 %
dari target [ 5 ] > 100 %
dari target [ 5 ] Selalu tepat waktu
II.
KUALITAS [ 1 ] Dibawah 85
% dari target
[ 1 ] Dibawah 85
% dari target [ 1 ] > 3 x Kesalahan [ 2 ] 85 - 90
% dari
target [ 2 ] 85 - 95
% dari target [ 2 ] 3 x Kesalahan
[ 3 ] 91 - 95
% dari
target [ 3 ] 96 - 99
% dari target [ 3 ] 2 x Kesalahan [ 4 ] 96 - 99
% dari
target [ 4 ] 100 %
dari target [ 4 ] 1 x Kesalahan
[ 5 ] 100 % dari target
[ 5 ] > 100 % dari target
[ 5 ] Tidak pernah ada kesalahan
5. Pengolahan Data
Pada tahap ini melakukan proses
pemilihan data, dari 12 atribut dipilih 10
atribut yang digunakan dalam proses perhitungan dengan algoritma K-Means.
1. Cleaning Data
Pada tahap cleaning data dilakukan penghapusan data atribut yang tidak digunakan yaitu atribut kesehatan dan absensi dikarenakan seluruh karyawan mendapatkan penilaian maksimal sehingga tidak banyak mempengaruhi kedalam perhitungan K- means
2. Transformasi Data
Pada tahap transformasi data dilakukan perubahan data dari nominal menjadi numerik dikarenakan dalam proses perhitungan K-Means data yang digunakan adalah nilai numerik.
6. Metode Diusulkan
Gambar 2. metode data sample
Dalam tahapan ini dimulai dari Identifikasi masalah merupakan proses awal bagaimana memahami persoalan yang ada selanjutnya pada penentuan metode penelitian yang dilakukan dalam penelitian saat ini adalah metode data sampel, metode ini melakukan pengujian terhadap sejumlah data atau keseluruhan data sampel, pembersihan atribut/preprosessing
Untuk indentifikasi variabel data sampel dalam perencanaan ini yaitu menentukan variabelvariabel yang memiliki kaitan yang dekat antar variabel dan kemudian dari data sampel akan ditentukan besaran jumlah data dari 451 record data .
Gambar 3. Model alur penelitian
III. Hasil Pembahasan
Pemodelan pada penelitian ni dilakukan dengan data mining teknik klasifikasi algoritma K-Means Clustering, Teknik ni dipilih karena merupakan metode yang umum dipakai pada penelitian data mining untuk mengklasifikasi atau mengenali data- Diagnosa data sample
Perencanaan data sampel
Pengolahan data sampel
Evaluasi
data baru yang belum pernah dipelajari terutama pada data penilaian prestasi kinerja karyawan produksi. Algoritma yang akan diterapkan pada penelitian ni adalah algoritma K-Means Clustering. Algoritma ni merupakan algoritma yang sudah mapan dan banyak diimplementasikan pada teknik klasifikasi. Selain tu algoritma ni memiliki kelebihan yaitu berupa akurasinya yang baik dalam menangani sebuah dataset yang diolah. Davies-Bouldin Index merupakan salah satu metode yang digunakan untuk mengukur validitas cluster pada suatu metode pengelompokan, kohesi didefinisikan sebagai jumlah dari kedekatan data terhadap titik pusat cluster dari cluster yang diikuti, Evaluasi menggunakan Davies Bouldin Index ini memiliki skema evaluasi internal cluster, dimana baik atau tidaknya hasil cluster dilihat dari kuantitas dan kedekatan antar data hasil cluster. Berdasarkan tahapan data mining untuk algoritma K-Means, dengan Langkah langkah sebagai berikut:
1. Dataset sampel penilaian karyawan Pada tahap ini dilakukan perhitungan dengan 10 data sampel diambil dari dataset penilaian karyawan pada plant 1
Tabel 4.. Taining penilaian kinerja
2. Mentukan jumlah cluster
Menentukan jumlah cluster yang digunakan pada perhitungan ini adalah 4 cluster, penilaian karyawan “Sangat Baik (C1)”, “Baik (C2)”, “Cukup (C3)”, dan
“Kurang (C4)”
Tabel 5. Sampel data Cluster pusat
No Na
m a
Line
Kreteria Penilaian P
1 P 2
P 3
P 4
P 5
P 6
P 7
P 8
P 9
P 10
1 K
1
Plan 1
5 5 5 5 5 5 5 5 5 5
2 K
2 4 3 3 3 3 3 3 3 3 3
3 K
3 4 5 3 3 4 5 3 5 3 3
4 K
4 5 5 5 5 3 4 3 4 5 5
5 K
5 5 5 5 4 5 5 4 4 4 4
6 K
6 4 3 5 3 4 5 5 5 3 3
7 K
7 3 5 3 3 4 5 3 5 3 3
8 K
8 4 5 5 4 5 5 3 5 4 4
9 K
9 5 5 3 5 4 5 5 5 5 5
10 K
10 5 5 3 4 5 5 5 5 4 4
11 K
11 5 4 5 5 5 5 5 4 3 4
12 K
12 4 3 5 5 4 5 5 3 4 3
N o
Clust err
P 1
P 2
P 3
P 4
P 5
P 6
P 7
P 8
P 9
P1 0
1 C1 5 5 5 5 5 5 5 5 5 5
2 C2 5 5 5 5 3 4 3 4 5 5
3 C3 3 5 3 3 4 5 3 5 3 3
4 C4 3 3 3 3 3 3 3 3 3 3
3. Perhitungan Eunclidean Distance Untuk menghitung jarak anatara data dengan pusat cluster jarak centroid atau rata- rata dari data yang ada ke masing-masing kluster.
Dengan rumus:
Eunclidean Distance.
𝑫e= √(x𝒊 − s𝒊)² + (y𝒊 − t𝒊) ²
Tabel 6. Hasil sampel data Cluster pusat
No Nama Jarak Ke Cluster
Cluster C1 C2 C3 C4
1 Warsito 0,00 3,16 5,00 6,32 1 2 Pirgiawan 6,08 4,80 3,74 1,00 4 3 Bahrudin 4,69 4,47 1,00 3,74 3 4 Erwin
Sunandar 3,16 0,00 4,80 5,10 2 5 Firdaus 2,24 3,00 3,74 5,00 1 6 Hasbullah 4,24 4,90 3,61 4,24 3 7 Ipan
Permana 5,00 4,80 0,00 3,61 3 8 Jaja
Taryana 2,83 3,16 3,00 4,47 1 9 Rohadi 2,24 3,32 4,47 5,79 1
10 Suparno 2,65 4,12 3,46 5,20 1
11
Ujang Komarudi n
2,65 3,87 4,47 5,20 1
12 Untung
Tugiono 4,36 3,61 4,24 3,87 2
4.
Perhitungan pusat cluster baru
Setelah data dihitung dan ditempatkan pada masing-masing cluster terdekat, maka selanjutnya menghitung kembali data untuk mendapatkan pusat cluster yang baru berdasarkan, yakni berdasarkan nilai rata-rata dari masing-masing variabel, pada masing- masing cluster. Adapun perhitungannya sebagai berikut:
Tabel 7. Centeroid baru
No PK
Jarak Ke Cluster C1 C2 C3 C4
27 98 210 116
1 P1 73,41 20,22 9,43 17,09 2 P2 71,41 19,67 9,18 16,62 3 P3 71,37 19,66 9,17 16,61 4 P4 69,07 19,03 8,88 16,08 5 P5 71,41 19,67 9,18 16,62
6 P6 72,3 19,92 9,29 16,83
7 P7 71,67 19,74 9,21 16,68 8 P8 70,74 19,49 9,09 16,47 9 P9 68,15 18,78 8,76 15,86
10 P10 70,69 19,46 9.08 16,44