1
PENDAHULUAN
1.1. Latar Belakang Masalah
Sumber daya manusia (SDM) memegang peranan yang sangat dominan dalam aktivitas atau kegiatan perusahaan. Berhasil atau tidaknya perusahaan dalam mencapai tujuan yang ditetapkan sebelumnya sangat tergantung pada kemampuan sumber daya manusianya (pegawai) dalam menjalankan tugas-tugas yang diberikan kepadanya. Oleh karena itu, setiap perusahaan perlu memikirkan bagaimana cara yang dapat dilakukan untuk mengembangkan sumber daya manusianya agar dapat mendorong kemajuan bagi perusahaan dan bagaimana caranya agar pegawai tersebut memiliki produktivitas yang tinggi, yang tentunya pimpinan perusahaan perlu memotivasi pegawainya (Windarto, 2017).
Keberhasilan suatu perusahaan dapat dipengaruhi oleh kinerja pegawai (job performance) atau hasil kerja yang telah dicapai oleh seorang pegawai dalam melakukan tugas sesuai dengan tanggung jawab yang diberikan kepadanya.
Pegawai merupakan sumber daya yang penting bagi perusahaan, karena memiliki bakat, tenaga dan kreativitas yang sangat dibutuhkan oleh organisasi untuk mencapai tujuannya. Maka dari itu data kehadiran merupakan salah satu faktor penting untuk menentukan pegawai teladan atau menentukan pegawai yang berdampak akan di PHK. Data kehadiran atau absensi digunakan untuk mengetahui dan memantau kehadiran setiap pegawai. Selain itu absensi juga digunakan untuk menghitung jumlah jam kerja setiap pegawai pada periode tertentu dan sebagai
dasar penghitungan gaji pegawai baik gaji tetap, gaji lembur maupun pemotongan gaji. Itulah yang menyebabkan absensi sangat penting (Amuharnis, Fikry, & Aswin, 2014).
Untuk itu maka diadakannya pengolahan data kehadiran untuk mengelompokan setiap pegawai dengan metode data mining. Pengambilan keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna membantu mengambil kesimpulan, hal ini menjadikan munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah yang besar, yang disebut dengan Data Mining. Penggunaan teknik Data Mining diharapkan dapat memberikan pengetahuan-pengetahuan yang sebelumnya (Purba, Siawin, &
Hardih, 2019). Data hasil penerimaan setiap tahunnya cukup banyak sehingga apabila tidak dimanfaatkan data tersebut akan menjadi tumpukan data pada gudang data. Data mining merupakan metode untuk menggali dan mencari pengetahuan baru dari data tumpukan data tersebut (Yutanto & Setiawan, 2018).
Data mining merupakan suatu istilah yang di gunakan untuk menguraikan penemuan pengetahuan di dalam database (Nofriansyah, 2015). Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik data yang ada di database yang besar (Siregar & Puspabhuana, 2016). Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi in formasi yang bermanfaat dan pengetahuan yang terakit dari berbagai database besar (T. Larose & D. Larose, 2014). Konsep data mining adalah
sebagai proses atau teknik pemodelan yang mempergunakan analisis dengan variasi data yang banyak untuk mendapatkan pola dan hubungan diantara variasi data tersebut. Kehadiran data mining dilatarbelakangi dengan adanya masalah data explosion atau ledakan data yang dialami oleh banyak organisasi yang telah mengumpulkan data sekian tahun lamanya (Yutanto & Setiawan, 2018). Sehingga dapat disimpulkan bahwa data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang belum diketahui sebelumnya dari sebuah database.
Clustering atau klasifikasi adalah metode yang digunakan untuk membagi rangkaian data menjadi beberapa group berdasarkan kesamaan-kesamaan yang telah ditentukan sebelumnya. Cluster adalah sekelom-pok atau sekumpulan objek- objek data yang similar satu sama lain dalam cluster yang sama dan disimilar terhadap objek-objek yang berbeda cluster. Objek akan dikelomokkan ke dalam satu atau lebih cluster sehingga objek-objek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satudengan yang lainnya (Metisen & Sari, 2015).
Algoritma K-Means merupakan metode non hierarki yang pada awalnya mengambil sebagian banyaknya komponen populasi untuk dijadikan pusat cluster awal. Pada tahap ini pusat cluster dipilih secara acak dari sekumpulan populasi data.
Berikutnya K-Means menguji masing-masing komponen di dalam populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-tiap cluster. Posisi pusat cluster akan dihitung kembali sampai semua komponen data digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan terbentuk posisi
pusat cluster yang baru (Metisen & Sari, 2015). Metode K-Means Cluster bisa menjadi solusi untuk pengklasifikasian karakteristik dari objek. Algoritma K- Means memiliki ketelitian yang cukup tinggi terhadap ukuran objek, sehingga algoritma ini relatif lebih terukur dan efisien untuk pengolahan objek dalam jumlah besar. Selain itu algoritma K-Means ini tidak terpengaruh terhadap urutan objek (Aranda & Galvani, 2016).
Metode K-Means Clustering membantu pihak pengambil keputusan dalam melakukan pengelompokkan data pegawai sehingga dapat memiliki informasi pegawai yang memiliki potensi terkena PHK dari beberapa kriteria yang telah ditentukan sehingga hasil penilaiannya lebih obyektif dan akurat (Purba, Siawin, &
Hardih, 2019).
Fakultas Teknik Sipil dan Lingkungan ITB merupakan salah satu institusi yang bergerak dalam dunia Pendidikan, yang memiliki staff pegawai tetap dan PKWT (Perjanjian Kerja Waktu Tertentu). Pada instansi tersebut dapat di peroleh data historis kehadiran pegawai. Pengolahan data ini dapat membantu menentukan pegawai teladan dan berpotensi PHK untuk kemajuan sebuah perusahaan atau instansi. Salah satunya dengan mengelompokan data kehadiran pegawai.
Menimbang dari latar belakang masalah diatas maka penulis mengambil penelitian skripsi dengan judul “Penerapan K-Means Clustering Untuk Penentuan Keputusan Pegawai Teladan Dan Berpotensi PHK Berdasarkan Data Kehadiran”.
1.2. Identifikasi Permasalahan
Berdasarkan latar belakang masalah di atas maka indentifikasi masalah dari penelitian ini adalah :
1. Perlu adanya pengolahan data kehadiran agar dapat menemukan informasi penting yang dapat membantu pihak perusahan atau instansi dalam penentuan pegawai berpotensi PHK.
2. Belum adanya pengelompokan data kehadiran pegawai sesuai jam kerja menggunakan metode K-Means.
1.3. Maksud dan Tujuan
Maksud dan tujuan penelitian ini adalah :
1. Melakukan pengolahan data kehadiran pegawai untuk mendapatkan hasil yang dapat membantu pihak perusahaan atau instansi dalam menentukan pegawai teladan berpotensi PHK.
2. Memudahkan pihak pengambil keputusan untuk mengelompokan pegawai sesuai dengan data menggunakan metode K-Means.
Tujuan dari pembuatan skripsi ini adalah salah satu syarat dalam menyelesaikan program studi strata satu (S1) dan lulus pada jurusan Sistem Informasi di Universitas BSI Bandung.
1.4. Metode Penelitian
Metode yang digunakan dalam penelitian ini antara lain adalah : 1. Observasi
Melakukan permintaan data kehadiran ke staff administrasi dan kepegawaian di Fakultas Teknik Sipil dan Lingkungan ITB.
2. Wawancara
Melakukan wawancara langsung kepada staff administrasi dan kepegawaian untuk mengetahui data kehadiran pegawai.
3. Studi Pustaka
Untuk mendukung penelitian ini, maka dilakukan studi pustaka dengan mengumpulkan data dan informasi dari beberapa sumber, seperti media internet, jurnal, dan beberapa buku referensi.
1.5. Ruang Lingkup
Ruang lingkup pada penelitian ini adalah sebagai berikut :
1. Penilaian ini berfokus pada perhitungan cluster untuk pengelompokan data kehadiran pegawai.
2. Data yang digunakan sebagai sumber merupakan data kehadiran yang di ambil di perusahaan sesuai jam kerja di Fakultas Teknik Sipil dan Lingkungan ITB.
3. Data yang digunakan adalah data yang telah di lakukan proses cleaning dan transformation.