Penerapan Algoritma C4.5 Dalam Analisa Kelayakan Penerima Bonus Tahunan Pegawai (Studi Kasus : PT. Multi Pratama Nauli Medan)
Guntur Syahputra,M.Kom Program Studi Manajemen Informatika
STMIK Pelita Nusantara Medan, Jl. Iskandar Muda No 1 Medan, Sumatera Utara 20154, Indonesia [email protected]
Abstrak
Data mining adalah serangkaian proses untuk menggali nilai tambah dengan mencari pola atau aturan tertentu dari bongkahan data (database) yang besar untuk mendapatkan sebuah informasi atau pengetahuan baru yang selama ini tidak diketahui secara manual, yang diharapkan dapat dijadikan suatu pola keputusan yang nantinya akan digunakan dalam menganalisa kelayakan penerima bonus tahunan pegawai.
Penerapan algoritma C4.5, dapat digunakan dalam menganalisa pegawai yang layak atau tidaknya untuk menerima bonus tahunan ini berdasarkan kriteria yang telah ditetapkan yang akan menghasilkan suatu pohon keputusan, dari pohon keputusan inilah, akan diambil pengetahuan-pengetahuan baru berupa rules atau aturan-aturan yang akan dijadikan pola keputusan. Oleh karena itu dapat membantu seorang pimpinan perusahaan dalam menganalisa pegawai yang layak untuk menerima bonus tahunan ini.
Kata Kunci : Bonus Tahunan Pegawai, Algoritma C4.5 I PENDAHULUAN
1.1 Latar Belakang Penelitian
Salah satunya dalam meningkatkan kualitas dan loyalitas pegawai pada PT. Multi Pratama Nauli Medan, maka setiap tahunnya pimpinan perusahaan memberikan bonus pada pegawai yang berprestasi dengan kriteria-kriteria yang telah ditetapkan. Karena banyaknya kriteria dan data pegawai yang dianalisa, maka seorang pimpinan perusahaan harus bekerja keras dalam menganalisa pegawai mana yang layak dalam menerima bonus tahunan ini. Maka diperlukan pengolahan data lebih lanjut untuk menemukan informasi atau pengetahuan baru yang berguna sebagai pembantu dalam mengambil keputusan.
Oleh karena itu, pembentukan suatu pola keputusan sangat diperlukan karena dapat menghindari permasalahan tersebut.
Penerapan algoritma C4.5 merupakan salah satu solusi pemecahan kasus yang sering digunakan dalam pemecahan masalah pada teknik klasifikasi yang memiliki karakteristik yaitu dengan proses penentuan nilai entropy dan nilai gain dari kemungkinan setiap kriteria yang menjadi acuan keputusan yang dilanjutkan dengan proses perangkingan dari hasil keputusan. Keluaran dari algoritma C4.5 yaitu berupa sebuah pohon keputusan (decision tree). Pohon keputusan adalah sebuah struktur yang dapat digunakan untuk mengubah data menjadi pohon keputusan yang akan menghasilkan aturan-aturan keputusan
1.2 Rumusan Masalah
Berdasarkan uraian yang terdapat pada latar belakang, maka permasalahan pokok yang akan dibahas yaitu :
1. Bagaimana memanfaatkan data mining dengan menggunakan algoritma C4.5 dalam menganalisa kelayakan penerima bonus tahunan pegawai pada PT. Multi Pratama Nauli Medan?
2. Bagaimana menerapkan algoritma C4.5 dalam kelayakan penerima bonus tahunan pegawai pada PT. Multi Pratama Nauli Medan ?
2.1 Tujuan Penelitian
Tujuan dilakukannya penelitian ini adalah : 1. Merancang aplikasi Sistem Pendukung
KeputusanSiswa Berprestasi Menggunakan Metode AHP (Analytic Hierarchy Process) Pada SMK Singosari Delitua.
2. Membangun aplikasi Sistem Pendukung Keputusan Siswa Berprestasi Menggunakan Metode AHP (Analytic Hierarchy Process) Pada SMK Singosari Delitua.
II Landasan Teori Dan Kerangka Pemikiran 2.1 Defenisi Sistem
Menurut (Sukma Putri Utari, 2015 Volume :
IX, Nomor: 3) Algoritma C4.5 merupakan
algoritma yang digunakan untuk membentuk
pohon keputusan. Sedang pohon keputusan dapat
diartikan suatu cara untuk memprediksi atau
mengklarifikasi yang sangat kuat. Pohon
keputusan dapat membagi kumpulan data yang
besar menjadi himpunan-himpunan record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Rumus Algoritma C4.5 terbagi menjadi 2 rumus, yang pertama rumus untuk mencari nilai gain
( ) ( ) ∑| |
| |
( ) ( )
Keterangan :
S : Himpunan kasus A : Atribut
n : Jumlah Partisi Atribut A
|Si| : Jumlah kasus pada partisi ke-i
|S| : Jumlah Kasus dalam S
Dan rumus yang kedua adalah untuk mencari nilai entropy.
( ) ∑
( )
2.2 Decision Tree
Sistem Pendukung Keputusan (SPK) / Desision tree (pohon keputusan) merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami.
Dan mereka juga dapat diekpresikan dalam bentuk bahasa basis data seperti Structured Query Language untuk mencari record pada kategori tertentu.
A decision tree is a structure that can be used to divide large datasets into the sets of records that are smaller by applying a set of decision rules. With each of the division series, members of the result set to be similar to one another. (Berry & Linoff, 2004:14) yang artinya Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi kumpulan data yang besar menjadi himpunan-himpunan record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Dengan masing- masing rangkaian pembagian, anggota himpu nan hasil menjadi mirip satu dengan yang lain.
“Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, anatara lain ID3, CART dan C4.5. Algoritma C4.5 merupakan pengembangan dari algoritma ID3 (Larose, 2005:14).”
Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan record.
Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan pohon.
Misalkan untuk menentukan main tenis, kriteria yang diperhatikan adalah cuaca, angin, dan temperatur. Salah satu atribut merupakan atribut yang menyatakan data solusi per item data yang disebut target atribut. Atribut memiliki nilai-nilai yang dinamakan dengan instance. Misalkan
atribut cuaca mempunyai instance berupa cerah, berawan, dan hujan (Basuki & Syarif, 2003:14).
“Proses pada pohon keputusan adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model pohon menjadi rule, dan menyederhanakan rule (Basuki & Syarif, 2003:14).”
2.3 Rapid Miner
Rapid Miner merupakan perangkat lunak yang bersifat terbuka (open source). Rapid Miner adalah sebuah solusi untuk melakukan analisis prediksi. Rapid Miner menggunakan berbagai teknik deskriptif dan prediksi dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang paling baik. Rapid Miner memiliki kurang lebih 500 operator data mining, termasuk operator untuk input, output, data preprocessing dan visualisasi. Rapid Miner merupakan software yang berdiri sendiri untuk analisis data dan sebagai mesin data mining yang dapat diitegrasikan pada produknya sendiri.
Rapid Miner ditulis dengan menggunakan bahasa java sehingga dapat bekerja di semua sistem operasi.
Rapid Miner menyediakan GUI (Graphic User Iterface) untuk merancang
sebuah pipeline analitis. GUI ini akan menghasilkan file XML (Extensible Markup Language) yang mendefenisikan proses analitis keinginan pengguna untuk diterapkan ke data.
File ini kemudian dibaca oleh Rapid Miner untuk menjalankan analis secara otomatis.
Rapid Miner memiliki beberapa sifat sebagai berikut :
1. Ditulis dengan bahasa pemrograman java sehingga dapat dijalankan diberbagai sistem operasi.
2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.
3. Representasi XML internal untuk memastikan format standar pertukaran data.
4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan otomatisasi eksperimen.
5. Konsep multi-layer untuk menjamin tampilan data yang efisien dan menjamin penanganan data.
6. Memiliki GUI, command line mode, dan java API yang dapat dipanggil dari program lain.
(Wicaksana, dkk, Belajar Data Mining Dengan Rapid Miner, 2009)
III Metodologi Penelitian
3.1.1 Teknik Pengumpulan Data
Adapun teknik pengumpulan data yang
penulis lakukan pada PT. Multi Pratama Nauli
Medan yaitu dengan melakukan pengamatan
penelitian lapangan (field study) secara langsung dengan cara :
1. Wawancara (interview) kepada pimpinan serta seluruh pegawai PT. Multi Pratama Nauli Medan.
2. Pengamatan (observation) langsung ke tempat objek penelitian yaitu PT. Multi Pratama Nauli Medan. Serta melakukan penelitian keperpustakaan (library) untuk pengumpulan data yang bersifat teoritis dengan membaca buku, mata kuliah, dan tulisan lainnya.
3.1.2 Teknik Analisis Data
Dalam penelitian yang dilakukan penulis pada PT. Multi Pratama Nauli Medan, teknik analisis data dilakukan dengan cara :
1. Menyeleksi data yang sesuai dengan fokus masalah penelitian yang dikumpulkan dari hasil wawancara (kepada Kepala Sekolah, guru-guru,staf pegawai)dan pengamatan langsung PT. Multi Pratama Nauli Medan.
2. Menganalisis data hasil seleksi untuk menarik kesimpulan dan mengambil tindakan.
3. Membuat kesimpulan berdasarkan analisis data.
3.2 Analisa Masalah
Kegiatan seleksi siswa berprestasi merupakan kegiatan yang dilaksanakan oleh banyak sekolah setiap tahunnya. Kenyataan dilapangan bahwa pihak sekolah jarang yang siap dalam penyelenggaraan seleksi siswa berprestasi. Masalah administrasi yang bersifat manual mengakibatkan kurang efisiennya kegiatan seleksi siswa berprestasi. Oleh karena itu, penulis berinisiatif untuk merancang suatu sistem yang dapat membantu pihak sekolah dalam pengambil keputusan seleksisiswa berprestasi, sehingga dapat lebih efisien dalam pelaksanaannya.
3.2.1. Analisa Data Pegawai
Data yang digunakan dalam membentuk pohon keputusan adalah data kinerja seluruh pegawai pada PT. Multi Pratama Nauli Medan dengan kriteria-kriteria yang telah ditetapkan perusahaan dalam analisa kelayakan penerima bonus tahunan pegawai pada PT. Multi Pratama Nauli Medan. Data tersebut di dapat dari pekerjaan Rehabilitasi Jaringan Irigasi D.I.
Balangka Sitongkon 1.017 Ha (417 Ha) Kab.
Padang Lawas, selanjutnya akan dilakukan praproses untuk menghasilkan data kasus yang siap untuk dibentuk menjadi pohon keputusan.
Praproses data meliputi : 1. Seleksi data
Untuk memilih data yang akan digunakan dalam penelitian ini, yaitu data kinerja
seluruh pegawai pada PT. Multi Pratama Nauli Medan. Dari data yang ada, kolom yang diambil sebagai atribut/variabel dalam pembentukan pohon keputusan adalah : a. Masa Kerja
b. Kehadiran c. Loyalitas d. Hasil Pekerjaan 2. Pembersihan data
Untuk membersihkan data, yaitu melengkapi data, menghapus data duplikat, menghilangkan noise.
3. Transformasi data
Data diubah atau digabung kedalam format yang sesuai untuk diproses dalam data mining agar data siap dihitung menggunakan algoritma C4.5.
Berikut adalah data kinerja pegawai pada PT.
Multi Pratama Nauli Medan:
Tabel 3.1 Data Kinerja Pegawai
No
Nama MasaKerja Kehadiran Loyalitas Hasil
Pekerjaan
1
Desi Leman 10 thn 80% 65% 902
BayuSyahputra 5 thn 80% 65% 90
3
Putri Permata Sari
7 thn 75% 75% 90
4
NovitaSafriani 3 bln 85% 80% 60
5
Susi Wjaya 3 thn 85% 80% 706
Elim Wan 10 bln 65% 70% 707
Sintia 2 thn 77% 80% 658
ElfridaManulang 8 thn 65% 80% 65
9
Elly Suparti 5 bln 65% 70% 8010
GestiYolanda 9 bln 70% 85% 70
11
HariSusanto 2 thn 70% 60% 75
12
HeliantiniManulang 3 thn 70% 60% 75
13
IndahPurnama 9 thn 80% 70% 90
14
Joko IndraPrasetyo 6 thn 80% 65% 80
15
Jumini 4 thn 65% 60% 6516
Lisa AdeYanti 2 thn 65% 65% 65
17
M. Alfan 11 bln 80% 85% 7018
Maryati 5 bln 70% 75% 7019
MellyPurnama 3 thn 70% 75% 75
20
Merryana 2 thn 80% 80% 8521
Nur AbidaSiregar 10 bln 70% 65% 60
22
RaniWahyuni 5 thn 70% 65% 65
23
AfrianiGirsang 8 thn 80% 75% 80
24 Noni Elni
Siregar 7 thn 70% 85% 85 25 Dita Lifia 8 bln 70% 75% 70 26 Nirwana
Wisnu 5 thn 65% 65% 75
27 Juliana 10 thn 65% 85% 80 28 Sumatri 5 thn 75% 65% 65 29 Suriani 8 bln 80% 75% 80
30 Surip 8 thn 85% 70% 85
31 Suryandi 7 bln 70% 65% 70 32 Liona
Pringka 7 bln 80% 80% 70 33 Fury Ayu 3 thn 65% 80% 85 34 Budi
Alamsyah 5 thn 75% 80% 85
35 Heru Pratama Putra
3 thn 80% 70% 75
Sumber : PT. Multi Pratama Nauli Medan Keterangan :
Dari tabel diatas, dapat dijelaskan bahwa data yang diperoleh merupakan data hasil olahan pertahunnya, yaitu data kinerja seluruh pegawai pada PT. Multi Pratama Nauli Medan karena keterbatasan data, kemampuan dan waktu dan juga data yang bersifat pribadi. Pada tahap ini proses pembersihan data tidak dilakukan karena data dianggap sudah siap untuk dipergunakan.
Selanjutnya akan dilakukan proses transformasi data yaitu data diubah kedalam format yang sesuai untuk diproses dalam data mining agar data siap dihitung menggunakan algoritma C4.5.
Berikut merupakan tabel hasil dari transformasi data kinerja pegawai.
Tabel 3.2 Transformasi Data Kinerja Pegawai
No
Nama Kerja Masa Kehadiran Loyalitas Pekerjaan Hasil Tahunan Bonus1
Desi Leman MS Bagus Kurang Baik Layak2
Bayu Syahputra MS Bagus Kurang Baik Layak3
Putri Permata Sari
MS Bagus Cukup Baik Layak
4
Novita Safriani TS Bagus Baik Kurang Layak Tdk5
Susi Wjaya MS Bagus Baik Cukup Layak Tdk6
Elim Wan TS Tidak Cukup Cukup TdkLayak
7
Sintia MS Bagus Baik Kurang Layak Tdk8
Elfrida Manulang MS Tidak Baik Kurang Layak Tdk9
Elly Suparti TS Tidak Cukup Baik Layak Tdk10
Gesti Yolanda TS Tidak Baik Cukup Layak Tdk11
Hari Susanto MS Tidak Kurang Cukup Layak Tdk12
HeliantiniManulang MS Tidak Kurang Cukup Tdk Layak
13
Indah Purnama MS Bagus Cukup Baik Layak14
Joko IndraPrasetyo MS Bagus Kurang Baik Layak
15
Jumini MS Tidak Kurang Kurang Layak Tdk16
Lisa Ade Yanti MS Tidak Kurang Kurang Layak Tdk17
M. Alfan TS Bagus Baik Cukup Layak Tdk18
Maryati TS Tidak Cukup Cukup Layak Tdk19
Melly Purnama MS Tidak Cukup Cukup Layak Tdk20
Merryana MS Bagus Baik Baik Layak21
Nur AbidaSiregar TS Tidak Kurang Kurang Tdk Layak
22
RaniWahyuni MS Tidak Kurang Kurang Tdk Layak
23
AfrianiGirsang MS Bagus Cukup Baik Layak
24
Noni ElniSiregar MS Tidak Baik Baik Tdk Layak
25
DitaLifia TS Tidak Cukup Cukup Tdk Layak
26
NirwanaWisnu MS Tidak Kurang Cukup Tdk Layak
27
Juliana MS Tidak Baik Baik TdkLayak
28
Sumatri MS Bagus Kurang Kurang TdkLayak
29
Suriani TS Bagus Cukup Baik TdkLayak
30
Surip MS Bagus Cukup Baik Layak31
Suryandi TS Tidak Kurang Cukup TdkLayak
32
LionaPringka TS Bagus Baik Cukup Tdk Layak
33
FuryAyu MS Tidak Baik Baik Tdk
Layak
34
BudiAlamsyah MS Bagus Baik Baik Layak
35
Heru PratamaPutra
MS Bagus Cukup Cukup Tdk Layak
Keterangan :
Dari tabel diatas, dapat dijelaskan bahwa setiap pegawai yang layak dalam menerima bonus tahunan pegawai ditentukan oleh :
1. Masa Kerja
Untuk masa kerja terbagi atas 2 (dua) transformasi data yaitu :
a. MS (Memenuhi Syarat)
Masa kerja memenuhi syarat apabila masa kerja dari setiap atribut pada tabel asal (data kinerja pegawai) adalah minimal 2 tahun.
b. TS (Tidak Memenuhi Syarat)
Masa kerja tidak memenuhi syarat apabila masa kerja dari setiap atribut pada tabel asal (data kinerja pegawai) adalah kurang dari 2 tahun.
2. Kehadiran
Untuk kehadiran terbagi atas 2 (dua) transformasi data yaitu :
a. Bagus
Kehadiran bagus apabila kehadiran pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) minimal 75% per tahun.
b. Tidak Bagus
Kehadiran tidak bagus apabila kehadiran pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) kurang dari 75% per tahun.
3. Loyalitas
Untuk loyalitas terbagi atas 3 (tiga) transformasi data yaitu :
a. Baik
Loyalitas baik apabila loyalitas pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) minimal 80% per tahun.
b. Cukup
Loyalitas cukup apabila loyalitas pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) 70%
sampai 75% per tahun.
c. Kurang
Loyalitas kurang apabila loyalitas pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) kurang dari 70% per tahun.
4. Hasil Pekerjaan
Untuk hasil pekerjaan terbagi atas 3 (tiga) transformasi data yaitu :
a. Baik
Hasil pekerjaan baik apabila hasil pekerjaan pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) mempunyai nilai 80 sampai 90 per tahun.
b. Cukup
Hasil pekerjaan cukup apabila hasil pekerjaan pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) mempunyai nilai 70 sampai 75 per tahun.
c. Kurang
Hasil pekerjaan kurang apabila hasil pekerjaan pegawai dari setiap atribut pada tabel asal (data kinerja pegawai) mempunyai nilai kurang dari 65 per tahun.
Data yang digunakan dalam membentuk pohon keputusan adalah data kinerja seluruh pegawai pada PT. Multi Pratama Nauli Medan dengan kriteria-kriteria yang telah ditetapkan perusahaan dalam analisa kelayakan penerima bonus tahunan pegawai pada PT. Multi Pratama Nauli Medan. Data tersebut di dapat dari pekerjaan Rehabilitasi Jaringan Irigasi D.I.
Balangka Sitongkon 1.017 Ha (417 Ha) Kab.
Padang Lawas, selanjutnya akan dilakukan praproses untuk menghasilkan data kasus yang siap untuk dibentuk menjadi pohon keputusan.
Praproses data meliputi : 4. Seleksi data
Untuk memilih data yang akan digunakan dalam penelitian ini, yaitu data kinerja seluruh pegawai pada PT. Multi Pratama Nauli Medan. Dari data yang ada, kolom yang diambil sebagai atribut/variabel dalam pembentukan pohon keputusan adalah : e. Masa Kerja
f. Kehadiran g. Loyalitas h. Hasil Pekerjaan 5. Pembersihan data
Untuk membersihkan data, yaitu melengkapi data, menghapus data duplikat, menghilangkan noise.
6. Transformasi data
Data diubah atau digabung kedalam format yang sesuai untuk diproses dalam data mining agar data siap dihitung menggunakan algoritma C4.5.
Berikut adalah data kinerja pegawai pada PT.
Multi Pratama Nauli Medan:
Tabel 3.3 Data Kinerja Pegawai
No Nama Masa
Kerja Kehadiran Loyalitas Hasil Kerja 1 Desi
Leman
10
thn 80% 65% 90
2 Bayu
Syahputra 5 thn 80% 65% 90 3
Putri Permata Sari
7 thn 75% 75% 90
4 Novita 3 bln 85% 80% 60
Safriani
5 Susi Wjaya 3 thn 85% 80% 70 6 Elim Wan 10
bln 65% 70% 70
7 Sintia 2 thn 77% 80% 65
8 Elfrida
Manulang 8 thn 65% 80% 65 9 Elly
Suparti 5 bln 65% 70% 80
10 Gesti
Yolanda 9 bln 70% 85% 70
11 Hari
Susanto 2 thn 70% 60% 75
12 Heliantini
Manulang 3 thn 70% 60% 75 13 Indah
Purnama 9 thn 80% 70% 90
14 Joko Indra
Prasetyo 6 thn 80% 65% 80
15 Jumini 4 thn 65% 60% 65
16 Lisa Ade
Yanti 2 thn 65% 65% 65
17 M. Alfan 11
bln 80% 85% 70
18 Maryati 5 bln 70% 75% 70
19 Melly
Purnama 3 thn 70% 75% 75
20 Merryana 2 thn 80% 80% 85 21 Nur Abida
Siregar
10
bln 70% 65% 60
22 Rani
Wahyuni 5 thn 70% 65% 65
23 Afriani
Girsang 8 thn 80% 75% 80
24 Noni Elni
Siregar 7 thn 70% 85% 85
25 Dita Lifia 8 bln 70% 75% 70 26 Nirwana
Wisnu 5 thn 65% 65% 75
27 Juliana 10
thn 65% 85% 80
28 Sumatri 5 thn 75% 65% 65
29 Suriani 8 bln 80% 75% 80
30 Surip 8 thn 85% 70% 85
31 Suryandi 7 bln 70% 65% 70 32 Liona
Pringka 7 bln 80% 80% 70 33 Fury Ayu 3 thn 65% 80% 85 34 Budi
Alamsyah 5 thn 75% 80% 85 35
Heru Pratama Putra
3 thn 80% 70% 75
Sumber : PT. Multi Pratama Nauli Medan
Keterangan :
Dari tabel diatas, dapat dijelaskan bahwa data yang diperoleh merupakan data hasil olahan pertahunnya, yaitu data kinerja seluruh pegawai pada PT. Multi Pratama Nauli Medan karena keterbatasan data, kemampuan dan waktu dan juga data yang bersifat pribadi. Pada tahap ini proses pembersihan data tidak dilakukan karena data dianggap sudah siap untuk dipergunakan.
Selanjutnya akan dilakukan proses transformasi data yaitu data diubah kedalam format yang sesuai untuk diproses dalam data mining agar data siap dihitung menggunakan algoritma C4.5.
Berikut merupakan tabel hasil dari transformasi data kinerja pegawai.
Tabel 3.4 Transformasi Data Kinerja Pegawai No
Nama Masa Kerja Keha diran Loya litas Pekerjaan HasilBonu s Tahu
nan