PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN
KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN
METODE DECISION TREE DAN C4.5
SKRIPSI
AANG ADYATMA
091402011
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN
KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN
METODE DECISION TREE DAN C4.5
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Teknologi Informasi
AANG ADYATMA 091402011
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2013
PERSETUJUAN
Judul : PEMANFAATAN DATA MINING PADA SISTEM
PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DAN C4.5
Kategori : SKRIPSI
Nama : AANG ADYATMA
Nomor Induk Mahasiswa : 091402011
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI (FASILKOMTI) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, April 2013
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Syahril Efendi, S.Si, M.IT Dr. Erna Budhiarti Nababan, M.IT
NIP NIP -
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
Prof. Dr. Opim Salim Sitompul, M.Sc. NIP 19610817 198701 1 001
PERNYATAAN
PEMANFAATAN DATA MINING PADA SISTEM PENGAMBILAN KEPUTUSAN PENERIMAAN KARYAWAN BARU DENGAN
METODE DECISION TREE DAN C4.5
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, April 2013
Aang Adyatma 091402011
UCAPAN TERIMA KASIH
Puji dan syukur penulis sampaikan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi S1 Teknologi Informasi Universitas Sumatera Utara. Ucapan terima kasih penulis sampaikan kepada:
1. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
2. Ucapan terima kasih juga ditujukan kepada Ketua dan Sekretaris Program Studi Teknologi Informasi, Prof. Dr. Opim Salim Sitompul, M.Sc. dan Drs. Sawaluddin, M.IT.
3. Ibu Dr. Erna Budhiarti Nababan, M.IT selaku pembimbing satu dan Bapak Syahril Efendi, S.Si, M.IT selaku pembimbing dua yang telah banyak meluangkan waktu dan pikirannya, memotivasi dan memberikan kritik dan saran kepada penulis. 4. Ucapan terima kasih juga ditujukan kepada M. Fadly Syahputra, B.Sc,M.Sc.IT dan
Romi Fadillah Rahmat, B.Comp.Sc.M.Sc yang telah bersedia menjadi dosen pembanding, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi. 5. Kedua orang tua dan keluarga penulis yang telah memberikan dukungan dan motivasi baik materil dan spiritual, Ayahanda Maman Faturahman dan Ibunda Elvida yang selalu sabar dalam mendidik dan membesarkan penulis. Untuk adik penulis Dhanu Elfitrah yang selalu memberikan dorongan kepada penulis.
6. Penulis juga mengucapkan terimakasih kepada Telkomsel area Sumatera yang telah membantu dan membimbing penulis dalam melakukan riset, Pak Agus Supranowo, Bang Ivren, Pak Ardy Afriadi, Ibu Mila Sari, dan Bang Wimby.
7. Terima kasih kepada teman-teman yang selalu memberikan dukungan, Satrya Prayudi, Rizki Mulki, Wildan Afifi, Mhd. Ari Rifki, Bagus Setiadi, Mhd. Rozy Lubis, Fuzi Frilla Kurnia, Umaya Ramadhani Nst, Nanda Putra,S.Ti, Musyafa Hutagalung, S.Ti, Fithra Prawiratama, Yogi Suryo Santoso, Ranap Katili Parulian, serta seluruh angkatan 09, teman-teman SRC, teman – teman TA, teman – teman sampali, serta teman-teman mahasiswa Teknologi Informasi lainnya yang tidak dapat penulis sebutkan satu persatu, Semoga Allah SWT membalas kebaikan kalian dengan nikmat yang berlimpah. Terimakasih kepada Indi Andira Butar - Butar, atas motivasi, semangat, dan hiburan, semoga kita bisa menggapai cita- cita yang kita inginkan.
Akhir kata, saya ucapkan terimakasih kepada semua pihak yang terkait dalam penyelesaian skripsi ini yang tidak bisa saya sebut satu persatu. Semoga Allah SWT membalas segala kebaikan yang sudah diberikan dan semoga Allah tetap memberi rahmat dan keberkahan kepada kita semua.
ABSTRAK
Pada penerimaan karyawan, sering sekali melibatkan data pelamar dalam jumlah besar, oleh sebab itu diperlukan sebuah aplikasi yang dapat memilah dan memproses data dalam jumlah besar, data dalam jumlah besar tersebut dapat memberikan informasi yang dibutuhkan. Manfaat data mining dapat diimplementasikan pada penerimaan karyawan yang melibatkan data dalam jumlah besar, teknik yang digunakan dalam aplikasi data mining ini adalah pohon keputusan, dengan algoritma C4.5, dimana data diklasifikasikan, dan dipilah sesuai variabel dan atribut yang ada. Setelah data dipilah, akan terlihat bagaimana kecenderungan pelamar yang akan diterima pada perusahaan, dengan mencari entropy dan gain tertinggi dibentuklah pohon keputusan, kemudian didapatkanlah rules yang akan dimasukkan kedalam aplikasi. Aplikasi tersebut dapat digunakan untuk memvalidasi data pelamar, apakah pelamar tersebut lulus atau tidak lulus dalam seleksi. Pengujian yang dilakukan terhadap berbagai data training menunjukkan bahwa semakin banyak data dan variasi dari data itu, akan menambah keakuratan sistem pengambilan keputusan, pengujian juga dilakukan terhadap data pelamar dari tahun 2009 sampai 2012 dengan data training terbanyak, pada suatu perusahaan diperoleh rata – rata keakuratan sebesar 70,9%.
Kata kunci : data mining, pohon keputusan, algoritma C4.5, Sistem Pengambilan Keputusan, Penerimaan.
IMPLEMENTATION DATA MINING IN DECISION SUPPORT SYSTEM RECRUITMENTS NEW EMPLOYEE WITH
DECISION TREE METHOD AND C4.5
ABSTRACT
In open employee recruitment, always involve the applicant data in large quantities, therefore, it need an application which can classify and process data in large numbers. It give information that we needs, the benefit of data mining can implemented in employee recruitments, technique in this application is decision tree with C4.5 algorithm, which the data classified and selectioned suitable with variable and the attribute. And will be seen how the tendency of applicants will be accepted at the company, with calculate the entropy and decision trees formed the highest gain, then found the rules will be incorporated into the application. The application can use for validate applicant data, whether the applicant passed or did not pass the selection. Tests were conducted on a variety of data indicate that the more training data and variety of the data that will increase the accuracy of decision-making system, and tests were conducted on applicant data from 2009 to 2012 the company acquired an average accuracy of 70.9%.
Keywords: data mining, decision tree, C4.5 algorithm, Decision Suport Systems, Acceptance.
DAFTAR ISI
Hal.
PERSETUJUAN ii
PERNYATAAN iii
UCAPAN TERIMA KASIH iv
ABSTRAK v
ABSTRACT vi
DAFTAR ISI vii
DAFTAR TABEL ix DAFTAR GAMBAR x BAB 1 1 PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah 3 1.3 Batasan Masalah 3 1.4 Tujuan Penelitian 3 1.5 Manfaat Penelitian 4 1.6 Metodologi Penelitian 4 1.7 Sistematika Penulisan 5 BAB 2 6 LANDASAN TEORI 6
2.1 Basis Data (Database) 6
2.1.1 DBMS (Database Management System) 7
2.2 Konsep dasar pengambilan keputusan 7
2.2.1 Tahapan Pengambilan Keputusan 7
2.3 Data Mining 8
2.3.1 Tahapan Data Mining 9
2.4 Pohon Keputusan 11
2.4.1 Konsep Pohon keputusan 11
2.4.2 Manfaat Metode Pohon Keputusan 12
2.4.3 Kelebihan Pohon Keputusan 12
2.4.4 Algoritma C4.5 13
BAB 3 16
ANALISIS DAN PERANCANGAN 16
3.1 Data 16
3.2 Pemrosesan Data 20
3.2.1 Data Cleaning (pembersihan data) 20
3.2.2 Data Integration 24
3.2.3 Data Selection 24
3.2.4 Data Transformation 26
3.2.5 Data Mining 26
3.2.5.1 Variabel 26
3.2.5.2 Pembentukan Pohon Keputusan 28
3.2.7 Knowledge Presentation 46
3.3 Analisis Komponen Sistem 48
3.3.1 Usecase Spesification 48
3.3.2 Data Flow Diagram (DFD) 49
3.3.2.1 DFD Level 0 49
3.3.2.2 DFD Level 1 51
3.3.2.3 DFD Level 2 52
3.3.3 Sitemap Aplikasi 56
3.3.4 Flowchart Perancangan Algoritma C4.5 57
3.4 Database Relationship 59
3.5 Antarmuka Sistem 60
3.5.1 Form Login 60
3.5.2 Halaman Awal (Home) 61
3.5.3 Halaman Sistem Pendukung Keputusan (SPK) 62
3.5.4 Form Input Data Pelamar 63
3.5.5 Halaman Menampilkan Pelamar 64
3.5.6 Halaman Menampilkan Pelamar 65
3.5.7 Halaman Management Data Pelamar 66
3.5.8 Halaman Laporan 67
3.5.9 Halaman Control Panel 68
3.5.10 Halaman Ganti Password 69
BAB 4 70
IMPLEMENTASI DAN PENGUJIAN SISTEM 70
4.1 Implementasi Sistem 70
4.1.1 Lingkungan Implementasi 70
4.3 Implementasi perancangan antarmuka 71
4.3.1 Halaman Login 71
4.3.2 Halaman Home 72
4.3.3 Halaman SPK 72
4.3.4 Halaman Tampil Pelamar 77
4.3.5 Halaman Tampil Pelamar 79
4.3.6 Halaman Management Data Pelamar 80
4.3.7 Halaman Laporan 81
4.3.8 Halaman Control Panel 82
4.4 Implementasi Data 85
4.5 Pengujian Sistem 85
4.5.1 Rencana pengujian sistem 86
4.5.2. Kasus dan hasil pengujian sistem 87
4.5.3. Pengujian kinerja sistem 94
4.5.4. Pengujian data 107
BAB 5 110
KESIMPULAN DAN SARAN 110
5.1 Kesimpulan 110
5.2 Saran 111
DAFTAR PUSTAKA 112
DAFTAR TABEL
Hal. Table 3.1 Jumlah data pelamar setelah tahap data integration 24
Table 3.2 Klasifikasi data pelamar 25
Table 3.3 klasifikasi data (Berdasarkan Variabel) 28 Table 3.4 Sample Perhitungan Entropy (Jenjang Pendidikan) 30
Table 3.5 Perhitungan Node Akar 31
Table 3.6 Perhitungan Node 2 32
Table 3.7 Perhitungan Node 2.1 33
Table 3.8 Perhitungan Node 2.1.1 35
Table 3.9 Perhitungan Node 2.1.2 37
Table 3.10 Perhitungan Node 3 39
Table 3.11 Perhitungan Node 3.1 40
Table 3.12 Perhitungan Node 3.1.1 42
Table 3.13 Perhitungan Node 3.1.2 42
Table 3.14 Entitas Luar pada DFD 50
Tabel 4.1 Rencana Pengujian 86
Tabel 4.1 Rencana Pengujian (Lanjutan) 87
Tabel 4.2 Hasil Pengujian 87
Tabel 4.2 Hasil Pengujian (Lanjutan) 88
Tabel 4.2 Hasil Pengujian (Lanjutan) 89
Tabel 4.2 Hasil Pengujian (Lanjutan) 90
Tabel 4.2 Hasil Pengujian (Lanjutan) 91
Tabel 4.2 Hasil Pengujian (Lanjutan) 92
Tabel 4.2 Hasil Pengujian (Lanjutan) 93
Tabel 4.2 Hasil Pengujian (Lanjutan) 94
Table 4.3 perbandingan hasil proses validasi data 105 Table 4.4 Detail perbandingan hasil proses validasi data 106 Table 4.5 Persentase Keakuratan Berdasarkan data training 109
DAFTAR GAMBAR
Hal.
Gambar 2.1 Tahapan Data Mining 9
Gambar 2.2 konsep pohon keputusan 11
Gambar 2.2 Contoh pohon keputusan 15
Gambar 3.1 Print Screen Data Pelamar Excel 16
Gambar 3.2 Printscreen Data Pelamar yang Lulus Exel 18
Gambar 3.3 Contoh Field yang tidak Konsisten 20
Gambar 3.3 Contoh Field Kosong 22
Gambar 3.5 Node Akar 31
Gambar 3.6 Pembentukan Node 2 33
Gambar 3.7 Pembentukan Node 2.1 34
Gambar 3.8 Pembentukan Node 2.1.1 dan node akhir 36
Gambar Pembentukan node 3.1.1 42
Gambar 3.13 Usecase Spesification Program 48
Gambar 3.15 DFD Level 1 Program 51
Gambar 3.16 DFD Level 2: pencarian 52
Gambar 3.17 DFD Level 2: mengelola data pelamar 52
Gambar 3.19 DFD Level 2: Sistem Pembentukan Rules 53
Gambar 3.20 DFD Level 2: Mencetak Data Pelamar 54
Gambar 3.21 DFD Level 2: Proses Login 54
Gambar 3.22 DFD Level 2: Control Panel Sistem 55
Gambar 3.23 Sitemap Aplikasi 56
Gambar 3.24 Flowchart C4.5 57
Gambar 3.24 Flowchart C4.5 (Lanjutan) 58
Gambar 3.25 Database Relationship 59
Gambar 3.26 Halaman Login 60
Gambar 3.27 Halaman Awal (Home) 61
Gambar 3.28 Halaman Sistem Pengambilan Keputusan (SPK) 62
Gambar 3.29 Halaman Input Data Pelamar 63
Gambar 3.30 Halaman Pembentukan Rules 64
Gambar 3.31 Halaman Menampilkan Pelamar 65
Gambar 3.32 Halaman Management Pelamar 66
Gambar 3.34 Halaman Control Panel 68
Gambar 3.35 Halaman ganti password 69
Gambar 4.1 Halaman Login 71
Gambar 4.2 Halaman Home 72
Gambar 4.3 Halaman SPK 72
Gambar 4.4 Tutorial SPK 73
Gambar 4.5 Form input data pelamar 73
Gambar 4.6 Control panel tahun 74
Gambar 4.7 Pengaturan Periode 74
Gambar 4.8 Pratinjau input pelamar 75
Gambar 4.10 Halaman Utama SPK 76
Gambar 4.12 Halaman Pembentukan Rules 77
Gambar 4.13 Form data yang akan diproses 77
Gambar 4.14 Proses pembersihan data 78
Gambar 4.15 Klasifikasi Data 78
Gambar 4.16 Pembentukan Rules 79
Gambar 4.17 Form tampil data pelamar 79
Gambar 4.18 Halaman tampil data pelamar 80
Gambar 4.19 Halaman management data pelamar 80
Gambar 4.20 Halaman persentase kelulusan 81
Gambar 4.21 Halaman form laporan 81
Gambar 4.22 Hasil laporan dalam bentuk Excel 82
Gambar 4.23 Control Panel Sistem 82
Gambar 4.24 Pohon Keputusan yang terbentuk 83
Gambar 4.25 Control Panel (Jurusan) 84
Gambar 4.26 Control Panel (User) 84
Gambar 4.27 Ganti password 85
Gambar 4.28 Data Testing 94
Gambar 4.29 Submenu Menu Utama pada menu Rules 96
Gambar 4.30 Form data training 97
Gambar 4.31 Submenu preproses data 97
Gambar 4.32 Preproses klasifikasi 97
Gambar 4.33 Preproses pembentukan rules 98
Gambar 4.34 Pengecekan rules 98
Gambar 4.35 Pohon Keputusan 99
Gambar 4.36 Form masukkan data pelamar 99
Gambar 4.37 Halaman SPK 100
Gambar 4.38 Hasil proses validasi 101
Gambar 4.39 Halaman Persentase kelulusan 102
Gambar 4.40 Hasil Validasi datamar dengan menggunakan aplikasi 102
Gambar 4.41 Hasil Validasi Sebenarnya 102
Gambar 4.42 Pengujian dari segi running time program 107 Gambar 4.43 Pengujian dari segi keakuratan sistem pengambilan keputusan 108 Gambar 4.44 keakuratan kelulusan berdasarkan data training pembentuk rules 108