IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KAPABILITAS KONSUMEN
DALAM MENGAMBIL PINJAMAN KPR (STUDI KASUS : PT GRAHA SAMOLO INDAH)
SKRIPSI
Diajukan untuk Memenuhi Sebagai Syarat Memperoleh Gelar Sarjana Komputer (S.Kom)
Oleh
Risyad Ananda Putra
11110110087
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INFORMASI DAN KOMUNIKASI
UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2016
LEMBAR PENGESAHAN
IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KAPABILITAS KONSUMEN
DALAM MENGAMBIL PINJAMAN KPR (STUDI KASUS : PT GRAHA SAMOLO INDAH)
Oleh
Nama : Risyad Ananda Putra Nim : 11110110087 Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi dan Komunikasi
Tangerang , 3 Agustus 2016
Ketua Sidang
Yustinus Widya Wiratama, S.Kom, M.Sc.
Dosen Penguji
Marcel Bonar Kristanda, S.Kom, M.Sc.
Dosen Pembimbing
Adhi Kusnadi, S.T., M.Si.
Ketua Program Studi Teknik Informatika
PERNYATAAN TIDAK MELAKUKAN PLAGIAT
Dengan ini, saya
Nama : Risyad Ananda Putra NIM : 11110110087
Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi dan Komunikasi
Menyatakan bahwa skripsi yang berjudul “Implementasi Data Mining Menggunakan Algoritma C4.5 Untuk Memprediksi Kapabilitas Konsumen Dalam Mengambil Pinjaman KPR (Studi Kasus: PT Graha Samolo Indah)” adalah karya ilmiah pribadi saya, bukan karya ilmiah yang ditulis oleh orang atau lembaga lain. Semua karya ilmiah orang atau lembaga lain yang dirujuk dalam skripsi ini telah disebutkan sumbernya serta dicantumkan dalam daftar pustaka.
Jika pada kemudian hari terbukti ditemukan kecurangan/penyimpangan, baik dalam pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah Skripsi yang telah saya tempuh.
Tangerang, 24 Juli 2016
IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA C4.5 UNTUK MEMPREDIKSI KAPABILITAS KONSUMEN
DALAM MENGAMBIL PINJAMAN KPR (STUDI KASUS : PT GRAHA SAMOLO INDAH)
ABSTRAK Risyad Ananda Putra
11110110087
Memprediksikan kemampuan peminjaman seorang calon konsumen merupakan hal yang berharga bagi pihak pengembang perumahan. Dokumen konsumen yang selalu dikumpulkan untuk pengajuan kredit berisikan data-data penting yang seringkali tidak digunakan oleh para pengembang. Menggunakan Algoritma C4.5 sebagai metode learning dan data-data konsumen dapat dikembangkan sebuah aplikasi untuk memprediksikan kemampuan konsumen untuk melakukan peminjaman. Data-data konsumen yang sudah diketahui kemampuannya dapat dibentuk menjadi pohon keputusan. Pohon keputusan tersebut merupakan aturan-aturan yang digunakan untuk melakukan uji coba terhadap data konsumen yang belum diketahui kemampuannya. Untuk menguji ketepatan metode learning akan digunakan cross-validation untuk mengukur akurasinya.
KATA PENGANTAR
Sungguh Maha Besar dan Maha Penolong Tuhan Yang Maha Esa karena telah membantu penulis dapat menyelesaikan laporan skripsi ini, yang menjadi salah satu syarat lulus sebagai sarjana strata 1 Jurusan Teknik Informatika, Fakultas Teknologi Informasi dan Komunikasi, Universitas Multimedia Nusantara.
Selesainya laporan skripsi ini tidak terlepas dari dukungan dan kerja sama dari berbagai pihak, oleh karena itu penulis mengucapkan banyak terima kasih kepada:
1. Ibu Maria Irmina Prasetiyowati, S.Kom., M.T. selaku ketua prodi Teknik Informatika.
2. Bapak Adhi Kusnadi, S.T., M.Sc. selaku dosen pembimbing yang tidak pernah lelah memberikan bimbingan dan masukkan selama pengerjaan tugas akhir ini.
3. Fakultas Teknologi Informasi dan Komunikasi Universitas Multimedia Nusantara, sebagai lembaga yang mengembangkan pengetahuan mengenai Teknik Informatika.
4. PT. Graha Samolo Indah yang memberikan saya kesempatan untuk melakukan penelitian dan pembuatan program.
5. Keluarga yang selalu memberikan dukungan baik dalam doa dan motivasi yang diberikan saat penyusunan laporan skripsi ini.
6. Mei Larasetiati, Gustave Lyman, Danariski Pratama, Aldiansyah Putra, Achmad Robby Subarly, Faisal Musyaddad, Michael Hadi Pratama,
Ongky Kristianto Edward, serta teman-teman lainnya yang telah membantu dan memotivasi dalam proses pembuatan laporan skripsi. Penyusunan laporan Skripsi ini tidak terlepas dari kesalahan teknis penulisan maupun pengumpulan materi. Saran dan kritik yang membangun dari berbagai pihak sangat diharapkan untuk menyempurnakan laporan Skripsi ini.
Tangerang, 25 Juli 2016
DAFTAR ISI
LEMBAR PENGESAHAN...II PERNYATAAN TIDAK MELAKUKAN PLAGIAT ...III ABSTRAK...IV KATA PENGANTAR ...V DAFTAR ISI ...VII
BAB I PENDAHULUAN...1
1.1 Latar Belakang Masalah...1
1.2 Rumusah Masalah ...3
1.3 Batasan Masalah ...4
1.4 Tujuan Penelitian ...4
1.5 Manfaat Penelitian ...4
1.6 Sistematika Penulisan ...5
BAB II LANDASAN TEORI ...6
2.1 Data Mining ...6
2.2 Decision Tree/ Classification Tree...6
2.3 Algoritma C4.5...7
2.4 Pinjaman KPR...10
2.5 K-Fold Cross Validation ...11
BAB III METODE DAN PERANCANGAN SISTEM...12
3.1 Metode Penelitian ...12
3.2 Analisa Data...13
3.3 Rancangan Aplikasi ...15
3.3.1 Flowchart ...17
3.3.2 Data Flow Diagram...24
3.3.3 Rancangan Antar Muka Aplikasi...28
3.3.4 Struktur Tabel ...32
3.4 Analisis Model ...36
BAB IV IMPLEMENTASI DAN HASIL PENELITIAN...44
4.1 Spesifikasi Sistem ...44
4.1.1 Spesifikasi Pengembangan Sistem dan Pengujian Sistem ...44
4.1.2 Spesifikasi Minimum ...44
4.2 Implementasi Sistem ...45
4.2.1 Implementasi Tampilan Antar Muka Aplikasi...45
4.2.2 Implementasi Proses Learning Algoritma C4.5 dan Proses Testing.49 4.2.2.1 Proses Testing Menggunakan Algoritma C4.5 ...50
4.2.2.2 Proses Testing ...55
4.3 Hasil Pengujian Sistem ...56
4.3.1 Uji Coba 10-Fold-Cross-Validation...56
4.3.2 Perhitungan Manual ...57
BAB V SIMPULAN DAN SARAN...63
5.1 Simpulan ...63
5.2 Saran...63
DAFTAR TABLE
Tabel 3.1 Document Checklist...14
Tabel 3.1 Document Checklist (Lanjutan)...15
Tabel 3.2 Spesifikasi Atribut ...15
Tabel 3.3 Struktur Tabel data_training ...33
Tabel 3.4 Struktur Tabel data_testing ...33
Tabel 3.4 Struktur Tabel data_testing (Lanjutan) ...34
Tabel 3.5 Struktur Tabel mining_c45 ...34
Tabel 3.5 Struktur Tabel mining_c45 (Lanjutan) ...35
Tabel 3.6 Struktur Tabel pohon_keputusan ...35
Tabel 3.7 Struktur Tabel Atribut...36
Tabel 3.8 Tabel sampel data perhitungan node pertama...37
Tabel 3.9 Hasil perhitungan gain dan entropi untuk node pertama ...38
Tabel 3.10 Tabel sampel data perhitungan node kedua ...39
Tabel 3.10 Tabel sampel data perhitungan node kedua (lanjutan) ...40
Tabel 3.11 Hasil perhitungan gain dan entropi untuk node kedua ...40
Tabel 3.12 Hasil Tabel sampel data perhitungan node ketiga ...41
Tabel 3.13 Hasil perhitungan gain dan entropi untuk node ketiga ...42
Tabel 4.1 Hasil perhitungan 10-fold-cross-validation...56
Tabel 4.1 Hasil perhitungan 10-fold-cross-validation (lanjutan)...57
Tabel 4.2 Hasil perhitungan gain dan entropi untuk node pertama ...58
Tabel 4.2 Hasil perhitungan gain dan entropi untuk node pertama (lanjutan) ...59
Tabel 4.3 Tabel Pohon Keputusan ...61
DAFTAR GAMBAR
Gambar 2.1 Decision Tree ...7
Gambar 3.1 Flowchart Aplikasi Sistem Informasi Prediksi Konsumen ...17
Gambar 3.2 Flowchart Subproses Tampilkan Data Learning...18
Gambar 3.3 Flowchart Subproses Proses Learning ...18
Gambar 3.4 Flowchart Subproses Jumlah dan Entropy...19
Gambar 3.5 Flowchart Subproses Hitung Gain ...20
Gambar 3.6 Flowchart Subproses Buat Pohon Keputusan ...21
Gambar 3.7 Flowchart Tampilkan Data Testing...21
Gambar 3.8 Flowchart Subproses Proses Testing...22
Gambar 3.9 Flowchart Subproses Masukkan Data Learning ...23
Gambar 3.10 List Flowchart Subproses Masukkan Data Testing...23
Gambar 3.11 List Flowchart Subproses Ubah Data Learning ...23
Gambar 3.12 List Flowchart Subproses Ubah Data Testing...24
Gambar 3.13 Context Diagram Prediksi Konsumen...25
Gambar 3.14 DFD Level 0 Prediksi Konsumen Main...25
Gambar 3.15 DFD Level 1-1 View Data Learning...26
Gambar 3.16 DFD Level 1-3 View Data Testing ...27
Gambar 3.17 DFD Level 1-2 Proses Learning ...28
Gambar 3.18 Rancang Interface Prediksi Konsumen Main...29
Gambar 3.19 Rancang Interface View Data Testing ...29
Gambar 3.20 Rancangan Form Masukkan Data Learning...30
Gambar 3.21 Rancangan Form View Data Testing ...31
Gambar 3.22 Rancangan Form Masukkan Data Testing ...32
Gambar 3.23 Pohon keputusan cabang pertama ...39
Gambar 3.24 Pohon keputusan cabang kedua ...41
Gambar 3.25 Pohon keputusan cabang ketiga ...42
Gambar 4.1 Tampilan Form Prediksi Konsumen Main...45
Gambar 4.2 Tampilan Form View Data Learning ...46
Gambar 4.3 Tampilan Form View Data Testing...47
Gambar 4.4 Tampilan Form Insert Data Testing ...48
Gambar 4.5 Tampilan Form Insert Data Testing ...48
Gambar 4.6 Tampilan Form About...49
Gambar 4.7 Source Code Buat Pohon Keputusan ...50
Gambar 4.8 Source Code Buat Pohon Keputusan Lanjutan ...50
Gambar 4.9 Source Code Hitung Jumlah Dan Entropy ...51
Gambar 4.10 Source Code Buat Hitung Jumlah Dan Entropy Lanjutan ...51
Gambar 4.11 Source Code Hitung Gain ...52
Gambar 4.12 Source Code Hitung Gain ...52
Gambar 4.13 Source Code Insert Data Pohon Keputusan ...53
Gambar 4.14 Source Code Insert Data Pohon Keputusan ...53
Gambar 4.15 Source Code Looping Kondisi Atribut ...54
Gambar 4.16 Source Code Looping Kondisi Atribut ...54
Gambar 4.17 Source Code Prediksi Data...55
Gambar 4.18 Pohon keputusan cabang pertama ...60