i
IMPLEMENTASI ALGORITMA C4.5 UNTUK MEMPREDIKSI STATUS KELAYAKAN
PENERIMAAN BANTUAN DESA (Studi Kasus : Desa Tarempa Barat Daya)
HALAMAN JUDUL
Skripsi
Untuk memenuhi syarat memperoleh Derajat Sarjana Komputer (S.T.)
Oleh:
RIZAL
NIM 170155201036
JURUSAN INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MARITIM RAJA ALI HAJI TANJUNGPINANG
2022
ii
iii
iv
v
HALAMAN PERSEMBAHAN Bismillahirohmanirrohim
“dengan menyebut nama Allah yang maha pengasih lagi maha penyayang”
Alhamdulillahirobbil‟alamin, segala puji dan tidak hentinya untuk bersyukur atas kehadirat dan izin Allah SWT atas berkat, rahmat, hidayah serta ridho-Nya yang telah memberikan nikmat kesehatan dan kesempatan sehingganya dapat menyelesaikan skripsi ini dengan baik dan segala kekurangannya.
Bersholawat kepada Nabi Baginda Muhammad SAW dengan senantiasa mengucapkan Allahummasholli „Ala Sayyidina Muhammad Wa‟ala ali Sayyidina Muhammad atas kecintaannya menjadi umat yang paling dicintainya.
Skripsi ini saya persembahkan terutama kepada kedua orang paling penting dalam kehidupan saya yaitu kedua orangtua saya, bapak Jahari dan ibu Musrowati yang tidak pernah berhenti dalam mendoakan anaknya demi menjadi anak yang baik dan juga kemudian perjuangannya serta jerih payahnya untuk membesarkan saya. Berkat doa dan perjuangan mereka saya dapat menyelesaikan skripsi ini.
Seluruh keluarga, saudara, dan teman-teman dekat yang telah memberikan dukungan, dan doa dalam menyelesaikan pendidikan ini.
Para seluruh bapak ibu dosen yang telah mengajarkan ilmu yang sangat bermanfaat dalam menyelesaikan pendidikan ini.
Seluruh teman angakatan 2017, yang telah menjadi teman baik selama ini semoga teman semua bukan hanya menjadi teman didunia melainkan menjadi teman sampai kapan pun. Hasil karya yang sederhana ini saya persembahkan, semoga bisa bermanfaat bagi siapapun yang menggunakannya.
vi
HALAMAN MOTO
"Raihlah ilmu, dan untuk meraih ilmu belajarlah keadaan tenang dan sabar"
Umar Bin Khattab
vii
KATA PENGANTAR
Alhamdulillahirobbil‟alamin, puji dan syukur atas kehadirat Allah SWT yang telah memberikan rahmat, taufik, dan hidayah-Nya sehingga penulis dapat menyelesaikan penyusunan skripsi yang berjudul “ Implementasi Algoritma C4.5 Untuk Memprediksi Status Kelayakan Penerimaan Bantuan Desa (Studi Kasus : Desa Tarempa Barat Daya) ini dapat di selesaikan sebagai salah satu syarat untuk memperoleh gelar Sarjana Strata I Teknik (ST) Fakultas Teknik Jurusan Teknik Informatika Universitas Maritim Raja Ali Haji.
Dalam penyusunan skripsi ini, penulis menyadari bahwa banyak terdapat kekurangan. Tanpa adanya dorongan, bantuan, masukan serta doa dari berbagai pihak skripsi ini tidak bisa terselesaikan dengan baik dan lancar. Oleh karena itu, dengan penuh kerendahan hati penulis ingin mengucapkan terimakasih kepada :
1. Allah SWT, yaitu tuhan semesta alam yang telah memberikan nikmat dan rahmatnya sehingga penulis dapat menyelesaikan skripsi ini.
2. Kedua orang tua, yaitu Bapak Jahari dan Ibu Musrowati atas segala usaha dengan penuh pengorbanan, doa dan dukungan yang telah diberikan kepada penulis selama ini.
3. Bapak Prof. Dr. Agung Dhamar Syakti S.Pi,D.EA., selaku Rektor Universitas Maritim Raja Ali Haji.
4. Bapak Sapta Nugraha, S.T., M.Eng., selaku Dekan Fakultas Teknik Universitas Maritim Raja Ali Haji.
5. Bapak Muhamad Radzi Rathomi, S.Kom., M.Cs., selaku Ketua Jurusan Teknik Informatika Universitas Maritim Raja Ali Haji.
6. Ibu Nurfalinda, S.T., M.Cs., selaku Dosen pembimbing I yang telah memberikan waktunya, memberikan masukan dan arahan dalam proses penyusunan skripsi ini.
7. Bapak Muhamad Radzi Rathomi, S.Kom., M.Cs., selaku Dosen pembimbing II yang telah memberikan waktunya, memberikan masukan dan arahan dalam proses penyusunan skripsi ini.
viii
8. Seluruh Bapak Ibu Dosen Fakultas Teknik Jurusan Teknik Informatika Universitas Maritim Raja Ali Haji yang telah mengajar, mendidik, dan membimbing selama masa perkuliahan sampai dengan menyelesaikan skripsi ini.
9. Staff tata usaha Fakultas Teknik Universitas Maritim Raja Ali Haji yang telah banyak membantu dalam menyelesaikan urusan administrasi selama masa perkuliahan sampai dengan akhir perkuliahan.
10. Seluruh teman-teman mahasiswa angkatan 2017(TI17) Program Studi Teknik informatika.
ix DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
PERNYATAAN ORISINALITAS ... iv
HALAMAN PERSEMBAHAN ... v
HALAMAN MOTO... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... ix
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xiv
GLOSARIUM ... xv
ABSTRAK ... xvi
ABSTRACT ... xvii
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 4
1.3 Batasan Masalah ... 4
1.4 Tujuan Penelitian ... 5
1.5 Manfaat Penelitian ... 5
1.6 Keaslian Penelitian ... 5
1.7 Sistematika Penulisan ... 6
BAB II KAJIAN LITERATUR ... 8
2.1 Tinjauan Pustaka ... 8
2.2 Landasan Teori ... 13
2.2.1 Data mining ... 13
2.2.2 Prediksi ... 15
2.2.3 Pohon Keputusan ... 15
2.2.4 Algoritma C4.5 ... 16
2.2.5 Confusion Matrix ... 18
2.2.6 Kemiskinan ... 19
x
2.2.7 Bantuan Pangan Nontunai ... 19
BAB III METODOLOGI PENELITIAN ... 20
3.1 Waktu dan Tempat Penelitian ... 20
3.2 Jenis Penelitian ... 20
3.3 Bahan atau Materi Penelitian ... 20
3.4 Peralatan Penelitian ... 21
3.5 Alat Pengumpulan Data... 21
3.6 Kerangka Pikir Penelitian ... 21
3.7 Proses Tahapan Algoritma C4.5 ... 23
3.8 Analisis dan Perancangan ... 24
3.8.1 Analisis Kebutuhan Data ... 24
3.9 Perhitungan Manual ... 25
3.9.1 Perhitungan Manual Algoritma C4.5... 27
3.10 Perancangan Alur Sistem ... 69
3.10.1 Arsitektur Sistem ... 69
3.10.2 Flowchart Login ... 70
3.10.3 Flowchart Sistem Aplikasi ... 70
3.10.4 Flowchart Menu Sistem Algoritma C4.5 ... 71
3.10.5 Entity Relationship Diagram (ERD) ... 72
3.10.6 Perancangan Data Flow Diagram (DFD) ... 73
3.10.7 Perancangan Basis Data ... 75
3.11 Perancangan Antarmuka ... 76
3.11.1 Perancangan Halaman Login ... 76
3.11.2 Perancangan Halaman Dashboard ... 77
3.11.3 Perancangan Halaman Datasets ... 77
3.11.4 Perancangan Halaman Initial Proses ... 78
3.11.5 Perancangan Halaman Prediksi ... 79
3.11.6 Perancangan Halaman Performance ... 79
3.12 Implementasi Sistem ... 80
3.12.1 Halaman Login ... 80
3.12.2 Halaman Dashboard ... 81
xi
3.12.3 Halaman Datasets ... 81
3.12.4 Halaman Initial Proses ... 82
3.12.5 Halaman Prediksi ... 82
3.12.6 Halaman Hasil Prediksi ... 83
3.12.7 Halaman Performance ... 84
3.12.8 Halaman Hasil Performance ... 84
BAB IV ANALISA DAN PEMBAHASAN... 86
4.1 Analisis Data ... 86
4.2 Pengujian Data ... 86
4.3 Hasil Akurasi Algoritma C4.5 ... 88
BAB V PENUTUP ... 89
5.1 Kesimpulan ... 89
5.2 Saran ... 89
DAFTAR PUSTAKA ... 90
LAMPIRAN ... 92
xii DAFTAR TABEL
Tabel 1.1 Keaslian Penelitian ... 5
Tabel 2.1 Confusion Matrix ... 18
Tabel 3.1 Keterangan Data ... 25
Tabel 3.2 Data Daftar Warga Desa ... 26
Tabel 3.3 Nilai Entropy ... 27
Tabel 3.4 Nilai Entropy dari Setiap Atribut ... 29
Tabel 3.5 Nilai Gain ... 30
Tabel 3.6 Lanjutan ... 31
Tabel 3.7 Nilai Split Information ... 33
Tabel 3.8 Lanjutan ... 34
Tabel 3.9 Nilai Gain Ratio ... 35
Tabel 3.10 Lanjutan ... 36
Tabel 3.11 Pemangkasan Atribut “Status Program Keluarga Harapan” dengan kriteria “Non PKH” ... 37
Tabel 3.12 Node 1 Perhitungan Atribut “Status Program Keluarga Harapan” dengan kriteria “Non PKH” ... 37
Tabel 3.13 Lanjutan ... 38
Tabel 3.14 Pemangkasan Atribut “Jenis Kelamin” dengan kriteria “Laki-laki” .. 39
Tabel 3.15 Node 1.1 Perhitungan Atribut “Jenis Kelamin” dengan kriteria “Laki- laki” ... 40
Tabel 3.16 Lanjutan ... 41
Tabel 3.17 Pemangkasan Atribut “Status Kepemilikan Rumah” dengan kriteria “Milik Sendiri” ... 41
Tabel 3.18 Node 1.1.1 Perhitungan Atribut “Status Kepemilikan Rumah” dengan kriteria “Milik Sendiri” ... 42
Tabel 3.19 Pemangkasan Atribut “Kondisi Rumah” dengan kriteria “Papan” ... 43
Tabel 3.20 Node 1.1.1.1 Perhitungan Atribut “Kondisi Rumah” dengan kriteria “Papan” ... 44 Tabel 3.21 Pemangkasan Atribut “Jumlah Penghasilan” dengan kriteria “Kecil” 45
xiii
Tabel 3.22 Node 1.1.1.1.1 Perhitungan Atribut “Jumlah Penghasilan” dengan kriteria “Kecil” ... 46 Tabel 3.23 Pemangkasan Atribut “Jumlah Tanggungan” dengan kriteria “Sedikit”
... 47 Tabel 3.24 Node 1.1.1.1.1.1 Perhitungan Atribut “Jumlah Tanggungan” dengan kriteria “Sedikit” ... 48 Tabel 3.25 Pemangkasan Atribut “Jumlah Tanggungan” dengan kriteria “Sedang”
... 48 Tabel 3.26 Node 1.1.1.1.1.1 Perhitungan Atribut “Jumlah Tanggungan” dengan kriteria “Sedang” ... 49 Tabel 3.27 Pemangkasan Atribut “Jumlah Penghasilan” dengan kriteria “Sedang”
... 49 Tabel 3.28 Node 1.1.1.1.1 Perhitungan Atribut “Jumlah Penghasilan” dengan kriteria “Sedang” ... 50 Tabel 3.29 Pemangkasan Atribut “Usia” dengan kriteria “Muda” ... 51 Tabel 3.30 Node 1.1.1.1.1.2 Perhitungan Atribut “Usia” dengan kriteria “Muda”
... 51 Tabel 3.31 Pemangkasan Atribut “Jenis Kelamin” dengan kriteria “Perempuan” 52 Tabel 3.32 Node 1.1 Perhitungan Atribut “Jenis Kelamin” dengan kriteria
“Perempuan” ... 53 Tabel 3.33 Pemangkasan Atribut “Status Kepemilikan Rumah” dengan kriteria
“Milik Sendiri” ... 54 Tabel 3.34 Node 1.1.2 Perhitungan Atribut “Status Kepemilikan Rumah” dengan kriteria “Milik Sendiri” ... 55 Tabel 3.35 Pemangkasan Atribut “Kondisi Rumah” dengan kriteria “Papan” ... 56 Tabel 3.36 Node 1.1.2.1 Perhitungan Atribut “Kondisi Rumah” dengan kriteria
“Papan” ... 57 Tabel 3.37 Pemangkasan Atribut “Jumlah Penghasilan” dengan kriteria “Kecil” 58 Tabel 3.38 Node 1.1.2.1.1 Perhitungan Atribut “Jumlah Penghasilan” dengan kriteria “Kecil” ... 59
xiv
Tabel 3.39 Pemangkasan Atribut “Jumlah Tanggungan” dengan kriteria “Tidak
Ada” ... 60
Tabel 3.40 Node 1.1.2.1.1.1 Perhitungan Atribut “Jumlah Tanggungan” dengan kriteria “Tidak Ada” ... 60
Tabel 3.41 Pemangkasan Atribut “Jumlah Tanggungan” dengan kriteria “Sedikit” ... 61
Tabel 3.42 Node 1.1.2.1.1.1 Perhitungan Atribut “Jumlah Tanggungan” dengan kriteria “Sedikit” ... 61
Tabel 3.43 Pemangkasan Atribut “Jumlah Penghasilan” dengan kriteria “Sedang” ... 62
Tabel 3.44 Node 1.1.2.1.1.2 Perhitungan Atribut “Jumlah Penghasilan” dengan kriteria “Sedang” ... 63
Tabel 3.45 Deskripsi Tabel User ... 75
Tabel 3.46 Deskripsi Tabel Datasets ... 75
Tabel 4.1 Hasil Pengujian ... 87
Tabel 4.2 Pengujian dengan Confusin Matrix ... 88
xv
DAFTAR GAMBAR
Gambar 3.1 Flowchart Metode Penelitian ... 22
Gambar 3.2 Flowchart Proses Tahapan Algoritma C4.5 ... 23
Gambar 3.3 Pohon Keputusan (Decesion Tree) ... 64
Gambar 3.4 Arsitektur Sistem. ... 69
Gambar 3.5 Flowchart Login. ... 70
Gambar 3.6 Flowchart Sistem Aplikasi. ... 70
Gambar 3.7 Flowchart Menu Sistem Algoritma C4.5. ... 71
Gambar 3.8 Entity Relationship Diagram (ERD) ... 73
Gambar 3.9 Perancangan DFD Level 0 ... 73
Gambar 3.10 Perancangan DFD Level 1 ... 74
Gambar 3.11 Perancangan Halaman Login ... 76
Gambar 3.12 Perancangan Halaman Dashboard ... 77
Gambar 3.13 Perancangan Halaman Datasets ... 78
Gambar 3.14 Perancangan Halaman Initial Proses ... 78
Gambar 3.15 Perancangan Halaman Prediksi ... 79
Gambar 3.16 Perancangan Halaman Performance ... 80
Gambar 3.17 Halaman Login ... 80
Gambar 3.18 Halaman Dashboard ... 81
Gambar 3.19 Halaman Datasets ... 81
Gambar 3.20 Halaman Initial Proses ... 82
Gambar 3.21 Halaman Prediksi ... 83
Gambar 3.22 Halaman Hasil Prediksi ... 83
Gambar 3.23 Halaman Performance... 84
Gambar 3.24 Halaman Hasil Performance ... 85
xvi GLOSARIUM
Prediksi suatu proses memperkirakan secara sistematis tentang sesuatu yang paling mungkin terjadi di masa depan berdasarkan informasi masa lalu dan sekarang yang dimiliki.
Algoritma C4.5 yaitu sebuah algoritma yang digunakan untuk membangun decision tree (pengambilan keputusan).
Decision tree merupakan algoritma pengklasifikasian yang sering digunakan dan mempunyai struktur yang sederhana dan mudah untuk diinterpretasikan.
Confusion Matrix adalah alat yang sangat berguna untuk menganalisa seberapa baik pengklasifikasian bisa mengenali tuple dari class yang berbeda.