1
PREDIKSI LAPORAN PERKEMBANGAN PINJAMAN
TABUNGAN PADA BADAN USAHA MILIK KAMPUNG
MENGGUNAKAN ALGORITMA C4.5
Annaa Adhe Franciska, Evfi Mahdiyah Mahasiswa Program Studi S1 Sistem Informasi
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia
[email protected] ABSTRACT
Prediction reports on the development of savings and loans are very necessary for the Village Owned Enterprise (BUM) of Anugrah Village. By using this prediction of the report on the development of savings loans, BUM Kampung Anugrah can predict the number of customers who repay loans on time and not on time. The purpose of this study is to predict reports on the development of savings and loans at BUM Kampung Anugrah. This prediction used the application of the C4.5 Algorithm and Decission Tree methods. This system was built using the PHP programming language with MySQL as the database server and UML as the system design. The results obtained from this study were in the form of prediction of savings loans that are on time and not on time as well. Finally, we performed the system testing using the Black Box method. This system helped the BUM Kampung Anugrah organization to manage efficiently customer loan data.
Keywords: Black Box, C4.5 Algorithm, Decission Tree, Prediction. ABSTRAK
Prediksi laporan perkembangan pinjaman tabungan sangat diperlukan bagi pihak Badan Usaha Milik (BUM) Kampung Anugrah. Prediksi laporan perkembangan pinjaman tabungan BUM Kampung Anugrah ini dapat memprediksi banyaknya nasabah yang mengembalikan pinjaman tepat waktu dan tidak tepat waktu. Tujuan penelitian ini untuk memprediksi laporan perkembangan pinjaman tabungan pada BUM Kampung Anugrah. Prediksi ini menggunakan penerapan metode Algoritma C4.5 dan Decission Tree.Sistem ini dibangun menggunakan bahasa pemograman PHP dengan MySQL sebagai database server dan UML sebagai desain perancangan sistem. Hasil yang diperoleh dari penelitian ini berupa prediksi pinjaman tabungan yang tepat waktu dan tidak tepat waktu. Kemudian melakukan pengujian sistem menggunakan metode Black Box. Sistem ini membantu organisasi BUM Kampung Anugrah dalam mengelola data pinjaman nasabah.
2 PENDAHULUAN
Badan Usaha Milik Kampung (BUM Kampung) merupakan suatu wadah dalam meningkatkan perekonomian dan kesejahteraan masyarakat serta meningkatkan pendapatan asli kampung. Salah satu kegiatan BUM Kampung yaitu melakukan pelayanan simpan pinjam terhadap masyarakat. Bagi masyarakat yang ingin meminjam pinjaman dana tabungan kepada BUM Kampung tentunya harus memenuhi beberapa syarat yang telah ditetapkan oleh pihak BUM Kampung, Agar dikemudian hari tidak menimbulkan masalah yang menyulitkan pihak nasabah maupun merugikan pihak BUM Kampung akibat pengembalian pinjaman tabungan yang kurang lancar atau pun menunggak.
Prediksi laporan perkembangan pinjaman tabungan sangat penting bagi pihak BUM Kampung Anugrah, dimana dengan adanya prediksi laporan perkembangan pinjaman tabungan pihak BUM Kampung dapat memprediksi banyaknya nasabah peminjam yang tepat waktu dan tidak tepat waktu. Prediksi ini menggunakan penerapan algoritma C4.5 yang merupakan algoritma dari metode klasifikasi yang digunakan pada data mining sebagai pembuatan pohon keputusan untuk memprediksi agar lebih cepat dalam pengambilan keputusan.
Berdasarkan latar belakang diatas penulis berkeinginan untuk melakukan penelitian dengan judul “Prediksi Laporan Perkembangan Pinjaman Tabungan Pada Badan Usaha Milik Kampung Menggunakan Algoritma C4.5”.
METODE PENELITIAN a. Metode Pengumpulan Data
Pengumpulan data yang berkaitan dengan masalah yang diteliti dan akan digunakan sebagai bahan analisa kebutuhan sistem yang akan dirancang. Adapun metode
pengumpulan data yang digunakan adalah wawancara dan studi literatur.Wawancara ini dilakukan untuk memperoleh data yang dibutuhkan tentang kriteria dan variabel apa saja yang digunakan dalam penentuan prediksi laporan perkembangan tabungan. Studi Literatur dilakukan untuk mencari informasi yang berkaitan dengan sistem yang akan dibangun dengan mengacu pada teori–teori terkait penelitian yang bersumber dari jurnal, internet dan dokumen maupun informasi. Data hasil studi literatur dapat menunjang dalam menguraikan informasi mengenai kriteria apa saja yang menjadi objek penelitian. Pencarian teori-teori bertujuan untuk mencari data–data yang berhubungan dengan Prediksi Laporan Perkembangan Pinjaman Tabungan yang menggunakan Metode Algoritma C4.5.
b. Peralatan yang Digunakan
Penelitian membutuhkan beberapa peralatan/tools untuk mendukung berjalannya perancangan dan implementasi sistem :
1. Perangkat Keras
Perangkat Keras merupakan salah satu komponen dari sebuah komputer yang secara fisik dapat dilihat dan diraba secara langsung serta berfungsi juga dalam mendukung pengoperasian komputer.
3 Adapun perangkat keras yang digunakan dalam perancangan sistem ini adalah a. Laptop Lenovo dengan Processor Intel® Core™ i3 CPU @ 1,90GHz b. Printer Cannon IP 2700 untuk mencetak laporan
c. Flashdisk 16 GB untuk menyimpan laporan 2. Perangkat Lunak
Perangkat lunak adalah suatu program yang dibuat untuk menjalankan perangkat keras komputer. Perangkat lunak berfungsi untuk melakukan pengolahan data dan sebagai alat bantu dalam pengoperasian komputer.:
a. Sistem Operasi Windows 10 pro
b. XAMPP control panel v3.2.4 sebagai pengolah basis data
c. Rapid Miner sebagai software/perangkat lunak untuk pengolahan data dan pengujian sistem.
d. Sublime sebagai text editor
e. Star UML aplikasi komputer yang digunakan untuk membuat diagram sistem. f. PHP Yii framework
c. Metode Algoritma C4.5
Algoritma C4.5 adalah algoritma populer dalam klasifikasi data mining. Algoritma C4.5 merupakan pengembangan dari ID3, dalam ID3 kita gunakan criteria information gain untuk memilih atribut yang akan digunakan untuk pemisahan obyek. Atribut yang mempunyai informasi gain paling tinggi dibandingkan dengan atribut yang data lain relatif terhadap set y dalam satu data, dipilih untuk melakukan pemecahan (Sucipto, 2015).
Terdapat empat langkah dalam proses pembuatan pohon keputusan pada algoritma C4.5 yaitu (Pambudi, Setiawan, & Indriati, 2018):
1. Memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada.
2. Membuat cabang untuk masing-masing nilai, artinya membuat cabang sesuai dengan jumlah nilai variabel gain tertinggi.
3. Membagi setiap kasus dalam cabang, berdasarkan perhitungan nilai gain tertinggi dan perhitungan dilakukan setelah perhitungan nilai gain tertinggi awal dan kemudian dilakukan proses perhitungan gain tertinggi kembali tanpa menyertakan nilai variabel gain awal.
4. Mengulangi proses dalam setiap cabang sehingga semua kasus dalam cabang memiliki kelas yang sama, mengulangi semua proses perhitungan gain tertinggi untuk masing-masing cabang kasus sampai tidak bisa lagi dilakukan proses perhitungan.
Ada beberapa tahapan dalam membuat sebuah decision tree dengan algoritma C4.5 yaitu (Siallagan, 2015) :
1. Menyiapkan data training. Data training biasanya diambil dari data histori yang pernah terjadi sebelumnya dan sudah dikelompokkan ke dalam kelas-kelas tertentu. 2. Menentukan akar dari pohon. Akar akan diambil dari atribut yang terpilih, dengan
cara menghitung nilai Gain dari masing-masing atribut, nilai Gain yang paling tinggi yang akan menjadi akar pertama. Gain adalah ukuran efektivitas suatu variabel dalam mengklasifikasikan data. Sebelum menghitung nilai Gain dari atribut, hitung dahulu nilai entropy menggunakan rumus :
4 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑𝑛𝑖=1−𝑃𝑖∗ 𝑙𝑜𝑔2𝑝𝑖………(2.1)
Keterangan :
S : Himpunan kasus n : Jumlah partisi S
pi : proporsi dari Si terhadap S
3. Kemudian hitung nilai Gain menggunakan rumus : 𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝ℎ𝑦(𝑆) − ∑𝑛𝑖=1 |𝑆𝑖|
|𝑆| ∗ 𝐸𝑛𝑡𝑟𝑜𝑝ℎ𝑦(𝑆1)……(2.2) Keterangan :
S : Himpunan kasus A : Atribut
n : Jumlah partisi atribut A |Si| : Jumlah kasus pada partisi ke-i |S| : Jumlah kasus dalam S
4. Ulangi langkah ke-2 hingga semua atribut terpartisi. 5. Proses partisi pohon keputusan akan berhenti saat :
a. Semua tupel dalam node N mendapat kelas yang sama. b. Tidak ada atribut didalam tupel yang dipartisi lagi. c. Tidak ada tupel didalam cabang yang kosong. d. Pohon Keputusan (Decision Tree)
Decision tree merupakan salah satu metode klasifikasi yang menggunakan representasi struktur pohon (tree) di mana setiap node merepresentasikan atribut, cabangnya merepresentasikan nilai dari atribut, dan daun merepresentasikan kelas. Node yang paling atas dari decision tree disebut sebagai root. Decision tree merupakan metode klasifikasi yang paling populer digunakan. Selain karena pembangunannya relatif cepat, hasil dari model yang dibangun mudah untuk dipahami. Pada decision tree terdapat 3 jenis node, yaitu:
a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
b. Internal node, merupakan node percabangan, pada node ini hanya terdapat satu input dan mempunyai output minimal dua.
c. Leaf node atau Terminal node , merupakan node akhir, pada node ini hanya terdapat satu input dan tidak mempunyai output.
HASIL DAN PEMBAHASAN a. Analisa Kebutuhan Sistem
Analisa Kebutuhan sistem merupakan tahap awal dalam perancangan dan pengembangan sebuah sistem yang akan dirancang, karena tahap inilah akan diukur dan dievakuasi tentang kinerja dari sistem yang dirancang. Analisa Sistem juga dilakukan
5 untuk mengumpulkan data dan informasi mengenai sistem yang sebelumnya digunakan dan sistem yang dirancang serta analisa tentang kebutuhan sistem dan pengguna.
Penentuan Prediksi Laporan Perkembnagan Pinjaman Tabungan Pada BUM Kampung Anugrah menggunakan Metode Algortima C4.5 ini memiliki beberapa kriteria yang terdapat pada Tabel 4.1 dibawah ini :
Tabel 4.1 Kriteria prediksi laporan perkembangan pinjaman tabungan
No Atribut Kriteria
1 Jenis Kelamin 1. Laki – laki 2. Perempuan 2 Jenis Usaha 1. Perawatan Sawit
2. Pertanian 3. Palawija 4. Dagang 5. Jasa
3 Periode pinjaman 1. 1 bulan – 6 bulan 2. 7 bulan – 12 bulan 3. 13 bulan – 18 bulan 4. 19 bulan – 24 bulan 5. 25 bulan – 30 bulan 6. 31 bulan – 36 bulan 4 Pinjaman Total 1. Besar >10.000.000
2. Sedang >5.000.000 – 10.000.000 3. Kecil <5.000.000
b. Perhitungan Algoritma C4.5 1. Mempersiapkan data training
Data sampel yang digunakan pada perhitungan algoritma c4.5 288 dari data Laporan Pinjaman Tabungan BUM Kampung Anugrah yang berjumlah 1028 data. Seperti yang terlihat pada Tabel 4.2 dibawah ini
Tabel 4.2 Data Training
No NAMA JK Jenis Usaha Period
Pinj Pinjaman (Rp) Total Ket 1 Sarah P Dagang 18 2.540.000 Ls 2 Dewi P Palawija 18 1.791.000 Ls 3 M.Sholeh L Dagang 18 1.270.000 Ls 4 Eko L Palawija 18 2.420.000 Ls 5 Sunarsih P Palawija 12 3.495.000 Ls …. …. …. …. …. …. ….
6 2. Menghitung akar dari pohon
Sebelum menghitung nilai gain, terlebih dahulu menghitung nilai entropy. Pertama yang harus dilakukan adalah menghitung nilai entropy total dari tabel 4.2.
Diketahui : Jumlah kasus (s) = 288 Jumlah kasus Tepat Waktu = 251 Jumlah kasus Tidak Tepat Waktu = 37
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑𝑛𝑖=1−𝑃𝑖∗ 𝑙𝑜𝑔2𝑝𝑖
= ((-251/288) * 𝑙𝑜𝑔2(251/288) + (-37/288) * 𝑙𝑜𝑔2(37/288)) = ((-0,87153 * -0,19838) + (-0,12847 * -2,96047))
= 0,17289 + 0,38034 = 0,55323
3. Menghitung nilai gain
Setelah mendapatkan nilai entropy dari atribut jenis kelamin maka langkah selanjutnya adalah menghitung nilai gain
𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝ℎ𝑦(𝑆) − ∑𝑛𝑖=1 |𝑆𝑖|
|𝑆| ∗ 𝐸𝑛𝑡𝑟𝑜𝑝ℎ𝑦(𝑆1)
= (0,55323) – ((101/288 * 0,46585) + (187/288 * 0,5956)) = 0,0031
4. Mengulangi langkah ke -2 dan ke-3 untuk menghitung atribut yang selanjutnya hingga semua atribut terpatisi
Tabel 4.3 Hasil perhitungan Entropy dan Gain
Variabel Value Jumlah
kasus TW TTW Entropy Gain
Total 288 251 37 0,553233312 Jenis Kelamin 0,003130629 Perempuan 101 91 10 0,465849174 Laki-Laki 187 160 27 0,595608590 Jenis Usaha 0,123449537 Perawatan Sawit 219 204 15 0,360275056 Pertanian 35 15 20 0,985228136 Dagang 28 26 2 0,371232327 Palawija 5 5 0 0,000000000 Jasa 1 1 0 0,000000000 Periode Pinjaman 0,054776778
7 Lanjutan Tabel 4.3
Variabel Value Jumlah
kasus TW TTW Entropy Gain
1– 6 bulan 80 60 20 0,811278124 7–12 bulan 58 57 1 0,125658050 13–18 bulan 126 114 12 0,453716339 19–24 bulan 20 17 3 0,609840305 25–30 bulan 2 1 1 1,000000000 31–36 bulan 2 2 0 0,000000000 Pinjaman Total 0,007941530 >10.000.000 34 31 3 0,430551867 >5.000.000-10.000.000 73 67 6 0,409855370 <5.000.000 181 153 28 0,621468662
Dari Tabel 4.3 dapat dilihat bahwa atribut yang memiliki nilai gain tertinggi adalah jenis usaha. selanjutnya dilakukan hal yang sama untuk mengitung nilai entropy dan gain dari sub-sub node yang belum terpenuhi nilainya dan dari tabel diatas yang akan menjadi rood node adalah jenis usaha. Seperti yang terlihat pada Gambar 4.1.
Gambar 4.1 Pohon Keputusan Rood Node
1.2 1.1 PS PER D PA J TW TW 1.3 Jenis Usaha
8 5. Proses partisi pohon keputusan selesai.
Dari gambar 4.1 sudah dapat menentukan rule atau aturan yang terbentuk dari perhitungan Gain dan entropy sebagai berikut :
a. Jika jenis usaha = palawija maka nasabah = Tepat waktu b. Jika jenis usaha = jasa maka nasabah = Tepat waktu c. Desain Sistem
Desain sistem merupakan gambaran dari sistem yang dirancang dan direpresentasikan dengan diagram-diagram yang menunjukkan proses atau aliran data dan langkah kerja dari sistem tersebut. Pada prediksi laporan perkembangan pinjaman tabungan pada badan usaha milik kampung ini menggunakan metode algoritma C4.5 dengan beberapa tahapan perancangan sistem diantaranya menggunakan Class Diagram, Use Case Diagram, Activity Diagram, dan Squence Diagram.
d. Implementasi Sistem
Implementasi sistem meruapakan desain tampilan antarmuka yang dihasilkan dalam prediksi laporan perkembangan pinjaman tabungan pada badan usaha milik kampung menggunakan algoritma C4.5.
e. Pengujian Sistem
Pada proses pengujian sistem yang telah dibuat dilakukan berdasarkan metode pengujian Black box. Pengujian Black box menguji dari sisi fungsionalitas, aplikasi diuji agar dapat memenuhi fungsi sebagaimana mestinya. pengujian Black box adalah dengan menggunakan teknik Equivalence Partitioning (EP) yang penulis gunakan untuk menguji masukan serta membagi masukan kedalam kelompok-kelompok berdasarkan fungsinya. Sehingga didapatkan sebuah test case yang akurat (Jaya, 2018).
KESIMPULAN
Berdasarkan penelitian yang dilakukan oleh penulis dengan mengamati dan menganalisa sistem pengolahan data yang digunakan serta teori dan alat yang berkaitan dengan penelitian, maka dapat diambil kesimpulan sebagai berikut :
1. Dalam penelitian dapat dikatakan bahwa sistem prediksi laporan perkembangan pinjaman tabungan pada BUM Kampung Anugrah dapat memprediksi laporan perkembangan pinjaman tabungan yang tepat waktu dan tidak tepat waktu berdasarkan kriteria yang telah ditentukan dan sistem yang dihasilkan berjalan dengan baik.
2. Sistem prediksi menggunakan metode algoritma C4.5 ini dapat membantu pihak organisasi BUM Kampung anugrah untuk mengetahui apakah nasabah yang melakukan peminjaman dapat mengembalikan pimjaman secara tepat waktu atau tidak tepat waktu.
3. Metode algoritma C4.5 ini dapat memberikan informasi rule atau aturan yang nantinya akan digunakan sebagai acuan prediksi data selanjutnya. namun dalam pemilihan variabel yang digunakan dalam memprediksi dapat mempengaruhi rule yang dihasilkan.
9 SARAN
Berdasarkan kesimpulan diatas, maka penulis merekomendasikan beberapa hal berupa saran-saran sebagai berikut :
1. Sistem prediksi ini juga dapat dikembangkan dengan menggunakan metode lainnya seperti K-NN (K-Nearest Neighbor), Neural Network, dll. sehingga dapat dibandingkan hasil prediksi laporan perkembangan pinjaman tabungan antara satu metode dengan metode yang lain.
2. Sistem prediksi laporan perkembangan pinjaman tabungan BUM Kampung Anugrah ini dapat di kembangkan lebih lanjut agar sistem yang sudah berjalan dapat diakses secara lebih baik dan menambah fitur agar lebih lengkap.
Demikian saran yang dapat penulis berikan, mudah-mudahan dapat dijadikan sebagai bahan masukan yang bermanfaat untuk penelitian yang berkaitan di masa yang akan datang.
UCAPAN TERIMA KASIH
Penulis mengucapkan terima kasih kepada ibu Efvi Mahdiyah, S.Kom, MIT yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.
DAFTAR PUSTAKA
Jaya, T. S. (2018). Pengujian Aplikasi dengan Metode Blackbox Testing Boundary Value Analysis (Studi Kasus: Kantor Digital Politeknik Negeri Lampung). Jurnal Informatika Pengembangan IT (JPIT), 3(2), 45–46. Retrieved from http://www.ejournal.poltektegal.ac.id/index.php/informatika/article/view/647/640 Pambudi, R. H., Setiawan, B. D., & Indriati. (2018). Penerapan Algoritma C4 . 5 Untuk
Memprediksi Nilai Kelulusan Siswa Sekolah Menengah Berdasarkan Faktor Eksternal. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(7), 2637–2643. Retrieved from http://j-ptiik.ub.ac.id5
Siallagan, T. F. (2015). Pencarian Nasabah dengan Menggunakan Data Mining dan Algoritma C4.5 Koperasi MADUMA Subang. Jurnal Teknik Informatika Dan Sistem Informasi, 1(3), 221–228. https://doi.org/10.28932/jutisi.v1i3.399
Sucipto, A. (2015). Prediksi Kredit Macet Melalui Perilaku Nasabah Pada Koperasi Simpan Pinjam Dengan Menggunakan Metode Algoritma Klasifikasi C4.5. Jurnal DISPROTEK, 6(1), 75–87.