PENERAPAN DATA MINING KLASIFIKASI DENGAN MENGGUNAKAN ALGORITMA C4.5 PADA DATA NASABAH KREDIT DI BANK KREDIT
DESA (BKD) KABUPATEN REMBANG Dina Rusdiana Sari
Universitas Dian Nuswantoro
Jalan Nakula 1 No 5-11, (024) 3515261, Semarang e-mail: [email protected]
ABSTRAK
Bank adalah salah satu lembaga keuangan yang berperan penting dalam perekonomian di Indonesia. Bank menghimpun dana dari masyarakat yaitu berupa simpanan tabungan yang dilakukan oleh masyarakat, kemudian bank melakukan peranan bank yang lain yaitu memberikan jasa keuangan berupa kredit. Bank Kredit Desa (BKD) merupakan salah satu perbankan yang melayani perkreditan di desa. Adanya BKD memudahkan bagi rakyat pedesaan untuk meminjam dana . Kebutuhan masyarakat pedesaan yang semakin meningkat menyebabkan tidak sedikitnya yang melakukan kredit di BKD. Pada penelitian ini digunakan teknik data mining klasifikasi dengan metode algoritma C4.5 untuk mengetahui apakah nasabah tergolong nasabah lancar ataupun macet.. Dari hasil pengujian data menghasilkan akurasi sebesar 84,67% yang tergolong good classification dan menghasilkan rule dari pohon keputusan yang diterapkan pada implementasi sistem klasifikasi data nasabah kredit di BKD Kabupaten Rembang. Model ini berhasil diterapkan sistem untuk mengetahui nasabah yang tergolong lancar ataupun macet.
Kata kunci : data mining, klaifikasi, algoritma C4.5, kredit 1. Pendahuluan
Bank adalah salah satu lembaga keuangan yang berperan penting dalam perekonomian di Indonesia.
Bank menghimpun dana dari masyarakat yaitu berupa simpanan tabungan yang dilakukan oleh masyarakat, kemudian bank melakukan peranan bank yang lain yaitu memberikan jasa keuangan berupa kredit, agar dana yang dihimpun dari masyarakat bisa diputar kembali dalam bentuk
pinjaman dan pihak bank mengurangi resiko likuiditas sehingga dana yang ada dapat menjadi modal oleh pihak bank untuk menyalurkannnya dalam bentuk kredit, sehingga pihak bank tidak hanya membayar bunga atas tabungan dari nasabah [1].
Menurut SK Direksi Bank Indonesia No 31/KEP/DIR/ tanggal 12 November 1998 bahwa kegiatan perkreditan
merupakan proses
pembentukan asser bank sehingga kredit merupakan asset bank yang memiliki risiko risk asset karena asset tersebut dikuasai oleh pihak luar yaitu debitur. Bank harus berusaha mengelola asset tersebut agar kualitas risk asset tersebut menjadi sehat dalam arti produktif sehingga dapat memberikan kontribusi pendapatan yang besar bagi bank.
BKD (Bank Kredit Desa) merupakan salah satu perbankan yang melayani perkreditan di desa. BKD sudah ada sejak jaman kolonial Belanda, yang dirintis oleh seorang asisten residen pada tahun 1897 dan kemudian dikukuhkan berdasarkan Ordonansi 14 September 1929 (Staatsblad No. 357). Adanya BKD memudahkan bagi rakyat pedesaan untuk meminjam dana . Kebutuhan masyarakat pedesaan yang semakin meningkat menyebabkan tidak sedikitnya yang melakukan kredit di BKD.
Didalam menyalurkan dana kredit bank mendapati ada beberapa kredit yang dikatakan kurang lancar atau kredit macet yang kemudian akan berpengaruh kepada pemberian kredit selanjutnya atau juga bisa mempengaruhi kemampuan bank didalam menyalurkan kredit [1].
Dalam penelitian ini, penulis melakukan analisa kredit dengan menggali data- data yang sudah ada terhadap
data nasabah kredit BKD Rembang berdasarkan atribut- atributnya dengan teknik data mining menggunakan algoritma C 4.5. Data mining adalah proses menganalisa data dari perspektif yang
berbeda dan
menyimpulkannya menjadi informasi - informasi yang penting yang dapat digunakan untuk meningkatkan keuntungan, memperkecil biaya pengeluaran atau keduanya[2]. Algoritma C4.5 merupakan kelompok algoritma decision tree.
Algoritma ini mempunyai input berupa training samples dan samples [3]. Oleh karena itu, penelitian ini fokus pada pemanfaatan data mining dengan menggunakan algoritma C4.5 untuk klasifikasi data nasabah kredit, sehingga dapat diketahui apakah nasabah bersangkutan termasuk ke dalam golongan nasabah lancar ataupun macet dan sebagai acuan untuk
permohonan kredit
selanjutnya.
Penelitian sebelumnya dilakukan oleh Fitri Nuraeni, Rahadi Deli Saputra dan Neneng Sri Uryani “ Algoritma C 4.5 Untuk Klasifikasi Pola Pembayaran Kredit Motor Pada Perusahaan Pembiayaan (Leasing). Pada tahun 2012, Angga Ginanjar Mabrur dan Riani Lubis “ Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah Kredit”. Penelitian sebelumnya melakukan
penelitian untuk membandingkan beberapa algoritma data mining seperti regresi linier, neural network, dan decision tree. Semua model algoritma digunakan
untuk menganalisa
persetujuan pinjaman dalam bentuk kredit. Dari hasil penelitian yang didapat bahwa decision tree dengan algoritma C4.5 terbukti mempunyai akurasi tertinggi dalam menentukan keputusan dibandingkan dengan algoritma yang lain [4].
2. Metode Penelitian
Pada penelitian ini menggunakan model Cross Standard Industry for Data Mining (CRISP-DM) [5]
seperti pada gambar 1:
Gambar 1. CRISP-DM a) Pemahaman Bisnis
Istilah kredit memiliki arti khusus, yaitu meminjamkan
uang(penundaan
pembayaran) [1]. Didalam menyalurkan dana kredit bank mendapati ada beberapa kredit yang dikatakan kurang lancar atau kredit macet yang
kemudian akan
berpengaruh kepada pemberian kredit selanjutnya atau juga bisa mempengaruhi
kemampuan bank didalam menyalurkan kredit [1].
Guna untuk mencegah kredit macet maka harus adanya klasifikasi terhadap data nasabah.
b) Pemahaman Data
Data yang
digunakan pada penelitian ini diperoleh dari BKD Rembang. Data yang diperoleh yaitu data nasabah yang melakukan kredit pada BKD Rembang yang terdiri dari 10 variabel atau atribut diantaranya no pinjaman, nama, alamat, jenis kelamin, pekerjaan, penghasilan, pinjaman, jenis pinjaman, waktu pinjaman dan keterangan.
c) Pengolahan Data
Pada pengolahan data ini, data yang akan digunakan adalah sebagai berikut:
Tabel 1 Kedudukan Atribut yang Digunakan
Atribut Kegunaa n No
pinjaman
Tidak digunaka n
Nama Tidak
digunaka n
Alamat Tidak digunaka n
Jenis Kelamin
Tidak digunaka n
Pekerjaan Tidak digunaka n
Penghasila n
Regular (nilai model) Pinjaman Regular
(nilai model) Jenis Regular
(nilai model) Waktu Regular
(nilai model) Keterangan Label
(hasil)
Atribut yang
digunakan dikategorikan sebagai berikut:
Tabel 2 Kategori Atribut
Atribut Keterangan Penghas
ilan
a)Kecil <=
1.250.000 b)1.250.000<Se dang<=
2.750.000 c)Besar >
2.750.000 Pinjama
n
a)100.000 <
Kecil
<=2.575.000 b)2.575.000<Se dang
<=7.525.000 c)7.525.000 <
Besar<=10.000.
000
Waktu a)Pendek <=
10 bulan
b)10 bulan <
Sedang <= 26 bulan
c)Panjang > 26 bulan
d) Pemodelan (Modeling)
Pada tahap
pemodelan algoritma C4.5 dalam pengembangan model menggunakan framework RapidMiner versi 6 sehingga dapat menghasilkan hasil yang akurat.
Rumus perhitungan Entropy
( )
∑ (2)
Keterangan:
S : Himpunan kasus
n :
Jumlah partisi S pi : Proporsi dari Si ke S
Rumus perhitungan Gain
( ) ( )
∑ ( ( ))
(1) Keterangan:
S : Kasus A : Atribut n :Jumlah partisi atribut A
Si : Jumlah kasus pada partisi ke-i
S : Jumlah Kasus e) Evaluasi
Dalam tahap ini dilakukan pengukuran akurasi.
f) Fase Penyebaran (Deployment Phase)
Hasil dari penelitian ini adalah analisis yang mengarah ke Decision Support System (DSS) yang dapat digunakan oleh BKD untuk mengklasifikasikan data nasabah kredtit yang tergolong lancar maupun macet.
3. Pembahasan
Pengujian data dilakukan dengan menggunakan algoritma C4.5 pada
rapidminer yang
menghasilkan pohon keputusan seperti berikut:
Gambar 2. Decision tree Selain menghasilkan pohon keputusan, juga menghasilkan akurasi pada confusion matrix berikut ini:
Gambar 3. Confusion matrix Kemudian rule yang dihasilkan pada pengujian
data kemudian
diimplementasikan pada program.
Gambar 4. Implementasi 4. Kesimpulan
Dari permasalahan di atas dapat disimpulkan bahwa klasifikasi data nasabah kredit di BKD Rembang dapat diselesaikan menggunakan teknik data mining, yaitu dengan mengunakan algoritma C4.5, karena rules yang terbentuk sederhana. Akurasi yang dihasilkan dari pemodelan algoritma C4.5 sebesar 84,67% yang
tergolong Good
Classification.
5. Daftar Pustaka
[1] Nurul Fitria and Raina Linda Sari, "Analisis Kebijakan Pemberian Kredit dan Pengaruh Non Performing Loan Terhadap Loan To Deposit Ratio Pada PT. Bank Rakyat Indonesia (Persero), Tbk Cabang Rantau Aceh Tamiang (Periode 2007- 2011)," Ekonomi dan Keuangan, vol. 1, no. 1, pp.
88-101, Desember 2012.
[2] Angga Ginanjar Mabrur and Riani Lubis, "Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah Kredit," Komputer dan Informatika (KOMPUTA), vol.
1, pp. 53-57, Maret 2012.
[3] Sunjana , "Klasifikasi Data Nasabah Sebuah Asuransi Menggunakan Algoritma C 4.5," Seminar Nasional Aplikasi Teknologi Informasi 2010 (SNATI 2010), pp. 31- 34, Juni 2010.
[4] Fitri Nuraeni, Rahadi Deli Saputra, and Neneng Sri Uryani, "Algoritma C4.5
Untuk Klasifikasi Pola Pembayaran Kredit Motor Pada Perusahaan Pembiayaan (Leasing)," Seminar Nasional Informatika , pp. 245-250, 2013.
[5] Irwan Budiman, "Data Clustering Menggunakan CRISP-DM untuk Pengenalan Pola Proporsi Pelaksanaan Tridharma," Universitas, Diponegoro, Thesis Sistem Informasi 2012.