INF-226
KOMPARASI ALGORITMA C4.5, K-NEAREST NEIGHBOR DAN NEURAL NETWORK
DALAM MENENTUKAN KELAYAKAN FASILITAS KREDIT : STUDI KASUS PT. BANK
MEGA, TBK.
Andi Diah Kuswanto
Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
http://www.nusamandiri.ac.id
Hilman Pardede
Pascasarjana Magister Ilmu omputer STMIK Nusa Mandiri
http://www.nusamandiri.ac.id
ABSTRAK — Di industri perbankan, kredit merupakan
sumber keuntungan bisnis dengan risiko tinggi. Kebutuhan untuk mengidentifikasi dan membedakan antara pelanggan baik dan buruk perlu dibangun sehingga pihak yang berkepentingan dapat mengambil satu tindakan pencegahan masalah kredit macet. Dalam penelitian ini, algoritma perbandingan C4.5, pembayaran angsuran K-Nearest Neighbor Network dan Neural Network atau tidak. Dari hasil pengujian untuk mengukur performansi dari ketiga algoritma tersebut dengan menggunakan metode uji Confusion Matrix dan kurva ROC, diketahui bahwa algoritma C4.5 memiliki nilai akurasi tertinggi. Sehingga bisa diaplikasikan pada masalah penentuan kelayakan kredit.
Kata kunci: C4.5, K-Nearest Neighbor, Neural Network, Confusion Matrix, Kurva ROC.
ABSTRACT In banking industry, credit is a source of
business advantage with high risk. The need to identify and distinguish between good and bad customer needs to be built so that interested parties can take one precaution the problem of bad credit. In this research, comparison algorithm C4.5, K-Nearest Neighbor and Neural Network installment payment or not. From the test results to measure the performance of the three algorithms using the test method Confusion Matrix and the ROC curve, it is known that the C4.5 algorithm has the highest accuracy value. So it can be applied to the problem of determining the credit worthiness.
Keywords: C4.5, K-Nearest Neighbor, Neural Network, Confusion Matrix, Kurva ROC.
PENDAHULUAN
Berawal dari sebuah usaha milik keluarga bernama PT. Bank Karman yang didirikan pada tahun 1969 dan berkedudukan di Surabaya, selanjutnya pada tahun 1992 berubah nama menjadi PT. Mega Bank dan melakukan relokasi Kantor Pusat ke Jakarta. Seiring dengan perkembangannya PT. Mega Bank pada tahun 1996 diambil alih oleh PARA GROUP (PT. Para Global Investindo dan PT. Para Rekan Investama). Untuk lebih meningkatkan
citra PT. Mega Bank, pada bulan Juni 1997 melakukan perubahan logo dengan tujuan bahwa sebagai lembaga keuangan kepercayaan masyarakat, akan lebih mudah dikenal melalui logo perusahaan yang baru tersebut. Dan pada tahun 2000 dilakukan perubahan nama dari PT. Mega Bank menjadi PT. Bank Mega. Dalam rangka memperkuat struktur permodalan maka pada tahun yang sama PT. Bank Mega melaksanakan Initial Public Offering dan listed di BEJ maupun BES. Dengan demikian sebagian saham PT. Bank Mega dimiliki oleh publik dan berubah namanya menjadi PT. Bank Mega Tbk. Pada saat krisis ekonomi, Bank Mega mencuat sebagai salah satu bank yang tidak terpengaruh oleh krisis dan tumbuh terus tanpa bantuan pemerintah bersama-sama dengan Citibank, Deutche Bank dan HSBC. PT. Bank Mega Tbk. dengan semboyan "Mega Tujuan Anda" tumbuh dengan pesat dan terkendali serta menjadi lembaga keuangan ternama yang mampu disejajarkan dengan bank-bank terkemuka di Asia Pasifik dan telah mendapatkan berbagai penghargaan dan prestasi baik di tingkat nasional, regional maupun internasional. Dalam upaya mewujudkan kinerja sesuai dengan nama yang disandangnya, PT. Bank Mega Tbk. berpegang pada azas profesionalisme, keterbukaan dan kehati-hatian dengan struktur permodalan yang kuat serta produk dan fasilitas perbankan terkini.
Kredit merupakan salah satu produk utama perbankan. Kredit adalah penyediaan uang atau tagihan yang dapat dipersamakan dengan ini, berdasarkan persetujuan atau kesepakatan pinjam meminjam antara pelapor dengan pihak lain yang mewajibkan pihak peminjam untuk melunasi utangnya setelah jangka waktu tertentu dengan pemberian bunga termasuk cerukan, pengambilalihan tagihan dalam rangka kegiatan piutang dan pengambil alihan atau pembelian kredit pihak lain.(Peraturan Bank Indonesia Nomor 9/14/PBI/2007). Dalam industri perbankan kredit menjadi salah satu bentuk pelayanan yang diberikan bank kepada masyarakat dan memberikan andil besar dalam memberikan keuntungan bisnis dengan resiko tinggi..
Seiring dengan banyaknya nasabah kredit PT. Bank Mega Tbk maka bertambah pula permasalahan yang terjadi. Dimana hampir setiap bulannya ada nasabah yang bermasalah dalam hal ini kredit macet (Non Performace Loan). Kredit macet yang cenderung meningkat akan
INF-227
mengakibatkan penurunan penilaian masyarakat dan juga Bank Indonesia selaku regulator terhadap PT. Bank Mega Tbk. Dalam hal ini kurang tepatnya penilaian mengakibatkan terjadinya kredit macet.
Sehubungan dengan hal tersebut maka perlu di buatkan sebuah pendukung keputusan dengan cara menganalisa data-data historis yang ada pada tahun-tahun sebelumnya. Sehingga ditemukan sebuah knowledge baru yang mampu membantu PT. Bank Mega Tbk dalam mengambil penilaian yang tepat bagi calon nasabah baru. Sangatlah penting tentunya bagi pihak bank selaku pemberi kredit mengetahui dan bisa membedakan antara nasabah baik dan nasabah buruk sehingga dapat meminimalisir terhadap resiko kredit macet, maka kebutuhan sistem terkait hal tersebut menjadi sangat mendesak.
Pengertian kredit pada pasal 1 angka 11 Undang-undang No. 10 tahun 1998 tentang perubahan Undang- undang-undang No. 7 tahun 1992 tentang Perbankan adalah penyediaan uang atau tagihan yang dapat dipersamakan dengan itu, berdasarkan persetujuan atau kesepakatan pinjam-meminjam antara bank dengan pihak lain yang mewajibkan pihak peminjam untuk melunasi utangnya setelah jangka waktu tertentu dengan pemberian bunga.
Istilah kredit berasal dari perkataan latin credo, yang berarti saya percaya, yang merupakan kombinasi dari bahasa Sansekerta cred yang artinya kepercayaan dan bahasa latin do yang artinya saya tempatkan (Hariani, 2010). Memperoleh kredit berarti memperoleh kepercayaan. Atas dasar kepercayaan kepada seseorang yang memerlukannya maka di berikan uang, barang atau jasa dengan syarat membayar kembali atau memberikan penggantiannya dalam jangka waktu yang telah diperjanjikan (Hariani, 2010).
Kredit yang diberikan oleh bank didasarkan atas kepercayaan sehingga pemberian kredit merupakan pemberian kepercayaan kepada nasabah. Hal tersebut menunjukkan perlu diperhatikannya faktor kemampuan dan kemauan, sehingga tersimpul kehati-hatian dengan menjaga unsur keuntungan dari suatu kredit(Muhammad Jumhana dalam Hariani, 2010). Menurut Thomas Suyatno dalam Hariani(2010) mengemukakan bahwa unsur-unsur kredit terdiri atas (a) Kepercayaan, (b) Tenggang Waktu, (c) Degree of Risk (tingkat resiko), (d) Prestasi atau objek kredit.
BAHAN DAN METODE
Kerangka Pendekatan Penelitian
Penelitian menggunakan data observasi yang diambil langsung dari CoreSystem AS/400 PT. Bank Mega, Tbk. Tabel yang digunakan yaitu master data nasabah LNMAST kemudian akan dilakukan penentuan atribut yang akan digunakan dalam data minning.
Proses identifikasi masalah dilakukan dengan melihat, mengamati dan memahami proses pinjaman yang dilakukan, secara langsung maupun memahami data-data yang diperoleh dari CoreSystem/CoreBanking. Objek
penelitian ditentukan dengan menggunakan tehnik data
minning agar diperoleh algoritma yang tepat.
Variabel
Data dipersiapkan setelah diambil dari CoreSystem guna menentukan variable yang akan dibutuhkan. Permasalahan dalam penelitian ini adalah meningkatnya jumlah kredit macet,
Tabel 1 Daftar atribut
Attribut Keterangan
Sex jenis kelamin usia tingkat usia stskawin status perkawinan pekerjaan pekerjaan
stsrumah status tempat tinggal penghasilan besar penghasilan pinjaman jumlah pinjaman tenor jangka waktu kegunaan kegunaan collateral jaminan Sumber: Hasil penelitian (2013)
Transformation
Data yang digunakan dalam penulisan ini sebagian dalam angka, untuk model yang digunakan data ditransformasikan ke dalam klasifikasi atau kelompok berdasar interval.
Interval kelas haruslah yang sama. Prof. Strurge telah memberikan rumus berikut untuk menentukan ukuran interval kelas (Jain dan Aggarwal, 2010).
Tabel 2 atribut dan nilai kategori
Attribut Nilai Keterangan
sex P Pria W Wanita usia SP SPESIFIKASI (19 - 22 thn) IM IMPLEMENTASI (23 - 24 thn) ST STABILISASI (25 - 35 thn) KD KONSOLIDASI ( > 35 thn) stskawin 1 Menikah 2 Lajang 3 Duda/Janda
pekerjaan 11 KARYAWAN SWASTA 12 PNS / GURU
13 TNI/POLRI 14 PENSIUNAN 15 WIRAUSAHA
INF-228 99 LAIN-LAIN
stsrumah 1 MILIK SENDIRI 2 MILIK KELUARGA 3 SEWA/KONTRAK penghasilan 1 ≤ 2,2 juta 2 > 2,2 - 5 juta 3 > 5 - 7,5 juta 4 > 7,5 - 10 juta 5 > 10 juta pinjaman 0 ≤ 10 juta 1 > 10 ≤ 50 juta 2 > 50 ≤ 100 juta 3 > 100 ≤ 500 juta 4 > 500 < 1 milyar 5 ≥ 1 milyar
tenor S 1-12 Bulan = PENDEK M 13-36 Bulan = MENENGAH L > 36 Bulan = PANJANG kegunaan 10 MODAL USAHA
40 INVESTASI 70 KONSUMSI collateral 9 SHM/SHGB
10 V01
Sumber: Hasil penelitian (2013)
HASIL DAN PEMBAHASAN
Nilai akurasi dapat dihitung dengan menggunakan
software rapid minner. Keakuratan klasifikasi merupakan
tolak ukur yang menunjukkan bagaimana classifier dapat mengidentifikasi objek dengan benar (Gorunescu, 2011). Pengujian akurasi bertujuan untuk mengevaluasi tingkat akurasi dari masing-masing algoritma dengan menggunakan dua model yaitu Confusion Matrix dan kurva ROC (Receiver Operating Character).
Berdasarkan nilai accuracy yang ada, terlihat bahwa Algoritma C4.5 memiliki nilai akurasi tertinggi yaitu 72,92% kemudian diikuti dengan K-Nearest Neighbor 69,33% dan Neural Network 52,99%. Maka algoritma C4.5 layak untuk digunakan dalam menentukan kelayakan kredit di PT. bank Mega Tbk.
Tabel 3 Perbandingan Akurasi ketiga Algoritma
Metode Accuracy Perbandingan Akurasi
Training Testing
Algoritma C4.5 74,80% 82,06% 72,92%
K-Nearest Neighbor 72,80% 84,00% 69,33%
Neural Network 61,60% 93,00% 52,99%
Sumber: Hasil penelitian (2013)
Setelah ditemukan algoritma terbaik maka diterapkanlah algoritma tersebut kedalam bahasa pemprograman php dan di uji menggunakan data baru.
Sumber: Hasil penelitian (2013)
Gambar 1 GUI Form input data baru
Sumber: Hasil penelitian (2013)
Gambar 2 GUI Hasil nasabah yang diterima
Sumber: Hasil penelitian (2013)
INF-229
Sumber: Hasil penelitian (2013)
Gambar 4 Laporan data nasabah yang sudah diproses Dari penerapan algoritma tersebut maka dapat diprediksi nasabah mana saja yang dapat diberikan fasilitas kredit sehingga mengurangi resiko NPL (kredit macet. Hasil laporan dalam bentuk excel memudahkan user melihat data nasabah mana yang dterima dan mana yang ditolak untuk pengajuan kreditnya.
UCAPAN TERIMA KASIH
Terima kasih kepada orang tua, kerabat, teman dan semua pihak yang tidak dapat disebutkan satu persatu sehingga penelitian ini selesai dilakukan.
KESIMPULAN
Beberapa kesimpulan yang dapat diambil dari hasil penelitian yang dilakukan adalah:
1. Dalam penelitian ini dilakukan pembuatan model menggunakan Algoritma C4.5, K-Nearest
Neighbor dan Neural Network menggunakan data
nasabah yang mendapatkan kredit. Model yang dihasilkan, dikomparasi untuk mengetahui algoritma yang paling baik dalam penentuan resiko kredit. Untuk mengukur kinerja ketiga algoritma tersebut digunakan metode pengujian
Confusion Matrix dan Kurva ROC. Diketahui bahwa
algoritma C4.5 memiliki nilai 74,80%, diikuti oleh metode K-Nearest Neighbor 72,80%, dan
Neural Network 61,60%.
2. Diketahui bahwa penerapan data baru menggunakan Algoritma C4.5 menghasilkan data yang sesuai dengan prediksi lebih besar di banding dengan yang tidak sesuai dengan prediksi, sehingga dapat dikatakan bahwa program tersebut dapat digunakan untuk penentuan kelayakan pemberian kredit bagi nasabah yang akan menerima kredit.
REFERENSI
Awad, M. et al. (2009). Design And Implementation Of Data
Mining Tools. New York: CRC Press.
Banik Shipra, Farah Habib Chanchary, Khodadad Khan, Rifat Ara Rouf dan Mohammed Anwer. Neural
Network and Genetic Algorithm Approach for Forecasting Bangladeshi Monsoon Rainfall, (2008).
Proceedings of 11th International Conference on Computer and Information Technology (ICCIT 2008) 25-27 December, 2008, Khulna, Bangladesh
Bramer, Max. (2007). Principles of Data Mining. London: Springer
David, Olson L & Delen, Dursun. (2008). Advanced Data
Mining Techniques. Verlag Berlin Heidelberg :
Springer
Gorunescu, F. (2011). Data Minin Concepts, Models and
Techniques. Berlin Heidelberg: Springer Verlag.
Han, J., & Kember, M. (2006). Data Mining Concepts adn
Techniques. San Fransisco: Morgan Kauffman
.
Hannan, Shaikh Abdul, R. R. Manza, R. J. Ramteke. (2010).
Generalized Regression Neural Network and Radial Basis Function for Heart Disease diagnosis.
Maharashtra, India. International Journal of Computer Application (0975-8887) Volume 7- No.13. Hariani, Iswi. (2010). Restrukturisasi dan Penghapusan
Kredit Macet. Jakarta: PT Elexmedia Komputindo .
Haykin, S. (1999). Neural networks a comprehensive
foundation, Second Edition, Upper Saddle River, N.J.:
Prentice-Hall International, Inc.
Jiang,Yi. et al. (2007). A Bank Customer Credit
Evaluation Based on the Decision Tree and the Simulated Annealing Algorithm. Journal of
Department of Computer Science Xiamen University (IEEE International Co 8-11 July 2008)
Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta: Andi Publishing.
Larose, D. T. (2005). Discovering Knowledge in Data. New Jersey: John Willey & Sons, Inc.
Liao. (2007). Recent Advances in Data Mining of Enterprise
Data: Algorithms and Application. Singapore: World
Scientific Publishing
Linof, Gordon S & Berry, Michael J. (2011). Data
Mining Techniques: For Marketing, Sales, and Customer Relationship Management. Indiana: Wiley
INF-230 Maimon, Oded, & Rokach, Lior.(2010). Data Mining and
Knowledge Discovey Handbook. New York: Springer
Mania, Hasan & Patel. (2011). Comparative study of Naïve
Bayes Classifier and KNN for Tuberculosis.
International Journal of Computer Applications (IJCA).
Mujiasih,Subekti. (2011). Pemanfaatan Data Mining
Untuk Prakiraan Cuaca. Jurnal Meteorologi dan Geofisika Volume 12 Nomor 2 September
2011:189-195
Purnomo, Mauridhi Hery, Agus Kurniawan. (2006).
Supervised Neural Networks dan Aplikasinya.
Yogyakarta: Graha Ilmu
Santoso, Budi. (2007). Data Mining Teknik Pemanfaatan
Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu.
Satchidananda, S S & Jay B.Simha. (2006). Comparing
Decision Trees With Logistic Regression For Credit Risk Analysis (SAS APAUGC)
Suhadi, Gunarto.(2003). Usaha Perbankan dan Perspektif
Hukum. Yogyakarta: Kanisius.
Sumathi, S., & Sivanandam, S. (2006). Introduction to Data
Mining and its Applications. Verlag Berlin Heidelberg:
Springer.
Triantaphyllou, Evangelos. (2010). Data Mining and
Knowledge Discovery Via Logic-Based Methods. Verlag
Berlin Heidelberg : Springer
Venkatesan, P. & S. Anitha. (2006). Application of a radial
Basis Function Neural Network for Diagnosis of Diabetes Mellitus, Chennai, India: Current Science,
Vol. 91, No. 9.
Witten, I. H., Frank, E., & Hall, M. A. (2011).Data Mining:
Practical Machine Learning and Tools. Burlington:
Morgan Kaufmann Publisher.
Wu, Xindong& Kumar, Vipin. (2009). The Top Ten