Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI)
804
Klasifikasi Nasabah Dalam Pengelolaan Resiko Kredit Menggunakan Metode Naïve Bayes
Betrisandi1*, Ruhmi Sulaehani2, Ivo Colanus Rally Drajana3
1-3Universitas Pohuwato
Jl. Trans Sulawesi No.147 Marisa 96266 Pohuwato Corresponding author‘s e-mail: [email protected]
Abstrak - Pengelolaan risiko kredit merupakan elemen kritis dalam industri keuangan, di mana perusahaan perbankan dan lembaga keuangan lainnya berupaya untuk meminimalkan risiko gagal bayar peminjam.
klasifikasi nasabah menjadi tantangan signifikan dan memegang peranan penting dalam proses pengambilan keputusan kredit. Oleh karena itu, klasifikasi nasabah menjadi suatu aspek penting dalam proses pengambilan keputusan kredit yang dapat membentuk dasar keputusan terkait penentuan suku bunga, plafon kredit, dan pemantauan risiko secara keseluruhan. penelitian ini bertujuan untuk memberikan kontribusi pada pemahaman mendalam terkait metode klasifikasi yang efektif dalam mengelola risiko kredit dengan menggunakan metode klasifikasi, dengan fokus pada pendekatan Naive Bayes, untuk mengatasi permasalahan yang dihadapi dalam klasifikasi nasabah. Kumpulkan data nasabah yang mencakup berbagai fitur atau atribut seperti umur, penghasilan, merek barang, jangka waktu dan jumlah bayar dengan hasil akurasi pada penelitian ini sebesar 87,30% sehingga membantu dalam pengambilan keputusan yang tepat dan akurat dalam memberikan kredit kepada nasabah.
Kata kunci: Metode Naïve Bayes, Klasifikasi, Nasabah
Abstract - Credit risk management is a critical element in the financial industry, where banking companies and other financial institutions strive to minimize the risk of borrower default. Customer classification is a significant challenge and plays an important role in the credit decision making process. Therefore, customer classification is an important aspect in the credit decision making process which can form the basis of decisions regarding determining interest rates, credit ceilings and overall risk monitoring. This research aims to contribute to an in-depth understanding of effective classification methods in managing credit risk using classification methods, with a focus on the Naive Bayes approach, to overcome problems faced in customer classification. Collect customer data which includes various features or attributes such as age, income, brand of goods, time period and payment amount with accuracy results in this research of 87,30%
thus helping in making the right and accurate decisions in providing credit to customers.
Keywords: Naïve Bayes Method, Classification, Customer
1. Pendahuluan
Dalam industri keuangan, pengelolaan risiko kredit menjadi salah satu aspek utama yang memerlukan perhatian khusus. Kesehatan keuangan suatu perusahaan perbankan atau lembaga keuangan seringkali sangat tergantung pada kemampuannya untuk mengelola risiko gagal bayar peminjam dengan efektif. Pengelolaan risiko kredit merupakan elemen kritis dalam industri keuangan, di mana perusahaan perbankan dan lembaga keuangan lainnya berupaya untuk meminimalkan risiko gagal bayar peminjam. klasifikasi nasabah menjadi tantangan signifikan dan memegang peranan penting dalam proses pengambilan keputusan kredit. Oleh karena itu, klasifikasi nasabah menjadi suatu aspek penting dalam proses pengambilan keputusan kredit, yang dapat membentuk dasar keputusan terkait penentuan suku bunga, plafon kredit, dan pemantauan risiko secara keseluruhan [1].
Klasifikasi nasabah memungkinkan perusahaan untuk mengembangkan model penilaian risiko yang lebih akurat. Dengan mempertimbangkan faktor-faktor seperti riwayat kredit, kestabilan keuangan, dan jenis industri, perusahaan dapat membuat estimasi risiko yang lebih tepat [2]. Pengelolaan risiko kredit yang baik tidak hanya melibatkan identifikasi risiko tetapi juga langkah-langkah untuk memitigasi risiko tersebut.
Klasifikasi nasabah menjadi landasan dalam upaya perlindungan terhadap risiko kredit dan menjaga stabilitas keuangan perusahaan [3].
Oleh karena itu, penelitian ini bertujuan untuk memberikan kontribusi pada pemahaman mendalam terkait metode klasifikasi yang efektif dalam mengelola risiko kredit dengan menggunakan metode klasifikasi, dengan fokus pada pendekatan Naive Bayes, untuk mengatasi permasalahan yang dihadapi dalam klasifikasi nasabah. Naive Bayes dipilih karena kemampuannya dalam menangani dataset yang kompleks dan mampu
Submitted Date : 25 Desember 2023 Accepted Date : 26 Deseember 2023
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI)
805 memberikan estimasi probabilitas kelas dengan cepat. Dengan merinci latar belakang permasalahan dan memanfaatkan metode klasifikasi yang tepat, penelitian ini bertujuan untuk memberikan kontribusi positif terhadap praktik pengelolaan risiko kredit, membantu perusahaan keuangan untuk membuat keputusan yang lebih tepat dan akurat dalam memberikan kredit kepada nasabah.
2. Tinjauan Pustaka 2.1. Data Mining
Data mining adalah suatu proses penggalian informasi yang mengidentifikasi pola tersembunyi atau pengetahuan yang bermanfaat dari sejumlah besar data. Teknik ini melibatkan analisis statistik, pembelajaran mesin, kecerdasan buatan, dan metode matematika lainnya untuk mengungkap hubungan dan tren yang mungkin sulit ditemukan dengan cara tradisional [4].
Data mining sering memanfaatkan algoritma pembelajaran mesin untuk mengklasifikasikan data, membuat prediksi, atau mengenali pola. Algoritma ini dapat berupa Decision Trees, Naive Bayes, Support Vector Machines, dan banyak lagi.
2.2. Naïve Bayes
Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya [5].
Klasifikasi adalah suatu fungsionalitas data mining yang menghasilkan model untuk memprediksi kelas atau kategori dari objek - objek didalam basis data. Klasifikasi merupakan proses yang terdiri dari dua tahap, yaitu tahap pembelajaran dan tahap pengklasifikasian. Pada tahap pembelajaran, sebuah algoritma klasifikasi akan membangun sebuah model klasifikasi dengan cara menganalisis training data. Tahap pembelajaran dapat juga dipandang sebagai tahap pembentuakan fungsi atau pemetaan Y=F(X) dimana Y adalah kelas hasil prediksi dan X adalah tuple yang ingin diprediksi kelasnya. Selanjutnya pada tahap pengklasifikasian, model yang telah dihasilkan akan digunakan untuk melakukan pengklasifikasian. klasifikasi adalah proses pencarian sekumpulan model yang menggambarkan dan membedakan kelas data dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu obyek yang belum diketahui kelasnya. Naïve Bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas [6].
2.3. RapidMiner
Rapidminer merupakan platform perangkat lunak yang dikembangkan oleh perusahaan dengan nama yang sama, yang menyediakan lingkungan terpadu untuk pembelajaran mesin (machine learning), pembelajaran mendalam (deep learning), penambangan text (text mining), dan analisis prediktif (predictive analytic).
Aplikasi ini digunakan untuk aplikasi bisnis dan komersial serta untuk penelitian, pendidikan, pelatihan, pembuatan prototype dengan cepat, dan pengembangan aplikasi serta mendukung semua langkah proses pembelajaran mesin termasuk persiapan data, visualisasi hasil, validasi dan pengoptimalan.
3. Metode Penelitian
Berikut adalah langkah-langkah umum untuk menerapkan klasifikasi pelanggan menggunakan metode Naive Bayes:
a. Pengumpulan Data
Kumpulkan data nasabah yang mencakup berbagai fitur atau atribut seperti umur, penghasilan, merek barang, jangka waktu dan jumlah bayar. Data ini diperlukan untuk melatih model Naive Bayes.
b. Pemisahan Data
Pisahkan data menjadi dua bagian, yaitu data pelatihan (training data) dan data pengujian (testing data).
Data pelatihan digunakan untuk melatih model, sedangkan data pengujian digunakan untuk menguji performa model.
c. Pemilihan Fitur
Identifikasi fitur-fitur yang paling relevan untuk klasifikasi nasabah. Fitur-fitur ini dapat mencakup informasi seperti preferensi produk, frekuensi pembelian, atau demografis pelanggan.
d. Pelatihan model naïve bayes
Gunakan data pelatihan untuk melatih model Naive Bayes. Model ini akan belajar dari hubungan antara fitur-fitur yang ada dan kategori nasabah yang telah ditentukan sebelumnya.
e. Perhitungan Probabilitas
Hitung probabilitas kelas atau kategori nasabah untuk setiap kombinasi fitur. Ini melibatkan penggunaan teorema Bayes untuk menghitung probabilitas posterior dari kelas berdasarkan fitur-fitur yang diamati.
f. Klasifikasi nasabah
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI)
806 Gunakan model yang telah dilatih untuk mengklasifikasikan nasabah pada data pengujian ke dalam kategori tertentu.
g. Evaluasi model
Evaluasi model Naive Bayes dengan menggunakan metrik evaluasi seperti akurasi, presisi, recall, dan F1- score. Ini membantu menilai seberapa baik model dapat mengklasifikasikan nasabah.
Precision =𝑇𝑃+𝐹𝑃𝑇𝑃 x 100%
Recall = 𝑇𝑃
𝑇𝑃+𝐹𝑁 x 100%
Accuracy = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑡𝑜𝑡𝑎𝑙 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 x 100%
h. Implementasi
Terapkan model Naive Bayes yang telah dilatih pada data pelanggan baru untuk melakukan klasifikasi secara real-time atau berkelanjutan.
Gambar 1. Desain Eksperimen 4. Hasil dan Pembahasan
Pada penelitian ini data yang digunakan adalah data bersih yang sudah melalui tahap prepocesing, data nasabah yang berjumlah 210, dengan attribute umur, penghasilan, merek barang, jangka waktu, jumlah bayar.
Data nasabah tersebut dibagi 2 bagian yaitu data training 70% dari 210 yaitu 147 adalah data training dan 30% yaitu berjumlah 63 data nasabah menjadi data uji yang akan dilakukan klasifikasi menggunakan algoritma naïve bayes. Data nasabah tersebut yang akan dilakukan klasifikasi ditunjukkan pada tabel 1.
Tabel 1. Data Nasabah
NO UMU
R
PENGHASILA
N MERK
JANGKA ANSGURA
N
JUMLAH ANGSURAN
KELANCARAN PEMBAYARA
N
1 35 5.454.000,00 SCOOPY
PRESTIGE 18 2.054.000 LANCAR
2 41 3.220.000,00 BEAT SPORTY
CBS ISS 36 1.388.000 TIDAK
LANCAR
3 43 6.730.000,00 JUPITER ZI CW 12 2.759.000 LANCAR
4 29 4.250.000,00 NMAX 150ABS 24 1.711.000 LANCAR
Data Nasabah
Data Preprocesing
Data Training Data Testing
Naïve Bayes
Model Naïve Bayes
Performance
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI)
807
5 32 6.500.000,00 REVO FIT 12 2.759.000 LANCAR
6 44 3.560.000,00
NEW SUPRA GTR150 EXCLUSIVE
24 1.711.000 TIDAK
LANCAR 7 47 4.255.000,00 NEW BEAT
STREET 24 1.711.001 LANCAR
8 31 3.320.000,00 NEW SCOOPY
STYLISH 24 1.711.002 TIDAK
LANCAR
9 27 3.790.000,00 VARIO 150 24 1.711.003 LANCAR
10 49 3.500.000,00 CRF150L 30 1.513.000 LANCAR
11 46 4.830.000,00 VARIO 160 CBS 18 2.054.000 LANCAR
.. … … … … … …
Data yang sudah diolah kemudian diuji dengan menggunakan aplikasi Rapidminer, pada tahap ini dengan melakukan drag dan drop data set yang ada di repository ke dalam menu bar proses.
Gambar 2. Hasil Akurasi pada Rapidminer
Berdasarkan gambar di atas menjelaskan bahwa hasil akurasi pada penelitian ini sebesar 87,30% dengan rincian sebagai berikut :
a. Hasil Prediksi LANCAR dan True LANCAR berjumlah 50 b. Hasil Prediksi LANCAR dan True TIDAK LANCAR berjumlah 7 c. Hasil Prediksi TIDAK LANCAR dan True LANCAR berjumlah 1
d. Hasil Prediksi TIDAK LANCAR dan True TIDAK LANCAR berjumlah 5
Precision adalah proporsi data yang benar – benar kelas lancar diantara data yang diklasifikan sebagai kelas LANCAR :
Precision : Proporsi jumlah sampel bernilai true yang berhasil diprediksi secara tepat.
Precision = 𝑇𝑃
𝑇𝑃+𝐹𝑃 = 50
50+7 x 100% = 87,72%
Recall : Proporsi sampel bernilai true yang diprediksi secara benar.
Recall = 𝑇𝑃
𝑇𝑃+𝐹𝑁 = 50
50+1 x 100% = 98,04%
Selanjutnya hitung nilai akurasinya.
Akurasi = 𝐵𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑡𝑜𝑡𝑎𝑙 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 x 100%
=
50+5
50+7+1+5 x 100% = 87,30%
Dapat disimpulkan bahwa perhitungan persentase tingkat akurasinya dalam mengklasifikasi data nasabah sebesar 87,30%.
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI)
808 5. Kesimpulan
Kesimpulan dari penelitian :
1. Klasifikasi nasabah dengan menggunakan metode naïve bayes dapat digunakan oleh perusahaan perbankan atau keungan dalam mengklasifikasi nasabah.
2. Dengan mengklasifikasikan nasabah akan membantu dalam pengambilan keputusan yang lebih tepat dan akurat dalam memberikan kredit kepada nasabah.
Daftar Pustaka
[1] Saunders, A., & Cornett, M. M. Financial Institutions Management: A Risk Management Approach.
McGraw-Hill Education,2014
[2] Altman, E. I., Resti, A., & Sironi, A. Credit Risk Management: The State of the Art. Springer,2019.
[3] Crouhy, M., Galai, D., & Mark, R. The Essentials of Risk Management. McGraw-Hill Education,2006.
[4] Susana, H., & dkk (2020). Penerapan Model Klasifikasi metode Naïve Bayes terhadap Penggunaan Akses Internet. JURSISTEKNI Vol4,No, 2022
[5] Bustami.. Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. TECHSI.
2013
[6] Budi Santosa, Data Mining : Teknik Pemanfaatan Data untuk Keperluan Bisnis/Studi, 1st ed. Yog- yakarta: Graha Ilmu, 2007.
[7] Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springe
[8] Betrisandi,.Klasifikasi Nasabah Asuransi Jiwa Menggunakan Algoritma Naïve Bayes Berbasis Backward Elimination.,ILKOM Vol 9 Nomor 1, 2017
[9] Russell, S., & Norvig, P. (2009). Artificial Intelligence: A Modern Approach. Prentice H