62
BAB V PENUTUP
5.1. Kesimpulan
Dari beberapa uraian sebelumnya yang telah dibahas, penulis dapat mengambil kesimpulan dari pembahasan bab-bab sebelumnya, diantaranya:
1. Proses feature selection yang digunakan dalam penelitian ini terjadi pada tahap data preprocessing data yaitu data cleaning, data integration, data reduction, dan data transformation.
2. Perhitungan Algoritma KNN Secara manual Caranya yaitu dengan mencari jarak terdekat antara data yang akan dievaluasi dengan k tetangga (neighbor) terdekatnya dalam data. Jauh atau dekatnya jarak antar tetangga biasanya dihitung berdasarkan Euclidean Distance. Dimana rumusnya adalah 𝐷(𝑥 + 𝑦) = √∑𝑛𝑖=1 (𝑥𝑖+ 𝑦𝑖)2 . Dimana D adalah jarak antar atribut, x adalah data atribut baru y adalah data atribut lama.
3. Nilai akurasi algoritma k-nearest neigbour dengan validasi split validation pada penelitian kelayakan kredit anggota koperasi adalah sebesar 85,71%
4. Hasil conffussion matrik algoritma k-nearest neigbour dengan validasi split validation pada penelitian kelayakan kredit anggota koperasi adalah jumlah Pred Dikurangi-True Dikurangi = 9 data ; jumlah Pred Layak-True Layak = 9 data ; jumlah Pred Dikurangi-True Layak =2 data; jumlah Pred Layak-True
63
Dikurangi = 1 data. Sehingga nilai akurasi diperoleh dari total jumlah data yang benar diprediksi dibagi total jumlah data. Akurasi = 1821 = 85,71%
5. Nilai AUC dalam ROC Curve algoritma k-nearest neigbour dengan validasi split validation pada penelitian kelayakan kredit anggota koperasi adalah 0,836 yang merupakan good classification.
6. Nilai K untuk mendapatkan hasil akurasi tertinggi algoritma dengan validasi split validation pada penelitian kelayakan kredit anggota koperasi adalah 5.
5.2. Saran
Saran pada penilitian ini sebagai berikut:
1. Perlu dilakukan beberapa penelitian dengan menggunakan valiadasi lain seperti cross validation sehingga hasilnya dapat dibandingkan dengan validasi split validation dan hasilnya dapat dibandingkan dan ditemukan yang paling tinggi.
2. Pada validasi split validation perlu dilakukan beberapa penelitian dengan pembagian data set yang berbeda seperti perbandingan 60%-40% , 70%-30%, 80%-20%, sehingga hasilnya dapat dibandingkan dan ditemukan yang paling tinggi.
3. Perlu dikembangkan aplikasi dengan menggunkana algoritma yang telah diteliti dan dievaluasi untuk mengetahui layak atau tidaknya calon kreditur untuk mendapatkan pinjaman.