• Tidak ada hasil yang ditemukan

Analisis Data dan Kredit Jerman

N/A
N/A
Protected

Academic year: 2018

Membagikan "Analisis Data dan Kredit Jerman"

Copied!
5
0
0

Teks penuh

(1)

Analisis Data Kredit Jerman

© Ir. H. Arry Andriana, 2017 Independent Investor

Email: arry.andriana@gmail.com

Abstrak:

Ketika sebuah bank menerima permohonan pinjaman dari seseorang calon kreditor, berdasarkan profil pemohon bank harus membuat keputusan apakah menerima untuk melanjutkan proses pinjaman atau tidak.

Bank memiliki dua resiko:Jika pemohon memiliki resiko kredit yang baik dan cenderung membayar pinjamannya, maka keputusan bank untuk tidak memberi pinjaman menjadikan bank merugi karena kehilangan kesempatan memperoleh keuntungan. Sebaliknya jika pemohon memiliki resiko kredit yang buruk dan cenderung tidak melunasi pinjamannya, maka keputusan bank untuk memberi pinjaman akan menjadikan bank merugi.

Kata kunci:

Pembelajaran mesin, data mining, pattern recognition, jaringan syaraf, algoritma genetika, analisis kredit.

I. Pendahuluan

Data mining adalah langkah kritik dalam proses pencarian pengetahuan yang melibatkan teori, metodologi dan alat bantu untuk menemukan pola (pattern) in data. Adalah hal penting untuk memahami alasan rasional di samping metode sehingga alat bantu dan metode memiliki kesesuaian dengan data dan tujuan dari pengenalan pola (pattern recognition).

Ketika sebuah bank menerima permohonan pinjaman dari seseorang calon kreditor, berdasarkan profil pemohon bank harus membuat keputusan apakah menerima untuk melanjutkan proses pinjaman atau tidak.

Bank memiliki dua resiko:Jika pemohon memiliki resiko kredit yang baik dan cenderung membayar pinjamannya, maka keputusan bank untuk tidak memberi pinjaman menjadikan bank merugi karena kehilangan kesempatan memperoleh keuntungan. Sebaliknya jika pemohon memiliki resiko kredit yang buruk dan cenderung tidak melunasi pinjamannya, maka keputusan bank untuk memberi pinjaman akan menjadikan bank merugi.

Penulis menggunakan data kredit Jerman yang diperoleh dari alamat UCI Machine Learning Repository https://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credi t+Data) yang berisi 20 variabel dan klasifikasi apakah seorang

pemohon kredit dianggap sebagai sebuah resiko Kredit Baik atau Buruk untuk 1000 pemohon pinjaman.

Tujuan dari analisis ini adalah untuk mengurangi resiko dari sudut pandang bank, bank memerlukan sebuah aturan keputusan sebagai pihak yang harus memberikan persetujuan untuk memberi pinjaman atau tidak kepada pemohon pinjaman. Profil demografik dan sosial ekonomi seorang pemohon akan diteliti oleh manajer pinjaman sebelum sebuah keputusan diambil sesuai permohonan pinjamannya.

Table 1 Deskripsi Variabel Input dan Output

Tabel 1 di atas menunjukkan semua variabel input dan output yang digunakan beserta rentang nilainya.

Hasil yang ingin diperoleh adalah berupa klasifikasi setiap data pemohon apakah termasuk pemohon dengan kredit profil yang baik (Worthed) atau buruk (Not Worthed).

Tabel 2 berikut ini menunjukkan deskripsi pengertian dari nilai variabel yang digunakan.

(2)

Tabel 2 Deskripsi variabel dikonversi menjadi numerik

Setelah nilai bobot (weight) dan bias jaringan syaraf diperoleh, selanjutnya dioptimisasi lebih lanjut dengan Algoritma genetika. Beberapa nilai statistik akan digunakan untuk mengukur seberapa jauh hasil prediksi jaringan syaraf dan juga setelah dioptimisasi lebih lanjut dengan algoritma genetika. Variabel statistik yang digunakan antara lain: R2, r2, MSE (Mean Squared

error), r (Pearson correlation), minimum absolute error, maksimum absolut error, range of percentage.

II. Jaringan Syaraf

Pengertian jaringan syaraf (neural network) berasal dari analogi yang memiliki otak manusia dan merupakan model sederhana dari “jaringan syaraf biologis”. Jaringan otak manusia memiliki 1011 neuron (sel-sel otak). Dalam sebuah jenis syaraf, ia terdiri dari sebuah nukleus yang terhubung dengan neuron-neuron lainnya melalui sebuah jaringan fiber yang disebut dendrit. Di luar nukleus terdapat axon yang mengirimkan sinyal berupa potensial listrik melalui proses kimia rumit. Ketika sinyal diterima oleh neuron, menjadi sinyal yang memiliki nilai yang sama atau melebihi nilai batasan, ia akan memicu pengiriman sebuah sinyal listrik dari tingkat dan waktu yang tetap melalui axon. Dengan cara ini sinyal dikirim dari satu neuron ke neuron lainnya.

Dalam jaringan syaraf, neuron atau unit pemrosesan bisa memiliki beberapa jalur input yang bersesuaian dengan dendrit-dendrit. Unit-unit dikombinasikan biasanya melalui penjumlahan sederhana, yaitu nilai terbobotkan (weighted value) dari jalur-jalur ini. Nilai terbobotkan akan dilewatkan ke neuron, yang mana akan dimodifikasi dengan fungsi transfer sebagai pemberi batasan (threshold limit) seperti fungsi sigmoid. Nilai termodifikasi tersebut dijalarkan ke neuron berikutnya. Prinsip inilah yang dikenal dengan penjalaran (propagation).

Gambar 2 Representasi matematika Jaringan Syaraf

Dalam bentuk persamaan matematika, komponen input, bobot, bias dan fungsi transfer. Aturan penjalaran yang digunakan adalah penjumlahan nilai terbobotkan.

Gambar 3 Komponen dasar Jaringan Syaraf

Dalam bentuk formula matematika berikut:

(1)

Di mana:

Sk(t) sebagai total input ke k

wjk(t) sebagai pembobot dari input j ke neuron tersembunyi k

yj(t) sebagai output dari neuron sebelumnya

(3)

Semua input sebelum dimasukkan ke dalam jaringan akan dinormalisasi terlebih dahulu sehingga memiliki rentang nilai antara 0-1 atau -1 hingga 1.

Selanjutnya melalui fungsi transfer Fk digunakan untuk

menghasilkan nilai aktivasi berdasarkan nilai total input ke k, menggunakan persamaan berikut

(2)

Fungsi transfer bias berupa fungsi logistic

f(x)=1/(1+exp(-x)) (3)

III. Algoritma genetika

Sebuah algoritma genetika (GA) adalah teknik pencarian yang digunakan dalam komputasi untuk mencari solusi yang tepat atau perkiraan untuk mencari dan masalah optimisasi. Algoritma genetik adalah kelas khusus dari perhitungan evolusi yang menggunakan teknik terinspirasi oleh biologi evolusioner seperti sebagai warisan, mutasi, seleksi, dan crossover. Sebuah algoritma genetika menemukan solusi potensial untuk masalah tertentu sebagai kromosom sederhana seperti struktur data sehingga dapat menjaga informasi penting.

Pelaksanaannya dimulai dengan pemilihan populasi kromosom, yang merupakan seperangkat solusi untuk masalah yang bisa terjadi untuk skenario tertentu. Satu mengevaluasi fitness dan kemudian melakukan reproduksi untuk mendapatkan solusi yang lebih baik sehubungan dengan masalah sasaran. Kromosom, yang merupakan solusi yang lebih baik, diberi lebih banyak kesempatan untuk reproduksi daripada mereka yang mewakili solusi yang lebih miskin. Proses ini berlanjut selama beberapa generasi setelah kita mendapatkan solusi yang optimal.

Operator digunakan untuk percobaan ini adalah persilangan dua induk dan mutasi merayap. Crossover adalah operator genetika digunakan untuk beragam struktur gen kromosom mana informasi gen dipertukarkan antara orang tua yang dipilih dengan memilih dua poin dalam struktur gen dari

setiap orang tua.

Gambar 4. Simulasi persilangan dua induk

IV Pengaturan Eksperimental

4.1 Jaringan Syaraf

Berikut pengaturan konfigurasi untuk jaringan syaraf Backpropagation yang digunakan:

No. Parameter Nilai

1 Jumlah Lapisan Neuron 3 2 Neuron Lapisan 1 20

Fungsi Skala Linear [-1,1] 3 Neuron Lapisan 2 35

Fungsi Aktivasi Logistic 4 Neuron Lapisan 3 3

Fungsi Aktivasi Logistic 5 Laju Pembelajaran 0.1 6 Momentum 0.1 7 Bobot awal 0.3

Tabel 3 Konfigurasi Jaringan Syaraf

4.2 Algoritma Genetika

Dalam optimisasi hasil prediksi jaringan syaraf, algoritma genetika digunakan untuk mencari nilai bobot (weight) dan bias dari jaringan syaraf. Maka kita akan gunakan jenis kromosom tipe berkelanjutan (continuous) dalam bentuk bilangan real (non-integer). Dengan demikian, berikut pengaturan parameter untuk algoritma genetik yang digunakan:

No. Parameter Nilai

1 Ukuran Populasi: 50 2 Panjang Kromosom 32 bit 3 Laju Crossover: 0.9 4 Laju Mutasi: 0.01 5 Gap Generasi: 0.98 6 Jenis Kromosom continuous or integer

Tabel 4: Pengaturan parameter untuk algoritma genetika

Saat melakukan optimisasi, kita akan merubah nilai bobot dan bias sedemikian hingga nilai statistik yang dioptimisasi menjadi lebih besar/kecil. Algoritma genetika melakukan penentuan nilai bobot dan bias secara acak dalam rentang kromosom (constrain) yang sudah ditentukan.

Langkah selanjutnya adalah menerapkan semua perhitungan jaringan syaraf dan algoritma genetika ke dalam sebuah lembar kerja (worksheet) Excel. Dalam lembar kerja terdapat beberapa bagian yang harus dibuat sesuai konfigurasi jaringan syaraf yang dibuat, yaitu bagian-bagian:

- Data asal (input dan output)

- Normalisasi/skala data input menjadi [-1,1] - Neuron Tersembunyi Link1 (weight & bias) - Output fungsi transfer Link1 sebagai implementasi

persamaan matematika (1)

(4)

- Output prediksi sebagai hasil operasi matematika output Link1 dengan neuron tersembunyi Link2 menggunakan persamaan matematika (2)

- Normalisasi/skala balik dari data output prediksi ke nilai skala asal

- Data perhitungan statistik (R2, r, r2, MSE, Min AE, Max AE, range percentage)

Selanjutnya kita menyalin worksheet tersebut sebagai lembar kerja untuk optimisasi algoritma genetika. Adapun yang menjadi target optimisasi adalah salah satu nilai statistik yang dikehendaki, misal memaksimumkan penjumlahan nilai R2 untuk

kedua output dan lain-lain. Kita menjadikan nilai-nilai weight dan bias dari hasil jaringan syaraf menjadi kromosom.

Setelah nilai optimisasi algoritma genetika diperoleh, selanjutnya dibuat aplikasi windows untuk memanggil file definisi dari jaringan syaraf teroptimisasi algoritma genetika. Pengguna aplikasi tinggal memasukkan semua nilai input yang diperlukan dan aplikasi akan memberikan hasil klasifikasi apakah seseorang diperkirakan memiliki resiko kredit yang baik atau buruk. Tentu saja aplikasi ini bisa digunakan oleh manajer bank atau staf personel yang mengevaluasi kelayakan pemohon kredit.

V. Hasil

Tabel 5 menunjukkan hasil pencarian menggunakan jaringan syaraf backpropagation, dengan bantuan Tabel 6 kita bisa mengetahui kualitas hasil klasifikasi jaringan syaraf tersebut.

Tabel 5 Statistik hasil Jaringan Syaraf

Tabel 6 Hasil Klasifikasi Jaringan Syaraf

Setelah kita melakukan optimisasi Tabel 7 menunjukkan nilai-nilai statistik hasil optimisasi menggunakan algoritma genetika terhadap nilai bobot dan bias dari hasil jaringan syaraf.

Tabel 7 Statistik Setelah Optimisasi AG

Sementara Tabel 8 menunjukkan hasil klasifikasi setelah optimisasi algoritma genetika.

Tabel 8 Hasil Klasifikasi Setelah Optimisasi AG

Perhatikan bahwa terjadi perbaikan nilai-nilai statistik setelah nilai weight dan bias dioptimisasi dengan algoritma genetika. Hasil klasifikasi juga semakin baik, salah satunya adalah nilai True Positive Proportion meningkat dibanding sebelumnya.

Proses optimisasi dengan algoritma genetika di atas dihentikan pada evolusi tertentu, sehingga proses peningkatan kualitas prediksi masih memungkinkan jika proses pencarian kromosom dilanjutkan.

Selanjutnya, jaringan syaraf teroptimisasi bisa dipanggil dalam aplikasi, sehingga mudah untuk digunakan. Seperti Gambar 1 di bawah, pengguna tinggal memasukkan data pemohon kredit, lalu dengan menekan tombol Classify, seorang pemohon tergolong kategori pemohon kredit yang baik atau buruk. Aplikasi akan secara otomatis menunjukkan klasifikasi pemohon pinjaman,

jika baik maka check box akan dipilih,

sebaliknya jika buruk maka check box akan

dipilih.

Untuk verifikasi input yang dimasukkan pengguna aplikasi, pesan kesalahan akan muncul jika pengguna memasukkan bilangan di luar rentang yang diberikan atau kosong atau memasukkan teks (bukan angka).

(5)

Gambar 1 Contoh Aplikasi Evaluasi Pemohon Kredit

VI. Kesimpulan dan Penelitian Lanjutan

Metode klasifikasi data kredit dengan menggunakan jaringan syaraf yang ditingkatkan dengan algoritma genetika menunjukkan hasil yang lebih baik, dan diperoleh dalam waktu yang cepat.

Ada banyak aspek yang kita dapat mempertimbangkan di masa depan. Agar data yang sama bisa diterapkan untuk evaluasi pemohon kredit di bank-bank negara lain termasuk Indonesia, maka kita perlu melakukan pengumpulan data. Data tersebut bisa menggunakan kategori sosio-ekonomi yang sama dengan data kredit di Jerman tetapi menggunakan data pemohon kredit terhadap bank-bank di Indonesia.

Analisis yang sama bisa dilakukan terhadap data yang dikumpulkan tersebut di atas sehingga seorang manajer bank atau staf personel pengevaluasi permohonan pinjaman atau kredit bisa memberikan keputusan yang cepat dan akurat.

Adalah perlu untuk melakukan studi yang sama dengan menggunakan konfigurasi jaringan yang lain, misal kohonen, PNN, GRRN dan lain-lain.

REFERENSI:

[1] Holland, J. Natural and Artificial Systems. Ann Arbor, Mich.: University of Michigan Press, 1975.

[2] Doolittle, D.P. Population Genetics: Basic Principles. Berlin: Springer-Verlag, 1986.

[3] Goldberg, D.E. Genetic Algorithms in Search, Optimization, and Machine Learning. Reading, Mass: Addison-Wesley, 1989.

[4] Burrascano, P. Learning Vector Quantization for the Probabilistic Neural Network. IEEE Trans. on Neural Networks, July 1991, 2, 458-461.

[5] Caudill, M. The Kohonen Model. Neural Network Primer. AI Expert, 1990, 25-31.

[6] Hutton, L. Using Statistics to Assess the Performance of Neural Network Classifiers. Johns Hopkins Applied Physics Lab Technical Digest, Vol 13, No. 1, 1992.

[7] Specht, D. Probabilistic Neural Networks. Neural Networks, 1990, 3, 109-118.

[8] Touretzky, D. and Pomerleau, D., What's Hidden in the Hidden Layers? Byte, 14, 1989, 227-233.

[9] Andriana, A. Aplikasi Jaringan Syaraf Neuroshell 2, 2015. [10] Andriana, A. Aplikasi Algoritma Genetika GeneHunter,

Gambar

Table 1 Deskripsi Variabel Input dan Output
Gambar 3 Komponen dasar Jaringan Syaraf
Tabel 3 Konfigurasi Jaringan Syaraf
Tabel 5 Statistik hasil Jaringan Syaraf
+2

Referensi

Dokumen terkait

Hasil penelitian ter sebut menyatakan bahwa Ada pengaruh yang signifikan model pembelajaran cooperative script terhadap hasil belajar matematika siswa kelas VIII di

3. Kompleks Belakang khusus untuk asrama tempat tinggal pasien, terdiri atas 2 asrama yaitu asrama pria dan asrama wanita yang saling terpisah oleh tembok tinggi serta

berhubungan, maka keluhan fisik atau hendaya sosial atau pekerjaan berlebihan dari yang.. diharapkan

Dari hasil penelitian didapatkan hasil nilai p-value 0.018 (p<0.05), sehingga didapati adanya perbedaan pengaruh minuman berenergi dan olahraga terhadap performa kognitif

The method used in this research is the development research methods models by Borg & Gall.The results of a questionnaire distributed to 30 students and 3 teachers

Uji Coba Enkripsi dan Dekripsi dengan Berbagai Macam Data Uji coba skenario pertama ini ditujukan pada proses transaksi pembelian dengan berbagai macam jenis barang yang berbeda

Pengaruh kompetensi profesional guru terhadap hasil belajar siswa kelas X pada mata pelajaran Ekonomi di SMA/MA Negeri Pontianak dapat dilihat dari analisis

Tulisan ini fokus pada pengaruh keteladanan kedua orang tua terhadap anak- anaknya, Sebab jika orang tua tidak memberi contoh yang baik kepada anaknya sebagai bentuk