1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kredit merupakan salah satu bentuk usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumya, proses kredit dapat dilayani melalui lembaga keuangan seperti bank atau lembaga keuangan lainnya. Pemberian kredit bukan tanpa risiko, apabila kredit yang diberikan tergolong dalam jumlah besar dan ternyata debitur (orang yang melakukan kredit) mengalami proses gagal bayar, maka hal ini dapat berakibat fatal pada eksistensi bank tersebut. Oleh karena itu bank yang menyediakan jasa kredit bagi nasabah perlu melakukan sistem manajemen risiko untuk menghindari dampak terburuk dari kejadian gagal bayar yang dilakukan oleh debitur.
Bentuk manajemen risiko suatu perusahaan atau lembaga dapat beragam macamya. Pada kasus kredit, selain dibutuhkan analisis kualikatif, perlu adanya manajemen risiko dengan analisis kuantitatif. Analisis yang tepat akan membantu perusahaan tersebut untuk memilih debitur mana yang layak untuk diberi bantuan dana sekaligus dapat meningkatkan keuntungan perusahaan dan juga dapat menghindari memberikan kredit kepada debitur yang tidak layak diberi bantuan dana. Analisis kuantitatif yang dianggap tepat untuk menangani kasus kredit seperti ini yaitu dengan menggunakan analisis credit scoring.
Akhir-akhir ini, credit scoring dianggap sebagai metode utama dalam mengembangkan alat penduga risiko kredit. Credit scoring merupakan metode untuk mengevaluasi risiko kredit yang mungkin terjadi pada debitur dengan menggunakan credit score yang akan dihasilkan berdasarkan model dari credit
scoring. Credit score adalah suatu angka yang akan merepresentasikan kelayakan
seorang debitur untuk menerima dana bantuan kredit. Penentuan credit score ini didasarkan pada karakteristik debitur yang telah dianalisis dengan menggunakan
credit scoring.
Metode yang kerap digunakan dalam credit scoring adalah metode-metode klasik yang menggunakan prinsip-prinsip statistika. Prinsip pertama mengenai
credit scoring digunakan oleh Fisher pada 1936 yang dikenal sebagai Fisher’s Disrimination. Kemudian pada 1977, Martin memperkenalkan analisis regresi
logistik sebagai alat peringatan dini mengenai kondisi krisis pada bank. Pada tahun 1980, Wiginton memperkenalkan metode analisis regresi logistik sebagai alat untuk melakukan credit scoring.
Analisis credit scoring dengan menggunakan metode dengan prinsip statistika klasik ini pada dasarnya sangat mudah untuk dilakukan. Namun, pada analisis statistika diperlukan adanya uji hipotesis dan adanya asumsi yang harus terpenuhi. Pemodelan yang demikian, akan sulit untuk diterapkan pada kondisi real apabila terjadi perubahan lingkungan atau perubahan populasi, karena model tidak dapat beradaptasi secara langsung sehingga perlu dilakukan pemodelan ulang pada setiap perubahan. Hal ini jelas bukan merupakan proses yang efisien.
Pada tahun 1995, teknik Support Vector Machine (SVM) mulai diperkenalkan oleh Cortes dan Vapnik. Ide utama dari SVM adalah membagi data menjadi dua kelompok melalui hyperplane yang optimal dengan cara memaksimalkan margin untuk meminimalkan error. Berdasarkan penelitian yang dilakukan Gestel pada tahun 2003 menunjukkan bahwa SVM adalah metode credit
scoring yang memiliki performa paling baik jika dibandingkan dengan
metode-metode lainnya.
Berdasarkan banyak penelitian yang telah dilakukan, SVM merupakan metode analisis yang memiliki performa paling baik jika dibandingkan dengan metode credit scoring lainnya. Namun di sisi lain SVM juga memiliki kekurangan dalam analisis. Apabila dalam data dengan dimensi tinggi terdapat variabel yang tidak begitu penting dan jumlah data yang digunakan tidak mengikuti jumlah variabel yang digunakan, maka titik sampel pada analisis menjadi jarang dan SVM memerlukan waktu yang cukup lama dalam proses training sehingga menyebabkan tidak akuratnya hyperplane (fungsi pemisah) yang terbentuk. Kekurangan ini dapat berakibat cukup fatal terhadap hasil analisis, walaupun pada dasarnya SVM memiliki tingkat robustness yang baik dan memiliki tingkat akurasi yang tinggi.
Masalah utama yang dihadapi oleh metode-metode analisis baik statistika maupun artifisial buatan dalam proses credit scoring adalah besarnya variabel yang
digunakan dalam input data, namun tak jarang data yang tersedia tidak mengikuti kenaikan dimensi. Banyakya variabel dalam input data yang tidak diikuti dengan kenaikan jumlah data, maka dapat menyebabkan munculnya kutukan dimensi (curse of dimensionality). Kutukan dimensi dapat didefiniskan sebagai suatu akibat dari banyaknya variabel yang digunakan dan di antaranya terdapat beberapa variabel yang tidak terlalu berperan dalam analisis, sehingga mengakibatkan adanya multikolinearitas antarvariabel. Kutukan dimensi juga membuat keberadaan titik sampel menjadi semakin jarang pada ruang dimensi tinggi sehingga pengklasifikasian akan sulit dilakukan.
Untuk menghindari akibat dari kutukan dimensi, maka perlu dilakukan proses reduksi dimensi pada pre-processing data. Reduksi dimensi pada kasus ini dibagi menjadi dua yaitu teknik feature selection dan teknik feature extraction.
Feature selection adalah metode untuk memilih variabel yang dianggap penting
yang akan mempengaruhi variabel dependen sehingga diharapkan dapat mengurangi dimensi dalam model. Sementara itu feature extraction adalah suatu metode untuk membentuk suatu variabel baru yang independen secara linear melalui suatu transformasi. Proses reduksi dimensi ini diharapkan dapat meningkatkan tingkat akurasi yang dimiliki oleh hasil dari credit scoring dengan menggunakan SVM.
1.2 Batasan Masalah
Pada tugas akhir ini akan dibahas mengenai credit scoring menggunakan
Support Vector Machine (SVM) dengan reduksi dimensi menggunakan feature selection dan feature extraction pada pre-processing data. Proses feature selection
akan dilakukan pada variabel kategorik dengan menggunakan analisis regresi logistik, sedangkan proses feature extraction akan dilakukan pada variabel numerik dengan menggunakan metode Orthogonal Dimension Reduction (ODR).
Pada akhir analisis akan dilakukan perbandingan hasil tingkat akurasi antara SVM menggunakan reduksi dimensi dengan analisis regresi logistik dan
Orthogonal Dimension Reduction (ODR) dibandingkan dengan SVM tanpa
penulis untuk melakukan penerapan metode ini yaitu data kredit nasabah Bank Perkreditan Rakyat (BPR) Bhumipala Yogyakarta.
1.3 Tujuan Penulisan
Penyusunan tugas akhir ini dimaksudkan sebagai salah satu syarat untuk mencapai derajat S1 pada Program Studi Statistika FMIPA UGM. Berikut adalah tujuan penulisan dari tugas akhir ini:
1. Untuk menerapkan penggunaan metode analisis regresi logistik dan
Orthogonal Dimension Reduction (ODR) sebagai metode reduksi
dimensi pada proses credit scoring dengan menggunakan Support
Vector Machine (SVM)
2. Untuk mempelajari dan memahami esensi dari penggunaan metode reduksi dimensi pada proses credit scoring dengan menggunakan
Support Vector Machine (SVM).
3. Untuk mengaplikasikan proses reduksi dimensi pada Support Vector
Machine (SVM) dengan menggunakan data kredit nasabah Bank
Perkreditan Rakyat (BPR) Bhumipala Yogyakarta
4. Untuk membandingkan tingkat akurasi proses credit scoring dengan menggunakan teknik reduksi dimensi dan tanpa menggunakan reduksi dimensi pada Support Vector Machine (SVM).
1.4 Metode Penulisan
Metode penulisan yang dilakukan oleh penulis dalam penyusunan tugas akhir ini berupa studi literatur dengan sumber yang diperoleh dari perpustakaan, jurnal-jurnal ilmiah, dan sumber-sumber lain yang diperoleh dari internet. Penulis menyelesaikan studi kasus pada tugas akhir ini dengan menggunakan bantuan
software SPSS 22.0, Minitab 14.0, dan R 3.2.2. Data yang diperoleh penulis adalah
data sekunder dari Bank Perkreditan Rakyat (BPR) Bhumipala Yogyakarta yang berupa data kredit nasabah.
1.5 Tinjauan Pustaka
Dalam tugas akhir ini, penulis menggunakan berbagai sumber pustaka sebagai bahan utama penulisan tugas akhir ini. Pustaka utama yang digunakan sebagai acuan adalah jurnal ilmiah dengan judul “Orthogonal Support Vector
Machine for Credit Scoring” yang ditulis oleh Lu Han, Liyan Han, Hongwei Zhao
(2013). Jurnal ini memperkenalkan teknik Orthogonal Dimension Reduction (ODR) sebagai teknik reduksi dimensi untuk analisis credit scoring menggunakan
Support Vector Machine (SVM). Dalam jurnal ini dilakukan beberapa
perbandingan teknik dimensi reduksi pada SVM dan teknik yang menghasilkan tingkat akurasi paling tinggi adalah teknik SVM dengan reduksi dimensi menggunakan analisis regresi logistik untuk variabel kategorik dan teknik
Orthogonal Dimension Reduction (ODR) untuk variabel numerik.
Penulis juga menggunakan skripsi terdahulu yang ditulis oleh Nurseha (2014) dengan judul “Segmentasi Karakteristik Debitur Menggunakan Metode
K-Means Cluster dan Multi-Class Support Vector Machine”. Kemudian
menggunakan acuan skripsi yang ditulis oleh Ayuningtyas (2009) yang berjudul “Credit Scoring untuk Kredit Konsumtif Bank Menggunakan Regresi Logistik Ganda dan Analisis Diskriminan”. Selain itu penulis juga menggunakan jurnal-jurnal ilmiah lain yang mendukung, buku-buku teori yang mendukung, dan beberapa artikel dari website resmi melalui internet.
1.6 Sistematika Penulisan
Penulisan skripsi ini digunakan dengan menggunakan sistematika sebagai berikut:
BAB I PENDAHULUAN
Bab ini berisi latar belakang dari permasalahan yang diangkat, batasan permasalahan, tujuan penulisan, metode penulisan, tinjauan pustaka, serta sistematika penulisan pada skripsi ini.
BAB II DASAR TEORI
Pada bab ini dibahas mengenai beberapa teori yang mendasari
menggunakan analisis regresi logistik dan Orthogonal Dimension
Reduction (ODR) untuk credit scoring seperti kredit, manajemen
risiko, credit scoring, curse of dimensionality, dimensi reduksi, matriks, variabel random, ekspektasi, variansi, kovariansi, korelasi, distribusi bernoulli, distribusi binomial, distribusi normal, distribusi
chi square, newton raphson, ortogonalitas, machine learning,
metode lagrange, metode kernel, dan lain sebagainya.
BAB III SUPPORT VECTOR MACHINE DENGAN REDUKSI DIMENSI
MENGGUNAKAN ANALISIS REGRESI LOGISTIK DAN
ORTHOGONAL DIMENSION REDUCTION UNTUK CREDIT SCORING
Pada bab ini dibahas mengenai pembatasan masalah utama yaitu penjelasan mengenai metode dan proses Support Vector Machine (SVM) untuk credit scoring dengan reduksi dimensi pada
pre-processing data menggunakan analisis regresi logistik untuk variabel
kategorik dan Orthogonal Dimension Reduction (ODR) untuk variabel numerik.
BAB IV STUDI KASUS
Bab ini akan membahas mengenai contoh penerapan Support Vector
Machine (SVM) dengan reduksi dimensi menggunakan analisis
regresi logistik dan Orthogonal Dimension Reduction (ODR) untuk
credit scoring menggunakan data kredit yang kemudian akan
dibandingkan tingkat akurasinya dengan data kredit yang dianalisis dengan menggunakan Support Vector Machine (SVM) tanpa reduksi dimensi.
BAB V PENUTUP
Pada bab ini dibahas mengenai kesimpulan yang diperoleh dari hasil pembahasan dan saran sebagai akibat dari kelebihan maupun kekurangan dari hasil penelitian yang dilakukan.