• Tidak ada hasil yang ditemukan

PROPOSAL PENELITIAN HIBAH INTERNAL TAHUN ID Proposal: 1733 Rencana Pelaksanaan Penelitian bulan September tahun 2020

N/A
N/A
Protected

Academic year: 2022

Membagikan "PROPOSAL PENELITIAN HIBAH INTERNAL TAHUN ID Proposal: 1733 Rencana Pelaksanaan Penelitian bulan September tahun 2020"

Copied!
72
0
0

Teks penuh

(1)

UNIVERSITAS PAMULANG

LEMBAGA PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT Alamat : Jl. Witana Harja No.18B, Pamulang Barat, Kec. Pamulang, Kota Tangerang Selatan,

Banten 15417 Email : lppm@unpam.ac.id http://localhost Telp/Fax (021)7412566/74709855

PROPOSAL PENELITIAN HIBAH INTERNAL TAHUN 2022

ID Proposal: 1733

Rencana Pelaksanaan Penelitian bulan September tahun 2020 1. JUDUL PENELITIAN

KOMPARASI ALGORITMA SUPPORT VECTOR MACHINE BERBASISPARTICLE SWARM OPTIMIZATION DENGAN NAVE BAYES UNTUKANALISIS KELAYAKAN PEMBERIAN KREDIT USAHA MIKRO STUDI KASUS MULTIFINANCE XYZ

Skema Rumpun Ilmu Tahun Pelaksanaan Lama Kegiatan (bulan)

Penelitian Dosen Pemula

(PDP) Sains dan Teknologi 2021 12

Bidang Fokus penelitian Tema Topik

Teknologi Informasi dan Komunikasi

(TIK) Engineering and Technology Other Engineering and Technology

2. IDENTITAS PENGUSUL

Nama Pengusul NIDN Program Studi Jabatan Fungsional

ANIQ ASTOFA 0403038901 TEKNIK INFORMATIKA TENAGA PENGAJAR

DEDE SUNANDAR 0418028604 TEKNIK INFORMATIKA TENAGA PENGAJAR

3. LUARAN DAN TARGET CAPAIAN

Luaran Wajib Luaran Tambahan

Jurnal Nasional Sinta 1 - 4 Prosiding Nasional

4. ANGGARAN

Total RAB : Rp 8.400.000

Jenis Pembelanjaan Item Volume Satuan Biaya (Rp) Total (Rp)

Honor Honor Dosen 1 BULANAN 200.000 2.400.000

Honor Honor Dosen 2 BULANAN 200.000 2.400.000

(2)

Honor print + fotocopy 600.000 600.000

Honor transport 2 DOSEN 1.000.000 1.000.000

Honor PEMBUATAN

APLIKASI 1.000.000 1.000.000

Honor PUBLIKASI DAN

LAIN-LAIN 1.000.000 1.000.000

Belanja Perjalanan 0 0

Total Pembiayaan Rp 8.400.000

(3)

LAPORAN KEMAJUAN PENELITIAN TAHUN AKADEMIK 2020/2021

KOMPARASI ALGORITMA SUPPORT VECTOR MACHINE BERBASIS BERBASIS

PARTICLE SWARM OPTIMIZATION DENGAN NAÏVE BAYES UNTUK ANALISIS KELAYAKAN PEMBERIAN KREDIT USAHA MIKRO

(STUDI KASUS MULTIFINANCE XYZ)

Ketua ANIQ ASTOFA NIDN. 0403038901

Dibiayai dengan Dana Kegiatan Penelitian dan Pengabdian kepada Masyarakat Tahun Akademik 2020/2021 oleh Universitas Pamulang

No Kontrak : 0395/D5/SPKP/LPPM/UNPAM/XI/2020 FAKULTAS TEKNIK INFORMATIKA

LEMBAGA PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT UNIVERSITAS PAMULANG

TAHUN 2021

(4)

LEMBAR IDENTITAS DAN PENGESAHAN LAPORAN KEMAJUAN PENELITIAN

TAHUN AKADEMIK 2020/2021

Judul : Komparasi Algoritma Support Vector Machine Berbasis Particle Swarm Optimization dengan Naïve Bayes untuk Menentukan Kelayakan Pemberian Kredit Usaha Mikro(Studi Kasus Multifinace XYZ)

Ketua Peneliti

Nama Lengkap : Aniq Astofa, S.Kom., M.Kom.

NIDN : 0403038901

Jabatan Fungsional : -

Program Studi : Teknik Informatika

Nomor HP 081391964090

Alamat surel (e-mail) : dosen02360@unpam.ac.id

Anggota (1)

Nama Lengkap : Dede Sunandar S.Kom., M.Kom.

NIDN : 0418028604

Anggota (2)

Nama Lengkap : ………

NIDN : ………

Institusi Mitra (jika ada)

Nama Institusi Mitra : ………

Alamat : ………

Tahun Pelaksanaan : ………

Biaya Internal Universitas Pamulang : Rp 8.400.000

Biaya Mitra : Rp ……….

Biaya Keseluruhan : Rp ……….

Mengetahui, Pamulang, 01 Agustus 2021

Dekan Fakultas & MIPA Ketua Peneliti,

Syaiful Bakhri.S.T., M.Eng.Sc., Ph. D. Aniq Astofa, S.Kom., M.Kom.

NIDN: 0421127402 NIDN: 0403038901

Menyetujui, Ketua LPPM UNPAM,

Dr. Ali Maddinsyah, S.E., M.M NIDN: 0417067101

(5)

KATA PENGANTAR

Alhamdulillah, Puja dan puji syukur saya haturkan kepada Allah Subhanahu Wata’ala yang telah memberikan banyak nikmat, taufik dan hidayah. Sehingga penulis dapat menyelesaikan laporan akhir kegiatan Penelitian dengan judul “Komparasi Algoritma Support Vector Machine Berbasis Particle Swarm Optimization dengan Naïve Bayes untuk Menentukan Kelayakan Pemberian Kredit Usaha Mikro(Studi Kasus Multifinace XYZ)”

yang merupakan salah satu bentuk Implementasi Tri Dharma Perguruan tinggi.

Kami menghaturkan banyak terima kasih kepada berbagai pihak yang terlibat baik secara langsung atau tidak langsung, oleh karena itu dengan segala hormat dan kerendahan hati, penulis menyampaikan ucapan terima kasih kepada:

1. Bapak Dr.Ali Maddinsyah, SE, MM., selaku Ketua LPPM Universitas Pamulang.

2. Bapak Syaiful Bakhri, S. T.,M. Eng. Sc., Ph. D., selaku Dekan Fakultas & MIPA.

3. Bapak Dede Sunandar, S.Kom., M.Kom. Selaku Anggota Penelitian.

Semoga bermanfaat untuk kemajuan ilmu pengetahuan Aamiin. Semoga Allah Subhanahu Wata’ala membalas kebaikan dan selalu mencurahkan hidayah serta taufik- Nya, kepada kita semua. Aamiin yaa robbal aa‟lamiin.

Pamulang, 01 Agustus 2021 Ketua Penelitian

Aniq Astofa,S.Kom., M.Kom.

(6)

Daftar Isi Hal

HALAMAN JUDUL

HALAMAN PENGESAHAN KATA PENGANTAR DAFTAR ISI

DAFTAR TABEL DAFTAR GAMBAR ABSTRAK

BAB 1 PENDAHULUAN

1.1 Latar Belakang ... 1

1.2 Permasalahan Penelitian ... 7

1.2.1 Identifikasi Masalah ... 7

1.2.2 Ruang Lingkup Masalah ... 7

1.2.3 Rumusan Masalah ... 7

1.3 Tujuan dan Manfaat ... 8

1.3.1 Tujuan ... 8

1.3.2 Manfaat ... 8

BAB II LANDASAN TEORI DAN KERANGKA PEMIKIRAN 2.1 Tinjauan Pustaka ... 10

2.2 Landasan Teori ... 13

2.3 Kerangka Pemikiran... 34

BAB III METODE PENELITIAN 3.1 Analisa Kebutuhan ... 35

3.2 Perancangan Penelitian ... 35

3.3 Teknik Analisis ... 44

3.4 Jadwal Penelitian ... 45

BAB IV HASIL DAN PEMBAHSAN 4.1 Hasil ... 46

4.2 Pembahasan... 51

BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ... 55

(7)

5.2 Saran ... 55 DAFTAR PUSTAKA

LAMPIRAN-LAMPIRAN

Lampiran 1. Identitas Tim Pengusul Lampiran 2. Surat Kontrak Penelitian

Lampiran 3. Surat Keterangan Telah Melaksanakan Penelitian dari Instansi lain (jika ada) Lampiran 4. Laporan Penggunaan Dana

Lampiran 5 dst. Lain laian

(8)

Daftar Tabel

Tabel 2.1 tabel literatur penelitian ... 10

Tabel 2.2 Tabel Confusion matrix ... 29

Tabel 3.1 atribut kelayakan kredit... 46

Tabel 4.1 perbandingan akurasi SVM dengan SVM – PSO ... 47

(9)

Daftar Gambar

Gambar 2.1 hyperlane ... 18

Gambar 2.2 hyperlane yang dipisahkan ... 19

Gambar 2.3 Crisp DM ... 26

Gambar 2.4 k-ford cross validation... 27

Gambar 2.5 kerangka pemikiran ... 35

Gambar 2.6 kerangka pemikiran alternatif ... 35

Gambar 3.1 desaian penelitian ... 37

Gambar 3.2 tampilan perspektif rapiminer ... 38

Gambar 3.3 tampilan desaian rapidminer ... 39

Gambar 3.4 tampilan kumpulan kelompok hierarki ... 39

Gambar 3.5 tampilan algoritma SVM PSO ... 40

Gambar 3.6 tampilan algoritma SVM adaboost ... 41

Gambar 3.7 tampilan algoritma naive bayes ... 42

Gambar 4.1 model validasi ... 46

Gambar 4.2 Model pengujian validasi Support Vector Machine ... 46

Gambar 4.3 Model pengujian validasi Support Vector Machine Pso ... 47

Gambar 4.4 grafik perbandingan akurasi SVM dan SVM PSO ... 47

Gambar 4.5 sebelum pengolahan data awal Retrieve Data, Validation ... 49

Gambar 4.6 Naïve Bayes Clasiffier, apply Model dan Performance ... 49

Gambar 4.7 hasil akurasi sebelum pengolahan data awal ... 49

Gambar 4.8 setelah pengolahan data awal menggunakan Optimize weight ... 49

Gambar 4.9 setelah pengolahan data awal dengan validation ... 50

Gambar 4.10 setelah pengolahan data awal dengan model atau metode Naive Bayes... 50

Gambar 4.11 setelah pengolahan data awal hasil akurasi ... 50

Gambar 4.12 grafik perbandingan akurasi svm dengan svm pso dan naive bayes ... 51

(10)

ABSTRAK

Kredit adalah penyediaan dana untuk transaksi pinjam meminjam atas persetujuan dan kesepakatan antara pihak bank atau instansi keuangan dengan nasabahnya, serta mewajibkan peminjam untuk membayar utang dalam jangka waktu tertentu dan pemberian jasa.

Pemberian kredit dilakukan dengan mengidentifikasi dan menilai faktor yang mempengaruhi resiko kredit. Hilangnya pendapatan dan ancaman profitabilitas merupakan hal yang perlu diwaspadai dalam pemberian kredit. Klasifikasi data mining dapat digunakan untuk membantu para analis kredit dalam menentukan pemberian kredit pada nasabah. Proses klasifikasi dilakukan untuk mendapatkan atribut penentu. proses klasifikasi menggunakan metode algoritma support vector machine , particle swarm optimization dan naive bayes.

dievaluasi cross validation, confusion matrix, ROC Curve. untuk mengetahui klasifikasi yang paling akurat dalam menentukan pemberian kredit bagi nasabah. Hasil yang didapatkan dari perbandingan kedua algoritma tersebut, bahwa tingkat akurasi yang lebih baik adalah menganalisa menggunaka algoritma klasifikasi yaitu naive bayes sebesar 86,44% sedangkan tingkat akurasi menggunakan algortima klasifikasi support vector machine , particle swarm optimization sebesar 85,92% dengan menggunakan software Rapidminer

Kanta kunci : kelayakan kredit, data mining, support vector machine, particle swarm optimization, naive bayes, rapidminer

(11)

BAB I PENDAHULUAN

1.1 Latar Belakang

Perbankan di Indonesia memiliki peran yang penting dalam menunjang berjalannya roda perekonomian dan pembangunan nasional, mengingat salah satu fungsinya adalah sebagai alat transmisi kebijakan moneter. Bank sebagai lembaga keuangan memiliki kegiatan utama yaitu menghimpun dana masyarakat dalam bentuk tabungan dan lain-lain serta kemudian menyalurkannya kembali kepada masyarakat dalam bentuk kredit (Kasmir, 2012) Dunia perbankan di Indonesia memasuki masa persaingan yang sangat kompetitif dan dinamis, hal ini disebabkan banyaknya bank yang beroperasi di Indonesia. Bank-bank yang mampu bertahan melewati masa krisis moneter maupun bank-bank yang baru beroperasi mulai berlomba lomba untuk memberikan layanan yang terbaik kepada nasabahnya melalui berbagai macam produk perbankan seperti produk dana, produk pinjaman atau produk jasa lainnya. Pada pasar kredit perbankan, bank memiliki beberapa jenis kredit yang umum ditawarkan kepada nasabah.

Bentuk persaingan bisnis di bidang perbankan yang mulai berkembang akhir-akhir ini adalah persaingan dalam penyaluran, khususnya dalam pembiayaan kredit usaha mikro.

Kredit kepada Usaha Mikro adalah pemberian kredit kepada debitur usaha mikro yang memenuhi kriteria usaha mikro sebagaimana diatur dalam UU No. 20 Tahun 2008 Tentang UMKM. Kredit bagi para pengusaha dirasa cukup penting mengingat kebutuhan untuk pembiayaan modal kerja dan investasi maka diperlukan Kredit Usaha mikro guna menjalankan usaha dan meningkatkan akumulasi pemupukan modal kerja mereka. Semakin meningkatnya penyaluran kredit, biasanya disertai pula dengan meningkatnya kredit yang bermasalah atau kredit macet atas kredit yang diberikan. Bahaya yang timbul dari kredit macet adalah tidak terbayarnya kembali kredit tersebut, baik sebagian maupun seluruhnya.

Pemberian kredit kepada konsumen atau calon nasabah atau debitur adalah dengan melewati proses pengajuan kredit dan proses analisis pemberian kredit terhadap kredit yang diajukan, setelah menyelesaikan prosedur administrasi barulah pihak bank melakukan analisis kredit. Analisis yang digunakan dalam perbankan adalah Analisis 5 C yaitu Character,

(12)

Capacity, Capital, Condition, dan Collateral, serta analisis 7 P yaitu Personality, Party, Purpose, Prospect, Payment, Profitability, dan Protection, dalam praktiknya di samping menggunakan 5C dan 7P, maka penilaian suatu kredit layak atau tidak untuk diberikan dapat dilakukan dengan menilai seluruh aspek yang ada, yaitu Aspek hukum, aspek pemasaran, aspek teknis, aspek manajemen, aspek sosial ekonomi dan aspek amdal (Kasmir, 2012).

Aspek hukum adalah untuk menilai keaslian dan keabsahan dokumendokumen yang diajukan oleh pemohon kredit. Aspek pemasaran adalah untuk menilai apakah kredit yang dibiayai akan laku di pasar dan bagaimana strategi pemasaran yang dilakukan. Aspek keuangan adalah untuk menilai keuangan perusahaan yang dilihat dari laporan keuangan. Aspek Teknis adalah untuk menilai kelengkapan sarana dan prasarana yang dimiliki.

Menurut Suhardjono (2003) “kredit bermasalah adalah suatu keadaaan dimana nasabah sudah tidak sanggup membayar sebagian atau seluruh kewajibannya kepada bank seperti yang telah diperjanjikan dalam perjanjian kredit”.

Pemberian kredit dimaksud pada hakikatnya menyukseskan program-program pemerintah berkaitan dengan sektor ekonomi untuk meningkatkan kesejahteraan rakyat menurut pola yang diterapkan dalam Undang-Undang Dasar Negara Republik Indonesia Tahun 1945 (selanjutnya disebut UUD 1945), karena di dalam UUD 1945 tersebut inyatakan bahwa Negara menjamin kesejahteraan rakyatnya. Pemberian kredit dituangkan dalam suatu perjanjian kredit dimana setiap pihak mempunyai hak dan kewajiban secara timbal balik.

Pihak yang satu mempunyai hak untuk menuntut sesuatu dari pihak lain, dan pihak lain itu wajib memenuhi tuntutan itu, dan sebaliknya. Pihak yang berhak menuntut sesuatu disebut kreditur, sedangkan pihak yang wajib memenuhi tuntutan disebut debitur. Sesuatu yang dituntut disebut prestasi. Prestasi adalah sesuatu yang dituntut oleh kreditur terhadap debitur, atau sesuatu yang wajib dipenuhi oleh debitur terhadap kreditur (Abdulkadir Muhammad, 2000).

Menurut ketentuan Pasal 1234 Kitab Undang-Undang Hukum Perdata (selanjutnya disebut KUH Perdata) ada tiga kemungkinan wujud prestasi, yaitu memberikan sesuatu, berbuat sesuatu, dan tidak berbuat sesuatu. Jika dikemudian hari debitur tidak memenuhi sesuatu yang diwajibkan seperti telah ditetapkan dalam perikatan maka debitur dapat dikatakan wanprestasi. Tidak dipenuhinya kewajiban oleh debitur disebabkan oleh dua alasan, yaitu (Abdulkadir Muhammad, 2000) :

1. Kesalahan debitur, baik dengan sengaja tidak dipenuhi kewajiban maupun karena kelalaian.

2. Keadaan memaksa (overmacht), force majeure, jadi di luar kemampuan debitur.

(13)

Ada tiga keadaan di mana debitur dikatakan sengaja atau lalai tidak memenuhi prestasi, yaitu 1. Debitur tidak memenuhi prestasi sama sekali;

2. Debitur memenuhi prestasi, tetapi tidak baik atau keliru; dan

3. Debitur memenuhi prestasi, tetapi tidak tepat waktunya atau terlambat.

Debitur dikatakan dalam keadaan wanprestasi atau tidak, dapat ditentukan melalui tenggang waktu, apakah dalam perjanjian itu ditentukan tenggang waktu pelaksanaan pemenuhan prestasi atau tidak. Dalam hal tenggang waktu pelaksanaan pemenuhan prestasi tidak ditentukan, perlu memperingatkan debitur supaya ia memenuhi prestasi sedangkan dalam Hal telah ditentukan tenggang waktunya, menurut ketentuan Pasal 1238 KUH Perdata debitur dianggap lalai dengan lewatnya tenggang waktu yang telah ditetapkan dalam perjanjian.

Debitur perlu diberi peringatan tertulis isinya menyatakan bahwa debitur wajib memenuhi prestasi dalam waktu yang ditentukan, jika dalam waktu itu debitur tidak memenuhinya maka debitur dinyatakan telah lalai atau wanprestasi. Peringatan tertulis dapat dilakukan secara resmi dan dapat juga secara tidak resmi. Peringatan tertukis secara resmi dilakukan melalui Pengadilan Negeri yang berwenang, yang disebut sommatie. Peringatan tertulis tidak resmi misalnya melalui surat tercatat, telegram, atau disampaikan sendiri oleh kreditur kepada debitur dengan tanda terima. Surat peringatan ini disebut ingebreke stelling (Abdulkadir Muhammad, 2000: 204).

Multifinance XYZ adalah salah satu perusahaan yang memberi jasa kegiatan kredit, khususnya untuk pengembangan usaha produktif maupun konsumtif skala mikro. Bagi perusahaan kredit, ada risiko yang harus dihadapi yaitu tidak tepat waktunya pembayaran atau bahkan kegagalan pembayaran dari kredit yang disalurkannya. Masalah kredit macet ini disebabkan oleh nasabah yang berisiko. Risiko kredit adalah kemungkinan penurunan hasil kredit dari tindakan peminjam yang mempunyai reputasi yang buruk.

Maka dengan adanya masalah diatas, jelas dibutuhkan sebuah metode atau sarana yang membantu untuk menganalis pemberian kredit dalam upaya mengantisipasi kredit bermasalah.

Komparasi Penerapan Algoritma C45, KNN Dan Neural Network Dalam Proses Kelayakan Penerimaan Kredit Kendaraan Bermotor dilakukan pengujian menggunakan algoritma C4.5, K-NN dan neural network menggunakan data konsumen yang mendapat penerimaan kredit motor. Kemudian hasil, dikomparasi untuk mengetahui algoritma yang paling baik dalam penentuan resiko kredit kendaraan bermotor. Untuk mengukur kinerja ketiga algoritma tersebut digunakan metode pengujian Cross Validation,Confusion Matrix dan Kurva ROC, diketahui bahwa algoritma C4.5 memiliki nilai accuracy dan AUC paling

(14)

tinggi, diikuti oleh metode neural network, dan yang paling rendah metode K-NN. Dengan demikian, metode decision tree merupakan metode yang cukup baik dalam pengklasifikasian data, dengan demikian algoritma C4.5 dapat memberikan pemecahan untuk permasalahan penentuan kelayakan konsumen yang mendapatkan kredit kendaraan bermotor pada leasing (Puji Astuti, 2016)

Algoritma Klasifikasi Naive Bayes Untuk Menilai Kelayakan Kredit. sistem klasifikasi dengan Metode Naïve Bayes yang dibangun dapat digunakan untuk menyeleksi calon nasabah dengan baik, sehingga dapat membantu dalam memberikan kredit yang sesuai dengan kriteria yang ada (Fachry Husaini).

Algoritma klasifikasi Naive Bayes Untuk Menilai Kelayakan Kredit untuk menilai kelayakan kredit pada BCA Finance Jakarta. Penilaian kelayakan kredit pada BCA Finance Jakarta pada data awal dengan preprocessing menghasilkan akurasi sebesar 85,57%

sedangkan setelah dilakukan pengolahan data awal dan dengan pre-processing menghasilkan akurasi sebesar 92,53%. Jadi penilaian kelayakan kredit menggunakan Algoritma Naïve Bayes pada BCA Finance Jakarta lebih unggul jika dilakukan pengolahan data awal sekalipun Naïve Bayes merupakan algoritma yang mampu menangani data yang hilang (Claudia Clarentia Ciptohartono).

Sistem Pendukung Pengambilan Keputusan Menggunakan Metode Naive bayes (Studi Kasus Kredit Sepeda Motor). algoritma Naïve Bayes memiliki peluang untuk dipergunakan sebagai sistem pendukung pengambilan keputusan. Namun algoritma Naïve Bayes akan lebih baik nilai ke akuratannya jika data pelatihan dan data uji tidak terdapat data yang bernilai abnormal. Sehingga untuk memaksimalkan fungsi dari sistem tersebut yang menggunakan algoritma naïve bayes data yang dipakai untuk data pelatihan harus memenuhi standar.

Dalam hal ini nilai standar data adalah sesuai dengan persyratan kredit sepeda motor (Jatmika 2014).

Optimasi Algoritma Support Vector Machine (SVM) Menggunakan AdaBoost Untuk Penilaian Risiko Kredit. penggunaan Boosting dalam hal ini AdaBoost-SVM memiliki akurasi yang lebih baik dari model Bagging-SVM. Penggunaan Boosting dapat dikatakan lebih baik dari Bagging. dan Bagging-SVM mempunyai nilai akurasi dibawah SVM dengan pemilihan parameter C yang tepat, Sedangkan pengaturan nilai parameter C terbukti dapat meningkatkan akurasi SVM dasar (Defri Kurniawan 2013).

Berdasarkan beberapa uraian di atas, penulis mengambil metode Naïve Bayes dan metode Support Vector Machine untuk dibandingkan dan digunakan untuk menentukan pemberian kredit pada nasabah. Selanjutya penulis mengambil metode Naïve Bayes dan metode Support

(15)

Vector Machine karena berdasarkan beberapa jurnal diatas seperti Claudia Clarentia Ciptohartono menerbitkan jurnal yang berjudul “ Algoritma Naive Bayes Untuk Menilai Kelayakan Kredit” membuktikan bahwa algoritma Naïve Bayes dapat diterapkan untuk menilai kelayakan kredit pada BCA Finance Jakarta. Dan pengolahan data awal merupakan tahapan yang sangat mempengaruhi hasil akurasi yang baik sehingga akurasi akhir yang dihasilkan termasuk kategori Excellent. Penilaian kelayakan kredit pada BCA Finance Jakarta pada data awal dengan preprocessing menghasilkan akurasi sebesar 85,57% sedangkan setelah dilakukan pengolahan data awal dan dengan pre-processing menghasilkan akurasi sebesar 92,53%. Jadi penilaian kelayakan kredit menggunakan Algoritma Naïve Bayes pada BCA Finance Jakarta lebih unggul jika dilakukan pengolahan data awal sekalipun Naïve Bayes merupakan algoritma yang mampu menangani data yang hilang.

Penilaian Agunan Property Pengajuan Kredit Menggunakan Optimasi Algoritma Support Vector Machine Berbasis Particle Swarm Optimization .metode Support Vector Machine mempunyai tingkat akurasi sebesar 84,17 % dan mempunyai nilai AUC sebesar 0,891. Setelah dilakukan penyesuaian pada parameter kernel tipe dan nilai validasi didapat nilai akurasi terbaik untuk algoritma Support Vector Machine yaitu mempunyai akurasi sebesar 84,17 % dan nilai AUCnya sebesar 0,891. Sedangkan eksperiment kedua yang dilakukan dengan menggunakan metode Support Vector Machine berbasis Particle Swarm Optimization mempunyai nilai akurasi sebesar 87,57 % dan nilai AUC sebesar 0,951 (Ibrahim, 2016).

Multifinance XYZ sebagai pemberi kredit memiliki resiko kemacetan kredit yang tinggi, hal ini dikarenakan adanya faktor ketidak sengajaan akibat musibah yang dialami oleh debitur sehingga kredit yang diberikan tidak meningkatkan pendapatan debitur, selain itu adanya itikad yang kurang baik dari debitur dengan tidak memenuhi kewajiban sebagaimana mestinya.Terhambatnya usaha pengembalian kredit akan mengakibatkan pada kelangsungan hidup perbankan yang bersangkutan dan adanya kemacetan kredit mengakibatkan aktifitas bank menjadi terganggu.

Maka penulis membuat karya ilmiah ini dengan judul “ Komparasi Algoritma Klasifikasi Support Vector Machine (SVM) yang Menggunakan Particle Swarm Optimization dengan Naive Bayes Untuk Analis Kelayakan Pemberian Kredit Usaha Mikro “(Studi kasus Multifinance XYZ)

(16)

1.2 Permasalahan Penelitian 1.2.1 Identifikasi Masalah

a. Resiko kredit disebut sebagai resiko kerugian ketika seorang peminjam tidak melunasi kontrak hutangnya.dilain pihak pengendalian resiko tidak mudah untuk dilakukan.

b. Belum adanya penerapan algoritma menentukan pemberian kredit tersebut.

1.2.2 Ruang Lingkup Masalah

Untuk menghindari penyimpangan dan perluasan yang tidak di perlukan, maka ruang lingkup masalah penelitian hanya membahas:

a. Evaluasi penerimaan kredit dalam upaya mengantisipasi kredit bermasalah.

b. teknik data mining menggunakan metode Naive bayes yang di bandingkan support vector machine berbasis Particle Swarm Optimization.

c. Software yang di gunakan adalah RapidMiner.

d. Range pinjaman mikro hanya 25 juta sampe 200 juta dan data yang diambil adalah tahun 2012-2015).

1.2.3 Rumusan Masalah

a. Bagaimana penerapan algoritma Support vector machine berbasis Particle Swarm Optimization maupun Naive bayes dalam mengklasifikasi kelayakan nasabah untuk melakukan kredit pada Multifinance XYZ ?

b. Bagaimana perbandingan tingkat keakuratan pada Support vector machine berbasis Particle Swarm Optimization dengan menggunakan algoritma Naive bayes?

1.3 Tujuan Dan Manfaat 1.3.1 Tujuan

Mengukur kinerja klasifikasi algoritma Support vector machine berbasis Particle Swarm Optimization dengan Naive bayes untuk menetukan kelayakan pemberian kredit

1.3.2 Manfaat

(17)

Adapun penelitian ini diharapkan memberikan manfaat bagi pihak-pihak yang terkait dengan penelitian ini, antara lain adalah:

 Bagi peneliti Menambah khazanah keilmuan, pemikiran dan pengalaman dalam bidang Teknik Informatika, serta sebagai salah satu bentuk Implementasi Tri Dharma Perguruan tinggi

 Bagi Institusi Hasil dari penelitian ini kiranya dapat digunakan sebagai tambahan informasi atau literatur dalam meningkatkan informasi tentang komparasi algoritma Naive bayes dengan Support vector machine berbasis Particle Swarm Optimization, sehingga dapat digunakan sebagai dasar penelitian selanjutnya.

 Bagi perusahaan diharapkan dapat digunakan sebagai model untuk memberikan penilaian kredit pada perusahaan dan lembaga keuangan agar dapat membuat suatu perbaikan berupa kebijakan dalam penentuan pemberian kredit.

1.4 Sistematika Penulisan

Untuk mempermudah penyajian pada penulisan ini digunakan sistematika penulisan yang berguna untuk mengetahui masalah pokok bahasan setiap bab yang disajikan adalah sebagai berikut:

Bab I Pendahuluan

Pada bab ini dibahas mengenai latar belakang, rumusan masalah, batasan penelitian, tujuan penelitian, manfaat penelitian, metode penelitan dan sistematika penulisan.

Bab II Landasan Teori

Menguraikan teori-teori yang menunjang penulisan/ penelitian, yang bisa di perkuat dengan menunjukkan hasil penelitian sebelumnya.

Bab III Metodologi Penelitian

Menjelaskan cara pengambilan dan pengolahan data dengan menggunakan alat-alat analisis yang ada. Menjelaskan langkah perancangan alat, detil skematik dan teknik pengujian.

(18)

BAB II

LANDASAN TEORI DAN KERANGKA PEMIKIRAN

2.1 Tinjauan Pustaka

Metode klasifikasi banyak digunakan oleh para peneliti sebelumnya untuk melakukan klasifikasi penentuan kelayakan pemberian kredit. Penilaian Agunan Property Pengajuan Kredit Menggunakan Optimasi Algritma Support Vector Machine Berbasis Particle Swarm Optimization. metode Support Vector Machine mempunyai tingkat akurasi sebesar 84,17 % dan mempunyai nilai AUC sebesar 0,891. Setelah dilakukan penyesuaian pada parameter kernel tipe dan nilai validasi didapat nilai akurasi terbaik untuk algoritma Support Vector Machine yaitu mempunyai akurasi sebesar 84,17 % dan nilai AUCnya sebesar 0,891.

Sedangkan eksperiment kedua yang dilakukan dengan menggunakan metode Support Vector Machine berbasis Particle Swarm Optimization mempunyai nilai akurasi sebesar 87,57 % dan nilai AUC sebesar 0,951 ( Ibrahim, 2016).

Selain beberapa jurnal metode klasifikasi di atas, ada beberapa literatur yang lain yang berhubungan dengan penelitian ini

No Judul Thn Metedologi Hasil

1 KomparasiPenerapan AlgoritmaC45, KNN dan Neural Network Dalam Kelayakan Penerimaan Kredit Kendaraan Bermotor

2016 AlgoritmaC45, KNN dan Neural Network

algoritma C4.5 memiliki nilai akurasi dan AUC paling tinggi, diikuti oleh metode neural network, dan yang paling rendah metode K- NN.

2 Klasifikasi Data Mining Dalam Menentukan Pemberian Kredit Bagi Nasabah Koperasi

2015 cross validation, confusion matrix, ROC Curve dan T- test

algoritma C4.5 nilai akurasi tertinggi yaitu 87,41% dengan uji T-test paling dominan terhadap algortima lainnya, dengan nilai AUC paling tinggi yaitu 1.000.

3 KomparasiAlgoritma Klasifikasi Data Mining

2016 algoritma C4.5 dan Algoritma

keakuratan sebesar 82,57% dan akurasi sebesar 88,90%.

(19)

untuk Evaluasi Pemberian Kredit

Naïve Bayes

4 Implementasi

AlgoritmaC4.5 untuk Menentukan Calon Debitur Dengan

Mengkur Tingkat Risiko Kredit Pada Bank BRI Cabang Curup

2016 algoritma C4.5.

pengujian sistem maka diperoleh jawaban Sangat Menarik 57,5%, Menarik 32,5%, dan Tidak Menarik 10% dari 20 responden yang

dimintai keterangan.

5 Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah Kredit

2012 Decission Tree, Algoritma C4.5.

aplikasi yang dibangun dapat membantu menentukan target pemasaran kredit diharapkan biaya operasional marketing perbankan dapat seminimal mungkin.

6 Klasifikasi Nasabah Dan Bermasalah

Menggunakn Metode Naive Bayes

2015 Metode Naive Bayes

pengembanngan berikutnya

sebaiknya diupayakan lebih banyak lagi mengingat data mining bisa mengelola data dengan jumlah yang sangat besar

7 Algoritma Klasifikasi Naive Bayes Untuk Menilai Kelayakan Kredit

2013 akurasi sebesar 85,57% sedangkan

setelah dilakukan pengolahan data awal dan dengan pre-processing menghasilkan akurasi sebesar 92,53%.

8 Pengembangan Sistem Pendukung Keputusan Kredit Konsumtif Dengan Metode Naive Bayes

2016 Metode Naive Bayes

akurasi sistem dengan menggunakan k-fold cross validation mendapatkan hasil sebesar 99.33%.

9 Model Pohon Keputusan Untuk Klasifikasi Persetujuan Kredit

2015 Algoritma C4.5

Tingkat akurasi klasifikasi

persetujuan kredit dengan algoritma

(20)

Menggunakan Algoritma C4.5

C4.5 sebesar 94,516% .

10 Klasifikasi Kelayakan Kredit Calon Debitur Bank Menggunakan Algoritma DecesionTree C4.5

Algoritma DecesionTree C4.5

Algoritma Decision Tree C4.5.

akurasi yang cukup tinggi yaitu 87 % dan 92%.

11 Model Klasifikasi Kelayakan Kredit Koperasi Karywan Berbasis Decision Tree

2015 Decision Tree Tingkat akurasi Decision Tree untuk data dari koperasi karyawan PT Nojorono Tobacco International sebesar 92,28%.

12 Efektifitas Faktor Penentu Putusan Penilaian Kelayakan Kredit Berbasis Data Mining

2016 Naive Bayes, Decision Tree

Algoritma decision tree memiliki keakuratan paling baik dalam pengujian dengan menggunakan use training set dan cross validation yaitu memiliki tingkat error 0%, 13 KomparasiAlgoritma

Klasifikasi Data Mining Dalam Penentuan Resiko Kredit PadaKoperasi SerbaUsaha

2013 k - nearest neighbor .

Dengan metode knearest neighbor diperoleh tingkat keakuratan hasil 93.00%.

14 OptimasiAlgoritma Support Vector Machine (SVM) Menggunakan AdaBoost Untuk Penilaian Risiko Kredit

2013 Support Vector Machine (SVM) AdaBoost

penggunaan Boosting dalam hal ini AdaBoost-SVM memiliki akurasi yang lebih baik dari model Bagging-SVM

15 PenilaianAgunan Properti Pengajuan Kredit

Menggunakan Optimasi Algoritma Support VectorMachine Berbasis ParticleSwarmOptimization

2016 SVM PSO Support Vector Machines dimana didapat nilai accuracy adalah 84.17 %, sedangkan pengujian dengan menggunakan Support Vector Machines

berbasisParticleSwarmOptimization didapatkan nilai accuracy 87.57%.

(21)

Sehingga kedua metode tersebut memiliki perbedaan tingkat akurasi yaitu sebesar 3.40%.

2.2 LANDASAN TEORI 2.2.1 Data mining

Data mining adalah suatu proses yang menggunakan teknik statistik, matematika, kecerdasan tiruan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database yang besar. Data mining merupakan proses iterative dan interaktif untuk menemukan pola atau model baru yang sempurna, bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive database).

Berdasarkan sifat masalahnya, teknik – teknik data mining dikelompokkan menjadi : 1. Classification/Klasifikasi disebut juga supervised learning. Bersifat prediktif dan

digunakan untuk variabel target diskret, menentukan sebuah record data baru ke salah satu dari beberapa kategori (kelas) yang telah didefinisikan sebelumnya. Cocok digunakan untuk menggambarkan dataset dengan tipe biner atau nominal. Tipe model klasifikasi yaitu Classification by decision tree, neural network, Naïve Bayes, Support Vector Machines (SVM), Classification Based on Associations.

2. Clustering/Klasterisasi/segmentasi, disebut juga dengan unsupervised learning. Bersifat deskriptif dan digunakan untuk mengidentifikasi kelompok secara umum yang didasarkan pada seperangkat atribut. Tipe klasterisasi yaitu Partitioning methods, Hierarchical agglomerative methods, density based methods, Grid-based methods, model-based methods.

3. Assosiation Rule Discovery/Asosiasi merupakan proses populer lain dari data mining, juga disebut analisis keranjang pasar (market basket analysis). Tipe Asosiasi yaitu Multilevel association rule, Multidimensional association rule, quantitative association rule, direct association rule, indirect association rule.

4. Regression/Regresi merupakan fungsi untuk menemukan model data yang memiliki tingkat eror paling kecil. Tipe regresi, yaitu linier regession, multivariate linier regression, nonlinier regression, multivariate nonliniear regression.

5. Sequential Pattern Discovery merupakan pencarian sejumlah event/peristiwa yang secara

(22)

umum terjadi bersama-sama.

2.2.2 Komparasi

Menurut Witten (2005) membandingkan dua metode yang berbeda pada masalah yang sama untuk melihat mana yang lebih baik untuk digunakan. memperkirakan kesalahan menggunakan kros validasi (atau prosedur estimasi lain yang cocok), mungkin diulang beberapa kali, dan memilih skema yang estimasi lebih kecil. Hal ini cukup banyak aplikasi praktis, jika salah satu metode memiliki suatu perkiraan kesalahan yang lebih rendah daripada yang lain pada dataset tertentu, yang terbaik yang dapat di lakukan adalah dengan menggunakan model metode ini. Namun, hal itu mungkin, bahwa perbedaan tersebut hanya disebabkan oleh kesalahan estimasi, dan dalam beberapa keadaan adalah penting untuk menentukan apakah satu skema ini benar-benar lebih baik daripada yang lain pada masalah tertentu. Model perbandingan. Analisis data mining yang perlu digunakan di sini adalah model deskriptif dapat dengan mudah berubah menjadi satu prediktif. Telah membandingkan model dasar dengan lebih model grafis terstruktur, yang merupakan model yang paling penting statistik simetris untuk analisis data pada tabel (Giudici dan Vigini,2009). Kriteria Perbandingan untuk model Data Mining dapat diklasifikasikan ke dalam skema: kriteria berdasarkan uji statistik, berdasarkan

fungsi mencetak, kriteria Bayesian, kriteria komputasi, dan kriteria bisnis.(Maimon dan Lior,2005:642). Mengingat pembelajaran dua algoritma, serta membandingkan dan menguji apakah metode tersebut membangun dan pengklasifikasi yang memiliki kesamaaan pada tingkat kesalahan dalam ekplorasi data.(Alpaydin,2010:501)

2.2.3 Metode Naïve Bayes

Algoritma Naïve Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh ilmuan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal Teorema Bayes.

Teorema tersebut dikombinasikan dengan Naïve dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naïve Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya.

Persamaan dari teorema Bayes adalah : P(H|X)= P(X|H).P(H)

P(X) Keterangan:

(23)

X :Data dengan class yang belum diketahui

H :Hipotesis data x merupakan suatu class spesifik P(H|X) :Probabilitas hipotesis H berdasarkan kondisi X P(H) :Probabilitas hipotesis H (prior probability)

P(X|H) :Probabilitas X berdasarkan kondisi pada hipotesis H P(X) :probabilitas X

Untuk menjelaskan teorema Naïve Bayes, perlu diketahui bahwa proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa yang cocok bagi sampel yang dianalisis tersebut. Karena itu, teorema Bayes di atas disesuaikan sebagai berikut:

P(C|F฀ ....F฀ ) = P(C)P(F฀ F฀ |C) P(F¹. ... F฀ )

Dimana variabel C merepresentasikan kelas, sementara variabel F1….Fn merepresentasikan karakteristik petunjuk yang dibutuhkan untuk melakukan klasifikasi.

Maka rumus tersebut menjelaskan bahwa peluang masuknya sampel karakteristik tertentu dalam kelas C (Posterior) adalah peluang munculnya kelas C (sebelum masuknya sampel tersebut, seringkali disebut prior), dikali dengan peluang kemunculan karakteristik- karakteristik sampel pada kelas C (disebut juga likehood), dibagi dengan peluang kemunculan karakteristik-karakteristik sampel secara global (disebut juga evidence). Karena itu, rumus diatas dapat pula ditulis secara sederhana sebagai berikut:

Posterior = Prior x likehood Evidence

Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai dari posterior tersebut nantinya akan dibandingkan dengan nilai-nilai posterior kelas lainnya untuk menentukan ke kelas apa suatu sampel akan diklasifikasikan penjabaran lebih lanjut rumus Bayes tersebut dilakukan dengan menjabarkan (C|F1… Fn) menggunakan aturan perkalian sebagai berikut:

P(C|F฀ ...,F฀ ) = P(C)P(F฀ ,F฀ |C)

= P (C) P(F฀ |C) P(F₂ ,....F฀ |C, F฀ )

= P(C) P(F฀ |C) P(F₂ |C, F฀ ) P(F₃ ,...F฀ |C, F฀ , F₂ )

(24)

=P(C)P(F฀ |C) P(F₂ |C, F฀ ) P(F₃ |C, F฀ , F₂ ), P(F₄ ,...F฀ |C, F฀ , F₂ , F₃ )

=P(C) P(F฀ |C) P(F₂ |C, F฀ ) P(F₃ |C, F฀ , F₂ )..P (F฀ |C,F฀ , F₂ , F₃ ,..

F₄ -฀ )

Dapat dilihat bahwa hasil penjabaran tersebut menyebabkan semakin banyak dan semakin kompleksnya faktor-faktor syarat yang mempengaruhi nilai probabilitas, yang hampir mustahil untuk dianalisa satu persatu. Akibatnya, perhitungan tersebut menjadi sulit untuk dilakukan. Disinilah digunakan asumsi independensi yang sangat tinggi (naïve), bahwa masing-masing petunjuk (F1,F2…Fn) saling bebas (independen) satu sama lain. Dengan asumsi tersebut, maka berlaku suatu kesamaan sebagai berikut:

P(Pᵢ|F฀ ) = P(Fᵢ Ո F฀ ) = P(Fᵢ) P(F฀ ) = P(Fᵢ) P(F฀ ) P(F฀ )

untuk i ≠ j, sehingga

p(Fᵢ|C, F฀ )= P(Fᵢ|C)

Dari persamaan diatas dapat disimpulkan bahwa asumsi independensif naif tersebut membuat syarat peluang menjadi sederhana, sehingga perhitungan menjadi mungkin untuk dilakukan. Selanjutnya, penjabaran P(C|F1,…,Fn) dapat disederhanakan menjadi:

Persamaan diatas merupakan model dari teorema Naïve Bayes yang selanjutnya akan

digunakan dalam proses klasifikasi. Untuk klasifikasi dengan data kontinyu digunakan rumus Densitas Gauss:

(25)

Adapun alur dari metode Naïve Bayes adalah sebagai berikut:

1. Baca data training

2. Hitung jumlah dan probabilitas, namun apabila data numerik maka:

a. Cari nilai mean dan standar deviasi dari masing-masing parameter yang merupakan data numerik.

b. Cari nilai probabilistik dengan cara menghitung jumlah data yang sesuai dari kategori yang sama dibagi dengan jumlah data pada kategori tersebut.

3. Mendapatkan nilai dalam tabel mean, standart deviasi dan probabilitas.

2.2.4 Pengertian Support vector machine (SVM)

Support vector machine (SVM) dikembangkan oleh Boser, Guyon, Vapnik dan pertama kali dipresentasikan pada tahun 1992 di Annual Workshop on Computational Learning Theory. Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah class pada input space. Gambar memperlihatkan beberapa pattern yang merupakan anggota dari dua buah class : +1 dan –1.

Pattern yang tergabung pada class –1 disimbolkan dengan warna merah (kotak), sedangkan pattern pada class +1, disimbolkan dengan warna kuning (lingkaran). Problem klasifikasi dapat diterjemahkan dengan usaha menemukan garis (hyperplane) yang memisahkan antara kedua kelompok tersebut (Cortes & Vapnik, 1995). Garis pemisah (discrimination boundaries) ditunjukkan pada Gambar merupakan salah satu alternatif garis pemisah yang memisahkan kedua class.

(26)

Gambar 2.1 Kedua Class Dipisahkan Secara Linear oleh Sebuah Hyperplane (Nugroho, 2008)

Hyperplane pemisah terbaik antara kedua class dapat ditemukan dengan mengukur margin hyperplane tersebut dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane tersebut dengan pattern terdekat dari masing-masing class. Pattern yang paling dekat ini disebut sebagai support vektor. Garis solid pada Gambar 4.1-b menunjukkan hyperplane yang terbaik, yaitu yang terletak tepat pada tengahtengah kedua class, sedangkan titik merah dan kuning yang berada dalam lingkaran hitam adalah support vector. Usaha untuk mencari lokasi hyperplane ini merupakan inti dari proses pembelajaran pada support vector machine (Nugroho, 2008).

Data yang tersedia dinotasikan sebagai 𝑋𝑖 ∈ 𝑅𝑑 sedangkan label masing-masing dinotasikan 𝑦𝑖 ∈ {−1 + 1 } untuk 𝑖 = 1,2,…,𝑙, yang mana l adalah banyaknya data.

Diasumsikan kedua class –1 dan +1 dapat terpisah secara sempurna oleh hyperplane berdimensi d , yang didefinisikan (Nugroho, 2008

.𝑋 + 𝑏 = 0

Pattern 𝑋𝑖 yang termasuk class -1 (sampel negatif) dapat dirumuskan sebagai pattern yang memenuhi pertidaksamaan

𝑊 .𝑋𝑖 + 𝑏 ≤ −1

Sedangkan patter 𝑋𝑖 yang termasuk class +1 (sampel positif)

(27)

𝑊 .𝑋𝑖 + 𝑏 ≥ +1

Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya, yaitu 1/‖𝑤 ‖. Hal ini dapat dirumuskan sebagai Quadratic Programming (QP) problem, yaitu mencari titik minimal persamaan, dengan memperhatikan constraint persamaan.

Pemetaan ini dilakukan dengan menjaga topologi data, dalam artian dua data yang berjarak dekat pada input space akan berjarak dekat juga pada feature space, sebaliknya dua data yang berjarak jauh pada input space akan juga berjarak jauh pada feature space.

Gambar 2.2 Kedua Class Dipisahkan Secara Linear oleh Sebuah Hyperplane (Nugroho, 2008)

Selanjutnya proses pembelajaran pada SVM dalam menemukan titik-titik support vector, hanya bergantung pada dot product dari data yang sudah berdimensi lebih tinggi, yaitu Φ (𝑋𝑖 ).Φ(𝑋𝑗 ). Karena umumnya transformasi Φ ini tidak diketahui, dan sangat sulit untuk dipahami secara mudah, maka perhitungan dot product tersebut dapat digantikan dengan fungsi kernel 𝐾(𝑋𝑖 ,𝑋𝑗 ) yang mendefinisikan secara implisit transformasi Φ.

Kernel trick memberikan berbagai kemudahan, karena dalam proses pembelajaran SVM, untuk menentukan support vector, hanya cukup mengetahui fungsi kernel yang dipakai, dan tidak perlu mengetahui wujud dari fungsi non-linear Φ. Selanjutnya hasil klasifikasi dari data 𝑋 diperoleh dari persamaan berikut (Cortes & Vapnik, 1995):

(28)

Support vektor pada persamaan di atas dimaksudkan dengan subset dari training set yang terpilih sebagai support vector, dengan kata lain data 𝑋𝑖 yang berkorespondensi pada 𝑎𝑖 ≥ 0. Fungsi kernel yang biasanya dipakai dalam dalam literatur SVM yaitu(Nugroho, 2008):

sampel yang diambil dari dataset untuk membentuk data training atau testing itu diambil tanpa penggantian, artinya contoh yang sama setelah dipilih tidak dapat dipilih lagi (Witten, I.

H., Frank, E., & Hall, 2011), jadi dengan menggunakan bootstrapping sampel yang sudah dipilih dapat dipilih kembali, hal ini memungkinkan penilaian terhadap estimasi akurasi dengan random sampling dengan penggantian dari dataset yang asli sehingga bisa meningkatkan akurasi dan mempercepat waktu komputasinya.

a) KARAKTERISTIK SVM

Karakteristik SVM sebagaimana telah dijelaskan pada bagian sebelumnya, dirangkumkan sebagai berikut:

1) Secara prinsip SVM adalah linear classifier.

2) Pattern recognition dilakukan dengan mentransformasikan data pada input spaceke ruang yang berdimensi lebih tinggi, dan optimisasi dilakukan pada ruang vector yang baru tersebut. Hal ini membedakan SVM dari solusi pattern recognition pada umumnya, yang melakukan optimisasi parameter pada ruang hasil transformasi yang berdimensi lebih rendah dari pada dimensi input space.

3) Menerapkan strategi Structural RiskMinimization (SRM).

4) Prinsip kerja SVM pada dasarnya hanyamampu menangani klasifikasi dua class.

b) KELEBIHAN DAN KEKURANGAN SVM

Dalam memilih solusi untuk menyelesaikan suatu masalah, kelebihan dan kelemahan masing-masing metode harus diperhatikan. Selanjutnya metode yang tepat dipilih dengan memperhatikan karakteristik data yang diolah. Dalam hal SVM, walaupun berbagai studi telah menunjukkan kelebihan metode SVM dibandingkan metode

(29)

konvensional lain, SVM juga memiliki berbagai kelemahan. Kelebihan SVM antara lain sbb.

1. Generalisasi

Generalisasi didefinisikan sebagai kemampuan suatu metode (SVM, neural network, dsb.) untuk mengklasifikasikan suatu pattern, yang tidak termasuk data yang dipakai dalam fase pembelajaran metode itu. Vapnik menjelaskan bahwa generalization error dipengaruhi oleh dua faktor: error terhadap training set, dan satu faktor lagi yang dipengaruhi oleh dimensi VC (Vapnik-Chervokinensis). Strategi pembelajaran pada neural network dan umumnya metode learning machine difokuskan pada usaha untuk meminimimalkan error pada training-set. Strategi ini disebut Empirical Risk Minimization (ERM). Adapun SVM selain

meminimalkan error pada training-set, juga meminimalkan faktor kedua. Strategi ini disebut Structural Risk Minimization (SRM), dan dalam SVM diwujudkan dengan memilih hyperplane dengan margin terbesar. Berbagai studi empiris menunjukkan bahwa pendekatan SRM pada SVM memberikan error generalisasi yang lebih kecil daripada yang diperoleh dari strategi ERM pada neural network maupun metode yang lain.

2. Curse of dimensionality

Curse of dimensionality didefinisikan sebagai masalah yang dihadapi suatu metode pattern recognition dalam mengestimasikan parameter (misalnya jumlah hidden neuron pada neural network, stopping criteria dalam proses pembelajaran dsb.) dikarenakan jumlah sampel data yang relatif sedikit dibandingkan dimensional ruang vektor data tersebut. Semakin tinggi dimensi dari ruang vektor informasi yang diolah, membawa konsekuensi dibutuhkannya jumlah data dalam proses pembelajaran. Pada kenyataannya seringkali terjadi, data yang diolah berjumlah terbatas, dan untuk mengumpulkan data yang lebih banyak tidak mungkin dilakukan karena kendala biaya dan kesulitan teknis.

Dalam kondisi tersebut, jika metode itu “terpaksa” harus bekerja pada data yang berjumlah relatif sedikit dibandingkan dimensinya, akan membuat proses estimasi parameter metode menjadi sangat sulit. Curse of dimensionality sering dialami dalam aplikasi di bidang biomedical engineering, karena biasanya data biologi yang tersedia sangat terbatas, dan penyediaannya memerlukan biaya tinggi. Vapnik membuktikan bahwa tingkat generalisasi yang diperoleh oleh SVM tidak dipengaruhi oleh dimensi dari input vector . Hal ini merupakan alasan mengapa SVM merupakan salah satu metode yang tepat dipakai untuk memecahkan masalah berdimensi tinggi, dalam keterbatasan sampel data yang ada.

(30)

3. Landasan teori

Sebagai metode yang berbasis statistik, SVM memiliki landasan teori yang dapat dianalisa dengan jelas, dan tidak bersifat black box.

4. Feasibility

SVM dapat diimplementasikan relatif mudah, karena proses penentuan support vector dapat dirumuskan dalam QP problem. Dengan demikian jika kita memiliki library untuk menyelesaikan QP problem, dengan sendirinya SVM dapat diimplementasikan dengan mudah. Selain itu dapat diselesaikan dengan metode sekuensial sebagaimana penjelasan sebelumnya.

Disamping kelebihannya, SVM memiliki kelemahan atau keterbatasan, antara lain:

1. Sulit dipakai dalam problem berskala besar. Skala besar dalam hal ini dimaksudkan dengan jumlah sample yang diolah.

2. SVM secara teoritik dikembangkan untuk problem klasifikasi dengan dua class. Dewasa ini SVM telah dimodifikasi agar dapat menyelesaikan masalah dengan class lebih dari dua, antara lain strategi One versus rest dan strategi Tree Structure. Namun demikian, masing- masing strategi ini memiliki kelemahan, sehingga dapat dikatakan penelitian dan pengembangan SVM pada multiclass-problem masih merupakan tema penelitian yang masih terbuka.

c.Particle Swarm Optimazition

Optimasi adalah proses menyesuaikan kepada masukan atau karakteristik perangkat, proses matematis, atau percobaan untuk menemukan output minimum atau maksimum atau hasil. Input terdiri dari variabel, proses atau fungsi dikenal sebagai fungsi biaya, fungsi tujuan, atau kemampuan fungsi, dan output adalah biaya atau tujuan jika proses adalah sebuah percobaan, kemudian variabel adalah masukan fisik untuk percobaan (Haupt & Haupt, 2004).

Particle Swarm Optimization (PSO) adalah metode pencarian penduduk, yang berasal dari penelitian untuk pergerakan organisme dari kelompok burung atau ikan, seperti algoritma genetika, Particle Swarm Optimization (PSO) melakukan pencarian menggunakan populasi (swarm) dari individu (partikel) yang diperbaharui dari iterasi untuk iterasi (Fei, et al, 2009).

Particle Swarm Optimization (PSO) merupakan algoritma pencarian berbasis populasi dan diinisialisasi dengan populasi solusi acak dan digunakan untuk memecahkan masalah optimasi (Abraham et al, 2006). PSO adalah teknik yang terinspirasi oleh proses

(31)

alami burung yang berkelompok, dan juga dikenal sebagai segerombolan intelijen dengan mempelajari perilaku sosial atau kelompok hewan. (Shukla,et al, 2010). untuk menemukan solusi yang optimal, masing-masing partikel bergerak ke arah posisi sebelumnya terbaik (pbest) dan terbaik posisi global (gbest).

a. CRISP-DM

Cross-Industry Standard Process for Data Mining (CRISP-DM) dikembangkan tahun 1996 oleh analis dari beberapa industry seperti DaimlerChrysler, SPSS dan NCR. CRISP- DM menyediakan standar proses data mining sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian (Rahmatullah, 2016). Dalam metode CRISP-DM terdapat enam proses data mining seperti tergambarkan dalam Gambar berikut ini (Defiyanti, 2015):

Gambar.2.3 CRISP-DM

a. Bussiness Understanding

(32)

Pada fase ini berfokus pada pemahaman dan perspektif bisnis proses dari suatu sistem.

Yaitu penentuan tujuan proyek, menerjemahkan tujuan, dan menyiapkan strategi untuk penyampaian tujuan.

b. Data Understanding

Pada fase ini berfokus pada pembelajaran data yang sudah ada, pengumpulan dan penyeleksaian data.

c. Data Preparation

Pada fase ini proses meliputi persiapan pemilihan variabel yang akan dianalisis yang digunakan dalam pemodelan

d. Modeling

Pada fase ini proses yang terjadi adalah pemilihan model yang sesuai. Pemodelan disini dapat dikalibrasi agar mengoptimalkan hasil

e. Evaluation

Pada fase ini proses yang terjadi adalah mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas.

f. Deployment

Pada fase ini proses yang terjadi adalah menggunakan model yang dihasilkan.

b. K-Fold Cross Validation

K-fold cross validation adalah teknik untuk mengestimasi performansi dari model pelatihan yang telah dibangun. Metode ini membagi data training dan data testing sebanyak k bagian data. Fungsi dari k-fold cross validation adalah agar tidak ada overlapping pada data testing. Berikut ini ilustrasi sederhana dari k-fold cross validation (Sasongko, 2016).

Gambar.2.4 K-fold cross validation

Referensi

Dokumen terkait

1) Aspek perancangan, aspek ini digunakan untuk menguji sejauh mana penerapan konsep ontologi diterapkan, pengujian implementasi ini dilakukan dengan melihat

Grafik Hubungan Yield dengan Rasio Bahan-Pelarut pada Konsentrasi Pelarut 1 g / 100mL Gambar 3 hingga gambar 5 menunjukan grafik hubungan yield dengan rasio bahan-pelarut

potong, persentase karkas dan kadar lemak daging itik lokal jantan umur sepuluh minggu.. Persentase karkas dan bagian-bagiannya dua galur ayam

■ Pada konjungtivitis giant papillary , iritasi kronis akan menyebabkan keratitis yaitu inflamasi pada kornea dan dapat menyebabkan kebutaan permanen karena terjadi

Telah dilakukan penelitian degradasi permetrin dengan menggunakan 200 mg zeolit alam persen degradasi 52 % dan 8 mg TiO 2 -anatase persen degradasi 45 % pada suhu 40 o C

Instrumen yang digunakan adalah alat penilaian kemampuan guru (APKG) yang diadopsi dari APKG sertifikasi guru rayon 21 Undiksha tahun 2013. Evaluasi dilakukan pada tiga orang guru

Oleh sebab itu, untuk variabel yang dapat dilakukan pendugaan kekerasan buah yaitu pada indeks warna merah dan hijau yang terdapat pada varietas pepaya California, sedangkan

• Pendidikan formal Persis adalah pendidikan yang berorientasi pada Islam, bersistem, berlandaskan pada teori ilmu pendidikan dan tujuan nasional, serta mengacu