• Tidak ada hasil yang ditemukan

MEMPREDIKSI TRANSAKSI NASABAH PADA KOPERASI SIMPAN PINJAM PT ASURANSI STACO MANDIRI DENGAN ALGORITMA C4

1.1 Latar Belakang Penelitian

Koperasi sebagai bentuk badan usaha adalah merupakan organisasi ekonomi rakyat yang berwatak sosial dan sebagai usaha bersama bedasarkan azas kekeluargaan, haruslah dapat dikelola dengan prinsip – prinsip manajemen tepat. Koperasi karyawan Asuransi Staco Mandiri adalah sebuah koperasi yang bertugas melayani anggota untuk memajukan kesejahteraan anggotanya pada khususnya. Salah satu unit yang dikelola oleh koperasi ini adalah unit simpan pinjam. Unit seperti ini tidak mencari keuntungan semata-mata, tetapi menciptakan sumber kredit dan sumber daya manusia dari, oleh dan untuk anggotanya saja dengan tingkat suku bunga yang pantas dan layak bertujuan untuk mengembangkan dan mengusahakan kesejahteraan bagi para anggotanya. Instansi koperasi dalam pengolahan data yang diterapkan di koperasi karyawan Asuransi Staco Mandiri, masih belum maksimal, karena masih timbul permasalahan dan kesulitan ketika petugas mengelola data-data yang ada. Maka dari itu dibutuhkan suatu pengelolaan koperasi demi menunjang kinerja koperasi terkait.

1.1.1 Rumusan Masalah

Salah satu hal yang juga menentukan kualitas layanan koperasi karyawan PT. Asuransi Staco Mandiri adalah kecepatan pelayanan. Pihak manajemen koperasi karyawan PT. Asuransi Staco Mandiri betul-betul memperhitungkan kinerja dalam hal kecepatan pelayanan pembayaran peminjaman anggota, penyimpanan dana anggota maupun pendaftaran anggota. Berdasarkan hasil wawancara dengan salah satu petugas koperasi, berkas pengajuan peminjaman yang belum lengkap dapat ditolak oleh petugas koperasi.

Kecepatan pelayanan ke nasabah seharusnya sudah bisa diukur sejak pengajuan dokumen dan kelengkapan syarat lainnya, misalnya untuk menjadi anggota koperasi harus menjadi karyawan tetap terlebih dahulu.Salah satu akar masalah yang teridentifikasi dari internal koperasi yaitu perilaku petugas yang menunda melengkapi persyaratan dakumen nasabah dan pencatatan dokumen sampai berkas lengkap diterima.

1.1.2 Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk memberikan prediksi terhadap lama waktu pelayanan nasabah koperasi karyawan PT. Staco Asuransi Mandiri serta untuk menganalisis faktor-faktor apa saja yang menyebabkan lamanya waktu dalam setiap transaksi.

1.2 Tinjauan Pustaka

Melakukan tinjauan pustaka dan penelitian sebelumnya yang relevan dengan penelitian ini untuk menjawab pertanyaan penelitian. Tahapan ini menggunakan teori dan metodologi yang relevan serta bebebrapa penelitian yang relevan.

Penelitian yang dilakukan oleh Hachesu (2013) berjudul “Use of Data Mining Techniques to Determine and Predict Length of Stay of Cardiac Patients”. Tujuan dari penelitian ini adalah mempredeksi lama inap pasien

gagal jantung di Rumah Sakit Rajaei di Teheran, Iran. Penelitian ini mengklasifikasikan lama inap pasien ke dalam tiga kelas yang akan diprediksi dengan menggunakan teknik data mining. Model data mining yang digunakan dalam penelitian adalah SVM, Decision Tree, dan ensemble model dengan mengkombinasikan ketiga

model sebelumnya. Dari penelitian tersebut didapatkan bahwa SVM mempunyai nilai akurasi tertinggi sebesar 96,4% dengan nilai sensitivity 98,1% dan specificity sebesar 97,3%.

Penelitian yang dilakukan oleh Shanti & Ramani (2012) berjudul “Feature Relevance Analysis and Classification of Road Traffic Accident Data through Data Mining Techniques”. Tujuan dari penelitian ini adalah untuk memprediksi faktor-faktor yang memengaruhi terjadinya kecelakaan lalu lintas berdasarkan tingkat parahnya cedera. Penelitian ini mengklasifikasikan tingkat cedera korban menjadi enam kelas yang akan diprediksi menggunakan teknik data mining klasifikasi. Model data mining yang digunakan dalam penelitian ini adalah Decision Tree C4.5, Classification and Regression Tree (CART), Iterative Dichotomiser 3 (ID3),

Random Tree dan Naïve Bayes. Dari penelitian tersebut didapatkan bahwa Random Tree mempunyai nilai akurasi tertinggi sebesar 85,8%.

Penelitian yang dilakukan oleh Sowmya & Ponmuthuramalingam (2013) berjudul “Analyzing the Road Traffic and Accidents with Classification Techniques”. Tujuan dari penelitian ini adalah memprediksi penyebab kecelakaan lalu lintas di Hong Kong. Penelitian ini mengklasifikasikan tingkat cedera ke dalam empat kelas yang akan diprediksi dengan teknik data mining. Model data mining yang digunakan dalam penelitian ini adalah Naïve Bayes, Decision Tree C4.5, Adaptive Boosting, dan Random Forest. Dari keempat model tersebut,

Random Forest memperoleh nilai akurasi tertinggi dengan nilai 74.89%.

Penelitian yang dilakukan oleh Bulbul (2016) berjudul “Analysis for Status of the Road Accident Occurance and Determination of the Risk of Accident by Machine Learning in Istanbul”. Tujuan dari penelitian ini adalah

untuk pemanfaatan data mining untuk mengestimasi kapan terjadinya kecelakaan. Penelitian ini menggunakan teknik data mining dengan model AdaBoost, CART, Decision Tree C4.5, Naïve Bayes, dan k-NN (k-Nearest Neighbor). Dari penelitian ini didapat bahwa Naïve Bayes, CART, dan k-NN mempunyai akurasi yang tertinggi, yaitu di atas 80%.

1.3 Metodologi Penelitian

Penelitian ini menggunakan metodologi penelitian kuantitatif studi kasus. Menurut Cohen (1980) dalam bukunya Jatmiko (2015), penelitian kuantitatif adalah penelitian sosial yang menggunakan metode empiris dan pernyataan empiris. Empiris adalah suatu sumber pengetahuan yang diperoleh dari observasi atau percobaan. Pernyataan empiris didefinisikan sebagai pernyataan deskriptif tentang apa permasalahan di dunia dan bukan apa yang akan menjadi permasalahan. Pendekatan kuantitatif memandang tingkah laku manusia dapat diramal dari realitas sosial, objektif dan dapat diukur. Studi kasus merupakan suatu metodologi penelitian yang digunakan sebagai suatu penjelasan komprehensif yang berkaitan dengan berbagai aspek seseorang, suatu kelompok, suatu organisasi, suatu program, atau suatu situasi dalam masyarakat yang diteliti, dianalisis, dan ditelaah sedalam mungkin. Penelitian ini merupakan penelitian kuantitatif studi kasus karena peneliti melakukan penelitian untuk mengatasi permasalahan yang ada di operasional di koperasi karyawan PT. Staco Asuransi Mandiri dan variabel- variabel teknis yang didapat dari observasi dan percobaan yang ada serta terkait secara langsung.

1.3.1 Data Mining

Data mining adalah proses penggalian informasi yang valid, yang sebelumnya tidak dikenal, belum dipahami, dan belum ditindaklanjuti dari basis data yang besar dan kemudian memanfaatkannya untuk membantu proses pengambilan keputusan bagi manajemen perusahaan atau organisasi. Menurut Vercellis (2011), data mining merupakan proses berulang-ulang untuk menganalisis informasi dari suatu basis data yang besar, dengan tujuan untuk menggali informasi dan pengetahuan yang valid untuk kemudian digunakan dalam membantu memecahkan masalah dan proses pengambilan keputusan. Sedangkan menurut Larose & Larose (2015), data mining adalah proses menemukan pola dan tren yang berguna dari data set yang sangat besar.Jadi

data mining dapat disimpulkan sebagai proses analisa yang berulang-ulang pada informasi di suatu basis data yang besar, yang sebelumnya tidak dikenal, belum dipahami, dan belum ditindaklanjuti, dengan tujuan untuk menggali pola informasi tersembunyi yang valid dan akurat. Informasi tersebut kemudian dapat dimanfaatkan untuk membantu memecahkan masalah dan membantu proses pengambilan keputusan.Data mining adalah proses yang memperkerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.

1.3.2 Jenis-jenis Tahapan Data Mining

Dalam kesempatan ini akan dijabarkan dua jenis tahapan dalam data mining atau penggalian data yaitu dengan metode Knowledge Discovery in Database (KDD) dan Cross Industry Standard Process for Data Mining

(CRISP-DM)

1.3.2.1 KDD

KDD singkatan dari Knowledge Discovery in Database, yaitu suatu aktivitas untuk menggali data dan menemukan informasi dan pengetahuan dalam suatu basis data yang besar dengan cara mentransformasi data

menjadi informasi dan pengetahuan yang berguna .Proses yang ada dalam KDD digambarkan pada Gambar 1 antara lain sebagai berikut:

1. Pembersihan Data (Data Cleaning)

Merupakan proses pembersihan data dari noise dan data yang tidak konsisten. Noise data misalnya perbedaan tipe data (string, integer, dan date) atau format data tidak sesuai. Sedangkan data yang tidak konsisten misalnya data yang mempunyai persebaran nilai dengan deviasi yang sangat lebar.

2. Penggabungan Data (Data Integration)

Merupakan proses penggabungan data yang mempunyai sumber yang berbeda-beda ke dalam sebuah data set. Proses ini menjadikan data menjadi lebih besar dan lebih luas sehingga informasi yang dapat digali menjadi lebih beragam.

3.

Seleksi Data (Data Selection)

Merupakan proses pemilihan data yang relevan dan menyampingkan data yang tidak diperlukan dalam proses

mining data.

4. Pengubahan Data (Data Transformation)

Merupakan proses pengubahan bentuk atau format data menjadi bentuk yang dapat diproses untuk data mining.

Gambar 1. Tahapan-tahapan metode KDD 1.3.3.2 CRISP-DM

CRISP-DM atau Cross Industry Standard Process for Data Mining menurut Kotu & Deshpande (2015) merupakan framework yang ditemukan melalui konsortium oleh sebagian besar perusahaan yang menerapkan

data mining. Proses CRISP-DM merupakan kerangka kerja yang paling banyak digunakan untuk mengembangkan solusi data mining. Menurut Chapman (2000), CRISP-DM merupakan siklus hidup suatu proyek data mining. Dalam framework ini berisi fase-fase proyek, tugas-tugas pada setiap fase, dan hubungan antar tugas-tugas tersebut. Siklus hidup proyek data mining terdiri dari enam tahapan, seperti yang digambarkan pada Gambar 2.

Gambar 2. Tahapan-tahapan pada CRISP-DM

Proses pengerjaan data mining terdiri dari enam tahapan sebagai, berikut: 1. Pemahaman Bisnis (Business Understanding)

Pada fase ini, proses difokuskan terhadap pemahaman tujuan dan definisi kebutuhan proyek berdasarkan sudut pandang bisnis. Langkah selanjutnya adalah mengubah kebutuhan informasi tersebut menjadi definisi permasalahan pada data mining, dan juga menetapkan desain rencana permulaan untuk dicapai secara obyektif. 2. Pemahaman Data (Data Understanding)

Proses dimulai dengan pemahaman data, yaitu dengan mengumpulkan data awal dan dilanjutkan dengan aktivitas untuk memahami data sehingga mendapatkan pemahaman yang mendalam tentang data. Langkah selanjutnya adalah melakukan identifikasi terhadap kualitas data atau menemukan data yang bisadigunakan sebagai bahan dalam melakukan analisis terhadap hipotesis mengenai informasi yang tersembunyi.

3. Persiapan Data (Data Preparation)

Fase persiapan data mencakup semua kegiatan yang dibutuhkan untuk membangun data set akhir yang lengkap berdasarkan data mentah. Proses ini dapat dilakukan secara tidak berurutan dan bisa dilakukan berulang- ulang.Dalam tahap ini juga dilakukan pemilihan dan penerapan terhadap teknik pemodelan sesuai pemodelan yang telah dipilih. Umumnya setiap teknik pemodelan berbeda penerapannya tergantung dengan data yang digunakan, karena belum tentu suatu pemodelan dapat digunakan untuk semua data meskipun kebutuhan informasinya sama.Sehingga proses yang dilakukan harus meliputi pemilihan tabel, record, dan atribut data serta bila diperlukan dapat melakukan pembersihan dan transformasi data agar data dapat dimasukkan ke tahap pemodelan.

4. Pemodelan

Fase pemodelan merupakan fase penerapan teknik model terhadap data yang parameternya telah dikalibrasi secara optimal.Untuk satu permasalahan data mining yang sama dapat digunakan lebih dari satu pemodelan, sehingga kegiatan dapat diulang-ulang. Selain itu dalam tahap pemodelan juga mempunyai syarat terhadap data, yaitu mempunyai format data khusus, sehingga pada saat melakukan fase pemodelan dapat kembali ke tahap sebelumnya yaitu persiapan data untuk memastikan data telah sesuai dengan persyaratan pemodelan yang sedang digunakan.

5. Evaluasi

Tahap evaluasi adalah melakukan evaluasi terhadap pemodelan yang telah digunakan dengan membandingkan hasil penerapan model dengan kebutuhan informasi berdasarkan tujuan bisnis yang telah didefinisikan pada tahap Business Understanding. Pemodelan telah dilakukan terhadap data, dan sebelum memutuskan pemodelan akhir mana yang dipilih, maka dilakukan evaluasi untuk mengetahui apakah masih terdapat kebutuhan, tujuan bisnis atau masalah yang belum ditemukan solusinya. Dalam fase ini harus dapat diputuskan pemodelan mana yang akan dipilih sehingga penggunaan hasil datamining dapat tercapai.

6. Penerapan (Deployment)

Pada fase ini, penerapan model telah dilakukan sehingga informasi atau pengetahuan yang telah disajikan dengan visualisasi yang tepat dapat diterima oleh pengguna.

1.4 Algoritma C4.5

Algoritma C4.5 adalah salah satu metode untuk membuat decision tree berdasarkan training data yang telah disediakan. Algoritma C4.5 merupakan pengembangan dari ID3. Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai antara lain bisa mengatasi missing value, bisa mengatasi data yang terus bertambah besar, dan pengurangan atau pemangkasan data.

Pada tahap algoritma C4.5 memiliki 2 prinsip kerja, yaitu:

1. Pembuatan pohon keputusan. Tujuan dari algoritma penginduksi pohon keputusan adalah mengkontruksi struktur data pohon yang dapat digunakan untuk memprediksi kelas dari sebuah kasus atau record baru yang belum memiliki kelas. C4.5 melakukan konstruksi pohon keputusan dengan metode divide and conquer. Pada awalnya hanya dibuat node akar dengan menerapkan algoritma divide and conquer. Algoritma ini memilih pemecahan kasus-kasus yang terbaik dengan menghitung dan membandingkan gainratio, kemudian node-node

yang terbentuk di level berikutnya, selanjutnya algoritma divide and conquer akan diterapkan lagi sampai terbentuk daun-daun.

2. Pembuatan aturan-aturan (rule set).Aturan-aturan yang terbentuk dari pohon keputusan akan membentuk suatu kondisi dalam bentuk if-then. Aturan-aturan ini didapat dengan cara menelusuri pohon keputusan dari akar sampai daun. Setiap node dan syarat percabangan akan membentuk suatu kondisi atau suatu if, sedangkan untuk nilai-nilai yang terdapat pada daun akan membentuk.

Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut: a. Pilih atribut sebagai akar.

b. Buat cabang untuk tiap-tiap nilai. c. Bagi kasus dalam cabang.

d.Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama.

Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam persamaan (1) berikut :

Gain(S,A) = Entropy(S) − 1 ∗𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) (1) Keterangan:

S : himpunan kasus A : atribut

n : jumlah partisi atribut A |Si| : jumlah kasus pada partisi ke-i |S| : jumlah kasus dalam S

Sementara itu, penghitungan nilai entropi dapat dilihat pada persamaan (2) berikut :

Entropy(S) = Σi=1n -𝑝𝑖∗ log2𝑝𝑖 (2)

Keterangan: S : himpunan kasus A : fitur

n : jumlah partisi S

pi : proporsi dari S_i terhadap S

Pada saat pembangunan pohon keputusan, banyaknya cabang mungkin mencerminkan adanya noise atau

outlier pada training data. Pemangkasan pohon dapat dilakukan untuk mengenali dan menghapus cabang-cabang tersebut. Pohon yang dipangkas akan menjadi lebih kecil dan lebih mudah dipahami. Pohon semacam itu biasanya juga menjadi lebih cepat dan lebih baik dalam melakukan klasifikasi.