IMPLEMENTASI ALGORITMA CLASIFICATION AND REGRESSION TREE (CART) UNTUK KLASIFIKASI BANTUAN USAHA MIKRO KECIL MENENGAH
(UMKM) JASA TELEMATIKA INDONESIA Fadlan Amirudin, Eneng Tita Tosida,Irma Anggraeni.
Email : fadlanamirudin043@gmail.com
Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor ABSTRAK
Telematika salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia. Berdasarkan hal tersebut akan dilakukan penelitian dan pengimplementasian untuk menentukan badan usaha jasa telematika yang layak menerima bantuan dari permenkop UKM dari data yang sesuai dari Susenas (Sensus Nasional) Badan Pusat Statistik 2006, dengan menerapkan algoritma CART yang merupakan salah satu algoritma data mining dalam pengolahan data yang menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, sehingga memudahkan permenkop dalam menentukan badan usaha yang layak menerima bantuan. Hasil penelitian uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan
confusion matrix dari proses mining yang membandingkan 2 skenario model.
Kata Kunci : UMKM, Telematika, Klasifikasi, Data Mining, Algoritma CART, PENDAHULUAN
Bidang telematika adalah salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia pada tahun 2015. Dasar penilitian ini bertujuan menentukan kelayakan UMKM untuk menerima bantuan atau tidak menerima bantuan dari Kemenkop UKM Indonesia. Beberapa penelitian terkait tentang kondisi telematika Indonesia baik berupa model klasifikasi usaha jasa telematika (Tosida et al. , 2012)
Penelitian yang relevan berkaitan dengan telematika telah dilakukan oleh peneliti terdahulu Hardiani, (2015), melakukan clustering usaha kecil menengah jasa telematika Indonesia sesuai dengan data Susenas (Sensus Nasional) Badan Pusat Statistik tahun 2006 yang
tersebar di seluruh wilayah provinsi, kabupaten atau kota di Indonesia. Selain itu Tosida et al.(2015) meneliti dan mengembangkan visualisasi data UMKM Jasa Telematika yang memiliki 8 atribut menjadi 21 atribut sesuai data Susenas tahun 2006. Berdasarkan dua penelitian tersebut sudah menghasilkan beberapa atribut namun belum ada atribut kelas yang telah ditentukan sehingga tidak bisa melakukan klasifikasi, maka dari itu perlu dikembangkan agar bisa menjadi machine
learning. Data penelitian ini sudah melalui
tahap praproses data sehingga data tersebut sudah bisa di ujicoba pada algoritma yang digunakan. Pengembangan yang akan dilakukan dari hasil kedua penelitian tersebut adalah menentukan atribut kelas dan menerapkan data pada algoritma CART.
Algoritma CART ini menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, lalu akan
mengidentifikasi variable secara otomatis yang berpengaruh dan mereduksi kompleksitas data, mudah dalam mengatasi data outlier, dan mudah dalam interpretasi. Untuk itu diterapkan algoritma CART dengan tujuan mampu menghasilkan klasifikasi berdasarkan informasi data yang ada.
Pembuatan sistem ini menggunakan
Adobe Dreamweaver cs6, perancangan
database menggunakan MySQL dan klasifikasi data menggunakan algoritma CART. Sistem ini ditujukan untuk mempermudah penentuan UMKM yang layak untuk diberikan bantuan dan juga dapat mudah dimengerti penggunaanya agar bisa digunakan sebaik mungkin.
Tujuan penelitian ini adalah mengimplementasikan algoritma CART untuk model klasifikasi pemberian bantuan UMKM Jasa Telematika Indonesia dengan menggunakan bahasa pemrograman R, PHP 5 dan database MySQL.
Penelitian tentang kredit Scoring juga telah dilakukan oleh Saputro, D (2010) dengan judul Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Di PT.X finance cabang mauk. Aplikasi ini memiliki tujuan adalah Membantu pihak kredit untuk mengetahui parameter dan klasifikasi kredit pada PT.X Finance.
Menurut Susanto dan Suryadi (2010), pada klasifikasi algoritma CART (Classification and Regression Trees), sebuah record akan diklasifikasikan ke dalam salah satu dari sekian klasifikasi yang tersedia pada variable tujuan berdasarkan nilai-nilai variabel prediktornya.Langkah-langkah Algoritma CART:
a. Susunlah calon cabang (candidate split) yang dilakukan terhadap seluruh variabel prediktor. Daftar yang berisi calon cabang disebut calon cabang mutakhir.
b.Berikan penilaian keseluruhan calon cabang mutakhir dengan menghitung besaran (s|t)
c.Tentukan cabang yang memiliki kesesuaian (s|t). Setelah noktah keputusan tidak ada lagi, algoritma CART dihentikan. Kesesuaian (goodness) (s|t) dari calon cabang s pada noktah keputusan t, didefiniskan sebagai persamaan – persamaan berikut :
( | ) LPRQ(s|t) …….. (1)
( | ) ∑ | ( | ) ( | )…... (2)
tl= Cabang kiri dari noktah keputusan t tr= Cabang kanan dari noktah keputusan t ………. (3)
( | ) …………. (4)
………….... (5)
( | ) ……..(6)
METODE PENELITIAN
Metode Peneitian yang diterapkan ini menggunakan tahapan data mining atau disebut juga Knowledge Discovery and
Data Mining (KDD) (Han et al .2006)
suatu rangkaian proses data mining dapat dibagi menjadi beberapa tahap yang diilustrasikan pada Gambar 1. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base.
Gambar 1. Tahap-Tahap Data Mining (Han et al.2006) CLEANING & INTEGRATION DATA MINING EVALUATION & PRESENTATION SELECTION & TRANSFORMATION KNOWLEDGE
Tahap-tahap data mining ada 5 yaitu : 1. Pembersihan data dan Integrasi
data (Cleaning And Integration
Data)
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Hasil pembersihan data set usaha jasa telematika yang diperoleh dari Susenas tahun 2006 melalui pengisian data kosong dengan nilai mean (untuk data numerik), modus (untuk data kategorik), menghapus data yang tidak konsisten serta outlier sesuai dengan ketentuan (UU No 20 Tahun 2008) menyebabkan reduksi data dari 12541 menjadi 8798. (Tosida et al.2015)
2. Seleksi Data dan Transformasi data
(Data Selection and Data
Transformation)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal. (Tosida et al.2015)
3. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.Untuk proses mining menggunakan algoritma CART dalam menentukan keputusan kelayakan bantuan UMKM.
4. Evaluasi pola (pattern evaluation),
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa
yang ada memang
tercapai.Evaluasi dari penelitian ini menggunakan confusion matrix. 5. Presentasi pengetahuan (knowledge
presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data
mining. Dalam presentasi ini, hasil
berupa decission tree yang berisi beberapa kaidah dan rule yang akan diimplementasikan ke dalam bentuk sistem berbasis web.
HASIL DAN PEMBAHASAN Hasil
Hasil yang didapat dari penelitian ini adalah pembuatan sistem klasifikasi bantuan usaha jasa telematika di Indonesia dengan mengunakan fungsi algoritma CART yang digunakan dalam machine
learning pada aplikasi Rstudio, data di
olah menjadi 2 bagian yaitu data latih sebesar 80% dan data uji sebesar 20% dengan keseluruhan 8798 data, sehingga akan menghasilkan klasifikasi berupa pohon keputusan badan usaha yang layak atau tidak untuk menerima bantuan.
Setelah data selesai diolah dalam aplikasi Rstudio maka akan diimplementasikan dengan web yang dirangcang menggunakan adobe dreamweaver kemudian diterapkan dalam framework yii dan database dibuat dalam
aplikasi MySQL. Dalam web klasifikasi ini di bedakan menjadi 2 akses pengguna, yaitu penguna umum untuk melakukan klasifikasi informasi UMKM dan admin untuk mengolah data klasifikasi UMKM.
Pembahasan
1. Cleaning and Integration
Data untuk klasifikasi ini telah mengalami tahapan praproses data mining seperti pembersihan data dan integrasi data yang dilakukan penelitian sebelumnya oleh Tosida et al (2015).
2. Selection Data
Data set usaha Jasa Telematika diperoleh dari Susenas (Sensus Nasional) pada tahun 2006 terdiri dari 8798 UMKM Jasa Telematika dengan atribut sebanyak 21 atribut (4 atribut numerik dan 17 atribut kategorik).
Agar data lebih ringkas efektif dilakukan seleksi data yang tujuan lainnya juga untuk menentukan kelas kemudian dipilihlah atribut pernah menerima bantuan sebagai kelas. Berikut adalah deskripsi data yang telah dan diseleksi.
Tabel 1. Deskripsi Data UMKM Jasatelematika
No. Atribut Tipe Rentang Nilai
A. Keterangan Umum
1. Provinsi K 1. Jawa, 2. Sumatera, 3.Kalimantan, 4. Papua 5. Bali&Nusra 2. Pendidikan pemilik K 1. SMA sederajat 2. D4-S1atau lebih 3. D1-D3 4. < SMA
3. Bentuk badan hokum K
1. CV 2. Firma
3. Ijin Khusus Instansi 4. Koperasi
5. Perorangan 6. PT
7. Yayasan 4. Tahun Mulai Operasi K 1. ≤ 3 tahun 2. > 3 tahun
5. Pengguna computer K 1. Ya 2. Tidak
6. Pengguna internet K 1. Ya 2. Tidak
7. Kelompok Usaha K 1. Jasa telekomunikasi 2. Konsultasi Hardware 3. Konsultasi Software 4. Lainnya B. Finansial 1. Penjualan N 1. Mikro 2. Kecil 3. Menengah
2. Total asset N 1. Mikro
2. Kecil 3. Menengah
3. Modal K 1. Modal sendiri 2. Modal Pihak lain
4. tenaga kerja N 1. Kecil
2. Mikro 3. Menengah
Tabel 2. Atribut Kelas yang telah di seleksi
2. Proses Mining 2.1 Algortima CART
Data ini dimasukan kedalam proses
mining menggunakan algoritma CART
yang akan mengeluarkan hasil
decission tree. Data di bagi menjadi 2
yaitu data latih 80% yang nantinya dimasukan dalam proses mining dan data uji 20% digunakan sebagai validasi decission tree yang telah dibuat pola data aslinya. Berikut
flowchart untuk algoritma CART.
Gambar 2. Flowchart algoritma CART Fathurahman et.al 2014.
C. Kendala & Propek Usaha
1 Kesulitan K 1.bahan baku/barang dagangan 5. Pemasaran 2. BBM/energy 6. Permodalan 3. ketrampilan
tenaga kerja 7. Tidak ada kesulitan 4. Lainnya 8. Transportasi
9. Upah buruh
2 Koperasi K 1. Ya 2. Tidak
3 Kemitraan K 1. Ya 2. Tidak
4 Menerima pelatihan K 1. Ya 2. Tidak
5 Pemasaran K 1. Ekspor 3. Luar Provinsi 2. Kabupaten 4. Provinsi
6 Kondisi perusahaan 3 bulan lalu
K 1. Sama baik 4. Lebih buruk
2. Sama buruk 5. Tidak dapat dibandingkan
3. Lebih baik
7 Perkiraan prospek usaha 3 bln akan datang
K 1. Lebih baik 4. Sama buruk
2. Lebih buruk 5. Tidak dapat dibandingkan
3. Sama baik
8 Rencana
K 1. Tidak 4. Ya, meningkatkan keahlian
2. Ya,
Memperluas usaha 5. Ya,lainnya 3. Ya, membuka
cabang
No. Atribut Rentang Nilai
1 Menerima bantuan 1. Tidak Menerima Bantuan
Berikut merupakan penjelasan dari
flowchart algoritma CART untuk
membangun pohon keputusan : 1. Masukan data latih.
2. Tentukan calon cabang yang akan di bentuk (Kandidat Split).
3. Lakukan split pada data dan membuat interval sehingga didapatkan nilaisplit dari setiap atribut.
4. Lakukan perhitungan Prior Length (PL) dan Prior Right (PR).
5. Dari hasil menghitung PL dan PR bisa dilanjutkan untuk menghitung nilai
goodness
6. Setelah semua nilai goodness dihitung dari setiap cabang, kita mencari nilai
goodness yang paling besar .
7. Cek apakah semua atribut sudah dibentuk pada pohon. Jika belum, ulangi dari langkah ke 5
8. Generate pohon keputusan 9. Selesai.
Tabel 3. Contoh Implementasi bentuk_badan_
hukum kelompok_usaha Modal penjualan total_aset
menerima_ bantuan Perorangan Warung telekomunikasi modal
sendiri Mikro Mikro Tidak Koperasi
Warung telekomunikasi
modal
sendiri Mikro Mikro Tidak Firma
Warung telekomunikasi
modal
sendiri Mikro Mikro Tidak Perorangan
Warung telekomunikasi
modal
sendiri Mikro Kecil Ya
CV
Warung telekomunikasi
model pihak
lain Kecil Kecil Ya CV
Warung telekomunikasi
modal
sendiri Mikro Mikro Ya Ijin Khusus dari instansi terkait Warung telekomunikasi modal
sendiri Mikro Kecil Tidak Perorangan
Warung telekomunikasi
modal
sendiri Mikro Kecil Tidak
Perorangan Jasa telekomunkasi lainnya model pihak
lain Mikro Kecil Ya
Perorangan Jasa telekomunkasi lainnya
modal
sendiri Mikro Kecil Tidak Tabel 4. Daftar Calon Mutakhir
No Cabang Kiri Cabang Kanan 1 BBH = Perorangan
BBH = k , f , cv , ijin khusus dari instansi terkait
2 BBH = koperasi
BBH = p, f , cv , ijin khusus dari instansi terkait
3 BBH = Firma
BBH = k , p , cv , ijin khusus dari instansi terkait
4 BBH = CV
BBH = k , f , p , ijin khusus dari instansi terkait
5
BBH = ijin khusus dari instansi
terkait BBH = k , f , cv , p 6 KU = warung telekomunikasi KU = Jasa telekomunikasi 7 KU = Jasa telekomunikasi KU = Warung telekomunikasi 8 M = sendiri M = Pihak Lain
9 M= Pihak Lain M = sendiri 10 P = Mikro P = Kecil 11 P = Kecil P = Mikro 12 Ta = Mikro Ta = Kecil 13 Ta = Kecil Ta = Mikro
Kemudian dihitung nilai Candidate
split purity left PL dan purity right PR
menggunakan rumus yang sudah ditentukan.
Berikut adalah perhitungan dari tiap Candidate Split, PL, PR, P(j|tl), P(j|tr) yang
memungkinkan “ya” atau “tidak” dan perhitungan nilai kesesuaian (goodnees) pada atribut bentuk badan hukum.disajikan pada tabel 5,6,7. Tabel 5. Perhitungan PL, PR , Bentuk badan hukum Total Y T Jumlah Data PL PR Perorangan 5 2 3 10 0.5 0.5 Koperasi 1 0 1 10 0.1 0.9 Firma 1 0 1 10 0.1 0.9 CV 2 2 0 10 0.2 0.8 Ijin khusus instansi terkait 1 0 1 10 0.1 0.9
Tabel 6. perhitungan P(j|tl) dan P(j|tr) Bentuk badan hukum Y T Jumla h Data P(j|tl ) Y P(j|tl ) T P(j|tr ) Y P(j|tr ) T Peroranga n 2 3 10 0.4 0.6 0.4 0.6 Koperasi 0 1 10 0 1 0.44 4 0.55 5 Firma 0 1 10 0 1 0.44 4 0.55 5 CV 2 0 10 1 0 0.25 0.75 Ijin khusus instansi terkait 0 1 10 0 1 0.44 4 0.55 5
Tabel 7. kesesuaian calon cabang
Bentuk badan hokum 2(Pl Pr) Q(s|t) phi (s|t) Perorangan 0.5 0 0 Koperasi 0.18 0.888 0.16 Firma 0.18 0.888 0.16 CV 0.32 1.5 0.48 Ijin khusus instansi terkait 0.18 0.888 0.16
2.1. Hasil Mining
Proses mining data UMKM jasa telematika ini menggunakan algoritma CART dalam menentukan kelayakan badan usaha untuk menerima bantuan. Beberapa hasil percobaan dari penelitian ini dengan 2 skenario model yang berbeda agar dapat diketahui tingkat akurasi yang tercipta. Berikut di sajikan pada gambar 10, dan 11 :
Gambar 3. Chart Nilai Akurasi Data Latih dengan 2 model.
Gambar 4. Chart Nilai Akurasi Data Latih dengan 2 model
Berdasarkan Gambar 10,11 dapat disimpulkan bahwa model A dengan 21 atribut tetap adalah yang paling baik nilai akurasinya yaitu 62,21% pada data latih dan 73,97% pada data uji. sedangkan model B dengan 21 yang direduksi menghasilkan nilai akurasi yaitu 61,18%
pada data latih dan 63,92% pada data uji.Maka dipilihlah model B pada penelitian kali ini dengan akurasi yang paling tinggi.
3. Evaluasi Pola
Dalam evaluasi pola klasifikasi ini memakai confusion matrix dengan menggunakan persamaan (7) sebagai berikut :
3.1. Confusion Matrix Data Latih 21 Atribut Tetap
Gambar 5. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio
Dari Gambar 5 Diketahui :
a. True Positive (TP) = 2274 b. True Negative (TN) = 2105 c. False Positive (FP) = 1258 d. False Negative (FN) = 1401 e. Jumlah Data = 7038
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi yang dimiliki oleh klasifikasi ini adalah 62,21% sesuai data latih yang digunakan dengan jumlah 7038 data.
3.2. Confusion Matrix Data Latih 21 Atribut Reduksi
Gambar 6. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio
Dari Gambar 6 Diketahui :
a. True Positive (TP) = 2434 b. True Negative (TN) = 1872 c. False Positive (FP) = 1098 d. False Negative (FN) = 1634 e. Jumlah Data = 7038 60.00% 61.00% 62.00% 63.00% A B 21 (Tetap) 21 (Reduksi)
Akurasi Data Latih
Akurasi Model Atribut 50.00% 60.00% 70.00% 80.00% A B 21 (Tetap) 21 (Reduksi)
Akurasi Data Uji
Akurasi
Atribut Model
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi
yang dimiliki oleh klasifikasi ini adalah 61,18% sesuai data latih yang digunakan dengan jumlah 7038 data. 3.3. Confusion Matrix Data Uji 21
Atribut Tetap
Gambar 7. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio
Dari Gambar 7 Diketahui : a. True Positive (TP) = 678 b. True Negative (TN) = 324 c. False Positive (FP) = 237 d. False Negative (FN) = 221 e. Jumlah Data = 1760
Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi
yang dimiliki oleh klasifikasi ini adalah 73,97% sesuai data latih yang digunakan dengan jumlah 1760 data. 3.4. Confusion Matrix Data Uji 21
Atribut Reduksi
Gambar 8. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio
Dari Gambar 8 Diketahui :
a. True Positive (TP) = 766 b. True Negative (TN) = 359 c. False Positive (FP) = 149 d. False Negative (FN) = 486 e. Jumlah Data = 1760 Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi
yang dimiliki oleh klasifikasi ini adalah 61,93% sesuai data latih yang digunakan dengan jumlah 1760 data. 4. Presentasi Pengetahuan
Berikut ini adalah decission tree hasil dari skenario model yang dipilih sebelumnya yaitu dengan model 21 atribut tetap, disajikan pada gambar 9 :
Dari gambar 9 tersebut algoritma CART hanya mengeluarkan atribut yang paling mempengaruhi dalam klasifikasi pemberian bantuan pada UMKM. Atribut Menerima Pelatiahan terpilih sebagai noktah dasar. Kondisi ini sesuai dengan Kemenkop UKM apabila UMKM yang sudah melakukan pelatihan dengan benar akan menerima bantuan.
UMKM yang salah dalam mengikuti pelatihan akan di proses kembali berdasarkan Rencana, apabila UMKM telah mempunyai rencana maka akan di berikan bantuan. UMKM akan terus diproses berdasarkan noktah keputusan atribut seterusnya.
4.1. Tampilan Index / Halaman Utama Pada halaman ini berisi menu awal dalam sistem klasifikasi ini dimana kita bisa memulai klasifikasi bantuan usaha jasa telematika, berikut disajikan pada Gambar 10.
Gambar 10. Tampilan Index 4.2. Tampilan Login
Tampilan ini berfungsi sebagai autentikasi user yang berhak menghapus atau mengedit data yang ada pada web tersebut. Berikut disajikan pada Gambar 11.
Gambar 11. Tampilan Login
4.3. Form Klasifikasi
Pada tampilan ini berisi form isian data badan usaha yang akan diklasifikasi berikut dengan tombol klasifikasinya kemudian menghasilkan output berupa kelayakan badan usaha tersebut dalam menerima bantuan atau tidak, berikut disajikan pada Gambar 12 dan 13 untuk hasil keputusan.
Gambar 12. Tampilan Form Klasifikasi
4.4. Tampilan Data Klasifikasi
Pada tampilan ini berisi data yang telah masuk kedalam sistem klasifikasi yang telah di input sebelumnya dan bagi admin bisa langsung mengedit atau menghapus data tersebut. Berikut disajikan pada Gambar 14.
Gambar 14. Tampilan Data Klasifikasi KESIMPULAN
Klasifikasi bantuan UMKM jasa telematika Indonesia dengan menggunakan algoritma CART ini dibuat untuk mengetahui UMKM yang akan menerima bantuan atau tidak, dan juga untuk pengguna sistem ini mencakup admin staf kemenkop UKM mengetahui informasi data UMKM jasa telematika yang ada di Indonesia. klasifikasi ini diolah dalam
machine learning mengunakan aplikasi Rstudio, setelah menghasilkan pohon
keputusan lalu diimplementasikan memakai website yang dirancang menggunakan aplikasi Adobe Dreamweaver CS6 dengan bahasa pemograman PHP yang tersimpan pada
framework Yii untuk desain template
memakai Bootstrap dan database
menggunakan MySQL.
Tahap Implementasi dan pembuatan klasifikasi usaha jasa telematika ini dilakukan dari data susenas 2006. yang sebelumnya sudah dilakukan pembersihan data noise,integrasi data dari setiap data dan seleksi atribut yang di pilih menjadi 21 atribut oleh (Tosida et.al, 2015) yang masih dalam tahap visualisasi maka perlu dikembangkan untuk menunjang pemilihan dalam pemberian bantuan pada UMKM jasa telematika.sehingga dibuatlah
website klasifikasi ini dengan fitur yang
didalamnya berupa proses klasifikasi atribut menggunakan algoritma CART dan menampilkan decission tree untuk mengetahui UMKM yang layak diberi bantauan atau tidak .
Jumlah data keseluruhan yang di klasifikasikan adalah 8798 data. Data di bagi menjadi 2 yaitu 80% data latih dan 20% data uji. Dalam penelitian ini data menggunakan 2 model dengan 21 atribut tetap model (A) dan 21 atribut yang di reduksi model (B). Reduksi atribut merupakan penyederhanan rentang nilai yang ada pada setiap atribut, maka atribut yang memiliki nilai rentang yang banyak maka akan di reduksi menjadi lebih sederhana dan sedikit. hasil uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan confusion matrix dari proses mining yang membandingkan 2 skenario model.
DAFTAR PUSTAKA .
Fathurahman et al. 2014. Analisis Dan Implementasi Algoritma ID3 Dan CART Pada Penilaian Kinerja Pegawai. Fakultas Informatika, Universitas Telkom, Bandung.
Han et al. 2006. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc, San Francisco.
Hardiani, 2015. Implementasi Self
Organizing Maps (SOM) Untuk Clustering Usaha Jasa Telematika
Indonesia Menggunakan Matlab. Skripsi. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Pakuan, Bogor.
Larose, 2006. Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.
Saputro, D. 2010. Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Universitas Islam Syarief Hidayatullah, Jakarta Tosida et al , 2012. Strategi Peningkatan
Daya Saing Melalui Framework Rantai Nilai Untuk Kompetensi Usaha Jasa Telematika Indonesia. Program Studi Ilmu Komputer, FMIPA, Universitas Pakuan
Tosida, E. T. 2015. Pengembangan Model Data Mining Kelayakan Bantuan Usaha Bagi Usaha Mikro Kecil Menengah Jasa Telematika Indonesia. Tesis. Sekolah Pascasarjana Institut Pertanian Bogor, Bogor.
Winesett, J. 2012. Web Application
Development with Yii and PHP.
Packt Publishing, Birmingham, Inggris.