• Tidak ada hasil yang ditemukan

Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor

N/A
N/A
Protected

Academic year: 2021

Membagikan "Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor"

Copied!
11
0
0

Teks penuh

(1)

IMPLEMENTASI ALGORITMA CLASIFICATION AND REGRESSION TREE (CART) UNTUK KLASIFIKASI BANTUAN USAHA MIKRO KECIL MENENGAH

(UMKM) JASA TELEMATIKA INDONESIA Fadlan Amirudin, Eneng Tita Tosida,Irma Anggraeni.

Email : fadlanamirudin043@gmail.com

Program Studi Ilmu Komputer FMIPA Universitas Pakuan Bogor ABSTRAK

Telematika salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia. Berdasarkan hal tersebut akan dilakukan penelitian dan pengimplementasian untuk menentukan badan usaha jasa telematika yang layak menerima bantuan dari permenkop UKM dari data yang sesuai dari Susenas (Sensus Nasional) Badan Pusat Statistik 2006, dengan menerapkan algoritma CART yang merupakan salah satu algoritma data mining dalam pengolahan data yang menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, sehingga memudahkan permenkop dalam menentukan badan usaha yang layak menerima bantuan. Hasil penelitian uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan

confusion matrix dari proses mining yang membandingkan 2 skenario model.

Kata Kunci : UMKM, Telematika, Klasifikasi, Data Mining, Algoritma CART, PENDAHULUAN

Bidang telematika adalah salah satu bidang prioritas bagi pembangunan Indonesia. Oleh karena itu pemerintah terus melakukan berbagai upaya untuk meningkatkan daya saing bidang telematika, terutama dalam menghadapi perdagangan bebas lingkup Asia pada tahun 2015. Dasar penilitian ini bertujuan menentukan kelayakan UMKM untuk menerima bantuan atau tidak menerima bantuan dari Kemenkop UKM Indonesia. Beberapa penelitian terkait tentang kondisi telematika Indonesia baik berupa model klasifikasi usaha jasa telematika (Tosida et al. , 2012)

Penelitian yang relevan berkaitan dengan telematika telah dilakukan oleh peneliti terdahulu Hardiani, (2015), melakukan clustering usaha kecil menengah jasa telematika Indonesia sesuai dengan data Susenas (Sensus Nasional) Badan Pusat Statistik tahun 2006 yang

tersebar di seluruh wilayah provinsi, kabupaten atau kota di Indonesia. Selain itu Tosida et al.(2015) meneliti dan mengembangkan visualisasi data UMKM Jasa Telematika yang memiliki 8 atribut menjadi 21 atribut sesuai data Susenas tahun 2006. Berdasarkan dua penelitian tersebut sudah menghasilkan beberapa atribut namun belum ada atribut kelas yang telah ditentukan sehingga tidak bisa melakukan klasifikasi, maka dari itu perlu dikembangkan agar bisa menjadi machine

learning. Data penelitian ini sudah melalui

tahap praproses data sehingga data tersebut sudah bisa di ujicoba pada algoritma yang digunakan. Pengembangan yang akan dilakukan dari hasil kedua penelitian tersebut adalah menentukan atribut kelas dan menerapkan data pada algoritma CART.

Algoritma CART ini menggunakan pendekatan nonparametic yang tidak membutuhkan asumsi distribusi, lalu akan

(2)

mengidentifikasi variable secara otomatis yang berpengaruh dan mereduksi kompleksitas data, mudah dalam mengatasi data outlier, dan mudah dalam interpretasi. Untuk itu diterapkan algoritma CART dengan tujuan mampu menghasilkan klasifikasi berdasarkan informasi data yang ada.

Pembuatan sistem ini menggunakan

Adobe Dreamweaver cs6, perancangan

database menggunakan MySQL dan klasifikasi data menggunakan algoritma CART. Sistem ini ditujukan untuk mempermudah penentuan UMKM yang layak untuk diberikan bantuan dan juga dapat mudah dimengerti penggunaanya agar bisa digunakan sebaik mungkin.

Tujuan penelitian ini adalah mengimplementasikan algoritma CART untuk model klasifikasi pemberian bantuan UMKM Jasa Telematika Indonesia dengan menggunakan bahasa pemrograman R, PHP 5 dan database MySQL.

Penelitian tentang kredit Scoring juga telah dilakukan oleh Saputro, D (2010) dengan judul Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Di PT.X finance cabang mauk. Aplikasi ini memiliki tujuan adalah Membantu pihak kredit untuk mengetahui parameter dan klasifikasi kredit pada PT.X Finance.

Menurut Susanto dan Suryadi (2010), pada klasifikasi algoritma CART (Classification and Regression Trees), sebuah record akan diklasifikasikan ke dalam salah satu dari sekian klasifikasi yang tersedia pada variable tujuan berdasarkan nilai-nilai variabel prediktornya.Langkah-langkah Algoritma CART:

a. Susunlah calon cabang (candidate split) yang dilakukan terhadap seluruh variabel prediktor. Daftar yang berisi calon cabang disebut calon cabang mutakhir.

b.Berikan penilaian keseluruhan calon cabang mutakhir dengan menghitung besaran (s|t)

c.Tentukan cabang yang memiliki kesesuaian (s|t). Setelah noktah keputusan tidak ada lagi, algoritma CART dihentikan. Kesesuaian (goodness) (s|t) dari calon cabang s pada noktah keputusan t, didefiniskan sebagai persamaan – persamaan berikut :

( | ) LPRQ(s|t) …….. (1)

( | ) ∑ | ( | ) ( | )…... (2)

tl= Cabang kiri dari noktah keputusan t tr= Cabang kanan dari noktah keputusan t ………. (3)

( | ) …………. (4)

………….... (5)

( | ) ……..(6)

METODE PENELITIAN

Metode Peneitian yang diterapkan ini menggunakan tahapan data mining atau disebut juga Knowledge Discovery and

Data Mining (KDD) (Han et al .2006)

suatu rangkaian proses data mining dapat dibagi menjadi beberapa tahap yang diilustrasikan pada Gambar 1. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base.

Gambar 1. Tahap-Tahap Data Mining (Han et al.2006) CLEANING & INTEGRATION DATA MINING EVALUATION & PRESENTATION SELECTION & TRANSFORMATION KNOWLEDGE

(3)

Tahap-tahap data mining ada 5 yaitu : 1. Pembersihan data dan Integrasi

data (Cleaning And Integration

Data)

Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Hasil pembersihan data set usaha jasa telematika yang diperoleh dari Susenas tahun 2006 melalui pengisian data kosong dengan nilai mean (untuk data numerik), modus (untuk data kategorik), menghapus data yang tidak konsisten serta outlier sesuai dengan ketentuan (UU No 20 Tahun 2008) menyebabkan reduksi data dari 12541 menjadi 8798. (Tosida et al.2015)

2. Seleksi Data dan Transformasi data

(Data Selection and Data

Transformation)

Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal. (Tosida et al.2015)

3. Proses mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.Untuk proses mining menggunakan algoritma CART dalam menentukan keputusan kelayakan bantuan UMKM.

4. Evaluasi pola (pattern evaluation),

Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa

yang ada memang

tercapai.Evaluasi dari penelitian ini menggunakan confusion matrix. 5. Presentasi pengetahuan (knowledge

presentation)

Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data

mining. Dalam presentasi ini, hasil

berupa decission tree yang berisi beberapa kaidah dan rule yang akan diimplementasikan ke dalam bentuk sistem berbasis web.

HASIL DAN PEMBAHASAN Hasil

Hasil yang didapat dari penelitian ini adalah pembuatan sistem klasifikasi bantuan usaha jasa telematika di Indonesia dengan mengunakan fungsi algoritma CART yang digunakan dalam machine

learning pada aplikasi Rstudio, data di

olah menjadi 2 bagian yaitu data latih sebesar 80% dan data uji sebesar 20% dengan keseluruhan 8798 data, sehingga akan menghasilkan klasifikasi berupa pohon keputusan badan usaha yang layak atau tidak untuk menerima bantuan.

(4)

Setelah data selesai diolah dalam aplikasi Rstudio maka akan diimplementasikan dengan web yang dirangcang menggunakan adobe dreamweaver kemudian diterapkan dalam framework yii dan database dibuat dalam

aplikasi MySQL. Dalam web klasifikasi ini di bedakan menjadi 2 akses pengguna, yaitu penguna umum untuk melakukan klasifikasi informasi UMKM dan admin untuk mengolah data klasifikasi UMKM.

Pembahasan

1. Cleaning and Integration

Data untuk klasifikasi ini telah mengalami tahapan praproses data mining seperti pembersihan data dan integrasi data yang dilakukan penelitian sebelumnya oleh Tosida et al (2015).

2. Selection Data

Data set usaha Jasa Telematika diperoleh dari Susenas (Sensus Nasional) pada tahun 2006 terdiri dari 8798 UMKM Jasa Telematika dengan atribut sebanyak 21 atribut (4 atribut numerik dan 17 atribut kategorik).

Agar data lebih ringkas efektif dilakukan seleksi data yang tujuan lainnya juga untuk menentukan kelas kemudian dipilihlah atribut pernah menerima bantuan sebagai kelas. Berikut adalah deskripsi data yang telah dan diseleksi.

Tabel 1. Deskripsi Data UMKM Jasatelematika

No. Atribut Tipe Rentang Nilai

A. Keterangan Umum

1. Provinsi K 1. Jawa, 2. Sumatera, 3.Kalimantan, 4. Papua 5. Bali&Nusra 2. Pendidikan pemilik K 1. SMA sederajat 2. D4-S1atau lebih 3. D1-D3 4. < SMA

3. Bentuk badan hokum K

1. CV 2. Firma

3. Ijin Khusus Instansi 4. Koperasi

5. Perorangan 6. PT

7. Yayasan 4. Tahun Mulai Operasi K 1. ≤ 3 tahun 2. > 3 tahun

5. Pengguna computer K 1. Ya 2. Tidak

6. Pengguna internet K 1. Ya 2. Tidak

7. Kelompok Usaha K 1. Jasa telekomunikasi 2. Konsultasi Hardware 3. Konsultasi Software 4. Lainnya B. Finansial 1. Penjualan N 1. Mikro 2. Kecil 3. Menengah

2. Total asset N 1. Mikro

2. Kecil 3. Menengah

3. Modal K 1. Modal sendiri 2. Modal Pihak lain

4. tenaga kerja N 1. Kecil

2. Mikro 3. Menengah

(5)

Tabel 2. Atribut Kelas yang telah di seleksi

2. Proses Mining 2.1 Algortima CART

Data ini dimasukan kedalam proses

mining menggunakan algoritma CART

yang akan mengeluarkan hasil

decission tree. Data di bagi menjadi 2

yaitu data latih 80% yang nantinya dimasukan dalam proses mining dan data uji 20% digunakan sebagai validasi decission tree yang telah dibuat pola data aslinya. Berikut

flowchart untuk algoritma CART.

Gambar 2. Flowchart algoritma CART Fathurahman et.al 2014.

C. Kendala & Propek Usaha

1 Kesulitan K 1.bahan baku/barang dagangan 5. Pemasaran 2. BBM/energy 6. Permodalan 3. ketrampilan

tenaga kerja 7. Tidak ada kesulitan 4. Lainnya 8. Transportasi

9. Upah buruh

2 Koperasi K 1. Ya 2. Tidak

3 Kemitraan K 1. Ya 2. Tidak

4 Menerima pelatihan K 1. Ya 2. Tidak

5 Pemasaran K 1. Ekspor 3. Luar Provinsi 2. Kabupaten 4. Provinsi

6 Kondisi perusahaan 3 bulan lalu

K 1. Sama baik 4. Lebih buruk

2. Sama buruk 5. Tidak dapat dibandingkan

3. Lebih baik

7 Perkiraan prospek usaha 3 bln akan datang

K 1. Lebih baik 4. Sama buruk

2. Lebih buruk 5. Tidak dapat dibandingkan

3. Sama baik

8 Rencana

K 1. Tidak 4. Ya, meningkatkan keahlian

2. Ya,

Memperluas usaha 5. Ya,lainnya 3. Ya, membuka

cabang

No. Atribut Rentang Nilai

1 Menerima bantuan 1. Tidak Menerima Bantuan

(6)

Berikut merupakan penjelasan dari

flowchart algoritma CART untuk

membangun pohon keputusan : 1. Masukan data latih.

2. Tentukan calon cabang yang akan di bentuk (Kandidat Split).

3. Lakukan split pada data dan membuat interval sehingga didapatkan nilaisplit dari setiap atribut.

4. Lakukan perhitungan Prior Length (PL) dan Prior Right (PR).

5. Dari hasil menghitung PL dan PR bisa dilanjutkan untuk menghitung nilai

goodness

6. Setelah semua nilai goodness dihitung dari setiap cabang, kita mencari nilai

goodness yang paling besar .

7. Cek apakah semua atribut sudah dibentuk pada pohon. Jika belum, ulangi dari langkah ke 5

8. Generate pohon keputusan 9. Selesai.

Tabel 3. Contoh Implementasi bentuk_badan_

hukum kelompok_usaha Modal penjualan total_aset

menerima_ bantuan Perorangan Warung telekomunikasi modal

sendiri Mikro Mikro Tidak Koperasi

Warung telekomunikasi

modal

sendiri Mikro Mikro Tidak Firma

Warung telekomunikasi

modal

sendiri Mikro Mikro Tidak Perorangan

Warung telekomunikasi

modal

sendiri Mikro Kecil Ya

CV

Warung telekomunikasi

model pihak

lain Kecil Kecil Ya CV

Warung telekomunikasi

modal

sendiri Mikro Mikro Ya Ijin Khusus dari instansi terkait Warung telekomunikasi modal

sendiri Mikro Kecil Tidak Perorangan

Warung telekomunikasi

modal

sendiri Mikro Kecil Tidak

Perorangan Jasa telekomunkasi lainnya model pihak

lain Mikro Kecil Ya

Perorangan Jasa telekomunkasi lainnya

modal

sendiri Mikro Kecil Tidak Tabel 4. Daftar Calon Mutakhir

No Cabang Kiri Cabang Kanan 1 BBH = Perorangan

BBH = k , f , cv , ijin khusus dari instansi terkait

2 BBH = koperasi

BBH = p, f , cv , ijin khusus dari instansi terkait

3 BBH = Firma

BBH = k , p , cv , ijin khusus dari instansi terkait

4 BBH = CV

BBH = k , f , p , ijin khusus dari instansi terkait

5

BBH = ijin khusus dari instansi

terkait BBH = k , f , cv , p 6 KU = warung telekomunikasi KU = Jasa telekomunikasi 7 KU = Jasa telekomunikasi KU = Warung telekomunikasi 8 M = sendiri M = Pihak Lain

9 M= Pihak Lain M = sendiri 10 P = Mikro P = Kecil 11 P = Kecil P = Mikro 12 Ta = Mikro Ta = Kecil 13 Ta = Kecil Ta = Mikro

Kemudian dihitung nilai Candidate

split purity left PL dan purity right PR

menggunakan rumus yang sudah ditentukan.

Berikut adalah perhitungan dari tiap Candidate Split, PL, PR, P(j|tl), P(j|tr) yang

memungkinkan “ya” atau “tidak” dan perhitungan nilai kesesuaian (goodnees) pada atribut bentuk badan hukum.disajikan pada tabel 5,6,7. Tabel 5. Perhitungan PL, PR , Bentuk badan hukum Total Y T Jumlah Data PL PR Perorangan 5 2 3 10 0.5 0.5 Koperasi 1 0 1 10 0.1 0.9 Firma 1 0 1 10 0.1 0.9 CV 2 2 0 10 0.2 0.8 Ijin khusus instansi terkait 1 0 1 10 0.1 0.9

Tabel 6. perhitungan P(j|tl) dan P(j|tr) Bentuk badan hukum Y T Jumla h Data P(j|tl ) Y P(j|tl ) T P(j|tr ) Y P(j|tr ) T Peroranga n 2 3 10 0.4 0.6 0.4 0.6 Koperasi 0 1 10 0 1 0.44 4 0.55 5 Firma 0 1 10 0 1 0.44 4 0.55 5 CV 2 0 10 1 0 0.25 0.75 Ijin khusus instansi terkait 0 1 10 0 1 0.44 4 0.55 5

Tabel 7. kesesuaian calon cabang

Bentuk badan hokum 2(Pl Pr) Q(s|t) phi (s|t) Perorangan 0.5 0 0 Koperasi 0.18 0.888 0.16 Firma 0.18 0.888 0.16 CV 0.32 1.5 0.48 Ijin khusus instansi terkait 0.18 0.888 0.16

(7)

2.1. Hasil Mining

Proses mining data UMKM jasa telematika ini menggunakan algoritma CART dalam menentukan kelayakan badan usaha untuk menerima bantuan. Beberapa hasil percobaan dari penelitian ini dengan 2 skenario model yang berbeda agar dapat diketahui tingkat akurasi yang tercipta. Berikut di sajikan pada gambar 10, dan 11 :

Gambar 3. Chart Nilai Akurasi Data Latih dengan 2 model.

Gambar 4. Chart Nilai Akurasi Data Latih dengan 2 model

Berdasarkan Gambar 10,11 dapat disimpulkan bahwa model A dengan 21 atribut tetap adalah yang paling baik nilai akurasinya yaitu 62,21% pada data latih dan 73,97% pada data uji. sedangkan model B dengan 21 yang direduksi menghasilkan nilai akurasi yaitu 61,18%

pada data latih dan 63,92% pada data uji.Maka dipilihlah model B pada penelitian kali ini dengan akurasi yang paling tinggi.

3. Evaluasi Pola

Dalam evaluasi pola klasifikasi ini memakai confusion matrix dengan menggunakan persamaan (7) sebagai berikut :

3.1. Confusion Matrix Data Latih 21 Atribut Tetap

Gambar 5. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio

Dari Gambar 5 Diketahui :

a. True Positive (TP) = 2274 b. True Negative (TN) = 2105 c. False Positive (FP) = 1258 d. False Negative (FN) = 1401 e. Jumlah Data = 7038

Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi yang dimiliki oleh klasifikasi ini adalah 62,21% sesuai data latih yang digunakan dengan jumlah 7038 data.

3.2. Confusion Matrix Data Latih 21 Atribut Reduksi

Gambar 6. Hasil Summary Data Latih Menggunakan Aplikasi Rstudio

Dari Gambar 6 Diketahui :

a. True Positive (TP) = 2434 b. True Negative (TN) = 1872 c. False Positive (FP) = 1098 d. False Negative (FN) = 1634 e. Jumlah Data = 7038 60.00% 61.00% 62.00% 63.00% A B 21 (Tetap) 21 (Reduksi)

Akurasi Data Latih

Akurasi Model Atribut 50.00% 60.00% 70.00% 80.00% A B 21 (Tetap) 21 (Reduksi)

Akurasi Data Uji

Akurasi

Atribut Model

(8)

Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi

yang dimiliki oleh klasifikasi ini adalah 61,18% sesuai data latih yang digunakan dengan jumlah 7038 data. 3.3. Confusion Matrix Data Uji 21

Atribut Tetap

Gambar 7. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio

Dari Gambar 7 Diketahui : a. True Positive (TP) = 678 b. True Negative (TN) = 324 c. False Positive (FP) = 237 d. False Negative (FN) = 221 e. Jumlah Data = 1760

Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi

yang dimiliki oleh klasifikasi ini adalah 73,97% sesuai data latih yang digunakan dengan jumlah 1760 data. 3.4. Confusion Matrix Data Uji 21

Atribut Reduksi

Gambar 8. Hasil Summary Data Uji Menggunakan Aplikasi Rstudio

Dari Gambar 8 Diketahui :

a. True Positive (TP) = 766 b. True Negative (TN) = 359 c. False Positive (FP) = 149 d. False Negative (FN) = 486 e. Jumlah Data = 1760 Dari perhitungan Confusion matrix tersebut bahwa tingkat akurasi

yang dimiliki oleh klasifikasi ini adalah 61,93% sesuai data latih yang digunakan dengan jumlah 1760 data. 4. Presentasi Pengetahuan

Berikut ini adalah decission tree hasil dari skenario model yang dipilih sebelumnya yaitu dengan model 21 atribut tetap, disajikan pada gambar 9 :

(9)

Dari gambar 9 tersebut algoritma CART hanya mengeluarkan atribut yang paling mempengaruhi dalam klasifikasi pemberian bantuan pada UMKM. Atribut Menerima Pelatiahan terpilih sebagai noktah dasar. Kondisi ini sesuai dengan Kemenkop UKM apabila UMKM yang sudah melakukan pelatihan dengan benar akan menerima bantuan.

UMKM yang salah dalam mengikuti pelatihan akan di proses kembali berdasarkan Rencana, apabila UMKM telah mempunyai rencana maka akan di berikan bantuan. UMKM akan terus diproses berdasarkan noktah keputusan atribut seterusnya.

4.1. Tampilan Index / Halaman Utama Pada halaman ini berisi menu awal dalam sistem klasifikasi ini dimana kita bisa memulai klasifikasi bantuan usaha jasa telematika, berikut disajikan pada Gambar 10.

Gambar 10. Tampilan Index 4.2. Tampilan Login

Tampilan ini berfungsi sebagai autentikasi user yang berhak menghapus atau mengedit data yang ada pada web tersebut. Berikut disajikan pada Gambar 11.

Gambar 11. Tampilan Login

4.3. Form Klasifikasi

Pada tampilan ini berisi form isian data badan usaha yang akan diklasifikasi berikut dengan tombol klasifikasinya kemudian menghasilkan output berupa kelayakan badan usaha tersebut dalam menerima bantuan atau tidak, berikut disajikan pada Gambar 12 dan 13 untuk hasil keputusan.

Gambar 12. Tampilan Form Klasifikasi

(10)

4.4. Tampilan Data Klasifikasi

Pada tampilan ini berisi data yang telah masuk kedalam sistem klasifikasi yang telah di input sebelumnya dan bagi admin bisa langsung mengedit atau menghapus data tersebut. Berikut disajikan pada Gambar 14.

Gambar 14. Tampilan Data Klasifikasi KESIMPULAN

Klasifikasi bantuan UMKM jasa telematika Indonesia dengan menggunakan algoritma CART ini dibuat untuk mengetahui UMKM yang akan menerima bantuan atau tidak, dan juga untuk pengguna sistem ini mencakup admin staf kemenkop UKM mengetahui informasi data UMKM jasa telematika yang ada di Indonesia. klasifikasi ini diolah dalam

machine learning mengunakan aplikasi Rstudio, setelah menghasilkan pohon

keputusan lalu diimplementasikan memakai website yang dirancang menggunakan aplikasi Adobe Dreamweaver CS6 dengan bahasa pemograman PHP yang tersimpan pada

framework Yii untuk desain template

memakai Bootstrap dan database

menggunakan MySQL.

Tahap Implementasi dan pembuatan klasifikasi usaha jasa telematika ini dilakukan dari data susenas 2006. yang sebelumnya sudah dilakukan pembersihan data noise,integrasi data dari setiap data dan seleksi atribut yang di pilih menjadi 21 atribut oleh (Tosida et.al, 2015) yang masih dalam tahap visualisasi maka perlu dikembangkan untuk menunjang pemilihan dalam pemberian bantuan pada UMKM jasa telematika.sehingga dibuatlah

website klasifikasi ini dengan fitur yang

didalamnya berupa proses klasifikasi atribut menggunakan algoritma CART dan menampilkan decission tree untuk mengetahui UMKM yang layak diberi bantauan atau tidak .

Jumlah data keseluruhan yang di klasifikasikan adalah 8798 data. Data di bagi menjadi 2 yaitu 80% data latih dan 20% data uji. Dalam penelitian ini data menggunakan 2 model dengan 21 atribut tetap model (A) dan 21 atribut yang di reduksi model (B). Reduksi atribut merupakan penyederhanan rentang nilai yang ada pada setiap atribut, maka atribut yang memiliki nilai rentang yang banyak maka akan di reduksi menjadi lebih sederhana dan sedikit. hasil uji coba validasi berdasarkan confusion matrix algoritma CART ini mencapai 62% data latih dan 73% data uji dengan model (A). 61% data latih dan 63% data uji dengan model (B). Maka dipilihlah model (A) dengan 21 atribut tetap untuk implementasinya karena memiliki nilai akurasi lebih tinggi berdasarkan perhitungan confusion matrix dari proses mining yang membandingkan 2 skenario model.

DAFTAR PUSTAKA .

Fathurahman et al. 2014. Analisis Dan Implementasi Algoritma ID3 Dan CART Pada Penilaian Kinerja Pegawai. Fakultas Informatika, Universitas Telkom, Bandung.

(11)

Han et al. 2006. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc, San Francisco.

Hardiani, 2015. Implementasi Self

Organizing Maps (SOM) Untuk Clustering Usaha Jasa Telematika

Indonesia Menggunakan Matlab. Skripsi. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Pakuan, Bogor.

Larose, 2006. Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.

Saputro, D. 2010. Model kredit Scoring untuk proses analisa kelayakan fasilitas kredit motor menggunakan metode classification and regression tree (Cart). Universitas Islam Syarief Hidayatullah, Jakarta Tosida et al , 2012. Strategi Peningkatan

Daya Saing Melalui Framework Rantai Nilai Untuk Kompetensi Usaha Jasa Telematika Indonesia. Program Studi Ilmu Komputer, FMIPA, Universitas Pakuan

Tosida, E. T. 2015. Pengembangan Model Data Mining Kelayakan Bantuan Usaha Bagi Usaha Mikro Kecil Menengah Jasa Telematika Indonesia. Tesis. Sekolah Pascasarjana Institut Pertanian Bogor, Bogor.

Winesett, J. 2012. Web Application

Development with Yii and PHP.

Packt Publishing, Birmingham, Inggris.

Gambar

Gambar 1. Tahap-Tahap Data Mining  (Han et al.2006) CLEANING &amp; INTEGRATION  DATA MINING EVALUATION &amp; PRESENTATION SELECTION &amp; TRANSFORMATION KNOWLEDGE
Tabel 1. Deskripsi Data UMKM Jasatelematika
Tabel 2. Atribut Kelas yang telah di seleksi
Tabel  4. Daftar Calon Mutakhir
+5

Referensi

Dokumen terkait

Paulus melihat bahwa banyak sekali bangsa Israel tidak memandang penting keistimewaan mereka sebagai umat, padahal sesungguhnya dengan sedikit kesadaran saja hal ini

Survey tentang motivasi dan paritas ibu hamil, terhadap 8 orang ibu hamil yang tidak memeriksakan kehamilannya, mengatakan bahwa kehamilan dan persalinan

Sebaliknya deflasi terbesar terjadi di Kota Sibolga sebesar 1,85 persen diikuti Kota Ternate dan Tual Ambon dengan deflasi sebesar 1,58 persen dan 1,41 persen,

Metode harga pokok proses adalah cara pengumpulan harga pokok produksi yang membedakan biaya produksi dan membaginya sama rata pada produk yang dihasilkan pada

6 Belum lama sudah tampak indah, rumah abdi tukang jala, ditempatkan di tepi berjajar, pepohonan berjajar, tidak jauh dari sungai, tampak jelas tidak tertutup,

Berdasarkan hasil analisis data mengenai pengaruh gaji, fasilitas dan tunjangan terhadap kinerja karyawan, maka dapat diambil kesimpulan bahwa gaji dengan nilai t

Karakter tersebut adalah warna antosianin pada telinga daun (auricle), perilaku helai daun pada pengamatan awal dan akhir, warna antosianin di bawah apex (pengamatan awal),

Krisis ekonomi yang melanda Indonesia sejak pertengahan tahun 1997 telah menyebabkan bertambahnya penduduk yang hidup di bawah garis kemiskinan, padahal sebelum