• Tidak ada hasil yang ditemukan

IMPLEMENTASIALGORITMA CLASIFICATION ANDREGRESSION TREES (CART) DALAM KLASIFIKASI EKONOMI KELUARGA PADA DESADAGANG KELAMBIR TG.

N/A
N/A
Protected

Academic year: 2021

Membagikan "IMPLEMENTASIALGORITMA CLASIFICATION ANDREGRESSION TREES (CART) DALAM KLASIFIKASI EKONOMI KELUARGA PADA DESADAGANG KELAMBIR TG."

Copied!
7
0
0

Teks penuh

(1)

66

IMPLEMENTASIALGORITMA CLASIFICATION ANDREGRESSION

TREES (CART) DALAM KLASIFIKASI EKONOMI KELUARGA

PADA DESADAGANG KELAMBIR TG. MORAWA

Eti Yonika Sri Ritno1, Nelly Astuti Hasibuan2, Fadlina3 1Mahasiswa Teknik Informatika STMIK Budi Darma

23Dosen STMIK Budi Darma

Jl. Sisingamangaraja No. 338 Simpang Limun, Medan

ABSTRAK

Ekonomi merupakan tingkahlaku manusia secara individu atau bersama-sama dalam menggunakan faktor-yang mereka butuhkan. Adapun keluarga adalah suatu satuan kekerabatan yang juga merupakan satuan tempat yang ditandai oleh adannya kerja sama ekonomi dan mempunyai fungsi untuk berkehidupan, bersosialisasi atau mendidik anak dan menolong serta melindungi yang lemah. Jadi, Ekonomi keluarga adalah suatu kajian tentang upaya manusia dalam memenuhi kebutuhan-kebutuhannya melalui aktivitas-aktivitas yang dilakukan oleh seseorang yang bertanggung jawab atas kebutuhan dan kebahagiaan bagi kehidupannya. Data mining adalah proses mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar.Datamining dapat meningkatkan nilai tambah suatu database. Salah satu algoritma dalam Data Mining adalah Algoritma Clasification And Regression Trees (CART) merupakan salah satu metode atau algoritma dari salah satu teknik eksplorasi data yaitu teknik pohon keputusan. CART terbilang sederhana namun merupakan metode yang kuat. CART bertujuan untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian. selain itu CART digunakan untuk menggambarkan hubungan antara variabel respon (variabel dependen atau tak bebas) dengan satu atau lebih variabel prediktor (variabel independen atau bebas). Dengan penggunaan tools weka, hasil dari proses penerapanAlgoritma Clasification And Regression Trees (CART)adalah informasi atau knowledge dimana informasi tersebut dapat menjadi alternatif yang dapat digunakan oleh pegawai kantor kepala desa dalam mengklasifikasikan ekonomi keluarga.

Kata kunci: Klasifikasi, Ekonomi Keluarga, Data Mining, CART, Weka 3.8.1

I. PENDAHULUAN

Keadaan ekonomi setiap orang berbeda-beda dan bertingkat, ada yang keadaan ekonominya tinggi, sedang, dan rendah. Sosial ekonomi juga menentukan kedudukan atau posisi seseorang dalam kelompok manusia yang ditentukan oleh jenis aktivitas ekonomi, pendapatan, tingkat pendidikan, jenis rumah tinggal, dan jabatan. Pendataan ekonomi keluarga dapat dilakukan dengan menggunakan data pengeluaran sebagai pendekatan pendapatan rumah tangga. Kemudian data pengeluaran ini diperbandingkan dengan suatu batas nilai tukar rupiah yang diperlukan untuk memenuhi kebutuhan hidup minimum. Biasanya pada suatu desa tempat pendataannya adalah Kantor Kepala Desa. Kantor Kepala Desa merupakan suatu instansi yang melakukan pendataan kependudukan terutama pendataan Kartu Tanda Penduduk (KTP), Kartu Keluarga (KK), Surat Kelahiran, Surat Kematian, dan Surat Keterangan Pindah, dan juga instansi yang merekap setiap ekonomi keluarga, baik ekonomi keluarga rendah, sedang, dan tinggi dari setiap dusun di desa

Data mining adalah penyaringan data secara implisit dimana sebelumnya tidak diketahui terdapatnya informasi yang potensial, data mining menganalisis data menggunakan tools untuk menemukan pola dan aturan dalam himpunan data, banyak Algoritma kalsifikasi dalam metode data mining salah satunya adalah Algoritma CART (Classification and Regression Trees).

Algoritma CART (Classification and Regression Trees) merupakan salah satu metode atau algoritma dari teknik eksplorasi data yaitu teknik pohon keputusan, CART terbilang sederhana namun merupakan metode yang kuat. Berdasarkan penelitian sebelumnya yang dilakukan oleh Muhammad Faisal Amin menyimpulkan bahwa Algoritma CART (Classification and Regression Trees) algoritma cart terbukti cukup akurat dalam memprediksi kelulusan mahasiswa. Model pohon keputusan ini akan membantu Karyawan dalam mengambil keputusan yang lebih tepat dan cepat [13].

II. TEORITIS A. Data Mining

Data Mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam database. proses yang menggunakan tehnik statistik, matematika, kecerdasan buatan, dan mechine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar[1]. Kemajuan luar biasa yang terus berlanjut dalam bidang data mining didorong oleh beberapa faktor [1] antara lain: 1. Pertumbuhan yang cepat dalam kumpulan data. 2. Penyimpanan data dalam warehouse, sehingga seluruh perusahaan memiliki akses kedalam database yang handal.

3. Adanya peningkatan akses data melalui navigasi web dan internet.

(2)

67

4. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi. 5. Perkembangan teknologi perangkat lunak untuk

data mining (ketersediaan teknologi).

6. Perkembangan yang hebat dalam kemampuan komputasi dan pengembangan kapasitas media penyimpanan.

B. Pengertian Klasifikasi

Klasifikasi pertama kali diterapkan pada bidang tanaman yang mengklasifikasikan suatu spesies tertentu, seperti yang dilakukan oleh Carolus Von Linne (atau dikenal dengan nama Carolus Linnaeus) yang pertama kali mengklasifikasikan spesies berdasarkan karakteristik fisik [5].

Klasifikasi juga merupakan suatu pekerjaan yang menilai objek data untuk memasukkannya kedalam kelas dari sejumlah kelas yang tersedia. Dalam klasifikasi ada pekerjaan utama yang dilakukan, [2] yaitu:

1. Pembanguna model sebagai prototipe untuk disimpan sebagai memori.

2. Penggunaan model tersebut untuk melakukan pengenalan/klasifikasi/prediksi pada suatu objek data lain agar diketahui dikelas mana objek data tersebut dalam model yang sudah disimpannya.

C. Algoritma Clasification and Regression Tress (CART)

Pohon keputusan merupakan teknik yang paling efisien. Ibaratnya, kita menyaring sesuatu lewat pohon keputusan, apakah suatu data lolos atau tidak terhadap saringan kita dengan proses yang cukup cepat. Teknik regresi sangat banyak, tetapi yang paling terkenal adalah algoritma yang diperkenalkan oleh Prof. Briemann dengan istilah The Clasification and Regression Tree (CART) [5]. Ada beberapa langkah-langkah yang terdapat pada algoritma CART [6] adalah sebagai berikut:

1. Susunlah calon cabang (candidate split), penyusunan ini dilakukan terhadap seluruh variabel prediktor secara lengkap (exhaustive).

2. Menilai kinerja keseluruhan calon cabang yang ada pada daftar calon cabang mutakhir dengan jalan menghitung nilai besaran kesesuaian,

(

s

|

t

)

, Kesesuaian dari calon cabang s pada noktah keputusan t dilambagkan dengan

(

s

|

t

)

dan didefinisikan sebagai berikut.

a. Persamaan 1 ɸ(s|t) = 2PLPR ∑ |𝑃(𝑗|𝑡𝐿) − jumlah 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖 𝑗=𝑖 𝑃(𝑗|𝑡𝑅)| b. Persamaan 2

t L = calon cabang kiri dari noktah keputusan t

c. Persamaan 3

t R = calon cabang kanan dari noktah keputusan t

d. Persamaan 4

=

L

P

jumlah catatan pada calon cabang kiri

t

L Jumlah catatan pada data latihan

e. Persamaan 5

=

R

P

jumlah catatan pada calon cabang kanan

t

R Jumlah catatan pada data latihan

f. Persamaan 6

=

)

|

(

j

t

L

P

jumlah catatan pada berkategori j pada calon cabang kiri

L

t

Jumlah catatan pada data latihan g. Persamaan 7

=

)

|

(

j

tR

P

jumlah catatan pada berkategori j pada calon cabang kanan

tr

Jumlah catatan pada data latihan h. Persamaan 8 ɸ(s|t) = ∑jumlah 𝑘𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑗=𝑖 |𝑃(𝑗|𝑡𝐿) − 𝑃(𝑗|𝑡𝑅)| i. Persamaan 9

ɸ(s|t) = 2P

L

P

R

ɸP(s|t)

III. ANALISA A. Analisa Masalah

Dengan studi kasus pada Dusun IV Desa Dagang Kelambir, dalam mengklasifikasikan ekonomi keluarga melalui data-data yang sudah ada. Data-data yang menjadi pokok pembahasan adalah data-data warga dusun IV Dagang Kelambir tahun 2012 yang diperoleh dari Administrasi Kantor Kepala Desa Dagang Kelambir Tg.Morawa, yang diolah dengan Algoritma CART dengan tujuan agar dapat mengetahui klasifikasi ekonomi keluarga yang berhak menerima program bantuan. Dalam pembahasan ini adapun syarat untuk menentukan klasifikasi tinggi, dan sedang yaitu rendah dengan menentukan pendapatan/bulan kepala keluarga, pekerjaan kepala keluarga, dan status rumah tinggal. Berikut merupakan Tabel 3.1 dengan data yang sudah di rubah atau sudah ditransformasi

Tabel 1. Daftar Warga Tahun 2012

Pekerjaan Jumlah Anggota Keluarga Pendapat an/bln Status Rumah Tinggal Klasifikasi Karyawan 3 Orang ≤4.500. 000 Milik Sendiri Tinggi Wiraswasta 4 Orang ≤2.200. 000 Sewa Rendah Wiraswasta 6 Orang ≤3.300. 000 Sewa Rendah Wiraswasta 9 Orang ≤3.300. 000 Milik Sendiri Sedang

(3)

68 Buruh 7 Orang ≤1.800. 000 Sewa Rendah Pedagang 3 Orang ≤3.500. 000 Sewa Rendah Karyawan 6 Orang ≤4.500. 000 Milik Sendiri Tinggi Wiraswasta 5 Orang ≤2.200. 000 Milik Sendiri Sedang Karyawan 5 Orang ≤4.500. 000 Milik Sendiri Tinggi Pedagang 5 Orang ≤2.500. 000 Milik Sendiri Rendah Buruh 7 Orang ≤1.800. 000 Sewa Rendah Karyawan 3 Orang ≤3.500. 000 Sewa Rendah Petani 3 Orang ≤2.200. 000 Milik Sendiri Rendah Pedagang 4 Orang ≤3.500. 000 Milik Sendiri Tinggi Buruh 6 Orang ≤1.800. 000 Milik Sendiri Sedang Buruh 3 Orang ≤1.800. 000 Milik Sendiri Sedang Wiraswasta 4 Orang ≤3.300. 000 Milik Sendiri Tinggi Wiraswasta 3 Orang ≤3.300. 000 Sewa Sedang Buruh 7 Orang ≤1.800. 000 Sewa Rendah Buruh 8 Orang ≤1.800. 000 Sewa Rendah Pedagang 5 Orang ≤3.500. 000 Sewa Rendah Buruh 4 Orang ≤1.800. 000 Sewa Rendah Wiraswasta 6 Orang ≤2.200. 000 Sewa Rendah Buruh 4 Orang ≤1.800. 000 Sewa Rendah Buruh 5 Orang ≤1.800. 000 Sewa Rendah Buruh 3 Orang ≤1.800. 000 Milik Sendiri Sedang Supir 3 Orang ≤20.00. 000 Milik Sendiri Rendah Petani 4 Orang ≤1.800. 000 Sewa Rendah Wiraswasta 5 Orang ≤2.200. 000 Sewa Rendah Petani 3 Orang ≤1.800. 000 Milik Sendiri Rendah Pedagang 6 Orang ≤3.500. 000 Milik Sendiri Sedang Pedagang 8 Orang ≤3.500. 000 Sewa Rendah Pedagang 5 Orang ≤2.500. 000 Milik Sendiri Sedang Supir 4 Orang ≤2.000. 000 Sewa Rendah Pedagang 8 Orang ≤2.500. 000 Sewa Rendah Petani 3 Orang ≤1.800. 000 Sewa Rendah Supir 6 Orang ≤2.000. 000 Sewa Sedang Wiraswasta 5 Orang ≤2.200. 000 Sewa Rendah Pedagang 3 Orang ≤2.500. 000 Milik Sendiri Sedang Buruh 6 Orang ≤1.800. 000 Sewa Rendah Pedagang 3 Orang ≤3.500. 000 Milik Sendiri Sedang Pedagang 4 Orang ≤2.500. 000 Sewa Rendah Pedagang 6 Orang ≤2.500. 000 Milik Sendiri Sedang Supir 5 Orang ≤2.000. 000 Sewa Rendah Buruh 5 Orang ≤1.800. 000 Sewa Rendah

Sumber : Arsip Kantor Kepala Desa

Berdasarkan semua data diatas, maka dilakukan pengklasifikasian dengan Algoritma CART, berikut langkah-langkah penyelesaiannya:

1. Menyusun Calon Cabang (Candidate Splite) penyusunan ini dilakukan terhadap seluruh variabel prediktor secara lengkap (exhaustive). Daftar yang berisi calon cabang disebut daftar calon cabang mutakhir.

Pembuatan calon cabang akan selalu patuh pada ciri khas Algoritma CART, yaitu adanya noktah keputusan yang selalu bercabang dua atau biner. Calon cabang untuk variabel prediktor pekerjaan adalah sebagai berikut:

a. Pekerjaan = Karyawan, dan Pekerjaan = (Wiraswasta, Pedagang, Buruh, Petani, Supir)

b. Pekerjaan = Wiraswasta, dan Pekerjaan = (Karyawan, Pedagang, Buruh, petani, Supir)

c. Pekerjaan = Pedagang, dan Pekerjaan = (Karyawan, Wiraswasta, Buruh, petani, Supir)

d. Pekerjaan =Buruh, dan Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Petani, Supir)

e. Pekerjaan = Petani, dan Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Buruh, Supir)

f. Pekerjaan = Supir, dan Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Buruh, Petani).

Pada variabel prediktor pendapatan yang sifatnya numerik, calon cabang yang dapat diusulkan adalah sebagai berikut:

a. Pendapatan ≤ 1.800.000-, dan Pendapatan > 1.800.000-,

b. Pendapatan ≤ 2.500.000-, dan Pendapatan > 2.500.000-,

c. Pendapatan ≤ 4.500.000-, dan Pendapatan > 4.500.000-,

Calon cabang untuk variabel prediktor status rumah tinggal adalah sebagai berikut:

a. Status rumah tinggal = Milik Sendiri, dan Status rumah tinggal = Sewa

b. Status rumah tinggal = Sewa, dan Status rumah tinggal = Milik sendiri

Mengingat ciri khas AlgoritmaCART yang setiap noktah keputusannya adalah bercabang biner, maka calon cabang akan diberi nama calon cabang kiri dan calon cabang kanan.

(4)

69

Tabel 2. Daftar Calon Cabang Mutakhir

Nomor Calon cabang

Calon cabang kiri Calon cabang kanan

1 Pekerjaan = Karyawan

Pekerjaan = (Wiraswasta, Pedagang, Buruh, Petani,

Supir) 2 Pekerjaan = Wiraswasta Pekerjaan = (Karyawan, Pedagang, Buruh, Supir), 3 Pekerjaan = Pedagang Pekerjaan = (Karyawan, Wiraswasta, Buruh, Petani,

Supir) 4 Pekerjaan = Buruh Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Petani Supir) 5 Pekerjaan = Petani Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Buruh, Supir) 6 Pekerjaan = Supir Pekerjaan = (Karyawan, Wiraswasta, Pedagang, Buruh, Petani) 7 Pendapatan ≤ 1.800.000 Pendapatan > 1.800.000-, 8 Pendapatan ≤ 2.500.000-, Pendapatan > 2.500.000-, 9 Pendapatan ≤ 4.500.000-, Pendapatan > 4.500.000-, 10 Jenis Rumah tinggal

= Milik sendiri

Jenis Rumah tinggal = sewa, Milik Sendiri 11 Jenis Rumah tinggal

= Sewa

Jenis Rumah tinggal = Milik sendiri, Sewa

2. Menilai kinerja keseluruhan calon cabang yang ada pada daftar calon cabang mutakhir dengan jalan menghitung nilai besaran kesesuaian

)

|

(

s

t

, yang terdapat pada rumus 3.1. Hasil perhitungan nilai kesesuaian bagi tiap calon cabang yang masih terdapat dalam daftar calon cabang mutakhir dihitung kembali menggunakan rumus 3.9

Tabel 3. Perhitungan nilai kesesuain untuk calon cabang 1-11 iterasi-1 L

P

P

R Rumah Status Tinggal P(j |tL) (PJ|tR ) 2P LP R Q(s|t ) ɸ(s|t) 4/45 = 0.0 88 41/4 5= 0.9 11 Tinggi 3/4 = 0.7 5 2/41 = 0.04 8 0.16 0 1.40 2 0.22 43 Sedang 0 12/41 = 0.29 2 Rendah 1/4 = 0.2 5 27/41 = 0.65 8 9/45 = 0.2 36/4 5= 0.8 Tinggi 1/9 = 0.1 11 4/36 = 0.11 1 0.32 0.19 5 0.06 24 Sedang 2/9 = 9/36 = 0.25 0.2 22 Rendah 6/9 = 0.6 66 23/36 = 0.63 8 12/4 5 = 0.2 66 33/4 5= 0.7 33 Tinggi 1/12 = 0.0 83 4/33 = 0.12 1 0.38 9 0.18 9 0.07 35 Sedang 4/12 = 0.3 33 7/33 = 0.21 2 Rendah 8/12 = 0.6 66 21/33 = 0.63 6 12/4 5 = 0.2 66 33/4 5= 0.7 33 Tinggi 0 5/33 = 0.15 1 0.38 9 0.30 9 0.12 02 Sedang 3/12 = 0.2 5 8/33 = 0.24 2 Rendah 9/12 = 0.7 5 20/33 = 0.60 6 4/45 = 0.0 88 41/4 5= 0.9 11 Tinggi 0 5/41 = 0.12 1 0.16 0 0.78 0.12 48 Sedang 0 11/41 = 0.26 8 Rendah 4/4 = 1 25/41 = 0.60 9 4/45 = 0.0 88 41/4 5= 0.9 11 Tinggi 0 5/41 = 0.15 1 0.16 0 0.24 4 0.03 90 Sedang 1/4 = 0.2 5 7/41 = 0.17 0 Rendah 3/4 = 0.7 5 27/41 = 0.70 7 10/4 5 = 0.2 22 35/4 5= 0.7 77 Tinggi 0 5/35 = 0.14 2 0.34 4 0.91 4 0.31 44 Sedang 0 11/35 = 0.34 2 Rendah 10/1 0 = 1 19/35 = 0.51 4 25/4 5 = 0.5 55 20/4 5= 0.4 44 Tinggi 0 5/20= 0.25 0.49 2 0.5 0.24 6 Sedang 8/25 = 0.3 2 3/20 = 0.15 Rendah 17/2 5 = 0.6 8 12/20 = 0.6

(5)

70 45/4 5 = 1 0/4 5 = 0 Tinggi 5/45 = 0.1 11 0 0 0.99 9 0 Sedang 12/4 5 = 0.2 66 0 Rendah 28/4 5 = 0.6 22 0 23/4 5= 0.5 11 22/4 5= 0.2 26 Tinggi 5/23 = 0.2 17 0 0.23 0 1.21 3 0.27 89 Sedang 10/2 3 = 0.4 34 1/22 = 0.04 5 Rendah 8/23 = 0.3 47 21/22 = 0.95 4 22/4 5= 0.2 26 23/4 5= 0.5 11 Tinggi 0 5/22 = 0.19 2 0.23 0 1.18 8 0.27 32 Sedang 1/22 = 0.0 45 10/23 = 0.43 4 Rendah 21/2 2 = 0.9 54 8/23 = 0.34 7

Untuk mendapatkan gambaran mengenai cara mendapatkan Tabel 3.3 berikut adalah penjelasan mengenai perhitungan nilai kesesuaian, misalnya bagi calon cabang 7, yaitu calon cabang yang terdiri atas calon cabang kiri yaitu pendapatan ≤ 1.800.000-, dan calon cabang kanannya yaitu > 1.800.000-.

Ada 10 buah catatan yang memenuhi syarat pendapatan ≤ 1.800.000-, yaitu catatan 6, 10, 13, 18, 21, 29, 33, 36, 39, 44. Adapun jumlah catatan pada data latihan yang dipertimbangkan saat ini 35 buah, sehingga dari rumus 3.4 didapatkan :

1. Nilai dari besaran

2

PLPR=2(0.222)(0.777)=0.344 2. Nilai dari besaran, yang terdapat pada rumus 3.8

adalah

)

|

(

s

t

914 . 0 514 . 0 1 | | 344 . 0 0 | | 142 . 0 0 | ) | ( ) | ( | = − + − + − = −

= L R kategori jum lah i j t j P t j P

Dan didapatkan pula hasil dari perhitungan kesesuaian menggunakan rumus 3.9 adalah

(

s

|

t

)

= 2 PLPR 3144 . 0 ) 194 . 0 )( 777 . 0 )( 222 . 0 ( 2 ) | ( = = P s t

3. Langkah ketiga algoritma CART iterasi-1

Langkah ketiga algoritma ini adalah menentukan calon cabang manakah yang akan benar-benar dijadikan cabang. Hal ini dilakukan dengan memilih calon cabang yang memiliki nilai kesesuaian terbesar. Berdasarkan tabel 3.3 diatas tampak bahwa calon cabang nomor 7 adalah calon cabang dengan nilai besaran kesesuaian terbesar dari pada calon cabang yang lain, maka calon cabang inilah yang akan kita pilih sebagai cabang pada tahap ini sehingga kita memperoleh pohon keputusan seperti pada gambar 3.1 dari iterasi 1.

Gambar 1. Pohon keputusan masalah klasifikasi 1. Pada noktah dasar kita masih berhadapan

dengan seluruh catatan, yaitu catatan 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45.

2. Calon cabang nomor 7 kini telah benar-benar menjadi cabang. Adapun cabang kirinya yaitu 6, 10, 13, 18, 21, 29, 33, 36, 39, 44, karena nilai variabel prediktor bagi kedua catatan ini seluruhnya adalah Pendapatan ≤ 1.800.000 = Rendah, maka noktah terminasi akan dihasilkan. 3. Cabang kanannya, yaitu cabang yang memenuhi syarat Pendapatan > 1.800.000-, dan karena nilai variabel prediktor bagi catatan-catatan ini ada yang mamiliki status ekonomi keluarga = tinggi, rendah sedang, maka dihasilkan noktah keputusan, karena merupakan noktah keputusan pertama kita dapat menyebutnya noktah keputusan A. Noktah ini akan bercabang lebih lanjut karena bukan termasuk noktah terminasi. IV. IMPLEMENTASI

A. Implementasi Sistem

Weka adalah perangkat lunak data mining yang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan berbasis GUI dan secara langsung melalui Command Line (advanced users) Weka dapat digunakan untuk melakukan

(6)

71

preprocessing, klasifikasi, clustering (pengelompokan), regresi, association rule mining (ARM) dan visualisasi.

Gambar 2. Tampilan Weka

Sebelum data diolah, maka data harus di import terlebih dahulu atau lebih tepatnya pilih file yang akan diolah ke software weka nantinya dengan format CSV (Comma Delimetid), kemudian kita membuka software Weka dan memilih bagian Explorer. Setelah itu kita klik open file pada bagian kanan seperti pada gambar dibawah, kemudian kita membuka file yang akan kita olah dan menyimpannya dengan format Arff, Adapun Tampilannya dalah sebagai beriku

Gambar 3. Tampilan Import Data

Berikut merupakan tampilan data yang sudah diolah dengan menggunakan format Arff, kita dapat memilih attribut mana yang akan diolah menggunakan metode Cart dan attribut mana yang tidak perlu digunakan dengan klik kotak pada attribut masing masing. Seperti yang terlihat pada gambar dibawah ini:

Gambar 4. Tampilan File Dengan Format Arff

Gambar 5.Tampilan Visualize All

Clasifier adalah temapat dimana kita bisa memilih Algoritma yang akan digunakan. Pada bagian ini kita melakukan klasifikasi dengan metode Cart, dengan memilih clasificatiaon, kemudian pilih metode cart, klik choose, pilih use training set. Akan muncul hasil klasifikasi dengan menggunkan metode Cart, seperti yang terlihat pada gambar berikut ini.

Gambar 6. Tampilan Clasification Cart Hasil klasifikasi dapat dilihat pada Gambar 5.10 dengan hasil klasifikasi 5,1,5 diatas. Sedangkan pada confusion matrix terdapat klasifikasi yang digunakan pada perhitungan data yaitu classified as A = Tinggi, dimana dengan jumlah sampel 45 berarti terdapat 5 data yang memiliki klasifikasi tinggi. Sedangkan classified as B = Rendah, dimana terdapat

(7)

72

29 sampel data yang memiliki klasifikasi rendah. Kemudian classified as C = Sedang, dimana ada 11 sampel data yang memiliki klasifikasi rendah. V. KESIMPULAN

Berdasarkan uraian yang telah dibuat mengenai implementasi Algortima Clasification And Regression Tress (Cart), maka penulis dapat menarik beberapa

kesimpulan yang diperoleh dari pembahasan tersebut, antara lain:

1. Algoritma Clasification and Regression tress (Cart) dapat digunakan dalam pengklasifikaian ekonomi keluarga pada Kantor Kepala Desa Tanjung Morawa.

2. Data warga dapat diklasifikasi dengan menggunakan Algoritma Clasification and Regression (Cart) dengan melihat data yang memenuhi nilai kesesuaian terbesar berdasarkan data warga sebelumnya. Namun dalam penyusunan candidate split dan perhitungan keseluruhan calon cabangnya sangat sulit jika data yang diolah dalam jumlah yang besar. 3. Tehnik data mining dengan algoritma Cart dapat

diimplementasikan pada sistem klasifikasi ekonomi keluraga dengan data yang digunakan adalah data warga pada tahun 2012 dan pengujian sampel menggunakan tools Weka 3.8.1.

REFERENCES

[1] Amin Faisal Muhammad, "Penerapan Algoritma Untuk Memprediksi Status Kelulusan Mahasiswa," Jutisi, vol. 5, p. 1222, Desember 2016.

[2] Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining, I ed, Theresia Ari Prabawati, Ed. Yogyakarta, Indonesia: Andi, 2009.

[3] Eko Prasetyo, DATA MINING Konsep dab Aplikasi Menggunakan Matlab. Yogyakarta, Indonesia: Andi, 2012. [4] Nofriyandyah Dicky, Algoritma Data Mining Dan Pengujian.

Yogyakarta, Indonesia: Deepublish, 2015.

[5] Astuti Hermawati Fajar, Data Mining. Yogyakarta, Indonesia: Andi, 2009.

[6] Pudjo Prabowo Widodo, Trias Handayanto, and Herlawati , Penerapan Data Mining Dengan Matlab. Bandung, Indonesia: Rekayasa Sains, 2013.

Gambar

Tabel 1. Daftar Warga Tahun 2012
Tabel 3. Perhitungan nilai kesesuain untuk calon  cabang 1-11 iterasi-1  P L P R Rumah Status  Tinggal  P(j|tL )  (PJ|t R)  2PLP R Q(s|t)  ɸ(s|t)  4/45 =  0.0 88  41/4 5= 0.911  Tinggi  3/4 =  0.75  2/41 = 0.048  0.160  1.402  0.2243 Sedang 0 12/41 = 0.292
Gambar 1. Pohon keputusan masalah klasifikasi
Gambar 2. Tampilan Weka

Referensi

Dokumen terkait

Kata kunci: Persamaan Meinhardt, metode beda hingga, skema Crank-Nicolson Persamaan Meinhardt merupakan sebuah model matematika yang menggambarkan pola pembentukan sel pada hydra..

Mengingat pentingnya peran sumber daya manusia, maka manajemen perusahaan akan memberikan perhatiannya terhadap pengelolaan sumber daya manusia dan berupaya

(Asesmen Mandiri/ Self Assessment ) Penilaian Pendukung Bukti-bukti Diisi Asesor K BK V A T M 2.1 Apakah anda dapat menilai risiko kredit inheren terkait. dengan

Berdasarkan hal tersebut penulis mengambil judul ANALISIS PENGARUH KINERJA KEUANGAN, GOOD CORPORATE GOVERNANCE, DAN CORPORATE SOCIAL RESPONSIBILITY TERHADAP NILAI

Dari hasil simulasi Band Pass Filter mikrostrip menggunakan metode open stub sesuai dengan spesifikasi yang diinginkan dengan melakukan beberapa kali optimasi pada simulasi

Kehadiran umat disetiap Misa Kudus adalah melalui jemputan atau pembahagian kepada semua KKD di Kampung Katolik Komuniti untuk setiap Perayaan Misa dan kehadiran

1) Untuk mengetahui tingkat kepuasan pelanggan terhadap layanan jasa yang diberikan ditinjau dari Service Quality dan analisis GAP. 2) Untuk mengukur dimensi mana yang

Glass eel yang melakukan ruaya anadromous (bermigrasi) ke muara Sungai Palu periode Bulan Januari sampai April 2009 terdiri dari tiga spesies yaitu dua spesies