• Tidak ada hasil yang ditemukan

APLIKASI DATA MINING MENGGUNAKAN METODE (1)

N/A
N/A
Protected

Academic year: 2018

Membagikan "APLIKASI DATA MINING MENGGUNAKAN METODE (1)"

Copied!
16
0
0

Teks penuh

(1)

APLIKASI DATA MINING MENGGUNAKAN METODE DECISION TREE UNTUK

EVALUASI BALANCE SCALE COGNITIVE DENGAN ALGORITMA C4.5

M. Azhari Marpaung

1

, Nabila Dwi Cahyani

2

,

Gustara Sapto Ajie

3

, Agung Kurniawan

4

, Eka

Qolbu M.S.

5

Teknik Informatika, Fakultas Matematika dan Ilmu

Pengetahuan Alam, Universitas Padjadjaran

Jatinangor, Indonesia

Email : ariipaung@gmail.com

1

, chyndc@gmail.com

2

,

gustara.sapto@gmail.com

3

, agungkurniawan060496@gmail.com

4

, ekaqolbums@yahoo.co.id

5

Abstrak

Istilah “Cognitive” berasal dari kata cognition artinya adalah pengertian, mengerti.

Kognitif adalah proses yang terjadi secara internal di dalam pusat susunan saraf pada waktu

manusia sedang berpikir (Gagne dalam Jamaris, 2006). Pengertian yang luasnya cognition

(kognisi) adalah perolehan, penataan, dan penggunaan pengetahuan (Neisser, 1976). Menurut

para ahli jiwa aliran kognitifis, tingkah laku seseorang/anak itu senantiasa didasarkan pada

kognisi, yaitu tindakan mengenal atau memikirkan situasi dimana tingkah laku itu terjadi.

Kemudian istilah kognitif ini menjadi populer sebagai salah satu wilayah psikologi

manusia / satu konsep umum yang mencakup semua bentuk pengenalan yang meliputi setiap

perilaku mental yang berhubungan dengan masalah pemahaman, memperhatikan, memberikan,

menyangka, pertimbangan, pengolahan informasi, pemecahan masalah, kesengajaan,

pertimbangan, membayangkan, memperkirakan, berpikir dan keyakinan.

Pada penelitian ini dihasilkan untuk model eksperimen psikologis yang dilansir oleh

Siegler, R. S. (1976). Tiga Aspek Pengembangan Kognitif. Psikologi kognitif, 8, 481-520.

Kumpulan data ini dihasilkan untuk model hasil eksperimen psikologis. Setiap contoh

diklasifikasikan sebagai memiliki ujung timbangan ke kanan, ujung ke kiri, atau seimbang.

Atribut adalah berat kiri, jarak kiri, berat badan yang tepat, dan jarak yang tepat. Cara yang

benar untuk menemukan kelas adalah lebih besar dari (kiri-jarak * kiri berat badan) dan

(kanan jarak * kanan berat badan). Jika mereka sama, itu adalah seimbang.

Salah satu teknik data mining yang dapat digunakan adalah klasifikasi. Data percobaan

balance scale pada pengembangan kognitif yang telah ada dianalisis menggunakan Metode

Decision Tree (Pohon Keputusan) dengan algoritma C4.5. Metode Decision Tree

merupakan metode yang merubah fakta yang sangat besar menjadi sebuah

pohon keputusan yang mereprentasikan aturan-aturan. Pohon keputusan ini juga

berguna untuk mengeksplorasi data, serta menemukan hubungan tersembunyi antara

sejumlah calon variabel input dengan sebuah variabel target. Algoritma C4.5 membuat

pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang

paling bawah dinamakan daun, kemudian pola tersebut dapat digunakan untuk menunjukkan

hasil balance scale pengembangan kognitif

(2)

1. PENDAHULUAN

Dalam pekembangan selanjutnya,

kemudian istilah kognitif ini menjadi

populer sebagai salah satu wilayah

psikologi manusia / satu konsep umum

yang

mencakup

semua

bentuk

pengenalan yang meliputi setiap perilaku

mental

yang

berhubungan

dengan

masalah pemahaman, memperhatikan,

memberikan, menyangka, pertimbangan,

pengolahan

informasi,

pemecahan

masalah, kesengajaan, pertimbangan,

membayangkan,

memperkirakan,

berpikir

dan

keyakinan.

Termasuk

kejiwaan yang berpusat di otak ini juga

berhubungan dengan konasi (kehendak)

dan afeksi (perasaan) yang bertalian

dengan rasa.

Tujuan aspek kognitif berorientasi

pada

kemampuan

berfikir

yang

mencakup kemampuan intelektual yang

lebih sederhana, yaitu mengingat, sampai

pada kemampuan memecahkan masalah

yang

menuntut

siswa

untuk

menghubungakan dan menggabungkan

beberapa ide, gagasan, metode atau

prosedur

yang

dipelajari

untuk

memecahkan masalah.

penerapan data mining menggunakan

metode

decision tree

dengan algoritma

C4.5.

2. LANDASAN TEORI

a. Data Mining

Data mining adalah penambangan

atau penemuan informasi baru

dengan mencari pola atau aturan

tertentu dari sejumlah data yang sangat

besar. Data mining juga disebut

sebagai serangkaian proses untuk

menggali

nilai

tambah

berupa

pengetahuan yang selama ini tidak

diketahui secara manual dari suatu

kumpulan data.

Klasifikasi adalah proses untuk

menemukan model atau fungsi yang

menjelaskan atau membedakan

konsep atau kelas data, dengan tujuan

untuk dapat memperkirakan kelas

dari suatu objek yang labelnya tidak

diketahui. Dalam mencapai tujuan

tersebut, proses klasifikasi

membentuk suatu model yang

mampu membedakan data ke dalam

kelas-kelas yang berbeda berdasarkan

aturan atau fungsi tertentu. Model

itu sendiri bisa berupa aturan

jika-mak

a”

,berupa pohon keputusan atau

formula matematis.

(3)

c. Decision Tree

Sebuah pohon keputusan adalah

sebuah struktur yang dapat digunakan

klasifikasi dalam data mining. Metode

pohon keputusan mengubah fakta

yang sangat besar menjadi pohon

keputusan

yang

merepresentasikan

aturan. Pohon keputusan juga berguna

untuk mengekplorasi data, menemukan

hubungan tersembunyi antara

sejumlah calon variabel input dengan

sebuah variabel target.

Data dalam pohon keputusan

biasanya dinyatakan dalam bentuk tabel

dengan atribut dan record. Atribut

menyatakan

suatu

parameter

yang

disebut

sebagai

kriteria

dalam

pembentukan pohon. Misalkan untuk

menentukan kinerja motor sevo, kriteria

yang diperhatikan adalah loop, beban,

dan tegangan input. Salah satu atribut

merupakan atribut yang menyatakan

data solusi per item data yang disebut

atribut hasil. Banyak algoritma yang

dapat dipakai dalam pembentukan

pohon keputusan, antara lain ID3, C4.5,

CART .

d. Algoritma C4.5

Algoritma

C4.5

merupakan

pengembangan

dari

algoritma

ID3.

Algoritma C4.5 dan ID3 diciptakan oleh

seorang peneliti dibidang kecerdasan

buatan bernama J. Rose Quinlan

pada akhir tahun 1970-an. Algoritma C4.5

membuat pohon keputusan dari atas ke

bawah, dimana atribut paling atas

merupakan akar, dan yang paling

bawah dinamakan daun.

Secara umum, algoritma C4.5

untuk

membangun

sebuah

pohon

keputusan adalah sebagai berikut:

Hitung jumlah data, jumlah data

berdasarkan anggota atribut hasil

dengan syarat tertentu.

Untuk proses pertama syaratnya

masih kosong.

daun yang terbentuk. Jika seluruh

nilai entropy anggota Node

syarat sampai semua anggota dari

Node bernilai nol.

(4)

3. ANALISA DATA DENGAN ALGORITMA C.4.5

Secara umum algoritma C4.5 untuk membangun pohon keputusan

adalah sebagai berikut:

Pilih atribut sebagai akar

Buat cabang untuk masing-masing nilai

Bagi kasus dalam cabang

Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang

memiliki kelas yang sama.

(5)

TOTAL

KASUS

SUM ( L

)

SUM ( B

)

SUM ( R

)

ENTROPI

TOTAL

15

5

5

5

1,584963

NODE

ATRIBUT

Nilai

SUM

(N)

SUM ( L )

SUM ( B

)

SUM ( R

)

Entropi

GAIN

1

LW

1

15

5

5

5

1,584963

0

2

0

0

0

0

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

LD

1

6

0

1

5

0,650022

1,001303

2

2

0

2

0

0

3

5

3

2

0

0,970951

4

2

2

0

0

0

5

0

0

0

0

0

RW

1

11

4

3

4

1,572624

0,114713

2

3

1

1

1

1,584963

3

1

0

1

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RD

1

7

3

3

1

1,448816

0,375515

2

4

2

1

1

1,5

3

2

0

1

1

1

4

1

0

0

1

0

5

1

0

0

1

0

Tabel 1. Balance

(6)

Berdasarkan pembentukan pohon keputusan pada gambar 1, menunjukkan

bahwa pada node 1 (balance) merupakan node dengan mendapatkan gain tertinggi

sebesar

1,001303.

Sehingga node 1 mendapatkan attribute LD

TOTAL KASUS

SUM ( L

)

SUM ( B

)

SUM ( R

)

ENTROPI

TOTAL

6

0

1

5

0,650022

NODE

ATRIBUT

Nilai

SUM (N)

SUM (

L )

SUM ( B

)

SUM (

R )

Entropi

GAIN

1.1

2

0

0

0

0

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RW

1

5

0

1

4

0,721928

0,048416

2

1

0

0

1

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RD

1

2

0

1

1

1

0,316689

2

1

0

0

1

0

3

1

0

0

1

0

4

1

0

0

1

0

5

1

0

0

1

0

Tabel 2. LD (Left-Distance)

(7)

Berdasarkan pembentukan pohon keputusan pada gambar 2, menunjukkan

bahwa pada node 1.1 (Left-Distance) merupakan node dengan mendapatkan attribute

RW

TOTAL

KASUS

SUM ( L

)

SUM ( B

)

SUM ( R

)

ENTROPI

TOTAL

5

0

1

4

0,721928

NODE

ATRIBUT

Nilai

SUM

(N)

SUM ( L )

SUM ( B

)

SUM ( R

)

Entropi

GAIN

1.1.1

LW

1

5

0

1

4

0,721928

0

2

0

0

0

0

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RD

1

1

0

1

0

0

0,721928

2

1

0

0

1

0

3

1

0

0

1

0

4

1

0

0

1

0

5

1

0

0

1

0

Tabel 3. RD (Right-Distance)

(8)

Berdasarkan pembentukan pohon keputusan pada gambar 3, menunjukkan

bahwa pada node 1.1.1. (RD) merupakan node dengan mendapatkan gain tertinggi

sebesar

0,721928.

Sehingga node 1.1.1. mendapatkan attribute RD

TOTAL

KASUS

SUM ( L

)

SUM ( B

)

SUM ( R

)

ENTROPI

TOTAL

5

3

2

0

0,970951

NODE

ATRIBUT

Nilai

SUM

(N)

SUM ( L )

SUM ( B

)

SUM ( R

)

Entropi

GAIN

1.3

LW

1

5

3

2

0

0,970951

0

2

0

0

0

0

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RW

1

3

2

1

0

0,918296

0,419973

2

1

1

0

0

0

3

1

0

1

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RD

1

3

2

1

0

0,918296

0,419973

2

1

1

0

0

0

3

1

0

1

0

0

4

0

0

0

0

0

5

0

0

0

0

0

(9)

Gambar 4. Decision Tree Node 1.3. 1

Berdasarkan pembentukan pohon keputusan pada gambar 4, menunjukkan

bahwa pada node 1.3 (LD 3) merupakan node dengan mendapatkan gain tertinggi

sebesar

0,419973.

Sehingga node 1.3 mendapatkan attribute RD

TOTAL

KASUS

SUM ( L

)

SUM ( B

)

SUM ( R

)

ENTROPI

TOTAL

3

2

1

0

0,918296

NODE

ATRIBUT

Nilai

SUM

(N)

SUM ( L )

SUM ( B

)

SUM ( R

)

Entropi

GAIN

1.3.1

LW

1

3

2

1

0

0,918296

0

2

0

0

0

0

0

3

0

0

0

0

0

4

0

0

0

0

0

5

0

0

0

0

0

RW

1

1

1

0

0

0

0,918296

2

1

1

0

0

0

3

1

0

1

0

0

4

0

0

0

0

0

(10)

Tabel 5. RD 1

Berdasarkan pembentukan pohon keputusan pada gambar 5, menunjukkan

bahwa pada node 1.3.1 (RD 1) merupakan node dengan mendapatkan gain tertinggi

sebesar

0,918296.

Sehingga node 1.3.1 mendapatkan attribute RW

(11)

4. Implementasi Sistem

Berikut merupakan kesimpulan dari mining data balance scale :

(12)
(13)
(14)

IF LW = 5 ^ LD = 3 ^ RW = 3 ^ RD = 5 THEN BALANCE 'B' IF LW = 5 ^ LD = 3 ^ RW = 4 ^ RD = 1/2/3 THEN BALANCE 'L' IF LW = 5 ^ LD = 3 ^ RW = 4 ^ RD = 4/5 THEN BALANCE 'R' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 1/2 THEN BALANCE 'L' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 3 THEN BALANCE 'B' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 4/5 THEN BALANCE 'R' IF LW = 5 ^ LD = 4 ^ RW = 1 THEN BALANCE 'L'

IF LW = 5 ^ LD = 4 ^ RW = 2 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 3 THEN BALANCE 'L'

IF LW = 5 ^ LD = 4 ^ RW = 4 ^ RD = 1/2/3/4 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 4 ^ RD = 5 THEN BALANCE 'B'

IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 1/2/3 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 4 THEN BALANCE 'B' IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 5 THEN BALANCE 'R' IF LW = 5 ^ LD = 5 ^ RW = 1 THEN BALANCE 'L'

IF LW = 5 ^ LD = 5 ^ RW = 2 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 3 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 4 THEN BALANCE 'L'

IF LW = 5 ^ LD = 5 ^ RW = 5 ^ RD = 1/2/3/4 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 5 ^ RD = 5 THEN BALANCE 'B'

(15)

5. Pengujian Sistem

Pengujian sistem dengan cara memasukkan data balance scale yang baru pada aplikasi

untuk mengetahui keakuratan dalam memprediksi balance scale pada kognitif . dimana yang

menjadi data training yang sebelumnya telah diuji dengan menggunakan metode Decision Tree.

Data balance scale baru yang akan diinputkan pada sistem diantaranya :

Class

Left-Weight

Left-Distance

Right-Weight

Right-Distance

R

1

1

1

2

R

1

1

1

3

R

1

1

1

4

B

1

1

1

1

B

1

2

2

1

B

1

2

1

2

L

1

3

1

1

L

1

3

1

2

(16)

Dapat dilihat bahwa hasil dari program menunjukkan nilai kesimpulan data balance scale yang

dihasilkan. Tingkat keakuratan yang masih 100%, semakin tinggi nilai akurasi yang dihasilkan

maka program yang dihasilkan juga semakin baik karena kesesuaian antara prediksi dan hasil

tinggi.

6. Kesimpulan

Pada paper ini telah dilakukan studi penerapan data mining menggunakan metode

Decision Tree dengan algoritma C4.5 untuk mengetahui keakuratan data balance scale dalam

pengujian kognitif.

Berdasarkan hasil pengujian yang telah dilakukan dengan memasukkan data balance

scale yang baru kemudian dianalisis dengan menggunakan metode pohon keputusan algoritma

C4.5 pada sistem aplikasi, hasil yang diperoleh sama dengan hasil kategori data sebenarnya.

7. Daftar Pustaka

http://archive.ics.uci.edu/ml/datasets/Balance+Scale

https://www.academia.edu/6065920/Belajar_Mudah_Algoritma_Data_Mining_C4.

http://whatis.techtarget.com/definition/decision-tree

Gambar

tabel 1 merupakan data yang akan dijadikan parameter dalam proses pengklasifikasian Data hasil percobaan balance scale pada pengembanga kognitif yang terdapat pada balance scale dengan algoritma C4.5 menggunakan Model Metode Pohon Keputusan.
Tabel 1. Balance
Gambar 2. Decision Tree Node 1 1
Tabel 3. RD (Right-Distance)
+4

Referensi

Dokumen terkait

Internalisasi nilai-nilai religius adalah suatu proses yang mendalam dalam menghayati nilai-nilai agama Islam yang dipergunakan seseorang dalam menyelenggarakan tata

Pameran Hasil Karya Siswa Sekolah Menengah Kejuruan pada

tidak hanya dipengaruhi oleh metode atau media saja juga dipengaruhi oleh banyak faktor yang bisa datang dari dalam siswa (internal) ataupun dalam diri siswa (eksternal).

UIN) Sayarif Hidayatullah Jakarta. Pemikirannya tentang pembaruan hukum Islam dimunculkan untuk menyambut gagasan Munawir. Dasar pemikiran beliau adalah bahwasanya

Prinsip syariah itu sendiri adalah prinsip hukum Islam dalam kegiatan perbankan berdasarkan fatwa yang telah dikeluarkan oleh lembaga yang memiliki kewenangan dalam

Schuld (karena salahnya/ culpa/ kealpaan/ lalai) dalam melakukan perbuatannya, jika perbuatan itu telah ia lakukan tanpa disertai dengan tidak adanya kehati-hatian dan kurangnya

b) Sulaman untuk tanaman yang berasal dari bibit rayungan bermata dua dilakukan tiga minggu setelah tanam (tanaman berdaun 3-4 helai). Sulaman diambil dari persediaan bibit dengan

Pada saat biji kacang tanah berisiko tinggi ter- kontaminasi aflatoksin (deraan kekeringan pada akhir fase generatif, suhu tanah tinggi di daerah polong, tingkat populasi A