APLIKASI DATA MINING MENGGUNAKAN METODE DECISION TREE UNTUK
EVALUASI BALANCE SCALE COGNITIVE DENGAN ALGORITMA C4.5
M. Azhari Marpaung
1, Nabila Dwi Cahyani
2,
Gustara Sapto Ajie
3, Agung Kurniawan
4, Eka
Qolbu M.S.
5Teknik Informatika, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Universitas Padjadjaran
Jatinangor, Indonesia
Email : ariipaung@gmail.com
1, chyndc@gmail.com
2,
gustara.sapto@gmail.com
3, agungkurniawan060496@gmail.com
4, ekaqolbums@yahoo.co.id
5Abstrak
Istilah “Cognitive” berasal dari kata cognition artinya adalah pengertian, mengerti.
Kognitif adalah proses yang terjadi secara internal di dalam pusat susunan saraf pada waktu
manusia sedang berpikir (Gagne dalam Jamaris, 2006). Pengertian yang luasnya cognition
(kognisi) adalah perolehan, penataan, dan penggunaan pengetahuan (Neisser, 1976). Menurut
para ahli jiwa aliran kognitifis, tingkah laku seseorang/anak itu senantiasa didasarkan pada
kognisi, yaitu tindakan mengenal atau memikirkan situasi dimana tingkah laku itu terjadi.
Kemudian istilah kognitif ini menjadi populer sebagai salah satu wilayah psikologi
manusia / satu konsep umum yang mencakup semua bentuk pengenalan yang meliputi setiap
perilaku mental yang berhubungan dengan masalah pemahaman, memperhatikan, memberikan,
menyangka, pertimbangan, pengolahan informasi, pemecahan masalah, kesengajaan,
pertimbangan, membayangkan, memperkirakan, berpikir dan keyakinan.
Pada penelitian ini dihasilkan untuk model eksperimen psikologis yang dilansir oleh
Siegler, R. S. (1976). Tiga Aspek Pengembangan Kognitif. Psikologi kognitif, 8, 481-520.
Kumpulan data ini dihasilkan untuk model hasil eksperimen psikologis. Setiap contoh
diklasifikasikan sebagai memiliki ujung timbangan ke kanan, ujung ke kiri, atau seimbang.
Atribut adalah berat kiri, jarak kiri, berat badan yang tepat, dan jarak yang tepat. Cara yang
benar untuk menemukan kelas adalah lebih besar dari (kiri-jarak * kiri berat badan) dan
(kanan jarak * kanan berat badan). Jika mereka sama, itu adalah seimbang.
Salah satu teknik data mining yang dapat digunakan adalah klasifikasi. Data percobaan
balance scale pada pengembangan kognitif yang telah ada dianalisis menggunakan Metode
Decision Tree (Pohon Keputusan) dengan algoritma C4.5. Metode Decision Tree
merupakan metode yang merubah fakta yang sangat besar menjadi sebuah
pohon keputusan yang mereprentasikan aturan-aturan. Pohon keputusan ini juga
berguna untuk mengeksplorasi data, serta menemukan hubungan tersembunyi antara
sejumlah calon variabel input dengan sebuah variabel target. Algoritma C4.5 membuat
pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang
paling bawah dinamakan daun, kemudian pola tersebut dapat digunakan untuk menunjukkan
hasil balance scale pengembangan kognitif
1. PENDAHULUAN
Dalam pekembangan selanjutnya,
kemudian istilah kognitif ini menjadi
populer sebagai salah satu wilayah
psikologi manusia / satu konsep umum
yang
mencakup
semua
bentuk
pengenalan yang meliputi setiap perilaku
mental
yang
berhubungan
dengan
masalah pemahaman, memperhatikan,
memberikan, menyangka, pertimbangan,
pengolahan
informasi,
pemecahan
masalah, kesengajaan, pertimbangan,
membayangkan,
memperkirakan,
berpikir
dan
keyakinan.
Termasuk
kejiwaan yang berpusat di otak ini juga
berhubungan dengan konasi (kehendak)
dan afeksi (perasaan) yang bertalian
dengan rasa.
Tujuan aspek kognitif berorientasi
pada
kemampuan
berfikir
yang
mencakup kemampuan intelektual yang
lebih sederhana, yaitu mengingat, sampai
pada kemampuan memecahkan masalah
yang
menuntut
siswa
untuk
menghubungakan dan menggabungkan
beberapa ide, gagasan, metode atau
prosedur
yang
dipelajari
untuk
memecahkan masalah.
penerapan data mining menggunakan
metode
decision tree
dengan algoritma
C4.5.
2. LANDASAN TEORI
a. Data Mining
Data mining adalah penambangan
atau penemuan informasi baru
dengan mencari pola atau aturan
tertentu dari sejumlah data yang sangat
besar. Data mining juga disebut
sebagai serangkaian proses untuk
menggali
nilai
tambah
berupa
pengetahuan yang selama ini tidak
diketahui secara manual dari suatu
kumpulan data.
Klasifikasi adalah proses untuk
menemukan model atau fungsi yang
menjelaskan atau membedakan
konsep atau kelas data, dengan tujuan
untuk dapat memperkirakan kelas
dari suatu objek yang labelnya tidak
diketahui. Dalam mencapai tujuan
tersebut, proses klasifikasi
membentuk suatu model yang
mampu membedakan data ke dalam
kelas-kelas yang berbeda berdasarkan
aturan atau fungsi tertentu. Model
itu sendiri bisa berupa aturan
“
jika-mak
a”
,berupa pohon keputusan atau
formula matematis.
c. Decision Tree
Sebuah pohon keputusan adalah
sebuah struktur yang dapat digunakan
klasifikasi dalam data mining. Metode
pohon keputusan mengubah fakta
yang sangat besar menjadi pohon
keputusan
yang
merepresentasikan
aturan. Pohon keputusan juga berguna
untuk mengekplorasi data, menemukan
hubungan tersembunyi antara
sejumlah calon variabel input dengan
sebuah variabel target.
Data dalam pohon keputusan
biasanya dinyatakan dalam bentuk tabel
dengan atribut dan record. Atribut
menyatakan
suatu
parameter
yang
disebut
sebagai
kriteria
dalam
pembentukan pohon. Misalkan untuk
menentukan kinerja motor sevo, kriteria
yang diperhatikan adalah loop, beban,
dan tegangan input. Salah satu atribut
merupakan atribut yang menyatakan
data solusi per item data yang disebut
atribut hasil. Banyak algoritma yang
dapat dipakai dalam pembentukan
pohon keputusan, antara lain ID3, C4.5,
CART .
d. Algoritma C4.5
Algoritma
C4.5
merupakan
pengembangan
dari
algoritma
ID3.
Algoritma C4.5 dan ID3 diciptakan oleh
seorang peneliti dibidang kecerdasan
buatan bernama J. Rose Quinlan
pada akhir tahun 1970-an. Algoritma C4.5
membuat pohon keputusan dari atas ke
bawah, dimana atribut paling atas
merupakan akar, dan yang paling
bawah dinamakan daun.
Secara umum, algoritma C4.5
untuk
membangun
sebuah
pohon
keputusan adalah sebagai berikut:
Hitung jumlah data, jumlah data
berdasarkan anggota atribut hasil
dengan syarat tertentu.
Untuk proses pertama syaratnya
masih kosong.
daun yang terbentuk. Jika seluruh
nilai entropy anggota Node
syarat sampai semua anggota dari
Node bernilai nol.
3. ANALISA DATA DENGAN ALGORITMA C.4.5
Secara umum algoritma C4.5 untuk membangun pohon keputusan
adalah sebagai berikut:
Pilih atribut sebagai akar
Buat cabang untuk masing-masing nilai
Bagi kasus dalam cabang
Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
TOTAL
KASUS
SUM ( L
)
SUM ( B
)
SUM ( R
)
ENTROPI
TOTAL
15
5
5
5
1,584963
NODE
ATRIBUT
Nilai
SUM
(N)
SUM ( L )
SUM ( B
)
SUM ( R
)
Entropi
GAIN
1
LW
1
15
5
5
5
1,584963
0
2
0
0
0
0
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
LD
1
6
0
1
5
0,650022
1,001303
2
2
0
2
0
0
3
5
3
2
0
0,970951
4
2
2
0
0
0
5
0
0
0
0
0
RW
1
11
4
3
4
1,572624
0,114713
2
3
1
1
1
1,584963
3
1
0
1
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RD
1
7
3
3
1
1,448816
0,375515
2
4
2
1
1
1,5
3
2
0
1
1
1
4
1
0
0
1
0
5
1
0
0
1
0
Tabel 1. Balance
Berdasarkan pembentukan pohon keputusan pada gambar 1, menunjukkan
bahwa pada node 1 (balance) merupakan node dengan mendapatkan gain tertinggi
sebesar
1,001303.
Sehingga node 1 mendapatkan attribute LD
TOTAL KASUS
SUM ( L
)
SUM ( B
)
SUM ( R
)
ENTROPI
TOTAL
6
0
1
5
0,650022
NODE
ATRIBUT
Nilai
SUM (N)
SUM (
L )
SUM ( B
)
SUM (
R )
Entropi
GAIN
1.1
2
0
0
0
0
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RW
1
5
0
1
4
0,721928
0,048416
2
1
0
0
1
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RD
1
2
0
1
1
1
0,316689
2
1
0
0
1
0
3
1
0
0
1
0
4
1
0
0
1
0
5
1
0
0
1
0
Tabel 2. LD (Left-Distance)
Berdasarkan pembentukan pohon keputusan pada gambar 2, menunjukkan
bahwa pada node 1.1 (Left-Distance) merupakan node dengan mendapatkan attribute
RW
TOTAL
KASUS
SUM ( L
)
SUM ( B
)
SUM ( R
)
ENTROPI
TOTAL
5
0
1
4
0,721928
NODE
ATRIBUT
Nilai
SUM
(N)
SUM ( L )
SUM ( B
)
SUM ( R
)
Entropi
GAIN
1.1.1
LW
1
5
0
1
4
0,721928
0
2
0
0
0
0
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RD
1
1
0
1
0
0
0,721928
2
1
0
0
1
0
3
1
0
0
1
0
4
1
0
0
1
0
5
1
0
0
1
0
Tabel 3. RD (Right-Distance)
Berdasarkan pembentukan pohon keputusan pada gambar 3, menunjukkan
bahwa pada node 1.1.1. (RD) merupakan node dengan mendapatkan gain tertinggi
sebesar
0,721928.
Sehingga node 1.1.1. mendapatkan attribute RD
TOTAL
KASUS
SUM ( L
)
SUM ( B
)
SUM ( R
)
ENTROPI
TOTAL
5
3
2
0
0,970951
NODE
ATRIBUT
Nilai
SUM
(N)
SUM ( L )
SUM ( B
)
SUM ( R
)
Entropi
GAIN
1.3
LW
1
5
3
2
0
0,970951
0
2
0
0
0
0
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RW
1
3
2
1
0
0,918296
0,419973
2
1
1
0
0
0
3
1
0
1
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RD
1
3
2
1
0
0,918296
0,419973
2
1
1
0
0
0
3
1
0
1
0
0
4
0
0
0
0
0
5
0
0
0
0
0
Gambar 4. Decision Tree Node 1.3. 1
Berdasarkan pembentukan pohon keputusan pada gambar 4, menunjukkan
bahwa pada node 1.3 (LD 3) merupakan node dengan mendapatkan gain tertinggi
sebesar
0,419973.
Sehingga node 1.3 mendapatkan attribute RD
TOTAL
KASUS
SUM ( L
)
SUM ( B
)
SUM ( R
)
ENTROPI
TOTAL
3
2
1
0
0,918296
NODE
ATRIBUT
Nilai
SUM
(N)
SUM ( L )
SUM ( B
)
SUM ( R
)
Entropi
GAIN
1.3.1
LW
1
3
2
1
0
0,918296
0
2
0
0
0
0
0
3
0
0
0
0
0
4
0
0
0
0
0
5
0
0
0
0
0
RW
1
1
1
0
0
0
0,918296
2
1
1
0
0
0
3
1
0
1
0
0
4
0
0
0
0
0
Tabel 5. RD 1
Berdasarkan pembentukan pohon keputusan pada gambar 5, menunjukkan
bahwa pada node 1.3.1 (RD 1) merupakan node dengan mendapatkan gain tertinggi
sebesar
0,918296.
Sehingga node 1.3.1 mendapatkan attribute RW
4. Implementasi Sistem
Berikut merupakan kesimpulan dari mining data balance scale :
IF LW = 5 ^ LD = 3 ^ RW = 3 ^ RD = 5 THEN BALANCE 'B' IF LW = 5 ^ LD = 3 ^ RW = 4 ^ RD = 1/2/3 THEN BALANCE 'L' IF LW = 5 ^ LD = 3 ^ RW = 4 ^ RD = 4/5 THEN BALANCE 'R' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 1/2 THEN BALANCE 'L' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 3 THEN BALANCE 'B' IF LW = 5 ^ LD = 3 ^ RW = 5 ^ RD = 4/5 THEN BALANCE 'R' IF LW = 5 ^ LD = 4 ^ RW = 1 THEN BALANCE 'L'
IF LW = 5 ^ LD = 4 ^ RW = 2 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 3 THEN BALANCE 'L'
IF LW = 5 ^ LD = 4 ^ RW = 4 ^ RD = 1/2/3/4 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 4 ^ RD = 5 THEN BALANCE 'B'
IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 1/2/3 THEN BALANCE 'L' IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 4 THEN BALANCE 'B' IF LW = 5 ^ LD = 4 ^ RW = 5 ^ RD = 5 THEN BALANCE 'R' IF LW = 5 ^ LD = 5 ^ RW = 1 THEN BALANCE 'L'
IF LW = 5 ^ LD = 5 ^ RW = 2 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 3 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 4 THEN BALANCE 'L'
IF LW = 5 ^ LD = 5 ^ RW = 5 ^ RD = 1/2/3/4 THEN BALANCE 'L' IF LW = 5 ^ LD = 5 ^ RW = 5 ^ RD = 5 THEN BALANCE 'B'