4.1 Hasil Penelitian
4.1.2 Pemodelan Menggunakan Algoritma Decision Tree C4.5
10 A/G Normal 30 20 10
Tidak
Normal 436 307 129
Sumber : (Penulis, 2018)
4.1.2 Pemodelan Menggunakan Algoritma Decision Tree C4.5
Dalam tahap ini, akan dijelaskan tahapan dalam membuat pohon keputusan dengan algoritma decision tree C4.5 yang dibuat berdasarkan hasil perhitungan Entropy dan Gain. Setelah pohon keputusan tebentuk, maka akan menghasilkan sebuah rule berdasarkan cabang pohon keputusan. Berikut langkah β langkah dalam mengklasifikasi diagnosa penyakit Liver menggunakan algoritma algoritma decision tree C4.5 secara manual dan analisa menggunakan aplikasi Rapidminer.
A. Node 1 (Root) Atribut Total
Proses perhitungan klasifikasi diagnosa penyakit Liver menggunakan algoritma decision tree C4.5 adalah sebagai berikut :
Menghitung jumlah kasus, menghitung jumlah kasus untuk keputusan Pasein dan Non Pasein, dan menghitung entropy dari semua kasus. setelah itu lakukan perhitungan gain dari setiap atribut.
Tabel 4.4 Pehitungan Node 1
ENTROPY INFORMATION GAIN
No. ATTRIBUTE VALUE
ENTROPY INFORMATION GAIN
Sumber : (Penulis, 2018)
Dari perhitungan yang ada pada tabel 4.4 diketahui bahwa jumlah dari total kasus adalah 117 kasus, dengan jumlah keputusan Pasein (S1) adalah 89 kasus, dan jumlah keputusan Non Pasein (S2) adalah 28 kasus. Perhitungan entropy pada tabel diatas dapat dihitung dengan menggunakan persamaan sebagai berikut :
Entropy (Total) = (89
117β πΏππ2(89
117)) + (28
117β πΏππ2(28
117)) Entropy (Total) = 0,09647305819
Sementara itu, nilai Information Gain pada atribut age dapat dihitung dengan menggunakan persamaan sebagai berikut :
Information Gain (Total, Age) = πΈππ‘ππππ¦ (πππ‘ππ) β β |π΄ππ|
|πππ‘ππ|β
ππ=1
πΈππ‘ππππ¦(π΄ππ)
Information Gain (Total, Age) = 0,793901359 β ((20
117β 0,970950594) + ((70
117β 0,749595257) + ((27
117β 0,691289869) Information Gain (Total, Age) = 0,019922672
Kemudian hitung nilai Split Info dengan persamaan sebagai berikut :
Setelah nilai Split Info diketahui langkah terakhir adalah menghitung niali gain rasio dengan persamaan sebagai berikut :
Untuk perhitungan dari artibut-atribut lainnya dapat menggunakan pehitungan pada atribut Age. Sehingga dapat diketahui dari tabel 4.4 bahwa atribut dengan nilai gain ratio tertinggi ada pada atribut ALB yaitu sebesar : 0,096473058, sehingga dengan demikian atribut ALB bisa menjadi node akar.
Ada 2 nilai dari atribut ALB yaitu Normal dan Tidak Normal. Dari kedua nilai tersebut masih memerlukan pehitungan lebih lanjut. Dan hasil pehitungan tersebut dapat digambarkan pada pohon keputusan seperti pada gambar 4.1.
πππππ‘ πΌπππππππ‘πππ (π΄ππ)
= (β (20
117β πΏππ2 (20
117)) + (70
117β πΏππ2 (70
117)) + (27
117β πΏππ2 (27
117)) = 1,367199458
πΊπππ π ππ‘ππ (π΄ππ) = πΊπππ (π΄ππ)
πππππ‘ πΌπππππππ‘πππ (π΄ππ)= 0,019922672 1,367199458
= 0,014571884
Gambar 4.1 Pohon keputusan Node 1 Sumber : (Penulis, 2018)
B. Node 1.1 ALB nilai Normal
Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
Tabel 4.5 Pehitungan Node 1.1
No. ATTRIBUTE VALUE
ENTROPY INFORMATION GAIN
No. ATTRIBUTE VALUE
ENTROPY INFORMATION GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.5 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah SGPT dengan nilai 0,117473462, dengan demikian atribut SGPT bisa menjadi node cabang. Ada dua nilai atribut yaitu Normal dan Tidak Normal, dari nilai atribut itu masih memerlukan pehitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.2.
Gambar 4.2 Pohon keputusan Node 1.1 Sumber : (Penulis, 2018)
C. Node 1.2 SGPT nilai Normal
Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
Tabel 4.6 Pehitungan Node 1.2
No. ATTRIBUTE VALUE
ENTROPY INFORMATION
GAIN SPLIT INFO GAIN
No. ATTRIBUTE VALUE
ENTROPY INFORMATION
GAIN SPLIT INFO GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.6 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah TP dengan nilai 0,0404196 , dengan demikian atribut TP bisa menjadi node cabang. Ada dua nilai atribut yaitu Normal dan Tidak Normal, dari nilai atribut itu masih memerlukan pehitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.3.
Gambar 4.3 Pohon keputusan Node 1.2 Sumber : (Penulis, 2018)
D. Node 1.3 TP nilai Normal
Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
Tabel 4.7 Pehitungan Node 1.3
No. ATTRIBUTE VALUE
ENTROPY INFORMATION
GAIN SPLIT INFO GAIN
No. ATTRIBUTE VALUE
ENTROPY INFORMATION
GAIN SPLIT INFO GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.7 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah Age dengan nilai 0,031107523, dengan demikian atribut Age bisa menjadi node cabang. Ada tiga nilai atribut yaitu <=32, 33...61, dan => 62, dari nilai atribut itu masih memerlukan pehitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.4.
Gambar 4.4 Pohon keputusan Node 1.3 Sumber : (Penulis, 2018)
1
E. Node 1.3.1 Age nilai <= 32 dan Node 1.3.2 Age nilai 33 ... 61 Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
Tabel 4.8 Pehitungan Node 1.3.1
No. ATTRIBUTE VALUE
ENTROPY INFORMATION GAIN
Sumber : (Penulis, 2018)
Tabel 4.9 Pehitungan Node 1.3.2
ENTROPY INFORMATION GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.8 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah TB dengan nilai 0,412598, terdapat dua nilai atribut dari TB yaitu Normal dan Tidak Normal. Hasil dari perhitungan tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga tidak memerlukan perhitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.5. Sedangkan pada tabel 4.9 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah DB dengan nilai 0,153910095, dengan demikian atribut DB
bisa menjadi node cabang. Ada dua nilai atribut yaitu Normal dan Tidak Normal, dari nilai atribut itu masih memerlukan pehitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.5.
Gambar 4.5 Pohon keputusan Node 1.3.1 dan 1.3.2 Sumber : (Penulis, 2018)
F. Node 1.3.2.1 DB nilai Normal
Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
1
Tabel 4.10 Pehitungan Node 1.3.2.1
ENTROPY INFORMATION GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.10 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah TB dengan nilai 6,5827261, dengan demikian atribut TB bisa menjadi node cabang. Ada dua nilai atribut yaitu Normal dan Tidak Normal, dari nilai atribut itu masih memerlukan pehitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.6.
Gambar 4.6 Pohon keputusan Node 1.3.2.1 Sumber : (Penulis, 2018)
G. Node 1.3.2.1.1 TB nilai Normal
Menghitung Jumlah kasus untuk keputusan Pasein dan Non Pasein, entropy dari semua kasus, dan perhitungan gain dari setiap atribut.
1
Tabel 4.11 Pehitungan Node 1.3.2.1.1
ENTROPY INFORMATION
GAIN
Sumber : (Penulis, 2018)
Dari tabel 4.11 dapat diketahui bahwa atribut dengan nilai gain tertinggi adalah SGOT dengan nilai 7,2605044, terdapat dua nilai atribut dari SGOT yaitu Normal dan Tidak Normal. Hasil dari perhitungan tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga tidak memerlukan perhitungan lebih lanjut. Dari hasil perhitungan tersebut dapat digambarkan pada gambar 4.7.
Gambar 4.7 Pohon keputusan Node 1.3.2.1.2 Sumber : (Penulis, 2018)
1
Pada pohon keputusan yang terbentuk pada gambar 4.7, diketahui bahwa semua kasus sudah masuk dalam kelas. Dengan demikian pohon keputusan yang terbentuk pada gambar 4.7 merupakan pohon keputusan yang terakhir.