Nama : Eka Nurhayati NIM : 22305141016 Kelas : Matematika B
Tugas 1 Data Mining
Data Rekomendasi Warga :
No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin
Kurang
Peduli Mampu
Tidak
Inisiatif Tidak 2 Cukup Peduli
Tidak
Mampu Inisiatif Ya
3 Rajin
Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak
4 Rajin Peduli Mampu Inisiatif Ya
5 Rajin Peduli Mampu Inisiatif Ya
6 Cukup Peduli
Tidak
Mampu Inisiatif Ya
7 Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak 8 Rajin Peduli
Tidak Mampu
Kurang
Inisiatif Ya
9 Rajin Peduli Mampu Inisiatif Ya
10 Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak 11 Cukup
Kurang
Peduli Mampu
Kurang
Inisiatif Tidak
12 Rajin Peduli Mampu
Tidak
Inisiatif Ya
13 Cukup Peduli Mampu Inisiatif Ya
14 Rajin Peduli Mampu Inisiatif Ya
Hitunglah Nilai Entropy dan Gain data tersebut dan buat Decicion Tree dan rulenya untuk mengetahui apakah seorang warga direkomendasikan untuk jadi perwakilan warga atau tidak.
Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :
Atribut Jumlah Ya Tidak Entropy Gain
Total 14 9 5 0,940285959
Kehadiran
0,244905
Rajin 8 6 2 0,81127812
Cukup 4 3 1 0,81127812
Kurang 2 0 2 0
Lingkungan
0,402827
Kurang Peduli 3 0 3 0
Peduli 11 9 2 0,68403844
Kerjasama
0,048127
Mampu 8 6 2 0,8112781
Tidak Mampu 6 3 3 1
Prakarsa
0,539597
Inisiatif 7 7 0 0
Kurang Inisiatif 5 1 4 0,72192809
Tidak Inisiatif 2 1 1 1
Max Gain 0,539597
Berdasarkan hasil tersebut diperoleh :
1. Nilai Entropy total seluruh data berdasarkan kategori label kelasnya adalah 0,940285959 ≈ 0,94
2. Nilai Gain untuk masing-masing atribut berdasarkan kelasnya adalah a. Kehadiran adalah 0,244905 ≈ 0,245
b. Lingkungan adalah 0,402827 ≈ 0,403 c. Kerjasama adalah 0,048127 ≈ 0,048 d. Prakarsa adalah 0,539597 ≈ 0,540
3. Gain terbesar dari semua atribut yaitu 0,539597 ≈ 0,540 pada atribut Prakarsa yang akan menjadi root node dari Decision Tree.
Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Prakarsa, karena nilai Entropy dari Inisiatif sudah 0 maka tidak perlu dihitung lagi
a. Data Kurang Inisiatif
No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin
Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak 2 Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak 3 Rajin Peduli
Tidak Mampu
Kurang
Inisiatif Ya 4 Kurang
Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak
5 Cukup Peduli Mampu
Kurang
Inisiatif Tidak
Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :
Atribut Jumlah Ya Tidak Entropy Gain
Total 14 9 5 0,940285959
Kehadiran
0,797429
Rajin 2 1 1 1
Cukup 1 0 1 0
Kurang 2 0 2 0
Lingkungan
0,743508
Kurang Peduli 2 0 2 0
Peduli 3 1 2 0,91829583
Kerjasama
0,708492
Mampu 1 0 1 0
Tidak Mampu 4 1 3 0,81127812
Max Gain 0,797429
Gain terbesar dari semua atribut yaitu 0,797429 ≈ 0,780 pada atribut Kehadiran yang akan menjadi node 1.1 dari Decision Tree.
Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Kehadiran, karena nilai Entropy dari Cukup dan Kurang sudah 0 maka tidak perlu dihitung lagi
No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin
Kurang Peduli
Tidak Mampu
Kurang
Inisiatif Tidak 2 Rajin Peduli
Tidak Mampu
Kurang
Inisiatif Ya
Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :
Atribut Jumlah Ya Tidak Entropy Gain
Total 14 9 5 0,940285959
Lingkungan
0,940286
Kurang Peduli 1 0 1 0
Peduli 1 1 0 0
Kerjasama
0,797429
Mampu 0 0 0 0
Tidak Mampu 2 1 1 1
Max Gain 0,940286
Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Kurang Inisiatif selesai.
b. Data Tidak Inisiatif
No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin
Kurang
Peduli Mampu
Tidak
Inisiatif Tidak
2 Rajin Peduli Mampu
Tidak
Inisiatif Ya
Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :
Atribut Jumlah Ya Tidak Entropy Gain
Total 14 9 5 0,940285959
Kehadiran
0,797429
Rajin 2 1 1 1
Cukup 0 0 0 0
Kurang 0 0 0 0
Lingkungan
0,940286
Kurang Peduli 1 0 1 0
Peduli 1 1 0 0
Kerjasama
0,797429
Mampu 2 1 1 1
Tidak Mampu 0 0 0 0
Max Gain 0,940286
Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Tidak Inisiatif selesai.
Soal :
1. Buatlah tree dan rule untuk permasalahan yang datanya ada di file excel
Rule Decision Tree :
1. Jika Prakarsa adalah Inisiatif maka = Ya
2. Jika Prakasa Tidak Inisiatif dan Lingkungan Kurang Peduli maka = Tidak 3. Jika Prakarsa Tidak Inisiatif dan Lingkungan Peduli maka = Ya
4. Jika Prakarsa Kurang Inisiatif dan Kehadiran Kurang maka = Tidak 5. Jika Prakarsa Kurang Inisiatif dan Kehadiran Cukup maka = Tidak
6. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Kurang Peduli maka = Tidak
Prakarsa
Ya Lingkungan Kehadiran
Inisiatif Kurang Inisiatif
Tidak Inisiatif
Tidak Ya
Peduli Kurang Peduli
Tidak Tidak Lingkungan
Rajin
Kurang
Cukup
Tidak Ya
Kurang Peduli Peduli
7. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Peduli maka = Ya
2. Berapa persen besarnya error yang terjadi
𝑒𝑟𝑟𝑜𝑟 = (𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑆𝑎𝑙𝑎ℎ
𝑇𝑜𝑡𝑎𝑙 𝐷𝑎𝑡𝑎 ) × 100%
𝑒𝑟𝑟𝑜𝑟 (0
14) × 100% = 0%
Jadi, hasilnya 0% error karena tidak ada prediksi yang salah pada dataset yang diberikan.