Klasifikasi K-Means_Data Mining

(1)

Nama : Eka Nurhayati NIM : 22305141016 Kelas : Matematika B

Tugas 1 Data Mining

Data Rekomendasi Warga :

No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin

Kurang

Peduli Mampu

Tidak

Inisiatif Tidak 2 Cukup Peduli

Tidak

Mampu Inisiatif Ya

3 Rajin

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak

4 Rajin Peduli Mampu Inisiatif Ya

6 Cukup Peduli

Tidak

Mampu Inisiatif Ya

7 Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 8 Rajin Peduli

Tidak Mampu

Kurang

Inisiatif Ya

10 Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 11 Cukup

Kurang

Peduli Mampu

Kurang

Inisiatif Tidak

12 Rajin Peduli Mampu

Tidak

Inisiatif Ya

13 Cukup Peduli Mampu Inisiatif Ya

Hitunglah Nilai Entropy dan Gain data tersebut dan buat Decicion Tree dan rulenya untuk mengetahui apakah seorang warga direkomendasikan untuk jadi perwakilan warga atau tidak.

Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :

(2)

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,244905

Rajin 8 6 2 0,81127812

Cukup 4 3 1 0,81127812

Kurang 2 0 2 0

Lingkungan

0,402827

Kurang Peduli 3 0 3 0

Peduli 11 9 2 0,68403844

Kerjasama

0,048127

Mampu 8 6 2 0,8112781

Tidak Mampu 6 3 3 1

Prakarsa

0,539597

Inisiatif 7 7 0 0

Kurang Inisiatif 5 1 4 0,72192809

Tidak Inisiatif 2 1 1 1

Max Gain 0,539597

Berdasarkan hasil tersebut diperoleh :

1. Nilai Entropy total seluruh data berdasarkan kategori label kelasnya adalah 0,940285959 ≈ 0,94

2. Nilai Gain untuk masing-masing atribut berdasarkan kelasnya adalah a. Kehadiran adalah 0,244905 ≈ 0,245

b. Lingkungan adalah 0,402827 ≈ 0,403 c. Kerjasama adalah 0,048127 ≈ 0,048 d. Prakarsa adalah 0,539597 ≈ 0,540

3. Gain terbesar dari semua atribut yaitu 0,539597 ≈ 0,540 pada atribut Prakarsa yang akan menjadi root node dari Decision Tree.

Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Prakarsa, karena nilai Entropy dari Inisiatif sudah 0 maka tidak perlu dihitung lagi

(3)

a. Data Kurang Inisiatif

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 2 Kurang Peduli

Tidak Mampu

Kurang

Tidak Mampu

Kurang

Inisiatif Ya 4 Kurang

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak

5 Cukup Peduli Mampu

Kurang

Inisiatif Tidak

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,797429

Rajin 2 1 1 1

Cukup 1 0 1 0

Kurang 2 0 2 0

Lingkungan

0,743508

Peduli 3 1 2 0,91829583

Kerjasama

0,708492

Mampu 1 0 1 0

Tidak Mampu 4 1 3 0,81127812

Max Gain 0,797429

Gain terbesar dari semua atribut yaitu 0,797429 ≈ 0,780 pada atribut Kehadiran yang akan menjadi node 1.1 dari Decision Tree.

Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Kehadiran, karena nilai Entropy dari Cukup dan Kurang sudah 0 maka tidak perlu dihitung lagi

Kurang Peduli

Tidak Mampu

Kurang

Tidak Mampu

Kurang

Inisiatif Ya

(4)

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Lingkungan

0,940286

Peduli 1 1 0 0

Kerjasama

0,797429

Mampu 0 0 0 0

Tidak Mampu 2 1 1 1

Max Gain 0,940286

Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Kurang Inisiatif selesai.

b. Data Tidak Inisiatif

Kurang

Peduli Mampu

Tidak

Inisiatif Tidak

2 Rajin Peduli Mampu

Tidak

Inisiatif Ya

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,797429

Rajin 2 1 1 1

Cukup 0 0 0 0

Kurang 0 0 0 0

Lingkungan

0,940286

Peduli 1 1 0 0

Kerjasama

0,797429

Mampu 2 1 1 1

Tidak Mampu 0 0 0 0

(5)

Max Gain 0,940286

Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Tidak Inisiatif selesai.

Soal :

1. Buatlah tree dan rule untuk permasalahan yang datanya ada di file excel

Rule Decision Tree :

1. Jika Prakarsa adalah Inisiatif maka = Ya

2. Jika Prakasa Tidak Inisiatif dan Lingkungan Kurang Peduli maka = Tidak 3. Jika Prakarsa Tidak Inisiatif dan Lingkungan Peduli maka = Ya

4. Jika Prakarsa Kurang Inisiatif dan Kehadiran Kurang maka = Tidak 5. Jika Prakarsa Kurang Inisiatif dan Kehadiran Cukup maka = Tidak

6. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Kurang Peduli maka = Tidak

Prakarsa

Ya Lingkungan Kehadiran

Inisiatif Kurang Inisiatif

Tidak Inisiatif

Tidak Ya

Peduli Kurang Peduli

Tidak Tidak Lingkungan

Rajin

Kurang

Cukup

Tidak Ya

Kurang Peduli Peduli

(6)

7. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Peduli maka = Ya

2. Berapa persen besarnya error yang terjadi

𝑒𝑟𝑟𝑜𝑟 = (𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑆𝑎𝑙𝑎ℎ

𝑇𝑜𝑡𝑎𝑙 𝐷𝑎𝑡𝑎 ) × 100%

𝑒𝑟𝑟𝑜𝑟 (0

14) × 100% = 0%

Jadi, hasilnya 0% error karena tidak ada prediksi yang salah pada dataset yang diberikan.