• Tidak ada hasil yang ditemukan

Klasifikasi K-Means_Data Mining

N/A
N/A
Eka Nurhayati

Academic year: 2025

Membagikan "Klasifikasi K-Means_Data Mining"

Copied!
6
0
0

Teks penuh

(1)

Nama : Eka Nurhayati NIM : 22305141016 Kelas : Matematika B

Tugas 1 Data Mining

Data Rekomendasi Warga :

No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin

Kurang

Peduli Mampu

Tidak

Inisiatif Tidak 2 Cukup Peduli

Tidak

Mampu Inisiatif Ya

3 Rajin

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak

4 Rajin Peduli Mampu Inisiatif Ya

5 Rajin Peduli Mampu Inisiatif Ya

6 Cukup Peduli

Tidak

Mampu Inisiatif Ya

7 Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 8 Rajin Peduli

Tidak Mampu

Kurang

Inisiatif Ya

9 Rajin Peduli Mampu Inisiatif Ya

10 Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 11 Cukup

Kurang

Peduli Mampu

Kurang

Inisiatif Tidak

12 Rajin Peduli Mampu

Tidak

Inisiatif Ya

13 Cukup Peduli Mampu Inisiatif Ya

14 Rajin Peduli Mampu Inisiatif Ya

Hitunglah Nilai Entropy dan Gain data tersebut dan buat Decicion Tree dan rulenya untuk mengetahui apakah seorang warga direkomendasikan untuk jadi perwakilan warga atau tidak.

Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :

(2)

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,244905

Rajin 8 6 2 0,81127812

Cukup 4 3 1 0,81127812

Kurang 2 0 2 0

Lingkungan

0,402827

Kurang Peduli 3 0 3 0

Peduli 11 9 2 0,68403844

Kerjasama

0,048127

Mampu 8 6 2 0,8112781

Tidak Mampu 6 3 3 1

Prakarsa

0,539597

Inisiatif 7 7 0 0

Kurang Inisiatif 5 1 4 0,72192809

Tidak Inisiatif 2 1 1 1

Max Gain 0,539597

Berdasarkan hasil tersebut diperoleh :

1. Nilai Entropy total seluruh data berdasarkan kategori label kelasnya adalah 0,940285959 ≈ 0,94

2. Nilai Gain untuk masing-masing atribut berdasarkan kelasnya adalah a. Kehadiran adalah 0,244905 ≈ 0,245

b. Lingkungan adalah 0,402827 ≈ 0,403 c. Kerjasama adalah 0,048127 ≈ 0,048 d. Prakarsa adalah 0,539597 ≈ 0,540

3. Gain terbesar dari semua atribut yaitu 0,539597 ≈ 0,540 pada atribut Prakarsa yang akan menjadi root node dari Decision Tree.

Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Prakarsa, karena nilai Entropy dari Inisiatif sudah 0 maka tidak perlu dihitung lagi

(3)

a. Data Kurang Inisiatif

No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 2 Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 3 Rajin Peduli

Tidak Mampu

Kurang

Inisiatif Ya 4 Kurang

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak

5 Cukup Peduli Mampu

Kurang

Inisiatif Tidak

Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,797429

Rajin 2 1 1 1

Cukup 1 0 1 0

Kurang 2 0 2 0

Lingkungan

0,743508

Kurang Peduli 2 0 2 0

Peduli 3 1 2 0,91829583

Kerjasama

0,708492

Mampu 1 0 1 0

Tidak Mampu 4 1 3 0,81127812

Max Gain 0,797429

Gain terbesar dari semua atribut yaitu 0,797429 ≈ 0,780 pada atribut Kehadiran yang akan menjadi node 1.1 dari Decision Tree.

Lakukan perhitungan lagi untuk mencari nilai Entropy dan Gain dari atribut Kehadiran, karena nilai Entropy dari Cukup dan Kurang sudah 0 maka tidak perlu dihitung lagi

No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin

Kurang Peduli

Tidak Mampu

Kurang

Inisiatif Tidak 2 Rajin Peduli

Tidak Mampu

Kurang

Inisiatif Ya

(4)

Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Lingkungan

0,940286

Kurang Peduli 1 0 1 0

Peduli 1 1 0 0

Kerjasama

0,797429

Mampu 0 0 0 0

Tidak Mampu 2 1 1 1

Max Gain 0,940286

Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Kurang Inisiatif selesai.

b. Data Tidak Inisiatif

No Kehadiran Lingkungan Kerjasama Prakarsa Rekomendasi 1 Rajin

Kurang

Peduli Mampu

Tidak

Inisiatif Tidak

2 Rajin Peduli Mampu

Tidak

Inisiatif Ya

Akan dihitung nilai Entropy dan Gain menggunakan Excel, didapatkan hasil seperti pada tabel berikut :

Atribut Jumlah Ya Tidak Entropy Gain

Total 14 9 5 0,940285959

Kehadiran

0,797429

Rajin 2 1 1 1

Cukup 0 0 0 0

Kurang 0 0 0 0

Lingkungan

0,940286

Kurang Peduli 1 0 1 0

Peduli 1 1 0 0

Kerjasama

0,797429

Mampu 2 1 1 1

Tidak Mampu 0 0 0 0

(5)

Max Gain 0,940286

Gain terbesar dari semua atribut yaitu 0,940286 ≈ 0,940 pada atribut Lingkungan dimana Kurang Peduli dan Peduli nilainya sudah 0, maka perhitungan untuk Tidak Inisiatif selesai.

Soal :

1. Buatlah tree dan rule untuk permasalahan yang datanya ada di file excel

Rule Decision Tree :

1. Jika Prakarsa adalah Inisiatif maka = Ya

2. Jika Prakasa Tidak Inisiatif dan Lingkungan Kurang Peduli maka = Tidak 3. Jika Prakarsa Tidak Inisiatif dan Lingkungan Peduli maka = Ya

4. Jika Prakarsa Kurang Inisiatif dan Kehadiran Kurang maka = Tidak 5. Jika Prakarsa Kurang Inisiatif dan Kehadiran Cukup maka = Tidak

6. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Kurang Peduli maka = Tidak

Prakarsa

Ya Lingkungan Kehadiran

Inisiatif Kurang Inisiatif

Tidak Inisiatif

Tidak Ya

Peduli Kurang Peduli

Tidak Tidak Lingkungan

Rajin

Kurang

Cukup

Tidak Ya

Kurang Peduli Peduli

(6)

7. Jika Prakarsa Kurang Inisiatif, Kehadiran Rajin dan Lingkungan Peduli maka = Ya

2. Berapa persen besarnya error yang terjadi

𝑒𝑟𝑟𝑜𝑟 = (𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑆𝑎𝑙𝑎ℎ

𝑇𝑜𝑡𝑎𝑙 𝐷𝑎𝑡𝑎 ) × 100%

𝑒𝑟𝑟𝑜𝑟 (0

14) × 100% = 0%

Jadi, hasilnya 0% error karena tidak ada prediksi yang salah pada dataset yang diberikan.

Referensi

Dokumen terkait

Dalam penelitian ini, dilakukan analisis komparasi empat algoritma klasifikasi data mining yaitu logistic regression, decision tree, naïve bayes dan neural network

Metode yang diusulkan pada penelitian ini adalah penerapan K-Means sebagai model yang digunkan untuk dapat meningkatkan tingkat akurasi untuk klasifikasi jenis

Penelitian ini dilakukan untuk mempelajari data mining menggunakan algoritma K-Means yang diimplementasikan dalam pemilihan pelanggan potensial di MC Laundry.. data

Tujuan dari penelitian ini adalah menerapkan algoritam K- Means Clustering pada data penerimaan mahasiswa baru tahun ajaran 2014/2015(studi kasus : Universitas

Penelitian ini dilakukan untuk mempelajari data mining menggunakan algoritma K-Means yang diimplementasikan dalam pemilihan pelanggan potensial di MC Laundry.. data

Diperlukan algoritma lain selain K-Means clustering yang cocok untuk mendeteksi outlier pada data berdimensi tinggi, karena tidak semua data dapat ditangani oleh

Manfaat Clustering Kuliah 13 - Hierarchical and K-means Clustering ANR – Data Mining & Knowledge Management - 2022 Keuntungan penggunaan metode hierarki dalam analisis Cluster adalah

Berdasarkan hasil penelitian yang dilakukan untuk analisis kepuasan pengguna perpustakaan digital menggunakan algoritma K-Means dan decision tree, dapat disimpulkan bahwa dengan dataset