• Tidak ada hasil yang ditemukan

IF MATERI DATA MINING PERTEMUAN 04

N/A
N/A
Protected

Academic year: 2017

Membagikan "IF MATERI DATA MINING PERTEMUAN 04"

Copied!
13
0
0

Teks penuh

(1)
(2)

Algoritma K-Means

K-means merupakan metode clustering secara

partitioning yang memisahkan data ke dalam kelompok

yang berbeda

Dengan partitioning secara iteratif, K-Means

(3)

Dasar algoritma K-means adalah sebagai berikut : 1. Tentukan nilai k sebagai jumlah klaster yang

ingin dibentuk.

2. Bangkitkan k centroid (titik pusat klaster) awal secara random.

3. Hitung jarak setiap data ke masing-masing

centroid menggunakan rumus korelasi antar dua objek yaitu Euclidean Distance

(4)

5. Tentukan posisi centroid baru (Ck ) dengan cara

menghitung nilai rata-rata dari data-data yang

ada pada centroid yang sama.

Dimana nk adalah jumlah dokumen dalam

cluster k dan di adalah dokumen dalam cluster k.

(5)

Contoh :

Dengan menggunakan Algoritma K-Means, temukan

grup terbaik dari dua cluster berikut :

(6)
(7)

Asumsi:

Semua data akan dikelompokkan ke dalam dua

kelas

(8)

Iterasi 1

a. Menghitung Euclidean Distance dari semua data ke

tiap titik pusat pertama

√15.49

√16.48

√0.88

(9)

Dengan cara yang sama hitung jarak tiap titik ke titik

pusat ke-2 dan kita akan mendapatkan

(10)

b. Dari penghitungan Euclidean distance, kita dapat membandingkan:

M1 M2 M3 M4 M5 M6 M7 jarak ke C1 1.41 1.80 2.06 3.94 4.06 0.94 1.12

C2 4.12 4.27 1.12 1.87 1.22 2.62 2.06

(11)

c. Hitung titik pusat baru

(12)

Iterasi ke 2

a. Hitung Euclidean distance dari tiap data ke titik pusat yang baru Dengan cara yang sama dengan

iterasi pertama kita akan mendapatkan perbandingan sebagai berikut:

M1 M2 M3 M4 M5 M6 M7 Jarak ke C1 0.88 1.04 2.57 4.55 4.55 0.64 1.21

(13)

b. Dari perbandingan tersebut kita tahu bahwa {M1 , M2 , M6 , M7 } anggota C1 dan

{M3 , M4 , M5 } anggota C2

c. Karena anggota kelompok tidak ada yang berubah

maka titik pusat pun tidak akan berubah.

Kesimpulan

{M

1

, M

2

, M

6

, M

7

} anggota C

1

dan

Referensi

Dokumen terkait

Basis data adalah suatu kumpulan data terhubung ( interralated data ) yang disimpan secara bersama-sama pada suatu media, tanpa mengatap satu sama lain atau tidak perlu

Untuk melihat data yang telah dipilih pada langkah pertama, dapat dilakukan dengan meletakkan widget Data Table di kanvas yang terdapat pada tabulasi yang sama dengan

Untuk melihat data yang telah dipilih pada langkah pertama, dapat dilakukan dengan meletakkan widget Data Table di kanvas yang terdapat pada tabulasi yang sama dengan

logical maupun fisik dari data warehouse [2] , pemilihan data pada sumber data yaitu data penelitian yang telah ada, dan dilanjutkan dengan pemodelan data dimensional.g.

Pandangan tentang proses eksekusi suatu program adalah dengan mengambil pengolahan instruksi yang terdiri dari dua langkah yang diperlukan untuk instruksi tunggal

Hampir sama dengan tahap 4, yaitu menentukan anggota cluster dengan menghitung jarak minimum tiap object dengan centroid baru yang telah dihasilkan. K-means Algoritma merupakan

Sekumpulan nilai data akan terdistribusi secara normal (membentuk kurva yang simetris) apabila rata-rata nilai variabel sama dengan median dan sama

Menentukan titik pusat klaster yang baru, dengan cara menentukan rata-rata dari data yang terletak pada klaster yang sama.. Berikut adalah pusat klaster