TUGAS DATA MINING
ANALISIS KLASTER METODE K-MEANS DAN METODE
SINGLE LINKAGE DENGAN MENGGUNAKAN
SOFTWARE R
Disusun oleh :
Nama
: Fahri Istiari
NIM
: 131.06.1001
Program Studi
: Statistika
Jurusan
: Statistika
FAKULTAS SAINS TERAPAN
INSTITUT SAINS & TEKNOLOGI AKPRIND
YOGYAKARTA
2017
Langkah-langkah :
1. Menentukan jumlah kluster yaitu k = 2
2. Data diberi nama fahri yang berisi tentang lokasi dengan minimal temperature
dan maximal temperature. Data disajikan sebagai berikut:
> fahri
lokasi min max
1 A 8.0 24.3
2 B 14.0 26.9
3 C 13.7 23.4
4 D 13.3 15.5
5 E 7.6 16.1
6 F 6.2 16.9
7 G 6.1 18.2
8 H 8.3 17.0
9 I 8.8 19.5
10 J 8.4 22.8
3. Membuat scatterplot dengan menggunakan syntax berikut:
> library(ggplot2)
> ggplot(fahri, aes(maxTemp, minTemp, color = lokasi)) + geom_point()
Output
scatterplot
telah
diperoleh,
sekarang
kita
telah
melihat
sebaran data,
sekarang
kita
coba
untuk
cluster
k-means.
Syntax yang
digunakan
sebagai
berikut:
> fahriCluster
<-kmeans(fahri[, 2:3], 2, nstart = 10)
> fahriCluster
Output :
K-means clustering with 2 clusters of sizes 4, 6
Cluster means:
minTemp maxTemp
1 11.025000 24.35
2 8.383333 17.20
Clustering vector:
[1] 1 1 1 2 2 2 2 2 2 1
Within cluster sum of squares by cluster:
[1] 41.85750 45.46833
(between_SS / total_SS = 61.5 %)
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size"
> table(fahriCluster$cluster, fahri$lokasi)
A B C D E F G H I J
1 1 1 1 0 0 0 0 0 0 1
2 0 0 0 1 1 1 1 1 1 0
Interpretasi :
> table(fahriCluster$cluster, fahri$lokasi)
A B C D E F G H I J
1 1 1 1 0 0 0 0 0 0 1
2 0 0 0 1 1 1 1 1 1 0
Tabel diatas menjelaskan bahwa untuk lokasi A,B,C, dan J Masuk kelam klaster 1
sedangkan lokasi DEFGHI masuk kedalam lokasi 2
Langkah-langkah :
1. Menentukan jumlah kluster yaitu k = 2
2. Data diberi nama fahri yang berisi tentang lokasi dengan minimal temperature
dan maximal temperature. Data disajikan sebagai berikut:
> fahri
lokasi minTemp maxTemp
1 A 8.0 24.3
2 B 14.0 26.9
3 C 13.7 23.4
4 D 13.3 15.5 5 E 7.6 16.1
6 F 6.2 16.9
7 G 6.1 18.2
8 H 8.3 17.0
9 I 8.8 19.5
10 J 8.4 22.8
3. Membuat scatterplot dengan menggunakan syntax berikut:
> clusters<-hclust(dist(fahri[,2:2]))
> plot(clusters)
4. Analisis klaster dengan menggunakan hirarki (Single linkage):
> clusters<-hclust(dist(fahri[,2:3]),method='single')
Interpretasi: