• Tidak ada hasil yang ditemukan

TUGAS DATA MINING ANALISIS KLASTER METOD

N/A
N/A
Protected

Academic year: 2018

Membagikan "TUGAS DATA MINING ANALISIS KLASTER METOD"

Copied!
7
0
0

Teks penuh

(1)

TUGAS DATA MINING

ANALISIS KLASTER METODE K-MEANS DAN METODE

SINGLE LINKAGE DENGAN MENGGUNAKAN

SOFTWARE R

Disusun oleh :

Nama

: Fahri Istiari

NIM

: 131.06.1001

Program Studi

: Statistika

Jurusan

: Statistika

FAKULTAS SAINS TERAPAN

INSTITUT SAINS & TEKNOLOGI AKPRIND

YOGYAKARTA

2017

(2)

Langkah-langkah :

1. Menentukan jumlah kluster yaitu k = 2

2. Data diberi nama fahri yang berisi tentang lokasi dengan minimal temperature

dan maximal temperature. Data disajikan sebagai berikut:

> fahri

lokasi min max

1 A 8.0 24.3

2 B 14.0 26.9

3 C 13.7 23.4

4 D 13.3 15.5

5 E 7.6 16.1

6 F 6.2 16.9

7 G 6.1 18.2

8 H 8.3 17.0

9 I 8.8 19.5

10 J 8.4 22.8

3. Membuat scatterplot dengan menggunakan syntax berikut:

> library(ggplot2)

> ggplot(fahri, aes(maxTemp, minTemp, color = lokasi)) + geom_point()

(3)

Output

scatterplot

telah

diperoleh,

sekarang

kita

telah

melihat

sebaran data,

sekarang

kita

coba

untuk

cluster

k-means.

Syntax yang

digunakan

sebagai

berikut:

> fahriCluster

<-kmeans(fahri[, 2:3], 2, nstart = 10)

> fahriCluster

Output :

K-means clustering with 2 clusters of sizes 4, 6

Cluster means:

minTemp maxTemp

1 11.025000 24.35

2 8.383333 17.20

Clustering vector:

[1] 1 1 1 2 2 2 2 2 2 1

Within cluster sum of squares by cluster:

[1] 41.85750 45.46833

(between_SS / total_SS = 61.5 %)

(4)

[1] "cluster" "centers" "totss" "withinss" "tot.withinss"

[6] "betweenss" "size"

> table(fahriCluster$cluster, fahri$lokasi)

A B C D E F G H I J

1 1 1 1 0 0 0 0 0 0 1

2 0 0 0 1 1 1 1 1 1 0

Interpretasi :

> table(fahriCluster$cluster, fahri$lokasi)

A B C D E F G H I J

1 1 1 1 0 0 0 0 0 0 1

2 0 0 0 1 1 1 1 1 1 0

Tabel diatas menjelaskan bahwa untuk lokasi A,B,C, dan J Masuk kelam klaster 1

sedangkan lokasi DEFGHI masuk kedalam lokasi 2

(5)

Langkah-langkah :

1. Menentukan jumlah kluster yaitu k = 2

2. Data diberi nama fahri yang berisi tentang lokasi dengan minimal temperature

dan maximal temperature. Data disajikan sebagai berikut:

> fahri

lokasi minTemp maxTemp

1 A 8.0 24.3

2 B 14.0 26.9

3 C 13.7 23.4

4 D 13.3 15.5 5 E 7.6 16.1

6 F 6.2 16.9

7 G 6.1 18.2

8 H 8.3 17.0

9 I 8.8 19.5

10 J 8.4 22.8

3. Membuat scatterplot dengan menggunakan syntax berikut:

> clusters<-hclust(dist(fahri[,2:2]))

> plot(clusters)

(6)

4. Analisis klaster dengan menggunakan hirarki (Single linkage):

> clusters<-hclust(dist(fahri[,2:3]),method='single')

(7)

Interpretasi:

Referensi

Dokumen terkait

Kriteria pengambilan keputusannya adalah, apabila t hitung lebih kecil atau sama dengan t tabel , maka menerima Ho yang berarti prestasi belajar mahasiswa tidak

Metode Penelitian yang digunakan dalam pembuatan laporan Tugas Akhir ini, yaitu menggunakan metode pendekatan deskriptif melalui variabel percobaan yang telah tersedia

Penelitian ini dilakukan dengan tujuan untuk mengetahui efektivitas formulasi campuran bahan ekstrak daun kayu putih dan kayu pinus terdegradasi jamur, dengan campuran

Nyanyian ini ditulis pertama kali oleh Charles Wesley pada tahun 1739. Lagu ini adalah lagu natal pertama bagi Charles, yang diaransemen oleh F. Mendelssohn yang merupakan

Secara umum, pengaruh awal campuran boraks dan asam borat sebagai bahan pengawet kayu khususnya untuk perlakuan A, B, dan C mempunyai pengaruh yang baik terhadap

Indikator pemantauan dan evaluasi dalam Badan Penelitian dan Pengembangan dilakukan untuk menilai hasil pelaksanaan kegiatan yang telah dilakukan oleh Unsur

Penggunaan lahan hutan hanya berada di kecamatan Kawalu yang luasnya 150,3 ha atau 0,87%, sedangkan penggunaan lahan permukiman seluas 4.718,10 ha atau 27,5 % dari luas

2 Sehubungan dengan itu, saat ini peremajaan atau penanaman ulang tanaman kelapa sawit adalah aktivitas utama yang harus dilakukan untuk menjaga keberlanjutan