• Tidak ada hasil yang ditemukan

5 6 7 8 9

Mat Fis Bio Sej Kew Sos Seni

Mata Ajaran

N

il

a

i

Andi Benny Budi Ika Maya Ana

13. Cluster Analysis

Plot Profil

13. Cluster Analysis

1. Metode aglomeratif

2. Metode berhirarki divisif (pemisahan)

Beberapa ukuran ketakmiripan antar gerombol : • Pautan Tunggal • Pautan Lengkap • Pautan Centroid • Pautan Median • Pautan Rataan

13. Cluster Analysis

Penggerombolan Berhirarki

• Pautan Tunggal (Single Linkage = Nearest Neighbor) Jarak antar dua gerombol diukur dengan jarak terdekat

antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.

h(Br, Bs) = min { d(xi, xj); xi anggota Br, dan xj anggota Bs }

13. Cluster Analysis

• Pautan Lengkap (Complete Linkage = Farthest Neighbor)

Jarak antar dua gerombol diukur dengan jarak terjauh antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.

h(Br, Bs) = max { d(xi, xj); xi anggota Br, dan xj anggota Bs }

13. Cluster Analysis

Penggerombolan Berhirarki

• Pautan Centroid (Centroid Linkage)

Jarak antara dua buah gerombol diukur sebagai jarak Euclidean antara kedua rataan (centroid) gerombol. Jika dan adalah vektor rataan (centroid) dari

gerombol Br dan Bs, maka jarak kedua gerombol tersebut didefinisikan sebagai :

Jarak yang baru didefinisikan sebagai :

r

x x

s s r s s r r

n

n

n

n

x

x

13. Cluster Analysis

Penggerombolan Berhirarki

• Pautan Median (Median Linkage)

Jarak antar gerombol didefinisikan sebagai jarak antar median, dan gerombol-gerombol dengan jarak terkecil akan digabungkan.

Median untuk gerombol yang baru adalah Mbaru = 2 s r m m

13. Cluster Analysis

Penggerombolan Berhirarki

• Pautan Rataan (Average Linkage)

Jarak antara dua buah gerombol, Br dan Bs

didefinisikan sebagai rataan dari nrns jarak yang dihitung antara xi anggota Br dan xj anggota Bs

13. Cluster Analysis

• Dari ilustrasi sebelumnya, digunakan konsep jarak Euclidian dan diperoleh matriks jarak sbb :

13. Cluster Analysis

Penggerombolan Berhirarki: Ilustrasi

Dengan menggunakan konsep Single lingkage diperoleh hasil dalam bentuk dendogram sebagai berikut :

13. Cluster Analysis

Metode K rataan (k-means) Algoritmanya sbb :

1. Tentukan besarnya k, yaitu banyaknya gerombol, dan tentukan juga centroid di tiap gerombol.

2. Hitung jarak antara setiap objek dengan setiap centroid. 3. Hitung kembali rataan (centroid) untuk gerombol yang

baru terbentuk.

4. Ulangi langkah 2 sampai tidak ada lagi pemindahan objek antar gerombol.

13. Cluster Analysis

Penggerombolan Tak Berhirarki

• Misalkan ada dua peubah X1 dan X2 yang tiap objeknya diberi nama A, B, C dan D. Datanya sebagai berikut:

13. Cluster Analysis

1. Dikelompokkan ke dalam 2 kelompok. Centroid dipilih secara acak : c1 = (2, 2) dan c2 = (-1, -2).

2. Jarak yang digunakan jarak Euclidian. Memasukkan objek ke gerombol berpatokan pada jarak terdekat Diperoleh matriks jarak sbb :

13. Cluster Analysis

Penggerombolan Tak Berhirarki: Ilustrasi

3. Hitung centroid baru, rataan dari vektor masing-masing unsur.

c1 = (5, 3)

c2 = [(-1, 1) + (1, -2) + (-3, -2)]/3 = (-1, -1) Diperoleh matriks yang sbb :

Diperoleh 2 gerombol : G1 = {A} dan G2 = {B, C, D}.

13. Cluster Analysis

• Biplot diperkenalkan pertama kali oleh Gabriel (1971) sehingga sering disebut sebagai Gabriel’s biplot.

• Metode ini tergolong dalam analisis eksplorasi peubah ganda yang ditujukan untuk menyajikan data peubah ganda dalam peta dua dimensi, sehingga perilaku data mudah dilihat dan diinterpretasikan.

13. Biplot

Biplot adalah teknik statistika deskriptif yang dapat disajikan secara visual guna menyajikan secara simultan n obyek pengamatan dan p peubah dalam ruang bidang datar, sehingga ciri-ciri peubah dan obyek pengamatan serta posisi relatif antar obyek pengamatan dengan peubah dapat dianalisis. (Jollife, 1986 & Rawlings 1988).

13. Biplot

Definisi

1. Hubungan antar peubah

2. Kemiripan relatif antar obyek pengamatan

3. Posisi relatif antar obyek pengamatan dengan peubah 4. Nilai peubah pada suatu objek

13. Biplot

Biplot merupakan teknik statistika deskriptif dimensi ganda yang mendasarkan pada penguraian nilai singular (PNS) atau Singular Value Decomposition (SVD).

Misalkan suatu matriks data X berukuran nxp yang berisi n pengamatan dan p peubah yang dikoreksi terhadap nilai rata-ratanya dan berpangkat r, dapat dituliskan menjadi

X = U L A’

13. Biplot

Konsep Dasar

Keterangan :

matriks U dan A masing-masing berukuran (nxr) dan (pxr)

sehingga U’U = A’A = Ir

L adalah matrik diagonal berukuran (rxr) dengan unsur-unsur diagonalnya adalah akar kuadrat dari akar ciri X’X atau XX’ sehingga

1  2 .... r

13. Biplot

Kolom matris A adalah vektor ciri yang berpadanan dengan akar ciri  dari matrik X’X atau XX’.

Lajur-lajur matrik U dapat dihitung melalui :

Dengan i adalah akar ciri ke-i dari matrik X’X dan ai adalah lajur ke-i matrik A.

i i a    1 Ui

13. Biplot

Konsep Dasar

n

X

r

=

n

U

r r

L

r r

A

p

A = [a

1

, a

2

, …,a

r

]

r 2 1 0 0 0 0 0 0 L   r r a a a 1 ,..., 1 , 1 U 2 2 1 1

13. Biplot

Konsep Dasar: SVD

• X = U L L1- A’ = G H’

• Misalkan G = U L serta H’ = L1- A’

Unsur ke-(i,j) matriks X dapat dituliskan sbb : X ij = gihj

dimana: i = 1,2,3,...,n j = 1,2,3,...,p

dengan gi’dan hj masing-masing merupakan baris-baris matriks G dan H

Jika r(X)=2 maka gi dan hj digambarkan dalam ruang berdimensi 2

13. Biplot

Konsep Dasar: SVD

• Jika  = 1, maka G = UL dan H = A, sehingga diperoleh hubungan: X’X = (GH’)(GH’)’ = GH’ HG’ = GA’ AG’ = GG’

• Jika  = 0 maka G = U dan H = AL, sehingga diperoleh X’X = (GH’)’(GH’) = HG’ GH’ = HU’ UH’ = HH’

13. Biplot

Konsep Dasar: SVD

1. Kedekatan antar obyek.

Dua obyek dengan karakteristik sama akan digambarkan sebagai dua faktor yang posisi-nya berdekatan.

2. Keragaman peubah.

Peubah dengan keragaman kecil digambarkan sebagai vektor yang pendek. Begitu pula sebaliknya.

13. Biplot

Informasi yang Bisa Diperoleh

3. Hubungan antar peubah :

Jika sudut dua peubah < 900 maka korelasi bersifat positif Jika sudut dua peubah > 900 maka korelasi bersifat

negatif

Semakin kecil sudutnya, maka semakin kuat korelasinya. 4. Nilai peubah pada suatu obyek.

Karakteristik suatu obyek bisa disimpulkan dari posisi relatifnya yang paling dekat dengan suatu peubah.

13. Biplot

• Ilustrasi berikut memberikan penerapan BIPLOT untuk menilai posisi relatif sembilan negara ASEAN menurut indikator

pembangunan berkelanjutan (sustatinable development indicators).

Ada 9 variabel yang dimasukkan.

13. Biplot

Ilustrasi

13. Biplot

13. Biplot

Ilustrasi

Biplot Analysis

13. Biplot

Perusahaan penyedia jasa layanan kartu kredit harus mampu membuat fungsi diskriminan yang mampu memisahkan calon pemegang kartu yang potensial melakukan transaksi dan yang tidak (idle) berdasarkan data dalam formulir aplikasi.

X mampu menjadi

pembeda, tetapi Y tidak pembeda, tetapi X tidak Y mampu menjadi

13. Diskriminan

Prinsip Dasar

X dan Y saja tidak mampu Membutuhkan fungsi non-linear

13. Diskriminan

Bersambung …….

Dokumen terkait