5 6 7 8 9
Mat Fis Bio Sej Kew Sos Seni
Mata Ajaran
N
il
a
i
Andi Benny Budi Ika Maya Ana
13. Cluster Analysis
Plot Profil
13. Cluster Analysis
1. Metode aglomeratif
2. Metode berhirarki divisif (pemisahan)
Beberapa ukuran ketakmiripan antar gerombol : • Pautan Tunggal • Pautan Lengkap • Pautan Centroid • Pautan Median • Pautan Rataan
13. Cluster Analysis
Penggerombolan Berhirarki• Pautan Tunggal (Single Linkage = Nearest Neighbor) Jarak antar dua gerombol diukur dengan jarak terdekat
antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.
h(Br, Bs) = min { d(xi, xj); xi anggota Br, dan xj anggota Bs }
13. Cluster Analysis
• Pautan Lengkap (Complete Linkage = Farthest Neighbor)
Jarak antar dua gerombol diukur dengan jarak terjauh antara sebuah objek dalam gerombol yang satu dengan sebuah objek dalam gerombol yang lain.
h(Br, Bs) = max { d(xi, xj); xi anggota Br, dan xj anggota Bs }
13. Cluster Analysis
Penggerombolan Berhirarki
• Pautan Centroid (Centroid Linkage)
Jarak antara dua buah gerombol diukur sebagai jarak Euclidean antara kedua rataan (centroid) gerombol. Jika dan adalah vektor rataan (centroid) dari
gerombol Br dan Bs, maka jarak kedua gerombol tersebut didefinisikan sebagai :
Jarak yang baru didefinisikan sebagai :
r
x x
s s r s s r rn
n
n
n
x
x
13. Cluster Analysis
Penggerombolan Berhirarki• Pautan Median (Median Linkage)
Jarak antar gerombol didefinisikan sebagai jarak antar median, dan gerombol-gerombol dengan jarak terkecil akan digabungkan.
Median untuk gerombol yang baru adalah Mbaru = 2 s r m m
13. Cluster Analysis
Penggerombolan Berhirarki• Pautan Rataan (Average Linkage)
Jarak antara dua buah gerombol, Br dan Bs
didefinisikan sebagai rataan dari nrns jarak yang dihitung antara xi anggota Br dan xj anggota Bs
13. Cluster Analysis
• Dari ilustrasi sebelumnya, digunakan konsep jarak Euclidian dan diperoleh matriks jarak sbb :
13. Cluster Analysis
Penggerombolan Berhirarki: Ilustrasi
Dengan menggunakan konsep Single lingkage diperoleh hasil dalam bentuk dendogram sebagai berikut :
13. Cluster Analysis
Metode K rataan (k-means) Algoritmanya sbb :
1. Tentukan besarnya k, yaitu banyaknya gerombol, dan tentukan juga centroid di tiap gerombol.
2. Hitung jarak antara setiap objek dengan setiap centroid. 3. Hitung kembali rataan (centroid) untuk gerombol yang
baru terbentuk.
4. Ulangi langkah 2 sampai tidak ada lagi pemindahan objek antar gerombol.
13. Cluster Analysis
Penggerombolan Tak Berhirarki
• Misalkan ada dua peubah X1 dan X2 yang tiap objeknya diberi nama A, B, C dan D. Datanya sebagai berikut:
13. Cluster Analysis
1. Dikelompokkan ke dalam 2 kelompok. Centroid dipilih secara acak : c1 = (2, 2) dan c2 = (-1, -2).
2. Jarak yang digunakan jarak Euclidian. Memasukkan objek ke gerombol berpatokan pada jarak terdekat Diperoleh matriks jarak sbb :
13. Cluster Analysis
Penggerombolan Tak Berhirarki: Ilustrasi
3. Hitung centroid baru, rataan dari vektor masing-masing unsur.
c1 = (5, 3)
c2 = [(-1, 1) + (1, -2) + (-3, -2)]/3 = (-1, -1) Diperoleh matriks yang sbb :
Diperoleh 2 gerombol : G1 = {A} dan G2 = {B, C, D}.
13. Cluster Analysis
• Biplot diperkenalkan pertama kali oleh Gabriel (1971) sehingga sering disebut sebagai Gabriel’s biplot.
• Metode ini tergolong dalam analisis eksplorasi peubah ganda yang ditujukan untuk menyajikan data peubah ganda dalam peta dua dimensi, sehingga perilaku data mudah dilihat dan diinterpretasikan.
13. Biplot
Biplot adalah teknik statistika deskriptif yang dapat disajikan secara visual guna menyajikan secara simultan n obyek pengamatan dan p peubah dalam ruang bidang datar, sehingga ciri-ciri peubah dan obyek pengamatan serta posisi relatif antar obyek pengamatan dengan peubah dapat dianalisis. (Jollife, 1986 & Rawlings 1988).
13. Biplot
Definisi
1. Hubungan antar peubah
2. Kemiripan relatif antar obyek pengamatan
3. Posisi relatif antar obyek pengamatan dengan peubah 4. Nilai peubah pada suatu objek
13. Biplot
Biplot merupakan teknik statistika deskriptif dimensi ganda yang mendasarkan pada penguraian nilai singular (PNS) atau Singular Value Decomposition (SVD).
Misalkan suatu matriks data X berukuran nxp yang berisi n pengamatan dan p peubah yang dikoreksi terhadap nilai rata-ratanya dan berpangkat r, dapat dituliskan menjadi
X = U L A’
13. Biplot
Konsep Dasar
Keterangan :
matriks U dan A masing-masing berukuran (nxr) dan (pxr)
sehingga U’U = A’A = Ir
L adalah matrik diagonal berukuran (rxr) dengan unsur-unsur diagonalnya adalah akar kuadrat dari akar ciri X’X atau XX’ sehingga
1 2 .... r
13. Biplot
Kolom matris A adalah vektor ciri yang berpadanan dengan akar ciri dari matrik X’X atau XX’.
Lajur-lajur matrik U dapat dihitung melalui :
Dengan i adalah akar ciri ke-i dari matrik X’X dan ai adalah lajur ke-i matrik A.
i i a 1 Ui
13. Biplot
Konsep Dasarn
X
r=
nU
r rL
r rA
pA = [a
1, a
2, …,a
r]
r 2 1 0 0 0 0 0 0 L r r a a a 1 ,..., 1 , 1 U 2 2 1 113. Biplot
Konsep Dasar: SVD• X = U L L1- A’ = G H’
• Misalkan G = U L serta H’ = L1- A’
Unsur ke-(i,j) matriks X dapat dituliskan sbb : X ij = gi’hj
dimana: i = 1,2,3,...,n j = 1,2,3,...,p
dengan gi’dan hj’ masing-masing merupakan baris-baris matriks G dan H
Jika r(X)=2 maka gi dan hj digambarkan dalam ruang berdimensi 2
13. Biplot
Konsep Dasar: SVD
• Jika = 1, maka G = UL dan H = A, sehingga diperoleh hubungan: X’X = (GH’)(GH’)’ = GH’ HG’ = GA’ AG’ = GG’
• Jika = 0 maka G = U dan H = AL, sehingga diperoleh X’X = (GH’)’(GH’) = HG’ GH’ = HU’ UH’ = HH’
13. Biplot
Konsep Dasar: SVD1. Kedekatan antar obyek.
Dua obyek dengan karakteristik sama akan digambarkan sebagai dua faktor yang posisi-nya berdekatan.
2. Keragaman peubah.
Peubah dengan keragaman kecil digambarkan sebagai vektor yang pendek. Begitu pula sebaliknya.
13. Biplot
Informasi yang Bisa Diperoleh
3. Hubungan antar peubah :
Jika sudut dua peubah < 900 maka korelasi bersifat positif Jika sudut dua peubah > 900 maka korelasi bersifat
negatif
Semakin kecil sudutnya, maka semakin kuat korelasinya. 4. Nilai peubah pada suatu obyek.
Karakteristik suatu obyek bisa disimpulkan dari posisi relatifnya yang paling dekat dengan suatu peubah.
13. Biplot
• Ilustrasi berikut memberikan penerapan BIPLOT untuk menilai posisi relatif sembilan negara ASEAN menurut indikator
pembangunan berkelanjutan (sustatinable development indicators).
Ada 9 variabel yang dimasukkan.
13. Biplot
Ilustrasi
13. Biplot
13. Biplot
Ilustrasi
Biplot Analysis
13. Biplot
Perusahaan penyedia jasa layanan kartu kredit harus mampu membuat fungsi diskriminan yang mampu memisahkan calon pemegang kartu yang potensial melakukan transaksi dan yang tidak (idle) berdasarkan data dalam formulir aplikasi.
X mampu menjadi
pembeda, tetapi Y tidak pembeda, tetapi X tidak Y mampu menjadi
13. Diskriminan
Prinsip Dasar
X dan Y saja tidak mampu Membutuhkan fungsi non-linear