• Tidak ada hasil yang ditemukan

Analisis Cluster pada Data American New

N/A
N/A
Protected

Academic year: 2018

Membagikan "Analisis Cluster pada Data American New"

Copied!
7
0
0

Teks penuh

(1)

Abstrak —Transportation is one of the industrial that grow rapidly. The production and sales of cars and truck are increasing year by year in United States of America. There are some indicators to determine the price of vehicle. One of them is vehicle’s spesification. They are horsepower, wheel base, weight, length and widht. Those spesifications can classify the vehicle into some group. The data of vehicles’ name and their spesification in in United States of America on 2004 will be analyzed using clustering analysis. They are consist of single linkage, complete linkage and K-Means. The next step is choose the optimum cluster that can formed by each method using the value of pseudo f. After that is calculate the internal cluster dispersion rate (icdrate) of each method and choose the smallest one. The result from all of methods deliver the same conclusio. The optimum cluster that formed is two clusters but each method has different member of it cluster. The best method based on the value of icdrate is Single Linkage with two clusters.

Key wordClustering, Complete Linkage, icdrate, K-Means, Pseudo f, Single Linkage, Vehicle.

I. PENDAHULUAN

alah satu industri yang paling berkembang saat ini adalah industri transportasi. Produksi dan penjualan mobil maupun truk sangat diperhatikan oleh industri transportasi ini. Penjualan kendaraan dari tahun ke tahun meningkat di berbagai negara, tak terkecuali Amerika Serikat. Indikator yang paling penting dalam menentukan harga kendaraan adalah spesifikasi kendaraan. Spesifikasi kendaraan tersebut meliputi horsepower, panjang dan lebar kendaraan, berat kendaraan, serta wheelbase. Beberapa spesifikasi yang ada pada kendaraan dapat digunakan untuk mengelompokkan ke dalam jenis apa kendaraan tersebut. Objek dalam suatu kelompok yang terbentuk diharapkan memiliki kemiripan dengan objek lain pada kelompok yang sama, tetapi sangat tidak mirip dengan objek pada cluster yang lain. Oleh karena itu, akan dilakukan pengelompokkan kendaraan dengan data penjualan kendaraan di Amerika Serikat pada tahun 2004 beserta spesifikasinya berdasarkan jenis kendaraannya dengan menggunakan metode clustering.

S

Analisis cluster digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok sehingga akan diperoleh kelompok dimana obyek-obyek dalam satu kelompok tersebut mempunyai persamaan sedangkan dengan anggota kelompok lain mempunyai perbedaan [1]. Dalam mengembangkan metode clustering terdapat beberapa pendekatan, diantaranya dengan pendekatan hirarki dan pendekatan non-hirarki. Clustering dengan pendekatan non-hirarki dapat menggunakan metode K-means, mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang

ada. Clustering dengan pendekatan hirarki, mengelom-pokkan data dengan membuat suatu hirarki berupa dendo-gram (tree) dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan. Tujuan dari laporan ini adalah pengelompokan jenis kendaraan berdasarkan data penjualan kendaaraan di Amerika Serikat pada tahun 2004 beserta spesifikasinya.

II. TINJAUAN PUSTAKA A. Analisis Cluster

Analisis cluster (analisis kelompok) adalah metode analisis yang digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok sehingga akan diperoleh kelompok dimana obyek-obyek dalam satu kelompok tersebut mempunyai persamaan sedangkan dengan anggota kelompok lain mempunyai perbedaan [1]. Secara umun dalam melakukan analisis cluster terdapat dua metode yang digunakan, yaitu pengelompokan secara hirarki dan pengelompokan secara non-hirarki. Jarak yang digunakan adalah euclidean dengan rumus sebagai berikut.

d

(

i, k

)=

j

(

x

ij

x

kj

)

2 (1) Di mana d(i,k) adalah jarak antara observasi i dengan k.

B. Analisis Cluster Secara Hirarki

Analisis cluster merupakan teknik pengelompokan dimana belum diketahuinya asumsi berapa banyak grup atau struktur grup yang terbentuk. Pengelompokan dilakukan berdasarkan kemiripan atau ketidakmiripan [2]. Salah satu teknik clustering yang popular adalah dilakukan secara hirarki. Dinamakan hirarki sebab pengelompokan dilakukan secara bertahap dengan menggabungkan objek yang diamati kemiripannya ke dalam suatu cluster berdasarkan karakteristik tertentu. Terdapat beberapa jenis clustering secara hirarki, diantaranya yaitu Single Linkage, Complete Linkage, Average Linkage, dan Ward’s Hierarchical Clustering Method.

Berikut ini prosedur untuk melakukan pembentukan cluster secara hirarki

a. Mendapatkan matriks jarak D = {dik} dan menetapkan

akan ada sebanyak N cluster yang dapat terbentuk, dimana N adalah banyak objek yang diamati.

b. Menentukan matriks jarak untuk kedekatan antar cluster.

c. Menggabungkan cluster yang terbukti memiliki kedekatan.

d. Mengulang langkah c sebanyak N-1 kali hingga dipero-leh banyaknya cluster yang terbentuk dan seberapa dekat jarak antar cluster tersebut.

Hasil penggabungan tersebut dapat diuraikan atau

Analisis

Cluster

pada Data

American New Cars and

Truk

tahun 2014 dengan Metode Hirarki dan

Non-Hirarki

Ikacipta Mega Ayuputri, M. Alifian Nuriman, Ratna Juwita, M. Alfan AlfianRiyadi, Dr. Bambang W. Otok Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia

(2)

dijelaskan dengan baik secara visual oleh dendrogram. 1. Single Linkage

Single linkage merupakan metode untuk mengelompokkan objek ke dalam cluster berdasarkan kedekatan dengan objek lainnya. Berdasarkan prosedur pembentukan cluster di atas, metode ini menggunakan kriteria berikut.

d

(UV)W

=

min

{

d

UW

, d

VW

}

(2) dimana jarak antara cluster (UV) dan cluster W merupakan jarak minimal antara cluster U dan W atau antara cluster V dan W [2].

2. Complete Linkage

Complete linkage merupakan metode untuk mengelompokkan objek ke dalam cluster berdasarkan ketidakmiripan dengan objek lainnya. Berdasarkan prosedur pembentukan klaster di atas, metode ini menggunakan kriteria berikut.

d

(UV)W

=

max

{

d

UW

, d

VW

}

(3)

dimana jarak antara cluster (UV) dan cluster W merupakan jarak paling jauh antara cluster U dan W atau antara klaster V dan W [2].

C. Analisis Cluster Secara Non-Hirarki

Teknik clustering dengan metode non-hirarki menempatkan obyek ke dalam kelompok dimana jumlah cluster ditentukan. Salah satu metode cluster non-hirarki adalah K-means [2].

Prosedur metode K-means adalah dengan mempartisi atau mengelompokan data ke dalam jumlah cluster yang telah ditentukan peneliti. Kemudian secara iterative melakukan pemindahan pengamatan pada antar cluster, sampai beberapa kriteria numerik terpenuhi. Kriteria menentukan tujuan yang berhubungan dengan meminimalkan jarak pengamatan dari satu sama lain dalam sebuah cluster dan memaksimalkan jarak antara cluster [3]

Algoritma pada metode clostering menggunakan K-Means adalah sebagai berikut.

1. Partisi data ke dalam K cluster sebagai inisiasi

2. Lanjutkan melalui daftar data, dengan melalui data yang terdekat dengan mean. Hitung kembali mean unruk cluster yang menerima maupun kehilangan data. 3. Ulangi langkah kedua hingga tidak ada penugasan yang

terjadi [2].

D. Calinski-Harabasz Pseudo F-Statistics Pseudo F-statistics adalah salah satu metode yang umum digunakan untuk menentukan banyaknya kelompok yang optimum [4]. Rumus Pseudo F-statistics ditulis dalam persamaan berikut.

Pseudo F

statistics

=

R

2

k

1

1

R

2

n

k

(4)

R

2

=

SST

SSW

SST

(5)

SST

=

i=1

n

j=1

c

k=1

p

(

x

ijk

−´

x

j

)

2 (6)

SSW

=

i=1

n

j=1

c

k=1

p

(

x

ijk

−´

x

jk

)

2 (7)

E. Internal Cluster Dispersion Rate

Beberapa macam metode untuk membandingkan hasil pengelompokan dapat dilakukan berbagai cara dan rumusan. Salah satunya dengan menghitung performansi cluster dengan menghitung nilai SSB dari hasil pengolahan data dan menghitung persebaran (internal cluster dispersion rate) dalam masing-masing klaster yang telah terbentuk. Semakin kecil nilai icdrate maka semakin baik hasil pengelompokkannya. Membandingkan metode cluster yang terbaik dengan nilai persebaran data-data dalam cluster (internal cluster dispersion rate) didefinisikan dengan persamaan berikut [5].

icdrate

=

1

SSB

SST

(8)

SSB

=

j=1

c

k=1

p

(

x

jk

− ´

x

j

)

2 (9)

III. METODOLOGI PENELITIAN A. Sumber Data

Sumber data yang digunakan adalah data sekunder. Data yang diperoleh berasal dari http://www.idvbook.com/ dengan judul “2004 Cars and Trucks” dan diambil pada tanggal 29 April 2017 pukul 14.00 WIB [6].

B. Variabel Penelitian

Variabel yang digunakan pada penelitian ini sebanyak 6 variabel dengan 40 tipe kendaraan yang diamati. Berikut ini tabel yang memuat variabel pada penelitian ini.

Tabel 1. Variabel Penelitian

No. Variabel Keterangan

1 X1 Reatail price (US$)

2 X2 Horsepower

3 X3 Weight (pound)

4 X4 Wheel Base (inches)

5 X5 Length (inches)

6 X6 Width (inches)

Satuan yang digunakan antar variabel memiliki perbedaan sehingga perlu dilakukan standardize pada variabel penelitian.

C. Langkah Analisis

Langkah analisis yang digunakan pada penelitian ini adalah sebagai berikut.

1. Mengidentifikasi masalah dan tujuan penelitian. 2. Mengumpulkan data penjualan cars and trucks di

Amerika pada tahun 2004.

3. Melakukan analisis cluster dengan metode hirarki (single linkage dan complete linkage).

4. Melakukan analisis cluster dengan metode non-hirarki (K-means).

5. Membandingkan hasil analisis cluster dengan menggunakan Pseudo F-statistics.

6. Menguji kebaikan model dari analisis cluster dengan icdrate.

(3)

IV. HASIL DAN PEMBAHASAN A. Pengecekan Missing Value

Analisis cluster dapat dilakukan pada data yang tidak mengandung missing value. Apabila terdapat data yang missing maka harus diatasi sebelum dianalisis lebih lanjut. Berikut adalah tabel yang digunakan untuk mendeteksi apakah pada data American new cars and trucks terdapat missing value atau tidak.

Tabel 2. Pengecekan Missing Value

Valid Missing Total

N Percent N Percent N Percent

40 100 0 0 40 100

Tabel 2 menunjukkan bahwa data berjumlah 40 dan tidak ada missing value sehingga data dapat dianalisis lebih lanjut dengan analisis cluster.

B. Analisis Cluster dengan Single Linkage

Hasil olahan analisis cluster menggunakan metode single linkage berdasarkan iterasi jarak Euclidian yang terdiri dari minimum 2 cluster hingga maksimum 28 cluster.

Berikut merupakan dendogram pengelompokan data menggunakan metode single linkage:

Gambar 1. Grafik dendogram untuk Single Linkage

Dilihat dari grafik rescaled distance cluster combine pada scale distance 25 menunjukkan 2 cluster yang mengelompokkan data. Pada scale distance 20 menunjuk-kan 2 cluster, pada scale distance 10 menunjukmenunjuk-kan 3 clus-ter dan seclus-terusnya sampai menunjukkan 28 cluster yang mengelompokkan data. Kemudian dipilih pengelompokkan 2 cluster.

Tabel 3. Pengelompokkan dengan 2 Cluster

Cluster Jumlah

1 39

2 1

Berdasarkan Tabel 3 terlihat bahwa jumlah anggota pada cluster satu lebih banyak dibandingingkan cluster dua. Terdapat 39 tipe mobil masuk pada cluster satu dan hanya satu tipe mobil masuk pada cluster dua. Selain

menggunakan dendogram, jumlah cluster bisa ditentukan menggunakan pseudo f-statistics. Berikut ini merupakan hasil perhitungan pseudo f-statistics pada metode single linkage.

Tabel 4. Hasil Perhitungan Pseudo f-statistics pada Metode Single Linkage

Metode Hirarki Pseudo F-Statistics

Single Linkage (5 cluster) 4,838

Single Linkage (4 cluster) 5,552

Single Linkage (3 cluster) 5,164

Single Linkage (2 cluster) 6,158

Berdasarkan Tabel 4 hasil perhitungan manual dan pada analisis cluster hirarki dengan metode Single Linkage memiliki nilai pseudo f-statistics yang terbesar adalah metode Single Linkage dengan jumlah cluster sebanyak 2 cluster. Hal ini dapat dikatakan bahwa pengelompokkan yang optimum adalah sebesar 2 cluster. Hal ini juga diperkuat dengan selisih dari banyak data (n) dengan stage yang memiliki lompatan tertinggi pada coefficient dalam Lampiran 1 yang apabila dihitung adalah sebesar 40 – 38 sama dengan 2 cluster.

C. Analisis Cluster dengan Complete Linkage

Berikut merupakan dendogram pengelompokan data menggunakan metode complete linkage dengan iterasi jarak Euclidean.

Gambar 2. Dendogram untuk Complete Linkage

Berdasarkan rescaled distance cluster combine pada gambar 2, scale distance 25 menunjukkan 2 cluster yang terbentuk dalam mengelompokkan data. Pada scale distance 15 menunjukkan 4 cluster yang terbentuk, dan seterusnya hingga menunjukkan 10 cluster yang mengelompokkan data. Kemudian dipilih pengelompokkan 2 cluster dengan hasil sebagai berikut.

Tabel 5. Pengelompokkan 2 Cluster dengan Complete Linkage

Cluster Jumlah

1 27

(4)

Tabel 5 menunjukkan bahwa anggota cluster satu lebih banyak dibandingkan cluster dua. Terdapat 27 tipe mobil pada cluster satu dan 13 tipe mobil pada cluster dua. Selain menggunakan dendogram, jumlah cluster dapat ditentukan melalui pseudo f-statistics. Berikut ini hasil perhitungan pseudo f-statistics dengan menggunakan metode complete linkage.

Tabel 6. Pseudo F-statistics dengan Complete Linkage

Metode Hirarki Cluster Pseudo F-statistics

Complete

Linkage 2 22,1041

Complete

Linkage 3 17,1552

Complete

Linkage 4 15,6317

Complete

Linkage 5 11,6157

Berdasarkan tabel 6, dapat diketahui bahwa nilai pseudo f-statistics terbesar pada metode complete linkage adalah pada 2 cluster. Hal ini dapat dikatakan bahwa pengelompokkan yang optimum dengan metode complete linkage adalah sebesar 2 cluster. Hal ini juga diperkuat dengan selisih dari banyak data (n) dengan stage yang memiliki lompatan tertinggi pada coefficient dalam lampiran 4 yang apabila dihitung adalah sebesar 40 – 38 sama dengan 2 cluster.

D. Analisis Cluster dengan K-Means Method

Pada analisis cluster menggunakan metode K-Means jumlah cluster yang diinginkan adalah sebanyak 2,3,4 dan 5 yang selanjutnya ditentukan jumlah cluster yang optimum. Jumlah cluster optimum pada metode K-Means bisa ditentukan menggunakan pseudo f-statistics. Berikut ini merupakan hasil perhitungan pseudo f-statistics untuk keempat clustering.

Tabel 7. Penentuan Jumlah Cluster Optimum menggunakan Pseudo f

Metode Non Hirarki Pseudo f

K-Means dua cluster 25,228

K-Means tiga cluster 13,660

K-Means empat cluster 21,130

K-Means lima cluster 18,109

Berdasarkan hasil pada Tabel 7 didapatkan nilai pseudo f terbesar adalah pada metode K-Means dengan dua cluster yang berarti bahwa jumlah cluster optimum sebanyak dua.

Setelah mendapatkan cluster optimum dilakukan perhitungan MANOVA untuk mengetahui variabel yang signifikan pada pengelompokkan K-Means dengan dua cluster. Hasil yang didapatkan adalah sebagai berikut.

Tabel 8. Hasil MANOVA Dua Cluster

Variabel F p-value

Retail Price 2,200 0,146

Horsepower 3,217 0,081

Weight 29,929 0,000

Wheel Base 54,468 0,000

Length 47,029 0,000

Width 81,974 0,000

Berdasarkan nilai p-value pada Tabel 8 terlihat bahwa variabel weight, wheel base, length dan width memiliki nilai < α sehingga diputuskan tolak H0. Hal ini berarti

bahwa keempat variabel tersebut yang memiliki kontribusi signifikan dalam mempengaruhi hasil pengelompokkan dua cluster. Adapun jumlah anggota untuk masing-masing cluster dengan metode K-Means dua cluster adalah sebagai berikut.

Tabel 9. Jumlah Anggota pada Pengelompokkan Dua Cluster

Cluster Jumlah

1 23

2 17

Pada pengelompokkan dua cluster 40 data tersebut sudah masuk di dalam cluster dan tidak ditemukan missing value dengan jumlah anggota pada cluster 1 lebih banyak dibandingkan cluster 2 (Tabel 9 ).

E. Metode Terbaik

Kriteria pemilihan model terbaik adalah dengan melihat nilai icdrate terkecil. Berikut merupakan nilai icdrate dari setiap cluster pada setiap metode.

Tabel 10. Hasil icdrate Model Hirarki dan Non Hirarki

Cluster Single Linkage Complete Linkage K-Means

2 0,863 0,976 0,979

Dari Tabel 12, diketahui nilai icdrate terkecil terdapat pada metode Single Linkage dengan 2 cluster, sehingga model pengelompokan dari metode tersebut paling baik diterapkan untuk kasus ini.

V. KESIMPULAN DAN SARAN A. Kesimpulan

Berdasarkan analisis dan pembahasan di atas diperoleh kesimpulan sebagai berikut. Pada dendogram metode clustering hirarki single linkage menghasilkan dua cluster dengan anggota pertama sebanyak 39 kendaraan dan satu kendaraan untuk cluster 2. Selanjutnya pada metode complete linkage juga menghasilkan dua cluster dengan anggota pertama sebanyak 27 kendaraan dan 13 kendaraan pada cluster 2. Keputusan yang sama juga terlihat dari perhitungan pseudo f terbesar yaitu pada dua cluster yang berarti sebagai jumlah cluster optimum. Pada metode non hirarki K-Means menggunakan pseudo f didapatkan kesimpulan yang sama. Jumlah cluster optimum yang terbentuk sebanyak dua cluster dengan variabel yang berkontribusi signifikan dalam pengelompokkan adalah weight, wheel base, length dan width. Pada penentuan model terbaik berdasarkan nilai icdrate terkecil disimpulkan bahwa metode single linkage dengan dua cluster adalah metode terbaik.

B. Saran

Berdasarkan penelitian yang telah dilakukan, saran yang dapat diberikan untuk penelitan selanjutnya adalah melakukan standarisasi data terlebih dahulu jika data yang digunakan memiliki stauan yang berbeda-beda agar clustering yang dihasilkan tepat.

DAFTAR PUSTAKA

[1] Rencher, Alvin C. 2002. Methods of Multivariate Analysis, Second Edition. Canada: John Wiley & Sons, Inc.

[2] Johnson, Richard. 2007. Applied Multivariate Statistical Analysis. Madison : Pearson Prentice Hall. [3] Rencher, Alvin C. 2002. Methods of Multivariate

Analysis, Second Edition. Canada: John Wiley & Sons, Inc.

[4] Santoso, Singgih. 2010. Statistik Multivariat, Konsep dan Aplikasi dengan SPSS. Jakarta: PT Elex Media Komputindo.

(5)
(6)

LAMPIRAN

1. Data retail price, horsepower, dan weight berdasarkan penjualan tipe mobil di Amerika Serikat tahun 2004

Vehicle Name X1 X2 X3

Acura RSX Type S 2dr 23820 200 2778

Audi A4 3.0 4dr 31840 220 3462

Audi A4 3.0 Quattro 4dr auto 34480 220 3627

Audi A6 2.7 Turbo Quattro 4dr 42840 250 3836

Audi A6 3.0 4dr 36640 220 3561

Audi A6 3.0 Quattro 4dr 39640 220 3880

Audi A8 L Quattro 4dr 69190 330 4399

Audi S4 Avant Quattro 49090 340 3936

BMW 325i 4dr 28495 184 3219

BMW 330Ci convertible 2dr 44295 225 3616

BMW 545iA 4dr 54995 325 3814

BMW X3 3.0i 37000 225 4023

Buick Century Custom 4dr 22180 175 3353

Buick Park Avenue 4dr 35545 205 3778

Cadillac Deville 4dr 45445 275 3984

Chevrolet Astro 26395 190 4605

Chevrolet Corvette 2dr 44535 350 3246

Chevrolet Corvette convertible 2dr 51535 350 3248

Chevrolet Impala 4dr 21900 180 3465

Chevrolet Malibu Maxx LS 22225 200 3458

Chevrolet Tahoe LT 41465 295 5050

Chrysler 300M 4dr 29865 250 3581

Chrysler Concorde LXi 4dr 26860 232 3548

Chrysler Sebring Touring 4dr 21840 200 3222

CMC Yukon 1500 SLE 35725 285 5042

Dodge Durango SLT 32235 230 4987

Dodge Grand Caravan SXT 32660 215 4440

Dodge Intrepid SE 4dr 22035 200 3469

Ford Escape XLS 22515 201 3346

Ford Freestar SE 26930 193 4275

GMC Safari SLE 25640 190 4309

GMC Yukon XL 2500 SLT 46265 325 6133

Honda Accord EX V6 2dr 26960 240 3294

Honda CR-V LX 19860 160 3258

Honda Odyssey LX 24950 240 4310

Hyundai Accent GL 4dr 11839 103 2290

Hyundai Elantra GT 4dr 15389 138 2635

Infiniti FX45 36395 315 4309

Infiniti G35 4dr 32445 260 3677

Isuzu Rodeo S 20449 193 3836

2. Data wheel base, length, dan width berdasarkan penjualan tipe mobil di Amerika Serikat tahun 2004

Vehicle Name X4 X5 X 6

Acura RSX Type S 2dr 101 172 68

Audi A4 3.0 4dr 104 179 70

Audi A4 3.0 Quattro 4dr auto 104 179 70

Audi A6 2.7 Turbo Quattro 4dr 109 192 71

Audi A6 3.0 4dr 109 192 71

Audi A6 3.0 Quattro 4dr 109 192 71

Audi A8 L Quattro 4dr 121 204 75

Audi S4 Avant Quattro 104 179 70

BMW 325i 4dr 107 176 69

BMW 330Ci convertible 2dr 10 17 6

7 7 9

BMW 545iA 4dr 114 191 73

BMW X3 3.0i 110 180 73

Buick Century Custom 4dr 109 195 73

Buick Park Avenue 4dr 114 207 75

Cadillac Deville 4dr 115 207 74

Chevrolet Astro 111 190 78

Chevrolet Corvette 2dr 105 180 74

Chevrolet Corvette convertible 2dr 105 180 74

Chevrolet Impala 4dr 111 200 73

Chevrolet Malibu Maxx LS 112 188 70

Chevrolet Tahoe LT 116 197 79

Chrysler 300M 4dr 113 198 74

Chrysler Concorde LXi 4dr 113 208 74

Chrysler Sebring Touring 4dr 108 191 71

CMC Yukon 1500 SLE 116 199 79

Dodge Durango SLT 119 201 76

Dodge Grand Caravan SXT 119 201 79

Dodge Intrepid SE 4dr 113 204 75

Ford Escape XLS 103 173 70

Ford Freestar SE 121 201 77

GMC Safari SLE 111 190 78

GMC Yukon XL 2500 SLT 130 219 79

Honda Accord EX V6 2dr 105 188 71

Honda CR-V LX 103 179 70

Honda Odyssey LX 118 201 76

Hyundai Accent GL 4dr 96 167 66

Hyundai Elantra GT 4dr 103 178 68

Infiniti FX45 112 189 76

Infiniti G35 4dr 112 187 69

Isuzu Rodeo S 106 178 70

3. Agglomeration Schedule dengan metode Single Linkage

Stage Cluster Combined Coefficients Cluster 1 Cluster 2

1 2 3 ,320

2 16 31 ,417

3 5 6 ,512

4 21 25 ,541

(7)

6 4 5 ,580

7 17 18 ,592

8 20 24 ,790

9 13 28 ,802

10 13 23 ,816

11 13 20 ,820

12 29 34 ,896

13 27 30 ,918

14 13 22 ,929

15 9 29 ,941

16 9 40 ,948

17 2 9 ,959

18 13 33 ,964

19 27 35 ,977

20 13 14 ,981

21 2 13 1,007

22 2 10 1,007

23 1 2 1,030

24 4 39 1,149

25 26 27 1,149

26 1 37 1,168

27 1 4 1,187

28 1 12 1,206

29 21 26 1,388

30 1 21 1,483

31 1 15 1,516

32 8 17 1,520

33 1 38 1,706

34 1 16 1,712

35 1 36 1,727

36 1 11 1,825

37 1 8 1,923

38 1 7 2,182

39 1 32 3,264

4. Hasil pengelompokkan Single Linkage dua cluster

Cluste

r Tipe Mobil

1

Acura RSX Type S 2dr, Audi A4 3.0 4dr, Audi A4 3.0 Quattro 4dr , Audi A6 2.7 Turbo Quattro 4drauto, Audi A6 3.0 4dr, Audi A6 3.0 Quattro 4dr, Audi S4 Avant Quattro, BMW 325i 4dr, BMW 330Ci convertible 2dr, BMW X3 3.0i, Buick Century Custom 4dr, Buick Park Avenue 4dr, Chevrolet Corvette 2dr, Chevrolet Corvette convertible 2dr, Chevrolet Impala 4dr, Chevrolet Malibu Maxx LS, Chrysler 300M 4dr, Chrysler Concorde LXi 4dr, Chrysler Sebring Touring 4dr, Dodge Intrepid SE 4dr, Ford Escape XLS, Honda Accord EX V6 2dr, Honda CR-V LX, Hyundai Accent GL 4dr, Hyundai Elantra GT 4dr, Infiniti G35 4dr, Isuzu Rodeo S, Audi A8 L Quattro 4dr, BMW 545iA 4dr, Cadillac Deville 4dr, Chevrolet Astro, Chevrolet Tahoe LT, CMC Yukon 1500 SLE, Dodge Durango SLT, Dodge Grand Caravan SXT, Ford Freestar SE, GMC Safari SLE, Honda Odyssey LX, dan Infiniti FX45

2 GMC Yukon XL 2500 SLT

5. Agglomeration Schedule dengan metode Complete Linkage

Stage Cluster Combined Coefficients Cluster 1 Cluster 2

1 2 3 ,320

2 16 31 ,417

3 5 6 ,512

4 21 25 ,541

5 13 19 ,548

6 17 18 ,592

7 20 24 ,790

8 23 28 ,816

9 4 5 ,825

10 29 34 ,896

11 27 30 ,918

12 29 40 1,086

13 2 9 1,142

14 26 35 1,149

15 22 23 1,231

16 14 22 1,259

17 4 39 1,272

18 26 27 1,324

19 13 20 1,370

20 1 37 1,414

21 10 12 1,505

22 2 33 1,535

23 8 17 1,556

24 4 10 1,627

25 2 29 1,717

26 21 38 1,762

27 11 15 1,825

28 16 26 2,079

29 1 36 2,297

30 13 14 2,474

31 7 11 2,494

32 16 21 2,810

33 4 8 2,965

34 2 13 3,812

35 2 4 4,426

36 7 16 4,864

37 7 32 5,396

38 1 2 6,232

39 1 7 10,525

6. Hasil pengelompokkan Complete Linkage dua cluster

Cluste

r Tipe Mobil

1

Acura RSX Type S 2dr, Audi A4 3.0 4dr, Audi A4 3.0 Quattro 4dr , Audi A6 2.7 Turbo Quattro 4drauto, Audi A6 3.0 4dr, Audi A6 3.0 Quattro 4dr, Audi S4 Avant Quattro, BMW 325i 4dr, BMW 330Ci convertible 2dr, BMW X3 3.0i, Buick Century Custom 4dr, Buick Park Avenue 4dr, Chevrolet Corvette 2dr, Chevrolet Corvette convertible 2dr, Chevrolet Impala 4dr, Chevrolet Malibu Maxx LS, Chrysler 300M 4dr, Chrysler Concorde LXi 4dr, Chrysler Sebring Touring 4dr, Dodge Intrepid SE 4dr, Ford Escape XLS, Honda Accord EX V6 2dr, Honda CR-V LX, Hyundai Accent GL 4dr, Hyundai Elantra GT 4dr, Infiniti G35 4dr, dan Isuzu Rodeo S

2

Gambar

Gambar 1. Grafik dendogram untuk Single Linkage
Tabel 6. Pseudo F-statistics dengan Complete Linkage

Referensi

Dokumen terkait

Hasil waktu respon yang dimiliki oleh MySQL Cluster juga menunjukkan hasil yang lebih baik 31,21% dibandingkan DRBD. Sehingga disimpulkan MySQL Cluster merupakan solusi

Algoritma K-Means Cluster Analysis mempergunakan metode perhitungan jarak (distance) untuk mengukur tingkat kedekatan antara data dengan titik tengah (centroid),

Berikut hasil perhitungan nilai pseudo F-Statistic pada data pengelompokan Kabupaten/Kota di Jawa Timur berdasarkan faktor-faktor yang mempengaruhi produksi kedelai pada

Pada tabel 3, data yang memiliki nilai modularity terbesar dibandingkan dengan data lainnya bukanlah yang memiliki jumlah relasi banyak, namun cluster yang terbentuk dari

Berdasarkan hasil perhitungan manual (Tabel 4.1) dan hasil pada tampilan antarmuka proses klasifikasi range nilai (Gambar 4.18) untuk 6 alternatif sesuai data awal dengan 5

Data diolah dengan perhitungan manual menggunakan algorithma K-Means dan menggunakan Software Rapid Miner sehingga didapatkan hasil akhir berupa tiga cluster dimana

Dari hasil penelitian yang dilakukan untuk 17 perusahaan dikota Medan menggunakan metode Single Linkage, berdasarkan jenis pencemaran udara gas buang cerobong asap

Hal ini dilihat dari perbedaan perhitungan manual dan data aktual dilapangan yang tidak terlalu jauh, dengan %kesalahan impedansi primer terkecil yaitu 0,12% pada zona 1 dan terbesar