Analisis Cluster pada Data American New

(1)

Abstrak —Transportation is one of the industrial that grow rapidly. The production and sales of cars and truck are increasing year by year in United States of America. There are some indicators to determine the price of vehicle. One of them is vehicle’s spesification. They are horsepower, wheel base, weight, length and widht. Those spesifications can classify the vehicle into some group. The data of vehicles’ name and their spesification in in United States of America on 2004 will be analyzed using clustering analysis. They are consist of single linkage, complete linkage and K-Means. The next step is choose the optimum cluster that can formed by each method using the value of pseudo f. After that is calculate the internal cluster dispersion rate (icdrate) of each method and choose the smallest one. The result from all of methods deliver the same conclusio. The optimum cluster that formed is two clusters but each method has different member of it cluster. The best method based on the value of icdrate is Single Linkage with two clusters.

Key word—Clustering, Complete Linkage, icdrate, K-Means, Pseudo f, Single Linkage, Vehicle.

I. PENDAHULUAN

alah satu industri yang paling berkembang saat ini adalah industri transportasi. Produksi dan penjualan mobil maupun truk sangat diperhatikan oleh industri transportasi ini. Penjualan kendaraan dari tahun ke tahun meningkat di berbagai negara, tak terkecuali Amerika Serikat. Indikator yang paling penting dalam menentukan harga kendaraan adalah spesifikasi kendaraan. Spesifikasi kendaraan tersebut meliputi horsepower, panjang dan lebar kendaraan, berat kendaraan, serta wheelbase. Beberapa spesifikasi yang ada pada kendaraan dapat digunakan untuk mengelompokkan ke dalam jenis apa kendaraan tersebut. Objek dalam suatu kelompok yang terbentuk diharapkan memiliki kemiripan dengan objek lain pada kelompok yang sama, tetapi sangat tidak mirip dengan objek pada cluster yang lain. Oleh karena itu, akan dilakukan pengelompokkan kendaraan dengan data penjualan kendaraan di Amerika Serikat pada tahun 2004 beserta spesifikasinya berdasarkan jenis kendaraannya dengan menggunakan metode clustering.

S

Analisis cluster digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok sehingga akan diperoleh kelompok dimana obyek-obyek dalam satu kelompok tersebut mempunyai persamaan sedangkan dengan anggota kelompok lain mempunyai perbedaan [1]. Dalam mengembangkan metode clustering terdapat beberapa pendekatan, diantaranya dengan pendekatan hirarki dan pendekatan non-hirarki. Clustering dengan pendekatan non-hirarki dapat menggunakan metode K-means, mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang

ada. Clustering dengan pendekatan hirarki, mengelom-pokkan data dengan membuat suatu hirarki berupa dendo-gram (tree) dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan. Tujuan dari laporan ini adalah pengelompokan jenis kendaraan berdasarkan data penjualan kendaaraan di Amerika Serikat pada tahun 2004 beserta spesifikasinya.

II. TINJAUAN PUSTAKA A. Analisis Cluster

Analisis cluster (analisis kelompok) adalah metode analisis yang digunakan untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa kelompok sehingga akan diperoleh kelompok dimana obyek-obyek dalam satu kelompok tersebut mempunyai persamaan sedangkan dengan anggota kelompok lain mempunyai perbedaan [1]. Secara umun dalam melakukan analisis cluster terdapat dua metode yang digunakan, yaitu pengelompokan secara hirarki dan pengelompokan secara non-hirarki. Jarak yang digunakan adalah euclidean dengan rumus sebagai berikut.

d

(

i, k

)=

√

∑

j

(

x

_ij

−

x

_kj

)

2 ₍₁₎ Di mana d(i,k) adalah jarak antara observasi i dengan k.

B. Analisis Cluster Secara Hirarki

Analisis cluster merupakan teknik pengelompokan dimana belum diketahuinya asumsi berapa banyak grup atau struktur grup yang terbentuk. Pengelompokan dilakukan berdasarkan kemiripan atau ketidakmiripan [2]. Salah satu teknik clustering yang popular adalah dilakukan secara hirarki. Dinamakan hirarki sebab pengelompokan dilakukan secara bertahap dengan menggabungkan objek yang diamati kemiripannya ke dalam suatu cluster berdasarkan karakteristik tertentu. Terdapat beberapa jenis clustering secara hirarki, diantaranya yaitu Single Linkage, Complete Linkage, Average Linkage, dan Ward’s Hierarchical Clustering Method.

Berikut ini prosedur untuk melakukan pembentukan cluster secara hirarki

a. Mendapatkan matriks jarak D = {dik} dan menetapkan

akan ada sebanyak N cluster yang dapat terbentuk, dimana N adalah banyak objek yang diamati.

b. Menentukan matriks jarak untuk kedekatan antar cluster.

c. Menggabungkan cluster yang terbukti memiliki kedekatan.

d. Mengulang langkah c sebanyak N-1 kali hingga dipero-leh banyaknya cluster yang terbentuk dan seberapa dekat jarak antar cluster tersebut.

Hasil penggabungan tersebut dapat diuraikan atau

Analisis

Cluster

pada Data

American New Cars and

Truk

tahun 2014 dengan Metode Hirarki dan

Non-Hirarki

Ikacipta Mega Ayuputri, M. Alifian Nuriman, Ratna Juwita, M. Alfan AlfianRiyadi, Dr. Bambang W. Otok Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia

(2)

dijelaskan dengan baik secara visual oleh dendrogram. 1. Single Linkage

Single linkage merupakan metode untuk mengelompokkan objek ke dalam cluster berdasarkan kedekatan dengan objek lainnya. Berdasarkan prosedur pembentukan cluster di atas, metode ini menggunakan kriteria berikut.

d

₍_UV₎_W

=

min

{

d

_UW

, d

_VW

}

(2) dimana jarak antara cluster (UV) dan cluster W merupakan jarak minimal antara cluster U dan W atau antara cluster V dan W [2].

2. Complete Linkage

Complete linkage merupakan metode untuk mengelompokkan objek ke dalam cluster berdasarkan ketidakmiripan dengan objek lainnya. Berdasarkan prosedur pembentukan klaster di atas, metode ini menggunakan kriteria berikut.

d

₍_UV₎_W

=

max

{

d

_UW

, d

_VW

}

(3)

dimana jarak antara cluster (UV) dan cluster W merupakan jarak paling jauh antara cluster U dan W atau antara klaster V dan W [2].

C. Analisis Cluster Secara Non-Hirarki

Teknik clustering dengan metode non-hirarki menempatkan obyek ke dalam kelompok dimana jumlah cluster ditentukan. Salah satu metode cluster non-hirarki adalah K-means [2].

Prosedur metode K-means adalah dengan mempartisi atau mengelompokan data ke dalam jumlah cluster yang telah ditentukan peneliti. Kemudian secara iterative melakukan pemindahan pengamatan pada antar cluster, sampai beberapa kriteria numerik terpenuhi. Kriteria menentukan tujuan yang berhubungan dengan meminimalkan jarak pengamatan dari satu sama lain dalam sebuah cluster dan memaksimalkan jarak antara cluster [3]

Algoritma pada metode clostering menggunakan K-Means adalah sebagai berikut.

1. Partisi data ke dalam K cluster sebagai inisiasi

2. Lanjutkan melalui daftar data, dengan melalui data yang terdekat dengan mean. Hitung kembali mean unruk cluster yang menerima maupun kehilangan data. 3. Ulangi langkah kedua hingga tidak ada penugasan yang

terjadi [2].

D. Calinski-Harabasz Pseudo F-Statistics Pseudo F-statistics adalah salah satu metode yang umum digunakan untuk menentukan banyaknya kelompok yang optimum [4]. Rumus Pseudo F-statistics ditulis dalam persamaan berikut.

Pseudo F

−

statistics

=

R

2

k

−

1

−

R

2

n

−

k

(4)

R

2

=

SST

−

SSW

SST

(5)

SST

=

∑

i=1

n

∑

j=1

c

∑

k=1

p

(

x

_ijk

−´

x

_j

)

2 ₍₆₎

SSW

=

∑

i=1

n

∑

j=1

c

∑

k=1

p

(

x

_ijk

−´

x

_jk

)

2 ₍₇₎

E. Internal Cluster Dispersion Rate

Beberapa macam metode untuk membandingkan hasil pengelompokan dapat dilakukan berbagai cara dan rumusan. Salah satunya dengan menghitung performansi cluster dengan menghitung nilai SSB dari hasil pengolahan data dan menghitung persebaran (internal cluster dispersion rate) dalam masing-masing klaster yang telah terbentuk. Semakin kecil nilai icdrate maka semakin baik hasil pengelompokkannya. Membandingkan metode cluster yang terbaik dengan nilai persebaran data-data dalam cluster (internal cluster dispersion rate) didefinisikan dengan persamaan berikut [5].

icdrate

=

1

−

SSB

SST

(8)

SSB

=

∑

j=1

c

∑

k=1

p

(

x

_jk

− ´

x

_j

)

2 ₍₉₎

III. METODOLOGI PENELITIAN A. Sumber Data

Sumber data yang digunakan adalah data sekunder. Data yang diperoleh berasal dari http://www.idvbook.com/ dengan judul “2004 Cars and Trucks” dan diambil pada tanggal 29 April 2017 pukul 14.00 WIB [6].

B. Variabel Penelitian

Variabel yang digunakan pada penelitian ini sebanyak 6 variabel dengan 40 tipe kendaraan yang diamati. Berikut ini tabel yang memuat variabel pada penelitian ini.

Tabel 1. Variabel Penelitian

No. Variabel Keterangan

1 X1 Reatail price (US$)

2 X2 Horsepower

3 X3 Weight (pound)

4 X4 Wheel Base (inches)

5 X5 Length (inches)

6 X6 Width (inches)

Satuan yang digunakan antar variabel memiliki perbedaan sehingga perlu dilakukan standardize pada variabel penelitian.

C. Langkah Analisis

Langkah analisis yang digunakan pada penelitian ini adalah sebagai berikut.

1. Mengidentifikasi masalah dan tujuan penelitian. 2. Mengumpulkan data penjualan cars and trucks di

Amerika pada tahun 2004.

3. Melakukan analisis cluster dengan metode hirarki (single linkage dan complete linkage).

4. Melakukan analisis cluster dengan metode non-hirarki (K-means).

5. Membandingkan hasil analisis cluster dengan menggunakan Pseudo F-statistics.

6. Menguji kebaikan model dari analisis cluster dengan icdrate.

(3)

IV. HASIL DAN PEMBAHASAN A. Pengecekan Missing Value

Analisis cluster dapat dilakukan pada data yang tidak mengandung missing value. Apabila terdapat data yang missing maka harus diatasi sebelum dianalisis lebih lanjut. Berikut adalah tabel yang digunakan untuk mendeteksi apakah pada data American new cars and trucks terdapat missing value atau tidak.

Tabel 2. Pengecekan Missing Value

Valid Missing Total

N Percent N Percent N Percent

40 100 0 0 40 100

Tabel 2 menunjukkan bahwa data berjumlah 40 dan tidak ada missing value sehingga data dapat dianalisis lebih lanjut dengan analisis cluster.

B. Analisis Cluster dengan Single Linkage

Hasil olahan analisis cluster menggunakan metode single linkage berdasarkan iterasi jarak Euclidian yang terdiri dari minimum 2 cluster hingga maksimum 28 cluster.

Berikut merupakan dendogram pengelompokan data menggunakan metode single linkage:

Gambar 1. Grafik dendogram untuk Single Linkage

Dilihat dari grafik rescaled distance cluster combine pada scale distance 25 menunjukkan 2 cluster yang mengelompokkan data. Pada scale distance 20 menunjuk-kan 2 cluster, pada scale distance 10 menunjukmenunjuk-kan 3 clus-ter dan seclus-terusnya sampai menunjukkan 28 cluster yang mengelompokkan data. Kemudian dipilih pengelompokkan 2 cluster.

Tabel 3. Pengelompokkan dengan 2 Cluster

Cluster Jumlah

1 39

2 1

Berdasarkan Tabel 3 terlihat bahwa jumlah anggota pada cluster satu lebih banyak dibandingingkan cluster dua. Terdapat 39 tipe mobil masuk pada cluster satu dan hanya satu tipe mobil masuk pada cluster dua. Selain

menggunakan dendogram, jumlah cluster bisa ditentukan menggunakan pseudo f-statistics. Berikut ini merupakan hasil perhitungan pseudo f-statistics pada metode single linkage.

Tabel 4. Hasil Perhitungan Pseudo f-statistics pada Metode Single Linkage

Metode Hirarki Pseudo F-Statistics

Single Linkage (5 cluster) 4,838

Single Linkage (3 cluster) 5,164

Berdasarkan Tabel 4 hasil perhitungan manual dan pada analisis cluster hirarki dengan metode Single Linkage memiliki nilai pseudo f-statistics yang terbesar adalah metode Single Linkage dengan jumlah cluster sebanyak 2 cluster. Hal ini dapat dikatakan bahwa pengelompokkan yang optimum adalah sebesar 2 cluster. Hal ini juga diperkuat dengan selisih dari banyak data (n) dengan stage yang memiliki lompatan tertinggi pada coefficient dalam Lampiran 1 yang apabila dihitung adalah sebesar 40 – 38 sama dengan 2 cluster.

C. Analisis Cluster dengan Complete Linkage

Berikut merupakan dendogram pengelompokan data menggunakan metode complete linkage dengan iterasi jarak Euclidean.

Gambar 2. Dendogram untuk Complete Linkage

Berdasarkan rescaled distance cluster combine pada gambar 2, scale distance 25 menunjukkan 2 cluster yang terbentuk dalam mengelompokkan data. Pada scale distance 15 menunjukkan 4 cluster yang terbentuk, dan seterusnya hingga menunjukkan 10 cluster yang mengelompokkan data. Kemudian dipilih pengelompokkan 2 cluster dengan hasil sebagai berikut.

Tabel 5. Pengelompokkan 2 Cluster dengan Complete Linkage

Cluster Jumlah

1 27

(4)

Tabel 5 menunjukkan bahwa anggota cluster satu lebih banyak dibandingkan cluster dua. Terdapat 27 tipe mobil pada cluster satu dan 13 tipe mobil pada cluster dua. Selain menggunakan dendogram, jumlah cluster dapat ditentukan melalui pseudo f-statistics. Berikut ini hasil perhitungan pseudo f-statistics dengan menggunakan metode complete linkage.

Tabel 6. Pseudo F-statistics dengan Complete Linkage

Metode Hirarki Cluste_r Pseudo F-_statistics

Complete

Linkage 2 22,1041

Complete

Linkage 3 17,1552

Complete

Linkage 4 15,6317

Complete

Linkage 5 11,6157

Berdasarkan tabel 6, dapat diketahui bahwa nilai pseudo f-statistics terbesar pada metode complete linkage adalah pada 2 cluster. Hal ini dapat dikatakan bahwa pengelompokkan yang optimum dengan metode complete linkage adalah sebesar 2 cluster. Hal ini juga diperkuat dengan selisih dari banyak data (n) dengan stage yang memiliki lompatan tertinggi pada coefficient dalam lampiran 4 yang apabila dihitung adalah sebesar 40 – 38 sama dengan 2 cluster.

D. Analisis Cluster dengan K-Means Method

Pada analisis cluster menggunakan metode K-Means jumlah cluster yang diinginkan adalah sebanyak 2,3,4 dan 5 yang selanjutnya ditentukan jumlah cluster yang optimum. Jumlah cluster optimum pada metode K-Means bisa ditentukan menggunakan pseudo f-statistics. Berikut ini merupakan hasil perhitungan pseudo f-statistics untuk keempat clustering.

Tabel 7. Penentuan Jumlah Cluster Optimum menggunakan Pseudo f

Metode Non Hirarki Pseudo f

K-Means dua cluster 25,228

K-Means tiga cluster 13,660

K-Means empat cluster 21,130

K-Means lima cluster 18,109

Berdasarkan hasil pada Tabel 7 didapatkan nilai pseudo f terbesar adalah pada metode K-Means dengan dua cluster yang berarti bahwa jumlah cluster optimum sebanyak dua.

Setelah mendapatkan cluster optimum dilakukan perhitungan MANOVA untuk mengetahui variabel yang signifikan pada pengelompokkan K-Means dengan dua cluster. Hasil yang didapatkan adalah sebagai berikut.

Tabel 8. Hasil MANOVA Dua Cluster

Variabel F p-value

Retail Price 2,200 0,146

Horsepower 3,217 0,081

Weight 29,929 0,000

Wheel Base 54,468 0,000

Length 47,029 0,000

Width 81,974 0,000

Berdasarkan nilai p-value pada Tabel 8 terlihat bahwa variabel weight, wheel base, length dan width memiliki nilai < α sehingga diputuskan tolak H0. Hal ini berarti

bahwa keempat variabel tersebut yang memiliki kontribusi signifikan dalam mempengaruhi hasil pengelompokkan dua cluster. Adapun jumlah anggota untuk masing-masing cluster dengan metode K-Means dua cluster adalah sebagai berikut.

Tabel 9. Jumlah Anggota pada Pengelompokkan Dua Cluster

Cluster Jumlah

1 23

2 17

Pada pengelompokkan dua cluster 40 data tersebut sudah masuk di dalam cluster dan tidak ditemukan missing value dengan jumlah anggota pada cluster 1 lebih banyak dibandingkan cluster 2 (Tabel 9 ).

E. Metode Terbaik

Kriteria pemilihan model terbaik adalah dengan melihat nilai icdrate terkecil. Berikut merupakan nilai icdrate dari setiap cluster pada setiap metode.

Tabel 10. Hasil icdrate Model Hirarki dan Non Hirarki

Cluster Single Linkage Complete Linkage K-Means

2 0,863 0,976 0,979

Dari Tabel 12, diketahui nilai icdrate terkecil terdapat pada metode Single Linkage dengan 2 cluster, sehingga model pengelompokan dari metode tersebut paling baik diterapkan untuk kasus ini.

V. KESIMPULAN DAN SARAN A. Kesimpulan

Berdasarkan analisis dan pembahasan di atas diperoleh kesimpulan sebagai berikut. Pada dendogram metode clustering hirarki single linkage menghasilkan dua cluster dengan anggota pertama sebanyak 39 kendaraan dan satu kendaraan untuk cluster 2. Selanjutnya pada metode complete linkage juga menghasilkan dua cluster dengan anggota pertama sebanyak 27 kendaraan dan 13 kendaraan pada cluster 2. Keputusan yang sama juga terlihat dari perhitungan pseudo f terbesar yaitu pada dua cluster yang berarti sebagai jumlah cluster optimum. Pada metode non hirarki K-Means menggunakan pseudo f didapatkan kesimpulan yang sama. Jumlah cluster optimum yang terbentuk sebanyak dua cluster dengan variabel yang berkontribusi signifikan dalam pengelompokkan adalah weight, wheel base, length dan width. Pada penentuan model terbaik berdasarkan nilai icdrate terkecil disimpulkan bahwa metode single linkage dengan dua cluster adalah metode terbaik.

B. Saran

Berdasarkan penelitian yang telah dilakukan, saran yang dapat diberikan untuk penelitan selanjutnya adalah melakukan standarisasi data terlebih dahulu jika data yang digunakan memiliki stauan yang berbeda-beda agar clustering yang dihasilkan tepat.

DAFTAR PUSTAKA

[1] Rencher, Alvin C. 2002. Methods of Multivariate Analysis, Second Edition. Canada: John Wiley & Sons, Inc.

[2] Johnson, Richard. 2007. Applied Multivariate Statistical Analysis. Madison : Pearson Prentice Hall. [3] Rencher, Alvin C. 2002. Methods of Multivariate

Analysis, Second Edition. Canada: John Wiley & Sons, Inc.

[4] Santoso, Singgih. 2010. Statistik Multivariat, Konsep dan Aplikasi dengan SPSS. Jakarta: PT Elex Media Komputindo.

(5)

(6)

LAMPIRAN

1. Data retail price, horsepower, dan weight berdasarkan penjualan tipe mobil di Amerika Serikat tahun 2004

Vehicle Name X1 X2 X3

Acura RSX Type S 2dr 23820 200 2778

Audi A4 3.0 4dr 31840 220 3462

Audi A4 3.0 Quattro 4dr auto 34480 220 3627

Audi A6 2.7 Turbo Quattro 4dr 42840 250 3836

Audi A6 3.0 4dr 36640 220 3561

Audi A6 3.0 Quattro 4dr 39640 220 3880

Audi A8 L Quattro 4dr 69190 330 4399

Audi S4 Avant Quattro 49090 340 3936

BMW 325i 4dr 28495 184 3219

BMW 330Ci convertible 2dr 44295 225 3616

BMW 545iA 4dr 54995 325 3814

BMW X3 3.0i 37000 225 4023

Buick Century Custom 4dr 22180 175 3353

Buick Park Avenue 4dr 35545 205 3778

Cadillac Deville 4dr 45445 275 3984

Chevrolet Astro 26395 190 4605

Chevrolet Corvette 2dr 44535 350 3246

Chevrolet Corvette convertible 2dr 51535 350 3248

Chevrolet Impala 4dr 21900 180 3465

Chevrolet Malibu Maxx LS 22225 200 3458

Chevrolet Tahoe LT 41465 295 5050

Chrysler 300M 4dr 29865 250 3581

Chrysler Concorde LXi 4dr 26860 232 3548

Chrysler Sebring Touring 4dr 21840 200 3222

CMC Yukon 1500 SLE 35725 285 5042

Dodge Durango SLT 32235 230 4987

Dodge Grand Caravan SXT 32660 215 4440

Dodge Intrepid SE 4dr 22035 200 3469

Ford Escape XLS 22515 201 3346

Ford Freestar SE 26930 193 4275

GMC Safari SLE 25640 190 4309

GMC Yukon XL 2500 SLT 46265 325 6133

Honda Accord EX V6 2dr 26960 240 3294

Honda CR-V LX 19860 160 3258

Honda Odyssey LX 24950 240 4310

Hyundai Accent GL 4dr 11839 103 2290

Hyundai Elantra GT 4dr 15389 138 2635

Infiniti FX45 36395 315 4309

Infiniti G35 4dr 32445 260 3677

Isuzu Rodeo S 20449 193 3836

2. Data wheel base, length, dan width berdasarkan penjualan tipe mobil di Amerika Serikat tahun 2004

Vehicle Name X4 X5 X 6

Acura RSX Type S 2dr 10₁ 17₂ 6₈

Audi A4 3.0 4dr 10₄ 17₉ 7₀

Audi A4 3.0 Quattro 4dr auto 10₄ 17₉ 7₀

Audi A6 2.7 Turbo Quattro 4dr 10₉ 19₂ 7₁

Audi A6 3.0 4dr 10₉ 19₂ 7₁

Audi A6 3.0 Quattro 4dr 10₉ 19₂ 7₁

Audi A8 L Quattro 4dr 12₁ 20₄ 7₅

Audi S4 Avant Quattro 10₄ 17₉ 7₀

BMW 325i 4dr 10₇ 17₆ 6₉

BMW 330Ci convertible 2dr 10 17 6

7 7 9

BMW 545iA 4dr 11₄ 19₁ 7₃

BMW X3 3.0i 11₀ 18₀ 7₃

Buick Century Custom 4dr 10₉ 19₅ 7₃

Buick Park Avenue 4dr 11₄ 20₇ 7₅

Cadillac Deville 4dr 11₅ 20₇ 7₄

Chevrolet Astro 11₁ 19₀ 7₈

Chevrolet Corvette 2dr 10₅ 18₀ 7₄

Chevrolet Corvette convertible 2dr 10₅ 18₀ 7₄

Chevrolet Impala 4dr 11₁ 20₀ 7₃

Chevrolet Malibu Maxx LS 11₂ 18₈ 7₀

Chevrolet Tahoe LT 11₆ 19₇ 7₉

Chrysler 300M 4dr 11₃ 19₈ 7₄

Chrysler Concorde LXi 4dr 11₃ 20₈ 7₄

Chrysler Sebring Touring 4dr 10₈ 19₁ 7₁

CMC Yukon 1500 SLE 11₆ 19₉ 7₉

Dodge Durango SLT 11₉ 20₁ 7₆

Dodge Grand Caravan SXT 11₉ 20₁ 7₉

Dodge Intrepid SE 4dr 11₃ 20₄ 7₅

Ford Escape XLS 10₃ 17₃ 7₀

Ford Freestar SE 12₁ 20₁ 7₇

GMC Safari SLE 11₁ 19₀ 7₈

GMC Yukon XL 2500 SLT 13₀ 21₉ 7₉

Honda Accord EX V6 2dr 10₅ 18₈ 7₁

Honda CR-V LX 10₃ 17₉ 7₀

Honda Odyssey LX 11₈ 20₁ 7₆

Hyundai Accent GL 4dr 96 16₇ 6₆

Hyundai Elantra GT 4dr 10₃ 17₈ 6₈

Infiniti FX45 11₂ 18₉ 7₆

Infiniti G35 4dr 11₂ 18₇ 6₉

Isuzu Rodeo S 10₆ 17₈ 7₀

3. Agglomeration Schedule dengan metode Single Linkage

Stage Cluster Combined Coefficients Cluster 1 Cluster 2

1 2 3 ,320

2 16 31 ,417

3 5 6 ,512

4 21 25 ,541

(7)

6 4 5 ,580

7 17 18 ,592

8 20 24 ,790

9 13 28 ,802

10 13 23 ,816

11 13 20 ,820

12 29 34 ,896

13 27 30 ,918

14 13 22 ,929

15 9 29 ,941

16 9 40 ,948

17 2 9 ,959

18 13 33 ,964

19 27 35 ,977

20 13 14 ,981

21 2 13 1,007

22 2 10 1,007

23 1 2 1,030

24 4 39 1,149

25 26 27 1,149

26 1 37 1,168

27 1 4 1,187

28 1 12 1,206

29 21 26 1,388

30 1 21 1,483

31 1 15 1,516

32 8 17 1,520

33 1 38 1,706

34 1 16 1,712

35 1 36 1,727

36 1 11 1,825

37 1 8 1,923

38 1 7 2,182

39 1 32 3,264

4. Hasil pengelompokkan Single Linkage dua cluster

Cluste

r Tipe Mobil

1

Acura RSX Type S 2dr, Audi A4 3.0 4dr, Audi A4 3.0 Quattro 4dr , Audi A6 2.7 Turbo Quattro 4drauto, Audi A6 3.0 4dr, Audi A6 3.0 Quattro 4dr, Audi S4 Avant Quattro, BMW 325i 4dr, BMW 330Ci convertible 2dr, BMW X3 3.0i, Buick Century Custom 4dr, Buick Park Avenue 4dr, Chevrolet Corvette 2dr, Chevrolet Corvette convertible 2dr, Chevrolet Impala 4dr, Chevrolet Malibu Maxx LS, Chrysler 300M 4dr, Chrysler Concorde LXi 4dr, Chrysler Sebring Touring 4dr, Dodge Intrepid SE 4dr, Ford Escape XLS, Honda Accord EX V6 2dr, Honda CR-V LX, Hyundai Accent GL 4dr, Hyundai Elantra GT 4dr, Infiniti G35 4dr, Isuzu Rodeo S, Audi A8 L Quattro 4dr, BMW 545iA 4dr, Cadillac Deville 4dr, Chevrolet Astro, Chevrolet Tahoe LT, CMC Yukon 1500 SLE, Dodge Durango SLT, Dodge Grand Caravan SXT, Ford Freestar SE, GMC Safari SLE, Honda Odyssey LX, dan Infiniti FX45

2 GMC Yukon XL 2500 SLT

5. Agglomeration Schedule dengan metode Complete Linkage

Stage Cluster Combined Coefficients Cluster 1 Cluster 2

1 2 3 ,320

2 16 31 ,417

3 5 6 ,512

4 21 25 ,541

5 13 19 ,548

6 17 18 ,592

7 20 24 ,790

8 23 28 ,816

9 4 5 ,825

10 29 34 ,896

11 27 30 ,918

12 29 40 1,086

13 2 9 1,142

14 26 35 1,149

15 22 23 1,231

16 14 22 1,259

17 4 39 1,272

18 26 27 1,324

19 13 20 1,370

20 1 37 1,414

21 10 12 1,505

22 2 33 1,535

23 8 17 1,556

24 4 10 1,627

25 2 29 1,717

26 21 38 1,762

27 11 15 1,825

28 16 26 2,079

29 1 36 2,297

30 13 14 2,474

31 7 11 2,494

32 16 21 2,810

33 4 8 2,965

34 2 13 3,812

35 2 4 4,426

36 7 16 4,864

37 7 32 5,396

38 1 2 6,232

39 1 7 10,525

6. Hasil pengelompokkan Complete Linkage dua cluster

Cluste

r Tipe Mobil

1

Acura RSX Type S 2dr, Audi A4 3.0 4dr, Audi A4 3.0 Quattro 4dr , Audi A6 2.7 Turbo Quattro 4drauto, Audi A6 3.0 4dr, Audi A6 3.0 Quattro 4dr, Audi S4 Avant Quattro, BMW 325i 4dr, BMW 330Ci convertible 2dr, BMW X3 3.0i, Buick Century Custom 4dr, Buick Park Avenue 4dr, Chevrolet Corvette 2dr, Chevrolet Corvette convertible 2dr, Chevrolet Impala 4dr, Chevrolet Malibu Maxx LS, Chrysler 300M 4dr, Chrysler Concorde LXi 4dr, Chrysler Sebring Touring 4dr, Dodge Intrepid SE 4dr, Ford Escape XLS, Honda Accord EX V6 2dr, Honda CR-V LX, Hyundai Accent GL 4dr, Hyundai Elantra GT 4dr, Infiniti G35 4dr, dan Isuzu Rodeo S

2