• Tidak ada hasil yang ditemukan

2.3 TEORI STATISTIK 1 Populasi dan Sampel

2.4.3 Analisis Cluster

Analisis cluster adalah suatu analisis statistik untuk membuat kelompok (cluster) dari data objek multivariat (Hardle dan Shimar, 2003). Metode yang biasa digunakan dibagi menjadi dua tahapan pokok yaitu pemilihan ukuran kedekatan dan pemilihan dari algoritma group-building. Tujuan analisis cluster

dalam penelitian ini digunakan untuk mengidentifikasi sub segmen berdasarkan kebutuhan yang berbeda. Hal ini dilakukan dengan mengelompokkan individu yang homogen menurut beberapa kriteria yang tepat. Analisis cluster berusaha meminimumkan variansi didalam cluster (within-cluster) dan memaksimumkan variansi antar grup (between-cluster). Seperti halnya analisis faktor, pada analisis

cluster tidak ada variabel yang didefinisikan bebas atau tergantung, semua variabel diperhitungkan secara simultan.

Salah satu sifat analisis cluster adalah ‘more an art than a science’ (Hair et al, 1998) sehingga dapat dengan mudah mengalami salah terap (misapplied). Ukuran kesamaan atau algoritma yang berbeda dapat mempengaruhi hasil. Untuk mengatasi hal ini, harus dilakukan analisis cluster berulang-ulang dengan menggunakan metode yang berbeda-beda sehingga dapat menemukan pola tersembunyi dalam pengelompokan objek-objek yang ada.

Metode analisis cluster yang populer adalah hierarchical method dan non hierarchical method atau positioning method. Dalam metode hirarki pembagian kelompok dilakukan berdasarkan hirarki yang ada sehingga jumlah kelompok data yang terbentuk sangat bergantung pada karakteristik data, sedangkan pada metode pemisahan berlawanan dengan metode hirarki yaitu jumlah kelompok ditentukan

dahulu baru kemudian data dibagi sesuai dengan jumlah kelompok yang telah ditetapkan.

Kelas algoritma cluster dibagi menjadi dua jenis, yaitu: algoritma hirarki dan algoritma partisi. Algoritma hirarki dimulai dengan sekumpulan partisi dan selangkah demi selangkah menempatkan kelompok bersama. Teknik algoritma hirarki sering digunakan dalam praktek. Algoritma partisi dimulai dari awal

clustering dan pertukaran unsur-unsur kelompok sampai nilai tertentu tercapai. Ada empat kriteria penugasan dalam metode agglomeratif, yaitu: 1. Metode Single Linkage

Metode ini lebih dikenal dengan metode hubungan atau nearst neighbour. Dalam metode hiraraki tunggal (single linkage) atau metode tetangga terdekat pelasanaannya didasarkan pada perhitungan jarak terpendek. Kedua objek ini akan membentuk kelompok pertama. Pada tahap selanjutnya satu atau dua kemungkinan dapat terjadi, yaitu pertama apakah objek ketiga akan bergabung pada kelompok yang telah terbentuk atau kedua objek ketiga ini akan bergabung dengan objek lainnya membentuk kelompok kedua. Pembentukan kelompok tergantung apakah jarak dari objek ke kelompok pertama lebih dekat dibandingkan dengan jarak objek tersebut dengan objek lainnya yang belum terkelompok. Proses ini berlangsung terus sampai semua objek menjadi satu.

2. Metode Complete Linkage

Metode ini juga disebut sebagai metode furtherst neighbour atau diameter method. Metode ini kebalikan dari metode single linkage dimana jarak antar

cluster ditentukan sebagai jarak terjauh.

3. Metode Average Linkage

Metode average linkage merupakan variasi dari algoritma single linkage dan

complete linkage. Algoritma yang dipakai sama dengan kedua metode tersebut kecuali pehitungan jarak yang dipakai, yaitu bahwa jarak antar

cluster-cluster didefinisikan sebagai jarak rata-rata antara seluruh pasangan objek yang akan digabungkan.

4. Metode Ward’s Error Sum Of Square

Metode ini membentuk cluster berdasarkan jumlah total kuadrad deviasi tiap pengamatan dari rata-rata cluster yang menjadi anggotanya. Dalam hal ini nilai error sum of square merupakan fungsi objektif pada saat melakukan penggabungan.

Menurut Hair et al (1998) langkah-langkah analisis cluster dapat dibagi dalam enam tahap, yaitu:

1. Penentuan tujuan analisis

Tujuan analisis cluster terbagi menjadi tiga, yaitu taxonomy description yang merupakan analisis cluster dilakukan dengan tujuan eksplorasi (exploratory purpose), yaitu untuk mengklasifikasikan objek-objek ke dalam beberapa grup, data simplification adalah analisis cluster yang dilakukan untuk menyederhanakan data, yaitu dengan mereduksi jumlah observasi bagi keperluan analisis selanjutnya dan relationship identification yaitu analisis

cluster yang dilakukan untuk mengidentifikasi hubungan, yaitu dengan mengidentifikasi hubungan kemiripan (similarity) dan perbedaan (differences). 2. Penyusunan desain riset analisis

Desain riset analisis cluster meliputi pendeteksian outlier, pengukuran kemiripan objek dan penstandarisasian data. Dalam pendeteksian outlier,

outlier dapat mengubah struktur asli dan menghasilkan cluster yang tidak representatif terhadap struktur populasi yang sesungguhnya, oleh karena itu pendeteksian terhadap outlier sangat diperlukan. Outlier dapat dideteksi dengan menggunakan grafik, di mana dari grafik tersebut dapat diketahui adanya objek-objek yang mempunyai profil yang berbeda, yang ditunjukkan dari nilai yang sangat ekstrim pada satu atau beberapa variabel.

Pada analisis cluster, konsep kemiripan adalah sangat mendasar. Kemiripan interobjek adalah pengukuran kesesuaian atau kemiripan antara objek yang akan dikelompokkan. Kemiripan interobjek dapat dilihat dari tiga ukuran, yaitu korelasi dan jarak untuk data metrik, serta asosiasi untuk data nonmetrik. Untuk mengetahui kemiripan dapat dilihat dari koefisien korelasi antara pasangan objek. Korelasi yang tinggi mengindikasikan kemiripan, dan sebaliknya korelasi yang rendah mengindikasikan perbedaan. Tetapi,

pengukuran korelasi ini sangat jarang digunakan karena penekanan aplikasi analisis cluster adalah pada jarak objek, bukan pola nilainya.

Pengukuran jarak berdasar kemiripan yang mewakili kemiripan sebagai kedekatan observasi dengan yang lain. Pengukuran jarak sesungguhnya adalah pengukuran terhadap perbedaan, di mana semakin besar nilainya menunjukkan semakin kurang kemiripannya. Jarak dikonversikan sebagai pengukuran kemiripan dengan menggunakan hubungan kebalikan. Pengukuran asosiasi berdasar kemiripan digunakan untuk membandingkan objek yang termasuk data nonmetrik (nominal dan ordinal). Pengukuran ini dapat menilai tingkat kepercayaan atau kesesuaian antara pasangan responden. Sebelum proses penstandarisasian data dimulai, perlu ditentukan lebih dahulu apakah data perlu distandarisasi atau tidak. Pertimbangannya antara lain kebanyakan pengukuran jarak sangat peka terhadap perbedaan skala atau besarnya variabel, variabel dengan standar deviasi yang besar mempunyai pengaruh yang lebih terhadap nilai akhir kemiripan dan bila dilihat melalui grafik, tidak akan terlihat adanya perbedaan pada dimensi sehubungan dengan letaknya. Proses standarisasi dapat terbagi menjadi dua, yaitu standarisasi variabel dan standarisasi observasi atau objek. Standarisasi variabel adalah perubahan dari setiap variabel menjadi skor standar (z-scores) dengan mengurangi mean dan membaginya dengan standar deviasi setiap variabel. Standarisasi observasi dilakukan terhadap responden atau objek. Standarisasi ini sangat diperlukan, jika clustering dilakukan dengan tujuan mengidentifikasi kepentingan relatif suatu variabel terhadap variabel lainnya. Menurut Dillon (1984) dalam proses clustering, teknik yang dapat dilakukan untuk pengukuran jarak, antara lain:

a. Interval 1) Euclidian Distance − = (Xi Yi)2 Y) D(X, ………..………..….Persamaan 2.8

2) Squared Euclidian Distance

− = )2 i Y i X ( Y) D(X, ………..……Persamaan 2.9

b. Frekuensi 1) Chi Square − + − = ) i E(Y 2 )) i E(Y i Y ( ) i E(X 2 )) i E(X i X ( Y) D(X, …Persamaan 2.10 c. Biner

1) Squared Euclidian Distance

c b Y) D(X, = + ………..Persamaan 2.11 2) Euclidian Distance c b Y) D(X, = + ………...Persamaan 2.12 3. Pengujian asumsi

Analisis cluster tidak termasuk teknik statistik inferensia, di mana parameter analisis ini adalah seberapa besar sampel dapat mewakili populasi. Analisis

cluster mempunyai sifat matematik dan bukan dasar statistik, syarat kenormalan, linieritas, dan homogenitas tidak begitu penting karena memberikan pengaruh yang kecil sehingga tidak perlu diuji. Adapun hal-hal yang perlu diuji adalah kerepresentatifan sampel dan multikolinieritas. Dalam kerepresentatifan sampel, sampel dikumpulkan dan cluster diperoleh dengan harapan dapat mewakili struktur populasi. Baik atau tidaknya analisis cluster

sangat tergantung pada seberapa representatif sampel sehingga terlebih dahulu sampel perlu diuji kerepresentatifannya. Sementara itu, dalam multikolinieritasan, variabel-variabel yang bersifat multikolinier secara implisit mempunyai bobot lebih besar. Multikolinieritasan bertindak sebagai proses pembobotan yang berpengaruh pada analisis, sehingga variabel- variabel yang digunakan terlebih dahulu harus diuji tingkat multikolinieritasannya.

4. Pembentukan cluster (partisi) dan penilaian overall fit

Proses partisi (partitioning) dan penilaian overall fit dimulai setelah variabel- variabel yang digunakan dipilih dan matriks korelasi dibentuk. Sebelum proses dimulai, harus dilakukan pemilihan algoritma pembentukan cluster

dibentuk. Algoritma pembentukan cluster terdiri dari prosedur hirarki (hierarchical procedures) dan prosedur nonhirarki (nonhierarchical procedures).

Teknik hirarki adalah teknik clustering yang membentuk konstruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon. Jadi proses pengelompokan dilakukan secara bertingkat atau bertahap. Teknik hirarki terbagi menjadi dua, yaitu metode agglomeratif (agglomerative methods) dan metode divisif (divisive methods). Metode agglomeratif dimulai dengan pernyataan bahwa setiap objek membentuk clusternya masing-masing. Dua objek dengan jarak terdekat bergabung, selanjutnya objek ketiga akan bergabung dengan cluster yang ada atau bersama objek yang lain membentuk

cluster baru. Hal ini dilakukan dengan tetap memperhitungkan jarak kedekatan antar objek. Proses akan terus berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari keseluruhan objek. Sementara itu, metode divisif berlawanan dengan metode agglomeratif. Metode dimulai dengan satu cluster

besar yang mencakup semua observasi (objek), kemudian objek yang memiliki ketidakmiripan besar dipisahkan sehingga membentuk cluster yang lebih kecil, dan seterusnya untuk objek-objek yang tidak mirip lainnya. Proses pemisahan terus berlanjut hingga setiap observasi adalah cluster bagi dirinya sendiri.

Sementara itu, prosedur nonhirarki tidak melibatkan proses pembentukan konstruksi struktur pohon. Dimulai dengan memilih sejumlah nilai cluster

awal sesuai dengan jumlah yang diinginkan kemudian objek digabungkan ke dalam cluster-cluster tersebut. Metode non hirarki yang digunakan adalah k- means clustering.

5. Interpretasi hasil

Pada tahap ini yang perlu diperhatikan adalah karakteristik apa yang membedakan masing-masing cluster kemudian sesuai dengan tujuan, pemberian nama dilakukan berdasar apa yang dapat diberikan oleh objek pembentuk kepada masing-masing cluster tersebut. Tentunya terlebih dahulu perlu ditentukan spesifikasi atau kreteria yang mendasari cluster-cluster yang telah terbentuk. Di samping itu, interpretasi dari hasil clustering dapat

dilakukan terhadap grafik dendogram maupun analisis nilai koefisien agglomeratif. Jarak antar pengelompokan sebenarnya merupakan interpretasi dari beberapa nilai kedekatan dalam menggabungkan objek dalam cluster. Interpretasi cluster menghasilkan lebih dari hanya suatu deskripsi. Interpretasi

cluster memberikan penilaian kesesuaian cluster yang terbentuk berdasar teori prioritas atau pengalaman praktek. Dalam konfirmatori, analisis cluster

memberikan pengertian secara langsung terhadap penilaian kesesuaian.

Cluster juga memberikan langkah-langkah untuk membuat suatu penilaian dari segi signifikansi prakteknya.

6. Profiling cluster

Tahap profiling meliputi penggambaran karakteristik dari setiap cluster untuk menjelaskan bahwa masing-masing cluster adalah berbeda berdasar dimensi- dimensi tertentu. Analisis profil tidak memfokuskan pada apa yang secara langsung menentukan cluster tapi karakteristik cluster setelah proses identifikasi. Lebih lanjut, adanya penegasan bahwa karakteristik adalah berbeda secara signifikan terhadap cluster dan dapat memprediksikan anggota-anggota cluster secara lebih spesifik.

2.5 PENELITIAN TERDAHULU

Kotri (2006), melakukan penelitian yang berjudul “Analisis Nilai Pelanggan menggunakan Analisis Conjoint: Contoh Perusahaan Kemasan”. Tujuan penelitian ini adalah untuk mengetahui atribut-atribut kemasan yang penting oleh pelanggan di Perusahaan Estiko-Plastar. Penelitian ini menggunakan analisis conjoint. Secara deskriptif penelitian ini membahas tentang tujuh atribut kemasan diperusahaan Estiko-Plastar yaitu kualitas bahan plastik dan pengelasan, waktu pengiriman, kualitas percetakan, harga, kemahiran manajer pemasaran dan fleksibel produksi yang disebar kepada 36 responden untuk dirangking. Dari tujuh atribut tersebut didapatkan bahwa kualitas bahan plastik dan pengelasan yang paling dipilih oleh responden dengan nilai kepentingan relatif sebesar 23,9% dan harga sebesar 20,9% sebagai pilihan kedua yang dipilih ketika melihat kemasan di Estiko-Plastar. Untuk mengidentifikasi sub segmen yang bebeda maka dilakukan analisis cluster. Dari analisis cluster didapatkan empat segmen yaitu waktu

pengiriman yang singkat, manajer penjualan yang professional dan fleksibel produksi, kualitas bahan plastik yang baik dengan harga yang wajar dan kualitas bahan cetak dan bahan plastik.

Manurung (2006), melakukan penelitian yang berjudul “Analisis Penelitian terhadap atribut-atribut sepatu olahraga reebok dengan menggunakan

Conjoint Analysis”. Tujuan penelitian ini adalah untuk mengetahui atribut-atribut yang dianggap penting oleh konsumen sebagai pertimbangan dalam pemilihan produk sepatu olahraga reebok. Selain itu juga untuk mengetahui kombinasi- kombinasi atribut sepatu reebok yang diminati oleh konsumen. Penelitian ini menggunakan analisis conjoint. Secara deskriptif penelitian ini membahas tentang enam atribut sepatu reebok yaitu harga, warna, desain, bahan, lekatan, dan inovasi. Dari keenam atribut itu dibuat kuesioner yang disebarkan kepada 400 responden. Dari 400 responden tersebut didapatkan 367 responden yang kuesionernya sah untuk dilakukan pengolahan data. Hasil pengolahan data didapatkan bahwa responden membeli sepatu reebok pertama kali yang dilihat adalah desain sepatu dengan nilai kepentingan relatif sebesar 34,45 dan yang kedua adalah warna sepatu dengan nilai sebesar 35,35.

Kastaman (2005), melakukan penelitian yang berjudul “Kajian Proses Pengasinan Telur dengan Metode Reverse Osmosis pada berbagai Lama Perendaman”. Tujuan dari penelitian ini adalah untuk mengetahui pengaruh penerapan metode reverse osmosis dalam proses pengasinan telur terhadap beberapa karakteristik telur asin yang meliputi kehilangan air, penambahan garam, kadar air, kadar garam, perubahan berat telur dan karakteristik organoleptik telur asin. Secara deskriptif penelitian ini membahas tentang pengasinan dengan perlakuan berdasarkan kriteria kadar garam telur asin, kesukaan terhadap rasa telur asin, kesukaan terhadap warna telur asin, kesukaan terhadap tekstur telur asin dan kesukaan terhadap aroma telur asin. Berdasarkan kadar garam telur asin, semua perlakuan telur asin menghasilkan kadar garam diatas 2%. Kadar garam ini sudah sesuai dengan standar SNI karena standar SNI minimal 2%. Untuk kriteria kesukaan rasa telur metode reverse osmosis lebih disukai dari metode dehidrasi osmosis, untuk kriteria warna telur lebih disukai karena menghasilkan skor kesukaan warna yang lebih tinggi dan berbeda nyata dengan metode reverse

osmosis, untuk kriteria tekstur telur metode reverse osmosis dengan lama perendaman 58 jam menghasilkan kesukaan terhadap tekstur dengan skor lebih tinggi dan kriteria terhadap aroma telur perlakuan metode maupun lama perendaman tidak menunjukkan perbedaan yang nyata.

BAB III

Dokumen terkait