• Tidak ada hasil yang ditemukan

HI. KERANGKA TEORI. kelompok tersebut menimbulkan pengurangan dimensionalitas suatu tabel data,

N/A
N/A
Protected

Academic year: 2021

Membagikan "HI. KERANGKA TEORI. kelompok tersebut menimbulkan pengurangan dimensionalitas suatu tabel data,"

Copied!
10
0
0

Teks penuh

(1)

HI. KERANGKA TEORI

3.1. Cluster Analysis

Cluster analyszs adalah suatu analisis untuk menyusun objek-objek menjadi kelompok-kelompok (cluster-cluster) dan pembentukan kelompok- kelompok tersebut menimbulkan pengurangan dimensionalitas suatu tabel data, yaitu semakin sedikitnya jumlah baris (objek). Cluster analyszs merupakan tool yang mampu memberikan kepada kita kelompok-kelompok secara objektif (Legendre, 1 998).

Menurut Anderberg (1973), bahwa cluster analyszs dapat berkontribusi langsung terhadap pengembangan skema klasifikasi. Hal ini sejalan dengan pernyataan Greenacre (1984), bahwa cluster analyszs sering disebut sebagai cla~s.slJicatzon automatzque,

di

mana similaritas dari observasi-observasi antar objek dipelajari dengan tujuan membentuk kelompok-kelompok dari objek-objek yang sama. Dengan kata lain, kita menciptakan suatu partisi-partisi ataupun serangkaian partisi dan objek-objek tersebut. Berbeda dengan dzskrzmlnan analysu, di mana d~~skrzmznan analysrs memberikan penekanan yang berbeda pada partisi-partisi yang Qanalisis dan terdapat suatu partisi tertentu yang lebih diutamakan. Sedangkan cluster analysis, partisi-partisi dlhasilkan dan analisis. Untuk lebih jelas mengenai perbedaan keduanya dapat dilihat Gambar 1 dan Gambar 2.

Sementara itu, Kaufman dan Rousseeuw (1990) mendefinisikan cluster analyszs sebagai seni menemukan kelompok-kelompok dalam data, dan kelompok-kelompok yang ditemukan tersebut dinamai dengan cluster.

(2)

Gambar 1. Diskriminan Analysis

I

---. z l , 22,. . .

---.

Gambar 2. Cluster Analysis Menghasilkan Sekelompok Nilai-Nilai Kualitatif dalam Bentuk Partisi Objek-Objek (dan/atau Peubah)

Sumber : Kaufman dan Rousseeuw, 1990

Prinsip dasar cluster analysis adalah bahwa objek-objek dalarn satu kelompok adalah sama satu dengan lainnya. Sernentara objek-objek yang berada dalam kelompok yang berbeda memiliki perbedaan yang besar satu sama lainnya.

Pengelompokan ini memiliki peranan penting dalam kehidupan sehari-hari dan juga dalam ilmu pengetahuan-teknologi. Dalam marketing, pengelompokan dilakukan untuk mengidentifikasi segmen-segmen pasar, misalnya kelompok- kelompok konsumen dengan kebutuhan yang sama dan lain-lain. Tujuan cluster analysis adalah untuk mendapatkan suatu partisi ataupun serangkaian partisi clan sekelompok objek berdasarkan similaritasnya dengan yang lainnya sehingga objek da.larn satu kelompok yang sama memiliki kemiripan atau kesamaan dengan objek lainnya. Sedangkan kelompok-kelompok yang berbeda tidak mirip sarna sekali atau jauh berbeda satu sama lainnya sehingga dpisahkan (Greenacre, 1984).

(3)

Teknik cluster ana/y.szs pada umumnya dapat digolongkan menjadi dua, yaitu hzerarchical technique dan non-hierarchzcal technzque. Pada teknik hierarki, dimana proses klasifikasi (clustermg) menghasilkan jumlah kelompok-kelompok yang semakin banyak. Teknik ini dapat berupa dzvlsive ataupun agglomeratzve. Drvzsrve technzque, menganggap semua objek sebagai satu kelompok. Kemudian kelompok tersebut dipecah menjadi kelompok-kelompok yang semakin kecil. Sedangkan agglomerative technzque dimulai dengan anggota "cluster-cluster single" yang kemudian digabung sampai terbentuk satu kelompok baru yang besar. Jadi kedua teknik tersebut saling berkebalikan. Untuk lebih jelasnya mengenai teknik-teknik ini dapat dilihat pada Gambar 3.

Pada Gambar 3, penggerombolan dilakukan terhadap obat-obatan a, 6, c, d dan e berdasarkan kegunaan obat-obat tersebut. Dengan menggunakan teknik agglomeratif, masing-masing obat dianggap sebagai group (gerombol). Berdasarkan kegunaan obat tersebut, obat a dan b memiliki kegunaan yang paling mirip dan obat d sangat mirip kegunaannya dengan obat e, yaitu pada tingkat ketidakrniripan sebesar satu. Pada tingkat ketidakmiripan yang sama obat c sangat berbeda dengan keempat obat lainnya. Namun pada tingkat ketidakmiripan sebesar tiga, obat c mirip dengan obat d dan e tetapi berbeda dengan obat a dan b.

Pada tingkat ketidakmiripan sebesar empat, kelima obat tersebut baru bisa dikelompokkan dalam satu group. Sedangkan pada teknik divisif, pengelompokan dimulai dengan menganggap bahwa kelima obat tersebut dalam satu group dan kemudian baru dipecah-pecahkan sampai akhimya terbentuk lima group. Teknik tak berhirarki lebih & k e d sebagai k-mean atau partitioning methods, yang mengelompokkan data ke dalam k kelompok dengan persyaratan bahwa setiap

(4)

kelompok paling tidak terdiri dari satu objek dan setiap objek hams mempunyai posisi dalam satu kelompok.

k I n ... (3.1) dimana: k = jumlah kelompoWcluster n = jumlah objek v agglomerative divisive

Gambar 3. Perbedaan Agglomerative Technique dan Divisive Technique Sumber : Kaufrnan dan Rousseeuw, 1990 ha]: 45

Nilai k ditentukan sendiri oleh analist, sehingga algoritma akan membentuk suatu partisi sebanyak kelornpok yang diingnkan. Dalam ha1 ini

(5)

diperlukan beberapa iterasi, di mana algoritma perlu dijalankan beberapa kali (secara berulang) dengan nilai k yang berbeda mtuk menyeleksi k yang mana yang dianggap memiliki karakteristik atau tampilan grafik yang terbaik, yaitu dalam pengertian bahwa objek-objek dalam kelompok yang sama hams berhubungan erat satu sama lainnya, dan kelompok-kelompok yang berbeda harus terpisah dan sangat berbeda (Kaufman dan Rousseeuw, 1990).

Namun Suharjo dan Siswandi (1999) menambahkan bahwa sebelum analisis dilakukan jumlah kelompok yang akan dibentuk h a m ditentukan terlebih dahulu. Tapi untuk menentukan jumlah segrnen tidaklah mudah, karena terkait erat dengan jumlah gerombol yang ada dalam realita. Untuk mengatasi ha1 tersebut, umumnya ditentukan melalui cara eksplorasi, yakni dengan menentukan jumlah gerombol yang ada mulai dari 2,3,4,. .. , dan seterusnya.

Namun demikian ada kriteria yang dijadikan sebagai penentu jumlah gerombol berakhir, yaitu:

1 . Gerombol yang terbentuk hams dapat diinterpretasikan

2. Aspek proporsionalitas jumlah inhvidu atau objek dalam Gerombol hams diperhatikan.

Menurut Greenacre (1984), walaupun terdapat dua macam teknik pengelompokan, namun yang paling penting dilakukan sebelum pengelompokan adalah bagaimana mengukur "distance" atau "similaritas" antar objek-objek, dimana jika terdapat

I

objek, maka suatu matrik simetris

I

x 1 perlu dihitung. Untuk menghindari terjadinya pengulangan, maka unalist perlu menggambarkan pengelompokan dalam format "dzstance" antar objek.

(6)

Selain itu, Suharjo dan Siswandi (1999) menambahkan bahwa pemilihan metoda mana yang akan digunakan secara urnurn sangat ditentukan oleh fenomena yang dihadapi sesuai dengan bidang permasalahannya. Bahkan yang paling penting, bahwa pemilihan tersebut ddakukan atas dasar keberartian hasil pengelompokan yang diperoleh, sehingga hampir semua metoda digunakan dan kemudian hasilnya dibandingkan.

3.2. Standarisasi Data

Greenacre (1984) menjelaskan bahwa proses analisis dalam cluster analyszi akan menyusun objek-objek dan peubah-peubah yang akan dianalisis ke dalam suatu matrik yang simetris. Misalkan objek yang dianalisis berjumlah n dan jumlah peubahnya adalah p, maka akan diperoleh sebuah matrik n x p sebagai berikut :

p peubah

n objek

Namun, dalam banyak kasus perubahan unit ukuran bisa menghasilkan struktur cluster yang berbeda. Untuk menghindari ketergantungan pada pemilihan satuan pengukuran, maka digunakan data yang telah distandarisasi, sehingga peubah-peubahnya tidak mempunyai satuan.

Untuk melakukan standarisasi data, maka dilakukan penghitungan nilai rata-rata dan setiap peubah, yaitu biasanya dengan menggunakan rumus:

(7)

dimana:

mf = nilai rata-rata masing-masing peubah

n = jumlah objek

X f

= nilai peubah untuk objek ke-l

f

= peubah ke- 1,. . . , p

Selanjutnya perlu hlakukan penghitungan ukuran dispersi atau ukuran deviasi. Secara tradisional digunakan standar deviasi biasa, yaitu dengan rumus:

dimana:

stdf = standar deviasi biasa masing-masing peubah

Namun standar deviasi biasa ini sangat rentan terhadap nilai-nilai yang ekstrim, karena Hartigan (1975) dalam Kaufman dan Rousseeuw (1990) mengingatkan bahwa analist perlu menggunakan suatu ukuran dispersi yang tidak terlalu sensitif terhadap nilai-nilai yang ekstrim, sehingga ukuran deviasi yang sering dipakai adalah mean absolute deviation dengan menggunakan formula sebagai berikut:

dimana:

sf = mean absolut deviation masing-masing variabel

Jika tetap menggunakan standar deviasi biasa, maka dengan adanya nilai-nilai ekstrim, maka nilai sf umumnya cenderung memburnbung tinggi.

(8)

Kemudian untuk memperoleh data-data dengan ukuran yang distandarisasi, perlu dilakukan penghtungan nilai Z setiap peubah dengan menggunakan rumus:

dimana:

Zg = nilai masing-masing peubah setelah distandarisasi

Dengan menggunakan data yang distandarisasi ini, maka zif = 0 clan mean absolute deviation

-

I . Selanjutnya setelah semua zq dperoleh, maka dibentuk matrik simetris sebagai berikut:

peubah

3.3. Dissimilaritas

Langkah selanjutnya adalah menghitung distances di antara objek-objek untuk mendapatkan tingkat dissimilaritasnya. Ukuran yang paling sering dipakai adalah Euclidean distances, yaitu dihitung dengan menggunakan formula:

dimana:

d(ij1 = jarak gerombol i dan gerombol j

Namun, Euclidean Distances ini mengukur "distances" berbentuk garis lurus dalam ruang Euclidean (Legendre, 1998). Oleh karena itu bisa pula

(9)

diaplikasikan non-euclidean metric seperti city block atau Manhattan distance yang forrnulanya antara lain (Carrnichael dan Sneath 1969 dalam Kaufman dan Rousseeuw 1990):

Kedua formula tersebut (Euclzdean dun Manhattan) memenuhi persyaratan matematik berikut ini:

a. d(i, j) 2 0 b. d(i, i ) = 0

c. d(i, j) = d(j, i)

d. d(i, j) < d(i, h) + d(hj)

Besaran-besasan yang Qperoleh kemudian hbentuk menjadl suatu matrik n x n.

3.4. Perbaikan Jarak

Setelah mendapatkan matrik distances (Qssimilaritas atau simrnilaritas), kemudian dicari 2 objek (sebagai kelompok awal) yang paling mirip dan kemudian digabungkan menjadi sebuah kelompok. Selanjutnya cblakukan penghitungan distances atau dissimilaritas cluster baru ini dengan satu objek yang lainnya sehingga semuanya teruku (Legendre, 1998).

Beberapa ukuran yang digunakan adalah: (Suharjo dan Siswandi, 1999) 1. Pautan Tunggal, di mana dissimilaritas Qukur dengan:

dacl,jl = min [dhydkj) ... (10) 2. Pautan Lengkap, dimma bssimilaritas diukur dengan:

dk(l,J) = max [dh,dkJ) ... (11)

(10)

dk(ijl = [ni/(ni + nj)]d& + [nj/(ni + nJ)]dkj . . . ... . . .. . .

.

. . . .. (12)

4. Sentroid:

dkiij) = [ni/(ni

+

nj)}db + [nj/(ni + nj)]Q

-

(ninj)/(ni

+

nj)2dij}. .

. .

. . .

.

. ( 1 3) dimana:

dv = ukuran dissimilaritas antara gerornbol i dengan gerombol j dk(iJj = ukuran dissimilaritas antara gerombol k dengan gerombol

(id

yang merupakan penggabungan antara gerombol i dengan gerombol j.

ni = jumlah objek pada gerombol i

Gambar

Gambar 1.  Diskriminan Analysis
Gambar 3.  Perbedaan Agglomerative Technique dan Divisive Technique

Referensi

Dokumen terkait

Hasil penelitian ini menyimpulkan bahwa penyelesaian sengketa pemilihan Kepala Desa di desa Lowayu Kecamatan Dukun Kabupaten Gresik menurut Peraturan Daerah Kabupaten

Profit Margin), Ukuran Perusahaan (Firm Size), Leverage (Debt To Equity Ratio), dan Likuiditas (Cash Ratio)berpengaruh dan signifikan terhadap Kebijakan Dividen

Jika negara sumber modal asing tersebut memajaki pendapatan yang diperoleh dari luar negeri dengan tarif- nya sendiri sambil tetap memberikan kredit pajak luar negeri,

Haldjale hobune ei meeldi ja sellepärast tassib toidu tema eest ära] (Luzdori raj, Nošuli kn, Grezdi k – Lidija Mo ž egova, s 1932 (24. Mil- lest udar võib paiste minna, metsas

Berdasarkan karakteristik kadar leukosit serum pada tabel 1 didapatkan nilai rerata kadar leukosit serum kelompok pasien dengan partus

Pada jenis-jenis tekukan yang dibuat dengan memasang batang baja bulat ( round knuckles ), kekuatan structural.. yang memadai bisa diperoleh lewat pemasangan batang-batang

Perusahaan mengalami masa transisi apabila terjadi perubahan baik yang terjadi di lingkungan internal seperti perubahan manajemen, pemilik maupun adanya perubahan pada