155
CORRESPONDENCE ANAYSIS
Oleh: Alia Lestari
Prodi Pendidikan Matematika STAIN Palopo E-mail: entjenk@gmail.com
Abstrak:
Correspondence Analysis digunakan untuk melihat hubungan antara dua atau lebih variabel yang bersifat kategorik. Keterkaitan atau kedekatan suatu kategori pada satu variabel dengan kategori pada variabel lainnya dapat dilihat melalui grafik yang dihasilkan dari penerapan metode ini.
Kata Kunci: Correspondence Analysis, Variabel Kategorik, Segmentasi Pasar,
1. Pendahuluan
Segmentasi merupakan upaya bisnis untuk dapat melakukan strategi pemasaran dengan lebih fokus. Ketersediaan barang atau suatu merk produk sejenis di pasaran menyebabkan konsumen mempunyai kesempatan untuk membandingkan produk yang satu dengan yang lainnya. Misalnya sebuah produsen sabun mandi memiliki target pasar perempuan berjiwa muda yang dengan menonjolkan fungsi sabun sebagai penghalus kulit, sementara produsen sabun merek lain menargetkan konsumennya adalah keluarga yang mengutamakan fungsi sabun dalam melawan kuman-kuman penyakit. Hal ini menyebabkan produsen memerlukan peta persepsi konsumen terhadap produknya untuk mengetahui posisi di tengah persaingan sehingga dapat disusun strategi pemasaran yang tepat. Untuk keperluan pembuatan peta persepsi ini dapat digunakan beberapa analisis mutivariat. Kemiripan antar produk beserta atribut yang menjadi fokus penelitian diterjemahkan dalam pengertian jarak antara dua titik pada bidang atau ruang. Sehingga diperlukan transformasi dari persepsi konsumen ke dalam bentuk vektor dan matriks.
Variabel kategorik juga dapat diperoleh dari variabel numerik yang mengalami penggolongan. Misalnya penghasilan konsumen yang bernilai rupiah dapat dikategorikan menjadi tiga golongan yaitu rendah (kurang dari 1 juta rupiah), sedang (1 – 3 juta rupiah) dan tinggi (lebih dari 3 juta rupiah). Dengan demikian penggunaan analisis korespondensi dapat lebih luas, karena tidak hanya untuk variabel yang sifat dasarnya kategorik, namun juga dapat mencakup variabel yang sifatnya numerik setelah terlebih dahulu dilakukan penggolongan/pengkategorian.
2. Bahan Dan Metode
Misalnya X dan Y adalah peubah kategorik dengan masing-masing peubah mempunyai a dan b kategori. Hasil pengamatan disajikan dalam tabel kontingensi a x b dengan nij ≥ 0 menyatakan frekuensi dari sel ke (i, j). Matriks dari
frekuensi relatif dinyatakan sebagai berikut.
[ ] dengan ∑ ∑
disebut sebagai matriks korespondensi, untuk
Misal vektor jumlahan baris dari matriks adalah
Dan vektor jumlahan kolom dari matriks adalah
Dengan 1 = (1,...,1)’ adalah sebuah vektor satuan, satuan vektor yang semua unsurnya bernilai 1, dan ∑ ∑
Misal
[
]
dan
[
]
[
maka a baris dari matriks Raxb, disebut profil baris-profil baris
(row profiles) dalam ruang berdimensi b. Jumlah dari unsur-unsur profil baris (row profiles) adalah 1.
Misalkan didefinisikan profil baris ke-i sebagai dengan
kolom (column profiles) dalam ruang berdimensi a.
Sebagai catatan jumlah unsur-unsur dari profil kolom-profil kolom (column profiles) adalah sama dengan 1. Jika
Seperti pada kasus profil baris, jumlah unsur-unsur pada masing-masing profil kolom, sesuai harapan adalah 1. Vektor disebut sebagai rataan profil baris atau pusat baris atau vektor dari massa baris. Sedangkan vektor disebut sebagai rataan profil kolom atau pusat kolom atau vektor dari massa baris. Rataan profil baris dan rataan profil kolom ini merupakan rata-rata pembobot atau dengan kata lain rataan profil baris dan rataan profil, kolom merupakan rata-rata pembobot dari profil kolom dan profil baris. Lebih khusus, rataan profil baris adalah ∑ dengan adalah profil baris. Lebih khusus, rataan profil baris adalah ∑ [2].
pendekatan terhadap jarak chi square antar masing-masing profil yang mencerminkan kemiripan antar produk.
Statistik uji chi square dari Pearson untuk menguji kebebasan antara X dan Y adalah[3]:
∑ ∑
Besaran merepresentasikan kuadrat jarak antara profil baris ke-i dan rata-rata profil baris. Jarak ini disebut jarak chi square. Kenyataanya mirip dengan jarak euclid
antara vektor , kecuali jarak eucild diboboti dengan unsur-unsur vektor c, rataan profil baris. Besaran /n merupakan total inertia. Sedangkan ∑ menunjukan total inersia yang dinyatakan sebagai rata-rata terboboti dari kuadrat jarak chi square antara profil baris dengan rata-ratanya. Kuadrat jarak chi square antara dua profil, misalkan adalah ( ) ( )
Hal tersebut, serupa dengan jarak kuadrat euclid
( ) ( ) antara dua vektor kecuali
rataan profil digunakan sebagai pembobot. Jarak chi square sebuah profil kolom dengan rataanya dan antara dua kolom profil mempunyai definisi yang sama.
Langkah selanjutnya adalah menentukan dua atau tiga subruang euclid dan memproyeksikan semua profil baris kedalam subruang euclid tersebut. Untuk mencari subruang euclid digunakan generalized singular value decomposition (GSVD). GSVD dari matriks (M - rc’) adalah
dengan:
A adalah matriks berukuran a x p
B merupakan matriks berukuran b x p di mana berlaku A’
dan B’ A’
Matriks A dan B diperoleh dari penguraian nilai singular
(singular value decomposition) dari . Sebagai catatan adalah akar karakteristik dari
TT’ sama dengan akar karakteristik dari E.
Misalkan akan direpresentasikan profil–profil baris dan profil–profil kolom ke dalam ruang berdimensi k ( dengan k ≤ p ). Biasanya nilai k diambil 2 atau 3. Koordinat dari a profil baris adalah a buah baris dari matriks yang dibentuk dengan mengambil k kolom pertama dari F = . Dan koordinat dari b profil kolom adalah b buah baris dari matriks yang dibentuk dengan mengambil k kolom pertama dari G =
. Karena total inersia adalah
∑ maka pendekatan ruang berdimensi p dengan ruang berdimensi k adalah bagus jika ∑ mendekati total inersia ∑ , atau alternatifnya jika ∑ mendekati 0 . Besaran dan seterusnya bisa diinterpretasikan sebagai besarnya kontribusi yang diberikan kepada total inersia oleh masing–masing dimensi pertama, dimensi kedua dan sebagainya.
Dalam analisis korespondensi, a baris dari matriks yang dibentuk dari dua kolom pertama F dan b baris matriks yang dibentuk dari dua kolom pertama G secara umum ditampilkan dalam satu grafik .Plot semacam ini disebut symmetric plot dari titik-titik yang berhubungan dengan profil-profil baris dan profil-profil-profil-profil kolom. Dalam plot, jarak antar titik berhubungan dengan profil-profil baris atau antar titik berhubungan dengan profil-profil kolom merupakan pendekatan terhadap jarak chi square antar masing-masing profil. Tidak ada interpretasi yang mengindikasikan antara dua titik, satu merupakan profil baris sedangkan yang lainnya merupakan profil kolom. Oleh sebab itu, hanya jarak antar titik yang berhubungan baik dengan dua baris atau dua kolom[3].
3. Contoh Penerapan
Cara yang mereka gunakan adalah melakukan survei terhadap responden yang merupakan penghuni hotel-hotel di Bandung. Teknik bertanya yang dilakukan adalah personifikasi terhadap hotel. Artinya, responden diminta memberikan penilaian bagaimana wujud hotel-hotel tersebut seandainya mereka adalah manusia. Atribut yang diminta
Sedangkan nama hotel-hotel di Bandung yang disurvey adalah :
Data yang terkumpul berasal dari responden sebanyak 1415 orang.
Analysis of Indicator Matrix
Axis Inertia Proportion Cumulative Histogram
12 0.1597 0.0491 0.9629 ********** 13 0.1205 0.0371 1.0000 ******* Total 3.2500
Hasil dari analisis matriks indikator ini terbentuk 13 sumbu dengan total inersia sebesar 3.25, namun pada sumbu kesepuluh nilai kumulatif proporsi inersianya sudah mencapai 0.8588. Sehingga dengan 10 yang diambil, varians data asli yang dapat dijelaskan relatif cukup besar (85.88%), karena asosiasi antara variabel hotel dengan variabel-variabel prediktornya dikelompokkan menjadi sepuluh komponen (faktor), dimana masing-masing komponen tersebut dapat menjelaskan data sebesar proporsi masing-masing sumbu seperti yang terlihat pada tabel diatas.
Analisis data secara deskriptif, dapat dilihat pada Burt Tabel berikut :
Column Contribution
Component 1 Component 2 Component 3
Name Qual Mass Inert Coord Corr Contr Coord Corr Contr Coord Corr Contr
Homann 0,799 0,029 0,068 -0,985 0,126 0,06 0,114 0,002 0,001 -1,345 0,235 0,171
Hyatt 0,895 0,04 0,065 0,749 0,106 0,048 -0,487 0,045 0,029 -0,425 0,034 0,024
Holiday_Inn 0,946 0,034 0,066 0,59 0,055 0,026 -0,452 0,032 0,021 -0,331 0,017 0,012
Preanger 0,849 0,039 0,065 -1,13 0,234 0,106 0,238 0,01 0,007 -0,027 0 0
Panghegar 0,959 0,02 0,071 -0,531 0,024 0,012 0,012 0 0 0,858 0,063 0,048
Santika 0,902 0,028 0,068 -0,438 0,025 0,012 -0,862 0,095 0,065 1,641 0,346 0,252
Sheraton 0,87 0,06 0,058 0,747 0,178 0,073 0,77 0,189 0,11 0,071 0,002 0,001
<30 0,829 0,109 0,043 0,418 0,136 0,041 -0,533 0,221 0,095 0,484 0,182 0,084
30-50 0,676 0,074 0,054 -0,569 0,136 0,052 -0,231 0,022 0,012 -0,927 0,362 0,209
>50 0,97 0,067 0,056 -0,054 0,001 0 1,132 0,465 0,261 0,236 0,02 0,012
PNS 0,774 0,068 0,056 -1,036 0,402 0,158 -0,65 0,159 0,088 0,437 0,072 0,043
Swasta 0,981 0,032 0,067 -0,411 0,025 0,012 0,056 0 0 -0,317 0,015 0,01
Pengusaha 0,789 0,095 0,048 0,807 0,4 0,134 -0,289 0,052 0,024 -0,456 0,128 0,065
Pejabat 0,876 0,055 0,06 0,126 0,004 0,002 1,281 0,46 0,275 0,432 0,052 0,034
Lambat 0,599 0,085 0,051 -0,974 0,488 0,174 0,169 0,015 0,007 -0,011 0 0
Agresif 0,954 0,061 0,058 0,4 0,051 0,021 -0,086 0,002 0,001 -0,327 0,034 0,021
Component 4 Component 5 Component 6 Component 7
Name Coord Corr Contr Coord Corr Contr Coord Corr Contr Coord Corr Contr Homann 0,642 0,054 0,04 -0,77 0,077 0,065 1,276 0,212 0,186 -0,126 0,002 0,002 Hyatt -0,412 0,032 0,023 1,367 0,353 0,284 0,751 0,107 0,089 -0,833 0,131 0,112
Holiday_Inn -0,467 0,034 0,025 -1,524 0,367 0,303 -1,23 0,239 0,205 -0,299 0,014 0,012 Preanger -0,094 0,002 0,001 0,997 0,182 0,147 -1,462 0,392 0,329 -0,028 0 0 Panghegar -1,473 0,187 0,145 -0,288 0,007 0,006 1,266 0,138 0,126 2,038 0,357 0,334
Santika 0,229 0,007 0,005 -0,454 0,027 0,022 0,31 0,012 0,011 -0,893 0,102 0,092 Sheraton 0,664 0,14 0,09 -0,002 0 0 -0,033 0 0 0,548 0,096 0,074 <30 -0,013 0 0 0,051 0,002 0,001 0,057 0,003 0,001 0,165 0,021 0,012
30-50 0,379 0,061 0,036 -0,222 0,021 0,014 -0,064 0,002 0,001 0,178 0,013 0,01 >50 -0,4 0,058 0,036 0,164 0,01 0,007 -0,022 0 0 -0,468 0,08 0,059 PNS 0,405 0,061 0,038 0,099 0,004 0,003 -0,149 0,008 0,006 0,277 0,029 0,021
Swasta -1,683 0,413 0,305 -0,669 0,065 0,054 0,285 0,012 0,01 -0,949 0,131 0,117
Pengusaha 0,123 0,009 0,005 0,307 0,058 0,034 -0,039 0,001 0,001 0,122 0,009 0,006
Pejabat 0,26 0,019 0,013 -0,269 0,02 0,015 0,088 0,002 0,002 -0,006 0 0 Lambat 0,037 0,001 0 0,234 0,028 0,018 0,15 0,012 0,008 -0,108 0,006 0,004 Cekatan 0,477 0,163 0,08 -0,249 0,044 0,025 0,059 0,003 0,001 -0,296 0,063 0,037
Agresif -0,873 0,244 0,156 0,101 0,003 0,002 -0,312 0,031 0,023 0,661 0,14 0,108
Component 8 Component 9 Component 10
Name Coord Corr Contr Coord Corr Contr Coord Corr Contr Homann 0,461 0,028 0,026 0,668 0,058 0,06 -0,192 0,005 0,006
Hyatt -0,351 0,023 0,021 0,551 0,057 0,056 0,17 0,005 0,006 Holiday_Inn -0,673 0,071 0,066 0,817 0,105 0,106 -0,255 0,01 0,012 Preanger -0,231 0,01 0,009 -0,193 0,007 0,007 0,264 0,013 0,014
Panghegar -1,337 0,154 0,151 -0,271 0,006 0,007 -0,511 0,022 0,027 Santika 1,39 0,248 0,235 -0,314 0,013 0,013 -0,468 0,028 0,032
Sheraton 0,323 0,033 0,027 -0,781 0,195 0,171 0,343 0,037 0,037 <30 -0,02 0 0 0,258 0,052 0,034 0,522 0,212 0,155
30-50 0,051 0,001 0,001 -0,36 0,054 0,044 0,093 0,004 0,003
>50 -0,023 0 0 -0,024 0 0 -0,961 0,335 0,32
Swasta 0,031 0 0 -1,194 0,208 0,211 0,876 0,112 0,127
Pengusaha 0,01 0 0 -0,161 0,016 0,011 -0,435 0,116 0,094
Pejabat 0,065 0,001 0,001 0,861 0,208 0,189 0,621 0,108 0,11 Lambat -0,177 0,016 0,011 0,158 0,013 0,01 0,197 0,02 0,017
Cekatan -0,513 0,189 0,118 -0,317 0,072 0,049 -0,097 0,007 0,005 Agresif 1,133 0,411 0,332 0,325 0,034 0,03 -0,109 0,004 0,004
Pada analisis column contribution ini terlihat bahwa pada komponen atau faktor pertama, variabel yang memberikan kontribusi yang besar adalah Lambat, PNS, Pengusaha dan Preanger. Dapat disimpulkan bahwa Lambat, PNS, Pengusaha adalah karakteristik yang dapat menggambarkan Hotel Preanger. Pada komponen atau faktor kedua, variabel yang memberikan kontribusi terbesar adalah Sheraton, usia > 50 tahun dan Pejabat. Jadi, Hotel Sheraton cenderung mirip dengan pejabat yang berusia >50 tahun. Komponen ketiga menggambarkan bahwa Hotel Homann mirip dengan Hotel Santika yang mirip dengan manusia berusia 30-50 tahun. Pada komponen keempat, Hotel Panghegar digambarkan mirip dengan manusia yang bersifat agresif dan bekerja di swasta. Komponen kelima dibangun oleh variabel Hyatt, Holiday Inn dan Preanger. Berarti Hotel Hyatt, cenderung mempunyai karakteristik yang mirip dengan Hotel Holiday Inn dan Hotel Preanger. Komponen keenam menggambarkan bahwa Hotel Homann mirip dengan Hotel Hotel Holiday Inn, Hotel Preanger dan Hotel Panghegar. Pada komponen ketujuh menggambarkan bahwa Hotel Hyatt cenderung mempunyai karakteristik yang sama dengan Hotel Panghegar yang mirip dengan manusia yang mempunyai sifat agresif dan bekerja di swasta. Komponen kedelapan hanya memperlihatkan bahwa Hotel santika mempunyai karakteristik yang mirip dengan manusia yang agresif. Pada komponen kesembilan variabel yang memberikan kontribusi terbesar adalah Sheraton, Swasta, Pejabat. Jadi dapat disimpulkan bahwa Hotel Sheraton cenderung mirip dengan manusia yang bekerja sebagai karyawan swasta atau pejabat. Sedangkan pada komponen kesepuluh variabel yang memberikan kontribusi terbesar adalah usia <30, usia >50 dan swasta.
Gambar 1.
Pada plot ini terlihat bahwa Hotel Homann cenderung mirip dengan Hotel Preanger dan Hotel Panghegar yang diidentifikasikan oleh responden sebagai personal yang lambat, berusia 30-50 tahun, dan bekerja sebagai PNS atau karyawan swasta. Hal ini sesuai dengan analisis pada column contribution dimana variabel yang memberikan kontribusi terbesar pada komponen 1 adalah Hotel Preanger, PNS, Pengusaha dan Lambat.
Gambar 2.
Pada plot di atas juga terlihat bahwa Hotel Homann cenderung mirip dengan Hotel Preanger yang diidentifikasikan oleh responden sebagai personal yang lambat, berusia 30-50 tahun dan bekerja sebagai PNS atau karyawan swasta.
Gambar 3.
Dari analisis column contribution, dan beberapa plot diatas, dapat disimpulkan bahwa Hotel Homann dipersonifikasikan oleh responden mirip dengan Preanger dan Panghegar, yang ternyata merupakan hotel-hotel bernuansa tradisional di Bandung. Ketiganya diidentifikasi oleh responden sebagai personal yang cenderung lambat, dan bekerja sebagai PNS atau karyawan swasta, serta berusia 30-50 tahun. Personifikasi ini kira-kira menggambarkan segmen pengguna layanan ketiga hotel tersebut.
Hasil analisis ini tentunya dapat memberikan masukan buat manajemen Hotel Homann untuk memperbaiki kinerja mereka yang menurut responden cenderung lambat.
4. Kesimpulan
Pembuatan peta persepsi konsumen terhadap sebuah produk sangat diperlukan oleh produsen karena dapat menghemat biaya perusahaan yang mereka lakukan di berbagai bentuk karena memiliki target yang jelas. Misalnya saja, produsen sabun yang segmennya adalah wanita yang menggunakan sabun untuk tujuan kehalusan kulit, tidak perlu memasang iklan di televisi pada acara siaran langsung tinju.
Daftar Pustaka
Lebart L., Moreneu A., and Warwick M., Multivariate Descriptive Statistics Analysis Correpondence Analysis and Related Techniques for Large Matrices, John Wiley & Sons Inc., 1984
Michael J.G., Theory and Aplications of Correspondence Analysis. Academic Press Inc., 1984
Pauls G., Multidimensional Scaling, Concepts and Aplications. 1989