UKURAN KESESUAIAN ANALISIS KORESPONDENSI MELALUI
ANALISIS PROCRUSTES
SARI RAHAYU
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRAK
SARI RAHAYU. Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis Procrustes. Dibimbing oleh SISWADI dan TONI BAKHTIAR.
Analisis korespondensi merupakan bagian analisis peubah ganda yang mempelajari hubungan dua atau lebih variabel dengan memeragakan baris dan kolom secara serempak dari tabel kontingensi dalam ruang berdimensi rendah dengan menggunakan jarak khi-kuadrat. Dari analisis korespondensi diperoleh matriks koordinat profil baris dan kolom. Studi ini bertujuan menghitung ukuran kesesuaian analisis korespondensi melalui analisis Procrustes dan mengaplikasikan analisis korespondensi pada dua contoh data yaitu hubungan antara kelompok pegawai dengan kebiasaan merokok dan hubungan antara provinsi dengan lapangan pekerjaan utama. Ukuran kesesuaian melalui analisis Procrustes ditentukan dari nilai perbedaan minimum ketiga transformasi geometri yaitu translasi, rotasi, dan dilasi. Ukuran kesesuaian dalam analisis korespondensi melalui analisis Procrustes untuk matriks koordinat profil baris dan kolom perlu dilakukan ketiga transformasi. Hasil analisis untuk hubungan kategori perokok dengan kelompok pegawai menghasilkan ukuran kesesuaian masing-masing untuk profil baris dan kolom sebesar 98.64% dan 99.53%. Sedangkan hasil analisis Procrustes untuk hubungan provinsi dengan lapangan pekerjaan utama menghasilkan ukuran kesesuaian masing-masing untuk profil baris dan kolom masing-masing sebesar 91.83% dan 88.25%.
ABSTRACT
SARI RAHAYU. Goodness-of-fit of Correspondence Analysis via Procrustes Analysis. Under supervision of SISWADI and TONI BAKHTIAR.
Correspondence analysis is a part of multivariate analysis studying the relationship of two or more variables which are displayed in rows and columns simultaneously from contingency table in low dimensional space using the Chi-square distance. From correspondence analysis, it is obtained row and column profiles co-ordinate matrix. This study aims to calculate the goodness-of-fit of correspondence analysis via Procrustes analysis and applied to two examples of data, i.e. the relationships between categories of smokers and groups of employees and the relationship between the province and the main jobs. To obtain the Procrustes analysis, we need to determine minimum difference through three geometric transformations, i.e. translation, rotation, and dilation. In correspondence analysis, we need to do three transformations on Procrustes analysis to obtain goodness-of-fit in row and column profiles co-ordinate matrix. The result of Procrustes analysis for relationship between employee groups and smoking habits to row and column profiles is 98.64% and 99.53% respectively. While the result of Procrustes analysis for relationship between province and the main jobs to row and column profiles is 91.83% and 88.25% respectively.
UKURAN KESESUAIAN ANALISIS KORESPONDENSI MELALUI
ANALISIS PROCRUSTES
SARI RAHAYU
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains pada
Departemen Matematika
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul Skripsi
: Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis
Procrustes
Nama
: Sari Rahayu
NIM
: G54070055
Menyetujui,
Pembimbing I,
Prof Dr Ir Siswadi, MSc
NIP 19490609 197412 1 001
Pembimbing II,
Dr Toni Bakhtiar, MSc
NIP 19720627 199702 1 002
Mengetahui,
Ketua Departemen Matematika,
Dr Toni Bakhtiar, MSc
NIP 19720627 199702 1 002
Judul Skripsi
Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis
Procrustes
Nama
Sari Rahayu
NIM
G54070055
Menyetujui,
Pembimbing
I,
Pembimbing
II,
Prof
Dr
If
Siswadi, MSc
Dr Toni Bakhtiar, MSc
NIP 19490609 197412 1 001
NIP 19720627 199702 1 002
Mengetahui,
Ketua Departemen Matematika,
Bakhtiar, MSc
627 199702 1 002
a .
0
2 JAN 2014
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala limpahan rahmat dan karuniaNya, sehingga karya ilmiah berjudul Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis Procrustes ini dapat penulis selesaikan. Shalawat dan salam tak lupa penulis curahkan kepada Nabi Besar Muhammad SAW beserta seluruh keluarga, sahabat, dan para pengikutnya sampai akhir zaman.
Ucapan terima kasih penulis haturkan kepada Prof Dr Ir Siswadi, MSc selaku dosen pembimbing I dan Dr Toni Bakhtiar, MSc selaku dosen pembimbing II atas semua ilmu, kesabaran, serta motivasi yang telah diberikan selama penulisan karya ilmiah ini. Ucapan terima kasih juga penulis haturkan kepada Ir Ngakan Komang Kutha Ardana, MSc selaku dosen penguji yang telah banyak memberi saran. Penulis juga ingin mengucapkan terima kasih kepada seluruh dosen di Departemen Matematika atas semua ilmu yang diberikan, serta staf dan pegawai di Departemen Matematika atas semua bantuan dan pelayanannya selama ini.
Karya ilmiah ini penulis persembahkan untuk Bapak, Ibu, Adik tersayang dan Dzulkarnain. Penulis mengucapkan terima kasih atas doa, kesabaran, dukungan, motivasi, dan kasih sayang yang tiada henti kepada penulis. Tak lupa penulis mengucapkan terima kasih kepada teman-teman Matematika 44, adik-adik Matematika Angkatan 45 dan 46, serta seluruh pihak yang telah membantu penulis dalam penulisan karya ilmiah ini.
Semoga karya ilmiah ini bermanfaat.
Bogor, Desember 2013
RIWAYAT HIDUP
DAFTAR ISI
Halaman
DAFTAR TABEL ... viii
DAFTAR GAMBAR ... viii
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan ... 1
LANDASAN TEORI ... 1
Dekomposisi Nilai Singular ... 1
Analisis Korespondensi ... 3
Ukuran Kesesuaian Analisis Korespondensi ... 5
Analisis Procrustes ... 5
Translasi ... 5
Rotasi ... 6
Dilasi... 6
PEMBAHASAN ... 8
Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis Procrustes ... 8
Ukuran Kesesuaian Matriks Koordinat Profil Baris ... 8
Ukuran Kesesuaian Matriks Koordinat Profil Kolom ... 9
Contoh Aplikasi Analisis Korespondensi ... 9
SIMPULAN ... 13
DAFTAR TABEL
Halaman 1 Bentuk umum tabel kontingensi... ... 3
2 Bentuk umum matriks korespondensi ... 3
3 Data kategori perokok dengan kategori pekerjaan dari beberapa perusahaan ... 9
4 Data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu
menurut provinsi dan lapangan pekerjaan utama pada 2011 ... 11
DAFTAR GAMBAR
Halaman 1 Plot analisis korespondensi data hasil pengamatan kategori perokok dengan kelompok
pegawai dari beberapa perusahaan ... 10
2 Plot analisis korespondensi data penduduk berumur 15 tahun ke atas yang bekerja
(1)
PENDAHULUAN
Latar Belakang
Analisis korespondensi diartikan sebagai sebuah teknik analisis eksplorasi data untuk memperlihatkan dengan grafik dari tabel kontingensi dan data kategori peubah ganda. Berdasarkan kegunaannya, analisis korespondensi dan analisis komponen utama memiliki kesamaan yaitu mereduksi dimensi data menjadi yang lebih sederhana sedangkan perbedaannya terletak pada data yang digunakan. Analisis komponen utama digunakan untuk data dengan skala pengukuran kontinu sedangkan analisis korespondensi digunakan untuk data kategori (Abdi dan Williams 2010).
Tujuan dari analisis korespondensi ialah untuk mengubah data tabel menjadi dua kelompok nilai faktor yaitu satu untuk baris dan satu untuk kolom. Nilai faktor memberikan representasi terbaik dari struktur kesamaan baris dan kolom dari tabel
.
Analisiskorespondensi memproyeksikan baris-baris dan kolom-kolom dari matriks data sebagai titik-titik ke dalam sebuah grafik berdimensi rendah, biasanya dua. Baris dan kolom dalam grafik ini diperlihatkan sebagai titik-titik di mana koordinatnya merupakan nilai faktor dan dimensinya disebut faktor. Nilai faktor baris dan kolom memiliki nilai eigen yang sama dan karena itu, kedua baris dan kolom dapat dengan mudah diwakili dalam satu peta tunggal (Abdi dan Williams 2010).
Ukuran kesesuaian digunakan untuk mengukur seberapa baik analisis korespondensi menggambarkan data asli berdimensi tinggi melalui data pendekatan berdimensi rendah. Metode lain untuk mendapatkan ukuran kesesuaian ialah dengan analisis Procrustes. Analisis Procrustes adalah salah satu metode yang menyatakan perbedaan dua atau lebih konfigurasi �-titik sebagai suatu nilai numerik (Krzanowski 1990). Nilai numerik yang dihasilkan metode ini dapat digunakan untuk memperkirakan ukuran kesesuaian antar-konfigurasi (Sibson 1978).
Dalam analisis Procrustes, nilai perbedaan minimum dari dua atau lebih konfigurasi dihitung dengan menggunakan tiga transformasi geometris yaitu translasi, rotasi, dan dilasi. Ketiga transformasi tersebut dapat digunakan untuk menentukan ukuran kesesuaian yang optimal.
Tujuan
Tujuan dari karya ilmiah ini ialah:
1. Menghitung ukuran kesesuaian analisis korespondensi melalui analisis Procrustes. 2. Mengaplikasikan analisis korespondensi
pada dua contoh data, yaitu hubungan antara kategori perokok dengan kelompok pegawai serta hubungan antara provinsi dengan lapangan pekerjaan utama.
LANDASAN TEORI
Dekomposisi Nilai Singular
Definisi 1 (Nilai Eigen dan Vektor Eigen) Misalkan adalah suatu matriks ��. Skalar disebut sebagai nilai eigen atau nilai karakteristik dari jika terdapat suatu vektor taknol , sehingga = . Vektor disebut vektor eigen atau vektor karakteristik matriks
yang bersesuaian dengan (Leon 2001).
Definisi 2 (Nilai Singular)
Misalkan adalah suatu matriks �× . Nilai-nilai singular dari adalah akar dari nilai eigen yang positif dari matriks T atau
T(Leon 2001).
Definisi 3 (Dekomposisi Nilai Singular) Setiap matriks yang berdimensi �× dapat dinyatakan sebagai bentuk Dekomposisi Nilai Singular (DNS) sebagai berikut:
� = � T
(Jolliffe 2002), di mana dan masing-masing dengan kolom ortonormal,
merupakan pangkat matriks dengan
min �, . T = T =� , dengan � merupakan matriks identitas berpangkat .
= diag 1, 2,…, dengan 1
2 > 0 dan , = 1,2,…
merupakan nilai singular dari matriks . Matriks adalah matriks yang kolom-kolomnya terdiri atas vektor eigen yang berpadanan dengan nilai eigen taknol i dari
matriks T . Matriks adalah matriks yang
kolom-kolomnya merupakan vektor eigen yang berpadanan dengan nilai eigen taknol dari matriks Tdalam bentuk
2
(2) (3) = 1 1 , 2 2 ,…, .Untuk membuktikan persamaan (1), diperlukan fakta sebagai berikut:
1. T = ↔ = , untuk sembarang ∈ ℝ .
2. T dan T berpangkat r dan merupakan matriks semidefinit positif dengan r nilai eigen positif yang sama.
3. Nilai eigen matriks T dapat diurutkan
menjadi 1 2 > +1= =
= 0 dengan vektor-vektor eigen yang bersesuaian adalah 1, 2,…, ,
+1,…, . Nilai eigen matriks T
dapat diurutkan menjadi 1 2
> +1= = �= 0 dengan vektor-vektor eigen yang bersesuaian adalah �1= 1
1, �2= 2
λ2,…, � = λ ,� +1,
…,�� . Matriks = �1,�2,…,� dan
= 1, 2,…, merupakan matriks dengan kolom-kolom yang ortonormal. 4. Karena 1, 2,…, merupakan
matriks ortogonal, maka =1 T=�. 5. =1 i iT = =1 i iT , untuk
sembarang ∈ ℝ . Bukti:
Misalkan = 1 λ1,
2
λ2,…, λ , = 1, 2,…, ,
= iag λ1, λ2,…, λ .
Diperoleh � T = 1 1 , 2 2 ,…,
1 0
0 2 0 0 0 ⋱ 1T 2T T
= 1, 2,…,
1 T 2 T T = T =1
= =1 T = T+
=1
= =1 T+ = +1 T = T
=1
= � = .
Dekomposisi nilai singular tidak bersifat tunggal. Jika vektor-vektor kolom matriks dan ingin dilengkapi sehingga dan menjadi matriks-matriks ortogonal yang masing-masing memiliki dimensi �� dan
× , maka DNS dapat dituliskan ke dalam bentuk DNS Bentuk Lengkap (DNSBL).
Definisi 4 (Dekomposisi Nilai Singular Bentuk Lengkap)
Setiap matriks berdimensi �× dapat dinyatakan sebagai bentuk Dekomposisi Nilai Singular Bentuk Lengkap (DNSBL) sebagai berikut:
� = � � T
di mana T =��, T =� , dan
= diag 1, 2,…, −
�− �− −
.
Definisi 5 (Dekomposisi Nilai Singular Terampat)
Jika diberikan matriks definit positif �(�×�) dan �( × ) dan X merupakan matriks data berdimensi �× maka Dekomposisi Nilai Singular Terampat (DNS Terampat) dari matriks X dapat dinyatakan sebagai
= T
dengan T� = T� =� dan merupakan matriks diagonal nilai singular dengan 1 2 > 0. Matriks dan
dapat dicari dengan DNS dari matriks �1/2 �1/2 yaitu
�1/2 �1/2= T
�1/2 T �1/2= T
di mana T = T =� sehingga diperoleh
=�−1/2 , = , dan =�−1/2W.
Definisi 6 (Jarak Euclid)
Jarak Euclid antara dan dari matriks � = 1, 2,…, n T didefinisikan sebagai
, = i− j T
i− j
(Jolliffe 2002).
Definisi 7 (Jarak Mahalanobis)
Jarak Mahalanobis antara dan dari matriks � = 1, 2,…, � T didefinisikan
sebagai
� , = − T −1 − , dengan S adalah matriks koragam yang diperoleh dari . Diasumsikan berpangkat sehingga −1 ada (Jolliffe 2002).
Definisi 8 (Teras)
Misalkan adalah suatu matriks ��. Teras dari matriks atau ditulis tr
merupakan jumlah elemen-elemen diagonal utama dari :
tr = �=1y
3
Definisi 9 (Jarak khi-kuadrat)
Jarak khi-kuadrat didefinisikan sebagai
�2= � −
2
=1
�
=1
dengan
� = nilai frekuensi pengamatan pada baris ke-i dan kolom ke-j (� =� ), = nilai frekuensi harapan di mana
=�.�.
�..
�. = jumlah frekuensi pada baris ke-i,
�. = jumlah frekuensi pada kolom ke-j,
�= banyaknya baris, = banyaknya kolom (Daniel 1990).
Analisis Korespondensi
Analisis korespondensi ditemukan dan dikembangkan pertama kali tahun 1960-an di Perancis (Benzecri 1969). Analisis korespondensi merupakan bagian analisis peubah ganda yang memelajari hubungan antara dua atau lebih variabel dengan memeragakan baris dan kolom secara serempak dari tabel kontingensi dalam ruang berdimensi rendah dengan menggunakan jarak khi-kuadrat. Analisis korespondensi digunakan untuk mereduksi dimensi variabel dan menggambarkan profil vektor baris dan profil vektor kolom suatu matriks data dari tabel kontingensi (Greenacre 1984).
Tujuan yang ingin dicapai dalam analisis korespondensi antara lain mengetahui hubungan antara satu kategori variabel baris dengan satu kategori kolom serta menyajikan setiap kategori variabel baris dan kolom dari tabel kontingensi sehingga dapat ditampilkan secara bersama-sama pada satu ruang vektor berdimensi kecil secara optimal.
Andaikan N merupakan matriks data yang unsur-unsurnya bilangan tak negatif berukuran �× , di mana n menunjukkan banyaknya baris dan p menunjukkan banyaknya kolom. Tabel kontingensi dari N adalah tabel yang mencatat data hasil pengamatan dengan melibatkan dua variabel, variabel I dan variabel II. Variabel I sebagai variabel baris terdiri dari i kategori dan variabel II sebagai variabel kolom terdiri dari j kategori. Sel yang dibentuk baris ke-i dan kolom ke-j memunyai frekuensi pengamatan � yang ditunjukkan seperti pada Tabel 1.
Tabel 1 Bentuk umum tabel kontingensi Variabel
1
Variabel 2
Total 1 2 ... p
1 �11 �12 ... �1 �1.
2 �21 �22 ... �2 �2.
... ... ... ... ... ... n ��1 ��2 ... �� ��.
Total �.1 �.2 ... �. �..
(Greenacre 1984) dengan
�.= =1�
�. = �=1�
�..= �=1 =1�
di mana i = 1, 2, ..., n dan j = 1, 2, ..., p.
Matriks Korespondensi
Matriks korespondensi P didefinisikan sebagai matriks yang unsur-unsurnya adalah unsur matriks N yang telah dibagi dengan jumlah total unsur matriks N.
= 1 �...
dengan �..= T . Dari Tabel 1 diperoleh
matriks korespondensi seperti pada Tabel 2 berikut.
Tabel 2 Bentuk umum matriks korespondensi Variabel
1
Variabel 2
Total 1 2 ... p
1 11 12 ... 1 1.
2 21 22 ... 2 2.
... ... ... ... ... ...
n n1 n2 ... � �.
Total .1 .2 ... . 1
(Greenacre 1984)
Vektor jumlah baris matriks P ialah �= = 1., 2.,…, �. T
= (1, 2,…, �)T.
Vektor jumlah kolom matriks P ialah �= T = .1, .2,…, .
= 1, 2,…, .
Matriks diagonal dari elemen-elemen vektor jumlah baris r adalah yang berukuran �×� dan adalah matriks diagonal dengan ukuran × dari elemen-elemen vektor jumlah kolom c dengan
= diag � =
1. 0 …
0 2. …
⋱
0 0
0 0 … �.
4
= diag � =
.1 0 …
0 .2 …
⋱
0 0
0 0 … .
.
Matriks Profil Baris dan Kolom
Matriks profil baris dan profil kolom dari P diperoleh dengan cara membagi vektor baris dan vektor kolom dengan masing-masing massanya. Matriks profil baris (R) dan profil kolom (C) dinyatakan dengan:
= −1 =
11 1. 12 1. ⋱ �1 �. �2 �. 1 1. � �.
= � 1
T
� �T
dan
= −1 T =
11 .1 21 .1 ⋱ 1 . 2 . �1 .1 � . =
� 1T
� T
.
Pemilihan Jarak
Untuk menghitung jarak profil baris atau kolom dalam kategori yang sama digunakan jarak khi-kuadrat yang didefinisikan:
jarak antara profil baris � dan profil baris � adalah
d2 �,� = � − � T −1 � − �
jarak antara profil kolom � dan profil kolom �adalah
d2 �,� = � − � T −1 � − �
Jika jarak khi-kuadrat antara dua baris atau kolom adalah nol, maka kedua baris atau kolom tersebut memiliki sebaran frekuensi sama. Semakin besar jarak antarkedua baris atau kolom, semakin besar pula perbedaan sebaran frekuensi relatif kedua baris atau kolom tersebut.
Dekomposisi Inersia
Keseluruhan perbedaan tiap ruang dari setiap himpunan baris/kolom diukur dari total inersianya. Total inersia adalah jumlah kuadrat jarak terbobot dari titik-titik (baris/kolom) terhadap sentroidnya. Total inersia untuk titik baris ialah
in = �=1 � − � T c−1 � − � .
Total inersia untuk titik kolom ialah
in = =1 � − � T −1 � − � .
Total inersia untuk titik baris dan titik kolom secara bersamaan adalah
Inersia total = −
2
=χ
2 �...
Dekomposisi Nilai Singular Terampat Untuk mereduksi dimensi data berdasarkan keragaman data (nilai eigen/ inersia) terbesar dengan mempertahankan informasi yang optimum diperlukan dekomposisi nilai singular. Dekomposisi nilai singular terampat dari matriks adalah
− ��T= T
di mana dan diperoleh dari penguraian nilai singular matriks −1/2 − ��T −1/2 dan berlaku
T −1 = T −1 =�;
1 2 > 0
dengan merupakan matriks diagonal yang berukuran × dari nilai singular dari − ��T, dan masing-masing merupakan
sumbu utama dari baris dan kolom.
Dengan demikian, matriks koordinat profil baris dan matriks koordinat profil kolom dinyatakan sebagai
= −1
dan
= −1 .
Penggambaran dalam ruang berdimensi rendah, misalnya s, maka koordinat yang digunakan untuk menggambarkan profil-profil tersebut adalah s unsur pertamanya. Hubungan antarkategori ditelusuri melalui formula transisi, yaitu
= −1
dan
= −1.
Jumlah kuadrat terbobot dari titik-titik koordinat sekitar sumbu utama ke-s di setiap himpunan sama dengan 2, yang dinotasikan
oleh dan disebut inersia utama ke-s. Inersia utama baris dan kolom adalah
T
r = 2≡
T
c = 2≡
(Greenacre 1984).
Kontribusi mutlak memberikan informasi mengenai proporsi inersia yang dapat diterangkan oleh masing-masing kategori terhadap pembentukan sumbu utama. Rumus untuk menghitung kontribusi mutlak (KM) untuk baris dan kolom yaitu sebagai berikut:
KM = ×
2 2 dan
KM = ×
2
2 dengan :
KM = kontribusi mutlak kategori baris ke-i terhadap pembentukan sumbu ke-s
5
(35) (37) (38) (36) (34) terhadap pembentukan sumbu ke-s2
= koordinat baris ke-i pada sumbu ke-s
2 = koordinat kolom ke-j pada sumbu ke-s
= nilai singular ke-s.
Kontribusi relatif atau koordinat kosinus digunakan untuk melihat proporsi inersia dari setiap kategori yang diterangkan oleh sumbu utama yang terbentuk. Rumus untuk menghitung masing-masing kontribusi relatif untuk baris dan kolom adalah
KR = 2 2 dan KR = 2 2
di mana KR dan KR adalah kontribusi relatif kategori ke-i dan kategori ke-j yang dijelaskan oleh sumbu ke-s.
Kontribusi relatif yang tinggi pada suatu titik untuk sumbu utama ke-s, menunjukkan bahwa sumbu utama ke-s menjelaskan inersia titik tersebut dengan baik. Secara umum tingginya kontribusi titik terhadap inersia sumbu utama berimplikasi pada tingginya kontribusi relatif sumbu utama tersebut.
Ukuran Kesesuaian Analisis Korespondensi Besaran �12,…,�2 dapat
diinterpretasikan sebagai besarnya kontribusi yang diberikan pada total inersia oleh dimensi pertama, kedua, dan seterusnya, sehingga besaran relatif untuk mengukur besarnya kehilangan informasi dapat dirumuskan sebagai berikut :
GFAK , = �
2 =1
�2 =1
× 100%
dengan � merupakan nilai singular dari matriks X dan << dengan berdimensi rendah.
Analisis Procrustes
Misalkan adalah matriks berukuran �× dan berukuran �× yang masing-masing merupakan representasi konfigurasi yang akan dibandingkan. Koordinat titik ke- pada ruang Euclid diberikan oleh nilai-nilai pada baris ke- matriks. Konfigurasi pertama berada pada ruang berdimensi dan titik ke- memiliki koordinat 1, 2,…, ,
sedang-kan konfigurasi kedua berada pada ruang berdimensi dan titik ke- memiliki koordinat
1, 2,…, . Jika > maka konfigurasi
kedua berada dalam subruang dari ruang berdimensi . Perbedaan dimensi ruang ini dapat diselesaikan dengan memasangkan − kolom nol di kolom mana saja termasuk
memasangkan − di kolom terakhir dari sehingga menjadi matriks berukuran �×
(Siswadi et al. 2012). Dengan demikian, tanpa mengurangi keumuman dapat diasumsikan bahwa = .
Untuk menentukan nilai perbedaan dari konfigurasi dan , analisis Procrustes menggunakan jumlah kuadrat jarak antartitik yang bersesuaian, yaitu
, = �=1 =1 − 2 = tr − T − .
Nilai perbedaan minimum dihitung dengan menggunakan tiga transformasi geometris yaitu translasi, rotasi, dan dilasi yang diberikan oleh Bakhtiar dan Siswadi (2011). 1. Translasi
Definisi 10 (Sentroid)
Misalkan = , maka sentroid kolom dari matriks dinotasikan sebagai
= ( ∙1, ∙2,…, ∙ ), di mana
∙ =1� �=1 , = 1,2,… .
Dalam analisis Procrustes, translasi diartikan sebagai proses pemindahan seluruh titik dengan jarak yang tetap dan arah yang sama. Penguraian persamaan (34) menghasilkan:
,
= �=1 −=1 ∙ − − ∙ 2−
2 �=1 =1 − ∙ − − ∙
∙ − ∙ +� =1 ∙ − ∙ 2.
Penguraian persamaan (36) menghasilkan
, = �, � +��XY
di mana � = − � X, �= − � Y,
�XY = =1 ∙ − ∙ 2.
� dan � merupakan konfigurasi dan setelah ditranslasi. X dan Y
masing-masing adalah sentroid kolom dari dan , � merupakan vektor kolom berukuran �× 1 yang semua unsurnya bernilai 1, sedangkan �XY merupakan jarak
kuadrat dari kedua sentroid kolom dan . Penyesuaian optimal dengan translasi dapat dilakukan dengan menghimpitkan sentroid kolom dan sehingga �XY = 0.
6
(39) (40) (44) (43) (41) (42) 2. RotasiRotasi merupakan proses pemindahan seluruh konfigurasi titik dengan sudut yang tetap tanpa mengubah jarak setiap titik terhadap sentroidnya. Rotasi terhadap dilakukan dengan mengalikan matriks dengan matriks ortogonal ,
yaitu , = , dengan T =
T =�.
Nilai perbedaan minimum dari konfigurasi dan setelah dilakukan penyesuaian dengan rotasi adalah
, = inf , .
Berdasarkan persamaan (35), nilai perbedaan pada penyesuaian dengan rotasi dapat dituliskan sebagai
,
= tr − T −
= tr T− T T −
= tr T − T − T T + T T
= tr T − T − T T+ T T
= tr T )−tr T −tr T T+ tr( T T
= tr T )−tr T −tr T +
tr( T T
= tr T )−2 tr T + tr( T = tr T + tr T −2 tr T .
Nilai tr T yang semakin besar akan meminimumkan , . Jadi, harus dipilih matriks ortogonal yang memaksimumkan tr T .
Teorema
Jika , dan matriks ortogonal dengan ∈ ℝ�× , ∈ ℝ�× , dan ∈ ℝ × maka nilai tr T akan
maksimum bila dipilih =��T dengan
���T merupakan hasil Dekomposisi
Nilai Singular Bentuk Lengkap (DNSBL) dari matriks T .
Bukti:
Misalkan ���T merupakan hasil
DNSBL dari matriks T , sehingga T = � � �T . �= (σ ) adalah
matriks diagonal dengan σ ∈ ℝ, � dan � masing-masing merupakan matriks ortogonal, sehingga
tr T = tr T
= tr ���T
= tr �T �� .
Karena merupakan matriks ortogonal, akibatnya �T � juga
ortogonal. Misalkan �T �= = , maka berlaku −1 1, sehingga
tr T = tr �
= �=1 (σ )
tr � .
Jadi, tr � akan maksimum jika �=�T ��=�. Kondisi ini dapat
terpenuhi jika =��T (Bakhtiar 1995).
Berdasarkan teorema tersebut, penyesuaian optimal dengan rotasi dapat dilakukan dengan memilih matriks ortogonal =��T. Nilai perbedaan
minimum setelah penyesuaian optimal dengan rotasi dapat dituliskan menjadi
, = tr T ) + tr( T −2 tr � .
3. Dilasi
Dilasi merupakan proses penskalaan data melalui pembesaran/pengecilan jarak setiap titik dalam konfigurasi terhadap sentroidnya. Dilasi terhadap dilakukan dengan cara mengalikan konfigurasi dengan suatu skalar , yaitu , =
, . Nilai perbedaan minimum dari dua konfigurasi dan setelah dilakukan penyesuaian dengan dilasi adalah
, = inf , .
Berdasarkan persamaan (35), nilai perbedaan pada penyesuaian dengan dilasi dapat dituliskan sebagai
,
= tr − T −
= tr T− T −
= tr T − T − T + 2 T
= tr T − T − T T+ 2 T = tr T − tr T − tr T T+ 2tr T
= tr T − tr T − tr T + 2tr T
= tr T −2 tr T + 2 tr T .
Persamaan (43) merupakan bentuk fungsi kuadrat dengan variabel sehingga untuk meminimumkan nilai , , turunan pertamanya harus sama dengan nol dan turunan keduanya lebih besar dari nol.
=−2 tr T + 2 tr T
0 =−2 tr T + 2 tr T
2 tr � = 2 tr �
= tr
T
7
(45)
=−2 tr T + 2 tr T
2
2 = 2 tr
T > 0.
Dari (a) dan (b), diketahui bahwa nilai , minimum pada saat
memiliki nilai seperti pada persamaan (44). Dengan menyubstitusikan nilai , nilai perbedaan minimum setelah penyesuaian optimal dengan dilasi menjadi:
,
= tr T −2c tr T + 2tr T
= tr T −2tr T
tr T tr
T +
tr
T
tr T 2
tr T
= tr T −2 tr
2 T
tr T +
tr2 T
tr T
= tr T −tr
2 T
tr T .
Dengan menggunakan aljabar sederhana, secara analitik telah dibuktikan bahwa dalam analisis Procrustes, urutan pengerjaan yang menghasilkan jarak paling minimum adalah translasi-rotasi-dilasi. Bukti dapat dilihat di Bakhtiar dan Siswadi (2011).
Secara umum, ukuran kesesuaian analisis korespondensi dan analisis Procrustes diberikan sebagai berikut:
1. Analisis korespondensi
GFAK , =
�2 =1
�2 =1
× 100%,
dengan � merupakan nilai singular dari matriks X.
2. Analisis Procrustes
GFP , = 1− � , tr T ,
dengan � , merupakan nilai perbedaan minimum translasi, rotasi dan dilasi dari matriks X terhadap matriks Y.
(46)
8 (48) (49) (50) (51) (52)
PEMBAHASAN
Ukuran Kesesuaian Analisis Korespondensi melalui Analisis Procrustes
Ukuran kesesuaian analisis korespondensi untuk tampilan gambar (representasi) tanpa memperhitungkan massa akan dicari masing-masing menggunakan matriks koordinat profil baris dan kolom sebagai matriks data yang didefinisikan dengan F dan G dengan matriks pendekatannya masing-masing yaitu M dan N melalui analisis Procrustes dengan menentukan nilai perbedaan minimum yang dilakukan menggunakan tiga transformasi geometri, yaitu translasi, rotasi dan dilasi.
Ukuran kesesuaian analisis korespondensi untuk setiap matriks menggunakan analisis Procrustes melalui transformasi geometri translasi, rotasi dan dilasi diberikan pada pembahasan berikut.
Ukuran Kesesuaian Matriks Koordinat Profil Baris
Penyesuaian dengan Translasi
Nilai perbedaan minimum diperoleh ketika jarak kedua sentroid dari kedua matriks sama dengan nol � = 0 . Nilai perbedaan minimum melalui proses translasi adalah , = �, � +�� .
Pada matriks data F diperoleh ≠ T dan ≠ T sehingga � ≠0. Dengan
demikian transformasi translasi perlu dilakukan. Ilustrasi bahwa ≠ T dan
≠ T diberikan pada Lampiran 3.
Penyesuaian dengan Rotasi
Misalkan F� merupakan matriks F yang telah ditranslasi dan M� merupakan matriks M yang telah ditranslasi sebagai matriks pendekatannya. Setelah penyesuaian dengan translasi, dilakukan rotasi dengan mengalikan matriks M�dengan matriks ortogonal . Nilai perbedaan pada penyesuaian dengan rotasi sesuai dengan persamaan (40) menjadi
F�, M�
= tr F�TF� + tr M�TM� − tr F�TM� .
Nilai F�, M� tersebut akan minimum dengan memaksimumkan tr F�TM�
dengan =��T yang diperoleh dari DNSBL F�TM� =���T. Jika =� maka
F�, M� = F�, M� . Karena ≠ � sehingga perlu dicari matriks ortogonal Q untuk memperoleh F�, M� . Oleh karena
itu, transformasi rotasi perlu dilakukan. Ilustrasi bahwa ≠ � diberikan pada Lampiran 4.
Penyesuaian dengan Dilasi
Transformasi dilasi dilakukan setelah transformasi translasi dan rotasi dilakukan. Dilasi F� terhadap M� dilakukan dengan mengalikan konfigurasi M� dengan suatu skalar . Nilai perbedaan setelah penyesuaian dengan dilasi dapat ditulis sebagai:
F�, M�
= tr F�TF� + 2tr M�TM� −2 tr F�TM� .
Persamaan (50) merupakan bentuk dari fungsi kuadrat dengan variabel
,
sehingga nilai yang meminimumkan nilaiF�, M� yaitu
= tr F�
TM
� tr M�TM� .
Dengan menyubstitusikan nilai ke persamaan (50), diperoleh nilai perbedaan minimum:
� ,
= tr
F
�TF
�−
tr2 F
�TM� tr M�TM�
.
Ukuran kesesuaian berdasarkan nilai perbedaan minimum diperoleh dengan perhitungan berikut:
GFP F,M = 1− � ,
2
= 1−
tr F�TF� − tr
2 F
�TM� tr M�TM� tr F�TF�
= 1− 1− tr
2 F
�TM� tr F�TF� tr M�TM�
=
tr2 F �TM�
tr F�TF� tr M�TM�
.
(53)
(54)
(56)
(57) Ukuran Kesesuaian Matriks Koordinat
Profil Kolom
Penyesuaian dengan Translasi
Nilai perbedaan minimum diperoleh ketika jarak kedua sentroid dari kedua matriks sama dengan nol � = 0 . Nilai perbedaan minimum melalui proses translasi adalah , = �, � +�� .
Pada matriks data G diperoleh ≠ T dan ≠ T sehingga � ≠0. Dengan demikian transformasi translasi perlu dilakukan. Ilustrasi bahwa ≠ T dan
≠ T diberikan pada Lampiran 5.
Penyesuaian dengan Rotasi
Misalkan G� merupakan matriks G yang telah ditranslasi dan N� merupakan matriks yang telah ditranslasi sebagai matriks pendekatannya. Setelah penyesuaian dengan translasi, dilakukan rotasi dengan mengalikan matriks N�dengan matriks ortogonal . Nilai perbedaan pada penyesuaian dengan rotasi sesuai dengan persamaan (40) menjadi
G�, N�
= tr G�TG� + tr N�TN�
−2 tr G�TN� .
Nilai G�, N� tersebut akan minimum dengan memaksimumkan tr G�TN�
dengan =��T yang diperoleh dari DNSBL G�TN�=���T. Jika =� maka
G�, N� = G�, N� . Karena ≠ � se-hingga perlu dicari matriks ortogonal Q untuk memperoleh G�, N� . Oleh karena itu, transformasi rotasi perlu dilakukan. Ilustrasi bahwa ≠ � diberikan pada Lampiran 6.
Penyesuaian dengan Dilasi
Transformasi dilasi dilakukan setelah transformasi translasi dan rotasi dilakukan. Dilasi G� terhadap N� dilakukan dengan mengalikan konfigurasi N� dengan suatu skalar . Nilai perbedaan setelah penyesuaian dengan dilasi dapat ditulis sebagai:
G�, N�
= tr G�TG� + 2tr N
�TN� − 2 tr G�TN� .
N
ilai yang meminimumkann
ilaiG�,c N� ialah
= tr G�
T
N� tr N�TN� .
Dengan menyubstitusikan nilai ke persamaan (55), diperoleh nilai perbedaan minimum:
� , = tr G�TG� − tr 2G
�TN� tr N�TN� .
Ukuran kesesuaian berdasarkan nilai perbedaan minimum diperoleh dengan perhitungan berikut:
GFP ,
= 1− � ,
2
= 1−
tr G�TG� − tr
2 G
�TN� tr N�TN� tr G�TG�
= 1− 1− tr
2 G
�TN� tr G�TG� tr N�TN�
= tr
2 G
�TN� tr G�TG� tr N�TN� .
Dengan demikian, untuk mendapatkan ukuran kesesuaian analisis korespondensi diperlukan ketiga tahapan dalam analisis Procrustes yaitu translasi, rotasi dan dilasi.
Contoh Aplikasi Analisis Korespondensi Data yang digunakan untuk contoh pertama aplikasi analisis korespondensi adalah data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan yang bersumber pada Greenacre (1984). Kategori perokok dari hasil pengamatan dibedakan menjadi empat kategori, yaitu kategori tidak merokok, perokok ringan yang merokok 1 s.d 10 batang perhari, perokok sedang yang merokok 11 s.d 20 batang perhari dan perokok berat yang merokok lebih dari 20 batang perhari. Untuk kelompok pegawai, dibedakan menjadi lima yaitu manager senior, manager yunior, pegawai senior, pegawai yunior dan sekretaris. Banyaknya sampel yang diamati adalah 193 orang (Tabel 3).
Tabel 3 Banyaknya perokok dengan kelompok pegawai dari beberapa perusahaan
Kelompok Pegawai
Kategori Perokok
TIDAK RINGAN SEDANG BERAT Manager
Senior (1) 4 2 3 2
Manager
Yunior (2) 4 3 7 4
Pegawai
Senior (3) 25 10 12 4
Pegawai
Yunior (4) 18 24 33 13
Sekretaris
(5) 10 6 7 2
(55)
Gambar 1 Plot analisis korespondensi data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan
Berdasarkan plot analisis korespondensi (Gambar 1) terlihat bahwa masing-masing kelompok pegawai memiliki letak yang relatif berjauhan, hal ini memberikan keterangan bahwa masing-masing kelompok tidak memiliki kemiripan dalam mengkonsumsi jumlah rokok.
Perhitungan analisis korespondensi menghasilkan total inersia sebesar 0.08519. Dua dimensi pertama mampu menerangkan 99.5% dari total inersia (Lampiran 1). Kontribusi baris yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh pegawai senior sebesar 51.2%. Sementara untuk sumbu utama kedua diberikan oleh manager yunior sebesar 55.1% (Lampiran 1). Kontribusi kolom yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh kategori tidak pernah merokok sebesar 65.4% dan untuk sumbu utama kedua diberikan oleh kategori perokok berat sebesar 50.6% (Lampiran 1).
Nilai kontribusi relatif baris kelompok manager yunior, pegawai senior, pegawai yunior, dan staf sekretaris lebih besar diterangkan oleh sumbu utama pertama, sementara kelompok manager senior lebih besar diterangkan oleh sumbu utama kedua. Kontribusi relatif kolom untuk kategori tidak merokok, perokok sedang dan perokok berat lebih besar diterangkan oleh sumbu utama pertama dan perokok ringan oleh sumbu utama kedua.
Ukuran kesesuaian untuk data kategori perokok dengan kelompok pekerjaan dari beberapa perusahaan yang dihitung melalui analisis Procrustes masing-masing untuk
profil baris dan kolom sebesar 98.64% dan 99.53% (Lampiran 1).
Contoh data kedua aplikasi analisis korespondensi adalah data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama yang diolah dari Hasil Survei Angkatan Kerja Nasional (Sakernas) Agustus 2011 yang dilakukan oleh Badan Pusat Statistik.
Kategori lapangan pekerjaan utama yaitu (A) pertanian-kehutanan-perburuan-perikanan, (B) pertambangan-penggalian, (C) industri pengolahan, (D) listrik-gas-air, (E) bangunan, (F) perdagangan besar-eceran-rumah makan-hotel, (G) angkutan-pergudangan-komunikasi, (H) keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan, dan (I) bangunan-tanah-jasa kemasyarakatan-sosial-perorangan. Untuk kelompok provinsi dibedakan menjadi (1) Aceh, (2) Sumatera Utara, (3) Sumatera Barat, (4) Riau, (5) Kepulauan Riau, (6) Jambi, (7) Sumatera Selatan, (8) Kepulauan Bangka Belitung, (9) Bengkulu, (10) Lampung, (11) DKI Jakarta, (12) Jawa Barat, (13) Banten, (14) Jawa Tengah, (15) DI Yogyakarta, (16) Jawa Timur, (17) Bali, (18) Nusa Tenggara Barat, (19) Nusa Tenggara Timur, (20) Kalimantan Barat, (21) Kalimantan Tengah, (22) Kalimantan Selatan, (23) Kalimantan Timur, (24) Sulawesi Utara, (25) Gorontalo, (26) Sulawesi Tengah, (27) Sulawesi Selatan, (28) Sulawesi Barat, (29) Sulawesi Tenggara, (30) Maluku, (31) Maluku Utara, (32) Papua dan (33) Papua Barat. Banyaknya sampel yang diamati adalah 109.670.399 orang (Tabel 5).
Tabel 5 Penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama pada 2011
No Provinsi Lapangan Pekerjaan Utama Total
A B C D E F G H I
1 Aceh 898225 11739 72509 3966 113934 299183 69173 25040 358704 1852473 2 Sumatera Utara 2595244 30288 483988 11390 332780 1208842 246883 118250 884449 5912114 3 Sumatera Barat 813699 29824 153130 9124 127991 441786 106972 40489 347710 2070725 4 Riau 1086037 37659 145753 10151 124939 490910 95364 56332 377035 2424180 5 Kepulauan Riau 97757 15952 195368 4551 59755 193860 48580 26728 139273 781824 6 Jambi 770848 21517 48786 4525 63098 231221 57533 22822 214648 1434998 7 Sumatera Selatan 2029448 42225 168171 5949 124580 558401 129687 61203 433440 3553104 8 Kep. Bangka Belitung 152884 148549 32186 1435 26817 111897 13214 11209 91443 589634 9 Bengkulu 456467 9480 25323 2828 43567 161061 26210 14795 133988 873719 10 Lampung 1715268 27239 358572 3636 162881 605747 129625 40446 438887 3482301 11 DKI Jakarta 30404 15284 690816 15894 163033 1642120 393284 440825 1196758 4588418 12 Jawa Barat 3675713 131781 3571915 35078 1194823 4554503 1096994 494960 2699014 17454781 13 Banten 630122 62908 1140427 18050 231911 1118385 295786 201536 830535 4529660 14 Jawa Tengah 5376452 79440 3046724 29152 1097380 3402091 563144 264681 2057071 15916135 15 DI Yogyakarta 431070 12464 266768 4247 133128 480136 68200 50063 352519 1798595 16 Jawa Timur 7520067 132588 2665473 24399 1158525 3908294 709844 362314 2458836 18940340 17 Bali 556615 12635 290132 6859 185705 596527 81744 83281 391376 2204874 18 Nusa Tenggara Barat 872088 49587 169577 2508 89284 370239 85578 29560 293819 1962240 19 Nusa Tenggara Timur 1360265 23627 124697 2420 59405 147439 87407 20810 270189 2096259 20 Kalimantan Barat 1294481 78646 89493 4409 97395 277324 51545 21002 232277 2146572 21 Kalimantan Tengah 605378 60463 31277 3712 52107 157741 29409 14373 151241 1105701 22 Kalimantan Selatan 756416 74277 117126 4317 94961 390121 77729 35752 274230 1824929 23 Kalimantan Timur 454258 162640 84554 7063 85327 364266 76774 48236 307885 1591003 24 Sulawesi Utara 321121 24806 65984 4653 82431 196182 73065 22856 199622 990720 25 Gorontalo 159123 15020 44015 175 28642 65851 34590 6401 91393 445210 26 Sulawesi Tengah 654739 26254 65750 1812 57492 190410 44314 15792 204436 1260999 27 Sulawesi Selatan 1469245 29038 223246 7831 178717 654516 181214 55828 575863 3375498 28 Sulawesi Barat 315762 5629 30973 1236 20758 72203 14685 4508 70294 536048 29 Sulawesi Tenggara 467200 38159 51782 1901 54277 169917 56418 11538 175356 1026548 30 Maluku 321494 5947 45338 2425 23356 92986 36882 7928 113756 650112 31 Maluku Utara 241341 7605 10763 809 18221 55287 27740 2929 73175 437870 32 Papua 1036520 33174 19885 2910 36358 130766 52225 16483 147906 1476227 33 Papua Barat 163164 8932 11580 221 16233 56325 17010 4392 58731 336588 Total 39328915 1465376 14542081 239636 6339811 23396537 5078822 2633362 16645859 109670399
12
Hasil plot analisis korespondensi dapat dilihat pada gambar 2.
Gambar 2 Plot analisis korespondensi data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama
Berdasarkan plot analisis korespondensi (Gambar 2) diketahui bahwa penduduk di provinsi 32, 19 dan 20 memiliki posisi yang relatif berdekatan, hal ini memberikan keterangan bahwa penduduk di provinsi tersebut memiliki kemiripan dalam menentukan lapangan pekerjaan utama yaitu di bidang pertanian-kehutanan-perburuan-perikanan. Penduduk di provinsi 5, 11 dan 13 memiliki karakteristik yang sama dalam menentukan lapangan pekerjaan utama yaitu di bidang keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan, hal ini terlihat dari posisi yang relatif berdekatan. Penduduk di provinsi 8 dan 23 memiliki karakteristik yang berbeda dengan penduduk di provinsi lainnya dalam menentukan bidang pekerjaan utama yaitu di bidang pertambangan-penggalian, hal ini terlihat dari posisi provinsi yang terletak berjauhan dengan provinsi lainnya.
Perhitungan analisis korespondensi menghasilkan inersia sebesar 0.16876. Dua dimensi pertama mampu menerangkan 85.80% dari total inersia (Lampiran 2). Kontribusi baris yang besar dalam pembentukan sumbu utama pertama diberikan oleh provinsi 11 sebesar 22.6 % dan untuk sumbu utama kedua diberikan oleh provinsi 8 sebesar 53.7 % (Lampiran 2). Kontribusi kolom yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh lapangan pekerjaan utama di bidang
pertanian-kehutanan-perburuan-perikanan (A) sebesar 55.1 % dan untuk sumbu utama kedua diberikan oleh lapangan pekerjaan utama di bidang pertambangan-penggalian (B) sebesar 86 % (Lampiran 2).
Dari hasil perhitungan, nilai kontribusi relatif baris untuk provinsi 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 17, 18, 19, 20, 21, 26, 27, 28, 29, 30, 31, 32 dan 33 lebih besar diterangkan oleh sumbu utama pertama, sementara provinsi 8, 14, 16, 22, 23, 24 dan 25 lebih besar diterangkan oleh sumbu utama kedua. Pada hasil perhitungan kontribusi relatif kolom, kategori lapangan pekerjaan utama di bidang pertanian-kehutanan-perburuan-perikanan (A), industri pengolahan (C), bangunan (E), perdagangan besar-eceran-rumah makan-hotel (F), angkutan-pergudangan-komunikasi (G), keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan (H) dan bangunan-tanah-jasa kemasyarakatan-sosial-perorangan (I) lebih besar diterangkan oleh sumbu utama pertama dan lapangan pekerjaan utama di bidang pertambangan-penggalian (B) dan listrik-gas-air (D) oleh sumbu utama kedua.
13
SIMPULAN
Dalam analisis korespondensi, untuk mendapatkan ukuran kesesuaian bagi pendekatan matriks data F dan G untuk profil baris dan kolom dengan menggunakan analisis Procrustes, ketiga transformasi yaitu translasi, rotasi dan dilasi perlu dilakukan. Ukuran kesesuaian analisis korespondensi melalui analisis Procrustes diterapkan pada dua contoh data. Pertama yaitu data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan yang bersumber
DAFTAR PUSTAKA
Abdi, H. 2007. Singular Value Decomposition(SVD) and Generalized Singular Value Decomposition (GSVD). In N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage. Abdi H, Williams LJ. 2010. Correspondence
Analysis. In Neil Salkind (Ed.): Encyclopedia of Research Design. Thousand Oaks (CA): Sage.
[BPS] Badan Pusat Statistik. 2012. Statistik Indonesia 2012. Jakarta: BPS. Bakhtiar T. 1995. Tinjauan terhadap Urutan
Pengerjaan Transformasi Geometris pada Analisis Procrustes untuk Mencari Norma Kuadrat Perbedaan Minimum [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Bakhtiar T, Siswadi. 2011. Orthogonal Procrustes Analysis: Its Transformation Arrangement and Minimal Distance. International Journal of Applied. Mathematics and Statistics 20:16 24. Benzécri JP. (1969). Statistical analysis as a
tool to make patterns emerge from data. In Watanabe(Ed.): Methodologies of Pattern Recognition. New York: Academic Press. Daniel WW. 1990. Applied Nonparametric
Statistics. 2nd Ed. Boston: PWS-KENT.
Greenacre MJ. 1984. Theory and Applications of Correspondence Analysis. London: Academic Press.
Greenacre MJ. 2007. Correspondence Analysis in Practice. 2nd Ed. London: Chapman and Hall.
Jolliffe IT. 2002. Principal Component Analysis. 2nd Ed. Berlin: Springer-Verlag. Krzanowski WJ. 1990. Principles of
Multivariate Analysis, A User’s
Perspective. New York: Oxford University Press.
Leon SJ. 2001. Aljabar Linear dan Aplikasinya. Ed ke-5. Bondan A, penerjemah; Hardani HW, editor. Jakarta: Erlangga. Terjemahan dari: Linear Algebra with Applications. 5th Ed.
Sibson R. 1978. Studies in the Robustness of Multidimensional Scaling: Procrustes Statistics. J. Roy. Statist. Soc. B 40(2): 234–238.
Siswadi, Bakhtiar T, Maharsi R. 2012. Procrustes Analysis and the Goodness-of-fit of Biplots: Some Thoughts and Findings. Applied Mathematical Sciences 6(72): 3579 – 3590.
Siswadi, Suharjo B. 1999. Analisis Eksplorasi Data Peubah Ganda. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Lampiran 1 Hasil analisis korespondensi untuk datahasil pengamatan kategori perokok dengan kategori pekerjaan
Matriks Korespondensi
0.0207 0.0104 0.0155 0.0104 0.0207 0.0155 0.0363 0.0207 = 0.1295 0.0518 0.0622 0.0207
0.0933 0.1244 0.1710 0.0674 0.0518 0.0311 0.0363 0.0104
Profil Baris
1 2 3 4
Tidak Ringan Sedang Berat Margin 1 0.364 0.182 0.273 0.182 1.000 2 0.222 0.167 0.389 0.222 1.000 3 0.490 0.196 0.235 0.078 1.000 4 0.205 0.273 0.375 0.148 1.000 5 0.400 0.240 0.280 0.080 1.000 --- --- --- --- Margin 0 .316 0.233 0.321 0.130
Profil Kolom
1 2 3 4 5 Margin Tidak 0.066 0.066 0.410 0.295 0.164 1.000 Ringan 0.044 0.067 0.222 0.533 0.133 1.000 Sedang 0.048 0.113 0.194 0.532 0.113 1.000 Berat 0.080 0.160 0.160 0.520 0.080 1.000
--- --- --- --- --- Margin 0.057 0.093 0.264 0.456 0.130
Dimensi Singular Value Inertia Proportion Cumulative Proportion Explained 1 0.27342 0.07476 0.878 0.878 2 0.10009 0.01002 0.118 0.995 3 0.02034 0.00041 0.005 1.000 --- --- --- Total 0.08519 1.000 1.000
Koordinat Faktor baris
Row Koor 1 Koor 2 Koor 3 Koor 4 1 -0.0658 -0.1937 0.0710 -0.0000 2 0.2590 -0.2433 -0.0337 -0.0000 3 -0.3806 -0.0107 -0.0052 -0.0000 4 0.2330 0.0577 0.0033 -0.0000 5 -0.2011 0.0789 -0.0081 -0.0000
Koordinat Faktor kolom
Column Koor 1 Koor 2 Koor 3 Koor 4 1 Tidak -0.3933 -0.0305 -0.0009 0.0000 2 Rendah 0.0995 0.1411 0.0220 0.0000 3 Sedang 0.1963 0.0074 -0.0257 0.0000 4 Berat 0.2938 -0.1978 0.0262 0.0000
Kontribusi relatif baris
Marginal Dim Total Row Profile 1 2
2 0.093 0.526 0.465 0.991 3 0.264 0.999 0.001 1.000 4 0.456 0.942 0.058 1.000 5 0.130 0.865 0.133 0.999
Kontribusi relatif kolom
Marginal Dim Total Column Profile 1 2
1 Tidak 0.316 0.994 0.006 1.000 2 Rendah 0.233 0.327 0.657 0.984 3 Sedang 0.321 0.982 0.001 0.983 4 Berat 0.130 0.684 0.310 0.995
Kontribusi total baris Marginal Dim Row Profile 1 2 1 0.057 0.003 0.214 2 0.093 0.084 0.551 3 0.264 0.512 0.003 4 0.456 0.331 0.152 5 0.130 0.070 0.081 --- --- 1.000 1.000
Kontribusi total kolom Marginal Dim Column Profile 1 2 1 Tidak 0.316 0.654 0.029 2 Rendah 0.233 0.031 0.463 3 Sedang 0.321 0.166 0.002 4 Berat 0.130 0.150 0.506 --- --- 1.000 1.000
Ukuran kesesuaian analisis korespondensi melalui analisis Procrustes untuk data kategori perokok dengan kategori pekerjaan dari beberapa perusahaan disajikan dalam tabel berikut.
Hubungan Peubah Ukuran kesesuaian analisis korespondensi
Ukuran kesesuaian analisis Procrustes Matriks data F dan matriks
pendekatannya (M) 98.64% 98.64%
Matriks data G dan matriks
pendekatannya (N) 99.53% 99.53%
Lampiran 2 Hasil analisis korespondensi untuk data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama.
Matriks Korespondensi
Profil Baris
1 2 3 4 5 6 7 8 9
31 0.551 0.017 0.025 0.002 0.042 0.126 0.063 0.007 0.167 1.000 32 0.702 0.022 0.013 0.002 0.025 0.089 0.035 0.011 0.100 1.000 33 0.485 0.027 0.034 0.001 0.048 0.167 0.051 0.013 0.174 1.000
--- --- --- --- --- --- --- --- --- Margin 0.359 0.013 0.133 0.002 0.058 0.213 0.046 0.024 0.152
Profil Kolom
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 0.023 0.066 0.021 0.028 0.002 0.020 0.052 0.004 0.012 0.044 0.001 0.093 0.016 0.137 0.011 0.191 0.014 B 0.008 0.021 0.020 0.026 0.011 0.015 0.029 0.101 0.006 0.019 0.010 0.090 0.043 0.054 0.009 0.090 0.009 C 0.005 0.033 0.011 0.010 0.013 0.003 0.012 0.002 0.002 0.025 0.048 0.246 0.078 0.210 0.018 0.183 0.020 D 0.017 0.048 0.038 0.042 0.019 0.019 0.025 0.006 0.012 0.015 0.066 0.146 0.075 0.122 0.018 0.102 0.029 E 0.018 0.052 0.020 0.020 0.009 0.010 0.020 0.004 0.007 0.026 0.026 0.188 0.037 0.173 0.021 0.183 0.029 F 0.013 0.052 0.019 0.021 0.008 0.010 0.024 0.005 0.007 0.026 0.070 0.195 0.048 0.145 0.021 0.167 0.025 G 0.014 0.049 0.021 0.019 0.010 0.011 0.026 0.003 0.005 0.026 0.077 0.216 0.058 0.111 0.013 0.140 0.016 H 0.010 0.045 0.015 0.021 0.010 0.009 0.023 0.004 0.006 0.015 0.167 0.188 0.077 0.101 0.019 0.138 0.032 I 0.022 0.053 0.021 0.023 0.008 0.013 0.026 0.005 0.008 0.026 0.072 0.162 0.050 0.124 0.021 0.148 0.024 --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- Margin 0.017 0.054 0.019 0.022 0.007 0.013 0.032 0.005 0.008 0.032 0.042 0.159 0.041 0.145 0.016 0.173 0.020
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 Margin A 0.022 0.035 0.033 0.015 0.019 0.012 0.008 0.004 0.017 0.037 0.008 0.012 0.008 0.006 0.026 0.004 1.000 B 0.034 0.016 0.054 0.041 0.051 0.111 0.017 0.010 0.018 0.020 0.004 0.026 0.004 0.005 0.023 0.006 1.000 C 0.012 0.009 0.006 0.002 0.008 0.006 0.005 0.003 0.005 0.015 0.002 0.004 0.003 0.001 0.001 0.001 1.000 D 0.010 0.010 0.018 0.015 0.018 0.029 0.019 0.001 0.008 0.033 0.005 0.008 0.010 0.003 0.012 0.001 1.000 E 0.014 0.009 0.015 0.008 0.015 0.013 0.013 0.005 0.009 0.028 0.003 0.009 0.004 0.003 0.006 0.003 1.000 F 0.016 0.006 0.012 0.007 0.017 0.016 0.008 0.003 0.008 0.028 0.003 0.007 0.004 0.002 0.006 0.002 1.000 G 0.017 0.017 0.010 0.006 0.015 0.015 0.014 0.007 0.009 0.036 0.003 0.011 0.007 0.005 0.010 0.003 1.000 H 0.011 0.008 0.008 0.005 0.014 0.018 0.009 0.002 0.006 0.021 0.002 0.004 0.003 0.001 0.006 0.002 1.000 I 0.018 0.016 0.014 0.009 0.016 0.018 0.012 0.005 0.012 0.035 0.004 0.011 0.007 0.004 0.009 0.004 1.000
Dimension Singular Value Inertia Proportion Explained Proportion Cumulative 1 0.32434 0.10519 0.623 0.623
2 0.19892 0.03957 0.234 0.858 3 0.13294 0.01767 0.105 0.963 4 0.05461 0.00298 0.018 0.980 5 0.04509 0.00203 0.012 0.992 6 0.02883 0.00083 0.005 0.997 7 0.01646 0.00027 0.002 0.999 8 0.01426 0.00020 0.001 1.000 --- --- --- Total 0.16876 1.000 1.000
Koordinat Faktor Baris
20 - 0.5648 - 0.1110 - 0.0317 -0.0373 0.0499 0.0005 - 0.0257 0.0120 0.0000 21 - 0.5080 - 0.3002 - 0.0087 -0.0053 0.0270 0.0254 - 0.0253 - 0.0035 0.0000 22 - 0.2023 - 0.2359 0.0348 0.0419 0.0220 - 0.0375 0.0061 - 0.0141 0.0000 23 - 0.0863 - 0.8123 - 0.0199 0.0493 -0.0063 0.0042 - 0.0067 - 0.0148 0.0000 24 - 0.0214 - 0.1635 0.1393 0.1150 -0.1657 0.0057 - 0.0703 0.0426 0.0000 25 - 0.0859 - 0.1917 0.0343 -0.0070 -0.2312 0.0221 0.0300 0.0756 0.0000 26 - 0.3800 - 0.0354 0.0756 -0.0034 -0.0272 0.0411 0.0328 0.0017 0.0000 27 - 0.1874 0.0255 0.1328 0.0390 -0.0631 - 0.0148 0.0135 - 0.0108 0.0000 28 - 0.4828 0.0924 0.0411 -0.0433 0.0112 0.0298 0.0091 - 0.0246 0.0000 29 - 0.2965 - 0.1980 0.0597 0.0235 -0.0977 - 0.0121 0.0167 0.0111 0.0000 30 - 0.3003 0.0472 0.1174 -0.0599 -0.1215 0.0236 0.0097 - 0.0417 0.0000 31 - 0.4561 - 0.0137 0.1443 -0.0263 -0.1500 - 0.0253 0.0120 0.0079 0.0000 32 - 0.7320 0.0223 0.0649 -0.1362 0.0156 - 0.0283 - 0.0337 0.0103 0.0000 33 - 0.3389 - 0.1133 0.1243 0.0271 - 0.0729 - 0.0081 0.0433 0.0176
Koordinat Faktor Kolom
Column Koor 1 Koor 2 Koor 3 Koor 4 Koor 5 Koor 6 Koor 7 Koor 8 Koor 9 1 Pertanian - 0.4019 0.0725 - 0.0053 -0.0159 0.0077 -0.0012 - 0.0009 0.0003 0.0000 2 Pertambangan - 0.4197 - 1.5961 - 0.3597 - 0.0305 0.0095 -0.0062 - 0.0003 0.0034 0.0000 3 Industri 0.4075 0.1169 - 0.2400 - 0.0580 -0.0028 0.0128 0.0023 -0.0015 0.0000 4 Listrik_ 0.1389 - 0.1789 0.1485 0.0217 -0.0852 0.1254 - 0.2513 -0.2011 0.0000 5 Bangunan 0.0945 0.0445 - 0.1147 0.1473 -0.0206 0.0155 - 0.0283 0.0309 0.0000 6 Perdagangan 0.2266 - 0.0248 0.0423 0.0450 0.0417 -0.0274 0.0065 -0.0099 0.0000 7 Transportasi 0.2259 - 0.0420 0.1250 - 0.0605 -0.1361 -0.0803 - 0.0139 0.0087 0.0000 8 Keuangan 0.5325 - 0.1559 0.3832 - 0.1511 0.1329 0.0274 - 0.0365 0.0374 0.0000 9 Jasa_Kemasyarakatan 0.1209 - 0.0749 0.1372 0.0136 -0.0456 0.0431 0.0153 -0.0031 0.0000
Kontribusi relatif baris
Marginal Profile Dim Total Row 1 2
3 0.019 0.365 0.035 0.400 4 0.022 0.714 0.012 0.727 5 0.007 0.845 0.033 0.878
6 0.013 0.902 0.000 0.902
Kontribusi relatif kolom
Marginal Profile Dim Total
Column 1 2
1 Pertanian 0.359 0.966 0.031 0.998 2 Pertambangan 0.013 0.062 0.893 0.954 3 Industri 0.133 0.689 0.057 0.746 4 Listrik_ 0.002 0.096 0.160 0.256 5 Bangunan 0.058 0.185 0.041 0.227 6 Perdagangan 0.213 0.879 0.011 0.890 7 Transportasi 0.046 0.524 0.018 0.542 8 Keuangan 0.024 0.569 0.049 0.617 9 Jasa_Kemasyarakatan 0.152 0.337 0.129 0.466
Kontribusi total baris
Marginal Profile Dim Row 1 2 1 0.017 0.015 0.001 2 0.054 0.015 0.007 3 0.019 0.002 0.001 4 0.022 0.010 0.000 5 0.007 0.017 0.002
6 0.013 0.020 0.000
18 0.018 0.008 0.003 19 0.019 0.064 0.006 20 0.020 0.059 0.006 21 0.010 0.025 0.023 22 0.017 0.006 0.023 23 0.015 0.001 0.242 24 0.009 0.000 0.006 25 0.004 0.000 0.004 26 0.011 0.016 0.000 27 0.031 0.010 0.001 28 0.005 0.011 0.001 29 0.009 0.008 0.009 30 0.006 0.005 0.000 31 0.004 0.008 0.000 32 0.013 0.069 0.000 33 0.003 0.003 0.001 --- ---
1.000 1.000
Kontribusi total kolom
Marginal Profile Dim
Column 1 2
1 Pertanian 0.359 0.551 0.048
2 Pertambangan 0.013 0.022 0.860
3 Industri 0.133 0.209 0.046
4 Listrik_ 0.002 0.000 0.002
5 Bangunan 0.058 0.005 0.003
6 Perdagangan 0.213 0.104 0.003 7 Transportasi 0.046 0.022 0.002
8 Keuangan 0.024 0.065 0.015
9 Jasa_Kemasyarakatan 0.152 0.021 0.022
--- ---
Ukuran kesesuaian analisis korespondensi melalui analisis Procrustes untuk penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama disajikan dalam tabel berikut.
Hubungan Peubah Ukuran kesesuaian analisis
korespondensi
Ukuran kesesuaian analisis Procrustes
Matriks data F dan matriks pendekatannya (M) 91.83% 91.83%
Matriks data G dan matriks pendekatannya (N) 88.25% 88.25%
Lampiran 3 Ilustrasi ≠ T dan ≠ T sehingga ≠ T pada data kategori perokok dengan kategori pekerjaan dari beberapa perusahaan
Misalkan diberikan matriks dan yaitu
−0.0658 −0.1937 0.0710 −0.0000 0.2590 −0.2433 −0.0337 −0.0000 = −0.3806 −0.0107 −0.0052 −0.0000 0.2330 0.0577 0.0033 −0.0000
−0.2011 0.0789 −0.0081 −0.0000
−0.0369 −0.1359 0.0129 −0.0000 0.2919 −0.1777 0.0021 −0.0000 = −0.3486 0.0533 0.0107 0.0000 0.2632 0.1184 −0.0212 0.0000 −0.1696 0.1419 −0.0044 0.0000
Sentroid dari matriks ialah
= −0.0311 −0.0622 0.0055 −0.0000 ≠ T.
Sentroid dari matriks ialah
= −0.1665 × 10−16 −0.2220 × 10−16 −0.0173 × 10−16 0.0000 ≠ T.
Lampiran 4 Ilustrasi bahwa ≠ � pada transformasi rotasi.
Pada transformasi translasi diperoleh matriks � dan � di mana � = −15 T dan
�= −
1 5
T .
Matriks � dan � sebagai berikut:
−0.0347 −0.1315 0.0655 0.0000 0.2901 −0.1811 −0.0392 −0.0000 � = −0.3495 0.0515 −0.0106 −0.0000 0.2641 0.1200 −0.0022 −0.0000
−0.1700 0.1411 −0.0135 0.0000
−0.0369 −0.1359 0.0129 −0.0000 0.2919 −0.1777 0.0021 −0.0000 � = −0.3486 0.0533 0.0107 0.0000 0.2633 0.1184 −0.0212 0.0000
−0.1696 0.1419 −0.0044 0.0000
sehingga diperoleh matriks
0.3061 −0.0583 −0.0084 0.0000
−0.0583 0.0870 −0.0047 0.0000 �T � = −0.0084 −0.0047 0.0008 0.0000 −0.0000 −0.0000 −0.0000 0.0000
Untuk memperoleh matriks Q. akan dicari DNSBL dari matriks �T �. DNSBL dari matriks �T � ialah
�T � =���T
= −0.9701 −0.2387 −0.0000 −0.0431 0.2415 −0.9669 0.0000 −0.0825 0.0219 0.0905 −0.0000 −0.9957 0.0000 −0