UKURAN KESESUAIAN ANALISIS KORESPONDENSI MELALUI
ANALISIS PROCRUSTES
SARI RAHAYU
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
ABSTRAK
SARI RAHAYU. Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis Procrustes. Dibimbing oleh SISWADI dan TONI BAKHTIAR.
Analisis korespondensi merupakan bagian analisis peubah ganda yang mempelajari hubungan dua atau lebih variabel dengan memeragakan baris dan kolom secara serempak dari tabel kontingensi dalam ruang berdimensi rendah dengan menggunakan jarak khi-kuadrat. Dari analisis korespondensi diperoleh matriks koordinat profil baris dan kolom. Studi ini bertujuan menghitung ukuran kesesuaian analisis korespondensi melalui analisis Procrustes dan mengaplikasikan analisis korespondensi pada dua contoh data yaitu hubungan antara kelompok pegawai dengan kebiasaan merokok dan hubungan antara provinsi dengan lapangan pekerjaan utama. Ukuran kesesuaian melalui analisis Procrustes ditentukan dari nilai perbedaan minimum ketiga transformasi geometri yaitu translasi, rotasi, dan dilasi. Ukuran kesesuaian dalam analisis korespondensi melalui analisis Procrustes untuk matriks koordinat profil baris dan kolom perlu dilakukan ketiga transformasi. Hasil analisis untuk hubungan kategori perokok dengan kelompok pegawai menghasilkan ukuran kesesuaian masing-masing untuk profil baris dan kolom sebesar 98.64% dan 99.53%. Sedangkan hasil analisis Procrustes untuk hubungan provinsi dengan lapangan pekerjaan utama menghasilkan ukuran kesesuaian masing-masing untuk profil baris dan kolom masing-masing sebesar 91.83% dan 88.25%.
Kata kunci: analisis korespondensi, ukuran kesesuaian, analisis Procrustes
ABSTRACT
SARI RAHAYU. Goodness-of-fit of Correspondence Analysis via Procrustes Analysis. Under supervision of SISWADI and TONI BAKHTIAR.
Correspondence analysis is a part of multivariate analysis studying the relationship of two or more variables which are displayed in rows and columns simultaneously from contingency table in low dimensional space using the Chi-square distance. From correspondence analysis, it is obtained row and column profiles co-ordinate matrix. This study aims to calculate the goodness-of-fit of correspondence analysis via Procrustes analysis and applied to two examples of data, i.e. the relationships between categories of smokers and groups of employees and the relationship between the province and the main jobs. To obtain the Procrustes analysis, we need to determine minimum difference through three geometric transformations, i.e. translation, rotation, and dilation. In correspondence analysis, we need to do three transformations on Procrustes analysis to obtain goodness-of-fit in row and column profiles co-ordinate matrix. The result of Procrustes analysis for relationship between employee groups and smoking habits to row and column profiles is 98.64% and 99.53% respectively. While the result of Procrustes analysis for relationship between province and the main jobs to row and column profiles is 91.83% and 88.25% respectively.
UKURAN KESESUAIAN ANALISIS KORESPONDENSI MELALUI
ANALISIS PROCRUSTES
SARI RAHAYU
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains pada
Departemen Matematika
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
Judul Skripsi
: Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis
Procrustes
Nama
: Sari Rahayu
NIM
: G54070055
Menyetujui,
Pembimbing I,
Prof Dr Ir Siswadi, MSc
NIP 19490609 197412 1 001
Pembimbing II,
Dr Toni Bakhtiar, MSc
NIP 19720627 199702 1 002
Mengetahui,
Ketua Departemen Matematika,
Dr Toni Bakhtiar, MSc
NIP 19720627 199702 1 002
Judul Skripsi
Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis
Procrustes
Nama
Sari Rahayu
NIM
G54070055
Menyetujui,
Pembimbing
I,
Pembimbing
II,
Prof
Dr
If
Siswadi, MSc
Dr Toni Bakhtiar, MSc
NIP 19490609 197412 1 001
NIP 19720627 199702 1 002
Mengetahui
,
Ketua Departemen Matematika,
Bakhtiar, MSc
627 199702 1 002
a .
0
2 JAN 2014
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala limpahan rahmat dan karuniaNya, sehingga karya ilmiah berjudul Ukuran Kesesuaian Analisis Korespondensi Melalui
Analisis Procrustes ini dapat penulis selesaikan. Shalawat dan salam tak lupa penulis curahkan
kepada Nabi Besar Muhammad SAW beserta seluruh keluarga, sahabat, dan para pengikutnya sampai akhir zaman.
Ucapan terima kasih penulis haturkan kepada Prof Dr Ir Siswadi, MSc selaku dosen pembimbing I dan Dr Toni Bakhtiar, MSc selaku dosen pembimbing II atas semua ilmu, kesabaran, serta motivasi yang telah diberikan selama penulisan karya ilmiah ini. Ucapan terima kasih juga penulis haturkan kepada Ir Ngakan Komang Kutha Ardana, MSc selaku dosen penguji yang telah banyak memberi saran. Penulis juga ingin mengucapkan terima kasih kepada seluruh dosen di Departemen Matematika atas semua ilmu yang diberikan, serta staf dan pegawai di Departemen Matematika atas semua bantuan dan pelayanannya selama ini.
Karya ilmiah ini penulis persembahkan untuk Bapak, Ibu, Adik tersayang dan Dzulkarnain. Penulis mengucapkan terima kasih atas doa, kesabaran, dukungan, motivasi, dan kasih sayang yang tiada henti kepada penulis. Tak lupa penulis mengucapkan terima kasih kepada teman-teman Matematika 44, adik-adik Matematika Angkatan 45 dan 46, serta seluruh pihak yang telah membantu penulis dalam penulisan karya ilmiah ini.
Semoga karya ilmiah ini bermanfaat.
Bogor, Desember 2013
RIWAYAT HIDUP
Penulis dilahirkan di Bogor, Jawa Barat pada tanggal 21 September 1989 dari pasangan bapak Jumadi dan ibu Sudarini. Penulis merupakan putri pertama dari tiga bersaudara. Pada tahun 2007, penulis lulus dari SMA Negeri 1 Cibinong dan pada tahun yang sama diterima sebagai mahasiswa IPB melalui jalur Undangan Seleksi Masuk IPB (USMI). Penulis memilih mayor Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam, dengan minor Statistika Terapan sebagai mata kuliah penunjang. Selama mengikuti perkuliahan, penulis menjadi asisten mata kuliah Kalkulus pada semester ganjil tahun akademik 2009-2010. Penulis mendapatkan beasiswa Perhimpunan Orang Tua Mahasiswa (POM) pada semester ganjil tahun akademik 2007-2008 sampai dengan semester genap tahun akademik 2009-2010 dan beasiswa Pengembangan Prestasi Akademik (PPA) pada semester ganjil tahun akademik 2010-2011 sampai dengan semester genap tahun akademik 2011-2012. Penulis juga pernah menjadi panitia dalam Pesta Sains Nasional 2009 dan 2010, Welcome Ceremony Mathematica, Math Expo, Reuni Akbar Matematika dan kegiatan kepanitian lainnya.
DAFTAR ISI
Halaman
DAFTAR TABEL ... viii
DAFTAR GAMBAR ... viii
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan ... 1
LANDASAN TEORI ... 1
Dekomposisi Nilai Singular ... 1
Analisis Korespondensi ... 3
Ukuran Kesesuaian Analisis Korespondensi ... 5
Analisis Procrustes ... 5
Translasi ... 5
Rotasi ... 6
Dilasi... 6
PEMBAHASAN ... 8
Ukuran Kesesuaian Analisis Korespondensi Melalui Analisis Procrustes ... 8
Ukuran Kesesuaian Matriks Koordinat Profil Baris ... 8
Ukuran Kesesuaian Matriks Koordinat Profil Kolom ... 9
Contoh Aplikasi Analisis Korespondensi ... 9
SIMPULAN ... 13
DAFTAR TABEL
Halaman 1 Bentuk umum tabel kontingensi... ... 3 2 Bentuk umum matriks korespondensi ... 3 3 Data kategori perokok dengan kategori pekerjaan dari beberapa perusahaan ... 9 4 Data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu
menurut provinsi dan lapangan pekerjaan utama pada 2011 ... 11
DAFTAR GAMBAR
Halaman 1 Plot analisis korespondensi data hasil pengamatan kategori perokok dengan kelompok
pegawai dari beberapa perusahaan ... 10 2 Plot analisis korespondensi data penduduk berumur 15 tahun ke atas yang bekerja
(1)
PENDAHULUAN
Latar Belakang
Analisis korespondensi diartikan sebagai sebuah teknik analisis eksplorasi data untuk memperlihatkan dengan grafik dari tabel kontingensi dan data kategori peubah ganda. Berdasarkan kegunaannya, analisis korespondensi dan analisis komponen utama memiliki kesamaan yaitu mereduksi dimensi data menjadi yang lebih sederhana sedangkan perbedaannya terletak pada data yang digunakan. Analisis komponen utama digunakan untuk data dengan skala pengukuran kontinu sedangkan analisis korespondensi digunakan untuk data kategori (Abdi dan Williams 2010).
Tujuan dari analisis korespondensi ialah untuk mengubah data tabel menjadi dua kelompok nilai faktor yaitu satu untuk baris dan satu untuk kolom. Nilai faktor memberikan representasi terbaik dari struktur kesamaan baris dan kolom dari tabel
.
Analisis korespondensi memproyeksikan baris-baris dan kolom-kolom dari matriks data sebagai titik-titik ke dalam sebuah grafik berdimensi rendah, biasanya dua. Baris dan kolom dalam grafik ini diperlihatkan sebagai titik-titik di mana koordinatnya merupakan nilai faktor dan dimensinya disebut faktor. Nilai faktor baris dan kolom memiliki nilai eigen yang sama dan karena itu, kedua baris dan kolom dapat dengan mudah diwakili dalam satu peta tunggal (Abdi dan Williams 2010).Ukuran kesesuaian digunakan untuk mengukur seberapa baik analisis korespondensi menggambarkan data asli berdimensi tinggi melalui data pendekatan berdimensi rendah. Metode lain untuk mendapatkan ukuran kesesuaian ialah dengan analisis Procrustes. Analisis Procrustes adalah salah satu metode yang menyatakan perbedaan dua atau lebih konfigurasi 𝑛-titik sebagai suatu nilai numerik (Krzanowski 1990). Nilai numerik yang dihasilkan metode ini dapat digunakan untuk memperkirakan ukuran kesesuaian antar-konfigurasi (Sibson 1978).
Dalam analisis Procrustes, nilai perbedaan minimum dari dua atau lebih konfigurasi dihitung dengan menggunakan tiga transformasi geometris yaitu translasi, rotasi, dan dilasi. Ketiga transformasi tersebut dapat digunakan untuk menentukan ukuran kesesuaian yang optimal.
Tujuan
Tujuan dari karya ilmiah ini ialah:
1. Menghitung ukuran kesesuaian analisis korespondensi melalui analisis Procrustes. 2. Mengaplikasikan analisis korespondensi
pada dua contoh data, yaitu hubungan antara kategori perokok dengan kelompok pegawai serta hubungan antara provinsi dengan lapangan pekerjaan utama.
LANDASAN TEORI
Dekomposisi Nilai SingularDefinisi 1 (Nilai Eigen dan Vektor Eigen) Misalkan 𝐀 adalah suatu matriks 𝑛 × 𝑛 . Skalar λ disebut sebagai nilai eigen atau nilai karakteristik dari 𝐀 jika terdapat suatu vektor taknol 𝐱, sehingga 𝐀𝐱 = λ𝐱. Vektor 𝐱 disebut vektor eigen atau vektor karakteristik matriks 𝐀 yang bersesuaian dengan λ (Leon 2001). Definisi 2 (Nilai Singular)
Misalkan 𝐗 adalah suatu matriks 𝑛 × 𝑝 . Nilai-nilai singular dari 𝐗 adalah akar dari nilai eigen yang positif dari matriks 𝐗T𝐗 atau 𝐗𝐗T (Leon 2001).
Definisi 3 (Dekomposisi Nilai Singular) Setiap matriks
𝐘
yang berdimensi 𝑛 × 𝑝 dapat dinyatakan sebagai bentuk Dekomposisi Nilai Singular (DNS) sebagai berikut:𝑛𝐘𝑝= 𝐔𝑛 𝑟𝐋𝑟𝐖𝑝T
(Jolliffe 2002), di mana 𝐔 dan 𝐖 masing-masing dengan 𝑟 kolom ortonormal, 𝑟 merupakan pangkat matriks 𝐘 dengan 𝑟 ≤ min 𝑛, 𝑝 . 𝐔T𝐔 = 𝐖T𝐖 = 𝐈
𝑟, dengan 𝐈𝑟 merupakan matriks identitas berpangkat 𝑟 . 𝐋 = diag λ1, λ2, … , λ𝑟 dengan λ1≥ λ2≥ ⋯ ≥ λ𝑟 > 0 dan λ𝑖 , 𝑖 = 1,2, … 𝑟 merupakan nilai singular dari matriks 𝐘.
Matriks 𝐖 adalah matriks yang kolom-kolomnya terdiri atas vektor eigen 𝐰𝑖 yang berpadanan dengan nilai eigen taknol i dari
matriks 𝐘T𝐘. Matriks 𝐔 adalah matriks yang kolom-kolomnya merupakan vektor eigen yang berpadanan dengan nilai eigen taknol dari matriks 𝐘𝐘Tdalam bentuk
2
(2) (3) = 𝐘𝐰1 λ1 ,𝐘𝐰2 λ2 , … ,𝐘𝐰𝑟 λ𝑟 . Untuk membuktikan persamaan (1), diperlukan fakta sebagai berikut:1. 𝐘T𝐘 𝐰 = 𝟎 ↔ 𝐘 𝐰 = 𝟎, untuk sembarang 𝐰 ∈ ℝ𝑝.
2. 𝐘T𝐘 dan 𝐘𝐘T berpangkat r dan merupakan matriks semidefinit positif dengan r nilai eigen positif yang sama.
3. Nilai eigen matriks 𝐘T𝐘 dapat diurutkan menjadi λ1≥ λ2≥ ⋯ ≥ λ𝑟 > λ𝑟+1= ⋯ = λ𝑝= 0 dengan vektor-vektor eigen yang bersesuaian adalah 𝐰1, 𝐰2, … , 𝐰𝑟, 𝐰𝑟+1, … , 𝐰𝑝 . Nilai eigen matriks 𝐘𝐘T dapat diurutkan menjadi λ1≥ λ2≥ ⋯ ≥ λ𝑟> λ𝑟+1= ⋯ = λ𝑛= 0 dengan vektor-vektor eigen yang bersesuaian adalah 𝐮1=𝐘𝐰 λ1 1, 𝐮2= 𝐘𝐰2 λ2, … , 𝐮𝑟 = 𝐘𝐰𝑟 λ𝑟, 𝐮𝑟+1, … , 𝐮𝑛 . Matriks 𝐔 = 𝐮1, 𝐮2, … , 𝐮𝑟 dan 𝐖 = 𝐰1, 𝐰2, … , 𝐰𝑟 merupakan matriks dengan kolom-kolom yang ortonormal. 4. Karena 𝐰1, 𝐰2, … , 𝐰𝑝 merupakan
matriks ortogonal, maka 𝑝𝑖=1𝐰𝑖𝐰𝑖T= 𝐈. 5. 𝑝𝑖=1𝐘 𝐰i𝐰iT = 𝐘 𝑝𝑖=1𝐰i𝐰iT , untuk sembarang 𝐰𝑖 ∈ ℝ𝑝. Bukti: Misalkan 𝐔 = 𝐘𝐰1 λ1, 𝐘𝐰2 λ2, … , 𝐘𝐰𝑟 λ𝑟 , 𝐖 = 𝐰1, 𝐰2, … , 𝐰𝑟 , 𝐋 = 𝑑iag λ1, λ2, … , λ𝑟 . Diperoleh 𝑛𝐔𝑟𝐋𝑟𝐖𝑝T = 𝐘𝐰1 λ1 ,𝐘𝐰2 λ2 , … ,𝐘𝐰𝑟 λ𝑟 λ1 0 0 λ2 ⋯ 0 ⋯ 0 ⋮0 ⋯ ⋮ ⋯ λ ⋱ ⋮ 𝑟 𝐖1T 𝐖2T ⋮ 𝐖𝑟T = 𝐘𝐰1, 𝐘𝐰2, … , 𝐘𝐰𝑟 𝐖1T 𝐖2T ⋮ 𝐖𝑟T = 𝑟𝑖=1𝐘 𝐰𝑖𝐰𝑖T = 𝐘 𝑟𝑖=1𝐰𝑖𝐰𝑖T = 𝐘 𝑟𝑖=1𝐰𝑖𝐰𝑖T+ 𝟎 = 𝐘 𝑟𝑖=1𝐰𝑖𝐰𝑖T+ 𝐘 𝑝𝑖=𝑟+1𝐰𝑖𝐰𝑖T = 𝐘 𝑝𝑖=1𝐰𝑖𝐰𝑖T = 𝐘𝐈 = 𝐘.
Dekomposisi nilai singular tidak bersifat tunggal. Jika vektor-vektor kolom matriks 𝐔 dan 𝐖 ingin dilengkapi sehingga 𝐔 dan 𝐖 menjadi matriks-matriks ortogonal yang masing-masing memiliki dimensi 𝑛 × 𝑛 dan 𝑝 × 𝑝, maka DNS dapat dituliskan ke dalam bentuk DNS Bentuk Lengkap (DNSBL).
Definisi 4 (Dekomposisi Nilai Singular Bentuk Lengkap)
Setiap matriks 𝐘 berdimensi 𝑛 × 𝑝 dapat dinyatakan sebagai bentuk Dekomposisi Nilai Singular Bentuk Lengkap (DNSBL) sebagai berikut: 𝑛𝐘𝑝= 𝐔𝑛 𝑛𝐋𝑝𝐖𝑝T di mana 𝐔T𝐔 = 𝐈 𝑛, 𝐖T𝐖 = 𝐈𝑝, dan 𝐋 = diag λ1, λ2, … , λ𝑟 𝑟𝟎𝑝−𝑟 𝑛−𝑟𝟎𝑟 𝑛−𝑟𝟎𝑝−𝑟 .
Definisi 5 (Dekomposisi Nilai Singular Terampat)
Jika diberikan matriks definit positif 𝛀 ( 𝑛 × 𝑛) dan 𝚽 ( 𝑝 × 𝑝) dan X merupakan matriks data berdimensi 𝑛 × 𝑝 maka Dekomposisi Nilai Singular Terampat (DNS Terampat) dari matriks X dapat dinyatakan sebagai
𝐗 = 𝐀𝐃μ𝐁T
dengan 𝐀T𝛀𝐀 = 𝐁T𝚽𝐁 = 𝐈 dan 𝐃μ merupakan matriks diagonal nilai singular dengan 𝜇1≥ 𝜇2≥ ⋯ 𝜇𝑟> 0 . Matriks 𝐀 dan 𝐁 dapat dicari dengan DNS dari matriks 𝛀1/2𝐗𝚽1/2 yaitu
𝛀1/2𝐗𝚽1/2= 𝐔𝐋𝐖T 𝛀1/2 𝐀𝐃
μ𝐁T 𝚽1/2= 𝐔𝐋𝐖T
di mana 𝐔T𝐔 = 𝐕T𝐕 = 𝐈 sehingga diperoleh 𝐀 = 𝛀−1/2𝐔, 𝐃
μ= 𝐋, dan 𝐁 = 𝚽−1/2W.
Definisi 6 (Jarak Euclid)
Jarak Euclid antara 𝐲𝑖 dan 𝐲𝑗 dari matriks 𝑛𝐘𝑝= 𝐲1, 𝐲2, … , 𝐲n T didefinisikan sebagai
𝑑𝐸 𝐲𝑖, 𝐲𝑗 = 𝐲i− 𝐲j T
𝐲i− 𝐲j (Jolliffe 2002).
Definisi 7 (Jarak Mahalanobis)
Jarak Mahalanobis antara 𝐲𝑖 dan 𝐲𝑗 dari matriks 𝑛𝐘𝑝= 𝐲1, 𝐲2, … , 𝐲𝑛 T didefinisikan sebagai 𝑑𝑀 𝐲𝑖, 𝐲𝑗 = 𝐲𝑖− 𝐲𝑗 T 𝐒−1 𝐲 𝑖− 𝐲𝑗 , dengan S adalah matriks koragam yang diperoleh dari 𝐘. Diasumsikan 𝐘 berpangkat 𝑝 sehingga 𝐒−1 ada (Jolliffe 2002).
Definisi 8 (Teras)
Misalkan 𝐘 adalah suatu matriks 𝑛 × 𝑛 . Teras dari matriks 𝐘 atau ditulis tr 𝐘 merupakan jumlah elemen-elemen diagonal utama dari 𝐘: tr 𝐘 = 𝑛𝑖=1y𝑖𝑖 (Leon 2001). (4) (8) (5) (6) (7)
3
Definisi 9 (Jarak khi-kuadrat)
Jarak khi-kuadrat didefinisikan sebagai 𝜒2= 𝑂𝑖𝑗−𝐸𝑖𝑗 2 𝐸𝑖𝑗 𝑝 𝑗 =1 𝑛 𝑖=1 dengan
𝑂𝑖𝑗 = nilai frekuensi pengamatan pada baris ke-i dan kolom ke-j (𝑂𝑖𝑗 = 𝑛𝑖𝑗), 𝐸𝑖𝑗 = nilai frekuensi harapan di mana
𝐸𝑖𝑗 = 𝑛𝑖.𝑛.𝑗
𝑛..
𝑛𝑖. = jumlah frekuensi pada baris ke-i,
𝑛.𝑗 = jumlah frekuensi pada kolom ke-j, 𝑛 = banyaknya baris,
𝑝 = banyaknya kolom (Daniel 1990).
Analisis Korespondensi
Analisis korespondensi ditemukan dan dikembangkan pertama kali tahun 1960-an di Perancis (Benzecri 1969). Analisis korespondensi merupakan bagian analisis peubah ganda yang memelajari hubungan antara dua atau lebih variabel dengan memeragakan baris dan kolom secara serempak dari tabel kontingensi dalam ruang berdimensi rendah dengan menggunakan jarak khi-kuadrat. Analisis korespondensi digunakan untuk mereduksi dimensi variabel dan menggambarkan profil vektor baris dan profil vektor kolom suatu matriks data dari tabel kontingensi (Greenacre 1984).
Tujuan yang ingin dicapai dalam analisis korespondensi antara lain mengetahui hubungan antara satu kategori variabel baris dengan satu kategori kolom serta menyajikan setiap kategori variabel baris dan kolom dari tabel kontingensi sehingga dapat ditampilkan secara bersama-sama pada satu ruang vektor berdimensi kecil secara optimal.
Andaikan N merupakan matriks data yang unsur-unsurnya bilangan tak negatif berukuran 𝑛 × 𝑝 , di mana n menunjukkan banyaknya baris dan p menunjukkan banyaknya kolom. Tabel kontingensi dari N adalah tabel yang mencatat data hasil pengamatan dengan melibatkan dua variabel, variabel I dan variabel II. Variabel I sebagai variabel baris terdiri dari i kategori dan variabel II sebagai variabel kolom terdiri dari j kategori. Sel yang dibentuk baris ke-i dan kolom ke-j memunyai frekuensi pengamatan 𝑛𝑖𝑗 yang ditunjukkan seperti pada Tabel 1.
Tabel 1 Bentuk umum tabel kontingensi Variabel 1 Variabel 2 Total 1 2 ... p 1 𝑛11 𝑛12 ... 𝑛1𝑝 𝑛1. 2 𝑛21 𝑛22 ... 𝑛2𝑝 𝑛2. ... ... ... ... ... ... n 𝑛𝑛1 𝑛𝑛2 ... 𝑛𝑛𝑝 𝑛𝑛. Total 𝑛.1 𝑛.2 ... 𝑛.𝑝 𝑛.. (Greenacre 1984) dengan 𝑛𝑖.= 𝑝𝑗 =1𝑛𝑖𝑗 𝑛.𝑗 = 𝑛𝑖=1𝑛𝑖𝑗 𝑛..= 𝑛𝑖=1 𝑝𝑗 =1𝑛𝑖𝑗 di mana i = 1, 2, ..., n dan j = 1, 2, ..., p. Matriks Korespondensi
Matriks korespondensi P didefinisikan sebagai matriks yang unsur-unsurnya adalah unsur matriks N yang telah dibagi dengan jumlah total unsur matriks N.
𝐏 = 𝑛1... 𝐍
dengan 𝑛..= 𝟏T𝐍𝟏. Dari Tabel 1 diperoleh matriks korespondensi seperti pada Tabel 2 berikut.
Tabel 2 Bentuk umum matriks korespondensi Variabel 1 Variabel 2 Total 1 2 ... p 1 𝑝11 𝑝12 ... 𝑝1𝑝 𝑝1. 2 𝑝21 𝑝22 ... 𝑝2𝑝 𝑝2. ... ... ... ... ... ... n 𝑝n1 𝑝n2 ... 𝑝𝑛𝑝 𝑝𝑛. Total 𝑝.1 𝑝.2 ... 𝑝.𝑝 1 (Greenacre 1984)
Vektor jumlah baris matriks P ialah 𝐫 = 𝐏𝟏 = 𝑝1., 𝑝2., … , 𝑝𝑛. T
= (𝑟1, 𝑟2, … , 𝑟𝑛)T.
Vektor jumlah kolom matriks P ialah 𝐜 = 𝐏T𝟏 = 𝑝
.1, 𝑝.2, … , 𝑝.𝑝 = 𝑐1, 𝑐2, … , 𝑐𝑝 .
Matriks diagonal dari elemen-elemen vektor jumlah baris r adalah 𝐃𝑟 yang berukuran 𝑛 × 𝑛 dan 𝐃𝑐 adalah matriks diagonal dengan ukuran 𝑝 × 𝑝 dari elemen-elemen vektor jumlah kolom c dengan
𝐃𝑟 = diag 𝐫 = 𝑝1. 0 … 0 𝑝2. … ⋮ ⋮ ⋱ 00 ⋮ 0 0 … 𝑝𝑛. dan (11) (12) (13) (14) (9) (10)
4
𝐃𝑐= diag 𝐜 = 𝑝.1 0 … 0 𝑝.2 … ⋮ ⋮ ⋱ 00 ⋮ 0 0 … 𝑝.𝑝 .Matriks Profil Baris dan Kolom
Matriks profil baris dan profil kolom dari P diperoleh dengan cara membagi vektor baris dan vektor kolom dengan masing-masing massanya. Matriks profil baris (R) dan profil kolom (C) dinyatakan dengan:
𝐑 = 𝐃𝑟−1𝐏 = 𝑝11 𝑝1. 𝑝12 𝑝1. ⋯ ⋮ ⋮ ⋱ 𝑝𝑛 1 𝑝𝑛 . 𝑝𝑛 2 𝑝𝑛 . ⋯ 𝑝1𝑝 𝑝1. ⋮ 𝑝𝑛𝑝 𝑝𝑛 . = 𝐫 1 T ⋮ 𝐫 𝑛T dan 𝐂 = 𝐃𝑐−1𝐏T = 𝑝11 𝑝.1 𝑝21 𝑝.1 ⋯ ⋮ ⋮ ⋱ 𝑝1𝑝 𝑝.𝑝 𝑝2𝑝 𝑝.𝑝 ⋯ 𝑝𝑛 1 𝑝.1 ⋮ 𝑝𝑛𝑝 𝑝.𝑝 = 𝐜 1 T ⋮ 𝐜 𝑝T . Pemilihan Jarak
Untuk menghitung jarak profil baris atau kolom dalam kategori yang sama digunakan jarak khi-kuadrat yang didefinisikan:
jarak antara profil baris 𝒓𝑖 dan profil baris 𝒓𝑗 adalah
d2 𝒓
𝑖, 𝒓𝑗 = 𝒓𝑖− 𝒓𝑗 T
𝐃𝑐−1 𝒓𝑖− 𝒓𝑗
jarak antara profil kolom 𝒄𝑖 dan profil kolom 𝒄𝑗adalah
d2 𝒄
𝑖, 𝒄𝑗 = 𝒄𝑖 − 𝒄𝑗 T
𝐃𝑟−1 𝒄𝑖− 𝒄𝑗
Jika jarak khi-kuadrat antara dua baris atau kolom adalah nol, maka kedua baris atau kolom tersebut memiliki sebaran frekuensi sama. Semakin besar jarak antarkedua baris atau kolom, semakin besar pula perbedaan sebaran frekuensi relatif kedua baris atau kolom tersebut.
Dekomposisi Inersia
Keseluruhan perbedaan tiap ruang dari setiap himpunan baris/kolom diukur dari total inersianya. Total inersia adalah jumlah kuadrat jarak terbobot dari titik-titik (baris/kolom) terhadap sentroidnya. Total inersia untuk titik baris ialah
in 𝐼 = 𝑛𝑖=1𝑟𝑖 𝒓 𝑖− 𝒄 T𝐃c−1 𝒓 𝑖− 𝒄 . Total inersia untuk titik kolom ialah in 𝐽 = 𝑝𝑗 =1𝑐𝑗 𝒄 𝑗− 𝒓
T
𝐃𝑟−1 𝒄 𝑗− 𝒓 . Total inersia untuk titik baris dan titik kolom secara bersamaan adalah
Inersia total = 𝑝𝑖𝑗−𝑟𝑖𝑐𝑗 2 𝑟𝑖𝑐𝑗 𝑗 𝑖 =χ 2 𝑛...
Dekomposisi Nilai Singular Terampat Untuk mereduksi dimensi data berdasarkan keragaman data (nilai eigen/ inersia) terbesar dengan mempertahankan informasi yang optimum diperlukan dekomposisi nilai singular. Dekomposisi nilai singular terampat dari matriks 𝐏 adalah
𝐏 − 𝐫𝐜T= 𝐀𝐃 𝜇𝐁T
di mana 𝐀 dan 𝐁 diperoleh dari penguraian nilai singular matriks 𝐃𝑟−1/2 𝐏 − 𝐫𝐜T 𝐃𝑐−1/2 dan berlaku
𝐀T𝐃
𝑟−1𝐀 = 𝐁T𝐃𝑐−1𝐁 = 𝐈; 𝜇1≥ 𝜇2≥ ⋯ 𝜇𝑟 > 0
dengan 𝐃𝜇 merupakan matriks diagonal yang berukuran 𝑟 × 𝑟 dari nilai singular 𝜇 dari 𝐏 − 𝐫𝐜T, 𝐀 dan 𝐁 masing-masing merupakan sumbu utama dari baris dan kolom.
Dengan demikian, matriks koordinat profil baris dan matriks koordinat profil kolom dinyatakan sebagai
𝐅 = 𝐃𝑟−1𝐀𝐃μ dan
𝐆 = 𝐃𝑐−1𝐁𝐃μ.
Penggambaran dalam ruang berdimensi rendah, misalnya s, maka koordinat yang digunakan untuk menggambarkan profil-profil tersebut adalah s unsur pertamanya. Hubungan antarkategori ditelusuri melalui formula transisi, yaitu
𝐅 = 𝐑𝐆𝐃μ−1 dan
𝐆 = 𝐂𝐅𝐃μ−1.
Jumlah kuadrat terbobot dari titik-titik koordinat sekitar sumbu utama ke-s di setiap himpunan sama dengan μ𝑠2, yang dinotasikan oleh λ𝑠 dan disebut inersia utama ke-s. Inersia utama baris dan kolom adalah
𝐅T𝐃
r𝐅 = 𝐃𝜇2≡ 𝐃𝜆 𝐆T𝐃
c𝐆 = 𝐃𝜇2≡ 𝐃𝜆 (Greenacre 1984).
Kontribusi mutlak memberikan informasi mengenai proporsi inersia yang dapat diterangkan oleh masing-masing kategori terhadap pembentukan sumbu utama. Rumus untuk menghitung kontribusi mutlak (KM) untuk baris dan kolom yaitu sebagai berikut:
KM𝑖𝑠 =𝑟𝑖×𝑓𝑖𝑠 2 μ𝑠2 dan KM𝑗𝑠 = 𝑐𝑗×𝑔𝑗𝑠2 μ𝑠2 dengan :
KM𝑖𝑠 = kontribusi mutlak kategori baris ke-i terhadap pembentukan sumbu ke-s KM𝑗𝑠 = kontribusi mutlak kategori kolom ke-j (15) (18) (22) (16) (17) (40) (27) (20) (21) (26) (19) (23) (24) (25) (29) (28) (30) (31)
5
(35) (37) (38) (36) (34) terhadap pembentukan sumbu ke-s 𝑓𝑖𝑠2 = koordinat baris ke-i pada sumbu ke-s 𝑔𝑗𝑠2 = koordinat kolom ke-j pada sumbu ke-s μ𝑠 = nilai singular ke-s.Kontribusi relatif atau koordinat kosinus digunakan untuk melihat proporsi inersia dari setiap kategori yang diterangkan oleh sumbu utama yang terbentuk. Rumus untuk menghitung masing-masing kontribusi relatif untuk baris dan kolom adalah
KR𝑖𝑠 = 𝑓𝑖𝑠 2 𝑓𝑠 𝑖𝑠2 dan KR𝑗𝑠 = 𝑔𝑗𝑠2 𝑔𝑠 𝑗𝑠2
di mana KR𝑖𝑠 dan KR𝑗𝑠 adalah kontribusi relatif kategori ke-i dan kategori ke-j yang dijelaskan oleh sumbu ke-s.
Kontribusi relatif yang tinggi pada suatu titik untuk sumbu utama ke-s, menunjukkan bahwa sumbu utama ke-s menjelaskan inersia titik tersebut dengan baik. Secara umum tingginya kontribusi titik terhadap inersia sumbu utama berimplikasi pada tingginya kontribusi relatif sumbu utama tersebut. Ukuran Kesesuaian Analisis Korespondensi
Besaran 𝛼12, … , 𝛼𝑟2 dapat diinterpretasikan sebagai besarnya kontribusi yang diberikan pada total inersia oleh dimensi pertama, kedua, dan seterusnya, sehingga besaran relatif untuk mengukur besarnya kehilangan informasi dapat dirumuskan sebagai berikut :
GFAK 𝐗, 𝐘 = 𝛼𝑖 2 𝑠 𝑖=1 𝛼𝑖2 𝑟 𝑖=1 × 100% dengan 𝛼𝑖 merupakan nilai singular dari matriks X dan 𝑠 << 𝑟 dengan 𝑠 berdimensi rendah.
Analisis Procrustes
Misalkan 𝐗 adalah matriks berukuran 𝑛 × 𝑝 dan 𝐘 berukuran 𝑛 × 𝑞 yang masing-masing merupakan representasi konfigurasi yang akan dibandingkan. Koordinat titik ke-𝑖 pada ruang Euclid diberikan oleh nilai-nilai pada baris ke-𝑖 matriks. Konfigurasi pertama berada pada ruang berdimensi 𝑝 dan titik ke-𝑖 memiliki koordinat 𝑥𝑖1, 𝑥𝑖2, … , 𝑥𝑖𝑝 , sedang-kan konfigurasi kedua berada pada ruang berdimensi 𝑞 dan titik ke-𝑖 memiliki koordinat 𝑦𝑖1, 𝑦𝑖2, … , 𝑦𝑖𝑞 . Jika 𝑝 > 𝑞 maka konfigurasi kedua berada dalam subruang dari ruang berdimensi 𝑝 . Perbedaan dimensi ruang ini dapat diselesaikan dengan memasangkan 𝑝 − 𝑞 kolom nol di kolom mana saja termasuk
memasangkan 𝑝 − 𝑞 di kolom terakhir dari 𝐘 sehingga menjadi matriks berukuran 𝑛 × 𝑝 (Siswadi et al. 2012). Dengan demikian, tanpa mengurangi keumuman dapat diasumsikan bahwa 𝑝 = 𝑞.
Untuk menentukan nilai perbedaan dari konfigurasi 𝐗 dan 𝐘 , analisis Procrustes menggunakan jumlah kuadrat jarak antartitik yang bersesuaian, yaitu
𝐸 𝐗, 𝐘 = 𝑥𝑖𝑗 − 𝑦𝑖𝑗 2 𝑝 𝑗 =1 𝑛 𝑖=1 = tr 𝐗 − 𝐘 T 𝐗 − 𝐘 .
Nilai perbedaan minimum dihitung dengan menggunakan tiga transformasi geometris yaitu translasi, rotasi, dan dilasi yang diberikan oleh Bakhtiar dan Siswadi (2011). 1. Translasi
Definisi 10 (Sentroid)
Misalkan 𝐗 = 𝑥𝑖𝑗 , maka sentroid kolom dari matriks 𝐗 dinotasikan sebagai 𝐂𝐗= (𝑥∙1, 𝑥∙2, … , 𝑥∙𝑝), di mana
𝑥∙𝑗 =1𝑛 𝑛𝑖=1𝑥𝑖𝑗 , 𝑗 = 1,2, … 𝑝.
Dalam analisis Procrustes, translasi diartikan sebagai proses pemindahan seluruh titik dengan jarak yang tetap dan arah yang sama. Penguraian persamaan (34) menghasilkan: 𝐸 𝐗, 𝐘 = 𝑖=1𝑛 𝑝𝑗 =1 𝑥𝑖𝑗− 𝑥∙𝑗 − 𝑦𝑖𝑗− 𝑦∙𝑗 2− 2 𝑛𝑖=1 𝑝𝑗 =1 𝑥𝑖𝑗− 𝑥∙𝑗 − 𝑦𝑖𝑗− 𝑦∙𝑗 𝑥∙𝑗− 𝑦∙𝑗 +𝑛 𝑥∙𝑗− 𝑦∙𝑗 2 𝑝 𝑗 =1 .
Penguraian persamaan (36) menghasilkan 𝐸 𝐗, 𝐘 = 𝐸 𝐗𝑇, 𝐘𝑇 + 𝑛 𝑍XY di mana 𝐗𝑇 = 𝐗 − 𝟏𝑛𝐂X, 𝐘𝑇= 𝐘 − 𝟏𝑛𝐂Y, 𝑍XY = 𝑥∙𝑗− 𝑦∙𝑗 2 . 𝑝 𝑗 =1
𝐗𝑇 dan 𝐘𝑇 merupakan konfigurasi 𝐗 dan 𝐘 setelah ditranslasi. 𝐂X dan 𝐂Y masing-masing adalah sentroid kolom dari 𝐗 dan 𝐘 , 𝟏𝑛 merupakan vektor kolom berukuran 𝑛 × 1 yang semua unsurnya bernilai 1, sedangkan 𝑍XY merupakan jarak kuadrat dari kedua sentroid kolom 𝐗 dan 𝐘. Penyesuaian optimal dengan translasi dapat dilakukan dengan menghimpitkan sentroid kolom 𝐗 dan 𝐘 sehingga 𝑍XY = 0. Dengan demikian, nilai perbedaan minimum dari konfigurasi 𝐗 dan 𝐘 setelah dilakukan penyesuaian optimal dengan translasi adalah 𝐸𝑇 𝐗, 𝐘 = 𝐸 𝐗𝑇, 𝐘𝑇 = 𝑥𝑖𝑗− 𝑥∙𝑗 − 𝑦𝑖𝑗− 𝑦∙𝑗 2 . 𝑝 𝑗 =1 𝑛 𝑖=1 (32) (33)
6
(39) (40) (44) (43) (41) (42) 2. RotasiRotasi merupakan proses pemindahan seluruh konfigurasi titik dengan sudut yang tetap tanpa mengubah jarak setiap titik terhadap sentroidnya. Rotasi 𝐘 terhadap 𝐗 dilakukan dengan mengalikan matriks 𝐘 dengan matriks ortogonal 𝐐 , yaitu 𝐸 𝐗, 𝐘 = 𝐸 𝐗, 𝐘𝐐 dengan 𝐐T𝐐 =
𝐐𝐐T = 𝐈.
Nilai perbedaan minimum dari konfigurasi 𝐗 dan 𝐘 setelah dilakukan penyesuaian dengan rotasi adalah
𝐸𝑅 𝐗, 𝐘 = inf𝑄 𝐸 𝐗, 𝐘𝐐 .
Berdasarkan persamaan (35), nilai perbedaan pada penyesuaian dengan rotasi dapat dituliskan sebagai
𝐸 𝐗, 𝐘𝐐 = tr 𝐗 − 𝐘𝐐 T 𝐗 − 𝐘𝐐 = tr 𝐗T− 𝐐T𝐘T 𝐗 − 𝐘𝐐 = tr 𝐗T𝐗 − 𝐗T𝐘𝐐 − 𝐐T𝐘T𝐗+𝐐T𝐘T𝐘𝐐 = tr 𝐗T𝐗 − 𝐗T𝐘𝐐 − 𝐗T𝐘𝐐 T+𝐐T𝐘T𝐘𝐐 = tr 𝐗T𝐗) − tr 𝐗T𝐘𝐐 − tr 𝐗T𝐘𝐐 T+ tr(𝐐T𝐘T𝐘𝐐 = tr 𝐗T𝐗) − tr 𝐗T𝐘𝐐 − tr 𝐗T𝐘𝐐 + tr(𝐐𝐐T𝐘T𝐘 = tr 𝐗T𝐗) − 2 tr 𝐗T𝐘𝐐 + tr(𝐘T𝐘 = tr 𝐗T𝐗 + tr 𝐘T𝐘 − 2 tr 𝐗T𝐘𝐐 .
Nilai tr 𝐗T𝐘𝐐 yang semakin besar akan meminimumkan 𝐸 𝐗, 𝐘𝐐 . Jadi, harus dipilih matriks ortogonal 𝐐 yang memaksimumkan tr 𝐗T𝐘𝐐 .
Teorema
Jika 𝐗, 𝐘 dan 𝐐 matriks ortogonal dengan 𝐗 ∈ ℝ𝑛×𝑝 , 𝐘 ∈ ℝ𝑛×𝑝 , dan 𝐐 ∈ ℝ𝑝×𝑝 maka nilai tr 𝐗T𝐘𝐐 akan maksimum bila dipilih 𝐐 = 𝓦𝓤T dengan 𝓤𝓛𝓦T merupakan hasil Dekomposisi Nilai Singular Bentuk Lengkap (DNSBL) dari matriks 𝐗T𝐘.
Bukti:
Misalkan 𝓤𝓛𝓦T merupakan hasil DNSBL dari matriks 𝑝𝐗T𝐘𝑝 , sehingga
𝑝𝐗T𝐘𝑝 = 𝑝𝓤𝑝𝓛𝑝𝓦𝑝T . 𝓛 = (σ𝑖𝑗) adalah matriks diagonal dengan σ𝑖𝑗 ∈ ℝ, 𝓤 dan 𝓦 masing-masing merupakan matriks ortogonal, sehingga
tr 𝐗T𝐘𝐐 = tr 𝐐𝐗T𝐘 = tr 𝐐𝓤𝓛𝓦T = tr 𝓦T𝐐𝓤𝓛 .
Karena 𝐐 merupakan matriks ortogonal, akibatnya 𝓦T𝐐𝓤 juga
ortogonal. Misalkan 𝓦T𝐐𝓤 = 𝐏 = 𝑝 𝑖𝑗 , maka berlaku −1 ≤ 𝑝𝑖𝑗 ≤ 1, sehingga
tr 𝐗T𝐘𝐐 = tr 𝐏𝓛
= 𝑛𝑖=1 𝑝𝑖𝑖 (σ𝑖𝑖)
≤ tr 𝓛 .
Jadi, tr 𝐏𝓛 akan maksimum jika 𝐏𝓛 = 𝓦T𝐐𝓤𝓛 = 𝓛 . Kondisi ini dapat terpenuhi jika 𝐐 = 𝓦𝓤T (Bakhtiar 1995).
Berdasarkan teorema tersebut, penyesuaian optimal dengan rotasi dapat dilakukan dengan memilih matriks ortogonal 𝐐 = 𝓦𝓤T. Nilai perbedaan minimum setelah penyesuaian optimal dengan rotasi dapat dituliskan menjadi 𝐸𝑅 𝐗, 𝐘 = tr 𝐗T𝐗) + tr(𝐘T𝐘 − 2 tr 𝓛 .
3. Dilasi
Dilasi merupakan proses penskalaan data melalui pembesaran/pengecilan jarak setiap titik dalam konfigurasi terhadap sentroidnya. Dilasi 𝐘 terhadap 𝐗 dilakukan dengan cara mengalikan konfigurasi 𝐘 dengan suatu skalar 𝑐 , yaitu 𝐸 𝐗, 𝐘 = 𝐸 𝐗, 𝑐𝐘 . Nilai perbedaan minimum dari dua konfigurasi 𝐗 dan 𝐘 setelah dilakukan penyesuaian dengan dilasi adalah
𝐸𝐷 𝐗, 𝐘 = inf𝑄 𝐸 𝐗, 𝑐𝐘 .
Berdasarkan persamaan (35), nilai perbedaan pada penyesuaian dengan dilasi dapat dituliskan sebagai
𝐸 𝐗, 𝑐𝐘 = tr 𝐗 − 𝑐𝐘 T 𝐗 − 𝑐𝐘 = tr 𝐗T− 𝑐𝐘T 𝐗 − 𝑐𝐘 = tr 𝐗T𝐗 − 𝑐𝐗T𝐘 − 𝑐𝐘T𝐗 + 𝑐2𝐘T𝐘 = tr 𝐗T𝐗 − 𝑐𝐗T𝐘 − 𝑐 𝐗T𝐘 T+ 𝑐2𝐘T𝐘 = tr 𝐗T𝐗 − 𝑐 tr 𝐗T𝐘 − 𝑐 tr 𝐗T𝐘 T+ 𝑐2tr 𝐘T𝐘 = tr 𝐗T𝐗 − 𝑐 tr 𝐗T𝐘 − 𝑐 tr 𝐗T𝐘 + 𝑐2tr 𝐘T𝐘 = tr 𝐗T𝐗 − 2𝑐 tr 𝐗T𝐘 + 𝑐2 tr 𝐘T𝐘 . Persamaan (43) merupakan bentuk fungsi kuadrat dengan variabel 𝑐 sehingga untuk meminimumkan nilai 𝐸 𝐗, 𝑐𝐘 , turunan pertamanya harus sama dengan nol dan turunan keduanya lebih besar dari nol. 𝑑𝐸𝑑𝑐 = −2 tr 𝐗T𝐘 + 2𝑐 tr 𝐘T𝐘 0 = −2 tr 𝐗T𝐘 + 2𝑐 tr 𝐘T𝐘 2𝑐 tr 𝐘𝑇𝐘 = 2 tr 𝐗𝑇𝐘 𝑐 = tr 𝐗 T𝐘 tr 𝐘T𝐘 .
7
(45) 𝑑𝐸 𝑑𝑐 = −2 tr 𝐗 T𝐘 + 2𝑐 tr 𝐘T𝐘 𝑑2𝐸 𝑑𝑐2 = 2 tr 𝐘T𝐘 > 0.Dari (a) dan (b), diketahui bahwa nilai 𝐸 𝐗, 𝑐𝐘 minimum pada saat
memiliki nilai 𝑐 seperti pada persamaan (44). Dengan menyubstitusikan nilai 𝑐 , nilai perbedaan minimum setelah penyesuaian optimal dengan dilasi menjadi: 𝐸𝐷 𝐗, 𝐘 = tr 𝐗T𝐗 − 2c tr 𝐗T𝐘 + 𝑐2tr 𝐘T𝐘 = tr 𝐗T𝐗 − 2tr 𝐗T𝐘 tr 𝐘T𝐘 tr 𝐗T𝐘 + tr 𝐗 T𝐘 tr 𝐘T𝐘 2 tr 𝐘T𝐘 = tr 𝐗T𝐗 − 2 tr2 𝐗T𝐘 tr 𝐘T𝐘 + tr2 𝐗T𝐘 tr 𝐘T𝐘 = tr 𝐗T𝐗 −tr2 𝐗T𝐘 tr 𝐘T𝐘 .
Dengan menggunakan aljabar sederhana, secara analitik telah dibuktikan bahwa dalam analisis Procrustes, urutan pengerjaan yang menghasilkan jarak paling minimum adalah translasi-rotasi-dilasi. Bukti dapat dilihat di Bakhtiar dan Siswadi (2011).
Secara umum, ukuran kesesuaian analisis korespondensi dan analisis Procrustes diberikan sebagai berikut:
1. Analisis korespondensi GFAK 𝐗, 𝐘 = 𝛼𝑖 2 𝑠 𝑖=1 𝛼𝑖2 𝑟 𝑖=1 × 100%,
dengan 𝛼𝑖 merupakan nilai singular dari matriks X.
2. Analisis Procrustes GFP 𝐗, 𝐘 = 1 −𝐸tr 𝐗𝑇𝑅𝐷 𝐗,𝐘 T𝐗 ,
dengan 𝐸𝑇𝑅𝐷 𝐗, 𝐘 merupakan nilai perbedaan minimum translasi, rotasi dan dilasi dari matriks X terhadap matriks Y.
(46)
8 (48) (49) (50) (51) (52)
PEMBAHASAN
Ukuran Kesesuaian Analisis Korespondensi melalui Analisis Procrustes
Ukuran kesesuaian analisis korespondensi untuk tampilan gambar (representasi) tanpa memperhitungkan massa akan dicari masing-masing menggunakan matriks koordinat profil baris dan kolom sebagai matriks data yang didefinisikan dengan F dan G dengan matriks pendekatannya masing-masing yaitu M dan N melalui analisis Procrustes dengan menentukan nilai perbedaan minimum yang dilakukan menggunakan tiga transformasi geometri, yaitu translasi, rotasi dan dilasi.
Ukuran kesesuaian analisis korespondensi untuk setiap matriks menggunakan analisis Procrustes melalui transformasi geometri translasi, rotasi dan dilasi diberikan pada pembahasan berikut.
Ukuran Kesesuaian Matriks Koordinat Profil Baris
Penyesuaian dengan Translasi
Nilai perbedaan minimum diperoleh ketika jarak kedua sentroid dari kedua matriks sama dengan nol 𝑍𝐅𝐌= 0 . Nilai perbedaan minimum melalui proses translasi adalah 𝐸 𝐅, 𝐌 = 𝐸 𝐅𝑇, 𝐌𝑇 + 𝑛 𝑍𝐅𝐌.
Pada matriks data F diperoleh 𝐂𝐅≠ 𝟎T dan 𝐂𝐌≠ 𝟎T sehingga 𝑍𝐅𝐌≠ 0 . Dengan demikian transformasi translasi perlu dilakukan. Ilustrasi bahwa 𝐂𝐅≠ 𝟎T dan 𝐂𝐌≠ 𝟎T diberikan pada Lampiran 3.
Penyesuaian dengan Rotasi
Misalkan F𝑇 merupakan matriks F yang telah ditranslasi dan M𝑇 merupakan matriks
M yang telah ditranslasi sebagai matriks pendekatannya. Setelah penyesuaian dengan translasi, dilakukan rotasi dengan mengalikan matriks M𝑇 dengan matriks ortogonal 𝐐. Nilai perbedaan pada penyesuaian dengan rotasi sesuai dengan persamaan (40) menjadi 𝐸 F𝑇, M𝑇𝐐
= tr F𝑇TF𝑇 + tr M𝑇TM𝑇 − tr F𝑇TM𝑇𝐐 . Nilai 𝐸 F𝑇, M𝑇𝐐 tersebut akan minimum dengan memaksimumkan tr F𝑇TM𝑇𝐐 dengan 𝐐 = 𝓦𝓤T yang diperoleh dari DNSBL F𝑇TM𝑇 = 𝓤𝓛𝓦T. Jika 𝐐 = 𝐈 maka 𝐸𝑅 F𝑇, M𝑇 = 𝐸 F𝑇, M𝑇 . Karena 𝐐 ≠ 𝐈 sehingga perlu dicari matriks ortogonal Q untuk memperoleh 𝐸𝑅 F𝑇, M𝑇𝐐 . Oleh karena
itu, transformasi rotasi perlu dilakukan. Ilustrasi bahwa 𝐐 ≠ 𝐈 diberikan pada Lampiran 4.
Penyesuaian dengan Dilasi
Transformasi dilasi dilakukan setelah transformasi translasi dan rotasi dilakukan. Dilasi F𝑇 terhadap M𝑇 dilakukan dengan mengalikan konfigurasi M𝑇 dengan suatu skalar 𝑐. Nilai perbedaan setelah penyesuaian dengan dilasi dapat ditulis sebagai:
𝐸 F𝑇, 𝑐M𝑇𝐐
= tr F𝑇TF𝑇 + 𝑐2tr M𝑇TM𝑇 −2𝑐 tr F𝑇TM𝑇𝐐 .
Persamaan (50) merupakan bentuk dari fungsi kuadrat dengan variabel 𝑐
,
sehingga nilai 𝑐 yang meminimumkan nilai 𝐸 F𝑇, 𝑐M𝑇𝐐 yaitu 𝑐 = tr F𝑇 TM 𝑇𝐐 tr M𝑇TM𝑇 .Dengan menyubstitusikan nilai 𝑐 ke persamaan (50), diperoleh nilai perbedaan minimum:
𝐸𝑇𝑅𝐷 𝐅, 𝐌 = tr F
𝑇TF
𝑇−
tr 2 F 𝑇TM𝑇𝐐 tr M𝑇TM𝑇.
Ukuran kesesuaian berdasarkan nilai perbedaan minimum diperoleh dengan perhitungan berikut: GFP F,M = 1 − 𝐸𝑇𝑅𝐷 𝐅, 𝐌 𝐅 2 = 1 − tr F𝑇TF𝑇 − tr 2 F 𝑇TM𝑇𝐐 tr M𝑇TM𝑇 tr F𝑇TF𝑇 = 1 − 1 − tr 2 F 𝑇TM𝑇𝐐 tr F𝑇TF𝑇 tr M𝑇TM𝑇
=
tr F tr2 F𝑇TM𝑇𝐐 𝑇TF𝑇 tr M𝑇TM𝑇.
Dengan demikian, ketiga transformasi perlu dilakukan dalam analisis Procrustes untuk mendapatkan ukuran kesesuaian analisis korespondensi matriks profil baris dengan pendekatannya.
(53)
(54)
(56)
(57) Ukuran Kesesuaian Matriks Koordinat
Profil Kolom
Penyesuaian dengan Translasi
Nilai perbedaan minimum diperoleh ketika jarak kedua sentroid dari kedua matriks sama dengan nol 𝑍𝐆𝐍= 0 . Nilai perbedaan minimum melalui proses translasi adalah 𝐸 𝐆, 𝐍 = 𝐸 𝐆𝑇, 𝐍𝑇 + 𝑛 𝑍𝐆𝐍.
Pada matriks data G diperoleh 𝐂𝐆≠ 𝟎T dan 𝐂𝐍≠ 𝟎T sehingga 𝑍𝐆𝐍≠ 0 . Dengan demikian transformasi translasi perlu dilakukan. Ilustrasi bahwa 𝐂𝐆≠ 𝟎T dan 𝐂𝐍≠ 𝟎T diberikan pada Lampiran 5.
Penyesuaian dengan Rotasi
Misalkan G𝑇 merupakan matriks G yang telah ditranslasi dan N𝑇 merupakan matriks 𝐍 yang telah ditranslasi sebagai matriks pendekatannya. Setelah penyesuaian dengan translasi, dilakukan rotasi dengan mengalikan matriks N𝑇 dengan matriks ortogonal 𝐐. Nilai perbedaan pada penyesuaian dengan rotasi sesuai dengan persamaan (40) menjadi 𝐸 G𝑇, N𝑇𝐐
= tr G𝑇TG𝑇 + tr N𝑇TN𝑇 −2 tr G𝑇TN𝑇𝐐 .
Nilai 𝐸 G𝑇, N𝑇𝐐 tersebut akan minimum dengan memaksimumkan tr G𝑇TN𝑇𝐐 dengan 𝐐 = 𝓦𝓤T yang diperoleh dari DNSBL G𝑇TN𝑇= 𝓤𝓛𝓦T. Jika 𝐐 = 𝐈 maka 𝐸𝑅 G𝑇, N𝑇 = 𝐸 G𝑇, N𝑇 . Karena 𝐐 ≠ 𝐈 se-hingga perlu dicari matriks ortogonal Q untuk memperoleh 𝐸𝑅 G𝑇, N𝑇𝐐 . Oleh karena itu, transformasi rotasi perlu dilakukan. Ilustrasi bahwa 𝐐 ≠ 𝐈 diberikan pada Lampiran 6. Penyesuaian dengan Dilasi
Transformasi dilasi dilakukan setelah transformasi translasi dan rotasi dilakukan. Dilasi G𝑇 terhadap N𝑇 dilakukan dengan mengalikan konfigurasi N𝑇 dengan suatu skalar 𝑐. Nilai perbedaan setelah penyesuaian dengan dilasi dapat ditulis sebagai:
𝐸 G𝑇, 𝑐N𝑇𝐐
= tr G𝑇TG𝑇 + 𝑐2tr N𝑇TN𝑇 − 2𝑐 tr G𝑇TN𝑇𝐐 .
N
ilai 𝑐 yang meminimumkann
ilai 𝐸 G𝑇,c N𝑇𝐐 ialah 𝑐 = tr G𝑇 TN 𝑇𝐐 tr N𝑇TN𝑇 .Dengan menyubstitusikan nilai 𝑐 ke persamaan (55), diperoleh nilai perbedaan minimum:
𝐸𝑇𝑅𝐷 𝐆, 𝐍 = tr G𝑇TG𝑇 − tr 2 G𝑇TN
𝑇𝐐 tr N𝑇TN𝑇 . Ukuran kesesuaian berdasarkan nilai perbedaan minimum diperoleh dengan perhitungan berikut: GFP 𝐆, 𝐍 = 1 −𝐸𝑇𝑅𝐷 𝐆 𝐆, 𝐍 2 = 1 − tr G𝑇TG𝑇 − tr 2 G 𝑇TN𝑇𝐐 tr N𝑇TN𝑇 tr G𝑇TG𝑇 = 1 − 1 − tr 2 G 𝑇TN𝑇𝐐 tr G𝑇TG𝑇 tr N𝑇TN𝑇 = tr 2 G 𝑇TN𝑇𝐐 tr G𝑇TG𝑇 tr N𝑇TN𝑇 .
Dengan demikian, untuk mendapatkan ukuran kesesuaian analisis korespondensi diperlukan ketiga tahapan dalam analisis Procrustes yaitu translasi, rotasi dan dilasi. Contoh Aplikasi Analisis Korespondensi
Data yang digunakan untuk contoh pertama aplikasi analisis korespondensi adalah data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan yang bersumber pada Greenacre (1984). Kategori perokok dari hasil pengamatan dibedakan menjadi empat kategori, yaitu kategori tidak merokok, perokok ringan yang merokok 1 s.d 10 batang perhari, perokok sedang yang merokok 11 s.d 20 batang perhari dan perokok berat yang merokok lebih dari 20 batang perhari. Untuk kelompok pegawai, dibedakan menjadi lima yaitu manager senior, manager yunior, pegawai senior, pegawai yunior dan sekretaris. Banyaknya sampel yang diamati adalah 193 orang (Tabel 3).
Tabel 3 Banyaknya perokok dengan kelompok pegawai dari beberapa perusahaan
Kelompok Pegawai
Kategori Perokok
TIDAK RINGAN SEDANG BERAT Manager Senior (1) 4 2 3 2 Manager Yunior (2) 4 3 7 4 Pegawai Senior (3) 25 10 12 4 Pegawai Yunior (4) 18 24 33 13 Sekretaris (5) 10 6 7 2 (55) 9
Gambar 1 Plot analisis korespondensi data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan
Berdasarkan plot analisis korespondensi (Gambar 1) terlihat bahwa masing-masing kelompok pegawai memiliki letak yang relatif berjauhan, hal ini memberikan keterangan bahwa masing-masing kelompok tidak memiliki kemiripan dalam mengkonsumsi jumlah rokok.
Perhitungan analisis korespondensi menghasilkan total inersia sebesar 0.08519. Dua dimensi pertama mampu menerangkan 99.5% dari total inersia (Lampiran 1). Kontribusi baris yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh pegawai senior sebesar 51.2%. Sementara untuk sumbu utama kedua diberikan oleh manager yunior sebesar 55.1% (Lampiran 1). Kontribusi kolom yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh kategori tidak pernah merokok sebesar 65.4% dan untuk sumbu utama kedua diberikan oleh kategori perokok berat sebesar 50.6% (Lampiran 1).
Nilai kontribusi relatif baris kelompok manager yunior, pegawai senior, pegawai yunior, dan staf sekretaris lebih besar diterangkan oleh sumbu utama pertama, sementara kelompok manager senior lebih besar diterangkan oleh sumbu utama kedua. Kontribusi relatif kolom untuk kategori tidak merokok, perokok sedang dan perokok berat lebih besar diterangkan oleh sumbu utama pertama dan perokok ringan oleh sumbu utama kedua.
Ukuran kesesuaian untuk data kategori perokok dengan kelompok pekerjaan dari beberapa perusahaan yang dihitung melalui analisis Procrustes masing-masing untuk
profil baris dan kolom sebesar 98.64% dan 99.53% (Lampiran 1).
Contoh data kedua aplikasi analisis korespondensi adalah data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama yang diolah dari Hasil Survei Angkatan Kerja Nasional (Sakernas) Agustus 2011 yang dilakukan oleh Badan Pusat Statistik.
Kategori lapangan pekerjaan utama yaitu (A) pertanian-kehutanan-perburuan-perikanan, (B) pertambangan-penggalian, (C) industri pengolahan, (D) listrik-gas-air, (E) bangunan, (F) perdagangan besar-eceran-rumah makan-hotel, (G) angkutan-pergudangan-komunikasi, (H) keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan, dan (I) bangunan-tanah-jasa kemasyarakatan-sosial-perorangan. Untuk kelompok provinsi dibedakan menjadi (1) Aceh, (2) Sumatera Utara, (3) Sumatera Barat, (4) Riau, (5) Kepulauan Riau, (6) Jambi, (7) Sumatera Selatan, (8) Kepulauan Bangka Belitung, (9) Bengkulu, (10) Lampung, (11) DKI Jakarta, (12) Jawa Barat, (13) Banten, (14) Jawa Tengah, (15) DI Yogyakarta, (16) Jawa Timur, (17) Bali, (18) Nusa Tenggara Barat, (19) Nusa Tenggara Timur, (20) Kalimantan Barat, (21) Kalimantan Tengah, (22) Kalimantan Selatan, (23) Kalimantan Timur, (24) Sulawesi Utara, (25) Gorontalo, (26) Sulawesi Tengah, (27) Sulawesi Selatan, (28) Sulawesi Barat, (29) Sulawesi Tenggara, (30) Maluku, (31) Maluku Utara, (32) Papua dan (33) Papua Barat. Banyaknya sampel yang diamati adalah 109.670.399 orang (Tabel 5).
Tabel 5 Penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama pada 2011
No Provinsi Lapangan Pekerjaan Utama Total
A B C D E F G H I 1 Aceh 898225 11739 72509 3966 113934 299183 69173 25040 358704 1852473 2 Sumatera Utara 2595244 30288 483988 11390 332780 1208842 246883 118250 884449 5912114 3 Sumatera Barat 813699 29824 153130 9124 127991 441786 106972 40489 347710 2070725 4 Riau 1086037 37659 145753 10151 124939 490910 95364 56332 377035 2424180 5 Kepulauan Riau 97757 15952 195368 4551 59755 193860 48580 26728 139273 781824 6 Jambi 770848 21517 48786 4525 63098 231221 57533 22822 214648 1434998 7 Sumatera Selatan 2029448 42225 168171 5949 124580 558401 129687 61203 433440 3553104 8 Kep. Bangka Belitung 152884 148549 32186 1435 26817 111897 13214 11209 91443 589634 9 Bengkulu 456467 9480 25323 2828 43567 161061 26210 14795 133988 873719 10 Lampung 1715268 27239 358572 3636 162881 605747 129625 40446 438887 3482301 11 DKI Jakarta 30404 15284 690816 15894 163033 1642120 393284 440825 1196758 4588418 12 Jawa Barat 3675713 131781 3571915 35078 1194823 4554503 1096994 494960 2699014 17454781 13 Banten 630122 62908 1140427 18050 231911 1118385 295786 201536 830535 4529660 14 Jawa Tengah 5376452 79440 3046724 29152 1097380 3402091 563144 264681 2057071 15916135 15 DI Yogyakarta 431070 12464 266768 4247 133128 480136 68200 50063 352519 1798595 16 Jawa Timur 7520067 132588 2665473 24399 1158525 3908294 709844 362314 2458836 18940340 17 Bali 556615 12635 290132 6859 185705 596527 81744 83281 391376 2204874 18 Nusa Tenggara Barat 872088 49587 169577 2508 89284 370239 85578 29560 293819 1962240 19 Nusa Tenggara Timur 1360265 23627 124697 2420 59405 147439 87407 20810 270189 2096259 20 Kalimantan Barat 1294481 78646 89493 4409 97395 277324 51545 21002 232277 2146572 21 Kalimantan Tengah 605378 60463 31277 3712 52107 157741 29409 14373 151241 1105701 22 Kalimantan Selatan 756416 74277 117126 4317 94961 390121 77729 35752 274230 1824929 23 Kalimantan Timur 454258 162640 84554 7063 85327 364266 76774 48236 307885 1591003 24 Sulawesi Utara 321121 24806 65984 4653 82431 196182 73065 22856 199622 990720 25 Gorontalo 159123 15020 44015 175 28642 65851 34590 6401 91393 445210 26 Sulawesi Tengah 654739 26254 65750 1812 57492 190410 44314 15792 204436 1260999 27 Sulawesi Selatan 1469245 29038 223246 7831 178717 654516 181214 55828 575863 3375498 28 Sulawesi Barat 315762 5629 30973 1236 20758 72203 14685 4508 70294 536048 29 Sulawesi Tenggara 467200 38159 51782 1901 54277 169917 56418 11538 175356 1026548 30 Maluku 321494 5947 45338 2425 23356 92986 36882 7928 113756 650112 31 Maluku Utara 241341 7605 10763 809 18221 55287 27740 2929 73175 437870 32 Papua 1036520 33174 19885 2910 36358 130766 52225 16483 147906 1476227 33 Papua Barat 163164 8932 11580 221 16233 56325 17010 4392 58731 336588 Total 39328915 1465376 14542081 239636 6339811 23396537 5078822 2633362 16645859 109670399 11
12
Hasil plot analisis korespondensi dapat dilihat pada gambar 2.
Gambar 2 Plot analisis korespondensi data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama Berdasarkan plot analisis korespondensi
(Gambar 2) diketahui bahwa penduduk di provinsi 32, 19 dan 20 memiliki posisi yang relatif berdekatan, hal ini memberikan keterangan bahwa penduduk di provinsi tersebut memiliki kemiripan dalam menentukan lapangan pekerjaan utama yaitu di bidang pertanian-kehutanan-perburuan-perikanan. Penduduk di provinsi 5, 11 dan 13 memiliki karakteristik yang sama dalam menentukan lapangan pekerjaan utama yaitu di bidang keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan, hal ini terlihat dari posisi yang relatif berdekatan. Penduduk di provinsi 8 dan 23 memiliki karakteristik yang berbeda dengan penduduk di provinsi lainnya dalam menentukan bidang pekerjaan utama yaitu di bidang pertambangan-penggalian, hal ini terlihat dari posisi provinsi yang terletak berjauhan dengan provinsi lainnya.
Perhitungan analisis korespondensi menghasilkan inersia sebesar 0.16876. Dua dimensi pertama mampu menerangkan 85.80% dari total inersia (Lampiran 2). Kontribusi baris yang besar dalam pembentukan sumbu utama pertama diberikan oleh provinsi 11 sebesar 22.6 % dan untuk sumbu utama kedua diberikan oleh provinsi 8 sebesar 53.7 % (Lampiran 2). Kontribusi kolom yang paling besar dalam pembentukan sumbu utama pertama diberikan oleh lapangan pekerjaan utama di bidang
pertanian-kehutanan-perburuan-perikanan (A) sebesar 55.1 % dan untuk sumbu utama kedua diberikan oleh lapangan pekerjaan utama di bidang pertambangan-penggalian (B) sebesar 86 % (Lampiran 2).
Dari hasil perhitungan, nilai kontribusi relatif baris untuk provinsi 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 17, 18, 19, 20, 21, 26, 27, 28, 29, 30, 31, 32 dan 33 lebih besar diterangkan oleh sumbu utama pertama, sementara provinsi 8, 14, 16, 22, 23, 24 dan 25 lebih besar diterangkan oleh sumbu utama kedua. Pada hasil perhitungan kontribusi relatif kolom, kategori lapangan pekerjaan utama di bidang pertanian-kehutanan-perburuan-perikanan (A), industri pengolahan (C), bangunan (E), perdagangan besar-eceran-rumah makan-hotel (F), angkutan-pergudangan-komunikasi (G), keuangan-asuransi-usaha persewaan bangunan-tanah-jasa perusahaan (H) dan bangunan-tanah-jasa kemasyarakatan-sosial-perorangan (I) lebih besar diterangkan oleh sumbu utama pertama dan lapangan pekerjaan utama di bidang pertambangan-penggalian (B) dan listrik-gas-air (D) oleh sumbu utama kedua.
Ukuran kesesuaian untuk data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama yang dihitung melalui analisis Procrustes untuk profil baris dan kolom masing-masing sebesar 91.83% dan 88.25% (Lampiran 2).
13
SIMPULAN
Dalam analisis korespondensi, untukmendapatkan ukuran kesesuaian bagi pendekatan matriks data F dan G untuk profil baris dan kolom dengan menggunakan analisis Procrustes, ketiga transformasi yaitu translasi, rotasi dan dilasi perlu dilakukan. Ukuran kesesuaian analisis korespondensi melalui analisis Procrustes diterapkan pada dua contoh data. Pertama yaitu data hasil pengamatan kategori perokok dengan kelompok pegawai dari beberapa perusahaan yang bersumber
pada Greenacre (1984) yang menghasilkan ukuran kesesuaian melalui analisis Procrustes untuk setiap matriks profil baris dan kolom sebesar 98.64% dan 99.53%. Kedua yaitu data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama menghasilkan ukuran kesesuaian melalui analisis Procrustes untuk setiap matriks profil baris dan kolom sebesar 91.83% dan 88.25%.
DAFTAR PUSTAKA
Abdi, H. 2007. Singular Value Decomposition(SVD) and Generalized Singular Value Decomposition (GSVD). In N.J. Salkind (Ed.): Encyclopedia of Measurement and
Statistics. Thousand Oaks (CA): Sage.
Abdi H, Williams LJ. 2010. Correspondence Analysis. In Neil Salkind (Ed.):
Encyclopedia of Research Design.
Thousand Oaks (CA): Sage.
[BPS] Badan Pusat Statistik. 2012. Statistik Indonesia 2012. Jakarta: BPS. Bakhtiar T. 1995. Tinjauan terhadap Urutan
Pengerjaan Transformasi Geometris pada Analisis Procrustes untuk Mencari Norma Kuadrat Perbedaan Minimum [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Bakhtiar T, Siswadi. 2011. Orthogonal Procrustes Analysis: Its Transformation Arrangement and Minimal Distance.
International Journal of Applied.
Mathematics and Statistics 20:16 24.
Benzécri JP. (1969). Statistical analysis as a tool to make patterns emerge from data. In Watanabe(Ed.): Methodologies of Pattern
Recognition. New York: Academic Press.
Daniel WW. 1990. Applied Nonparametric
Statistics. 2nd Ed. Boston: PWS-KENT.
Greenacre MJ. 1984. Theory and Applications
of Correspondence Analysis. London:
Academic Press.
Greenacre MJ. 2007. Correspondence
Analysis in Practice. 2nd Ed. London:
Chapman and Hall.
Jolliffe IT. 2002. Principal Component
Analysis. 2nd Ed. Berlin: Springer-Verlag.
Krzanowski WJ. 1990. Principles of
Multivariate Analysis, A User’s
Perspective. New York: Oxford University
Press.
Leon SJ. 2001. Aljabar Linear dan
Aplikasinya. Ed ke-5. Bondan A,
penerjemah; Hardani HW, editor. Jakarta: Erlangga. Terjemahan dari: Linear
Algebra with Applications. 5th Ed.
Sibson R. 1978. Studies in the Robustness of Multidimensional Scaling: Procrustes
Statistics. J. Roy. Statist. Soc. B 40(2): 234–238.
Siswadi, Bakhtiar T, Maharsi R. 2012. Procrustes Analysis and the Goodness-of-fit of Biplots: Some Thoughts and Findings. Applied Mathematical Sciences
6(72): 3579 – 3590.
Siswadi, Suharjo B. 1999. Analisis Eksplorasi
Data Peubah Ganda. Bogor: Fakultas
Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Lampiran 1 Hasil analisis korespondensi untuk datahasil pengamatan kategori perokok dengan kategori pekerjaan Matriks Korespondensi 0.0207 0.0104 0.0155 0.0104 0.0207 0.0155 0.0363 0.0207 𝐏 = 0.1295 0.0518 0.0622 0.0207 0.0933 0.1244 0.1710 0.0674 0.0518 0.0311 0.0363 0.0104 Profil Baris 1 2 3 4
Tidak Ringan Sedang Berat Margin 1 0.364 0.182 0.273 0.182 1.000 2 0.222 0.167 0.389 0.222 1.000 3 0.490 0.196 0.235 0.078 1.000 4 0.205 0.273 0.375 0.148 1.000 5 0.400 0.240 0.280 0.080 1.000 --- --- --- --- Margin 0 .316 0.233 0.321 0.130 Profil Kolom 1 2 3 4 5 Margin Tidak 0.066 0.066 0.410 0.295 0.164 1.000 Ringan 0.044 0.067 0.222 0.533 0.133 1.000 Sedang 0.048 0.113 0.194 0.532 0.113 1.000 Berat 0.080 0.160 0.160 0.520 0.080 1.000 --- --- --- --- --- Margin 0.057 0.093 0.264 0.456 0.130
Dimensi Singular Value Inertia Proportion Cumulative Proportion Explained 1 0.27342 0.07476 0.878 0.878 2 0.10009 0.01002 0.118 0.995 3 0.02034 0.00041 0.005 1.000 --- --- --- Total 0.08519 1.000 1.000 Koordinat Faktor baris
Row Koor 1 Koor 2 Koor 3 Koor 4 1 -0.0658 -0.1937 0.0710 -0.0000 2 0.2590 -0.2433 -0.0337 -0.0000 3 -0.3806 -0.0107 -0.0052 -0.0000 4 0.2330 0.0577 0.0033 -0.0000 5 -0.2011 0.0789 -0.0081 -0.0000 Koordinat Faktor kolom
Column Koor 1 Koor 2 Koor 3 Koor 4 1 Tidak -0.3933 -0.0305 -0.0009 0.0000 2 Rendah 0.0995 0.1411 0.0220 0.0000 3 Sedang 0.1963 0.0074 -0.0257 0.0000 4 Berat 0.2938 -0.1978 0.0262 0.0000
Kontribusi relatif baris
Marginal Dim Total Row Profile 1 2
2 0.093 0.526 0.465 0.991 3 0.264 0.999 0.001 1.000 4 0.456 0.942 0.058 1.000 5 0.130 0.865 0.133 0.999 Kontribusi relatif kolom
Marginal Dim Total Column Profile 1 2
1 Tidak 0.316 0.994 0.006 1.000 2 Rendah 0.233 0.327 0.657 0.984 3 Sedang 0.321 0.982 0.001 0.983 4 Berat 0.130 0.684 0.310 0.995 Kontribusi total baris
Marginal Dim Row Profile 1 2 1 0.057 0.003 0.214 2 0.093 0.084 0.551 3 0.264 0.512 0.003 4 0.456 0.331 0.152 5 0.130 0.070 0.081 --- --- 1.000 1.000 Kontribusi total kolom
Marginal Dim Column Profile 1 2 1 Tidak 0.316 0.654 0.029 2 Rendah 0.233 0.031 0.463 3 Sedang 0.321 0.166 0.002 4 Berat 0.130 0.150 0.506 --- --- 1.000 1.000
Ukuran kesesuaian analisis korespondensi melalui analisis Procrustes untuk data kategori perokok dengan kategori pekerjaan dari beberapa perusahaan disajikan dalam tabel berikut.
Hubungan Peubah Ukuran kesesuaian analisis korespondensi
Ukuran kesesuaian analisis Procrustes Matriks data F dan matriks
pendekatannya (M) 98.64% 98.64%
Matriks data G dan matriks
pendekatannya (N) 99.53% 99.53%
Pada tabel di atas ditunjukkan bahwa pendekatan matriks menggunakan analisis Procrustes memberikan ukuran kesesuaian yang cukup yaitu lebih dari 95% .
Lampiran 2 Hasil analisis korespondensi untuk data penduduk berumur 15 tahun ke atas yang bekerja selama seminggu yang lalu menurut provinsi dan lapangan pekerjaan utama. Matriks Korespondensi 0.0082 0.0001 0.0007 0.0000 0.0010 0.0027 0.0006 0.0002 0.0033 0.0237 0.0003 0.0044 0.0001 0.0030 0.0110 0.0023 0.0011 0.0081 0.0074 0.0003 0.0014 0.0001 0.0012 0.0040 0.0010 0.0004 0.0032 0.0099 0.0003 0.0013 0.0001 0.0011 0.0045 0.0009 0.0005 0.0034 0.0009 0.0001 0.0018 0.0000 0.0005 0.0018 0.0004 0.0002 0.0013 0.0070 0.0002 0.0004 0.0000 0.0006 0.0021 0.0005 0.0002 0.0020 0.0185 0.0004 0.0015 0.0001 0.0011 0.0051 0.0012 0.0006 0.0040 0.0014 0.0014 0.0003 0.0000 0.0002 0.0010 0.0001 0.0001 0.0008 0.0042 0.0001 0.0002 0.0000 0.0004 0.0015 0.0002 0.0001 0.0012 0.0156 0.0002 0.0033 0.0000 0.0015 0.0055 0.0012 0.0004 0.0040 0.0003 0.0001 0.0063 0.0001 0.0015 0.0150 0.0036 0.0040 0.0109 0.0335 0.0012 0.0326 0.0003 0.0109 0.0415 0.0100 0.0045 0.0246 0.0057 0.0006 0.0104 0.0002 0.0021 0.0102 0.0027 0.0018 0.0076 0.0490 0.0007 0.0278 0.0003 0.0100 0.0310 0.0051 0.0024 0.0188 0.0039 0.0001 0.0024 0.0000 0.0012 0.0044 0.0006 0.0005 0.0032 0.0686 0.0012 0.0243 0.0002 0.0106 0.0356 0.0065 0.0033 0.0224 0.0051 0.0001 0.0026 0.0001 0.0017 0.0054 0.0007 0.0008 0.0036 0.0080 0.0005 0.0015 0.0000 0.0008 0.0034 0.0008 0.0003 0.0027 𝐏 = 0.0124 0.0002 0.0011 0.0000 0.0005 0.0013 0.0008 0.0002 0.0025 0.0118 0.0007 0.0008 0.0000 0.0009 0.0025 0.0005 0.0002 0.0021 0.0055 0.0006 0.0003 0.0000 0.0005 0.0014 0.0003 0.0001 0.0014 0.0069 0.0007 0.0011 0.0000 0.0009 0.0036 0.0007 0.0003 0.0025 0.0041 0.0015 0.0008 0.0001 0.0008 0.0033 0.0007 0.0004 0.0028 0.0029 0.0002 0.0006 0.0000 0.0008 0.0018 0.0007 0.0002 0.0018 0.0015 0.0001 0.0004 0.0000 0.0003 0.0006 0.0003 0.0001 0.0008 0.0060 0.0002 0.0006 0.0000 0.0005 0.0017 0.0004 0.0001 0.0019 0.0134 0.0003 0.0020 0.0001 0.0016 0.0060 0.0017 0.0005 0.0053 0.0029 0.0001 0.0003 0.0000 0.0002 0.0007 0.0001 0.0000 0.0006 0.0043 0.0003 0.0005 0.0000 0.0005 0.0015 0.0005 0.0001 0.0016 0.0029 0.0001 0.0004 0.0000 0.0002 0.0008 0.0003 0.0001 0.0010 0.0022 0.0001 0.0001 0.0000 0.0002 0.0005 0.0003 0.0000 0.0007 0.0095 0.0003 0.0002 0.0000 0.0003 0.0012 0.0005 0.0002 0.0013 0.0015 0.0001 0.0001 0.0000 0.0001 0.0005 0.0002 0.0000 0.0005