• Tidak ada hasil yang ditemukan

Seleksi peubah dengan analisis komponen utama dan procrustes

N/A
N/A
Protected

Academic year: 2017

Membagikan "Seleksi peubah dengan analisis komponen utama dan procrustes"

Copied!
183
0
0

Teks penuh

(1)

SELEKSI PEUBAH DENGAN

ANALISIS KOMPONEN UTAMA DAN PROCRUSTES

ACHMAD MUSLIM

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(2)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa tesis berjudul Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Agustus 2011

(3)

ACHMAD MUSLIM. Variable Selection Using Principal Component and Procrustes Analysis. Supervised by SISWADI and TONIBAKHTIAR.

Principal component analysis (PCA) is a dimension-reducing tool that replaces the variables in a multivariate dataset by a smaller number of derived variables. Dimension reduction is often undertaken to help in interpreting the data set but, as each principal component usually involves all the original variables, interpretation of a PCA can still be difficult. One way to overcome this difficulty is to select a subset of the original variables and use this subset to approximate the data. Procrustes analysis as a measure of similarity, is used to measure the efficiencies of the alternative variable selection methods in extracting representative variables Because of its unavailability in statistical software, a package program, using Mathematica 8.0, is composed for variable selection. There are four variable selection methods, based on PCA and procrustes analysis, which have been described and examined along with different criteria levels for deciding on the number of variables to retain in the analysis. The methods are B2, B4, procrustes analysis in the principal component score, and procrustes analysis method. The result show that variable selection programs B2 as the best variable selection method followed by procrustes analysis method. Moreover, it is found that all of the methods considered give the measure of efficiency of more than 99.04%.

(4)

ACHMAD MUSLIM. Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes. Dibimbing oleh SISWADI dan TONI BAKHTIAR.

Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata melibatkan banyak peubah. Setiap peubah diukur secara individual untuk menelusuri pengaruh antarpeubah. Masalah yang kemudian dihadapi adalah kesulitan untuk menginterpretasikan himpunan data yang besar.

Oleh karena itu diperlukan sebuah metode untuk mengidentifikasi peubah-peubah yang dipandang memiliki kontribusi yang besar pada variasi data sebelum dilakukan analisis hasil penelitian. Pendekatan yang dapat dilakukan adalah mengurangi peubah-peubah yang mungkin tidak memiliki kaitan dengan masalah yang ingin diteliti ataupun dengan mengurangi peubah-peubah yang memberikan kontribusi informasi yang sedikit pada variasi data dengan seleksi peubah.

Analisis komponen utama merupakan salah satu teknik analisis peubah ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data sehingga lebih mudah dalam menginterpretasi hasil yang diperoleh. Peubah-peubah baru yang terbentuk disebut komponen utama (principal components).

Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011). Untuk melihat kesamaan bentuk dan ukuran dari dua konfigurasi maka salah satu konfigurasi dibuat tetap sementara konfigurasi yang lainnya ditransformasi sehingga sesuai dengan konfigurasi pertama.

Data penelitian yang digunakan adalah data yang diperoleh dari Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor (TPB IPB), yang terdiri atas data nilai mutu 14 mata kuliah yang diikuti 3223 mahasiswa TPB IPB tahun akademik 2008/2009 dan 3053 mahasiswa pada tahun akademik 2009/2010 baik pada semester ganjil maupun semester genap. Peubah yang digunakan dalam penelitian ini merupakan mata kuliah di TPB IPB yang terdiri dari Agama (AG), Bahasa Indonesia (ID), Bahasa Inggris (IG), Biologi (BI), Ekonomi Umum (EU), Fisika (FI), Kalkulus (KA), Kimia (KI), Olahraga dan Seni (OS), Pendidikan Kewarganegaraan (KN), Pengantar Ilmu Pertanian (PI), Pengantar Kewirausahaan (PK), Pengantar Matematika (PM), dan Sosiologi Umum (SU).

(5)

Peubah yang bersesuaian dengan hasil analisis procrustes yang memberikan nilai jarak antarkonfigurasi terkecil dalam setiap iterasi dihilangkan. Metode analisis procrustes membandingkan matriks data dengan matriks data yang telah direduksi dengan menghilangkan setiap kolomnya secara berurutan. Untuk mendapatkan dimensi yang sama, ditambahkan sebuah kolom nol. Peubah yang bersesuaian dengan nilai jarak procrustes terkecil dalam setiap iterasi dihilangkan.

Untuk menentukan kesesuaian konfigurasi yang dihasilkan metode-metode seleksi peubah dengan data sebenarnya, dilakukan pengukuran berdasarkan ukuran kesesuaian analisis procrustes. Hasil seleksi yang memiliki nilai ukuran efisiensi terbesar dipandang sebagai hasil seleksi peubah terbaik.

Algoritma implementasi metode-metode seleksi peubah disusun menggunakan software Mathematica versi 8.0. Berkaitan dengan data yang digunakan, nilai didasarkan pada proporsi varians komponen utama dengan menentukan nilai 0 = 0.80 (Jolliffe 1972). Dengan demikian dalam penelitian ini dipilih = 7 dan = 8.

Untuk kemudahan dalam penulisan dalam tabel, metode seleksi peubah dengan analisis procrustes pada skor komponen utama akan disebut dengan APSKU dan metode seleksi peubah dengan analisis procrustes akan disebut dengan AP.

Hasil pengukuran ukuran kesesuaian, 2, hasil seleksi peubah dengan konfigurasi data awal diberikan pada tabel 1. Pada data TPB IPB tahun akademik 2008/2009 metode seleksi peubah yang dipandang paling mewakili data yang sebenarnya adalah metode B2, dengan nilai kesesuaian 99.36% untuk = 7 dan 99.60% untuk = 8. Metode seleksi terbaik kedua adalah metode analisis procrustes pada skor komponen utama dengan = 3 dan B4 dengan nilai kesesuaian 99.27% dan 99.45% berturut-turut.

Tabel 1 Urutan metode seleksi peubah yang mempertahankan peubah berdasarkan ukuran efisiensi

Hasil pengukuran ukuran efisiensi pada data TPB IPB tahun akademik 2009/2010 juga menyatakan metode B2 merupakan metode seleksi terbaik dengan memberikan nilai efisiensi 99.44% dan 99.61% untuk = 7 dan = 8. Metode seleksi kedua adalah metode analisis procrustes dengan nilai efisiensi 99.44% dan

Ukuran Efisiensi

Urutan Metode Seleksi Terbaik

Tahun Akademik 2008/2009 Tahun Akademik 2009-2010

(6)

dapat mewakili data TPB IPB tahun akademik 2008/2009 adalah Biologi, Fisika, Bahasa Indonesia, Bahasa Inggris, Kalkulus, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan, termasuk Ekonomi Umum jika ada 8 mata kuliah yang dipertahankan.

Untuk tahun akademik 2009/2010 mata kuliah yang mewakili data TPB IPB adalah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, Pengantar Matematika, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan, termasuk Bahasa Inggris jika ada 8 mata kuliah yang dipertahankan.

(7)

© Hak Cipta milik IPB, tahun 2011

Hak Cipta dilindungi Undang-Undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan

b. Pengutipan tersebut tidak merugikan kepentingan yang wajar IPB. 2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya

(8)

SELEKSI PEUBAH DENGAN

ANALISIS KOMPONEN UTAMA DAN PROCRUSTES

ACHMAD MUSLIM

Tesis

sebagai salah satu syarat untuk meraih gelar Magister Sains pada

Program Studi Matematika Terapan

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(9)
(10)

Procrustes Nama : Achmad Muslim

NRP : G551090121

Disetujui, Komisi Pembimbing

Dr. Ir. Siswadi, M.Sc. Ketua

Dr. Toni Bakhtiar, M.Sc. Anggota

Diketahui,

Ketua Program Studi Matematika Terapan

Dr. Ir. Endar Hasafah Nugrahani, M.S.

Dekan Sekolah Pascasarjana

Dr. Ir. Dahrul Syah, M.Sc.Agr.

(11)

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia-Nya, sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Februaru 2011 ini ialah Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes.

Penulis menyampaikan ucapan terima kasih dan penghargaan kepada Bapak Dr. Ir. Siswadi, M.Sc. dan Bapak Dr. Toni Bakhtiar, M.Sc. selaku pembimbing yang telah banyak membimbing dan mengarahkan, serta kepada Ibu Dr. Ir. Endar Hasafah Nugrahani, M.S. selaku penguji dan selaku ketua Program Studi Matematika Terapan yang telah banyak memberikan saran dalam tesis ini. Ucapan terima kasih juga penulis sampaikan kepada Kementerian Agama Republik Indonesia yang telah memberikan bantuan berupa beasiswa.

Ucapan terima kasih dan penghargaan juga penulis sampaikan kepada istri, kedua orang tua, dan seluruh keluarga yang selalu memberikan motivasi, semangat, doa dan kasih sayang serta kepada semua pihak yang telah membantu dalam penyelesaian karya ilmiah ini. Semoga karya ilmiah ini bermanfaat dan berguna sebagai bahan informasi dalam kemajuan ilmu pengetahuan.

Bogor, Agustus 2011

(12)

Penulis dilahirkan di Jakarta pada tanggal 25 Juni 1980 dari seorang Ayah H. Nasruddin Ilyas dan Ibu Hj. Sa’amah. Penulis merupakan putra kedua dari tiga bersaudara.

Pendidikan sarjana ditempuh di Universitas Negeri Jakarta dengan memilih Jurusan Pendidikan Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam dan menyelesaikannya pada tahun 2004. Pada tahun 2005 penulis menjadi staf pengajar di Madrasah Aliyah Negeri (MAN) 12 Jakarta.

(13)

DAFTAR TABEL ... xv

DAFTAR GAMBAR ... xvii

DAFTAR LAMPIRAN ... xviii

PENDAHULUAN ... 1

Latar Belakang ... 1

Tujuan Penelitian ... 4

Manfaat Penelitian ... 4

TINJAUAN PUSTAKA... 5

Peubah ... 5

Analisis Peubah Ganda ... 5

Analisis Komponen Utama ... 6

Memilih Komponen Utama ... 10

Seleksi Peubah dalam Analisis Komponen Utama ... 12

Metode B1 ... 12

Metode B2 ... 13

Metode B3 ... 13

Metode B4 ... 14

Masalah Procrustes ... 15

Analisis Procrustes ... 16

Urutan Optimal dalam Analisis Procrustes ... 20

Metode Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama ... 21

Ukuran Efisiensi ... 22

METODE PENELITIAN ... 25

Sumber Data ... 25

Peubah Penelitian ... 25

Objek Penelitian ... 26

Langkah-langkah Penelitian ... 26

Diagram Alir Metode Seleksi Peubah ... 27

HASIL DAN PEMBAHASAN ... 31

Program Seleksi Peubah Menggunakan software Mathematica ... 31

Algoritma Program Analisis ... 31

Algoritma Program Seleksi Peubah ... 32

Eksplorasi Data ... 34

Analisis Hasil ... 46

Seleksi Peubah dengan Analisis Procrustes ... 52

Ukuran Efisiensi ... 56

(14)
(15)

Halaman

1. Peubah penelitian ... 25

2. Konversi huruf mutu ... 26

3. Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan rata-rata nilai mata kuliah ... 34

4. Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan simpangan baku ... 35

5. Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik 2008/2009... 37

6. Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 38

7. Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2008/2009... 40

8. Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan rata-rata nilai mata kuliah ... 40

9. Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2009/2010 berdasarkan simpangan baku ... 41

10. Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik ... 43

11. Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 44

12. Vektor eigen dari matriks kovarians data TPB IPB tahun akademik 2009/2010 ... 45

13. Hasil seleksi peubah dengan metode B2 ... 48

14. Hasil seleksi peubah dengan metode B4 ... 48

15. Hasil seleksi peubah berdasarkan pada analisis komponen utama ... 50

16. Hasil seleksi peubah dengan analisis procrustes pada komponen utama ... 51

17. Urutan peubah yang terseleksi berdasarkan metode seleksi dengan analisis procrustes pada komponen utama ... 52

(16)

19. Perbandingan seleksi peubah dengan analisis procrustes pada komponen utama dengan seleksi peubah dengan analisis procrustes pada data

TPB IPB tahun akademik 2008/2009... 56 20. Perbandingan seleksi peubah berdasarkan analisis procrustes pada

komponen utama dengan seleksi peubah dengan analisis procrustes

pada data TPB IPB tahun akademik 2009/2010 ... 56 21. Hasil seleksi peubah untuk data TPB tahun akademik 2008/2009 ... 57 22. Hasil seleksi peubah untuk data TPB tahun akademik 2009/2010 ... 57 23. Urutan metode seleksi peubah yang mempertahankan peubah

(17)

Halaman

1. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun

akademik 2008/2009 berdasarkan nilai rata-rata ... 36 2. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik

2008/2009 ... 40 3. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun

akademik 2009/2010 berdasarkan nilai rata-rata ... 42 4. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik

(18)

1. Data nilai mahasiswa TPB IPB tahun akademik 2008/2009 ... 69

2. Data nilai mahasiswa TPB IPB tahun akademik 2009/2010 ... 71

3. Diagram alir metode B1 ... 73

4. Diagram alir metode B3 ... 74

5. Analisis komponen utama menggunakan software Mathematica 8.0 pada seleksi peubah ... 75

6. Jarak procrustes menggunakan software Mathematica 8.0 pada seleksi peubah ... 77

7. Implementasi seleksi peubah dengan metode B2 ... 79

8. Implementasi seleksi peubah dengan metode B4 ... 81

9. Implementasi seleksi peubah dengan analisis procrustes pada skor komponen utama ... 83

10. Implementasi seleksi peubah dengan analisis procrustes ... 85

11. Implementasi ukuran efisiensi berdasarkan analisis procrustes ... 87

12. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama tahun akademik 2008/2009, = 2 ... 89

13. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama tahun akademik 2008/2009, = 3 ... 89

14. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama tahun akademik 2009/2010, = 2 ... 90

15. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes pada skor komponen utama tahun akademik 2009/2010, = 3 ... 90

16. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes tahun akademik 2008/2009 ... 91

17. Statistik ( )2 pada metode seleksi peubah dengan analisis procrustes tahun akademik 2009/2010 ... 91

18. Ukuran efisiensi 2 ... 92

(19)
(20)

PENDAHULUAN

Latar Belakang

Dalam proses pengambilan keputusan diperlukan informasi yang mendukung pengambilan keputusan secara tepat berdasarkan data yang ada. Oleh karena itu dibutuhkan cara yang tepat untuk menganalisis data yang tersedia agar diperoleh informasi yang bermanfaat.

Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata melibatkan banyak peubah. Setiap peubah diukur secara individual untuk menelusuri pengaruh antarpeubah. Namun kurangnya informasi pendukung yang dapat menjadi acuan dalam menentukan peubah-peubah yang memiliki pengaruh yang besar berkaitan dengan penelitian yang dilakukan, menyebabkan pengukuran dilakukan dengan sebanyak mungkin peubah dengan harapan tidak ada peubah penting yang tertinggal. Masalah yang kemudian dihadapi adalah kesulitan untuk menginterpretasikan himpunan data yang besar.

Salah satu cara untuk membantu menyelesaikan masalah ini adalah dengan pengurangan dimensi. Teknik pengurangan dimensi yang telah dikenal secara umum adalah analisis komponen utama (Principal Component Analysis). Analisis komponen utama merupakan alat untuk mengurangi dimensi yang menggantikan peubah dalam data peubah ganda dengan sejumlah peubah turunan yang lebih sedikit (Al-Kandari & Jolliffe 2005). Analisis komponen utama dilakukan untuk membantu dalam penginterpretasian data, di mana komponen utama yang diperoleh merupakan kombinasi linear dari semua peubah asli yang memiliki varians terbesar secara berurutan dan tidak berkorelasi dengan komponen utama sebelumnya. Menurut Jolliffe (2002) adalah mungkin untuk mengurangi sejumlah peubah menjadi sejumlah , , komponen utama agar lebih mudah untuk diinterpretasikan, akan tetapi karena setiap komponen utama merupakan kombinasi linear dari semua peubah asli, tidak ada jaminan untuk mendapatkan interpretasi yang sederhana.

(21)

kaitan dengan masalah yang ingin diteliti ataupun dengan mengurangi peubah-peubah yang memberikan kontribusi informasi yang sedikit pada variasi data.

Alasan seleksi peubah untuk merepresentasikan varians total pada keseluruhan data dapat berdasarkan pada pertimbangan bahwa beberapa peubah mungkin sulit ataupun mahal untuk diukur pada studi berikutnya, atau meskipun peubah tersebut biasanya dapat diinterpretasikan, komponen utama yang telah ditentukan dapat menjadi sulit diinterpretasikan jika terlalu banyak peubah yang terlibat.

Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011).

Analisis procrustes menggunakan transformasi linear berupa translasi, rotasi, dan dilasi, dengan salah satu konfigurasi dibuat tetap dan konfigurasi yang lain ditransformasi untuk dibandingkan agar sedekat mungkin dengan konfigurasi yang dibuat tetap. Analisis procrustes mendasarkan pengukurannya pada norma kuadrat perbedaan konfigurasi matriks. Nilai numerik yang dihasilkan dapat digunakan untuk memperkirakan tingkat kesesuaian antarkonfigurasi.

Analisis procrustes pertama kali dikemukakan oleh Hurley & Cattel (1962) untuk menyelesaikan masalah persamaan regresi berganda dengan mengestimasi matriks transformasi yang mengaitkan struktur faktor matriks. Namun demikian Green (1952) telah memberikan ide yang sama pada analisis faktor dengan aproksimasi ortogonal pada struktur oblique. Schönemann (1966) memberikan solusi umum untuk masalah procrustes ortogonal yang memberikan solusi langsung pada masalah kuadrat terkecil dengan menggunakan matriks transformasi yang ortogonal serta dapat diterapkan pada matriks yang memiliki rank tidak penuh. Schönemann & Carroll (1970) menguraikan prosedur dalam penyuaian dua buah matriks berdasarkan pada rotasi, translasi, dan dilasi yang belum diketahui.

(22)

solusi memiliki syarat ortogonalitas pada transformasinya. Ten Berge (1977) memberikan kondisi yang dibutuhkan dalam memaksimalkan penyesuaian rotasi matriks dalam sudut pandang kuadrat terkecil dan memberikan modifikasi pada metode Gower pada analisis procrustes umum. Borg (1978) menguraikan analisis procrustes pada kasus dengan matriks yang memiliki jumlah baris berbeda sedangkan Ten Berge & Knol (1984) menguraikan rotasi procrustes ortogonal untuk memaksimalkan kesesuaian antara dua matriks yang memiliki jumlah kolom yang berbeda dan kemudian memperumum untuk kasus lebih dari dua matriks. Koschat & Swayne (1991) mendeskripsikan dan menganalisis kriteria dan algoritma rotasi pada matriks dengan kolom terboboti. Dijksterhuis & Gower (1991) merangkum masalah procrustes dalam sebuah buku. Perkembangan terakhir diberikan oleh Bakhtiar & Siswadi (2011) yang memaparkan urutan transformasi optimal pada analisis procrustes.

Ide untuk seleksi peubah diawali oleh Beale et al. (1967) yang mengusulkan penghapusan atau pengurangan peubah pada analisis regresi yang tidak memberikan kontribusi secara signifikan. Jolliffe (1972) memaparkan beberapa metode penghapusan peubah berdasarkan pada koefisien korelasi, analisis komponen utama, dan berdasarkan analisis kelompok, yang dapat digunakan untuk menentukan peubah-peubah yang dapat dikeluarkan dari analisis. King & Jackson (1999) mencoba mengaplikasikan metode seleksi peubah berdasarkan analisis komponen utama, dan menyarankan metode B4 sebagai metode seleksi peubah dalam studi ekologi. George (2000) membahas masalah seleksi peubah sebagai kasus khusus dalam masalah seleksi model dalam regresi berganda. Al-Kandari & Jollife (2001) mendeskripsikan beberapa kriteria seleksi peubah berdasarkan pada kovarians terbesar pada komponen utama, dan mengusulkan penggunaan kriteria seleksi peubah yang tidak tunggal. Al-Kandari & Jolliffe (2005) meninjau ulang beberapa metode dalam seleksi peubah dan interpretasi terhadap variasi data.

(23)

telah disediakan IPB. Karena beragamnya input yang dimiliki oleh IPB perlu diadakan standardisasi kualitas yang melibatkan seluruh mahasiswa baru melalui program pendidikan komprehensif ditahap awal melaui program Pendidikan Tingkat Persiapan Bersama (PTPB) yang diasuh oleh Direktorat Pendidikan Tingkat Persiapan Bersama.

Untuk memberikan gambaran mata kuliah-mata kuliah yang memiliki pengaruh terbesar dalam mendeskripsikan standar mutu TPB IPB diperlukan analisis yang mendalam terhadap hasil belajar yang diperoleh mahasiswa TPB IPB dengan menganalisis mata kuliah-mata kuliah dominan dalam menjelaskan variasi data TPB IPB sehingga diperoleh hasil interpretasi yang lebih baik.

Tujuan dan Manfaat Penelitian

Berdasarkan latar belakang masalah, tujuan dari penelitian ini (dalam studi kasus mahasiswa TPB IPB tahun akademik 2008/2009 dan 2009/2010) ialah: 1. Mengkaji dan membandingkan metode seleksi peubah berdasarkan pada

analisis komponen utama dan procrustes.

2. Menyusun program seleksi peubah dengan menggunakan software Mathematica 8.0.

3. Mengaplikasikan program seleksi peubah pada data TPB IPB. Adapun manfaat dari penelitian ini adalah:

1. Menghasilkan program seleksi peubah dengan menggunakan software Mathematica 8.0.

2. Memberikan sebuah cara untuk melakukan pra-analisis dalam sebuah penelitian sebelum melakukan analisis yang sebenarnya agar mendapatkan hasil yang maksimal sesuai dengan penelitian yang dilakukan.

(24)

TINJAUAN PUSTAKA

Peubah

Peubah (variable) adalah beberapa karakteristik yang berbeda dari objek yang satu dengan objek yang lain atau berbeda dari waktu ke waktu (Everitt & Skrondal 2010). Dasar dari analisis peubah ganda adalah kombinasi linear dari peubah-peubah yang diberikan bobot secara empiris. Peubah ditentukan dan dijelaskan oleh peneliti sedangkan bobotnya ditentukan dengan teknik peubah ganda yang sesuai dengan tujuan penelitian. Sejumlah peubah dengan bobotnya dapat dinyatakan secara matematis

= 1 1+ 2 2+ + ,

dengan merupakan peubah yang diamati dan merupakan bobot yang ditentukan dengan teknik peubah ganda.

Analisis peubah ganda

Analisis peubah ganda (multivariate analysis) merupakan istilah umum untuk metode-metode analisis yang penting dalam menganalisis data peubah ganda (Everitt & Skrondal 2010). Dengan demikian analisis data yang melibatkan lebih dari satu peubah secara serempak dapat dipandang sebagai analisis peubah ganda.

Berbagai teknik analisis peubah ganda ada yang merupakan perluasan dari analisis peubah tunggal. Untuk dapat melakukan analisis peubah ganda diperlukan pemahaman konsep pada penelitian berkaitan dengan jenis skala pengukuran.

(25)

Analisis Komponen Utama

Analisis komponen utama merupakan salah satu teknik analisis peubah ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data sehingga lebih mudah dalam menginterpretasi data yang diperoleh.

Analisis komponen utama membentuk peubah baru yang merupakan kombinasi linear dari seluruh peubah asli, yang disebut komponen utama (principal components). Meskipun dibutuhkan komponen untuk menunjukkan keseluruhan variasi data, seringkali variasi ini dapat diwakili oleh komponen utama, dengan (Jollife 2002). Dengan demikian data awal yang mengandung pengukuran dengan peubah dapat direduksi menjadi pengukuran dengan komponen utama.

Secara aljabar, komponen utama merupakan kombinasi linear dari peubah 1, 2, . . . , yang memaksimalkan varians data. Secara geometris, kombinasi linear ini menunjukkan perubahan koordinat yang diperoleh dengan memproyeksikan sistem awal pada 1, 2, . . . , sebagai sumbu koordinat. Sumbu koordinat baru ini menyatakan arah dengan variasi maksimum dan memberikan interpretasi yang lebih sederhana pada struktur kovarians.

Misalkan kombinasi linear 1 dari vektor memiliki varians terbesar, dengan 1 merupakan vektor koefisien 11, 12, , 1 , sehingga

1 = 11 1+ 12 2+ + 1 = 1 =1

.

Kombinasi linear kedua, 2 , tidak berkorelasi dengan 1 . Kombinasi linear ini memiliki varians terbesar kedua, dan seterusnya, sehingga kombinasi linear ke- , , memiliki varians maksimum ke- dan tidak berkorelasi dengan 1 , 2 , , 1 . Dengan demikian terdapat matriks bobot yang tidak diketahui = 1, 2, , .

Misalkan memiliki matriks kovarians dengan elemen merupakan kovarians antara peubah ke-i dan peubah ke-j dari pada saat dan

(26)

merupakan varians peubah ke-j pada saat = . Jika memiliki nilai harapan maka kovarians diberikan oleh

cov = .

Misalkan = maka

= = .

Kovarians diberikan oleh

cov i = E E E T

cov Yi = E E E[ ] T

Var = E [ ]

Var = [ ]

Var = [ ]

Var = [ ]

Var = cov

Var =

Untuk menentukan bentuk komponen utama, pandang kombinasi linear pertama 1 dan vektor 1 yang memaksimumkan var 1 = 1 1. Nilai var 1 dapat dibuat sebesar mungkin dengan memilih nilai 1 yang besar, oleh karena itu dibutuhkan batasan 1 = 1, yaitu jumlah kuadrat elemen 1 sama dengan 1.

Untuk memaksimumkan 1 1 dengan syarat 1 1 = 1, pendekatan standar yang digunakan adalah menggunakan metode pengganda Lagrange. Misalkan fungsi akan dimaksimumkan dengan syarat = . Didefiniskan fungsi Lagrange

, = ,

dengan adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap kedua argumen dan mengaturnya sama dengan nol diperoleh

= = 0

= + = 0.

(2)

(3)

(4)

(27)

Diferensiasi fungsi pada persamaan (5) memberikan kembali syarat awal = . Pada persamaan (4) jika nilai = 0 maka diperoleh masalah optimasi tanpa syarat. Dengan demikian, apabila syarat telah terpenuhi nilai fungsi objektif sama dengan nilai fungsi objektif . Apabila terdapat lebih dari satu syarat, cukup dengan menambahkan pengganda Lagrange yang lain.

Berdasarkan uraian di atas didefinisikan fungsi Lagrange

= 1 1 1 1 1 ,

dengan adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap 1 memberikan

1 1 = 0

atau

1 = 0,

dengan merupakan matriks identitas berukuran × . Dengan demikian adalah nilai eigen dari dan 1 merupakan vektor eigen yang bersesuaian. Untuk menentukan vektor eigen yang memberikan kombinasi linear 1 nilai varians terbesar, kuantitas yang akan dimaksimumkan ialah

1 1 = 1 1 = 1 1 = .

Jadi, harus sebesar mungkin. Dengan demikian, 1 adalah vektor eigen yang bersesuaian dengan nilai eigen terbesar dari , dan var 1 = 1 1 = 1, yang merupakan nilai eigen yang terbesar.

Komponen utama kedua, 2 , memaksimumkan 2 2 dengan syarat 2 2 = 1 dan tidak berkorelasi dengan 1 , atau ekivalen dengan syarat cov 1 , 2 = 0, dengan cov , menyatakan kovarians antara peubah x dan y. Diperoleh

cov 1 , 2 = 1 2 = 2 1 = 2 1 1 = 1 2 1 = 1 1 2 = 0 Didefinisikan kembali fungsi Lagrange

= 2 2 2 2 1 2 1,

dengan dan adalah pengganda Lagrange. Diferensiasi terhadap 2 dan mengaturnya sama dengan nol memberikan

2 2 1 = 0.

(8)

(9) (6)

(7)

(10)

(11)

(28)

Dengan menggandakan persamaan (12) dengan 1 diperoleh

1 2 1 2 1 1 = 0.

Berdasarkan (10) dan (13) memberikan = 0, sehingga dari persamaan (12)

2 2 = 0

atau

2 = 0.

Dengan demikian merupakan nilai eigen dan 2 merupakan vektor eigen yang bersesuaian. Oleh karena = 2 2 maka juga harus sebesar mungkin. Dengan asumsi tidak memiliki nilai eigen yang berulang maka merupakan nilai eigen terbesar kedua dan 2 merupakan vektor eigen yang bersesuaian.

Berdasarkan uraian di atas, dapat ditunjukkan bahwa untuk komponen utama ketiga, keempat sampai dengan ke-p, vektor koefisien 3, 4, , merupakan vektor eigen yang bersesuaian dengan nilai eigen 3, 4, , ketiga, keempat, sampai nilai eigen terkecil berturut-turut. Secara umum, komponen utama ke-k dari adalah dan

var = untuk = 1, 2, , ,

dengan merupakan nilai eigen terbesar ke-k dan adalah vektor eigen yang bersesuaian.

Secara umum, transformasi peubah asal menjadi komponen utama dapat dinyatakan sebagai = , dengan merupakan matriks bobot yang disebut matriks koefisien komponen utama yang terdiri dari vektor eigen . Posisi setiap objek pada sistem koordinat komponen utama yang baru disebut skor yang diberikan oleh

= ,

dengan disebut matriks skor komponen utama.

Total varians yang dijelaskan oleh komponen utama adalah =1 sehingga proporsi dari total varians yang dijelaskan komponen utama pertama ialah

=1 =1

,

dengan = 1, 2, . . . . , p.

(16)

(17) (13)

(14)

(29)

Memilih Komponen Utama

Jolliffe (2002) dan Andrade et al. (2004) memaparkan beberapa aturan dalam menentukan banyaknya komponen utama pertama yang harus dipilih untuk mewakili variasi matriks data .

Persentase Kumulatif Variasi Total

Komponen utama merupakan kombinasi linear dari peubah acak 1, 2, . . . , yang memaksimalkan variasi data secara berurutan, dengan varians komponen utama ke- adalah dan total varians =1 . Dengan demikian persentase variasi yang dijelaskan oleh komponen utama pertama adalah

= 100 =1 =1

,

dengan . Apabila menggunakan matriks korelasi, (18) dapat direduksi menjadi

= 100 =1

.

Pemilihan pada interval 70% hingga 90% akan memberikan aturan penentuan nilai komponen utama yang mempertahankan sebagian besar informasi yang dimiliki .

Ukuran Variasi Komponen Utama

Aturan ini khusus digunakan saat menggunakan matriks korelasi, meskipun dapat diadopsi untuk beberapa matriks kovarians tertentu. Pada aturan ini jika semua elemen independen, maka komponen utama sama dengan peubah awal dan memiliki varians pada mariks korelasi. Dengan demikian komponen utama yang memiliki varians kurang dari 1 atau < 1 dianggap kurang memiliki informasi sehingga dapat dihilangkan.

Metode Cross-Validatory

Eastment & Krzanowski (1982) pada Andrade et al. (2004) memberikan pendekatan dalam penentuan komponen utama dengan menggunakan penguraian nilai singular secara langsung. Misalkan penguraian nilai singular

(18)

(30)

ialah = dan , , , menyatakan elemen dari matriks , , , dan . Jika komponen utama pertama dipandang dapat mewakili variasi data dan komponen dipandang kurang memiliki informasi yang signifikan maka = =1 + dengan merupakan residual noise. Prediktor dari ditentukan dengan formula

= =1

.

Ukuran kesesuaian untuk dapat diperoleh dari prediktor semua elemen dengan menentukan jumlah kuadrat selisih antara elemen observasi dengan elemen prediksi, yaitu

PRESS = 1 2

=1 =1

.

Akan tetapi data seharusnya tidak dipergunakan dalam memprediksi . Untuk mencegah hal tersebut adalah dengan menghapus baris ke-i dari , kemudian mengoreksi kolomnya terhadap rataan dan menyatakan hasilnya sebagai . Demikian pula menghapus kolom ke-j dari , mengoreksi kolomnya terhadap rataannya dan menyatakan hasilnya dengan ( ).Selanjutnya dengan melakukan penguraian nilai singular dua matriks ini menjadi

=

dengan = , = dan = diag 1, 2, , dan ( ) =

dengan = , = dan = diag 1, 2, , 1 . Dari konstruksi ini, maka prediktor dapat dinyatakan sebagai

= =1

.

Perbedaan dengan (20), prediktor (22) tidak menggunakan . Untuk menentukan nilai optimum , PRESS dihitung untuk nilai yang berbeda dari sampai 1 . Eastment & Krzanowski (1982) menyarankan untuk menentukan

(21)

(31)

= PRESS 1 PRESS

PRESS ,

dengan adalah derajat bebas yang dibutuhkan untuk menyesuaikan komponen ke- dan adalah derajat bebas yang tersisa setelah penyesuaian komponen ke- . Nilai = + 2 dan diperoleh dengan pengurangan secara berurutan yang dimulai dari derajat bebas 1 dari matriks yang telah terkoreksi terhadap rataannya, yaitu 1 = 1 dan =

1 + 2 1 .

Nilai menyatakan peningkatan kekuatan prediksi saat penambahan komponen ke-k, dan dibandingkan dengan rataan informasi prediksi pada komponen yang tersisa. Dengan demikian nilai komponen yang signifikan, k, diberikan oleh nilai terbesar dari yang lebih besar dari 1. Notasi PRESS merupakan akronim dari PREdiction Sum of Square.

Seleksi Peubah dalam Analisis Komponen Utama

Jolliffe (1972) menyarankan beberapa metode dalam memilih subset peubah terbaik yang tetap mempertahankan variasi data berdasarkan pada analisis komponen utama.

Metode B1

Metode B1 pertama kali dikembangkan oleh Beale et al. (1967). Metode B1 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung objek dan peubah, dan penentuan nilai-nilai eigen. Jika terdapat

1 nilai eigen yang lebih kecil dari suatu nilai tertentu, 0, maka vektor eigen yang bersesuaian, yaitu komponen utama itu sendiri, dibandingkan secara berurutan, mulai dari komponen yang bersesuaian dengan nilai eigen terkecil pertama dilanjutkan dengan komponen utama yang bersesuaian dengan nilai eigen terkecil kedua dan seterusnya. Satu peubah kemudian dikaitkan dengan setiap 1 komponen utama, yaitu peubah yang memiliki koefisien terbesar pada komponen-komponen yang sedang dibandingkan dan belum dikaitkan dengan komponen-komponen yang dibandingkan sebelumnya. Peubah yang dikaitkan dengan 1 komponen utama tersebut kemudian dihilangkan.

(32)

Setelah satu peubah dihilangkan, proses dilanjutkan dengan melakukan kembali analisis komponen utama untuk matriks data dengan 1 peubah. Jika terdapat 2 nilai eigen yang lebih kecil dari 0, maka sebuah peubah kembali dikaitkan dengan setiap 2 komponen utama yang bersesuaian dengan cara yang sama dengan sebelumnya. Peubah yang dikaitkan ini kemudian dihilangkan.

Analisis komponen utama kembali dilakukan untuk 2 peubah yang tersisa, dan prosedur ini terus dilakukan hingga semua nilai eigen pada analisis komponen terakhir lebih dari 0, sehingga tersisa peubah. Nilai ini akan bergantung pada pemilihan 0.

Metode B1 melakukan analisis komponen utama dalam setiap proses penghilangan peubah. Oleh karena itu metode B1 membutuhkan waktu komputasi yang besar sehingga tidak direkomendasikan.

Metode B2

Metode B2 sama seperti metode B1, akan tetapi hanya menggunakan satu kali analisis komponen utama. Metode B2 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung mengandung objek dan peubah. Jika telah ditentukan bahwa peubah akan dipertahankan maka dipilih koefisien dengan nilai mutlak terbesar untuk setiap ( ) komponen utama terakhir dan dikaitkan dengan peubah yang bersesuaian. Setelah dibandingkan peubah ini kemudian dihilangkan mulai dari komponen utama yang terakhir.

Metode B3

(33)

(24) dalam urutan tersebut dihilangkan. Dengan demikian peubah yang dipilih adalah peubah yang memiliki nilai

2 = +1

yang minimum. Dalam formula ini adalah koefisien dari peubah ke-i pada komponen utama ke-j.

Metode yang secara komputasi serupa dengan B3 ialah menggunakan proporsi varians peubah ke-i yang dijelaskan oleh komponen utama pertama. Proporsi varians peubah ke-i yang dijelaskan oleh komponen utama pertama ialah

2 =1

,

dengan adalah nilai eigen ke-j dan adalah koefisien peubah ke-i pada komponen utama ke-j. Metode ini memilih peubah yang memiliki nilai maksimum dari =1 2, yaitu

1 2

=1

= 2

= +1

minimum, sementara B3 memilih peubah di mana = +1 2 minimum.

Metode B4

Metode B4 membutuhkan satu analisis komponen utama dan penentuan peubah yang akan dipertahankan. Metode B4 dapat dipandang sebagai versi backward B2. Metode B4 diawali dengan melakukan analisis komponen utama pada matriks data yang mengandung mengandung objek dan peubah. Untuk melakukan proses seleksi, dipilih koefisien dengan nilai mutlak terbesar untuk setiap komponen utama pertama dan dibandingkan mulai dari komponen utama pertama secara berurutan seperti halnya pada metode B1 dan metode B2. Dengan demikian, peubah akan dipertahankan dan ( ) peubah dihilangkan.

Pada metode B1 jumlah peubah yang dipertahankan, , ditentukan dengan pemilihan 0, dan pada metode B2, B3 dan B4 nilai dapat dipilih sama dengan banyaknya nilai eigen dari matriks korelasi yang lebih besar dari 0 (yang nilainya lebih besar dari B1). Sebagai alternatif, nilai dapat ditentukan sama dengan (25)

(34)

jumlah komponen utama minimal dimana proporsi variasi yang dijelaskan lebih dari suatu nilai 0, misalnya 0 = 0.80 (Jollife 1972). Krzanowski (1987) menyarankan bahwa dapat dipilih sebarang jumlah peubah dari peubah yang ada dengan perbandingan antara objek dengan peubah adalah 3:1.

Masalah Procrustes

Istilah procrustes berasal dari legenda Yunani kuno, di mana Procrustes merupakan seorang bandit yang beroperasi pada daerah perbukitan Eleusis di sebelah selatan Yunani. Procrustes menawarkan penginapan bagi para pengembara yang bepergian dari Eleusis ke Athena, memberikan makanan dan minuman serta menawarkan tempat tidur untuk beristirahat. Jika tinggi pengembara tersebut melebihi panjang tempat tidur yang disediakan, maka Procrustes memotong kepala dan kaki mereka agar sesuai dengan ukuran tempat tidur. Namun apabila pengembara terlalu pendek, Procrustes meregangkannya agar sesuai dengan tempat tidur sehingga keduanya berujung pada kematian. Procrustes mengalami nasib yang sama di tangan Theseus, penguasa Ionia saat itu (Gower & Dijksterhuis 2004).

Terdapat tiga elemen dalam kisah Procrustes, yaitu pengembara yang tidak beruntung, yang dapat dilabelkan dengan 1, tempat tidur Procrustes, 2, dan perlakuan, . Bentuk paling sederhana dari masalah procrustes adalah mencari matriks yang meminimumkan

1 2

pada 1× 2 , dengan 1 × 1 dan 2 × 2 yang diketahui, dengan menyatakan norma Frobenius matriks. Norma Frobenius matriks dapat dipandang sebagai norma Euclid untuk matriks. Untuk vektor, norma Euclid dikenal sebagai norma-2, 2. Dengan vektor , maka kuadrat panjang Euclidnya ialah

2

2 = 2

=1 .

(27)

(35)

Untuk matriks × , norma Frobenius ialah

2 = 2

=1 =1

= tr ,

di mana adalah matriks transpos dari .

Analisis Procrustes

Menurut Awange et al. (2010) analisis procrustes adalah teknik penyesuaian sebuah konfigurasi dengan konfigurasi yang lain dengan tujuan memperoleh ukuran kesesuaian. Untuk melihat kesamaan bentuk dan ukuran dari dua konfigurasi maka salah satu konfigurasi dibuat tetap sementara konfigurasi yang lainnya ditransformasi sehingga sesuai dengan konfigurasi pertama. Sedangkan dalam Bakhtiar & Siswadi (2011) analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik melalui serangkaian transformasi linear.

Misalkan × adalah konfigurasi titik dalam ruang Euclid berdimensi dengan koordinat diberikan oleh matriks × berikut

= 1 2

dengan adalah vektor baris yang diberikan oleh = 1 , 2, ,

(36)

(31) Diasumsikan pula bahwa salah satu konfigurasi, , dibuat tetap dan konfigurasi yang lain, , akan ditransformasi agar sesuai dengan konfigurasi .

Untuk menentukan jarak antarkonfigurasi, analisis procrustes mendasarkan pengukurannya pada jumlah kuadrat jarak antartitik yang bersesuaian, yang dikenal dengan jarak procrustes, yaitu

, = 2

=1 =1

, = tr .

Secara geometris hal ini dilakukan dengan cara mentranslasi, merotasi dan kemudian mendilasi konfigurasi sedemikian rupa sehingga jumlah kuadrat jarak, , , antara titik-titik konfigurasi dengan titik-titik konfigurasi yang bersesuaian menjadi minimum (Andrade et al. 2004)

Translasi

Translasi dalam analisis procrustes merupakan proses penggeseran semua titik pada konfigurasi dan konfigurasi dengan jarak yang tetap dan arah yang sama sehingga kedua konfigurasi memiliki sentroid yang sama. Proses translasi ini sering dikenal dengan istilah mean-centering.

Definisikan dan sebagai rata-rata kolom ke-j pada konfigurasi dan konfigurasi berturut-turut. Dengan menguraikan (30) diperoleh

, = + 2

Karena bagian kedua pada ruas kanan (31) bernilai nol, diperoleh

(37)

Konfigurasi dan konfigurasi setelah mengalami proses translasi dinyatakan dengan

= ,

= ,

dengan adalah vektor 1 berukuran × 1, dan menyatakan sentroid dari setiap konfigurasi dan yang dinyatakan sebagai

= 1, 2, , , = 1, 2, , ,

dengan = 1 =1 dan = 1

=1 merupakan rataan dari kolom ke-j dari konfigurasi dan berturut-turut serta

= 2

=1

.

Jarak procrustes minimum diperoleh jika sentroid dan saling berhimpit (Bakhtiar & Siswadi 2011). Dengan demikian jarak minimum antara konfigurasi dan setelah dilakukan proses translasi ialah

, = , = 2

=1 =1

.

Rotasi

Rotasi adalah transformasi yang memindahkan seluruh titik dengan sudut yang tetap dengan mempertahankan jarak antartitik terhadap sentroidnya. Pada analisis procrustes rotasi dilakukan terhadap sentroid yang sama dengan cara menggandakan konfigurasi dengan sebuah matriks ortogonal yang meminimumkan jarak antarkonfigurasi.

Misalkan × merupakan matriks ortogonal sehingga = = . Rotasi pada analisis procrustes adalah menentukan matriks sedemikian sehingga

, = 2

minimum, dengan syarat = = . Masalah optimasi ini dikenal dengan masalah procrustes ortogonal (Schönemann 1966).

(38)

Untuk menentukan solusi masalah tersebut berdasarkan (30) dapat ditulis

|| ||2 = tr ( ) ( )

|| 1 2||2 = tr( ) 2tr( ) + tr( )

|| 1 2||2 = tr( ) 2 tr( ) + tr ( )

|| 1 2||2 = tr( ) 2 tr( ) + tr( )

|| 1 2||2 = tr( ) + tr( ) 2 tr( )

|| 1 2||2 = || ||2 + || ||2 2 tr( ).

Dengan demikian masalah minimasi procrustes ortogonal dapat diselesaikan dengan memaksimumkan nilai dari tr dengan menggunakan bantuan penguraian nilai singular bentuk lengkap (Complete Form of Singular Value Decomposition).

Misalkan merupakan hasil dari penguraian nilai singular bentuk lengkap , yaitu = , dengan merupakan matriks diagonal, dan

matriks ortogonal sehingga = = dan = = maka tr = tr

tr 2 1 = tr

tr 2 1 = tr

dengan mendefinisikan = yang merupakan hasil perkalian matriks ortogonal. Dengan demikian = merupakan matriks ortogonal dan berlaku

1 1, sehingga

tr = tr

tr = =1

tr

Jadi, tr akan maksimum jika = = .Dengan demikian =

sehingga

= .

Dari penguraian (39), (42), dan (43) , akan minimum jika tr = tr , dengan dan matriks ortogonal dari penguraian nilai singular bentuk lengkap sehingga jarak optimal setelah dilakukan proses rotasi ialah

, = tr + tr 2 tr .

(39) (40)

(43) (41)

(42)

(39)

Dilasi

Dilasi adalah pembesaran atau pengecilan jarak setiap titik dalam konfigurasi terhadap sentroid. Dilasi dalam analisis procrustes adalah menggandakan matriks dengan sebuah skalar .

Misalkan , dilasi dalam analisis procrustes adalah menentukan skalar sedemikian sehingga

, = 2

minimum.

Untuk menentukan solusi masalah tersebut dapat ditulis

2 = tr

2 = tr( 2 ) 2tr ( ) + tr ( )

2 = 2 tr 2 tr + tr ,

yang dapat dipandang sebagai fungsi kuadratik dalam , sehingga untuk meminimumkan , dapat dipilih sebagai berikut:

=tr

tr( ) .

Dengan menyubstitusi nilai pada persamaan (46) ke persamaan (45) diperoleh jarak procrustes setelah dilakukan proses dilasi

, = 2 tr 2 tr + tr

Urutan Optimal dalam Analisis Procrutes

Bakhtiar & Siswadi (2011) telah menunjukkan urutan optimal transformasi linear dalam analisis procrustes, yaitu translasi, rotasi dan dilasi. Pada bagian ini akan diulas kembali jarak procrustes berdasarkan urutan translasi, rotasi dan dilasi dengan mendefinisikan sebagai jarak procrustes berdasarkan pada translasi, rotasi dan dilatasi. Pada bagian selanjutnya akan dinotasikan sebagai 2.

(45)

(40)

Jarak procrustes setelah dilakukan proses translasi berdasarkan (38) adalah

, = tr + tr 2 tr .

Hasil konfigurasi oleh rotasi diperoleh dengan menggandakan dengan matriks ortogonal sedemikian sehingga

, = , .

Dengan memilih = , dengan merupakan hasil dari penguraian nilai singular bentuk lengkap , diperoleh

, = tr + tr 2 tr .

Proses dilasi dilakukan dengan menggandakan dengan skalar sehingga

, = , .

Berdasarkan (46), , dapat diminimumkan dengan memilih =tr

tr( ) . Dengan demikian, diperoleh

, = tr tr

2

tr( ) .

Metode Seleksi Peubah dengan Analisis Procrustes

pada Skor Komponen Utama

Analisis procrustes memiliki aplikasi yang sangat luas, antara lain aplikasi dalam shape analysis (Dryden & Mardia 1998) dan aplikasi pada seleksi peubah. Dijksterhuis et al. (2002) menguraikan seleksi peubah dengan meminimumkan jarak procrustes, Andrade et al. (2004) dan Héberger & Andrade (2004) menggunakan analisis procrustes sebagai metode seleksi peubah dalam bidang kimia dan Baxter et al. (2008) menguraikan seleksi peubah dengan analisis procrustes pada kandungan kimia beberapa jenis keramik.

Misalkan matriks data mengandung peubah telah diukur pada setiap objek. Proses seleksi diawali dengan melakukan analisis komponen utama pada matriks data dan membentuk matriks skor dari komponen utama pertama yang mewakili struktur data dan menempatkannya pada matriks berdimensi × . Matriks ini dijadikan sebagai konfigurasi dasar untuk dibandingkan dengan konfigurasi yang lain.

(48)

(49)

(50)

(41)

Pada proses selanjutnya, setiap kolom pada matriks data dihilangkan secara berurutan dan analisis komponen utama kembali dilakukan pada setiap matriks data yang telah tereduksi. Misalkan menyatakan konfigurasi titik-titik yang dihasilkan dari analisis komponen utama saat kolom ke-j dihilangkan. Matriks yang berdimensi × kemudian dibandingkan dengan konfigurasi menggunakan analisis procrustes sehingga memberikan nilai 2 untuk setiap kolom. Kolom ke-j dari konfigurasi yang memberikan nilai 2 terkecil merupakan peubah yang dianggap memiliki kontribusi yang paling sedikit pada struktur data sehingga dapat dikeluarkan dari analisis.

Setelah satu peubah dihilangkan, konfigurasi menjadi matriks berukuran × 1 . Keseluruhan proses dilakukan kembali untuk menghilangkan satu peubah sehingga tersisa 2 peubah pada konfigurasi awal.

Prosedur ini terus dilakukan sehingga tersisa peubah. Peubah inilah yang dipandang sebagai peubah terbaik yang mewakili keseluruhan struktur peubah dari matriks data awal.

Ukuran Efisiensi

Setelah beberapa metode seleksi peubah diaplikasikan, masalah yang dihadapi adalah menentukan hasil seleksi peubah yang dipandang sebagai hasil seleksi terbaik yang dapat mewakili variasi data asli yang diperoleh dari metode-metode seleksi tersebut. Untuk menentukannya dibutuhkan sebuah ukuran

kedekatan atau ukuran efisiensi yang dapat menunjukkan nilai tertinggi sebagai hasil seleksi peubah terbaik. Al-Kandari & Jolliffe (2001, 2005) dan Westad et al. (2003) memberikan ukuran efisiensi berdasarkan pada persentase total variasi yang dijelaskan oleh komponen utama pertama baru yang berasal dari peubah yang dipertahankan. Ukuran kedua berdasarkan pada total jumlah variasi yang jelaskan oleh subset yang dipertahankan.

(42)

Misalkan adalah matriks data berukuran × yang mengandung peubah yang diukur pada setiap objek. Misalkan adalah matriks skor berukuran × yang merupakan transformasi komponen utama terhadap konfigurasi sebenarnya, , yang dipandang sebagai aproksimasi terbaik berdimensi-k. Misalkan merupakan konfigurasi berukuran × yang mempertahankan peubah, dan merupakan matriks skor yang bersesuaian dengan berukuran × . Jarak procrustes digunakan untuk mengukur

kedekatan antara konfigurasi dan . Untuk mendapatkan dimensi yang sama, dipilih = (King & Jackson 1999).

Ukuran kesesuaian dua konfigurasi menggunakan formula

2 = 1 ( , )

tr × 100%.

(43)
(44)

METODE PENELITIAN

Sumber Data

Data penelitian yang digunakan adalah data yang diperoleh dari Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor (TPB IPB), yang terdiri atas data nilai mutu mata kuliah yang diikuti mahasiswa TPB IPB tahun akademik 2008/2009 dan 2009/2010. Peubah yang diamati ialah 14 mata kuliah dengan pengamatan pada nilai mutu mata kuliah yang diikuti mahasiswa TPB IPB pada semester ganjil dan genap tahun akademik 2008/2009 dan 2009/2010.

Peubah Penelitian

Peubah yang digunakan dalam penelitian ini merupakan mata kuliah selama di TPB IPB yang disajikan pada Tabel 1. Nilai mutu yang digunakan dalam konversi huruf mutu yang berlaku di IPB disajikan pada Tabel 2.

Tabel 1 Peubah penelitian

No. Peubah Kode

1 Agama AG

2 Bahasa Indonesia ID

3 Bahasa Inggris IG

4 Biologi BI

5 Ekonomi Umum EU

6 Fisika FI

7 Kalkulus KA

8 Kimia KI

9 Olahraga dan Seni OS

10 Pendidikan Kewarganegaraan KN 11 Pengantar Ilmu Pertanian PI 12 Pengantar Kewirausahaan PK

13 Pengantar Matematika PM

(45)

Tabel 2 Konversi huruf mutu No Huruf Mutu Nilai Mutu

1 A 4.00

2 B 3.00

3 C 2.00

4 D 1.00

5 E 0.00

Objek Penelitian

Objek penelitian adalah mahasiswa TPB IPB tahun akademik 2008/2009 sebanyak 3223 mahasiswa dan tahun akademik 2009/2010 sebanyak 3053 mahasiswa dengan pengamatan meliputi nilai mutu 14 mata kuliah yang diikuti baik semester ganjil maupun semester genap.

Langkah-Langkah Penelitian

1. Mengkaji seleksi peubah dengan menggunakan analisis komponen utama dan analisis procrustes.

2. Penyusunan program seleksi peubah dengan menggunakan software Mathematica 8.0 berdasarkan diagram alir.

3. Mengaplikasikan program seleksi peubah pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010.

4. Analisis data

(46)

Diagram Alir Metode Seleksi Peubah

Diagram Alir Metode B2

Dipilih koefisien dengan nilai mutlak terbesar untuk setiap ( ) komponen utama terakhir dan dikaitkan dengan peubah yang bersesuaian untuk dihilangkan

Matriks bobot komponen utama

Dipilih komponen utama terakhir untuk dikaitkan dengan peubah yang bersesuaian untuk nantinya dihilangkan

AKU

Tentukan

+1

Matriks data

(47)

Diagram Alir Metode B4

Matriks bobot komponen utama Matriks data

Dipilih komponen utama pertama untuk dikaitkan dengan peubah yang bersesuaian untuk nantinya dipertahankan

Dipilih koefisien dengan nilai mutlak terbesar untuk setiap komponen utama pertama dan dikaitkan dengan peubah yang bersesuaian untuk dipertahankan

AKU

Tentukan

(48)

Matriks Skor Matriks Skor

Diagram Alir Metode Seleksi Peubah dengan Analisis Procrustes pada Skor Komponen Utama

Peubah yang memiliki nilai ( )2 terkecil dihilangkan dan proses kembali diulangi

= 1, 2, ,

Setiap kolom dihilangkan secara berurutan

AKU

Matriks data

AKU

( ) 2

Analisis Procrustes

(49)
(50)

HASIL DAN PEMBAHASAN

Program Seleksi Peubah Menggunakan Software Mathematica 8.0

Untuk mengaplikasikan metode seleksi peubah yang telah dideskripsikan pada tinjauan pustaka pada data TPB IPB tahun akademik 2008/2009 dan 2009/2010, disusun program seleksi peubah menggunakan software Mathematica 8.0. Program seleksi untuk setiap metode disusun berdasarkan kemampuan penulis terhadap software Mathematica dan disesuaikan dengan kebutuhan penyelesaian tesis.

Penyusunan program seleksi peubah dengan menggunakan software Mathematica 8.0 diawali dengan mengkonstruksi program-program analisis dengan menggunakan data simulasi. Program-program analisis yang merupakan program pendukung yaitu program analisis komponen utama, dan program analisis procrustes. Program seleksi peubah menggunakan analisis komponen utama yang disusun adalah metode B2 dan B4, kemudian dilanjutkan dengan penyusunan program seleksi peubah dengan menggunakan analisis procrustes pada komponen utama.

Proses selanjutnya adalah menyusun program untuk menentukan ukuran efisiensi setiap metode yang diaplikasikan pada data TPB IPB tahun akademik 2008/2009 dan tahun akademik 2009/2010. Script program-program analisis dan program seleksi peubah diberikan pada lampiran.

Algoritma Program Analisis

Algoritma Analisis Komponen Utama

1. Misal konfigurasi data berukuran × .

2. Membentuk sentroid setiap kolom konfigurasi data , yaitu = 1 3. Translasi konfigurasi dengan dengan formula = 4. Membentuk matriks kovarians

(51)

Algoritma Analisis Procrustes :

1. Misal dan adalah dua konfigurasi data berukuran × .

2. Menentukan konfigurasi hasil translasi dari dan , yaitu dan

dengan rumus = dan = , di mana = 1

dan = 1 merupakan sentroid kolom dari konfigurasi dan . 3. Menentukan matriks ortogonal = untuk transformasi rotasi, dengan

matriks dan merupakan hasil penguraian nilai singular bentuk lengkap dari menjadi .

4. Menentukan skalar =tr

tr ( ) untuk transformasi dilasi.

5. Menentukan nilai norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan translasi, rotasi dan dilasi, yaitu :

, = tr tr

2

tr( ) .

Algoritma Program Seleksi Peubah

Metode B2

1. Misal konfigurasi data berukuran × .

2. Membentuk sentroid setiap kolom konfigurasi data , yaitu = 1 . 3. Translasi konfigurasi dengan dengan formula T = .

4. Membentuk matriks kovarians .

5. Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks kovarians , dengan persamaan karakreristik = 0.

6. Menentukan , dan memilih komponen utama terakhir.

7. Memilih max , di mana adalah koefisien peubah ke-i pada komponen utama ke-j, dan mengaitkannya dengan peubah yang bersesuaian.

Metode B4

1. Misal konfigurasi data berukuran × .

(52)

4. Membentuk matriks kovarians .

5. Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks kovarians , dengan persamaan karakteristik = 0.

6. Menentukan , dan memilih komponen utama pertama.

7. Memilih max , di mana adalah koefisien peubah ke-i pada komponen utama ke-j, dan mengaitkannya dengan peubah yang bersesuaian.

Metode Analisis Procrustes pada Skor Komponen Utama 1. Misal konfigurasi data berukuran × .

2. Membentuk sentroid setiap kolom konfigurasi data , yaitu = 1 . 3. Translasi konfigurasi dengan dengan formula = .

4. Membentuk matriks kovarians .

5. Menentukan nilai eigen dan vektor eigen yang bersesuaian dari matriks kovarians , dengan persamaan karakteristik = 0

6. Membentuk skor komponen utama, =

7. Menentukan komponen utama yang akan digunakan

8. Menghilangkan setiap kolom secara berurutan, dan membentuk skor komponen utama = ( )

9. Menentukan konfigurasi hasil translasi dan ( ), yaitu T dan dengan

rumus T = dan = , di mana = 1 dan

= 1 merupakan sentroid kolom dari konfigurasi dan .

10. Menentukan matriks ortogonal = untuk transformasi rotasi, dengan matriks dan merupakan hasil penguraian nilai singular bentuk lengkap dari matriks menjadi .

11. Menentukan skalar = tr

tr ( ) untuk transformasi dilasi.

12. Menentukan nilai norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan translasi, rotasi dan dilasi, yaitu :

, = tr tr

2

(53)

Eksplorasi Data

Eksplorasi data diawali dengan menganalisis sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 yang terdiri dari 3223 mahasiswa dengan 14 mata kuliah yang diberikan pada Tabel 3, sedangkan untuk tahun akademik 2009/2010 yang terdiri dari 3053 mahasiswa dengan 14 mata kuliah diberikan pada Tabel 4. Sebaran nilai ini diurutkan berdasarkan nilai rata-rata tertinggi pada setiap mata kuliah, baik untuk tahun akademik 2008/2009 maupun untuk tahun akademik 2009/2010.

Tabel 3 Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan rata-rata nilai mata kuliah

Kode

Peubah Peubah

Rata-rata

Proporsi

A B C D E

PK Pengantar Kewirausahaan 3.88 88.46 11.08 0.25 0.03 0.19

OS Olahraga dan Seni 3.65 66.58 32.73 0.00 0.00 0.68

EU Ekonomi Umum 3.34 57.96 25.63 10.24 4.53 1.64

AG Agama 3.33 35.93 61.40 2.14 0.31 0.22

IG Bahasa Inggris 3.22 42.91 37.42 18.96 0.37 0.34

PI Pengantar Ilmu Pertanian 3.21 46.70 33.01 15.08 4.69 0.53

ID Bahasa Indonesia 3.07 39.84 31.34 25.44 2.76 0.62

SU Sosiologi Umum 2.91 11.79 69.04 18.24 0.59 0.34

KN Pendidikan Kewarganegaraan 2.84 10.77 64.69 23.30 0.71 0.53

FI Fisika 2.30 8.35 31.18 43.31 16.63 0.53

KI Kimia 2.28 10.11 28.36 42.79 16.97 1.77

BI Biologi 2.23 11.48 27.02 37.98 20.38 3.13

PM Pengantar Matematika 2.04 5.03 20.88 51.04 18.86 4.19

KA Kalkulus 1.97 5.49 21.91 42.94 23.74 5.93

(54)

mata kuliah Pengantar Kewirausahaan (PK), Olahraga dan Seni (OS) dan Ekonomi Umum (EU).

Mata kuliah dengan nilai rata-rata terendah adalah mata kuliah Kalkulus (KA), Pengantar Matematika (PM) dan Biologi (BI) yang menunjukkan nilai rata-rata terendah pertama, kedua dan ketiga. Tabel 3 juga memberikan informasi bahwa mata kuliah Kalkulus (KA) memiliki proporsi terbesar mahasiswa yang tidak lulus mata kuliah tersebut.

Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 diberikan pada Tabel 4.

Tabel 4 Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan simpangan baku

Kode

Peubah Peubah Rata-rata Median

Simpangan Baku

BI Biologi 2.23 2 1.00

KA Kalkulus 1.97 2 0.96

EU Ekonomi Umum 3.34 4 0.95

KI Kimia 2.28 2 0.92

ID Bahasa Indonesia 3.07 3 0.90

PI Pengantar Ilmu Pertanian 3.21 3 0.90

OS Olahraga dan Seni 3.65 2 0.87

PM Pengantar Matematika 2.04 2 0.87

FI Fisika 2.30 2 0.86

IG Bahasa Inggris 3.22 3 0.78

KN Pendidikan Kewarganegaraan 2.84 3 0.63

SU Sosiologi Umum 2.91 3 0.59

AG Agama 3.33 3 0.55

PK Pengantar Kewirausahaan 3.88 4 0.37

(55)

Untuk memberikan gambaran perbandingan antarobjek digunakan diagram kotak garis (boxplot), yang diberikan pada Gambar 1.

Gambar 1 Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun akademik 2008/2009 berdasarkan nilai rata-rata

Pada diagram kotak garis tingkat penyebaran atau keragaman data setiap mata kuliah ditunjukkan oleh ukuran panjang kotak pada diagram kotak garis untuk setiap mata kuliah. Gambar 1 memberikan informasi mata kuliah yang memiliki keragaman terbesar yaitu mata kuliah Bahasa Indonesia (ID) dan Kalkulus (KA), sedangkan mata kuliah yang memiliki keragaman relatif kecil adalah Pendidikan Kewirausahaan (PK), Sosiologi Umum (SU) dan Pendidikan Kewarganegaraan (KN).

Diagram kotak garis juga memberikan informasi data pencilan. Pada Gambar 1 diperoleh informasi bahwa setiap mata kuliah memiliki data pencilan kecuali mata kuliah Bahasa Indonesia (ID) dan Kalkulus (KA). Namun demikian, data pencilan tersebut tidak dapat diidentifikasi karena data yang terlalu banyak.

(56)

Kalkulus (KA). Mata kuliah yang memiliki kemiringan pola sebaran positif, yaitu mata kuliah yang memiliki nilai rata-rata lebih besar dari mediannya, ialah mata kuliah Agama (AG), Bahasa Inggris (IG), Pengantar Ilmu Pertanian (PI), Fisika (FI), Kimia (KI) dan Biologi (BI). Mata kuliah Olahraga dan Seni (OS) dan Ekonomi Umum (EU) memiliki kemiringan pola sebaran negatif karena memiliki nilai rata-rata yang lebih kecil dari nilai mediannya.

Untuk menyelidiki hubungan antarpeubah (mata kuliah) digunakan korelasi Pearson yang diberikan pada Tabel 5 untuk menunjukkan ada atau tidaknya hubungan antarpeubah.

Tabel 5 Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik 2008/2009

PK OS EU AG IG PI ID SU KN FI KI BI PM KA

PK 1.000

OS 0.117** 1.000

EU 0.119** 0.104** 1.000

AG 0.113** 0.097** 0.356** 1.000

IG 0.127** 0.157** 0.415** 0.272** 1.000

PI 0.087** 0.119** 0.593** 0.354** 0.446** 1.000

ID 0.108** 0.053* 0.590** 0.396** 0.485** 0.559** 1.000

SU 0.105** 0.163** 0.394** 0.252** 0.389** 0.439** 0.376** 1.000

KN 0.109** 0.189** 0.307** 0.230** 0.337** 0.357** 0.309** 0.346** 1.000

FI 0.073** 0.130** 0.484** 0.257** 0.366** 0.469** 0.418** 0.352** 0.258** 1.000

KI 0.091** 0.147** 0.614** 0.367** 0.482** 0.558** 0.544** 0.382** 0.338** 0.582** 1.000

BI 0.100** 0.091** 0.598** 0.386** 0.483** 0.633** 0.584** 0.455** 0.366** 0.541** 0.662** 1.000

PM 0.058** 0.106** 0.599** 0.300** 0.420** 0.506** 0.497** 0.371** 0.260** 0.595** 0.666** 0.581** 1.000

KA 0.087** 0.156** 0.615** 0.308** 0.419** 0.494** 0.503** 0.345** 0.279** 0.602** 0.682** 0.572** 0.714** 1.000

Keterangan : ** nilai-p 0.01

* 0.01 < nilai-p 0.05

(57)

Dalam proses penginterpretasian data, cara umum yang telah dikenal adalah dengan melakukan analisis komponen utama untuk mereduksi dimensi data. Tabel 6 menampilkan varians setiap komponen utama yang diperoleh dengan melakukan analisis komponen utama pada data TPB IPB tahun akademik 2008/2009 dan persentase total variasi untuk setiap komponen utama.

Tabel 6 Varians komponen utama dan persentase total variasi yang dijelaskan setiap komponen utama pada data TPB IPB tahun akademik 2008/2009.

Komponen Utama

Varians Komponen

Utama

Persentase Varians yang dijelaskan

Individual Kumulatif

1 4.74 53.18 53.18

2 0.65 7.34 60.52

3 0.46 5.16 65.69

4 0.42 4.66 70.35

5 0.37 4.19 74.54

6 0.34 3.80 78.34

7 0.31 3.47 81.81

8 0.29 3.23 85.04

9 0.27 3.01 88.05

10 0.26 2.89 90.94

11 0.24 2.68 93.61

12 0.23 2.54 96.16

13 0.21 2.38 98.54

14 0.13 1.46 100.00

Gambar

Tabel 2  Konversi huruf mutu
Tabel 3 memberikan informasi sebaran nilai mata kuliah mahasiswa TPB
Tabel 4 Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB IPB
Tabel 6  Varians komponen utama dan persentase total variasi yang dijelaskan
+7

Referensi

Dokumen terkait

Metode RPCR merupakan kombinasi antara metode AKU (Analisis Komponen Utama) kekar yang diterapkan pada peubah bebas dengan menggunakan ROBPCA (Robust Principal

Analisis AMMI respon ganda dengan pembobotan komponen utama menghasilkan dua genotipe stabil dari respon produktifitas tanaman, satu genotipe stabil dari respon morfologi

Analisis komponen utama merupakan teknik statistik yang dapat digunakan untuk menjelaskan struktur variansi-kovariansi dari sekumpulan variabel melalui beberapa variabel

Saat menduga parameter regresi terdapat juga kemungkinan adanya pencilan ketika satu atau lebih komponen utama diregresikan dengan peubah respon, sehingga

Analisis komponen utama adalah metode statistika multivariat yang bertujuan untuk mereduksi dimensi data dengan membentuk kombinasi linear– kombinasi linear dari

Analisis AMMI (Additive Main Effect and Multiplicative Interaction) merupakan suatu metode peubah ganda yang digunakan dalam penelitian pemuliaan tanaman untuk

Hasil seleksi melalui analisis komponen utama, dengan menggunakan karakter jumlah biji per buah, berat segar biji per buah dan berat kering perbiji sebagai kriteria

Metodologi yang digunakan adalah dengan menggunakan analisis komponen utama (principal component analysis) pada 5 variabel data tersebut diatas, untuk mereduksi