• Tidak ada hasil yang ditemukan

PENERAPAN METODE MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST.

N/A
N/A
Protected

Academic year: 2017

Membagikan "PENERAPAN METODE MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST."

Copied!
24
0
0

Teks penuh

(1)

1 BAB I PENDAHULUAN

1.1. Latar Belakang

Principal Component Analysis (PCA) atau analisis komponen utama

merupakan salah satu analisis multivariat yang digunakan untuk mereduksi dimensi data dari yang berukuran besar dan saling berkorelasi menjadi dimensi yang lebih kecil dan tidak saling berkorelasi. Namun walaupun dimensi data menjadi lebih kecil, kita tidak akan kehilangan banyak informasi karena variasi data tetap dipertahankan minimal 80% (Johnson dan Wichern, 1992: 359).

Analisis komponen utama dilakukan untuk memperoleh komponen-komponen utama yang dapat menjelaskan sebagian besar variasi data. Komponen pertama memiliki persentase terbesar daripada komponen-komponen lainnya dan akan menjelaskan variasi terbesar data, komponen utama kedua memiliki persentase terbesar kedua dari variasi data, dan seterusnya.

(2)

klasik sangat rentan terhadap kehadiran pencilan karena didasarkan pada matriks varians kovarians yang juga sangat sensitif terhadap keberadaan data pencilan, terutama jika data mengandung pencilan yang ekstrim (Suryana, 1998).

Pendeteksian pencilan merupakan langkah yang sangat penting dalam suatu analisis data, karena pencilan dapat mempengaruhi keseimbangan data. Mendeteksi pencilan pada sampel data univariat dapat dilakukan melalui gambar atau uji statistik sederhana. Pada sampel bivariat, pendeteksian pencilan sudah mulai sulit dan uji statistik yang digunakan akan lebih rumit. Hal ini menjadi lebih sulit lagi jika sampel data yang digunakan berdimensi tinggi atau multivariat. Untuk mengatasi pencilan ini dibutuhkan metode penaksir robust yang tangguh terhadap pencilan sehingga analisis komponen utama robust merupakan metode komponen utama yang tidak lagi dipengaruhi pencilan.

Menurut Jackson (1991: 365), pada kasus analisis komponen utama terdapat dua cara yang sering digunakan para peneliti untuk memperoleh estimasi robust, pertama dengan menghasilkan estimasi robust pada matriks korelasi atau varians kovarians yang digunakan pada analisis komponen utama. Setelah itu, analisis komponen utama klasik dapat dilakukan. Kedua dengan cara menghasilkan estimasi robust pada akar dan vektor eigennya, yang beberapa hasilnya dapat digunakan untuk memperoleh estimasi robust pada matriks korelasi atau varians kovarians.

(3)

3

penaksir robust. MVE merupakan penaksir robust dengan high breakdown pertama pada lokasi dan scatter multivariat yang sering digunakan. MVE terkenal karena kepekaannya terhadap pencilan yang membuatnya dapat diandalkan untuk mendeteksi pencilan. Metode ini sangat berguna dalam mendeteksi pencilan pada data multivariat, karena memenuhi jumlah batas maksimum pencilan yaitu 50%.

Di Indonesia masalah ibu hamil dan kesehatan bayi baru lahir masih merupakan masalah kesehatan masyarakat yang perlu memperoleh perhatian khusus karena masih banyak kasus kematian bayi yang baru lahir. Ibu hamil yang menderita status gizi kurang mempunyai resiko melahirkan bayi dengan kematian saat persalinan, pendarahan, paska persalinan yang sulit karena lemah dan mudah mengalami gangguan kesehatan kesehatan ibu ketika hamil. Oleh karena itu, dilakukan pengamatan terhadap status gizi ibu hamil dan keadaan bayi saat dilahirkan. Pencilan yang terdapat di dalam data tersebut mungkin saja dapat mempengaruhi variasi data.

Berdasarkan penjelasan tersebut, penulis tertarik dengan konsep yang diperkenalkan oleh Rousseeuw dan diterapkan pada data yang penulis peroleh, sehingga tugas akhir ini diberi judul PENERAPAN METODE MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang telah penulis kemukakan, rumusan masalah yang akan dikaji dalam tugas akhir ini adalah:

(4)

2. Bagaimana cara menangani pencilan menggunakan analisis komponen utama robust?

3. Bagaimana penerapan analisis komponen utama robust dengan pendeteksian pencilan menggunakan metode minimum volume ellipsoid pada data Bayi Baru Lahir di Puskesmas Mergangsan, Yogyakarta untuk memperoleh sub ruang yang optimal?

4. Bagaimana keuntungan menggunakan Weighted PCA? 1.3. Tujuan penulisan

Berdasarkan rumusan masalah yang telah diuraikan, tujuan penulisan tugas akhir ini adalah untuk:

1. Mengetahui cara mendeteksi pencilan pada analisis komponen utama menggunakan metode minimum volume ellipsoid.

2. Mengetahui cara menangani pencilan menggunakan analisis komponen utama robust.

3. Menerapkan analisis komponen utama robust dengan pendeteksian pencilan menggunakan metode minimum volume ellipsoid pada data Bayi Baru Lahir di Puskesmas Mergangsan, Yogyakarta untuk memperoleh sub ruang yang optimal.

4. Bagaimana keuntungan menggunakan Weighted PCA? 1.4. Manfaat Penulisan

1. Manfaat Teoritis

(5)

5

2. Manfaat Praktis

Dapat menerapkan dan mengembangkan metode-metode robust pada data yang mengandung pencilan baik pada analisis komponen utama maupun analisis multivariat lainnya.

1.5. Batasan Masalah

Dalam tugas akhir ini penulis membatasi masalah pada data yang akan digunakan yaitu data dengan jumlah variabel kurang dari jumlah observasi ( < ). Selain itu, pendeteksian pencilan yang dibandingkan adalah metode MVE dengan pendekatan jarak Mahalanobis.

1.6. Sistematika Penulisan BAB I : PENDAHULUAN

Bab ini membahas latar belakang masalah, rumusan masalah, tujuan masalah, manfaat penulisan, batasan permasalahan, dan sistematika serta metodologi penulisan.

BAB II : LANDASAN TEORI

Bab ini berisi teori-teori pendukung masalah yang dikaji dalam tugas akhir ini dan diambil dari berbagai sumber yang relevan. BAB III : PEMBAHASAN

(6)

BAB IV : STUDI KASUS

Bab ini membahas penerapan materi analisis komponen utama robust menggunakan metode Minimum Volume Ellipsoid pada data Bayi Baru Lahir di Puskesmas Mergangsan, Yogyakarta.

BAB V : KESIMPULAN DAN SARAN

Bab ini menjelaskan tentang kesimpulan dan saran dari keseluruhan materi dan pengolahan data dalam penyusunan tugas akhir ini.

1.7. Metode Penulisan

(7)

25 BAB III

MINIMUM VOLUME ELLIPSOID

PADA ANALISIS KOMPONEN UTAMA ROBUST

Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis komponen utama robust sebagai konsep pendukung serta metode Minimum Volume Ellipsoid sebagai konsep utama pada tugas akhir ini.

3.1. Analisis Komponen Utama Robust

Analisis komponen utama merupakan metode yang baik untuk menerangkan variasi total dari variabel-variabel yang mewakili suatu data melalui sebagian kecil komponen utama. Namun ketika terdapat pencilan dalam data, analisis komponen utama klasik yang diperoleh dapat menyimpang dari hasil yang diharapkan.

3.1.1. Pencilan

Dalam Hampel et al (1986: 1), pencilan didefinisikan sebagai observasi yang terletak sangat jauh dari bagian terbesar data, dan membahayakan beberapa prosedur statistik klasik. Dengan kata lain, pencilan merupakan penyimpangan beberapa observasi dalam suatu data yang terletak cukup jauh dari pusat observasi. Adapun jenis-jenis pencilan yaitu:

(8)

2. Bad leverage merupakan observasi yang tidak berada baik dalam ruang distribusi observasi maupun daerah mayoritas data.

3. Pencilan ortogonal merupakan observasi yang mempunyai jarak yang sangat besar dari daerah mayoritas data sehingga observasi tersebut sudah tidak dapat dilihat dalam ruang distribusinya.

Pendeteksian pencilan sangat penting dilakukan dalam prosedur statistik karena pencilan dapat mempengaruhi informasi yang terdapat di dalam data. Sebagai contoh, suatu data berat badan (dalam kilogram) dari lima orang siswa dalam kelompok A masing-masing 43, 39, 39, 38, dan 41, mean dari data tersebut adalah 40 kg. Jika kemudian ada seorang siswa baru masuk ke dalam kelompok tersebut dan dia memiliki berat badan 100 kg, maka mean berat badan dalam kelompok A menjadi 50 kg. Hasil mean akhir tersebut tidak dapat mewakili informasi sebenarnya, karena mayoritas siswa dalam kelompok A memiliki berat badan di bawah 50 kg. Hal ini menunjukkan bahwa pencilan dapat mempengaruhi keseimbangan data.

(9)

27

3.1.2. Jarak Mahalanobis

Umumnya, metode yang digunakan untuk mendeteksi pencilan dalam analisis multivariat berdasarkan pada jarak Mahalanobis. Bentuk dari persamaan jarak Mahalanobis adalah

= − ∗ / 3.1

dengan adalah vektor observasi, adalah estimasi mean, dan ∗ adalah estimasi dari matriks varians kovarians. Bentuk persamaan ini sama dengan T2 Hotelling untuk vektor observasi individual, perbedaannya yaitu bahwa dan ∗ bukan lagi penaksir standar tetapi merupakan bagian dari proses robust. Kebanyakan teknik yang dipakai pada proses robust merupakan iterasi sehingga dan ∗ dapat berubah pada setiap iterasi. Jarak Mahalanobis ini dipakai untuk memberi indeks yang digunakan untuk menghasilkan dan ∗

= 3.2

=∑! − −

"{ } . 3.3

Definisi 3.2.1 Jarak Mahalanobis (Chen Y, Chen X, Xu, 2008: 222)

Untuk matriks data % &' dengan ( observasi dan ) variabel, jarak Mahalanobis dihitung sebagai

*+ ,, % = . ,− / % 0 % ,− / %

(10)

titik-titik tak beraturan (pencilan) dan ditaksir menggunakan distribusi 1 dengan derajat kebebasan yang sesuai.

3.1.3. Estimasi Robust dengan Penaksir Affine Equivariant

Dalam Rousseeuw dan Leroy (1987: 248), sebagai penaksir lokasi multivariat, persamaan untuk 2 yang merupakan translation equivariant dapat dituliskan sebagai

2 + 4, … , + 4 = 2 , … , 3.4

untuk beberapa vektor 4 berdimensi ). Persamaan tersebut juga disebut sebagai location equivariance. Sedangkan penaksir lokasi multivariat adalah mean

aritmetik

/ % = 7 =1n 9:

;

:

3.5

yang merupakan penaksir least square dalam kerangka ini karena persamaan tersebut akan meminimalkan ∑ ‖9;: :− >‖ dengan ‖… ‖ adalah norm Euclid.

2 disebut affine equivariant jika dan hanya jika

2 ? + 4, … , ? + 4 = 2 , … , ? + 4 3.6

untuk semua vektor 4 dan sebarang matriks nonsingular ?.

Untuk penaksir varians kovarians, affine equivariance berarti bahwa A { ? + 4, … , ? + 4} = ? A { , … , } ? 3.7

dengan ? adalah matriks nonsingular berukuran ) ) dan 4 merupakan vektor. Pada C D, E , maximum likelihood menghasilkan penaksir equivariant

(11)

29

% =1n .9:− > F 0G.9:− > F 0 ;

:

. 3.8

Untuk menghasilkan penaksir tak bias dari E, penyebut pada persamaan % dari ( diganti dengan ( − 1, dan , menjadi vektor sampel ke-i yang dihitung sebagai

/ % = 7,

% =( − 11 . − / % 0 . − / % 0. 3.9

Untuk menggeneralisasi pendekatan maksimum likelihood, digunakan langkah iteratif affine equivariant untuk menaksir D dan E. Definisi solusi simultan dari sistem persamaan

1

( J K − / − / L − / = M

3.10 1

( J − / − / − / − / = .

(12)

3.2. Pendeteksian Pencilan Menggunakan Metode MVE

Penggunaan jarak Mahalanobis klasik pada data multivariat berdasarkan mean sampel dan matriks varians kovarians sampel terkadang tidak efektif ketika berhadapan dengan sekelompok pencilan, dengan kata lain data masih dipengaruhi oleh pencilan. Akibatnya, jika terdapat pencilan dalam data, pencilan tersebut dapat mempengaruhi mean sampel dan matriks varians kovarians sampel sedemikian sehingga pencilan-pencilan tersebut memiliki jarak Mahalanobis yang kecil. Karena itu, pencilan tetap tidak terdeteksi. Hal ini disebut dengan efek masking. Rousseeuw dan Leroy (1987: 256) mengusulkan untuk menghitung jarak

robust berdasarkan penaksir lokasi dan scatter dengan high breakdown point.

3.2.1. MVE dan Resampling

MVE yang diperkenalkan oleh Rousseeuw merupakan penaksir robust dengan high breakdown pertama pada lokasi dan scatter multivariat yang sering digunakan. MVE terkenal karena kepekaannya terhadap pencilan yang membuatnya dapat diandalkan untuk mendeteksi pencilan dan tersedia secara luas, serta implementasi MVE mudah dioperasikan pada algoritma perhitungannya (Rousseeuw dan Van Aelst, 2009: 1).

(13)

31

Definisi 3.2.1.1 (Rousseeuw dan Van Aelst, 2009: 72)

Pasangan /, dengan penaksir lokasi / % dan penaksir scatter % meminimalkan determinan pada kondisi

{U| % − / % − / ≤ X } ≥ ℎ

dengan n adalah jumlah observasi, p adalah jumlah variabel, ℎ = ( + ) + 1 /2 , X adalah konstanta dan X adalah himpunan data observasi. Proses meminimalkan tersebut berada pada setiap / Z ℝ' dan Z [+\ ) . [+\ ) adalah himpunan matriks simetri definit positif berukuran ) ).

Nilai X adalah konstanta tetap yang dipilih untuk menentukan besar dari . Umumnya, X dipilih sedemikian sehingga merupakan penaksir konsisten pada matriks varians kovarians untuk data dari distribusi normal multivariat, dengan kata lain X = ]1',^ dengan _ = ℎ (⁄ . Dari definisi ini, jelas bahwa MVE menaksir pusat dan scatter untuk ℎ lebih memusatkan observasi dalam data. Nilai ℎ dapat dipilih dan menentukan ke-robust-an untuk menghasilkan estimasi MVE.

Persamaan standar untuk nilai ℎ yang sering dipakai dinyatakan dengan

ℎ = ` a'a b ≈ karena ini dapat menghasilkan breakdown point yang maksimal.

Tetapi jika diketahui pecahan pencilan sebagian besar berada pada 0 < _ < , maka dapat digunakan estimator MVE _ dengan ℎ = ( 1 − _ . Untuk mendapatkan hasil yang baik, nilai _ =

e adalah pilihan yang tepat.

(14)

dan tidak terhingga ketika kurang dari separuh dari jumlah data digantikan oleh nilai-nilai sebarang (Rousseeuw dan Van Aelst, 1991: 196).

Definisi 3.2.1.2 (Rousseeuw dan Van Aelst, 2009: 73)

Jarak robust f+ yang berhubungan dengan MVE didefinisikan

f+ = g. ,− / % 0 % ,− / % , U = 1, … , (.

Karena dalam mencari solusi eksak untuk menyelesaikan masalah pada MVE agak sulit, sebagai alternatifnya akan dicari pendekatan MVE menggunakan algoritma resampling yang disebut juga algoritma ) + 1 -subset. Algoritma ini memiliki keuntungan dalam penaksirannya karena masih bersifat affine equivariant dan masih mempertahankan high breakdown point. Dalam tugas

akhir ini digunakan adaptasi dari penaksir ) + 1 -subset untuk MVE dengan high breakdown point. Gambaran utama dari algoritma resampling ini yaitu

dengan merata-ratakan lebih dari beberapa nilai percobaan dibandingkan dengan hanya mengambil salah satu yang optimal.

Penaksir dasar dalam penentuan lokasi dan scatter multivariat adalah affine equivariance, yang berarti bahwa penaksir menunjukkan dengan baik di

bawah transformasi affine pada data. Sehingga, penaksir / dan pada lokasi dan scatter multivariat yang affine equivariant berikut pada beberapa matriks data %

/ %? + Q h = ? / % + h

%? + Q h = ? % ? 3.11

(15)

33

menjadi independen pada skala pengukuran variabel baik dalam translasi maupun rotasi pada data.

3.2.2. Metode MVE

Dari definisi 3.2.1.1 dapat diketahui bahwa perhitungan MVE yang tepat untuk himpunan % akan menuntut pengujian semua i(ℎj elipsoid yang mengandung ℎ observasi pada % untuk mencari elipsoid dengan volume terkecil. Penyelesaian masalah kombinatorial ini mungkin dilakukan jika himpunan data kecil dan berdimensi rendah. Karena jumlah elipsoid umumnya sangat besar, maka untuk menyelesaikan persoalan pada data yang berdimensi tinggi dilakukan pendekatan algoritma.

Patokan algoritma MVE membatasi pencarian elipsoid yang ditentukan oleh subset yang memuat ) + 1 () merupakan jumlah variabel pada matriks % ) observasi yang berbeda diberikan indeks k = U , U , … , U'a ⊂ {1, … , (} , kemudian berdasarkan persamaan 3.10 , hitung mean dan matriks varians kovarians sampel sehingga persamaan menjadi

/가가가가= 7k = 1

) + 1 'a

∈ 〱〱〱〱

3.12

k =1) . − 7k0 . − 7k0

'a

∈k

3.13

(16)

sebuah subsampel singular berukuran ℎ diperoleh). Elipsoid ditentukan oleh /k dan k yang kemudian dinaikkan atau diturunkan hingga mengandung tepat ℎ titik. Sedangkan faktor penskalaan diberikan oleh persamaan +k⁄X dengan X = ]1',^ dan

+k = . − 7k0AkQ. − 7

k0m !: 3.14

dengan ℎ = ( + ) + 1 2⁄ dan ℎ: ( menunjukkan jarak kuadrat terkecil ke-ℎ di antara jarak kuadrat pada ( observasi dalam % . Elipsoid yang dihasilkan dapat memenuhi definisi 3.4.1.1 dan volumenya proporsional dengan menggunakan persamaan

[k = .det.+k k00r,s. 3.15

Ulangi langkah-langkah tersebut sebanyak subsampel J, dan pilih salah satu dengan [k terendah. Kemudian untuk subsampel k yang telah diperoleh, hitung

/ % = /k

dan

% = X (, ) .1',^0 +k k 3.16

dengan X (, ) adalah correction term sampel kecil yang dihitung sebagai `1 + s'b dan 1',^ merupakan median dari distribusi 1 dengan derajat

(17)

35

t = . − / % 0 % . − / % 0 3.17

untuk observasi U, dengan t > 1';^ didefinisikan sebagai pencilan. PCA yang digambarkan dengan pencilan yang didefinisikan melalui MVE memiliki indeks 0 dan data normal diberikan indeks 1.

Dari uraian tersebut, algoritma pendeteksian pencilan pada metode MVE adalah:

1. Bentuk subsampel yang mengandung p+1 observasi disimbolkan dengan indeks k sebanyak i(ℎj.

2. Hitung mean dan matriks varians kovarians koresponden dengan k nonsingular.

3. Hitung +k = . − 7k0 kQ. − 7k0m !:

4. Hitung [k = .det.+k k00r,s untuk menghasilkan elipsoid.

5. Ulangi langkah 1-4 sebanyak subsampel k, kemudian pilih [k dengan nilai terendah.

6. Hitung / % dan % = X (, ) .1';^0 +k k dari [k yang akan digunakan sebagai estimasi mean dan matriks varians kovarians.

(18)

3.3. Weighted PCA

Untuk menangani masalah pencilan, selanjutnya digunakan Weighted Principal Component Analysis (WPCA) yang diperkenalkan oleh Joaquim F.

Pinto da Costa et al (2011) dalam jurnal “A Weighted Principal Component Analysis and Its Application to Gene Expression Data”. PCA klasik tidak cukup

tepat untuk menangani masalah pencilan. Dalam tugas akhir ini akan digunakan koefisien korelasi baru sebagai alternatif korelasi Pearson yang disebut Weighted PCA (WPCA).

Pada PCA klasik, vektor-vektor eigen dari matriks varians kovarians atau matriks korelasi Pearson memuat koefisien-koefisien dari kombinasi linier dari matriks asli yang berkorespondensi dengan variabel-variabel baru (komponen-komponen utama). Seperti telah diketahui koefisien korelasi Pearson sangat sensitif terhadap kehadiran pencilan dan gangguan. Untuk menangani hal ini, akan digunakan rank (rangking) dari setiap observasi, yang dimulai dengan merangking observasi untuk setiap variabel dari satu (rangking tertinggi) sampai ( (rangking terendah).

Misalkan diberikan data bivariat w , x , U = 1,2, … , (, beri nama f untuk rangking variabel 櫆 dan y untuk rangking variabel x . Jika akan

menghitung koefisien korelasi Pearson untuk rangking data, maka yang diperoleh adalah koefisien korelasi rank Spearman (z{), yaitu :

z{ = ∑ f − f| .y摥− y|0

g∑ f − f| ∑ y − y|

3.18

(19)

37

f dan y untuk merepresentasikan rank dari dua variabel yang berkorespondensi dengan observasi (sampel) U . Untuk tujuan komputasi, persamaan dalam mencari koefisien korelasi rank adalah

z = 1 −6 ∑ (}f − y− ( 3.19 .

Definisi 3.2.3.1 (da Costa, 2011: 247)

t + = f − y 2( + 2 − f − y

yang mewakili lebih dari t+ penyesuaian yang lebih penting pada rank-rank atas. Biasanya koefisien korelasi rank didefinisikan seperti koefisien Spearman, sebagai fungsi linier dari jarak antara dua vektor rank.

Da Costa mengusulkan bahwa transformasi mengandung pensubstitusian nilai observasi U pada variabel pertama dengan nilai f~= f 2( + 2 − f , dengan f merupakan rank dari observasi. Begitu pula untuk variabel lainnya, diperoleh dari y~= y 2( + 2 − y . Untuk menghitung rata-ratanya digunakan persamaan berikut

f~

||| = 1( f 2( + 2 − f = ( + 1 4( + 56

y~

||| = 1( y 2( + 2 − y = ( + 1 4( + 56 3.20

Algoritma WPCA yang diperkenalkan da Costa (Rachmatin, 2011) adalah sebagai berikut:

Misalkan diberikan data matriks % dengan ukuran ( ) (( observasi dan ) variabel).

(20)

% = € •‚ U = 1,2, … , ( ƒ = 1,2, … , )

• = €f•‚ dengan f = rank observasi ke-U kolom ke-ƒ. 2. Transformasi • menjadi •~ dengan •~= €f~‚

f•~ = f• 2( + 2 − f• 3. Standardisasi f~ dengan transformasi

f•~= f• ~− f|

•~ \„…√(

dengan f|~= ∑ f

\„… = ‡

1

( .f•~− f•0

4. Jika %~ menyatakan matriks data hasil transformasi langkah ke-3, hitung %~ . % --- "z ".

(21)

52 BAB V

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Berdasarkan tujuan penulisan dan pembahasan kajian materi dan studi kasus pada tugas akhir ini, dapat diperoleh beberapa kesimpulan:

1. Cara mendeteksi pencilan pada analisis komponen utama menggunakan metode minimum volume ellipsoid cukup rumit, sehingga untuk menyelesaikannya dilakukan pendekatan algoritma resampling. Pada algoritma tersebut dibentuk beberapa subsampel dari banyaknya observasi. Kemudian ketika dibandingkan dengan pencilan yang terdeteksi oleh jarak Mahalanobis, metode MVE mendeteksi lebih banyak pencilan. Hal ini dikarenakan efek masking yang masih terkandung pada pendekatan jarak Mahalanobis.

2. Salah satu cara menangani pencilan yang dapat dilakukan pada analisis komponen utama adalah dengan menggunakan Weighted Principal Component Analysis, yaitu dengan merangking observasi dalam setiap

variabel mulai dari 1 (rangking tertinggi) sampai (rangking terendah). 3. Hasil pendeteksian pencilan menggunakan metode minimum volume ellipsoid

(22)

jumlah komponen yang diperoleh PCA klasik dan WPCA dengan pencilan sama, namun nilai proporsi kumulatif pada WPCA dengan pencilan lebih besar daripada proporsi pada PCA klasik dengan pencilan. Sehingga analisis komponen utama menggunakan Weighted PCA dapat digunakan untuk menyelesaikan analisis komponen utama yang mengandung pencilan.

4. Dari hasil penelitian pada tugas akhir ini diperoleh bahwa menggunakan WPCA memiliki keuntungan, yaitu mudah dibuat programnya karena algoritmanya sederhana, dan pencilan yang terdeteksi oleh metode MVE tidak dibuang, tetapi diboboti dengan mempertimbangkan bahwa data pada studi kasus memiliki kekuranggizian pada ibu hamil, sehingga data dengan nilai terkecil diberi bobot terbesar (rank = 1). Karena data pencilan tidak dibuang, maka tidak ada informasi yang hilang.

5.2. Saran

(23)

54

DAFTAR PUSTAKA

Barnett, V. dan Lewis, T. (1994). Outliers in Statistical Data. 3th Edition. John Wiley & Sons Inc.

Croux, C. dan Haesbroeck, G. (1997). An Easy Way to Increase The Finite-Sample Efficiency of The Resampled Minimum Volume Ellipsoid Estimator. Comput Stat Data Anal 25: 125-141.

Croux, C. dan Haesbroeck, G. (2002). A Note on Finite-Sample Efficiencies of Estimator for The Minimum Volume Ellipsoid. J Stat Comput Simulation 72: 585-596.

Damayanti, E. (2009). Hubungan Status Gizi Ibu Hamil dengan Berat Badan dan Panjang Badan Bayi Baru Lahir di Puskesmas Mergangsan, Yogyakarta. Yogyakarta: tidak diterbitkan.

Hampel, FR, et al. (1986). Robust Statistics: The Approach Based on Influence Functions. New York: John Wiley & Sons Inc.

Jackson, JE. (1991). A User’s Guide to Principal Components. Canada: John Wiley & Sons.

Johnson, RA and Wichern, DW. (1992). Applied Multivariate Statistical Analysis. 3th Ed. New Jersey: Prentice Hall, Englewood Cliffs.

Kaiser, HF. (1960). The Application of Electronic Computers to Factor Analysis. Educational and Psychological Measurement 20: 141-151.

Kaiser, HF. (1986). This Week’s Citation Classic. Current Contents 40: 18.

Notiragayu. (2008). “Pembandingan Beberapa Metode Analisis Regresi Komponen Utama Robust”. Seminar Hasil Penelitian dan Pengabdian

kepada Masyarakat: 125-134. Tersedia:

http://proxy.caw2.com/index.php?vit=uggc%3A%2F%2Fjjj.cqsdhrra.pbz%2 Ferterfv-ebohfg [14 April 2010]

Rachmatin, D. (2011). Penerapan Weighted Principal Component Analysis (WPCA) pada Catatan Waktu Pelari. Bandung: belum diterbitkan.

Rencher, AC. (2002). Methods of Multivariate Analysis. 2nd Ed. Canada: John Wiley & Sons.

(24)

Rousseeuw, PJ. dan Van Aelst, S. (2009). Minimum Volume Ellipsoid. WIREs Computational Statistics 1: 71-82. Tersedia: http://onlinelibrary.wiley.com/ store/10.1002/wics.19/asset/19_ftp.pdf?v=1&t=gd2pln4y&s=3c67f2570944 3b7c34f4e7cb4a90a7e2d820246f [14 Agustus 2010].

Rousseeuw, PJ. dan Van Zomeren, BC. (1991). “Robust Distances: Simulations and Cutoff Values”. The IMA Volumes in Mathematics and Its Applications 34: 195-203. Tersedia: ftp://ftp.win.ua.ac.be/pub/preprints/91/Robdis91.pdf [30 September 2010]

Sharma, S. (1996). Applied Multivariate Techniques. Canada: John Wiley & Sons. Somantri, A. dan Muhidin, SA. (2006). Aplikasi Statistika dalam Penelitian.

Bandung: Pustaka Setia.

Suryana. (2008). Robust Principal Component Analysis [Online]. Tersedia:

http://statistikaterapan.wordpress.com/2008/04/17/robust-principal-component-analysis/ [14 April 2010].

Timm, NH. (2002). Applied Multivariate Analysis. New York: Springer.

Referensi

Dokumen terkait

Tujuan penelitian : Penelitianini bertujuan untuk mengetahui bagaimana pengetahuan dan sikap ibu nifas tentang penerapan metode kanguru pada bayi dengan berat badan lahir

Analisis Regresi Robust pada Data Mengandung Pencilan dengan Menggunakan Metode Least Median Square ; Hufron Haditama; 051810101096; 2011; 33 Halaman; Jurusan Matematika

Analisis Regresi Robust pada Data Mengandung Pencilan dengan Menggunakan Metode Least Median Square ; Hufron Haditama; 051810101096; 2011; 33 Halaman; Jurusan Matematika

Pada penelitian ini, setelah matriks kovarian biasa yang digunakan pada RKU diganti dengan matriks kovarian robust (LMS-MCD) memiliki nilai bias dan mean square

Data angka kematian bayi yang memiliki lima variabel bebas telah direduksi menjadi satu komponen utama dengan nilai eigen lebih besar dari satu yaitu 3,778 dengan total

Berdasarkan hasil analisis ragam pada Tabel 2, tidak ada perbedaan senyawa pada komponen pertama untuk kedua metode serta kedua metode memberikan keragaman skor yang sama,

Untuk menganalisis multivariable metode yang digunakan analisis multivariate, yang pada penelitian ini digunakan analisis komponen utama untuk mengelompokkan

Tujian dari tesis ini yaitu; (1) menemukan satuan analisis banr yang mampu memberikan informasi lebih banyak dalam analisis komponen utama, (2) melakukan eksplorasi untuk