ANALISIS RAGAM SKOR KOMPONEN UTAMA PADA PERCOBAAN RESPONS-GANDA
Bahriddin Abapihi 1)
1) Jurusan Matematika FMIPA, Universitas Haluoleo, Kendari 93231 Indonesia
ABSTRAK
Analisis Ragam Peubah Ganda (MANOVA) dalam perancangan percobaan multirespons lazim digunakan untuk menguji pengaruh perlakuan secara serempak. Jika faktor-faktor yang dicobakan pengaruhnya nyata (signifikan), maka sulit bagi peneliti untuk mengetahui taraf (level) yang memberikan pengaruh yang optimum dari faktor-faktor yang dicobakan. Apalagi bila faktor yang pengaruhnya nyata adalah faktor interaksi, penentuan taraf yang optimum sangat sulit untuk dilakukan. Tulisan ini mencoba teknik alternatif dengan cara menggunakan skor komponen utama pertama dari analisis komponen utama sebagai satu-satunya peubah respons, sehingga analisis ragam yang digunakan adalah analisis ragam peubah tunggal (ANOVA) dan bukan analisis ragam peubah ganda (MANOVA). Interpretasi hasil analisis ragam dengan skor komponen utama pertama ini sama dengan interpretasi pada analisis ragam satu peubah seperti yang lazim digunakan.
Kata kunci: percobaan multirespons, MANOVA, ANOVA, skor komponen utama ABSTRACT
Multivariate Analysis of Variance (MANOVA) is commonly used in multiresponse experiments to test simultaneously treatment effects on responses. When the effects of treatments, however, are significant, it is difficult for researchers to investigate which level of the treatments giving the optimum effect on the responses, especially if the interaction factor is significant. In this paper, an alternative technique is proposed by using the first score of principal component analysis as the only response variable. Then, univariate analysis of variance (ANOVA) is applied rather than applying multivariate analysis of variance (MANOVA) on the data. Interpretation of the result using first principal component score is simply the same as that using an ordinary ANOVA with one response variable.
Key words: multiresponse experiment, MANOVA, ANOVA, principal component score
Diterima: 10 Desember 2010; Disetujui untuk dipublikasikan: 25 Januari 2011
1. Pendahuluan
dengan analisis ragam peubah ganda (Multivariate Analysis of Variance, MANOVA). Metode ini cukup efektif dalam mendeteksi beda pengaruh taraf perlakuan dari faktor-faktor yang dicobakan pada percobaan dengan respons-ganda (multiresponse experiments) [2], [4]. Akan tetapi metode ini tidak efektif dalam menangani percobaan yang melibatkan pengaruh interaksi dari faktor-faktor yang dicobakan. Jika pun dapat mendeteksi adanya interaksi antar faktor yang dicobakan, metode ini tidak mampu memberi gambaran yang jelas tentang taraf-taraf mana saja dari faktor-faktor yang dicobakan memberikan nilai respons yang optimum. Ketidakmampuan metode MANOVA ini terutama disebabkan sulitnya melakukan plot interaksi faktor terhadap respons-respons secara serempak dalam satu grafik sebagaimana dapat dilakukan pada percobaan dengan respons tunggal. Selain itu, penggunaan MANOVA mensyaratkan peubah-peubah respons yang dianalisis haruslah menyebar normal-ganda, suatu syarat yang sulit dipenuhi dalam praktek [2].
Tulisan ini mengembangkan suatu teknik yang dapat digunakan untuk mengatasi masalah di atas dengan cara mentransformasi respons-ganda menjadi respons-tunggal. Dalam hal ini p peubah respons ditransformasi dengan menggunakan analisis komponen utama (PCA, principal component analysis). Selanjutnya, melalui teknik ini skor komponen utama pertama dipandang sebagai suatu peubah respons yang mewakili peubah respons-ganda. Dengan satu peubah respons inilah metode analisis ragam peubah tunggal (ANOVA) dilakukan, bukan terhadap masing-masing peubah respons, sehingga memudahkan dalam analisis dan interpretasi. Dengan hanya satu pubah, dapat dengan mudah diidentifikasi pada taraf-taraf mana dari faktor-faktor yang dicobakan memberikan pengaruh yang optimum pada respons-ganda secara serempak.
2. Analisis Komponen Utama
Kegunaan utama dari analisis komponen utama adalah mengganti p peubah yang berkorelasi metrik dengan sejumlah r (r < p) peubah tak-berkorelasi yang memuat sebahagian besar informasi dari gugus data asal. Secara aljabar, komponen utama merupakan kombinasi linear dari p peubah acak X1, X2, ..., Xp. Sedangkan secara geometrik kombinasi linear ini mewakili pemilihan sistem koordinat baru yang diperoleh dengan merotasikan sistem asal dengan X1, X2, ..., Xp sebagai sumbu-sumbu koordinat.
Sumbu-sumbu yang baru ini mewakili arah dengan variabilitas terbesar dan memberikan gambaran yang lebih mudah tentang struktur peragamnya [2].
Misalkan vektor acak X’ = [X1, X2, ..., Xp] memiliki matriks peragam Σ dengan akar ciri λ1 ≥ λ2 ≥ ... ≥ λp ≥ 0.
Perhatikan kombinasi-kombinasi linear
Y1 = a1’X = a11X1 + a12X2 + ... + a1pXp
Y2 = a2’X = a21X1 + a22X2 + ... + a2pXp
: :
Yp = ap’X = ap1X1 + ap2X2 + ... + appXp Maka diperoleh
Var (Yi) = ai’Σai i = 1, 2, ..., p Cov (Yi, Yk) = ai’Σak i, k = 1, 2, ..., p
Y1, Y2, ..., Yp merupakan komponen-komponen utama kombinasi linear dari peubah asal X yang tidak saling berkorelasi.
Komponen utama pertama dengan ragam terbesar diperoleh dengan memaksimumkan Var (Y1) = a1’Σa1 dengan kendala a1’a1 = 1. Komponen utama kedua diperoleh dengan memaksimumkan Var (Y2) = a2’Σa2 dengan kendala a2’a2 = 1 dan Cov (Y2, Y1) = 0. Demikian pula untuk komponen utama ke-i diperoleh dengan memaksimumkan Var (Yi) = ai’Σai dengan kendala ai’ai = 1 dan Cov (Yi, Yk) = 0 untuk setiap k < i.
2. Model ANOVA dan MANOVA Dua Faktor dengan Interaksi
Secara umum model ANOVA dan MANOVA memliki kemiripan, hanya berbeda pada banyaknya peubah respons yang digunakan. Dalam tulisan ini hanya akan ditampilkan model untuk ANOVA dan MANOVA dengan dua faktor dan memiliki komponen interaksi.
Model ANOVA dua faktor dengan komponen interaksi dapat dituliskan sebagai berikut:
dengan Σ αi = Σ βj = Σ γij = 0 dan εijk peubah acak normal N(0, σ 2
) yang saling bebas. Pada model ini µ menggambarkan rataan umum, αi pengaruh tetap faktor pertama, βj pengaruh tetap faktor kedua, dan γij sebagai interaksi antara faktor pertama dan faktor kedua [1], [3].
Seperti halnya dengan model ANOVA, model MANOVA dua faktor dengan interaksi dapat dituliskan sebagai berikut:
xijk = µ + αi + βj + γij + εijk
dengan Σ αi = Σ βj = Σ γij = 0. Semua simbol untuk model MANOVA merupakan vektor berukuran p × 1 (p banyaknya peubah respons) dan εijk merupakan vektor acak normal ganda Np(0, Σ) yang saling bebas [1].
3. Hasil dan Pembahasan
Pembahasan untuk masalah di atas didasarkan pada data rekaan yang memiliki tiga peubah respons. Bila pengujian pengaruh dari faktor-faktor yang dicobakan pada masing-masing respons dengan ANOVA biasa semuanya nyata (pengaruh yang signifikan), analisis dengan menggunakan metode MANOVA dan ANOVA satu peubah yang dihasilkan dari analisis komponen utama juga seharusnya berbeda nyata.
Data yang digunakan dalam tulisan ini adalah data rekaan dengan melihat pengaruh dua faktor (faktor A dan faktor B) serta pengaruh interaksi kedua faktor tersebut. Analisis data dilakukan dengan SAS 9.01.
a. Analisis Ragam (ANOVA) Terpisah untuk Setiap Peubah Respons
Hasil analisis data dengan ANOVA secara terpisah untuk setiap peubah respons seperti ditampilkan pada Tabel 1, Tabel 2, dan Tabel 3, menunjukkan bahwa peubah respons pertama yaitu X1 didapatkan faktor A, faktor B dan faktor interaksi A*B semuanya nyata dengan nilai signifikansi yang sama (nilai-p 0.00), kecuali faktor ulangan yang tidak nyata (nilai-p 0.883). Sedangkan analisis ragam pada peubah respons yang kedua (X2) dan peubah respons yang ketiga (X3), dua faktor yaitu faktor B dan interaksi A*B nyata pengaruhnya (dengan nilai-p sama 0.00), dan dua faktor lainnya yaitu faktor A dan ulangan dari kedua respons ini tidak nyata dengan nilai-p berturut-turut untuk faktor A dan ulangan adalah 0.820 dan 0.343 (respons X2) dan 0.262 dan 0.563 (respons X3).
Tabel 1 Analisis Ragam untuk Peubah Respons X1 Sumber Keragaman db JK KT F P A 03 095.692 031.897 027.81 0.000 B 03 361.403 120.468 105.03 0.000 A*B 09 061.213 006.801 005.93 0.000 Ulangan 04 001.332 000.333 000.29 0.883 Galat 60 068.820 001.147 Total 79 588.459
Keterangan: db = derajat bebas, JK = jumlah kuadrat, KT = kuadrat tengah, F = nilai F hitung, dan P = nilai-p
Tabel 2 Analisis Ragam untuk Peubah Respons X2
Sumber Keragaman db JK KT F P A 03 000.741 000.247 000.31 0.820 B 03 457.454 152.485 189.53 0.000 A*B 09 223.451 024.828 030.86 0.000 Ulangan 04 003.696 000.924 001.15 0.343 Galat 60 048.274 000.805 Total 79 733.615
Keterangan: db = derajat bebas, JK = jumlah kuadrat, KT = kuadrat tengah, F = nilai F hitung, dan P = nilai-p
Tabel 3 Analisis Ragam untuk Peubah Respons X3
Sumber Keragaman db JK KT F P A 3 20.78 6.93 1.37 0.262 B 3 4480.19 1493.40 294.38 0.000 A*B 9 2660.86 295.65 58.28 0.000 Ulangan 4 15.19 3.80 0.75 0.563 Galat 60 304.38 5.07 Total 79 7481.41
Keterangan: db = derajat bebas, JK = jumlah kuadrat, KT = kuadrat tengah, F = nilai F hitung, dan P = nilai-p
b. Analisis Ragam Peubah Ganda (MANOVA) secara Serempak Tiga Peubah
Analisis ragam secara serempak terhadap tiga peubah respons seperti dapat dilihat pada Tabel 4, menunjukkan pengaruh yang nyata pada faktor A, faktor B dan interaksi A*B. Hal ini dapat dilihat nilai-p yang semuanya kecil (0.00) dengan kriteria apapun dari empat kriteria pengujian yang ditampilkan yaitu kriteria uji Wilk, Lawley-Hotelling, Pillai dan Roy. Seperti halnya pada analisis ragam untuk setiap satu peubah respons, faktor
ulangan juga menunjukkan hasil yang tidak nyata berdasarkan semua kriteria pengujian dengan nilai-p sebesar 0.758 (Wilk), 0.770 (Lawley-Hotelling), dan 0.746 (Pillai).
c. Penentuan Skor Komponen Utama Pertama
Berdasarkan hasil analisis komponen utama, diperoleh komponen utama pertama
Y1 = PC1 = 0.702 X1 – 0.687 X2 – 0.191 X3. Besar keragaman yang dapat dijelaskan dari komponen utama pertama ini adalah 53.3%, suatu nilai yang cukup dapat diandalkan meski tidak terlalu baik. Skor komponen utama pertama didapatkan dengan memasukkan nilai-nilai peubah respons X1, X2, dan X3 ke dalam rumus Y1 = 0.702 X1 – 0.687 X2 – 0.191 X3.
Tabel 4 Analisis Ragam Serentak (MANOVA) untuk Tiga Peubah Respons X1, X2 dan X3 Faktor A
Kriteria Uji Statistik Uji Aproksimasi F db Nilai-p
Wilk’s 0.38402 7.564 (9, 141) 0.000
Lawley-Hotelling 1.56374 9.846 (9, 170) 0.000
Pillai’s 0.63153 5.333 (9, 180) 0.000
Roy’s 1.53772
Faktor B
Kriteria Uji Statistik Uji Aproksimasi F db Nilai-p
Wilk’s 00.00810 097.893 (9, 141) 0.000
Lawley-Hotelling 28.36531 178.596 (9, 170) 0.000
Pillai’s 01.75416 028.160 (9, 180) 0.000
Roy’s 24.52820
Ulangan
Kriteria Uji Statistik Uji Aproksimasi F db Nilai-p
Wilk’s 0.87014 0.692 (12, 153) 0.758
Lawley-Hotelling 0.14377 0.679 (12, 170) 0.770
Pillai’s 0.13464 0.705 (12, 180) 0.746
Roy’s 0.08167
Interaksi A*B
Kriteria Uji Statistik Uji Aproksimasi F db Nilai-p
Wilk’s 00.03364 13.821 (27, 170) 0.000
Lawley-Hotelling 13.47345 28.278 (27, 170) 0.000
Pillai’s 01.53894 07.022 (27, 180) 0.000
Roy’s 12.39669
Skor atau nilai dari Y1 inilah yang selanjutnya digunakan sebagai peubah respons dalam analisis ragam (ANOVA).
Sumber Keragaman db JK KT F P A 3 2.8984 0.9661 11.35 0.000 B 3 112.8318 37.6106 441.92 0.000 A*B 9 50.9889 5.6654 66.57 0.000 Ulangan 4 0.1556 0.0389 0.46 0.767 Galat 60 5.1064 0.0851 Total 79 171.9812
Keterangan: db = derajat bebas, JK = jumlah kuadrat, KT = kuadrat tengah, F = nilai F hitung, dan P = nilai-p
d. Analisis Ragam Skor Komponen Utama Pertama
Analisis ragam yang dilakukan terhadap satu peubah respons atau komponen utama pertama dari hasil analisis komponen utama seperti yang ditampilkan pada Tabel 5, menunjukkan bahwa selain faktor ulangan dengan nilai-p 0.767, semua faktor yang diuji yaitu faktor A, faktor B, dan faktor interaksi A*B memperlihatkan nilai-p yang nyata (semua nilai-p yang dihasilkan adalah sama 0.00). Hal ini sejalan dengan hasil analisis data dengan MANOVA (ditunjukkan pada Tabel 4) yang menghasilkan kesimpulan yang sama tentang signifikansi faktor-faktor yang diuji.
4. Kesimpulan
Analisis ragam peubah tunggal (ANOVA) terhadap skor kompomem utama pertama yang merupakan kombinasi linear dari peubah-peubah responsnya menunjukkan hasil yang sama baiknya dengan analisis ragam peubah ganda (MANOVA) terhadap peubah-peubah respons secara serempak. ANOVA terhadap skor komponen utama pertama terlihat lebih efisien digunakan terutama bila menjelaskan taraf dari faktor yang membuat nilai respons optimum.
Daftar Pustaka
[1] [2] [3]
Hedeker, D. & Gibbons, R. D. 2006. Longitudinal Data Analysis. New Jersey: Wiley.
Johnson, R. A. & Wichern, D. W. 1998. Applied Multivariate Statistical
Analysis. London: Prentice-Hall.
[4]
Reserch. New Jersey: Wiley.
Morrison, D. F. 1976. Multivariate Statistical Methods. New York: McGraw-Hill.