Analysis of Variance
Analysis of Variance adalah teknik yang memungkinkan kita untuk membandingkan dua atau lebih populasi data yang berbentuk interval. Anova adalah prosedur yang menjelaskan ada atau tidaknya perbedaan rata-rata antarpopulasi.
ANOVA satu arah
Hanya ada satu perlakuan terhadap dua atau lebih populasi. Hipotesis : H0=μ1=μ2=…=μk
H1=sedikitnyaada1rata−rata yang tidak sama Tolak H0 jika Fhit>Fα ;k−1;n−k
Source of
Variance Degrees ofFreedom SquaresSum of Mean Squares F-Statistic Treatment k-1 SST MST=SST/(k-1) Fhit=MST/MSE
Error n-k SSE MSE=SSE/(n-k)
Total n-1 SSTotal
Menggunakan fungsi built-in R
1. Membuat model
model = lm(y ~ treatment, sumber_data)
atau
model = lm(sumber_data$y ~ sumber_data$treatment)
2. Menggunakan Fungsi anova() terhadap model yang sudah dibuat 3. Menganalisis hasil yang ditampilkan
Contoh Soal :
1. Data berikut mencantumkan beberapa bungkus rokok yang terjual di sebuah pasar swalayan pada 8 hari dipilih secara acak :
Dengan ANOVA, pada taraf 0.05, dan tentukan apakah secara rata-rata di pasar swalayan ini kelima rokok diatas terjual sama banyak?
Jawab :
Dengan menggunakan R, kita buat fungsinya terlebih dahulu :
anova<-function(p1=NULL,p2=NULL,p3=NULL,p4=NULL, p5=NULL,alfa=0.05){
cat('H0 : miu1=miu2=...=miuk\n');
cat('H1 : sekurang-kurangnya dua miu nilainya tidak sama\n\n');
k=0;#untuk mengetahui banyaknya perlakuan sum1=numeric(5);
sum2=numeric(5); ni=numeric(5);
if(!is.null(p1)){k=k+1;ni[1]<-length(p1); sum1[1]<-sum(p1);sum2[1]<-sum(p1^2);} if(!is.null(p2)){k=k+1;ni[2]<-length(p2); sum1[2]<-sum(p2);sum2[2]<-sum(p2^2);} if(!is.null(p3)){k=k+1;ni[3]<-length(p3); sum1[3]<-sum(p3);sum2[3]<-sum(p3^2);} if(!is.null(p4)){k=k+1;ni[4]<-length(p4); sum1[4]<-sum(p4);sum2[4]<-sum(p4^2);} if(!is.null(p5)){k=k+1;ni[5]<-length(p5); sum1[5]<-sum(p5);sum2[5]<-sum(p5^2);} JKK=sum(sum2)-sum(sum1)^2/sum(ni);
JKG=0;
for(i in seq(k)){
JKG=JKG+sum1[i]^2/ni[i]; }
cat('Tabel ANOVA\n\n');
tabel<-data.frame(sk=c('nilai tengah','galat','total'),
} }
Input datanya terlebih dahulu :
p1<-c(21,35,32,28,14,47,25,38); p2<-c(35,12,27,41,19,23,31,20); p3<-c(45,60,33,36,31,40,43,48); p4<-c(32,53,29,42,40,23,35,42); p5<-c(45,29,31,22,36,29,42,30);
Kemudian panggil fungsinya :
anova(p1,p2,p3,p4,p5,alfa = 0.05)
Hasilnya adalah sebagai berikut :
H0 : miu1=miu2=...=miuk
H1 : sekurang-kurangnya dua miu nilainya tidak sama
Tabel ANOVA
Jadi dengan tingkat kepercayaan 95% dapat disimpulkan bahwa terdapat sekurang-kurangnya dua nilai rata-rata penjualan bungkus rokok di pasar swalayan selama 8 hari tidak sama.
2. Tiga kelas kuliah matematika dasar diberikan oleh tiga dosen. Nilai akhirnya tercatat sebagai berikut :
Dosen
A 73 89 82 43 80 73 66 60 45 93 36 77
B 88 78 48 91 51 85 74 77 31 78 62 76 96 80 56 C 68 79 56 91 71 71 87 41 59 68 53 79 15 Input datanya terlebih dahulu
p1<-c(73,89,82,43,80,73,66,60,45,93,36,77);
p2<-c(88,78,48,91,51,85,74,77,31,78,62,76,96,80,56); p3<-c(68,79,56,91,71,71,87,41,59,68,53,79,15);
Dengan fungsi yang telah dibuat pada no 1, jadi kita cukup memanggilnya seperti :
anova(p1,p2,p3,alfa = 0.05)
Hasilnya adalah sebagai berikut :
H0 : miu1=miu2=...=miuk
H1 : sekurang-kurangnya dua miu nilainya tidak sama
sk jk df ss fhit 1 nilai tengah 335.3526 2 167.676282051296 0.464 2 galat 13349.7474 37 360.803984753984
3 total 13685.1000 39 ftabel = 3.251924
Kesimpulan Gagal Tolak H0
Dengan tingkat kepercayaan 95% tidak dapat disimpulkan bahwa terdapat minimal dua nilai rata-rata yang diberikan oleh ketiga dosen tersebut berbeda.
Uji Perbandingan Ganda
Uji ini digunakan untuk menilai pengaruh macam-macam perlakuan proses atau untuk mengetahui adanya perbedaan atau persamaan antara dua variabel dari populasi yang sama. Beberapa macam pengujian yang dapat dilakukan dalam analisis perbandingan ganda adalah uji tukey, bonferroni, scheffe, fisher, dunnet, Duncan dll.
Uji fisher Least Significant Difference (LSD) / Uji Beda Nyata Terkecil
Analisis perbandingan ini digunakan untuk mengetahui dari pasangan rata-rata mana yang paling berbeda diantara pasangan yang ada. Metode Least Significant Difference menggunakan perbandingan berbagai rata-rata dengan uji t untuk mengetahui perbedaan dari pasangan rata-rata.
Salah satu prosedur uji yang paling sederhana untuk menjawab pertanyaan tentang nilai tengah perlakuan mana yang berbeda apabila H1 diterima adalah uji beda nyata terkecil (Least Significant Different = LSD).
Nilai tα dilihat pada tabel t dengan menggunakan derajat bebas galat dan α yang digunakan.
Untuk menilai apakah dua nilai tengah perlakuan berbeda secara statistika, maka bandingkan dengan selisih (beda) dua nilai tengah perlakuan tersebut dengan nilai BNT. Jika beda dua nilai tengah > nilai BNT , maka dua nilai tengah dikatakan berbeda secara nyata pada taraf α, sebaliknya jika beda dua nilai tengah ≤ nilai NP BNT, maka dua nilai tengah dikatakan tidak berbeda nyata.
Uji tukey / Honestly Significant Difference (HSD)
Nilai qα dilihat pada tabel BNJ dimana p adalah jumlah perlakuan dan fe adalah derajat bebas galat. Untuk mencari nilai q(p, v, α) anda dapat melihatnya pada table nilai kritis uji perbandingan berganda Tukey pada taraf nyata 1% dan 5%. Untuk menentukan nilai q(p, v, α), harus berdasarkannilai taraf nyata yang dipilih (misalnya anda menentukan taraf nyata = 5%), jumlah perlakuan, p dan nilai derajad bebas (db) error.
Contoh Soal :
1. Dalam memberi pakan ternaknya, C.V. Aqiqah Jaa memberikan jenis ransu yang berbeda pada masing-masing ternaknya. Untuk mengetahui efek perbedaan pakan ternak terhadap bobot ternaknya, manajer dari peternakan tersebut mengambil masing-masing 6 ekor ternaknya secara acak. Berikut adalah bobot ternak dari sampel terpilih (dalam kg).
Jenis Pakan Ternak
Ransum A Ransum B Ransum C
12 11.8 8.5
Kemudian, manajer tersebut menguji data tersebut dengan taraf 5%. Diperoleh hasil terdapat perbedaan efek pengaruh pemberian pakan ternak terhadap bobot ternak. Jenis pakan manakah yang memberikan efek berbeda?
Jawab :
Hasilnya adalah seperti berikut :
> summary(a1)
Fit: aov(formula = data$pakan ~ data$ransum)
$`data$ransum`
diff lwr upr p adj b-a -0.5 -2.0116 1.0115997 0.6732180 c-a -1.7 -3.2116 -0.1884003 0.0268250 c-b -1.2 -2.7116 0.3115997 0.1317706
karena XbarB-XbarA < p adj, maka gagal tolak H0, XbarA dan XbarB tidak berbeda nyata.
karena XbarC-XbarA > p adj, maka tolak H0, XbarC dan XbarA berbeda nyata. karena XbarC-XbarB < p adj, maka gagal tolak H0, XbarC dan XbarB tidak berbeda nyata.
ransum C < ransum B < ransum A
2. Berikut adalah data prduktivitas padi (dalam ton) dengan jenis pupuk yang berbeda
Jenis Pupuk
Kemudian, petani tersebut menguji data tersebut dengan taraf 5%. Diperoleh hasil terdapat perbedaan efek pengaruh pemberian pupuk yang berbeda terhadap produktivitas padi. Jenis pupuk manakah yang memberikan hasil yang berbeda? Jawab :
Hasilnya adalah sebagai berikut :
> summary(a2)
Fit: aov(formula = data2$prod ~ data2$pupuk)
$`data2$pupuk`
diff lwr upr p adj b-a 4.00 -2.539561 10.53956 0.2544985 c-a 13.75 7.210439 20.28956 0.0006221 c-b 9.75 3.210439 16.28956 0.0061918