• Tidak ada hasil yang ditemukan

R untuk Pengolahan & Analisis Statistik

V.4. Regresi & ANOVA (Analysis of Variance)

V.4.1.2. Penaksiran dan Pengujian

ˆ , ˆ = y αi = yiy μ

Dimana tanda (misal pada y) menyatakan indeks dari rerata yang digunakan.

Metode terakhir ini paling banyak direkomendasikan untuk penghitungan manualwalaupun akan lebih sulit disajikan dalam bentuk y= Xβ+ε. Faktor kedua pertama di atas lebih mudah diimplementasikan secara komputas. Seperti biasa, beberapa analisis grafis awal diperlukan sebelum melakukan pencocokkan (fitting). Boxplot sisi per sisi merupakan plot yang paling banyak digunakan. Lihat pada persamaan variansi, transformasi, outliers (disini tidak berpengaruh secar relevan karena levarage tidak akan berbeda kecuali disain yang sangat tidak seimbang)

V.4.1.2. Penaksiran dan Pengujian

Penaksiran efek menggunakan langsung formula seperti yang sudah dijelaskan sebelumnya atau menggunakan pendekatan least square (karena hasil sama).

Pada ANOVA, penaksiran dan pengujian dilakukan pertama kali adalah mencari perbedaan factor levelnya. Kita lakukan perbandingan hipotesis, dimana:

• H0 : αi = 0 , berlaku untuk semua i • Ha :paling sedikit satu αi ≠ 0 Contoh kasus,

Suatu penelitian ingin mengetahui apakah factor sosioekonomi mempengaruhi IPK mahasiswa. Sosioekonomi dibagi dalam tiga kelompok, yaitu rendah (r), sedang (s) dan tinggi (t). Dalam penelitian tersebut, masing-masing kelompok terdiri dari 7 mahasiswa yang diambil data IPK secara acak.

> ipksosek <- edit(data.frame()) #memasukkan data ipksosek >ipksosek ipk sosek 1 2.87 r 2 2.16 r 3 3.14 r 4 2.51 r 5 1.80 r 6 3.01 r

75 7 2.16 r 8 3.23 s 9 3.45 s 10 2.78 s 11 3.77 s 12 2.97 s 13 3.53 s 14 3.01 s 15 2.25 t 16 3.13 t 17 2.44 t 18 2.54 t 19 3.27 t 20 2.81 t 21 1.36 t

Langkah pertama adalah melihat sebaran data dengan melakukan plot, dan digunakan boxplot dan hasilnya seperti Gambar 5.24:

> boxplot(ipk˜sosek, data=ipksosek)

Gambar 5.24. Boxplot sebaran IPK mahasiswa berdasarkan sosio ekonomi Disini diharapkan tidak terlihat adanya outlier, kemiringan (skewness) dan variansi yang berbeda.

Selanjutnya, dilakukan pencocokan model dengan cara sebagai berikut:

Eksperimen tersebut melibatkan suatu factor tunggal yaitu kelas sosioekonomi (sosek) pada tiga level (r,s,t). Misalkan μrst masing-masing menyatakan rata-rata IPK untuk mahasiswa tingkat social ekonomi rendah, sedang dan tinggi. Sehingga akan diujikan hal berikut:

t s r

H0: μ =μ =μ

melawan alternatif:

Ha : paling sedikit dua dari tiga perlakuan berbeda.

Maka untuk mendapatkan hal tersebut, maka perlu dibuat suatu model linear yang menggambarkan hubungan ipk dengan sosek sebagai berikut:

76

> summary(g) Residuals:

Min 1Q Median 3Q Max -1.18286 -0.29286 -0.01143 0.34857 0.72714 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 2.52143 0.19336 13.040 1.31e-10 *** soseks 0.72714 0.27346 2.659 0.0160 * sosekt 0.02143 0.27346 0.078 0.9384 ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.5116 on 18 degrees of freedom

Multiple R-Squared: 0.3372, Adjusted R-squared: 0.2636 F-statistic: 4.579 on 2 and 18 DF, p-value: 0.02468

Karena nilai statistik F = 4.579 melebihi nilai kepercayaan F0.05 = 3.55, maka H0

ditolak dan disimpulkan (pada tingkat kepercayaan α = 0.05) bahwa rata-rata IPK mahasiswa berbeda paling sedikit dua dari tiga tingkat sosio ekonomi. Hal ini juga ditunjukkan oleh α = 0.05 lebih besar dari p-value = 0.02468.

Grup r adalah level rujukan dan mempunyai nilai rerata 2.52143, sedangkan grup s dan t berturut-turut memiliki nilai rerata 0.72714 dan 0.02143 lebih besar dari rata-rata r. Kemudian berdasarkan factor sosioekonomi tersebut, maka dilakukan pemeriksaan matriks rancangan untuk memahami pengkodean:

> model.matrix(g)

Kita dapat mencocokan model tanpa mengintersepsi batasan:

> gi <- lm(ipk˜sosek -1, ipksosek) > summary(gi)

Residuals:

Min 1Q Median 3Q Max -1.18286 -0.29286 -0.01143 0.34857 0.72714 Coefficients:

Estimate Std. Error t value Pr(>|t|) sosekr 2.5214 0.1934 13.04 1.31e-10 *** soseks 3.2486 0.1934 16.80 1.91e-12 *** sosekt 2.5429 0.1934 13.15 1.14e-10 *** ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.5116 on 18 degrees of freedom

Multiple R-Squared: 0.972, Adjusted R-squared: 0.9674 F-statistic: 208.4 on 3 and 18 DF, p-value: 3.662e-14

Kita lihat, dengan nilai p (p-value) = 3.662*10-14 (mendekati 0) maka kita tidak dapat melakukan perbandingan hipotesis sebelumnya.

77 V.4.2. ANOVA Dua Arah

Anggap terdapat dua faktor, α pada level I dan β pada level J. Misalkan jumlah observasi

pada level i dari α dan level j dari β dan misalkan observasi tersebut sebagai yi j1, yi j2, …. Suatu

layout lengkap A memiliki nij ≥1 untuk semua i, j. memiliki model umum yang paling sesuai adalah : ijk ij j i ijk y =μ+α +β +(αβ) +ε

Efek interaksi ((αβ)ijdiinterpretasikan sebagai bagian dari rata-rata respon yang bukan merupak atribut efek tambahan dari αi and βj Sebagai contoh misalkan anda menyukai strawberi dan es krim secara individu, tetapi strawberi yang dicampur dalam eskrim lebih disukai. Hal yang berlawanan misalkan anda menyukai ikan dan es krim tetapi tidak menyukai es krim yang dicampur ikan.

Berikut ini adalah contoh penggunaan anova dua arah [23]:

Perusahaan pengecatan pesawat udara akan melakukan pengecatan pada permukaan alumunium dengan dua cara; penyemprotan (spray) dan dipping. Percobaan perbedaan faktor dilakukan untuk menyelidiki efek dari tipe pengecatan dan metode pengecatan terhadap daya rekat (adhisif) cat. Kekuatan daya rekat diukur, dengan tiga jenis cat (primer) yang berbeda dan dua metode pengecatan (aplikasi). Berikut adalah penulisan dalam R: > paint <- data.frame(adhf = c(4.0,4.5,4.3,5.6,4.9,5.4,3.8,3.7,4.0,5.4,4.9,5.6,5.8,6.1,6.3,5.5 ,5.0,5.0), primer = factor(rep(rep(1:3,rep(3,3)),2)),applic = factor(rep(c("D","S"),c(9,9)))) > paint

adhf primer applic 1 4.0 1 D 2 4.5 1 D 3 4.3 1 D 4 5.6 2 D 5 4.9 2 D 6 5.4 2 D 7 3.8 3 D 8 3.7 3 D 9 4.0 3 D 10 5.4 1 S 11 4.9 1 S 12 5.6 1 S 13 5.8 2 S 14 6.1 2 S 15 6.3 2 S 16 5.5 3 S 17 5.0 3 S 18 5.0 3 S

Hasil tersebut adalah untuk anova satu arah, dengan mengabaikan metode pengecatan. Statemen lm() menyesuaikan model linier dan statemen anova() menampilkan hasil dalam bentuk tabel anova.

78

Analysis of Variance Table

Response: adhf

Df Sum Sq Mean Sq F value Pr(>F) primer 2 4.5811 2.2906 5.5989 0.01527 * Residuals 15 6.1367 0.4091

---

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Tampilan hasil di atas adalah anova satu arah untuk metode pengecatan, dengan mengabaikan jenis cat (primer).

> anova(lm(adhf~applic, data=paint)) Analysis of Variance Table

Response: adhf

Df Sum Sq Mean Sq F value Pr(>F) applic 1 4.9089 4.9089 13.521 0.002039 ** Residuals 16 5.8089 0.3631

---

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Hasil berikut merupakan anova dua arah untuk metode pengecatan, varibel primer dan interaksi antar keduanya.

Sebagai catatan, jumlah kuadrat untuk variable primer dan untuk variable applic bernilai sama dengan hasil perhitungan dalam analisis satu arah.

> anova(lm(adhf~primer*applic, data=paint)) Analysis of Variance Table

Response: adhf

Df Sum Sq Mean Sq F value Pr(>F) primer 2 4.5811 2.2906 27.8581 3.097e-05 *** applic 1 4.9089 4.9089 59.7027 5.357e-06 *** primer:applic 2 0.2411 0.1206 1.4662 0.2693 Residuals 12 0.9867 0.0822 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Interaksi variable tidak signifikan (p = 0.2693) oleh karena itu kita dapat melakukan uji untuk efek utama, dimana keduanya memiliki signifikansi yang tinggi. Kesimpulan: Bahwa pemilihan tipe primer dan pemilih metode pengecatan (aplikasi) mempengaruhi kekuatan daya rekat cat, dan selisih antara tiga tipe cat adalah sama untuk kedua cara pengecatan (aplikasi), dan selisih antara dua metode pengecatan adalah sama untuk setiap tipe cat.

Untuk uji t contoh pengecatan di atas, dibahas di V.5. sub bab uji t.

Perintah berikut digunakan untuk menunjukkan cara perhitungan nilai rerata untuk enam tipe cat yang berbeda: kombinasi variable applic dan cara bagaimana mengatur nilai rerata dalam bentuk matriks untuk memberikan plot interaksi.

> split(paint$adhf,paint$applic:paint$primer) $"D:1" [1] 4.0 4.5 4.3 $"D:2" [1] 5.6 4.9 5.4

79 $"D:3" [1] 3.8 3.7 4.0 $"S:1" [1] 5.4 4.9 5.6 $"S:2" [1] 5.8 6.1 6.3 $"S:3" [1] 5.5 5.0 5.0

>sapply (split (paint$adhf, paint$applic:paint$primer), mean) D:1 D:2 D:3 S:1 S:2 S:3 4.266667 5.300000 3.833333 5.300000 6.066667 5.166667 >matrix(sapply(split(paint$adhf, paint$applic:paint$primer),mean),ncol=2) [,1] [,2] [1,] 4.266667 5.300000 [2,] 5.300000 6.066667 [3,] 3.833333 5.166667

Perintah mathplot() akan mem-plot setiap kolom dari matriks pada graph yang sama.

> matplot(matrix(sapply(split(paint$adhf,

paint$applic:paint$primer),mean),ncol=2), type="l", xlab="Primer",ylab="Daya Rekat")

Gambar 5.25: Plot kolom matrik

Dua garis di atas tampak seperti paralel, sesuai dengan kesimpulan sebelumnya bahwa tidak terjadinya suatu interaksi. Oleh karena itu, selisih/perbedaan antara tipe cat (primer) adalah sama untuk setiap metode pengecatan.

80

> matplot(matrix(sapply(split(paint$adhf,paint$primer:paint$applic), mean),ncol=3), type="l", xlab="Aplikasi",ylab="Daya Rekat")

Cara lain, anda dapat juga memplot daya rekat (adhesi) dengan metode pengecatan (aplikasi), dengan garis yang berbeda untuk setiap primer garis tampak parallel (Gambar 5.23).

Gambar 5.26: Matplot daya rekat (adhesi) vs aplikasi V. 5. Analisis (Uji) Statistika t

Berkaitan den gan contoh kasus pengecatan pesawat terbang dengan variable primer (tipe cat) dan variable applic (metode pengecatan; semprot dan dipping) (lihat kasus di bagian anova dua arah), penulisan uji t dan koefisiennya dalam R adalah:

> summary(lm(adhf~primer*applic, data=paint)) Call:

lm(formula = adhf ~ primer * applic, data = paint)

Residuals:

Min 1Q Median 3Q Max -0.40000 -0.16667 0.03333 0.21667 0.33333

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 4.2667 0.1656 25.772 7.1e-12 *** primer2 1.0333 0.2341 4.414 0.000845 *** primer3 -0.4333 0.2341 -1.851 0.088949 . applicS 1.0333 0.2341 4.414 0.000845 *** primer2:applicS -0.2667 0.3311 -0.805 0.436265 primer3:applicS 0.3000 0.3311 0.906 0.382736 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Residual standard error: 0.2867 on 12 degrees of freedom

81

F-statistic: 23.67 on 5 and 12 DF, p-value: 7.89e-06

Data di atas menunjukkan nilai uji t dari masing-masing variabel. V.6. R dan Statistika Lanjut

Dokumen terkait