Tatik Widiharih, Cheking Asumsi dan Penanganannya CHEKING ASUMSI DAN PENANGANANNYA
Pendahuluan
Analisis variansi merupakan teknik statistika parametrik, oleh karena itu persyaratan- persyaratan yang diperlukan dari teknik tersebut harus dipenuhi agar analisis terhadap sekumpulan data dapat dinyatakan sahih. Asumsi yang dibahas dalam materi ini adalah uji indepensi, normalitas dan homogenitas dari residual. Langkah pertama dalam pengujian ini adalah mendapatkan data residual, rumus umum dari residual adalah
𝜀̂ = 𝑌 − 𝑌̂, dengan 𝑌: data terobservasi (aktual) dan 𝑌̂ : estimasi dari 𝑌. Pada kasus rancangan acak lengkap: 𝜀̂ = 𝑦𝑖𝑗 𝑖𝑗− 𝑦̅𝑖. .
a. Uji independensi residual.
Sifat independensi berarti bahwa residual dari suatu pengamatan yang mempunyai nilai tertentu haruslah tidak bergantung dari nilai-nilai residual untuk pengamatan yang lain (sifat ini sering kali disebut sifat tidak adanya korelasi antar residual). Uji independensi dilakukan secara visual yaitu dengan membuat plot antara residual versus order. Jika plot menunjukkan pola acak maka asumsi independensi terpenuhi.
b. Uji normalitas residual.
Pengujian normalitas residual dapat dilakukan secara visual (Q-Q plot) dan secara formal diantaranya dengan uji Kolmogorof Smirnov.
Prosedur pemeriksaan normalitas data menggunakan Q-Q plot sebagai berikut : 1. Urutkan nilai dugaan residual (ei) dari terkecil sampai terbesar.
2. Untuk setiap ei hitung pi = (k-0.5)/n dengan k = urutan dari ei dan n = banyaknya data.
3. Untuk setiap pi hitung F-1(pi)=Q(pi) dengan bantuan sebaran normal baku.
F merupakan fungsi sebaran normal kumulatif sedangkan Q(pi) adalah kuantil normal baku.
4. Buat plot antara ei yang telah diurutkan dengan Q(pi) yang merupakan Q-Q plot.
Pola pemencaran titik dalam plot yang membentuk garis lurus menjadi petunjuk bahwa sebaran data dapat didekati oleh pola sebaran normal.
Uji formal yang dapat digunakan untuk menguji apakah suatu data menyebar normal adalah uji Kolmogorof Smirnov. Data yang akan diuji diasumsikan berasal dari sampel acak
Tatik Widiharih, Cheking Asumsi dan Penanganannya berukuran n yang fungsi sebarannya F(x) belum diketahui, dengan parameter μ dan σ2 belum diketahui. Dalam uji ini data disusun dari yang terkecil sampai terbesar.
Hipotesis yang diuji :
H0 : data berdistribusi normal H1 : data berdistribusi tidak normal.
Statistik uji : D=max |S(x) – F0(x)|
Dengan S(x) : proporsi amatan sampel yang kurang atau sama dengan x (banyaknya amatan sampel yang kurang atau sama dengan x dibagi ukuran sampel(n)).
F0(x) : fungsi sebaran normal kumulatif.
Keputusan : tolak H0 jika D > Ln, α. Dengan Ln, α nilai kritis dalam tabel kuantil-kuantil statistik uji Kolmogorof dengan jumlah amatan n dan diuji pada taraf nyata α.
c. Uji homogenitas residual.
Misalnya dalam RAL, komponen residual yang berasal dari perlakuan harus menduga variansi populasi yang sama. Kadang-kadang bila nilai tengah satu atau dua perlakuan lebih tinggi dari yang lainnya dan variansinya juga lebih tinggi dari yang lainnya, akan mengakibatkan variansi residual yang tidak homogen.
Pengujian kehomogenan variansi dapat dilakukan dengan dua cara yaitu cara visual (dengan grafik) dan cara formal.
1. Uji secara visual.
Uji secara visual dengan membuat plot antara residual dengan nilai dugaan (fitted,
^
y
ij).Bila plot yang dibuat tidak membentuk suatu pola tertentu maka dikatakan homogenitas variansi terpenuhi.
2. Uji secara formal dengan uji Bartlet.
Hipotesis yang diuji : H0 : σ12 = σ22 =……= σa2
H1 : paling sedikit sepasang tidak sama.
Proseudr pada uji Bartlet ini menggunakan pendekatan sebaran chikuadrat dengan derajat bebas : a-1.
Statistik uji :
c q
h 2.3026.
2
dengan
n S
a n S
ii i p
a
i
q i 2
1 2 1
log 1 log
1
Tatik Widiharih, Cheking Asumsi dan Penanganannya
n
i ij
i
i j
i
y y
S n
1 2 2
1 . 1
a
i i
i a
i i p
n S n S
1
2 2 1
1 . 1
a
i i
a
i
n
in
c a
1
1 1
1 1
1 1
3 1 1
Tolak H0 jika
2h
2a1;Penangan Data terhadap Pelanggaran Asumsi.
Apabila salah satu dari asumsi model tidak terpenuhi salah satu jalan keluar mengatasi hal ini adalah melalui transformasi data terlebih dahulu, kemudian baru dianalisis kembali. Melalui transformasi diharapkan kestabilan (homogenitas) variansi akan terpenuhi sehingga proses pengujian dapat mendekati kesahihan. Kegunaan lain yang diperoleh dengan melakukan transformasi adalah diharapkan data menyebar mendekati sebaran normal dan variansi tidak akan dipengaruhi oleh perubahan nilai tengah (rataan) perlakuan. Beberapa bentuk transformasi yang biasa digunakan adalah : logaritma, akar, arcsin.
a. Transformasi logaritma.
Transformasi ini biasanya digunakan untuk data yang mempunyai simpangan baku proporsional dengan nilai tengah (rataan), yaitu Sy/μy mendekati konstan, atau bila pengaruh perlakuan bersifat multiplikatif. Langkah-langkah yang dilakukan dalam penggunaan transformasi logaritma adalah :
1. Periksa apakah data tidak memenuhi asumsi, plot nilai tengah perlakuan dalam diagram pencar. Jika simpangan baku meningkat secara proporsional dengan nilai tengah, ini memberi indikasi bahwa variansi residual tidak homogen.
2. Periksa apakah ada data yang bernilai kurang dari 10. Jika ada data yang bernilai kurang dari 10, digunakan transformasi log(Y+1), jika tidak ada data yang bernilai kurang dari 10 digunakan transformasi log(Y).
3. Periksa data hasil transformasi, jika sudah memenuhi asumsi, gunakan data hasil transformasi untuk pengujian selanjutnya.
Tatik Widiharih, Cheking Asumsi dan Penanganannya b. Transformasi akar kuadrat.
Transformasi ini biasanya digunakan untuk data yang mengandung semua nilai-nilai yang kecil, misalnya data yang diperoleh melalui penghitungan kejadian-kejadian yang jarang.
Untuk data ini variansi cenderung menjadi proporsional terhadap akar nilai tengah yaitu Sy/akar(μy) mendekati konstan. Transformasi ini juga cocok digunakan untuk data prosentase dengan wilayah data antara 0-30%. Jika sebagian besar data bernilai kecil, khususnya bila berniali 0 (nol), maka transformasi yang digunakan
Y1
.c. Transformasi arcsin.
Transformasi ini cocok digunakan pada data proporsi atau data prosentase yang diturunkan dari nisbah jumlah data, misalnya prosentase tanaman yang mati terhadap jumlah seluruh tanaman yang diamati. Hal-hal yang perlu diperhatikan sebelum melakukan transformasi adalah :
1. Data prosentase yang berada dalam satu wilayah 30% - 70% tidak perlu ditransformasi.
2. Untuk data prosentase yang berada dalam satu wilayah 0-30% atau 30%-70% tetapi tidak keduanya, gunakan transformasi akar kuadrat.
3. Untuk data prosentase yang tidak mengikuti ketentuan (1) dan (2), gunakan transformasi arcsin(√y). Dalam penggunaan transformasi ini, untuk data yang bernilai 0 (nol) diganti dengan 1/(4n), dan untuk data yang bernilai 100% diganti dengan (100 - 1/(4n))%.
d. Transformasi pangkat (power).
Perhatikan bentuk transformasi Yt dari data asal Y;
0 .
...
),...
log(
) 2 2
( , 0 ,...
untuk Y
untuk
Y
tY
Dalam hal ini, penentuan nilai λ yaitu λ = 1 – β dengan β adalah koefisien regresi (yang significant) dari bentuk regresi log(Sy) = α + β log(μy).
Bentuk-bentuk khusus dari transformasi pangkat :
β λ transformasi
2.0 1.5 1.0 0.5
-1 -0.5
0 0.5
1/Y 1/(akar(Y))
log(Y) akar(Y)
Contoh 1: Suatu percobaan dilakukan untuk mengetahui pengaruh varitas jagung terhadap hasil produksi. Dalam percobaan ini petak tanah digunakan relative homogen dan diperoleh data sebagai berikut.
Tatik Widiharih, Cheking Asumsi dan Penanganannya
ulangan
Varitas
A B C
1 2 3 4 5 6 7 8
24,0 16,7 22,8 19,8 18,9
23,2 19,8 18,1 17,8 20,2 17,8
18,4 39,2 17,8 14,5 19,7 18,9 13,4 19,3 a. Asumsi Normalitas residual.
Berdasarkan probability plot terlihat bahwa asumsi normalitas tidak terpenuhi jika diambil α=5%, selanjutnya dicoba transformasi akar kemudian dicek kembali asumsi normalitas residual diperoleh sebagai berikut:
Tatik Widiharih, Cheking Asumsi dan Penanganannya Berdasarkan probability plot terlihat bahwa asumsi normalitas tidak terpenuhi jika diambil α=5%. Selanjutnya digunakan pendekatan nonparametrik berikut.
Tolak H0 jika: H > 𝜆(𝑎−1),𝛼2 atau HC > 𝜆2(𝑎−1),𝛼
Tatik Widiharih, Cheking Asumsi dan Penanganannya
Tatik Widiharih, Cheking Asumsi dan Penanganannya Uji Kruskal Wallis untuk contoh 1.
ulangan
Varitas
A B C
Obs Rij Obs Rij Obs Rij
1 2 3 4 5 6 7 8
24,0 16,7 22,8 19,8 18,9
18 3 16 13,5
9,5
23,2 19,8 18,1 17,8 20,2 17,8
17 13,5
7 5 15
5
18,4 39,2 17,8 14,5 19,7 18,9 13,4 19,3
8 19
5 2 12 9,5 1 11
Total 60 62,5 67,5
Rata rata 12,0 20,41667 8,4375
= 12
19×20(602
5 +62,52
6 +67,52
8 ) − 3 ∗ 20 = 1,28125
∑ 𝑇 = (33 − 3) + (23− 2) + (23− 2) = 36
=
1,281251− 36
193−19
= 1,288029
𝜆2(𝑎−1),𝛼= 𝜆2;5%2 = 5,9914Karena HC < 𝜆2(𝑎−1),𝛼 maka terima H0
Kruskal Wallis dengan Minitab 1. Input data sebagai berikut:
Tatik Widiharih, Cheking Asumsi dan Penanganannya Output
Tatik Widiharih, Cheking Asumsi dan Penanganannya 𝑧_𝑣𝑎𝑙𝑢𝑒 = 𝑅̅𝑗− 𝑅̅
√(𝑁 + 1) (𝑁
𝑛𝑗 − 1) /2