UJI KESESUAIAN KAI KUADRAT (TEST OF GOODNESS OF FIT)
Teori/Konsep
Sebuah metode analisis non-parametrik yang paling terkenal dan banyak dipakai adalah uji Kai Kuadrat. Uji Kai Kuadrat tidak dibatasi oleh asumsi-asumsi ketat tentang jenis populasi maupun parameter populasi. Yang dibutuhkan hanya derajat bebas (dan tentu secara implisit berarti pula ukuran sampel). Metode ini sangat bermanfaat ketika data yang tersedia hanya berupa frekuensi (disebut pula count), misalnya banyaknya subjek dalam kategori sakit dan tidak sakit, atau banyaknya penderita diabetes mellitus dalam kategori I,II,III,IV menurut keparahan penyakitnya(Murti, 1996).
Uji goodness of fit pada prinsipnya bertujuan untuk mengetahui apakah sebuah distribusi data dari sampel mengikuti sebuah distribusi teoritis tertentu ataukah tidak. Sebagai contoh, sebuah dadu dilmpar maka kemungkinan mendapat angka “5” adalah 1/6, juga kemungkinan untuk angka yang lain. Inilah yang disebut distribusi teoritis sebuah dadu, karena terdiri atas 6 mata dadu yang kemungkinan seimbang untuk muncul dalam sekali pelemparan. Seandainya dilakukan pelemparan 120 kali, seharusnya tiap mata dadu secara teoritis akan muncul masing-masing 1/6 x 120 = 20 kali (angka 1 muncul 20 kali, angka 2 muncul 20 kali dan seterusnya). Namun tentu kenyataan tidak persis sama, bisa saja angka 1 muncul hanya 10 kali, tapi angka 3 muncul 24 kali da kemungkinan lain. Untuk mengetahui apakah kenyataan tersebut masih bisa dianggap selaras (fit) dengan distribusi teoritis, akan digunakan uji Goodness of Fit (Santoso, 2015).
Dengan demikian, goodness of fit test kan membandingkan dua distribusi data, yakni yang teoritis (frekuensi harapan) dan yang sesuai kenyataan (frekuensi observasi). Uji ini hampir sama dengan uji binomial, hanya jika pada binomial hanya ada dua kemungkinan jawaban, pada uji goodness of fit ada lebih dari dua kemungkinan (Santoso, 2015).
Perhitungan Metode
Dalam penerapan prosedur uji Kai Kuadrat , satu hal yang perlu diingat adalah bahwa cara kategorisai, baik frekuensi pengamatan maupun frekuensi harapan harus sama, agar memungkinkan perbandingan secara proporsional. Yang dimaksudkan dengan frekuensi harapan adalah(Murti, 1996) :
1. Frekuensi teoritis yang diharapkan muncul pada keadaan yang hipotesis nol nya benar. Frekuensi harapan ini disebut pula frekuensi teoritis.
2. Frekuensi dari suatu distribusi perumpamaan. Frekuensi harapan ini disebut pula frekuensi hipotesis.
Secara umum variable dikategorikan ke dalam table kontingensi r x c , dengan r=banyaknya baris, dan c= banyaknya kolom.Rumus statistik uji Kai Kuadrat sebagai berikut (Murti, 1996):
O = Frekuensi teramati dari sel bari ke-I dan kolom ke-j E = Frekuensi harapan dari sel baris ke –I dan kolom ke-j
Tabel format tabel kontingensi 2x2 (Murti, 1996) Variabel 1 Kategori 1 Kategori 2 Kategori 1 Variable 2 Kategori 2 a+b c+d a b c d a+c b+d
Tabel format table kontingensi 2x3 (Murti, 1996) Variable 1 Kategori 1
Variable 2 Kategori 2
kategori 1 kategori 2 kategori 3
Frekuansi harapan pada tiap-tiap sel dihitung sebagai berikut (Murti, 1996): E11 = (a+c) x (a+b) N E12 = (b+d) x (a+b) N E13 = (a+c) x (c+d) N E14 = (b+d) x (c+d) N N = a + b + c + d
Seperti telah disebutkan, derajat bebas memegang peran penting dalam uji Kai Kuadrat, karena itu perlu dihitung dengan betul menggunakan rumus berikut (Murti, 1996) :
Derajat bebas = (r-1) (c-1)
Dengan r = jumlah baris, dan c = jumlah kolom.
a b a
hitung tabel,
hitung tabel,
Bila kedua variable (karakteristik, karakteristik) dikategorikan masing- masing, menjadi dua, analisis bisa dilakukan dengan menggunan rumus alternative statistik X2 yang lebih pendek yaitu (Murti, 1996) ::
X2 = N (ad-bc)
(a+b) (c+d) (a+c) (b+d)
Jika distribusi teramati dan harapan persis sama, maka X2 = 0. Tetapi karena terdapat fluktuasi-fluktuasi pencuplikan (Sampling Variation), biasanya X2 tidak sama dengan nol. Pengambilan keputusan statistic didasarkan pada probabilitas untuk memperoleh X2hitung yang bisa dilihat pada table distribusi pencuplikan X2 bila Ho
benar (Murti, 1996) :.
Jika nilai X2 ≥nilai X2 antara frekuensi teramati dan frekuensi harapan terdapat perbedaan yang bermakna. Sebaliknya jika nilai X2 <nilai X2 perbedaan itu tidak bermakna. Perbedaan yang tampak hanya disebabkan peluang dan karena itu bisa diabaikan (Murti, 1996) :.
Dalam melakukan uji Kai Kuadrat, ada syarat-syarat yang perlu dipenuhi (Murti, 1996) : :
1. Sampel dipilh acak.
2. Semua pengamatan dilakukan independen
3. Setiap sel paling sedikit berisi frekuensi harapan sebesar 1. Sel-sel dengan frekuensi harapan kurang dari 5 tidak melebihi 20 persen dari total sel. Untuk table 2x2 syarat itu berarti tidak satu sel pun boleh berisi frekuensi kurang dari 5 4. Meskipun dapat diharapkan pada sampel kecil, ukuran sampel sebaikknya > 40.
Bila ukuran sampel kecil (<20), atau terdapat frekuensi harapan kurang dari 5, maka data hendaknya di analisi dengan prosedur uji pasti fisher.
Koreksi Yates
Nilai-nilai observasi dikategorikan ke dalam tabel kontingensi r x c, sehingga sifat dari menjadi diskret. Di pihak lain, distribusi pencuplikan statistic X2 sebagaimana telah disusun dalam table X2 merupakan distribusi kontinu. Kerena itu yates pada tahun 1974 mengusulkan koreksi dengan menggunakan table 2x2, yaitu
dengan mengurangi nilai absolut (0-E) dengan 0,5 sebelumdikuadratkan. Jika rumus altenatif X2 yang digunakan, nilai absolut (ad-bc) dikurangi dengan separoh jumlah total observasi, sebelum dikuadratkan. Statsistik X2 yang telah dikoreksi berbentuk sebagai berikut (Murti, 1996) :
X2 koreksi = ∑ (|0-E|-0,5)2 E
= ∑ N(|ad-bc| (-o,5N)2 (a+b) (c+d) (a+c) (b+d)
Kita dapat membayangkan bahw jika jumlah kategori variable sangat banyak, destribusi variable akan mendekati kontinu. Pada keadaan ini koreksi yates tidak diperlukan lagi. Dahulu koreksi yates banak digunakan, namun akhir-alkhir ini manfaatnya dipertanyakan. Grizzle (1967) menganjurkan untuk tidak menggunakan koreksi yates, sebab akan memperbesar kencenderungan tidak menolak hipotesis nol ( memperbesar kesalahan tipe III). Berikut akan kita bandingkan statistic X2 dengan koreksi dan tanpa koreksi yates (Murti, 1996) :.
X2 koreksi = (|23-42|-0,5)2 + (|35-9|-0,5)2 + (|5-3|-0,5)2 + (|37-46|-0,5)2
42 9 3 46
= 82,72
Ternyata pada N sampai sebesar 100 dan table 3x2 seperti pada contoh ini, X2 koreksi masih lebih kecil dibandingkan dengan X2 tanpa koreksi, artinya koreksi masih diperlukan. Selanjutnya rumus alternative X2 koreksi yates bisa kita perkirakan bahwa bila ukuran sampel cukup besar, maka hasil perhitungan X2 koreksi tidak begitu terpengaruh oleh pengurangan 0,5N. artinya, bila sampel besar ( yang secara implisit memungkinkan dibuat banyak kategori), koreksi yates tidak diperlukan lagi.
Contoh Kasus (Murti, 1996)
Seorang peneliti ingin melakukan survey terhadap respon pasar mengenai kunjungan ke sebuah laboratorium. Dikota tersebut terdapat 3 laboratorium lain yakni
Lab A, B dan C. berdasarkan data yang ada jumlah persentase kunjungan ke lab A adalah 50%, Lab B 30% dan Lab C adalah 20%. Dilakukan pengambilan sampel secara random pada 200 orang yang pernah melakukan pemeriksaan laboratorium seperti pada tabel berikut
Lab A : 74 Lab B : 62 Lab C : 64
Bagaimanakanh kesimpulan dari penelitian tersebut? Jawab :
Hipotesis: Ho : persentase respon pasar Lab A =50, lab B = 30, lab C = 20 Ha : Persentase respon pasar berbeda
Sig : 0,05 Lab O E O-E (𝐎 − 𝐄) 𝟐 (𝐎 − 𝐄) 𝟐 𝐄 A 74 100 -26 676 6.76 B 62 60 2 4 0.07 C 64 40 24 576 14.40 200 200 0 21.23 X2 = ∑ (O−E)2 = 21,23
Dari hasil perhitungan diperoleh X2 = 21,23 dan chi square tabel = 5,991 (df =
2, α = 0,05, maka didapatkan nilai chi square hitung > chi square tabel . Kesimpulan Ho Ditolak. Secara statistic terdapat perbedaan antara persentase kunjungan laboratorium pada sampel dengan data kunjungan sebelumnya.
Aplikasi SPSS : Uji Kesesuaian Kai Kuadrat 1. Siapkan data ke editor SPSS
2. Pilih Analyze Nonparametrik test Chi Square
3. Pindahkan variable ke kotak Test Variabel Output :
Dari hasil uji statsitik diperoleh chi square hitung adalah 21,227, chi square hitung > chi square tabel (5,991 , df =2) maka Ho ditolak. Dan berdasarkan angka probabilitas diperoleh Asymp sig = 0,000. P < α maka Ho ditolak. Artinya terdapat perbedaan antara persentase kunjungan laboratorium pada sampel dengan data kunjungan sebelumnya.