Uji Eksak Fisher
Uji independensi untuk table kategorik 2 X 2 ber dasarkan distribusi pendekatan Chi-Kuadrat hanya cocok untuk ukuran sampel besar. Dengan demikian uji independensi tidak cocok untuk sampel-sampel kecil. Untuk kasus sampel kecil Fisher dan Irwin telah mengembangkan suatu prosedur uji berdasarkan perhitungan probabilitas bersyarat frekuensi sel dengan anggapan jumlah baris (kolom) tetap. Dalam H0 bebas, dari sebuah distribusi eksak dikatakan bebas dari beberapa parameter yang tidak diketahui, dari frekuensi marginal bersyarat. Ketika diasumsikan Poisson, multinomial, atau independent multinomial sampling kemudian syarat jumlah tepi terpenuhi. Maka berlaku distribusi hipergeometri
1+
¿
2+
¿
(
n
¿n
11)(
n
¿n
+1−
n
11)
(
n
n
+1)
Persamaan ini menunjukkan distribusi dari 4 sel perhitungan dalam table dari hanya satu elemen, n11. Diberikan total marginal, yang merupakan nilai dari n11 yang dioeroleh dari perhitungan 3 sel lainnya. Interval nilai peluang untuk n11 dalam dstribusi ini adalah m_ ≤ n11 ≤ m+ di mana m_ adalah maksimum (0, n1+ + n+1 – n) dan m+ = minimum (n1+ , n+1).
Asumsi dan Statistik Uji
Sumber asumsi yang diperlukan untuk menguji pasangan hipotesis tersebut diatas adalah:
1. Data terdiri dari A buah hasi pengamatan dari populasi pertama, dan B buah hasil pengamatan dari populasi kedua.
2. Kedua sampel bebas dan diambil secara acak.
3. Masing-masing hasil pengamatan dapat digolongkan kedalam salah satu dari dua jenis atau ciri pengamatan yang saling terpisah (exclusive).
Jika asumsi ini
dipenuhi, dan tabel yang dibuat memenuhi syarat seperti pada tabel yang sebelumnya,
statistik uji b yang digunakan. Defenisi statistik b sesuai tabel sebelumnya adalah sebagai
berikut, b = banyaknya subjek dengan karakteristik yang di perhatikan (kategori 1) dalam
sampel
Jika kita tetapkan α sebagai taraf signifikasi yang digunakan dalam pengujian, kriteria pengambilan keputusan adalah sebagai berikut.
1. Uji dua sisi
Kesimpulan menolak H
0di ambil apa bila b≤B
k, karena keterbatasan tabel yang tersedia,
nilai α yang dapat digunakan untuk uji dua pihak, hanyalah 0.10, 0.05, 0.02, dan 0,01,
karena nilai peluang yang tercantum pada lampiran adalah 0.05, 0.025, 0.01 dan 0.005.
Almy (1973) menyelidiki hubungan antara daerah tempat tinggal sejumlah
kelompok dengan kelas sosial tertentu di kota-kota besar amerika dan kesatupaduan
pendapat dalam pemilihan umum yang diikuti oleh penduduk tersebut. Ia juga
mempelajari peran kesatuan pendapat diantara anggota kelompok pada konflik
antarkelompok seperti yang sering terjadi menjelang pemilihan umu. Tabel 1.2
memperlihatkan 14 kota besar yang dikelompokkan menurut daerah tempat tinggal
kelompok dengan kelas sosial tertentu dan kesatuan pendapat di antara anggota kelompok
yang sama pda suatu jejak pendapat tentang pendidikan.
Kita sesuaikan data dalam tabel 1.2 dengan simbol yang digunakan pada tabel 1.1 dengan demikian, A=10, B=4, a=1 dan b= 3. Sysrat pertama A≥B terpenuhi, akan tetapi syarat kedua a/A≥b/B tidak terpenuhi, karena a/A=1/10 dan b/B=3/4. Untuk memenuhi syarat kedua ini, kolom dalam tabel 1.2 harus dipertukarkan dan diperoleh tabel 1.3
Interpretasi masalah sesuai tabel 1.3 apabila kita menganggap kelompok yang
anggotanya tersebar sebagai sampel 1, dan tingginya kesatuan pendapat di antara anggota
kelompok yang sama sebagai karakteristik yang diamati. Tabel 1.3 jugamenunjukkan bahwa
sampel yang diambil dari pola hunian tersebar berukuran 10 dan sampel yang diambl dari pola
hunian berkumpul berukuran 4. Kita ingin tahu apakah kita dapat menyimpulkann bahwa
proporsi kota-kota dengan kesatuan pendapat yang tinggi di antara anggota kelompo kelas sosial
yang saling berjauhan (tersebar) sama dengan populasi kota-kota dengan kelompo sosial yang
berdekatan(berkumpul)?
H
0; proporsi kota-kota dengan kesatuan pendapat tinggi sebagai karakteristik yang diperhatikan
dalam kedua populasi sama.
H
1; proporsi kota-kota dengan kesatuan pendapat tinggi dalam populasi pertama tidak sama
dengan proporsi serupa dalam populasi kedua.
Misalnya kita tetapkan taraf signifikasi α=0.10. nilai kritis dilihat dalam lampiran B dengan A =
10, B=4 dan a=9. Cuplikan tabel ini dapat dilihat pada tabel 1.4. pada kolom peluang 0.05 (α/2),
kita peroleh bilangan bulat sebagai nilai kritis B
k= 1. Karena b=1= B
kberarti kita menolak H
0pada taraf signifikan 10%. Berdasarkan angka-angka dalam tabel tersebut, kita tidak dapat
menolak H
0dalam signifikasi kurang dari 5%.
Sebenarnya, kita dapat menghitung nilai peluang eksak dengan menggunakan fungsi
maswsa peluang hipergeometris sebagai berikut.
P=p(9,0)+p(9,1)=
Nilai peluang kumulatif untuk nilai Bk tidak akan lebih besar dari nilai peluang terdapat padaa baris atas tabel lampiran B. untuk kepentingan praktis, kita tidak perlu menghitung nilai p tersebut, sepanjang kesimpulan dapat diambil. Namun demikian, jika perhitungan dilakukan dengan bantuan komputer, nilai p ini dapat diperoleh secara langsung. Kesimpuln menolak H0 yang diambil pada taraf signifikasi 10% menunjukkan bahwa ada hubungan antara pola hunian dan kesatuan pendapat penduduk.
2. Uji satu sisi
Berbeda dengan uji dua pihak, uji satu puhak merujuk nilai kritis B
kpada kolom
peluang α(bukan α/2). Kesimpulan menolak H
0juga diambil apabila statistik b kurang
atau sama dengan B
k. Dalam sebuah studi mengenai pengaruh teknik wawancara yang
berbeda terhadap tekanan darah diastolik orang yang diwawancarai, williams dkk.
(1975)memperoleh hasil pengamatan yang diberikan dalam tabel 1.5
Dalam salah satu teknik wawancara, orang yang diwawancarai berperan passif.
Wawancara berlangsung dengan kartu yang diisi dan dijawab oleh orang yang
diwawancarai. Teknik wawancara kedua, pewawancara berinteraksi secara hangat dan
bertatap muka dengan orang yang diwawancarai. Pewawancara mengajukan pertanyaan
dan memberikan komentar pada saat yang diwawancarai memberikan jawaban. Tekanan
darah diastolik diukur pada saat selang waktu satu menit selama wawancara
berlangsaung.
Berdasarkan data tesebut, kita akan mengetahui apakah wawancara dengan tatap muka memberikan perubahan yang lebih besar terhadap tekanan darah diastolik? Utyuk menjawab pertanyaan ini. Kita perhatikan tabel 1.5 dan kita dapatkan A=6, B=6, a=6] dan b=1. Kedua persyaratan A≥B dan a/A≥b/B terpenuhi, karena a/A=1 dan b/B= 1/6. Kita akan mengambil kesimpulan dengan tingkat keyakinan 99%, yang berarti taraf signifikasi α=0.001 yang digunakan. Cuplikan tabel lampiran B diberikan pada tabel 1.6
Kita mendapatkan nilai kritis Bk = 1 pada kolom peluang 0,01. Karena statistik b=1 yang sama dengan nilai kritis, kita menolak hipotesis yang menyatakan bahwa perubahan tekanan darah diastolik sama saja bagi orang yang diwawancarai melalui cara kartu dengan cara tatap muka. Ini berarti tekanan darah diastolik mengalami perubahan yang cukup besar pada wawancara tatap muka(keseluruhan 6 dari 6 mengalami perubahan tekanan darah yang cukup besar), sedangkan wawancara melalui kartu tidak
memberoikan perubahan yang besar (hanya 1 dari 6 yang mengalami perubahan tekanan darah yang cukup besar).
Contoh Kasus Untuk Uji Eksak :
Misalkan, suatu studi telah dilakukan untuk membandingkan efektivitas obat dalam menyembuhkan suatu penyakit darah yang langka. Sebanyak 15 orang pasie yang menderita penyakit itu (yang kira – kira sama parahnya) kita gunakan sebagai subjek studi ini. Dari 15 orang ini, 7 orang kita pilih secara acak dan kita beri obat A, sedangkan 8 orang lainnya kita beri obat B. Hasil pengobatan ini rang lainnya kita beri obat B. Hasil pengobatan ini ditunjukkan dalam table di bawah ini.
TABEL 1 HASIL PENGOBATAN DENGAN OBAT A DAN OBAT B
hasil pengobatan Sembuh Tidak Sembuh Jumlah
Macam obat
A 4 3 7
Jumlah 5 10 15
Berdasarkan data ini kita ingin melkukan uji hipotesis bahwa kedua macam obat iu sama efektifnya dalam menyembuhkan penyakit itu dengan alternatif satu sisi bahwa obat A lebih efektif.
Jika sekiranya tidak ada perbedaan antara kedua macam obat itu, maka sampel gabungan dengan 5 orang sembuh dan 10 orang tidak sembuh dapat dipandang sebagai suatu sampel random dari satu populasi. Dengan memandang hasil gabungan ini sendiri sebagai suatu populasi kecil, uji Fisher-Irwin mengajukan pertanyaan, “ Dapatkah kedua baris table kemungkinan itu dipandang sebagai sampel-sampel yang homogeny dari populasi kecil ini?” Dalam melakukan inferensi, kita berpegang pada alas an bahwa fakta yang kuat mendukung kurangnya
homogenitas dalam subsample-subsampel itu menunjukkan bahwa kedua obat itu tidak serupa (efektivitasnya).
Model subsample-subsampel yang homogeny menganggap bahwa kedua baris table merupakan hasil pembagian secara acak 5 orang sembuh dan 10 orang tidak sembuh menjadi dua kelompok dengan masing-masing 7 orang dan 8 orang.
Banyak cara 7 orang dapat dipilih dari 15 orang adalah
(
15
7
)
,
yng masing-masing memiliki kemungkinan sama akan terjadinya, karena pemilihannya secara acak. Banyak cara dalam memilih 4 dari 5 orang yang sembuh dan memilih 3 dari 10orang yang tidak sembuh adalah
(
5 10
4
3
)
. Sekali pemilihan baris pertama selesai, berarti baris kedua tertentu. Oleh karena itu, probabilitas bersyarat frekuensi sel observasi, jika hasil gabungan diketahui 5 sembuh dan 10 tidak sembuh adalah ;(
5
4
) (
10
3
)
(
15
7
)
=
5 ×120
6435
=
0,093
Dengan jumlah baris tertentu (tetap), kita mulai mencari susunan frekuensi sel yang lebih ekstrim, dalam arti susunan-susunan frekuensi itu mendukung hipotesis
alternative lebih kuat daripada susunan frekuensi observasi. Dukungan lebih kuat untuk menyimpulkan obat A lebih efektif memerlukan frekuensi yang lebih tinggi dalam sel sudut atas – kiri table itu. Satu-satunya susunan yang mungkin adalah seperti yang tertuang dalam Tabel di bawah; dan probabilitas bersyaratny dihitung dengan cara seperti yang telah kita lakukan di atas.
TABEL 2 SUSUNAN YANG LEBIH EKSTRIM DARI TABEL 1
Sembuh Tidak Sembuh Jumlah
Obat A 5 2 7 Obat B 0 8 8 Probabilitas bersyarat =
(
5
5
)(
10
2
)
(
15
7
)
=0,007
Andaikan kita pilih tingkat signifikan
α=0,15
. Untuk menentukan apakah frekuensi sel observasi bertentangan dengan model pembagian menjadi subsample secara random, kita hitung probabilitas frekuensi observasi dan frekuensi yang lebih ekstrim, yakni 0,093 + 0,007 = 0,10. Karena harga ini lebih kecil dari tingkatsignifikan yang kita pilih maka hipotetis pembagian secara random ditolak. Sehingga dapat disimpulkan bahwa (dengan
α=0,15
) kedua obat itu berbeda efektifitasnya, yakni obat A lebih efektif daripada obat B.Jika tingkat signifikan yang kita gunakan ¿0,05 , H0 tidak ditolak. Ini kelihatan aneh jika mengingat selisih antara proporsi sampel yang sembuh 4/7 = 0,57untuk obat A dan 1/8 = 0,125 untuk obat B cukup besar. Hal ini menjelaskan untuk sampel kecil, seperti 7 dan 8, selisih antara proporsi sampel yang besar dapat terjadi karena kebetulan saja, meskipun proposi populasinya sama.
Untuk uji H0 bahwa tidak ada perbedaan antara efek dua tritmen versus alternative dua sisi,prosedur yang kita jalankan pada dasarnya sama. Tetapi, susunan-susunan yang lebih ekstrim harus diidentifikasi dalam dua sisinya. Untuk melihat hal ini, susunan umum dengan menggunakan jumlah baris dalam Tabel 1 kita sajikan dalam table 3 dibawah ini.
TABEL 3. SUSUNAN LEBIH EKSTRIM DENGAN JUMLAH BARIS SAMA DEGAN TABEL 1
sembuh Tidak Sembuh Jumlah
Obat A X 7 –x 7
Obat B 5 - x 3 + x 8
Jumlah 5 10 15
Selisih proporsi sampel dalam table ini adalah
(
x
7
−
5−x
Dalam table 1 adalah
(
4
7
−
1
8
)
. Maka susunan yang lebih ekstrim dua sisi dapat diidentifikasi sebagai harga-harga x yang memenuhi|
x
7
−
5−x
8
|
>
|
4
7
−
1
8
|
atau|
3 x−7|
>5Kriterium ini dipenuhi oleh table 2 dan table 4
TABEL 4 SUSUNAN LEBIH EKSTRIM DARI TABEL 1
Sembuh Tidak Sembuh Jumlah
Obat A 0 7 7
Obat B 5 3 8
Jumlah 5 10 15
Probabilitas yang lebih ekstrim =
(
5
0
)(
10
7
)
(
15
7
)
=0,019
Sehingga probabilitas signifikansi untuk alternative dua-sisi adalah 0,093 + 0,007 + 0,019 = 0,119