ANALISIS DATA KUALITATIF
(INTRODUCTION TO CATEGORICAL DATA
ANALYSIS)
GANGGA ANURAGA S.Si, M.Si
STATISTIKA
UNIPA
Materi :
Pendahuluan : Distribusi dalam dalam data diskret Tabel Kontingensi
Tabel dua dimensi Tabel dimensi > 2 Pratikum
Model log linier (Model dan Interpretasi)
Pratikum
Model logistik
Biner (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model) Pratikum
Multinomial (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model) Pratikum
Ordinal (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian model) Pratikum
Model poisson (Estimasi Parameter, pengujian parameter, interpretasi, kesesuaian
model) Pratikum
STATISTIKA
UNIPA
Kontrak kuliah
No Komponen Bobot Nilai (10%)
1 Partisipasi kuliah 10
2 Tugas-tugas 20
3 Kuis 15
4 Ujian Tengah Semester 25
5 Ujian Akhir Semester 30
Jumlah 100
STATISTIKA
UNIPA
referensi
Agresti, Alan. 1996. An Introduction to Categorical
Data Analysis. Wiley Series : New York
STATISTIKA
UNIPA
Pendahuluan
Hubungan antara variabel X dan Y, dimana Y adalah
variabel diskret (Nominal, Ordinal) dan X merupakan
variabel kontinyu atau diskret (Nominal, Ordinal,
Interval dan rasio)
Tujuan ADK :
Digunakan pada data berbentuk kategori, terutama pada
variabel respon yang berbentuk diskret/kategori.
Contoh :
Y : partai politik (Demokrat, Gerindra, Golkar)
X : pendidikan, pendapatan, dan jenis kelamin
STATISTIKA
UNIPA
Terdapat 2 jenis variabel kategori
Nominal
Contoh : jenis kelamin, jenis musik (rock, pop, jazz) dll
Ordinal
Contoh : tingkat pendidikan (SD, SMP, SMU, PT)
Selanjutnya yang akan menjadi perhatian penting adalah
variabel biner (sukses – gagal). Dan perbedaan penting
nominal-ordinal.
STATISTIKA
UNIPA
Distribusi Probabilitas dalam Analisis
Data Kualitatif (CDA)
Distribusi Binomial
distribusi untuk proses bernoulli
Karakteristik proses bernoulli
Percobaan berlangsung n kali, dalam cara dan kondisi
sama
Setiap percobaan hanya ada 2 kejadian yang mungkin
terjadi, yang mana saling asing dan independen.
Peluang / probabilitas dari satu percobaan ke percobaan
yang lain adalah konstan.
2 kejiadian tersebut umumnya dinotasikan sebagai kejadian
sukses dan kejadian gagal
STATISTIKA
UNIPA
Lanjutan distribusi binomial
(
), 1
(
) untuk setiap percobaan
munculnya atau jumlah sukses yang akan dihitung
Setiap percobaan saling asing dan independen
n = jumlah percobaan
berdistribusi binomial
P Sukses
P gagal
Y
Y
STATISTIKA
UNIPA
SURABAYA
Contoh :
Suatu pemilihan umum / pemilu yang diikuti oleh
partai demokrat dan golkar, yang mana
dilaksanakan dalam 3 putaran. Misalkan peluang
partai demokrat memenangkan pemilu adalah 0,5
.Berapa probabilitas partai
demokrat memenangkan pemilu sebanyak 3 kali.
Jawab : n = 3, Y = munculnya atau jumlah sukses
yang memilih partai demokrat.
(
P Demokrat
(
) = 0,5)
STATISTIKA
UNIPA
Lanjutan Contoh :
STATISTIKA
UNIPA
Catatan :
^
( )
(menunjukkan rata-rata kesuksesan dari sebuah percobaan)
( )
(1
),
(1
(menunjukkan variansi/standar deviasi dari sebuah percobaan)
juga dilambangkan ,
(menunjukkan persentas
E Y
n
Var Y
n
n
Y
p
n
e kesuksesan dari sebuah percobaan)
( )
(1
)
Y
E p
E
n
Y
n
n
STATISTIKA
UNIPA
SURABAYA
Soal :
Probabilitas kiriman paket dari suatu biro perjalanan
akan sampai tepat waktu adalah 0,8. jika kita
mengirim lewat biro tersebut 10 kali,
Berapa probabilitas bahwa 6 diantaranya akan sampai
tepat waktu ? 0,0881
Berapa rata-rata dan varians bahwa 6 diantaranya akan
sampai tepat waktu ? 8 dan 1,6
STATISTIKA
UNIPA
Pengujian Proporsi untuk Distr. Binomial
Untuk distribusi binomial, menggunakan estimator ML dalam inferensi statistik untuk parameter
Estimator ML adalah proporsi sampel ( )
Sampling distribusi dari proporsi sampel ( ), memiliki
p p mea 0 0 0 0 0 1 0 0,025 dan tan sbb : (1 ) ( ) , ( )
statistik uji yang digunakan :
(1 )
Hipotesis yang digunakan, : : (satu arah)
Daerah kritis : dengan =0,05 ( =1.96)
Dan CI 95% ada n s dar error E p p n p z n H vs H Z (1 ) lah p 1, 96 p p n
STATISTIKA
UNIPA
SURABAYA
Distribusi Multinomial
Jika dalam setiap percobaan / eksperimen didapatkan
peluang munculnya kesuksesan (possible outcomes) > 2,
dengan beberapa kategori. Maka dinamakan sebagai
distribusi multinomial (multinomial distribution).
Contoh : Beberapa percobaan yang memiliki lebih dari
dua hasil yang mungkin.
Misalnya, hasil untuk driver dalam kecelakaan mobil
dapat terekam menggunakan kategori "tidak terluka,"
"cedera yang tidak memerlukan rawat inap," "cedera
yang memerlukan rawat inap," "kematian."
STATISTIKA
UNIPA
Lanjutan Distribusi Multinomial
1 2 c
j j j jmenunjukkan jumlah kategori hasil
,
,...,
peluang sukses (probability)
1
c
n
n
STATISTIKA
UNIPA
SURABAYA
Contoh : Distribusi Multinomial
Dalam pemilihan umum sebuah negara besar,
kandidat A mendapat 20% suara, calon B
menerima 30% suara, dan kandidat C menerima
50% suara. Jika enam pemilih yang dipilih secara
acak, berapakah probabilitas bahwa akan ada
tepat satu pendukung calon A, dua pendukung
calon B dan tiga pendukung kandidat C dalam
sampel?
STATISTIKA
UNIPA
STATISTIKA
UNIPA
CONTINGENCY TABLES
(TABEL KONTINGENSI)
GANGGA ANURAGA S.Si, M.Si
STATISTIKA
UNIPA
Tabel Kontingensi
Berkaitan dengan hubungan antar variabel
kategori / diskret.
Menguji apakah kedua variabel tersebut (diskret)
independent.
STATISTIKA
UNIPA
Syarat pada Tabel Kontingensi
Homogen : setiap level atau kategori dalam suatu
variabel merupakan objek yang sama.
Independent (saling bebas)
Skala nominal : skala yang digunakan untuk
membedakan benda atau peristiwa yang satu dengan
lainnya, misal : jenis kelamin (laki-laki, perempuan
Skala ordinal : skala yang digunakan untuk
membedakan dan mengurutkan data, misal tingkat
pendidikan (SD, SMP, SMA, PT)
(
)
( ) ( )
P A B
P A P B
STATISTIKA
UNIPA
SURABAYA
Tabel Kontingensi r x c
Baris
Lajur / Kolom
1
2
.
.
.
c
1
n
11n
12.
.
.
n
1c2
n
21n
22.
.
.
n
2c.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
r
n
r1n
r2.
.
.
n
rc ijTabel kontingensi berisi hitungan hasil n ,
yang mana banyaknya individu yang termasuk
dalam sel ke ij, i = 1,2...r dan j = 1,2...c
STATISTIKA
UNIPA
Tabel Kontingensi 2 x 2
Misal hubungan antar jenis kelamin dengan
kepercayaan bahwa ada kehidupan setelam mati.
Tabel 1 :
STATISTIKA
UNIPA
Probabilitas Joint dan Marginal
Probabilitas join (Joint Probability)
,
,
menyatakan peluang ( , ) pada baris ke-i dan kolom ke-j
dinyatakan sebagai
nt
dari
1
ij ij ij ij ij i jn
p
P X
i Y
j
n
X Y
joi
distribution
X dan Y
STATISTIKA
UNIPA
SURABAYA
Tabel probabilitas untuk kontingensi 2 x 2
Gender
Belief in Afterlife
Total
Yes
No or Undecided
females
π
11π
12π
1+Males
π
21π
22π
2+Total
π
+1π
+2π
++STATISTIKA
UNIPA
SURABAYA
Tabel Probabilitas
Tabel 2 :
Gender Belief in Afterlife Total Yes No or Undecided females π11= 509/1127 = 0,452 π12= 116/1127 = 0,103 π1+= 0,555 Males π21= 398/1127 = 0,353 π22= 104/1127 = 0,092 π2+= 0,445 Total π+1= 0,805 π+2= 0,195 π++ = 1 11 11 11
misal :
0, 452,
menyatakan peluang (joint probability) dari jenis kelamin perempuan
yang mengatakan ya/percaya ada kehidupan setelah mati
n
p
n
STATISTIKA
UNIPA
SURABAYA
Probabilitas Marjinal (Marginal Probability)
Merupakan total dari baris dan atau total kolom dari
probabilitas join (joint probabiliy).
merupakan total dari probabilitas join (joint probability) dari baris ke-i merupakan total dari probabilitas join (joint probability) dari kolom ke-j = 1, merupakan total dari probabilitas m
i j ij arginal
STATISTIKA
UNIPA
SURABAYA
Gender Belief in Afterlife Total Yes No or Undecided females π11= 509/1127 = 0,452 π12= 116/1127 = 0,103 π1+= 0,555 Males π21= 398/1127 = 0,353 π22= 104/1127 = 0,092 π2+= 0,445 Total π+1= 0,805 π+2= 0,195 π++ = 1
Joint
Probability
Marginal
Probability
STATISTIKA
UNIPA
SURABAYA
Independensi
Untuk selanjutnya pandang Y sebagai variabel
respon (belief in afterlife) dan X (Gender) sebagai
variabel penjelas (explanatory variable). Dan
, jika X dan Y bebas (independen) maka :
ijp
ij1 1 1 . .1 1 2 1 . .2 2 1 2 . .1 2 2 2 . .2
(
b a c a h a m p i r s a m a )
p
p
x p
p
p
x p
p
p
x p
p
p
x p
STATISTIKA
UNIPA
SURABAYA
Uji Independensi (Chi-Squared dan
Likelihood Ratio Test)
0 1 H i p o t e s i s y a n g d i g u n a k a n a d a la h s e b a g a i b e r i k u t : : t i d a k a d a h u b u n g a n a n t a r a d a n ( b e b a s ) a t a u ( ) : a d a h u b u n g a n a n t a r a d a n ( t i d a k b e b a s ) a t a u ( ) i d e n t i f i k a s i : i j i j i j i j i j i j i H X Y H X Y n n
2 m e r u p a k a n n i la i h a r a p a n d a r i d e n g a n a s u m s i i n d e p e n d e n ˆ ˆ e s t i m a s i n i la i h a r a p a n S t a t i s t i k U j i : u n t u k t a b e l k o n t i n g e n s i , d e n g a n p e a r s o n j i j i j j i j i i j i j i j n n n n n n p p n n n n I x J
2 2 2 2 d a n L i k e li h o o d r a t i o t e s t s e b a g a i b e r i k u t : ˆ , 2 lo g ˆ ˆ 1 1 i j i j i j h i t u n g i j i j i j G n n G n d f I J
STATISTIKA
UNIPA
SURABAYA
Uji Chi-Squared
Uji Chi-Sqaured menuntut frekuensi-frekuensi yang
diharapkan tidak boleh terlalu kecil.
Untuk uji Chi-Squared dengan derajat bebas (db)
yang lebih besar 1, lebih dari 20% selnya harus
mempunyai frekuensi yang diharapkan lebih dari
5 dan tidak satu sel pun boleh memiliki
frekuensi yang diharapkan kurang dari satu.
STATISTIKA
UNIPA
Contoh uji independensi
2 2
Gunakan pearson
dan Likelihood ratio
sebagai statistik uji
G
STATISTIKA
UNIPA
Yates (1934)
Melakukan koreksi terhadap pearson Chi-Squared.
Frank Yates, ahli statistik Inggris, menyarankan
koreksi untuk kontinuitas yang menyesuaikan rumus
untuk uji chi-squared Pearson dengan mengurangi
0,5 dari perbedaan antara masing-masing nilai
yang diamati dan nilai yang diharapkan dari tabel
2 × 2 kontingensi.
2 2ˆ
0,5
ˆ
ij ij Yates ijn
STATISTIKA
UNIPA
SURABAYA
Fisher
Digunakan pada sampel kecil, untuk nilai harapan
< 5.
Nilai p_value langsung dapat dihitung,
dibandingkan dengan signifikansi alpha (0,05).
Langkah-langkah dalam uji fisher :
Mencari konfigurasi-konfigurasi tabel yang lebih
ekstrim dari tabel yang diamati
Menghitung nilai p, katakanlah
Nilai p dari tabel yang diamati adalah penjumlahan
1
,
2,...,
kp p
p
1 2...
kp
p
p
STATISTIKA
UNIPA
SURABAYA
Fisher (Lanjutan 1)
STATISTIKA
UNIPA
Fisher (Lanjutan 2)
STATISTIKA
UNIPA
Fisher (Lanjutan 3)
STATISTIKA
UNIPA
Fisher (Lanjutan 4)
Dengan alpha = 0,05, maka dapat disimpulkan
bahwa tidak ada hubungan (independen) antara
gejala psychotics dan neurotics dengan gejala
perasaan bunuh diri.
STATISTIKA
UNIPA
Risiko Nisbi (Relative Risk)
Merupakan perbandingan antara dua peluang yang sukses
Menyatakan peluang terjadinya suatu kejadian (resiko)
Nilai relative risk akan berkisar dari nol sampa tidak hingga
Nilai relative risk yang sama dengan 1 atau mendekati 1
mengindikasikan tidak ada hubungan antara kedua variabel
tersebut
11 1 1 21 2 2n
n
RR
n
n
STATISTIKA
UNIPA
SURABAYA
Risiko Nisbi (Relative Risk)
P(perempuan percaya ada kehidupan setelah mati)
=509/625 =0,81
P(laki-laki percaya ada kehidupan setelah mati) =398/502
=0,79
Didapatkan relative risk yang mendekati 1 mengindikasikan
tidak ada hubungan antara kedua variabel tersebut
0,81
1, 02
0, 79
RR
STATISTIKA
UNIPA
SURABAYA
Odds Ratio
Odds adalah peluang terjadinya suatu kejadian
dibandingkan peluang tidak terjadinya kejadian
tersebut.
Odds ratio adalah adalah perbandingan dari dua
odds.
STATISTIKA
UNIPA
TABEL DIMENSI GANDA
Gangga AnuragaSTATISTIKA
UNIPA
Uji kebebasan bersama-sama / mutual
independence dalam tabel kontingensi 3 x 3
Hipotesis :
0 .. . . .. 0 .. . . .. 2 2 1 1 1 .. . . .. 2:
:
(
)
Statistik Uji :
dengan :
ˆ
2
1, 2,...,
1, 2,...,
1, 2,...,
ijk i j k ijk i j k r c l ijk ijk i j k ijk i j k ijk ijkH
p
p p p
H
p
p p p
n
E
E
n n n
E
N
df
rcl
r
c
l
i
r
j
c
k
l
STATISTIKA
UNIPA
SURABAYA
Contoh :
Data perilaku kelas pada pada sekolah anak-anak
Uji apakah terdapat hubungan antara perilaku kelas anak-anak
(deviant, non deviant), kondisi sekolah (low, medium, high) dan
indeks resiko yang terkait dengan kondisi tempat tinggal (not at
risk, at risk)
STATISTIKA
UNIPA
.. . . ..
1.. 2..
.1. .2.
1.Tentukan terlebih dahulu ,
, dan
non deviant dan deviant
(16 7) (15 34) (5 3)
80
(1 1) (3 8) (1 3)
17
not at risk dan risk
(16 1) (15 3) (5 1)
41
(7 1) (34 8) (3 3)
56
i j kn n
n
n
n
n
n
..1 ..2 ..3condition school
(16 7) (1 1)
25
(15 34) (3 8)
60
(5 3) (1 3)
12
n
n
n
STATISTIKA
UNIPA
SURABAYA
.. . . .. 2
111
121
2. Tentukan nilai harapan masing-masing sel
80 x 41 x25
8,72
97 x 97
80 x 56 x25
11,90
97 x 97
lanjutkan...
i j k ijkn n n
E
N
E
E
STATISTIKA
UNIPA
SURABAYA
STATISTIKA
UNIPA
2 2 1 1 1 2 7 ,0.05 0
Statistik Uji :
(
)
17,30
2
7
14, 07
Kesimpulan : Karena tolak H maka
perilaku kelas anak-anak (deviant, non deviant),
kondisi sekolah (low, medium,
r c l ijk ijk i j k ijk
n
E
E
df
rcl
r
c l
df
high) dan
indeks resiko (not at risk, at risk) tidak bebas bersama-sama
STATISTIKA
UNIPA
Jika ditanyakan apakah kondisi sekolah dan indeks resiko
independet berdasarkan perilaku kelas, maka :
2
10,78 dengan df = 2
STATISTIKA
UNIPA
TUGAS
Kombinasikan data untuk jenis kelamin sehingga menjadi 4 x 4 kemudian uji
independensi dengan menggunakan pearson dan likelihood ratio test, interpretaasikan.
Bandingkan 2 level pendapatan pertama terhadap kepuasan kerja dengan
menggunakan likelihood ratio test, interpretaasikan.
Bandingkan 2 level pendapatan terakhir terhadap kepuasan kerja dengan
menggunakan likelihood ratio test, interpretaasikan.
STATISTIKA
UNIPA
TERIMA KASIH
STATISTIKA
UNIPA
MODEL LOG LINIER
Gangga Anuraga
STATISTIKA
UNIPA
MODEL LOG LINIER
Menyatakan hubungan antar variabel, dengan data yang
bersifat kualitatif (skala nominal atau ordinal).
Dengan menggunakan pendekatan log linier bisa
diketahui model matematikanya secara pasti serta level
atau kelas mana yang cenderung menimbulkan adanya
hubungan atau dependensi.
Dalam tabel kontingensi I x J, dikatakan independen
apabila
Formula dalam model log linier menggunakan nilai
harapan
dan independen jika
ij i j
ij
n
ij ijn
i j
STATISTIKA
UNIPA
SURABAYA
MODEL LOG LINIER UNTUK TABEL 2 X 2
M isalk an X seb ag ai variab el b aris d an
Y seb ag ai variab el k o lo m , m ak a m o d el lo g lin ier d ap at d itu lisk an seb ag ai b erik u t :
lo g ...(1 ) d im an a :
m en u n ju k k an efek u tam a k ateg o ri
X Y ij i j X i k e-i variab el X .
m en u n ju k k an efek u tam a k ateg o ri k e-j variab el Y .
d an m o d el jen u h d ap at d itu lisk an seb ag ai b erik u t :
lo g ... (2 )
= efek in terak si an tara k ateg o ri
Y j X Y X Y ij i j ij X Y ij k e-i p eu b ah X d an k ateg o ri k e-j p eu b ah Y u n tu k i= 1 ,2 ,3 ,...,I d an j= 1 ,2 ,3 ,...,J
STATISTIKA
UNIPA
SURABAYA
1
1
1 1
log
(terdapat hubungan antara log
dengan , sehingga dapat digunakan
untuk menduga log
)
ij ij ij ij ij ij ij J j i ij I i j I J ij i j
n
n
J
I
IJ
STATISTIKA
UNIPA
SURABAYA
X i i Y j j XY ij ij i j
STATISTIKA
UNIPA
SURABAYA
CONTOH KASUS
Hubungan partai dengan jenis kelamin
Ln n
ijhubungan partai dengan jenis kelamin
eta(ij)
jenis kelamin buruh Partaikonservatif eta(i+) Laki-laki 5.40 4.74 5.07 Perempuan 5.48 5.22 5.35 eta(+j) 5.44 4.98 5.21 jenis kelamin Partai Total
buruh konservatif Laki-laki 222 115 337 Perempuan 240 185 425 Total 462 300 762
STATISTIKA
UNIPA
SURABAYA
1 2 1 2 11 12 21 22
Sehingga :
5, 21
0,14
0,14
0, 23
0, 23
0,10
0,10
0,10
0,10
X X Y Y XY XY XY XY
STATISTIKA
UNIPA
SURABAYA
MODEL JENUH / SATURATED MODEL
(MODEL 0)
11 1 1 11
21 2 1 21
2
Didapat model penuh (saturated model)
log
5, 4
5, 21 0,14 0, 23 0,10 (mod
)
5, 21 0,14 0, 23 0,10 (mod
)
0 G
0, 000
ij ij X Y XY ij i j ij X Y XY X Y XYmisal
v
v
v
el jenuh
v
el jenuh
df
STATISTIKA
UNIPA
SURABAYA
MODEL TANPA INTERAKSI (MODEL 1)
XY ij
0
Model 1 adalah interaksi antar 2 variabel dihilangkan
log
Untuk mengevaluasi interaksi
dapat dilakukan dengan membandingkan model
Berikut hipotesis yang dibangun :
m
ij ij X Y ij i j XY ijmisal
v
v
H
1odel 1 adalah model terbaik
H
STATISTIKA
model 0 (saturated model) adalah model terbaik
UNIPA
2 2 2 2 2 2 1:0,05Statistik Uji :
Dengan pearson
dan Likelihood ratio test
sebagai berikut :
ˆ
,
2
log
ˆ
ˆ
1
1
0,05
3,841
ij ij ij hitung ij ij ijG
n
n
G
n
df
I
J
STATISTIKA
UNIPA
SURABAYA
Tabel Frekuensi Harapan dan ln dari
frekuensi harapan
jenis kelamin Partai
buruh konservatif Total Laki-laki 204.32 132.68 337.00 Perempuan 257.68 167.32 425.00 Total 462.00 300.00 762.00 jenis kelamin Partai Total
buruh konservatif Laki-laki 5.32 4.89 10.21 Perempuan 5.55 5.12 10.67 Total 10.87 10.01 20.88
STATISTIKA
UNIPA
SURABAYA
ANALISIS DAN PEMBAHASAN
2 2 0:
2
log
ˆ
7, 003138
Keputusan : Tolak H
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model
lengkap) sebagai model terbaik. Jadi model log linier
untuk hubungan
ij ij ijPerhitungan
n
G
n
G
antara kedua variabel tersebut adalah :
X Y XY ij i j ij
v
STATISTIKA
UNIPA
INTERPRETASI :
Interpretasi dari model adalah adanya hubungan
antara variabel jenis partai dengan variabel Jenis kelamin,
dimana pengaruh efek utama variabel jenis partai dan
variabel jenis kelamin juga masuk ke dalam model.
Gunakan SPSS
STATISTIKA
UNIPA
UJI K-WAY
Uji K-Way
1. Pengujian interaksi pada derajat K atau lebih tinggi sama
dengan nol (
-
)
Uji ini didasarkan pada hipotesis bahwa efek order ke-K
Test that K Way and higher order effect are zero
0 1
0
dan
yang lebih tinggi sama dengan nol.
Pada model log linear hipotesisnya sebagai berikut.
- Untuk K = 2
H : Efek order ke-2 = 0
H : Efek order ke-2
0
- Untuk K = 1
H : Efek or
1
der ke-1 dan yang lebih tinggi = 0
H : Efek order ke-1 dan yang lebih tinggi
0
STATISTIKA
UNIPA
U ji K -w ay
2 . P en g u jian in terak si p ad a d erajat K sa m a d en g an n o l
( - )
U ji in i d id asark an p ad a h ip o tesis efek o rd er k e-K sam a d en g an n o l. P ad a m o d el lo g li
T est th a t K W a y effect a re zero
0 1 0 1 n ear h ip o tesisn ya seb ag ai b erik u t. - U n tu k K = 1 H : E fek o rd er k e-1 = 0 H : E fek o rd er k e-1 0 - U n tu k K = 2 H : E fek o rd er k e-2 = 0 H : E fek o rd er k e-2 0 S tatistik u ji yan g d ig u n ak 2 2 0
an ad alah L ik elih o o d R atio T est (G ) K riteria p en o lak an G 2 > (d b ; ) m ak a to lah H
STATISTIKA
UNIPA
Output SPSS Uji K-Way
0
1
Pada pengujian efek order ke-K atau lebih sama dengan nol dijabarkan sebagai berikut. Untuk K = 2
Hipotesis :
H : Efek order ke-2 = 0 H : Efek order ke-2 0
P_value yang kurang dari nilai
1
= 5% yaitu 0,008.
Sehingga Hdidukung oleh data, artinya efek interaksi order kedua terdapat dalammodel.
STATISTIKA
UNIPA
0
1
1
Untuk K = 1 Hipotesis :
H : Efek order ke-1 dan yang lebih tinggi = 0 H : Efek order ke-1 dan yang lebih tinggi 0 P_value = 0,000 yang kurang dari nilai = 5% . Sehingga H didukung oleh data,
artinya efek interaksi order kesatu dan yang lebih tinggi terdapat dalam model.
0
1
Pada pengujian efek order ke-K sama dengan nol dijabarkan sebagai berikut.
Untuk K = 1 Hipotesis :
H : Efek order ke-1 = 0 H : Efek order ke-1 0
Nilai P_value = 0,000 yang kurang dari nilai
1
= 5%.
Sehingga H didukung oleh data, artinya efek interaksi order ke-1 terdapat dalam model.
STATISTIKA
UNIPA
0 1 1
U n tu k K = 2
H ip o tesis :
H : E fek o rd er k e-2 = 0
H : E fek o rd er k e-2
0
N ilai P _ v alu e = 0 ,0 0 8 yan g k u ran g d ari n ilai
= 5 % .
S eh in g g a H d id u k u n g o leh d ata, artin ya
efek in terak si o rd er k e-2 terd a
p at d alam m o d el.
STATISTIKA
UNIPA
SURABAYA
Uji Asosiasi Parsial
P e n g u jia n in i m e m p u n y a i tu ju a n u n tu k m e n g u ji s e m u a p a ra m e te r y a n g m u n g k in d a ri s u a tu m o d e l le n g k a p b a ik u n tu k s a tu v a ria b e l y a n g b e b a s m a u p u n u n tu k h u b u n g a n k e te rg a n tu n g a n b e b e ra p a v a ri a 0 1 0 0 1 0 b e l y a n g m e ru p a k a n p a rs ia l d a ri s u a tu m o d e l le n g k a p . H ip o te s is n y a a d a la h s e b a g a i b e rik u t. - H : E fe k in te ra k s i a n ta ra v a ria b e l 1 d a n v a ria b e l 2 = 0 H : H - H : E fe k v a ria b e l 1 = 0 H : H 0 1 0 - H : E fe k v a ria b e l 2 = 0 H : HSTATISTIKA
UNIPA
SURABAYA
OUTPUT SPSS UJI PARSIAL
2
0
0
Statistik uji yang digunakan adalah partial chi-squared
dengan derajat bebas
(db; ).
tolak H yang berarti terdapat efek variabel jenis kelamin
dalam model.
tolak H yang berarti terdapat efek
variabel jenis partai
dalam model.
STATISTIKA
UNIPA
SELEKSI MODEL
Eliminasi Backward
Seleksi model log linier dilakukan dengan metode Backward Elimination.
Metode Backward Elimination pada dasarnya menyeleksi model
dengan menggunakan prinsip hierarki, yaitu dengan melihat
model
0 1
terlengkap sampai dengan
model yang sederhana.
Untuk memilih model terbaik menggunakan hipotesis sebagai berikut.
H : Model 1 adalah model terbaik
H : Model 0 (model jenuh) adalah model terbaik
STATISTIKA
UNIPA
TERIMA KASIH
STATISTIKA
UNIPA
MODEL LOG LINIER (Lanjutan)
Gangga Anuraga
STATISTIKA
UNIPA
CONTOH KASUS
Hubungan partai dengan jenis kelamin
Ln n
ijhubungan partai dengan jenis kelamin
eta(ij)
jenis kelamin buruh Partaikonservatif eta(i+) Laki-laki 5.40 4.74 5.07 Perempuan 5.48 5.22 5.35 eta(+j) 5.44 4.98 5.21 jenis kelamin Partai Total
buruh konservatif Laki-laki 222 115 337 Perempuan 240 185 425 Total 462 300 762
STATISTIKA
UNIPA
SURABAYA
1 2 1 2 11 12 21 22
Sehingga :
5, 21
0,14
0,14
0, 23
0, 23
0,10
0,10
0,10
0,10
X X Y Y XY XY XY XY
STATISTIKA
UNIPA
SURABAYA
MODEL JENUH / SATURATED MODEL
(MODEL 0)
11 1 1 11
21 2 1 21
2
Didapat model penuh (saturated model)
log
5, 4
5, 21 0,14 0, 23 0,10 (mod
)
5, 21 0,14 0, 23 0,10 (mod
)
0 G
0, 000
ij ij X Y XY ij i j ij X Y XY X Y XYmisal
v
v
v
el jenuh
v
el jenuh
df
STATISTIKA
UNIPA
SURABAYA
MODEL TANPA INTERAKSI (MODEL 1)
XY ij
0
Model 1 adalah interaksi antar 2 variabel dihilangkan
log
Untuk mengevaluasi interaksi
dapat dilakukan dengan membandingkan model
Berikut hipotesis yang dibangun :
m
ij ij X Y ij i j XY ijmisal
v
v
H
0odel 1 adalah model terbaik
H
STATISTIKA
model 0 (saturated model) adalah model terbaik
UNIPA
2 2 2 2 2 2 1:0,05Statistik Uji :
Dengan pearson
dan Likelihood ratio test
sebagai berikut :
ˆ
,
2
log
ˆ
ˆ
1
1
0,05
3,841
ij ij ij hitung ij ij ijG
n
n
G
n
df
I
J
STATISTIKA
UNIPA
SURABAYA
Tabel Frekuensi Harapan dan ln dari
frekuensi harapan
jenis kelamin Partai
buruh konservatif Total Laki-laki 204.32 132.68 337.00 Perempuan 257.68 167.32 425.00 Total 462.00 300.00 762.00 jenis kelamin Partai Total
buruh konservatif Laki-laki 5.32 4.89 10.21 Perempuan 5.55 5.12 10.67 Total 10.87 10.01 20.88
STATISTIKA
UNIPA
SURABAYA
ANALISIS DAN PEMBAHASAN
2 2 0:
2
log
ˆ
7, 003138
Keputusan : Tolak H
Sehingga dapat ditarik kesimpulan bahwa Model 0 (model
lengkap) sebagai model terbaik. Jadi model log linier
untuk hubungan
ij ij ijPerhitungan
n
G
n
G
antara kedua variabel tersebut adalah :
X Y XY ij i j ij
v
STATISTIKA
UNIPA
PELUANG JIKA KATEGORI Y (JENIS
PARTAI) SAMA
0 ij
1 ij
2
H
Peluang kategori B (jenis partai ) sama (model v
)
H
Peluang kategori B (jenis partai ) tidak sama (model v
)
dengan statistik uji sbb :
2
log
ˆ
A i A B i j ij ij ijn
G
n
STATISTIKA
UNIPA
SURABAYA
Tabel Frekuensi Harapan dan ln dari
frekuensi harapan
Peluang jika kategori Y sama,
Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = eta
ijij
model v
Xi
jenis kelamin Partai Total buruh konservatif
Laki-laki 168.5 168.5 337 Perempuan 212.5 212.5 425
Total 381 381 762
jenis kelamin Partai Eta(i+) buruh konservatif Laki-laki 5.127 5.127 5.127 Perempuan 5.359 5.359 5.359 Eta(+j) 5.243 5.243 5.243
STATISTIKA
UNIPA
SURABAYA
1 1 2 1 1 11 12 21 22 1 2
,
5,127
5, 359
1
(
)
4
1
(5,127
5,127
5, 359
5, 359)
5, 243
4
5,127
5, 243
0,116
0,12
5, 359
5, 243
0,116
0,12
ij J j i I J ij i j X i X idan
J
IJ
STATISTIKA
UNIPA
SURABAYA
Didapatkan model :
ij ij 2v
v
5, 243 0,116
dan statistik uji G
41, 71
X i
STATISTIKA
UNIPA
SURABAYA
PELUANG JIKA KATEGORI X (GENDER)
SAMA
Peluang jika kategori X sama,
ij
model v
Y j
0 ij 1 ij 2H
Peluang kategori X (gender) sama (model v
)
H
Peluang kategori X (gender ) tidak sama (model v
)
dengan statistik uji sbb :
2
log
ˆ
Y j X Y i j ij ij ijn
G
n
STATISTIKA
UNIPA
SURABAYA
Tabel Frekuensi Harapan dan ln dari
frekuensi harapan
Peluang jika kategori X sama,
Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = eta
ijij
model v
Y j
jeniskelamin buruh Partaikonservatif Total Laki-laki 231 150 381 Perempuan 231 150 381 Total 462 300 762 jenis
kelamin buruh Partaikonservatif eta(i+) Laki-laki 5.442 5.011 5.227 Perempuan 5.442 5.011 5.227 eta(+j) 5.442 5.011 5.227
STATISTIKA
UNIPA
SURABAYA
1 1 2
1 1
1
log
(terdapat hubungan antara log
denga
sehingga dapat digunakan untuk menduga log
)
,
5, 442 dan
5,011
5, 227
ij ij ij ij ij ij ij I i j I J ij i j Y j j Yn
n
I
IJ
1 1 15, 442 5, 227
0, 215
0, 22
5,011 5, 227
0, 216
0, 22
Y
STATISTIKA
UNIPA
SURABAYA
ij ij 2 2 1:0 ,05
v
v
5, 227
0, 22
dan statistik uji G
17,19
3,841
Y j
STATISTIKA
UNIPA
SURABAYA
PELUANG KATEGORI (i,j) SAMA
0 ij
2
H
Peluang kategori i,j sama (model v
)
dengan statistik uji sbb :
2
log
ˆ
ij ij ijn
G
n
STATISTIKA
UNIPA
SURABAYA
Tabel frekuensi harapan
Tabel ln (frekuensi harapan) = eta
ijjenis kelamin Partai Total buruh konservatif
Laki-laki 190.5 190.5 381 Perempuan 190.5 190.5 381 Total 381 381 762
jenis kelamin Partai eta(i+) buruh konservatif Laki-laki 5.250 5.250 5.250 Perempuan 5.250 5.250 5.250 eta(+j) 5.250 5.250 5.250 ij ij 2
v
v
5, 25
G
51,89
STATISTIKA
UNIPA
SURABAYA
REKAPITULASI MODEL LOG LINIER
Interpretasi : terjadi penurunan G
2, dimana sesuai dengan
hipotesis yang dibangun dalam perbandingan model didapatkan
model jenuh (saturated model) adalah model terbaik
2
Model G
51,89
41,71
17,19
7,003
ij X ij i Y ij j X Y ij i j X ij iv
v
v
v
v
Y XY0,00
j ij
STATISTIKA
UNIPA
SURABAYA
Latihan Soal
Dalam suatu penelitian perusahaan, sejumlah data
dikumpulkan untuk menentukan apakah proporsi barang
yang cacat (X) yang dihasilkan oleh karyawan sama untuk
giliran shift pagi, sore atau malam (Y). Data berikut
menggambarkan barang yang diproduksi yang cacat untuk
shift pagi, sore, dan malam.Tentukan estimasi parameter
log linier dan berikan kesimpulan?
Kondisi Produk
Shift
Total Pagi Siang Malam
Cacat 45 55 70 170 Tidak cacat 905 890 870 2665 Total 950 945 940 2835
STATISTIKA
UNIPA
SURABAYA
TUGAS
Uraian
Tingkat Pemanfaatan TIK
Jarang Kadang-Kadang Sering SangatSering Ketersedian
Fasilitas Akse TIK
Sedikit 63 57 45 19 Banyak 13 35 49 46 Tentukan estimasi parameter log linier dan berikan kesimpulan? Gunakan perhitungan manual.
Lakukan analisis dan pembahasan sesuai dengan prosedur dalam Log Linier? Gunakan SPSS.
STATISTIKA
UNIPA
TERIMA KASIH
STATISTIKA
UNIPA
REGRESI LOGISTIK BINER
Oleh : Gangga Anuraga, S.Si M.Si
STATISTIKA
UNIPA
REGRESI LOGISTIK BINER
Menggambarkan hubungan antara variabel respon (berskala
kategori biner yaitu mempunyai dua kategori nilai 0 dan 1)dan
variabel prediktornya (kualitatif maupun kuantitatif).
Digunakan untuk memperkirakan apakah suatu kejadian akan
terjadi atau tidak dengan diketahuinya satu atau beberapa
variabel prediktor.
Model regresi logistik dapat pula digunakan untuk mengetahui
seberapa besar pengaruh variabel prediktor terhadap variabel
respon, sehingga dapat dikatakan bahwa, tujuan menggunakan
model ini adalah mencari model terbaik yang menggambarkan
hubungan antara variabel respon dengan variabel prediktornya.
STATISTIKA
UNIPA
DISTRIBUSI BERNOULLI
Variabel Y mengikuti distribusi Bernoulli dengan fungsi
probabilitas sebagai berikut :
1
( )
(1- ) dimana y = 0,1
jika y = 0, (
0 | ) 1
( ),
yang mana merupakan peluang untuk mendapatkan
hasil "gagal".
jika y = 1, (
1| )
( ),
yang mana merupakan peluang untuk mend
y y
f y
P y
x
x
P y
x
x
apatkan
hasil "sukses".
merupakan variabel prediktor yang dapat berupa kuantitatif
maupun kualitatif.
x
STATISTIKA
UNIPA
MODEL REGRESI LOGISTIK BINER
0 1|
merepresentasikan kondisional rata-rata (mean)
dengan prediktor x diketahui.
M enurut Hosmer dan Lameshow (2013),
model regresi logistik dapat dituliskan sbb :
x
E y x
e
x
0 1 0 11
dan transformasi dari
atau logit transformation
didefinisikan sbb :
ln
1
x xe
x
x
g x
x
x
STATISTIKA
UNIPA
SURABAYA
MODEL REGRESI LINIER Vs LOGISTIK
Perbedaan lain antara regresi linear dengan regresi logistik
adalah distribusi dari variabel respon.
2
Pada model regresi linear, variabel respon diasumsikan
sebagai
( )
dan ( )
|
dengan dinamakan error, ~ N(0,I
)
Pada regresi logistik biner, nilai error hanya terdiri dari dua kemungkinan,
ya
y
x
x
E y x
itu jika y = 1 maka
1
( ) dengan peluang ( )
atau jika y = 0 maka
( ) dengan peluang 1
( )
Jadi error mempunyai distribusi dengan mean sama dengan nol dan varians
( ) 1
( )
x
x
x
x
x
x
STATISTIKA
UNIPA
SURABAYA
PEMODELAN REGRESI LOGISTIK BINER
Data berpasanngan (x
i, y
i), i = 1,2,3…n, dan n merupakan
banyaknya sampel data.
i
i i
jika y = 1 dengan peluang ( )
atau jika y = 0 dengan peluang 1
( )
karena data berpasangan x ,
, maka
y = 1 dengan peluang ( ) dan
y = 0 dengan peluang 1
( )
Karena variabel respon dalam model reg
i i i
x
x
y
x
x
1resi logistik
mengikuti distribusi Bernoulli, maka fungsi kepadatan peluang
adalah sbb (Hosmer dan Lemeshow, 2013):
( ) 1
( )
i i y y i ix
x
STATISTIKA
UNIPA
SURABAYA
FUNGSI LIKELIHOOD
1 1 0 1Variabel respon diasumsikan bebas maka fungsi likelihood
dapat dituliskan sbb (Hosmer dan Lameshow, 2013) :
( ) 1
( )
...(1)
ˆ ˆ
ˆ
estimasi / taksiran
dan
dapat dicari dengan
memaks
i i n y y i i il
x
x
0 1 1 0imumkan terhadap dan . Dimana dengan me-ln kan
terlebih dahulu fungsi likelihood
. Berikut fungsi log-likelihood
ln
ln
( )
1
ln 1
( ) ...(2)
turunkan persamaan (2) terhadap dan
n i i i i il
L
l
y
x
y
x
1.
STATISTIKA
UNIPA
SURABAYA
CONTOH KASUS
Sumber data : buku Hosmer dan Lameshow (2013)
tentang coronary heart disease dengan sampel sebanyak
100
Hubungan antara umur (x) dengan penyakit jantung
koroner (y), y = 1 (terkena penyakit jantung koroner) dan
y = 0 (tidak terkena penyakit jantung koroner).
STATISTIKA
UNIPA
Hasil Estimasi SPSS
5 , 3 0 9 0 ,1 1 1* 5 , 3 0 9 0 ,1 1 1*ˆ
1
5 , 3 0 9
0 ,1 1 1 *
ˆ
u m u r u m u re
x
e
g
x
u m u r
STATISTIKA
UNIPA
SURABAYA
UJI SIGNIFIKANSI PARAMETER
1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 2 v ,H ip o te s is (U ji S e re n ta k ):
H :
0
H :
0
2 ln
1
ˆ
ˆ
a ta u
ln
ˆ
1
ln 1
ˆ
2
ln
ln
ln
2 9 , 3 1 d ib a n d in g k a n d e n g a n
i i n n n y y i i i n i i i i in
n
n
n
G
y
y
G
n
n
n
n
n
n
G
STATISTIKA
UNIPA
SURABAYA