PEMODELAN LOGLINIER G
2MENGGUNAKAN METODE
HIRARKIS BACKWARD DAN METODE FORWARD
SKRIPSI
SITI FATIMAH S
070803063
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS
BACKWARD DAN METODE FORWARD
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
SITI FATIMAH S 070803063
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD
Kategori : SKRIPSI
Nama : SITI FATIMAH S Nomor Induk Mahasiswa : 070803063
Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, Juni 2011
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Drs. Pasukat Sembiring, M.Si Dr. Sutarman, M.Sc
NIP. 19531113 198503 1 002 NIP. 19631026 199103 1 001
Diketahui/Disetujui oleh
Departemen Matenatika FMIPA USU Ketua,
Prof. Dr. Tulus, M.Si
NIP. 19620901 198803 1 002
PERNYATAAN
PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing – masing disebutkan sumbernya.
Medan, Juni 2011
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga skripsi ini dapat diselesaikan dalam waktu yang telah ditetapkan.
Penulis mengucapkan terima kasih kepada Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU dan Bapak Drs. Pasukat Sembiring, M.Si selaku para dosen pembimbing penulis pada penyelesaian skripsi ini yang telah mengarahkan penulis serta telah meluangkan waktu, tenaga, pikiran, dan bantuannya sehingga skripsi ini dapat selesai dengan tepat waktu. Kemudian ucapan terima kasih juga kepada Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika, Ibu Dra. Mardiningsih, M.Si selaku Sekretaris Departemen Matematika di FMIPA USU dan Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku penguji skripsi, serta semua staf pengajar beserta para pegawai pada Departemen Matematika FMIPA USU yang banyak membantu penulis.
Penulis juga mengucapkan terima kasih teristimewa kepada Ayahanda penulis Alm Ir. Zakaria Sihotang dan Ibunda tercinta Adek Palem yang senantiasa memberikan do’a, bantuan serta dorongan dalam penyelesaian skripsi ini. Akhirnya penulis mengucapkan terima kasih kepada Siti Hardianti, Rina, Novi, Dian S, Memel, Kesi, Warsini, Rizky dan teman-teman lain yang tidak dapat penulis sebutkan namanya satu per satu atas bantuannya dalam menyelesaikan skripsi ini serta tidak lupa penulis mengucapkan terima kasih kepada Ibu Nasrah yang juga banyak membantu.
Penulis hanya bisa memanjatkan do’a semoga Allah SWT akan membalas segala kebaikan dan bantuan yang diberikan kepada penulis. Semoga apa yang penulis perbuat akan selalu diridhoi oleh sang pemilik ilmu. Amin Ya Robbal Alamin.
Akhirnya sebagai seorang mahasiswa, penulis menyadari bahwa masih banyak terdapat kekurangan dalam menyelesaikan skripsi ini. Oleh karena itu, kritik dan saran yang membangun diharapkan demi perbaikan skripsi ini.
Medan, Juni 2011
Penulis,
ABSTRAK
Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.
LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL
BACKWARD AND FORWARD METHOD
ABSTRACT
Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.
DAFTAR ISI
Halaman
Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak v
Abstract vi
Daftar Isi vii-viii Daftar Tabel ix
Bab 1 Pendahuluan 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 3
1.3 Batasan Masalah 3
1.4 Tujuan Penelitian 4
1.5 Kontribusi Penelitian 4
1.6 Metodologi Penelitian 4
1.7 Tinjauan Pustaka 5
Bab 2 Landasan Teori 9
2.1 Analisis Model Loglinier 9
2.1.1 Distribusi Poisson 10
2.1.2 Model Loglinier Poisson 12
2.2 Asumsi Teorikal Untuk Model Loglinier 13
2.3 Tabel Kontingensi 15
2.3.1 Tabel Kontingensi Dua Faktor 15
2.3.2 Tabel Kontingensi Tiga Faktor 18
2.4 Pengujian Kecocokan Model 20
2.5 Seleksi Model 22
2.6 Metode Hirarkis Backward 23
2.7 Metode Forward 23
Bab 3 Pembahasan 24
3.1 Pendekatan Hirarkis untuk Pemodelan Loglinier 24
3.1.1 Model Lengkap 25
3.1.2 Model Non-lengkap 26
3.2 Konfigurasi Model Loglinier Tiga Faktor 27
3.3 Derajat Bebas 28
3.4 Algoritma Backward 28
3.5 Algoritma Forward 30
3.6 Analisis Residu 31
Bab 4 Kesimpulan dan Saran 47
4.1 Kesimpulan 47
4.2 Saran 48
Daftar Pustaka 49
Lampiran A: Output Nilai G2 dan Estimasi Parameter Untuk Model Lengkap 50 Lampiran B: Output Proses Eliminasi Hirarkis Backward 52 Lampiran C: Output Proses Penambahan Forward Secara Berurutan 54 Lampiran D: Nilai Kritis Distribusi Chi-Square
2 62
DAFTAR TABEL
Halaman
Tabel 2.1 Tabel Kontingensi I × J 16
Tabel 2.2 Tabel Kontingensi I × J × K 18
Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor 27
Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor 28
Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor 32
Tabel 3.4 Tabel Proses Eliminasi Hirarkis Backward 35
Tabel 3.5 Tabel Untuk K-faktor dan Efek Order yang Lebih Tinggi 38
Tabel 3.6 Tabel Asosiasi Parsial 40
Tabel 3.7 Tabel Proses Penambahan Forward Secara Berurutan 42
Tabel 3.8 Tabel Residu Untuk Model Akhir 46
ABSTRAK
Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.
LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL
BACKWARD AND FORWARD METHOD
ABSTRACT
Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Model Loglinier adalah salah satu kasus khusus dari general linier model untuk data
yang berdistribusi poisson. Model loglinier juga disebut sebagai suatu model statistik
yang berguna untuk menentukan depedensi (kecenderungan) antara beberapa variabel
yang berskala kategorik. Variabel didefinisikan sebagai suatu yang beragam atau
bervariasi dan skala kategorik merupakan transformasi fungsi nilai dari empat skala
ukuran observasi yang ada yaitu skala nominal, ordinal, rasio dan interval. Dengan
pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi.
Tabel kontingensi digunakan jika terdapat lebih dari satu variabel kategorik, yang
mana biasanya data disajikan dalam daftar baris dan kolom. Variabel kategorik yang
ada dianalisis dengan mengambil nilai logaritma natural dari frekuensi untuk setiap sel
dalam tabel kontingensi. Dari tabel kontingensi yang terbentuk, model loglinier akan
menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Model
loglinier tidak hanya dapat digunakan untuk menganalisis hubungan yang terjadi antar
dua variabel kategorik, tetapi juga dapat digunakan untuk mengevaluasi tabel
kontingensi multifaktor yang meliputi tiga variabel atau lebih.
Model loglinier sangat bergantung pada jumlah variabel yang akan dianalisis.
Penggunaan variabel yang dibahas pada penulisan ini dikelompokkan pada dua jenis
yaitu variabel dependen dan variabel independen. Variabel dependen adalah variabel
yang keberadaannya dipengaruhi oleh variabel lainnya. Sedangkan variabel
Analisis loglinier digunakan untuk menganalisis pola hubungan antar
sekelompok variabel kategorik yang mencakup mulai dari asosiasi satu variabel,
asosiasi dua variabel, asosiasi tiga variabel atau lebih, baik secara simultan maupun
secara parsial. Pola hubungan antar variabel dapat dilihat dari interaksi antar variabel
itu sendiri, termasuk kemungkinan adanya hubungan sebab akibat atau hubungan
kausal diantara variabel – variabel yang ada.
Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang
diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata
lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel
independen karena model loglinier hanya menunjukkan depedensi (kecenderungan)
antar variabel. Andaikan terdapat pembedaan yang dibuat antara satu atau lebih
variabelnya yang diperlakukan sebagai variabel independen dan variabel lainnya
sebagai variabel dependen, maka penggunaan analisis yang sesuai ialah dengan
analisis Regresi Logistik. Analisis Regresi Logistik digunakan untuk memprediksi
variabel yang bersifat kategorik (biasanya dikotomis) oleh seperangkat variabel
independen (Jeansonne, 2002).
Analisis model loglinier bergantung pada jumlah variabel dependen yang
termuat di dalamnya. Untuk penulisan ini akan diuraikan tentang model loglinier yang
membahas analisis hubungan antara tiga variabel yang disebut dengan analisis
trivariat. Model seperti ini disebut juga sebagai model loglinier tiga faktor. Model
loglinier tiga faktor memuat semua parameter yang mungkin dan tidak dapat dimasuki
oleh parameter – parameter lainnya. Model seperti ini disebut sebagai model lengkap.
Secara umum model loglinier tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ
Setelah jumlah variabel kategorik diselidiki, pembentukan model loglinier
penting untuk diteliti yang berguna untuk menentukan kecocokan model yang
karena tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang
ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan.
Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara
sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi
faktor model yang ada sebelum membentuk suatu model yang memang tepat dan
signifikan setelah melalui uji kecocokan modelnya.
Dalam hal ini akan dilakukan teknik pemodelan loglinier yang akan digunakan
sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk
model permasalahan. Jenis prosedur yang penulis gunakan dalam penyelesaian
pemodelan loglinier terbagi pada dua jenis, yaitu prosedur yang memakai metode
Hirarkis Backward dan prosedur pemodelan yang menggunakan metode Forward.
Untuk keperluan analisis data yang memuat hubungan tiga variabel dengan
menggunakan skala kategorik difokuskan pada bagaimana penentuan model dengan
melakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun
3-faktor dengan menggunakan uji goodness of fit model G2 untuk menguji kecocokan
modelnya. Pengolahan data dilakukan dengan software SPSS 15.0 for Windows.
1.2 Rumusan Masalah
Masalah yang akan dibahas dalam penulisan ini ialah melakukan prosedur pemodelan
loglinier menggunakan metode Hirarkis Backward dan metode Forward, kemudian
membandingkan kedua metode dalam hal mendapatkan suatu model akhir yang
menggambarkan hubungan antar variabel yang diselidiki.
1.3 Batasan Masalah
Ruang lingkup dari penulisan ini dibatasi pada melakukan suatu teknik pemodelan
loglinier menggunakan metode Hirarkis Backward dan metode Forward dengan uji
1.4 Tujuan Penelitian
Tujuan penulisan ini adalah melakukan prosedur pemodelan loglinier menggunakan
metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode
tersebut untuk dipilih sebagai metode yang yang lebih baik dalam membentuk model.
1.5 Kontribusi Penelitian
Hasil penulisan ini adalah:
1. Dapat menerapkan analisis tabel kontingensi dan metode pemodelan loglinier
yang ada untuk penyelesaian permasalahan yang berkaitan dengan berbagai
bidang kehidupan agar lebih mudah diolah, sehingga jelas tujuannya.
2. Dengan penulisan ini penulis berharap dapat menambah referensi bagi
pembaca yang dapat digunakan sebagai alat untuk mengklasifikasikan data
yang ingin diteliti dalam memutuskan suatu masalah.
1.6 Metodologi Penelitian
Dalam penulisan ini penulis melakukan studi dengan meneliti buku-buku yang
membahas mengenai model loglinier dan metode Hirarkis Backward dan Forward
dalam hal pemodelannya, yaitu:
1. Mengumpulkan dan mempelajari buku-buku yang berkaitan dengan materi
penulisan.
2. Menentukan jumlah variabel kategorik yang akan diselidiki sebelum dilakukan
prosedur pemodelan.
3. Menguraikan perbedaan penyelesaian pemodelan loglinier menggunakan
4. Pemodelan dilakukan melalui suatu proses seleksi sampai model akhir
terbentuk yang mana setiap kali variabel dihapus maupun ditambahkan pada
model, dilakukan pengujian terhadap interaksi faktor model baik tingkat
2-faktor maupun 3-faktor menggunakan uji rasio likelihood 2
G dan
melihat p-value yang dihasilkan untuk menguji kecocokan modelnya.
5. Menyelesaikan contoh permasalahan untuk memilih metode yang lebih
baik dalam membentuk suatu model.
1.7 Tinjauan Pustaka
Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk
setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk
memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap
independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi
2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan
jumlah independen sehingga model seperti ini sering disebut juga sebagai model
lengkap (chass.ncsu.edu, 3 Oktober 2010).
Secara umum model lengkap untuk tiga variabel kategorik dapat ditulis sebagai
berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ (1) dengan:
logmˆijk = Logaritma dari frekuensi sel ijk
= konstanta atau rata – rata logaritma seluruh sel ijk X
i
= Parameter pengaruh variabel pertama yang ke-i terhadap model
Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Z
k
= Parameter pengaruh variabel ketiga yang ke-k terhadap model
variabel kedua yang ke-j terhadap model
ikXZ = Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model
YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam
tabel kontingensi. Friendly (2000) menyatakan tabel kontingensi digunakan ketika
terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam
daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya
disebut daftar kontingensi. Analisis tabel kontingensi ini merupakan teknik
penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam
satu tabel. Untuk menginterpretasikan data pada tabel kontingensi, salah satu yang
dapat digunakan adalah dengan uji Chi-Square.
Uji Chi-Square dilambangkan dengan 2
, yang digunakan untuk mengetahui
adanya hubungan antara variabel yang diukur signifikan atau tidak. Dalam hal ini
analisis variabel yang diukur sebanyak tiga variabel atau yang disebut sebagai analisis
trivariat. Hipotesis yang berlaku untuk ketiga variabel yang independen dengan
asumsi tidak terdapat interaksi antar variabel, yaitu:
H0 :Pijk Pi..P.j.P..k
H1:Pijk Pi..P.j.P..k
Statistik uji Chi-Square yang digunakan untuk menguji hubungan antar variabel dapat
dirumuskan sebagai berikut:
i j k ijkijk ijk
m m Y
ˆ ˆ 2 2
(2)
i j k ijk
ijk ijk
m Y Y
G
ˆ ln 2
2
(3)
dengan:
ijk
Y = Observasi pada variabel i, j, dan k
ijk
mˆ = Frekuensi yang diharapkan untuk Yijk
degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05
Kriteria uji:
Tolak H0 jika 2 atau G2 hitung 2df; dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆijk iX Yj Zk diterima.
Pencarian Solusi
Pencarian solusi permasalahan pemodelan loglinier dapat dilakukan dengan
menentukan suatu model secara fleksibel dan mendalam serta memilih variabel
independen secara inklusif dengan tepat. Hal ini memungkinkan untuk menemukan
variabel independen yang terbaik yang dapat dipakai serta melihat pada kecocokan
model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dalam hal ini
dapat menggunakan beberapa metode yang akan digunakan sebagai perbandingan
dalam pemilihan metode yang lebih baik dalam membentuk suatu model akhir.
Metode – metode itu diantaranya adalah metode iteratif Hirarkis Backward, Forward
dan lain – lain.
1) Metode Hirarkis Backward
Pemodelan loglinier dengan metode Hirarkis Backward akan membentuk model
dengan menyeleksi model lengkap dan mulai menghapus interaksi yang lebih tinggi
sampai uji kecocokan dari model menjadi tidak dapat diterima lagi berdasarkan
standar probabilitas atau p-value yang diadopsi oleh penyidik. Model lengkap
mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun
3-faktor sesuai dengan jumlah variabel yang diselidiki dalam penelitian ini. Dimana
setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi
prediksinya dengan membandingkan uji rasio likelihood G2 dengan 2df; (Chapter 14, 2 November 2010).
2) Metode Forward
Penggunaan metode forward yang digunakan dalam penelitian ini menggunakan dua
cara yang berbeda namun prinsipnya hampir sama. Agresti (1990) menjelaskan
pengerjaan metode ini dimulai dengan dibentuknya model independen dan
menambahkan istilah interaksi yang lebih kompleks sampai suatu hasil uji fit diterima
yang tidak dapat ditingkatkan dengan menambahkan peraturan lebih lanjut. Dengan
kata lain, metode ini memilih variabel terlemah hingga terkuat secara bertahap.
Friel (2005) menjelaskan pemodelan loglinier dengan metode forward
dilakukan dengan dibentuknya model sederhana (model order nol) kemudian
menambahkan efek order pertama, order kedua, dan order ketiga untuk diuji
BAB 2
LANDASAN TEORI
2.1 Analisis Model Loglinier
Untuk data yang bersifat kategorik dan dapat dibentuk pada suatu tabel kontingensi,
dapat dianalisis dengan analisis model loglinier. Model loglinier digunakan untuk
menganalisis kemungkinan adanya hubungan yang signifikan dalam tabel kontingensi
multifaktor yang memiliki tiga atau lebih variabel kategorik yang diterapkan pada
kasus-kasus data kualitatif. Dalam hal ini pola hubungan atau asosiasi antar
variabelnya dapat dilihat dari interaksi antar variabel itu sendiri.
Pada umumnya terdapat dua jenis data berdasarkan pengklasifikasiannya,
yakni data kuantitatif dan data kualitatif. Data kuantitatif adalah data yang berbentuk
angka atau data yang diukur dalam skala numerik yang diperoleh melalui suatu hasil
perhitungan dan pengukuran. Sedangkan data kualitatif adalah data yang
menunjukkan sifat atau keadaan objek berupa label atau nama-nama yang digunakan
untuk mengidentifikasi atribut suatu elemen yang mana dalam hal pengumpulannya
disajikan menurut kualitas atau kategorik yang digunakan. Dalam hal ini yang akan
dipergunakan dalam model loglinier ialah data kualitatif karena variabel yang
dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal.
Secara umum bentuk model loglinier dapat ditulis sebagai berikut (Von eye, 2002):
log ˆ ...,
int sec
int
0
eraction ondorder
ijk eraction
firstorder ij s
maineffect i ijk
m (2.1)
Adapun tujuan dari melakukan analisis model loglinier adalah:
1. Pada analisisnya difokuskan pada kecocokan model yang memperhatikan ada
atau tidaknya interaksi antar variabel.
2. Untuk menghitung atau memperkirakan banyaknya observasi yang
diharapkan (expected counts) dalam tiap-tiap sel populasi dari tabel yang dibentuk
oleh kelompok yang diperhatikan.
Pada analisis model loglinier, prosedur untuk pemasukan variabel - variabel ke
dalam model dilakukan secara independen dan berguna untuk menjelaskan distribusi
kasus dalam tabulasi silang untuk variabel kategorik. Dengan demikian, analisisnya
meliputi distribusi yang diharapakan dari variabel kategorikal tersebut ialah distribusi
Poisson yang akan membentuk suatu model Poisson.
2.1.1 Distribusi Poisson
Distribusi Poisson dibangun atas suatu percobaan yang menghasilkan jumlah sukses
yang terjadi pada interval waktu ataupun pada daerah tertentu yang dikenal sebagai
percobaan Poisson. Percobaan Poisson adalah percobaan yang menghasilkan peubah
acak X yang bernilai numerik, yaitu jumlah sukses selama selang waktu tertentu atau
dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam,
sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu meter, satu
kilometer persegi dan lain-lain.
Distribusi Poisson adalah distribusi kemungkinan dari variabel acak Poisson x
yang menjelaskan jumlah sukses yang terjadi pada interval waktu ataupun daerah
tertentu. Dinotasikan sebagai:
! . ;x e x
p
x
dengan:
= jumlah rata-rata sukses terjadi e = bilangan natural = 2,71828...
Distribusi Poisson ini juga merupakan salah satu model distribusi probabilitas
untuk variabel diskrit. Model ini merupakan model pendekatan untuk menghitung
probabilitas timbulnya gejala yang diharapkan (gejala “sukses”) dari sejumlah n
peristiwa atau sampel. Ciri distribusi seperti itu memiliki kemiripan yang hampir sama
dengan distribusi Binomial. Tetapi, untuk kasus nilai n yang sangat besar (n )
dan peluangnya yang sangat kecil (p 0) sukar sekali menghitung nilai
probabilitasnya dengan model distribusi Binomial. Oleh karena itu, nilai probabilitas
dapat dihitung dengan pendekatan Distribusi Poisson.
Sekarang andaikan X adalah variabel acak binomial dengan distribusi
probabilitas b(x;n, p). Jika n , p 0, dan np konstan, maka distribusi Binomial dapat didekati oleh distribusi Poisson, yakni:
b(x; n, p) p(x; )
b
x;n,p
Cxnpx
1 p nx n,p0
! . ;x e x
p
x
Ekspektasi Harapan Distribusi Poisson
Distribusi Poisson merupakan salah satu dari beberapa distribusi probabilitas diskrit.
Variabel acak yang terdapat pada distribusi ini jelas bersifat diskrit (berdasarkan hasil
hitungan). Nilai harapan variabel acak diskrit adalah rata-rata tertimbang dari seluruh
kemungkinan.
Secara umum, rumus untuk nilai ekspektasi probabilitas diskrit adalah:
E(X)x
xi.p
xi (2.3)
0 ! . . x x x e x X E
0( )( 1)! . . x x x x e
x
0( 1)! .
x
x
x
e
1 1 1 1 )! 1 ( . )! 1 ( . x x x x x e x e jika x1 y, maka bentuk
1 1 )! 1 ( . x x x e =
0 ! . y y y e .karena
0 1 ! . y y y e
, maka diperoleh
1. ! . 0 y y y e. Jadi, ekspektasi
harapan untuk distribusi Poisson adalah .
2.1.2 Model Loglinier Poisson
Seperti yang penulis sebutkan pada bab awal penulisan, model loglinier
merupakan salah satu kasus khusus dari general linier model. Dalam hal ini komponen
acak merupakan salah satu jenis dari tiga komponen utama untuk general linier model.
Komponen acak berguna untuk mengidentifikasi distribusi probabilitas dari variabel
dependen, dengan memisalkan yi = (y1, y2, . . . , yk). Sehingga bentuk fungsi
peluangnya adalah:
f
yi;i
ai b yi exp
yi
i
(2.4)Kelompok ini memuat beberapa distribusi yang penting sebagai kasus khusus,
misalnya distribusi Poisson. Nilai parameter i pada persamaan (2.4) untuk i =1, 2, 3, . . . , k tergantung pada nilai dari variabel peramalnya yaitu sebagai variabel
Kemudian dengan memisalkan y jumlah observasi di dalam sel i yang terdistribusi i
Poisson dengan rata-rata i, maka fungsi padat peluang Poisson untuk y adalah: i
! . ; i y i i i y e y f i i
! exp i y i y i i
i
i
ii y
y
exp log ! 1 exp
(2.5)
Dengan yi adalah bilangan bulat positif.
Persamaan (2.5) sama saja dengan bentuk eksponensial sejati pada persamaan (2.4)
yang mana a
i a i exp
i ,
! 1 i i y y
b , dan
i log
i dengan
isebagai parameter sejati.
Untuk distribusi Poisson dalam kaitannya dengan istilah struktur yang
sistematis dari sebuah model, dapat dipertimbangkan tiga jenis model loglinier untuk
menghitung frekuensi yang diharapkan, yaitu: model order nol, model penambahan,
dan model lengkap. Inilah pembagian jenis model yang akan dipergunakan sebagai
pemilihan dalam menentukan apakah salah satu dari ketiga jenis model di atas dapat
digunakan untuk mewakili hubungan dari kumpulan data dalam pemodelan loglinier
yang akan dilakukan.
2.2 Asumsi Terorikal Untuk Model Loglinier
Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki
mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak
ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena
model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel.
tersebut terbagi menjadi variabel independen dan dependen, maka (Von eye, 2002)
terdapat beberapa hal yang harus diperhatikan. Berikut ini akan dijelaskan beberapa
contoh model loglinier yang biasa digunakan.
Jika tidak ada variabel yang mempengaruhi model (zero-order), model
loglinier secara umum (Von eye, 2002) adalah sebagai berikut:
logE(Y) (2.6)
dengan: E(Y) Frekuensi yang diharapkan dalam setiap sel
constant atau rata-rata umum
Jika semua variabel mempunyai status yang sama, dan hanya Main effect atau efek
utama yang digunakan (first-order), model loglinier secara umum (Von eye, 2002)
adalah sebagai berikut:
logE(Yij..)iX Yj ... (2.7)
dengan: E(Yij..) = Frekuensi yang diharapkan dalam setiap sel
= constant atau rata-rata umum
Xi = Parameter pengaruh tingkat ke-i faktor X Yj = Parameter pengaruh tingkat ke-j faktor Y
Jika variabel-variabel yang akan diteliti terbagi menjadi variabel independen dan
variabel dependen, dimisalkan terdapat dua variabel independen A dan B dan dua
variabel dependen C dan D, model loglinier yang dipergunakan adalah sebagai berikut
(Von eye, 2002):
E
Yijkl Ai Bj ABij Ck Dl CDkl (2.8)dengan: E
Yijkl = Frekuensi yang diharapkan dalam setiap sel
Bj = Pengaruh tingkat ke-j faktor B
ABij = Interaksi tingkat ke-i dan j faktor A dan B
C = Pengaruh tingkat ke-k faktor C k
D = Pengaruh tingkat ke-l faktor D l
CD = Interaksi tingkat ke-k dan l faktor C dan D kl
Model tersebut diasumsikan bahwa penelitian tidak menginginkan adanya interaksi
antar variabel independen dan variabel dependen.
2.3 Tabel Kontingensi
Tabel kontingensi merupakan suatu analisis teknik penyusunan data yang cukup
sederhana untuk melihat hubungan antar variabel dalam satu tabel (Friendly, 2000).
Dalam hal ini, variabel yang dianalisis merupakan variabel kategorik yang memiliki
skala nominal atau ordinal. Penggunaan tabel kontingensi yang akan dibahas pada
penelitian ini penulis kelompokkan menjadi dua yaitu tabel kontingensi dua faktor dan
tabel kontingensi tiga faktor.
2.3.1 Tabel Kontingensi Dua Faktor
Tabel kontingensi mulai digunakan ketika terdapat lebih dari satu variabel kategorik
yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian
dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Andaikan
terdapat suatu percobaan yang terdiri dari n pengamatan yang diklasifikasikan
menurut 2 variabel kategorik, maka variabel 1 mempunyai i tingkat/kategorik: A1,
A2, A3, . . . , Ai dan variabel 2 mempunyai j tingkat/kategorik: B1, B2, B3, . . . , Bj .
Kemudian anggap Yij menyatakan banyak peristiwa variabel-1 ada pada
tingkat ke-i dan variabel-2 pada tingkat ke-j, dengan i = 1, 2, 3, . . . , I dan j = 1, 2, 3,
Tabel 2.1 Tabel Kontingensi I × J
Variabel 2
B 1 B 2 B . . . 3 Bj Jumlah baris
Variabel 1
A 1 Y 11 Y 12 Y . . . 13 Y1j n 1
A 2 Y 21 Y 22 Y . . . 23 Y2j n 2
A 3 Y 31 Y 32 Y . . . 33 Y3j n 3
. . . . . . . . . . . . . . . . . .
A i Y b1 Y b2 Y . . . b3 Ybj n i
Jumlah kolom m 1 m 2 m . . . 3 mj nm1 ...mj
n1...ni
Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk masing-masing sel
dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk A dan i
j
B . Probabilitas untuk A = i P dan probabilitas untuk i. Bj = P.j. Kemudian, untuk menghitung besarnya P dan i. P.j dapat ditaksir dengan
N n Pˆi. i ,
N m
Pˆ.j j , sehingga
taksiran nilai harapannya adalah
N m n P P N
mij i j i j
. ˆ . ˆ .
ˆ . . .
Dari tabel kontingensi dua faktor yang terbentuk, model loglinier akan
menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Dengan
demikian, bentuk model loglinier untuk dua faktor dapat ditulis sebagai berikut:
Model di atas disebut sebagai model lengkap karena memasukkan semua efek
yang mungkin terbentuk, baik itu efek untuk 1-faktor dan juga efek 2-faktor. Sebagai
contoh misalkan dalam tabel kontingensi 2X2, maka akan terdapat empat parameter
yang terdiri dari ,iX,Yj,ijXY. Kemudian jika ingin mendapatkan sebuah model yang dapat menghilangkan salah satu efek di atas yang tidak memberikan kecocokan
terbaik dengan model, maka model non-lengkap harus dibentuk.
Pembentukan model ini dapat dilakukan dengan membuat beberapa efek
parameter menjadi bernilai nol. Misalkan dianggap ijXY 0 (diasumsikan bahwa variabel X tidak berasosiasi dengan variabel Y), maka model yang terbentuk akan
menjadi model loglinier non-lengkap sebagai berikut:
logmˆij iX Yj (2.10)
Bentuk model seperti ini disebut sebagai model independen karena hanya memuat
efek utamanya saja yakni X dan Y tanpa interaksi.
Uji keindependenan model loglinier untuk dua faktor, yaitu:
j i ij PP
P
H0 : . .
j i ij P P
P
H1: . .
Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:
i j ijij ij m m Y ˆ ˆ 2 2
(2.11)
Sedangkan untuk uji kecocokan datanya dengan uji Rasio Likelihood dapat
dirumuskan:
i j ij
ij ij m Y Y G ˆ ln 2 2 (2.12) dengan: ij
Y = Observasi pada variabel i dan j
ij
mˆ = Frekuensi yang diharapkan untuk Yij
Kriteria Uji:
Tolak H0 jika 2 atau G2 hitung 2df; dengan kata lain terdapat asosiasi antara dua variabel yang diselidiki dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆij iX Yj diterima.
2.3.2 Tabel Kontingensi Tiga Faktor
Seperti halnya pada tabel kontingensi I × J yang mempunyai i
tingkat/kategorik untuk variabel pertama dan mempunyai j tingkat/kategorik untuk
variabel kedua, maka pada tabel kontingensi I × J × K juga berlaku sama. Misal Yijk
menyatakan banyak peristiwa variabel-1 ada pada tingkat ke-i, variabel-2 pada tingkat
ke-j, dan variabel-3 pada tingkat ke-k, dengan i = 1, 2, 3, . . . , I , j = 1, 2, 3, . . . , J
dan k = 1, 2, 3, . . . , K. Maka data tersebut dapat disusun dalam tabel kategorik
I × J × K sebagai berikut:
Tabel 2.2 Tabel Kontingensi I × J × K
Variabel 2
Jumlah
1 2 ... j
Variabel 3 1 2 ... k
V a r i a b e l
1
1 ... ..
2 ... ..
⋮ ⋮ ⋮ … ⋮ ⋮
i … ..
Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk tiap sel
dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk Yi.., Y. j.,
dan Y..k. Probabilitas untuk Yi.. = P , probabilitas untuk i.. Y. j. = P. j. dan probabilitas untuk Y..k = P..k. Kemudian, untuk menghitung besarnya P , i.. P. j., dan P...k dapat
ditaksir dengan
N Y
P i
i .. ..
ˆ ,
N Y
Pˆ.j. .j., dan
N Y
P k
k .. ..
ˆ , sehingga taksiran nilai
harapannya adalah mˆijk N.Pi..P.j.P..k
..
.2.
..N Y Y
Yi j k
.
Dari tabel kontingensi tiga faktor yang terbentuk, model loglinier akan
menggambarkan pola asosiasi atau hubungan yang terjadi antar tiga variabel. Dengan
demikian, bentuk lengkap model loglinier untuk tiga faktor dapat ditulis sebagai
berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ (2.13)
dengan:
logmˆijk = Logaritma dari frekuensi sel ijk = rata – rata logaritma seluruh sel ijk
Xi = Parameter pengaruh variabel pertama yang ke-i terhadap model Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Zk = Parameter pengaruh variabel ketiga yang ke-k terhadap model ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan variabel kedua yang ke-j terhadap model
XZ ik
= Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model
YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
Kemudian, jika diasumsikan dari model di atas interaksi ijXY, ikXZ, ikXZ, YZjk , serta XYZ
ijk
bernilai 0, maka hal ini berarti X, Y,dan Z secara masing-masing tidak berasosiasi dan hanya main effects (efek utama) nya saja yang berhubungan secara
independen. Model loglinier independen untuk tiga faktor dapat ditulis sebagai
berikut:
logmˆijk iX Yj Zk (2.14)
Uji keindependenan model loglinier untuk tiga faktor, yaitu:
H0 :Pijk Pi..P.j.P..k
H1:Pijk Pi..P.j.P..k
Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:
i j k ijkijk ijk
m m Y
ˆ ˆ 2 2
(2.15)
dengan:
ijk
Y = Observasi pada variabel i, j, dan k
ijk
mˆ = Frekuensi yang diharapkan untuk Yijk
degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05
Kriteria Uji:
Tolak H0 jika 2 hitung 2df; dengan kata lain terdapat asosiasi antar ketiga variabel dan terima H0 jika 2 hitung < 2df; dengan kata lain model
Z k Y
j X i ijk
mˆ
log diterima.
2.4 Pengujian Kecocokan Model
Pengujian analisis model loglinier dapat dilakukan dengan dua pendekatan uji
1. Pendekatan Uji Chi-Square
Uji Chi-Square yang digunakan untuk mengetahui hubungan dari tiga variabel
yang diselidiki dapat ditulis sebagai:
i j k ijkijk ijk
m m Y
ˆ ˆ 2 2
(2.16)
2. Pendekatan Uji Rasio likelihood G2
Pendekatan ini digunakan untuk menguji kecocokan model yang
memperhatikan ada atau tidaknya interaksi antar variabel. Dengan kata lain uji
ini melihat seberapa cocok model dengan data. Untuk tabel tiga faktor dapat
ditulis sebagai berikut:
i j k ijk
ijk ijk
m Y Y
G
ˆ ln 2
2
(2.17)
degree of freedom nya disesuaikan dengan model yang terbentuk selama proses
seleksi dan diambil 0,05
Kriteria uji:
Tolak H0 jika 2 atau G2 2df; atau p-value < yang berarti terdapat hubungan yang signifikan antar interaksi variabel ataupun komponen yang sedang
diuji sehingga menyebabkan adanya depedensi dan terima H0 jika 2 atau G2
2df; yang berarti tidak terdapat hubungan yang signifikan.
Pengujian statistik rasio likelihood ini tidak hanya dapat digunakan untuk
menguji satu model saja, tetapi juga dapat digunakan terhadap dua model untuk
melihat perubahan nilai yang ada. Pada titik ini uji rasio likelihood dapat digunakan
untuk membandingkan model secara keseluruhan dengan model yang lebih rendah
(yaitu membandingkan model lengkap dengan satu interaksi atau pengaruh utama
yang lebih rendah) untuk menilai hubungan diantara kedua model itu. Persamaannya
2
1 22 2
M G M G
G perbandingan (2.18)
2 2M
G = statistik likelihood G2 untuk model (2)
12
M
G = statistik likelihood G2 untuk model (1)
Derajat kebebasan (degree of freedom) = derajat kebebasan model (2) - derajat
kebebasan model (1).
2.5 Seleksi Model
Bagian ini menjelaskan tentang strategi untuk memilih model loglinier setelah
variabel kategorik diselidiki. Strategi dasar dalam pemodelan loglinier melibatkan
model yang cocok untuk frekuensi yang diamati dalam tabulasi silang variabel
kategorik. Model kemudian dapat diwakili oleh satu set frekuensi harapan yang
mungkin. Setelah frekuensi harapan diperoleh, kemudian membandingkan
model-model yang hirarkis satu sama lain dan menyeleksi model-model yang terbentuk yang
merupakan model yang paling signifikan yang sesuai dengan data.
Dalam hal pengerjaannya proses seleksi untuk memilih model akan menjadi
sulit bersamaan dengan meningkatnya jumlah variabel karena terjadinya peningkatan
yang pesat dalam asosiasi yang mungkin dan interaksi yang ada. Pencocokan semua
model yang mungkin menjadi tidak praktis ketika jumlah variabel kategorik melebihi
tiga. Oleh karena itu, seleksi model bertujuan untuk menyeimbangkan dua tujuan yang
membahas beberapa hal di bawah ini (Friel, 2005):
a. Permasalahan mengenai komponen manakah dari model yang signifikan.
b. Manakah model yang paling cocok dengan data yang digunakan.
Maka dari itu, terdapat dua metode yang digunakan untuk menentukan signifikansi
dari komponen-komponen dalam model yaitu dengan dengan Metode Hirarkis
2.6 Metode Hirarkis Backward
Metode Hirarkis Backward digunakan untuk menganalisis proses terbentuknya sebuah
model loglinier hirarkis non-lengkap yang dilakukan dengan menyeleksi dari model
lengkap hingga pada model yang sederhana. Model lengkap mencakup semua
kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai
dengan jumlah variabel yang digunakan dalam penelitian ini, yakni sebanyak tiga
variabel kategorik. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk
menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood 2
G
dengan 2df; (Chapter 14, hal: 144). Mengingat bahwa model lengkap ini memiliki jumlah yang sama sel-sel nya dalam tabel kontingensi, seperti halnya efek dan
frekuensi sel yang diharapkan akan selalu bernilai sama dengan frekuensi yang
diamati tanpa derajat kebebasan yang tersisa (Knoke dan Burke, 1980 dikutip dari
Jeansonne).
Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat
ditulis sebagai berikut:
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ
2.7 Metode Forward
Metode Forward digunakan untuk menganalisis proses penambahan
komponen-komponen model menjadi signifikan untuk model akhir dengan dibentuknya sebuah
model order nol kemudian menambahakan efek order pertama, order kedua, dan order
ketiga. Setelah itu, pada setiap tahap dipilih efek order yang memberikan peningkatan
signifikansi terbesar dalam kesesuaian datanya setelah dilakukan pengujian (Friel,
2005). Akan tetapi, (Agresti, 1990) menjelaskan metode ini lebih dikenal sebagai
suatu metode yang digunakan untuk mengevaluasi sebuah model yang proses
pemodelannya dilakukan dengan dibentuknya model independen sampai model
lengkap. Nilai p-maksimum untuk model yang dihasilkan adalah kriteria yang
mungkin karena akan menghasilkan nilai G2 yang kecil, yang berarti baik untuk
model. Bentuk umum model loglinier order nol untuk tiga variabel kategorik, yaitu:
BAB 3
PEMBAHASAN
3.1 Pendekatan Hirarkis Untuk Pemodelan Loglinier
Untuk menyelesaikan suatu masalah yang berhubungan dengan model yang akan
terbentuk dari variabel kategorik yang diselidiki, maka pemodelan loglinier penting
untuk dilakukan. Hal ini berguna untuk menentukan kecocokan model yang
memperhatikan ada atau tidaknya interaksi antar variabel karena ternyata tidak semua
interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model
lengkap menjadi signifikan dalam suatu model yang akan terbentuk. Tentunya akan
menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam
model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang
ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah
melalui uji kecocokan datanya.
Dalam hal ini untuk mendapatkan model yang dapat mewakili kumpulan data
secara tepat yang berkaitan dengan hal di atas, cara yang dapat dilakukan adalah
dengan melakukan suatu teknik pemodelan loglinier dengan dua metode, yakni
dengan metode Hirarkis Backward dan metode Forward. Metode-metode ini dapat
diselesaikan dengan bantuan program komputer.
Metode Hirarkis Backward dapat digunakan untuk menguji satu per satu
model yang memuat efek 1-faktor untuk setiap variabel serta semua efek interaksi
2-faktor dan interaksi 3-2-faktor. Apabila melalui hasil uji terdapat interaksi yang tidak
memberikan kecocokan yang baik dengan data, maka harus dikeluarkan dan begitu
seterusnya. Dengan demikian, metode ini lebih dikenal dengan mengeliminasi model
3.1.1 Model Lengkap
Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk
setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk
memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap
independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi
2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan
jumlah independen sehingga model seperti ini sering disebut juga sebagai model
lengkap (chass.ncsu.edu, 3 Oktober 2010).
Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat
ditulis sebagai berikut:
logmˆijk iX Yj kZ ijXY XZik YZjk ijkXYZ
Perlu dicatat bahwa transformasi logaritma dari mˆijk bisa dilakukan karena hal
itu membatasi agar frekuensi yang diharapkan tetap dalam kisaran yang dapat
diterima. Konsekuensi dari menentukan model loglinier untuk logmˆijk adalah
diperolehnya model multiplikatif untuk mˆijk, yaitu:
mˆijk exp
iX Yj kZ ijXY ikXZ YZjk ijkXYZ
iXYjkZijXYYZjkYZjkijkXYZ (3.1)
Dari persamaan di atas dapat dilihat bahwa model lengkap berisi semua
variabel yang dianalisis dan semua interaksi yang mungkin antara variabel X, Y, dan Z
yang tidak ada pembatasan yang dikenakan pada data sesuai dengan prinsip hirarkis
yakni memasukkan semua order yang paling tinggi dengan order yang lebih rendah
tetap ada didalam model. Namun, dari persamaan (2.13) dan (3.1) mengandung
terlalu banyak parameter yang akan diidentifikasi. Mengingat nilai untuk frekuensi
yang diharapkan mˆijk tidak ada solusi unik untuk parameter-parameter dan . Oleh karena itu, batasan-batasan harus dipaksakan pada parameter model loglinier untuk
membuat parameter-parameter itu lebih mudah diidentifikasi. Salah satu pilihan
kZ k
i j
Y j X
i 0
,
i j i k j k
YZ jk YZ
jk XZ
ik XZ
ik XY
ij XY
ij 0
,
i j k
XYZ ijk XYZ
ijk XYZ
ijk 0
,
Parameterisasi seperti ini di mana setiap satuan jumlah parameter menjadi bernilai nol
atas masing-masing tandanya disebut effect coding. Pada effect coding, dinotasikan sebagai rata-rata untuk logmˆijk.
3.1.2 Model Non-lengkap
Seperti disebutkan di atas, dalam model loglinier lengkap semua kemungkinan
interaksi ada. Dengan kata lain, tidak ada pembatasan yang dikenakan pada
parameter-parameter model selain dari pembatasan untuk mengidentifikasi. Namun,
pembatasan parameter-parameter model menjadi penting dilakukan karena bertujuan
untuk menentukan dan menguji model yang lebih pelit yaitu model di mana beberapa
pembatasan dikenakan pada parameter. Model loglinier seperti ini di mana parameter
dibatasi dalam beberapa cara disebut sebagai model non-lengkap.
Ada berbagai jenis pembatasan yang dapat dikenakan kepada
parameter-parameter model loglinier. Salah satu jenis khusus pembatasan menyebabkan
terbentuknya kumpulan model loglinier hirarkis. Ini adalah model dimana
parameter-parameter loglinier secara tetap dibuat menjadi bernilai nol. Dengan demikian apabila
interaksi tertentu bernilai 0, semua order interaksi yang lebih tinggi berisi semua
indeks sebagai subset juga harus bernilai 0. Sebagai contoh jika asosiasi parsial antara
X dan Y dari persamaan (2.13) yaitu
ijXY diasumsikan tidak ikut dalam model, maka interaksi tiga variabel ijkXYZ harus bernilai 0.Menerapkan pembatasan ini untuk persamaan model loglinier lengkap di atas hasilnya
logmˆijk iX Yj kZ ikXZ YZjk (3.2)
Contoh lain dari model loglinier hirarkis yang non-lengkap adalah model independen
untuk trivariat sesuai persamaan (2.14), yaitu:
logmˆijk iX Yj Zk
Model loglinier hirarkis adalah model loglinier yang paling populer karena dalam
sebagian besar aplikasi secara relatif lebih mudah untuk mengestimasi parameter
karena keberadaan dari statistik minimum yang sederhana.
3.2 Konfigurasi Model Loglinier Tiga Faktor
Bentuk model loglinier tiga faktor dapat dibagi menjadi beberapa konfigurasi yang
berguna untuk lebih mengetahui pembagian jenis-jenis model yang ada, yakni:
Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor
No. Model Konfigurasi
1. Model Independen
logmˆijk iX Yj Zk C1C2C3
2. Model Satu Interaksi Dua Faktor
2.1 logmˆijk iX Yj kZ ijXY C12 C3
2.2 logmˆijk iX Yj kZ ikXZ C13 C2
2.3 logmˆijk iX Yj kZ YZjk C1 C23
3. Model Dua Interaksi Dua Faktor
3.1 logmˆijk iX Yj kZ ijXY XZik C12 C13
3.2 logmˆijk iX Yj Zk ijXY YZjk C12 C23
3.3 logmˆijk iX Yj kZ ikXZ YZjk C13 C23
4. Model Tanpa Interaksi Tiga Faktor
logmˆijk iX Yj Zk ijXY ikXZ YZjk C12 C13 C23
5. Model Lengkap
Sebagai tambahan bahwa untuk model lengkap di atas terdapat tiga jenis efek order
didalamnya, yakni efek order pertama, efek order kedua, dan efek order ketiga. Efek
order pertama adalah X i
, Yj, dan Z k
. Efek order kedua adalah ijXY, XZ ik
, dan YZjk .
Efek order ketiga adalah ijkXYZ.
3.3 Derajat Bebas
Derajat bebas adalah banyaknya sel dalam tabel klasifikasi silang dikurangi
banyaknya parameter yang ditaksir dalam model. Derajat bebas untuk tabel tiga faktor
ditulis pada tabel berikut:
Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor
Bentuk Derajat Bebas
1
X
I 1Y
J1 Z
K 1
XY
I1 J1 XZ
I1 K 1
YZ
J 1 K 1
XYZ
I1 J 1 K 1
(Sumber: Friel, 2005)
3.4 Algoritma Hirarkis Backward
Algoritma Hirarkis Backward dimulai dengan dibentuknya suatu model lengkap.
Kemudian, komponen dari model itu dievaluasi untuk melihat apakah terdapat efek
yang dapat dieliminasi dengan melihat hasil uji kecocokan modelnya. Proses ini terus
berlangsung sampai tidak ada efek yang harus dikeluarkan dari model. Pemodelan
loglinier Hirarkis Backward menggunakan eliminasi mundur yang digunakan untuk
menemukan model terbaik, yaitu model yang memiliki interaksi yang signifikan
Adapun algoritmanya secara lengkap sebagai berikut (Chapter 14 dan Agresti, 1990):
Langkah 1
Analisis dengan memasukkan semua variabel pada model lengkap, dengan asumsi
bahwa interaksi tiga faktor terdapat dalam model. Kemudian anggap model lengkap
dengan konfigurasi C123 sebagai model terbaik, dalam hal ini disebut sebagai model
(0).
Langkah 2
Keluarkan interaksi tiga fakor dari model sehingga menjadi model (1), yaitu model
dengan konfigurasi C12 C13 C23. Pada model ini semua interaksi dua faktor ada atau
signifikan dalam model, tetapi tidak ada interaksi antara ketiga faktor.
Langkah 3
Lakukan pengujian dengan Conditional Test Statistic (CTS) G2 apakah model (1)
masih merupakan model terbaik, dengan hipotesis sebagai berikut:
H0 : model (1) = model terbaik
H1 : model (0) = model terbaik
Conditional Test Statistic tersebut adalah : G2(1-0) = G2(1) - G2(0)
dimana : G2(1) = statistik likelihood G2 untuk model (1)
G2(0) = statistik likelihood G2 untuk model (0)
Langkah 4
Bandingkan G2(1-0) dengan 2df;, dengan kriteria penolakan G2 2df; dan untuk kriteria penerimaan jika G2 < 2df;.
Derajat kebebasan (degree of freedom) = derajat kebebasan model (0) - derajat
Langkah 5
Jika H0 diterima maka model (1) merupakan model terbaik. Jika H0 diterima,
bandingkan model (1) dengan model (2), yaitu model yang diperoleh dari model (1)
apabila salah satu dari interaksi dua faktor dikeluarkan dari model.
Langkah 6
Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai 2
G
terkecil, seandainya salah satu interaksi dua faktor dikeluarkan dari model. Hal ini
dilakukan karena untuk