Pemodelan Loglinier G2 Menggunakan Metode Hirarkis Backward Dan Metode Forward

(1)

PEMODELAN LOGLINIER G

2

MENGGUNAKAN METODE

HIRARKIS BACKWARD DAN METODE FORWARD

SKRIPSI

SITI FATIMAH S

070803063

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

(2)

PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS

BACKWARD DAN METODE FORWARD

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

SITI FATIMAH S 070803063

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

(3)

PERSETUJUAN

Judul : PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD

Kategori : SKRIPSI

Nama : SITI FATIMAH S Nomor Induk Mahasiswa : 070803063

Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, Juni 2011

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Drs. Pasukat Sembiring, M.Si Dr. Sutarman, M.Sc

NIP. 19531113 198503 1 002 NIP. 19631026 199103 1 001

Diketahui/Disetujui oleh

Departemen Matenatika FMIPA USU Ketua,

Prof. Dr. Tulus, M.Si

NIP. 19620901 198803 1 002

(4)

PERNYATAAN

PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing – masing disebutkan sumbernya.

Medan, Juni 2011

(5)

PENGHARGAAN

Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga skripsi ini dapat diselesaikan dalam waktu yang telah ditetapkan.

Penulis mengucapkan terima kasih kepada Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU dan Bapak Drs. Pasukat Sembiring, M.Si selaku para dosen pembimbing penulis pada penyelesaian skripsi ini yang telah mengarahkan penulis serta telah meluangkan waktu, tenaga, pikiran, dan bantuannya sehingga skripsi ini dapat selesai dengan tepat waktu. Kemudian ucapan terima kasih juga kepada Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika, Ibu Dra. Mardiningsih, M.Si selaku Sekretaris Departemen Matematika di FMIPA USU dan Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku penguji skripsi, serta semua staf pengajar beserta para pegawai pada Departemen Matematika FMIPA USU yang banyak membantu penulis.

Penulis juga mengucapkan terima kasih teristimewa kepada Ayahanda penulis Alm Ir. Zakaria Sihotang dan Ibunda tercinta Adek Palem yang senantiasa memberikan do’a, bantuan serta dorongan dalam penyelesaian skripsi ini. Akhirnya penulis mengucapkan terima kasih kepada Siti Hardianti, Rina, Novi, Dian S, Memel, Kesi, Warsini, Rizky dan teman-teman lain yang tidak dapat penulis sebutkan namanya satu per satu atas bantuannya dalam menyelesaikan skripsi ini serta tidak lupa penulis mengucapkan terima kasih kepada Ibu Nasrah yang juga banyak membantu.

Penulis hanya bisa memanjatkan do’a semoga Allah SWT akan membalas segala kebaikan dan bantuan yang diberikan kepada penulis. Semoga apa yang penulis perbuat akan selalu diridhoi oleh sang pemilik ilmu. Amin Ya Robbal Alamin.

Akhirnya sebagai seorang mahasiswa, penulis menyadari bahwa masih banyak terdapat kekurangan dalam menyelesaikan skripsi ini. Oleh karena itu, kritik dan saran yang membangun diharapkan demi perbaikan skripsi ini.

Medan, Juni 2011

Penulis,

(6)

ABSTRAK

Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.

(7)

LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL

BACKWARD AND FORWARD METHOD

ABSTRACT

Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.

(8)

DAFTAR ISI

Halaman

Persetujuan ii

Pernyataan iii

Penghargaan iv

Abstrak v

Abstract vi

Daftar Isi vii-viii Daftar Tabel ix

Bab 1 Pendahuluan 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 4

1.5 Kontribusi Penelitian 4

1.6 Metodologi Penelitian 4

1.7 Tinjauan Pustaka 5

Bab 2 Landasan Teori 9

2.1 Analisis Model Loglinier 9

2.1.1 Distribusi Poisson 10

2.1.2 Model Loglinier Poisson 12

2.2 Asumsi Teorikal Untuk Model Loglinier 13

2.3 Tabel Kontingensi 15

2.3.1 Tabel Kontingensi Dua Faktor 15

2.3.2 Tabel Kontingensi Tiga Faktor 18

2.4 Pengujian Kecocokan Model 20

2.5 Seleksi Model 22

2.6 Metode Hirarkis Backward 23

2.7 Metode Forward 23

Bab 3 Pembahasan 24

3.1 Pendekatan Hirarkis untuk Pemodelan Loglinier 24

3.1.1 Model Lengkap 25

3.1.2 Model Non-lengkap 26

3.2 Konfigurasi Model Loglinier Tiga Faktor 27

3.3 Derajat Bebas 28

3.4 Algoritma Backward 28

3.5 Algoritma Forward 30

3.6 Analisis Residu 31

(9)

Bab 4 Kesimpulan dan Saran 47

4.1 Kesimpulan 47

4.2 Saran 48

Daftar Pustaka 49

Lampiran A: Output Nilai G2 dan Estimasi Parameter Untuk Model Lengkap 50 Lampiran B: Output Proses Eliminasi Hirarkis Backward 52 Lampiran C: Output Proses Penambahan Forward Secara Berurutan 54 Lampiran D: Nilai Kritis Distribusi Chi-Square

 

2 62

(10)

DAFTAR TABEL

Halaman

Tabel 2.1 Tabel Kontingensi I × J 16

Tabel 2.2 Tabel Kontingensi I × J × K 18

Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor 27

Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor 28

Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor 32

Tabel 3.4 Tabel Proses Eliminasi Hirarkis Backward 35

Tabel 3.5 Tabel Untuk K-faktor dan Efek Order yang Lebih Tinggi 38

Tabel 3.6 Tabel Asosiasi Parsial 40

Tabel 3.7 Tabel Proses Penambahan Forward Secara Berurutan 42

Tabel 3.8 Tabel Residu Untuk Model Akhir 46

(11)

ABSTRAK

Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.

(12)

LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL

BACKWARD AND FORWARD METHOD

ABSTRACT

Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.

(13)

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Model Loglinier adalah salah satu kasus khusus dari general linier model untuk data

yang berdistribusi poisson. Model loglinier juga disebut sebagai suatu model statistik

yang berguna untuk menentukan depedensi (kecenderungan) antara beberapa variabel

yang berskala kategorik. Variabel didefinisikan sebagai suatu yang beragam atau

bervariasi dan skala kategorik merupakan transformasi fungsi nilai dari empat skala

ukuran observasi yang ada yaitu skala nominal, ordinal, rasio dan interval. Dengan

pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi.

Tabel kontingensi digunakan jika terdapat lebih dari satu variabel kategorik, yang

mana biasanya data disajikan dalam daftar baris dan kolom. Variabel kategorik yang

ada dianalisis dengan mengambil nilai logaritma natural dari frekuensi untuk setiap sel

dalam tabel kontingensi. Dari tabel kontingensi yang terbentuk, model loglinier akan

menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Model

loglinier tidak hanya dapat digunakan untuk menganalisis hubungan yang terjadi antar

dua variabel kategorik, tetapi juga dapat digunakan untuk mengevaluasi tabel

kontingensi multifaktor yang meliputi tiga variabel atau lebih.

Model loglinier sangat bergantung pada jumlah variabel yang akan dianalisis.

Penggunaan variabel yang dibahas pada penulisan ini dikelompokkan pada dua jenis

yaitu variabel dependen dan variabel independen. Variabel dependen adalah variabel

yang keberadaannya dipengaruhi oleh variabel lainnya. Sedangkan variabel

(14)

Analisis loglinier digunakan untuk menganalisis pola hubungan antar

sekelompok variabel kategorik yang mencakup mulai dari asosiasi satu variabel,

asosiasi dua variabel, asosiasi tiga variabel atau lebih, baik secara simultan maupun

secara parsial. Pola hubungan antar variabel dapat dilihat dari interaksi antar variabel

itu sendiri, termasuk kemungkinan adanya hubungan sebab akibat atau hubungan

kausal diantara variabel – variabel yang ada.

Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang

diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata

lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel

independen karena model loglinier hanya menunjukkan depedensi (kecenderungan)

antar variabel. Andaikan terdapat pembedaan yang dibuat antara satu atau lebih

variabelnya yang diperlakukan sebagai variabel independen dan variabel lainnya

sebagai variabel dependen, maka penggunaan analisis yang sesuai ialah dengan

analisis Regresi Logistik. Analisis Regresi Logistik digunakan untuk memprediksi

variabel yang bersifat kategorik (biasanya dikotomis) oleh seperangkat variabel

independen (Jeansonne, 2002).

Analisis model loglinier bergantung pada jumlah variabel dependen yang

termuat di dalamnya. Untuk penulisan ini akan diuraikan tentang model loglinier yang

membahas analisis hubungan antara tiga variabel yang disebut dengan analisis

trivariat. Model seperti ini disebut juga sebagai model loglinier tiga faktor. Model

loglinier tiga faktor memuat semua parameter yang mungkin dan tidak dapat dimasuki

oleh parameter – parameter lainnya. Model seperti ini disebut sebagai model lengkap.

Secara umum model loglinier tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):

logmˆ_ijk _iX Y_j _kZ _ijXY _ikXZ YZ_jk _ijkXYZ

Setelah jumlah variabel kategorik diselidiki, pembentukan model loglinier

penting untuk diteliti yang berguna untuk menentukan kecocokan model yang

(15)

karena tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang

ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan.

Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara

sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi

faktor model yang ada sebelum membentuk suatu model yang memang tepat dan

signifikan setelah melalui uji kecocokan modelnya.

Dalam hal ini akan dilakukan teknik pemodelan loglinier yang akan digunakan

sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk

model permasalahan. Jenis prosedur yang penulis gunakan dalam penyelesaian

pemodelan loglinier terbagi pada dua jenis, yaitu prosedur yang memakai metode

Hirarkis Backward dan prosedur pemodelan yang menggunakan metode Forward.

Untuk keperluan analisis data yang memuat hubungan tiga variabel dengan

menggunakan skala kategorik difokuskan pada bagaimana penentuan model dengan

melakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun

3-faktor dengan menggunakan uji goodness of fit model G2 untuk menguji kecocokan

modelnya. Pengolahan data dilakukan dengan software SPSS 15.0 for Windows.

1.2 Rumusan Masalah

Masalah yang akan dibahas dalam penulisan ini ialah melakukan prosedur pemodelan

loglinier menggunakan metode Hirarkis Backward dan metode Forward, kemudian

membandingkan kedua metode dalam hal mendapatkan suatu model akhir yang

menggambarkan hubungan antar variabel yang diselidiki.

1.3 Batasan Masalah

Ruang lingkup dari penulisan ini dibatasi pada melakukan suatu teknik pemodelan

loglinier menggunakan metode Hirarkis Backward dan metode Forward dengan uji

(16)

1.4 Tujuan Penelitian

Tujuan penulisan ini adalah melakukan prosedur pemodelan loglinier menggunakan

metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode

tersebut untuk dipilih sebagai metode yang yang lebih baik dalam membentuk model.

1.5 Kontribusi Penelitian

Hasil penulisan ini adalah:

1. Dapat menerapkan analisis tabel kontingensi dan metode pemodelan loglinier

yang ada untuk penyelesaian permasalahan yang berkaitan dengan berbagai

bidang kehidupan agar lebih mudah diolah, sehingga jelas tujuannya.

2. Dengan penulisan ini penulis berharap dapat menambah referensi bagi

pembaca yang dapat digunakan sebagai alat untuk mengklasifikasikan data

yang ingin diteliti dalam memutuskan suatu masalah.

1.6 Metodologi Penelitian

Dalam penulisan ini penulis melakukan studi dengan meneliti buku-buku yang

membahas mengenai model loglinier dan metode Hirarkis Backward dan Forward

dalam hal pemodelannya, yaitu:

1. Mengumpulkan dan mempelajari buku-buku yang berkaitan dengan materi

penulisan.

2. Menentukan jumlah variabel kategorik yang akan diselidiki sebelum dilakukan

prosedur pemodelan.

3. Menguraikan perbedaan penyelesaian pemodelan loglinier menggunakan

(17)

4. Pemodelan dilakukan melalui suatu proses seleksi sampai model akhir

terbentuk yang mana setiap kali variabel dihapus maupun ditambahkan pada

model, dilakukan pengujian terhadap interaksi faktor model baik tingkat

2-faktor maupun 3-faktor menggunakan uji rasio likelihood 2

G dan

melihat p-value yang dihasilkan untuk menguji kecocokan modelnya.

5. Menyelesaikan contoh permasalahan untuk memilih metode yang lebih

baik dalam membentuk suatu model.

1.7 Tinjauan Pustaka

Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk

setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk

memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap

independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi

2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan

jumlah independen sehingga model seperti ini sering disebut juga sebagai model

lengkap (chass.ncsu.edu, 3 Oktober 2010).

Secara umum model lengkap untuk tiga variabel kategorik dapat ditulis sebagai

berikut (Agresti, 1990):

logmˆ_ijk _iX Y_j _kZ _ijXY _ikXZ YZ_jk _ijkXYZ (1) dengan:

logmˆ_ijk = Logaritma dari frekuensi sel ijk

 = konstanta atau rata – rata logaritma seluruh sel ijk X

i

 = Parameter pengaruh variabel pertama yang ke-i terhadap model

Y_j = Parameter pengaruh variabel kedua yang ke-j terhadap model Z

k

 = Parameter pengaruh variabel ketiga yang ke-k terhadap model

(18)

variabel kedua yang ke-j terhadap model

_ikXZ = Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model

YZ_jk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

_ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam

tabel kontingensi. Friendly (2000) menyatakan tabel kontingensi digunakan ketika

terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam

daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya

disebut daftar kontingensi. Analisis tabel kontingensi ini merupakan teknik

penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam

satu tabel. Untuk menginterpretasikan data pada tabel kontingensi, salah satu yang

dapat digunakan adalah dengan uji Chi-Square.

Uji Chi-Square dilambangkan dengan 2

, yang digunakan untuk mengetahui

adanya hubungan antara variabel yang diukur signifikan atau tidak. Dalam hal ini

analisis variabel yang diukur sebanyak tiga variabel atau yang disebut sebagai analisis

trivariat. Hipotesis yang berlaku untuk ketiga variabel yang independen dengan

asumsi tidak terdapat interaksi antar variabel, yaitu:

H₀ :P_ijk  P_i_..P_._j_.P_.._k

H₁:P_ijk  P_i_..P_._j_.P_.._k

Statistik uji Chi-Square yang digunakan untuk menguji hubungan antar variabel dapat

dirumuskan sebagai berikut:











i j k ijk

ijk ijk

m m Y

ˆ ˆ 2 2

 (2)

(19)



    

i j k ijk

ijk ijk

m Y Y

G

ˆ ln 2

2

(3)

dengan:

ijk

Y = Observasi pada variabel i, j, dan k

ijk

mˆ = Frekuensi yang diharapkan untuk Y_ijk

degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05

Kriteria uji:

Tolak H0 jika 2 atau G2 hitung  2df; dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆ_ijk _iX Y_j Z_k diterima.

Pencarian Solusi

Pencarian solusi permasalahan pemodelan loglinier dapat dilakukan dengan

menentukan suatu model secara fleksibel dan mendalam serta memilih variabel

independen secara inklusif dengan tepat. Hal ini memungkinkan untuk menemukan

variabel independen yang terbaik yang dapat dipakai serta melihat pada kecocokan

model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dalam hal ini

dapat menggunakan beberapa metode yang akan digunakan sebagai perbandingan

dalam pemilihan metode yang lebih baik dalam membentuk suatu model akhir.

Metode – metode itu diantaranya adalah metode iteratif Hirarkis Backward, Forward

dan lain – lain.

1) Metode Hirarkis Backward

Pemodelan loglinier dengan metode Hirarkis Backward akan membentuk model

(20)

dengan menyeleksi model lengkap dan mulai menghapus interaksi yang lebih tinggi

sampai uji kecocokan dari model menjadi tidak dapat diterima lagi berdasarkan

standar probabilitas atau p-value yang diadopsi oleh penyidik. Model lengkap

mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun

3-faktor sesuai dengan jumlah variabel yang diselidiki dalam penelitian ini. Dimana

setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi

prediksinya dengan membandingkan uji rasio likelihood G2 dengan 2_df;_ (Chapter 14, 2 November 2010).

2) Metode Forward

Penggunaan metode forward yang digunakan dalam penelitian ini menggunakan dua

cara yang berbeda namun prinsipnya hampir sama. Agresti (1990) menjelaskan

pengerjaan metode ini dimulai dengan dibentuknya model independen dan

menambahkan istilah interaksi yang lebih kompleks sampai suatu hasil uji fit diterima

yang tidak dapat ditingkatkan dengan menambahkan peraturan lebih lanjut. Dengan

kata lain, metode ini memilih variabel terlemah hingga terkuat secara bertahap.

Friel (2005) menjelaskan pemodelan loglinier dengan metode forward

dilakukan dengan dibentuknya model sederhana (model order nol) kemudian

menambahkan efek order pertama, order kedua, dan order ketiga untuk diuji

(21)

BAB 2

LANDASAN TEORI

2.1 Analisis Model Loglinier

Untuk data yang bersifat kategorik dan dapat dibentuk pada suatu tabel kontingensi,

dapat dianalisis dengan analisis model loglinier. Model loglinier digunakan untuk

menganalisis kemungkinan adanya hubungan yang signifikan dalam tabel kontingensi

multifaktor yang memiliki tiga atau lebih variabel kategorik yang diterapkan pada

kasus-kasus data kualitatif. Dalam hal ini pola hubungan atau asosiasi antar

variabelnya dapat dilihat dari interaksi antar variabel itu sendiri.

Pada umumnya terdapat dua jenis data berdasarkan pengklasifikasiannya,

yakni data kuantitatif dan data kualitatif. Data kuantitatif adalah data yang berbentuk

angka atau data yang diukur dalam skala numerik yang diperoleh melalui suatu hasil

perhitungan dan pengukuran. Sedangkan data kualitatif adalah data yang

menunjukkan sifat atau keadaan objek berupa label atau nama-nama yang digunakan

untuk mengidentifikasi atribut suatu elemen yang mana dalam hal pengumpulannya

disajikan menurut kualitas atau kategorik yang digunakan. Dalam hal ini yang akan

dipergunakan dalam model loglinier ialah data kualitatif karena variabel yang

dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal.

Secara umum bentuk model loglinier dapat ditulis sebagai berikut (Von eye, 2002):

log ˆ ...,

int sec

int

0    





eraction ondorder

ijk eraction

firstorder ij s

maineffect i ijk

m     (2.1)

(22)

Adapun tujuan dari melakukan analisis model loglinier adalah:

1. Pada analisisnya difokuskan pada kecocokan model yang memperhatikan ada

atau tidaknya interaksi antar variabel.

2. Untuk menghitung atau memperkirakan banyaknya observasi yang

diharapkan (expected counts) dalam tiap-tiap sel populasi dari tabel yang dibentuk

oleh kelompok yang diperhatikan.

Pada analisis model loglinier, prosedur untuk pemasukan variabel - variabel ke

dalam model dilakukan secara independen dan berguna untuk menjelaskan distribusi

kasus dalam tabulasi silang untuk variabel kategorik. Dengan demikian, analisisnya

meliputi distribusi yang diharapakan dari variabel kategorikal tersebut ialah distribusi

Poisson yang akan membentuk suatu model Poisson.

2.1.1 Distribusi Poisson

Distribusi Poisson dibangun atas suatu percobaan yang menghasilkan jumlah sukses

yang terjadi pada interval waktu ataupun pada daerah tertentu yang dikenal sebagai

percobaan Poisson. Percobaan Poisson adalah percobaan yang menghasilkan peubah

acak X yang bernilai numerik, yaitu jumlah sukses selama selang waktu tertentu atau

dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam,

sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu meter, satu

kilometer persegi dan lain-lain.

Distribusi Poisson adalah distribusi kemungkinan dari variabel acak Poisson x

yang menjelaskan jumlah sukses yang terjadi pada interval waktu ataupun daerah

tertentu. Dinotasikan sebagai:

 

! . ;

x e x

p

x



(23)

dengan:

= jumlah rata-rata sukses terjadi e = bilangan natural = 2,71828...

Distribusi Poisson ini juga merupakan salah satu model distribusi probabilitas

untuk variabel diskrit. Model ini merupakan model pendekatan untuk menghitung

probabilitas timbulnya gejala yang diharapkan (gejala “sukses”) dari sejumlah n

peristiwa atau sampel. Ciri distribusi seperti itu memiliki kemiripan yang hampir sama

dengan distribusi Binomial. Tetapi, untuk kasus nilai n yang sangat besar (n  )

dan peluangnya yang sangat kecil (p  0) sukar sekali menghitung nilai

probabilitasnya dengan model distribusi Binomial. Oleh karena itu, nilai probabilitas

dapat dihitung dengan pendekatan Distribusi Poisson.

Sekarang andaikan X adalah variabel acak binomial dengan distribusi

probabilitas b(x;n, p). Jika n  , p  0, dan  np konstan, maka distribusi Binomial dapat didekati oleh distribusi Poisson, yakni:

b(x; n, p)  p(x; )

b



x;n,p



C_xnpx

 

1 p nx n,p0

 

! . ;

x e x

p

x



  

Ekspektasi Harapan Distribusi Poisson

Distribusi Poisson merupakan salah satu dari beberapa distribusi probabilitas diskrit.

Variabel acak yang terdapat pada distribusi ini jelas bersifat diskrit (berdasarkan hasil

hitungan). Nilai harapan variabel acak diskrit adalah rata-rata tertimbang dari seluruh

kemungkinan.

Secara umum, rumus untuk nilai ekspektasi probabilitas diskrit adalah:

E(X)_x 



x_i.p

 

x_i (2.3)

(24)

 



    0 ! . . x x x e x X E  



    

0( )( 1)! . . x x x x e

x  



    

0( 1)! .

x

e  



            1 1 1 1 )! 1 ( . )! 1 ( . x x x x x e x e      

jika x1 y, maka bentuk



     1 1 )! 1 ( . x x x e    =



   0 ! . y y y e    .

karena



    0 1 ! . y y y e  

, maka diperoleh     

 



_  1. ! . 0 y y y e

. Jadi, ekspektasi

harapan untuk distribusi Poisson adalah .

2.1.2 Model Loglinier Poisson

Seperti yang penulis sebutkan pada bab awal penulisan, model loglinier

merupakan salah satu kasus khusus dari general linier model. Dalam hal ini komponen

acak merupakan salah satu jenis dari tiga komponen utama untuk general linier model.

Komponen acak berguna untuk mengidentifikasi distribusi probabilitas dari variabel

dependen, dengan memisalkan yi = (y1, y2, . . . , yk). Sehingga bentuk fungsi

peluangnya adalah:

f



y_i;_i

    

a_i b y_i exp



y_i

 

_i



(2.4)

Kelompok ini memuat beberapa distribusi yang penting sebagai kasus khusus,

misalnya distribusi Poisson. Nilai parameter i pada persamaan (2.4) untuk i =1, 2, 3, . . . , k tergantung pada nilai dari variabel peramalnya yaitu sebagai variabel

(25)

Kemudian dengan memisalkan y jumlah observasi di dalam sel i yang terdistribusi _i

Poisson dengan rata-rata _i, maka fungsi padat peluang Poisson untuk y adalah: _i





! . ; i y i i i y e y f i i     

 

! exp i y i y i i   



 



_i

 

_i



i

i y

y 

 exp log ! 1 exp    

 (2.5)

Dengan yi adalah bilangan bulat positif.

Persamaan (2.5) sama saja dengan bentuk eksponensial sejati pada persamaan (2.4)

yang mana a

   

_i a _i exp

 

_i ,

 

! 1 i i y y

b  , dan 

 

_i log

 

_i dengan 

 

_i

sebagai parameter sejati.

Untuk distribusi Poisson dalam kaitannya dengan istilah struktur yang

sistematis dari sebuah model, dapat dipertimbangkan tiga jenis model loglinier untuk

menghitung frekuensi yang diharapkan, yaitu: model order nol, model penambahan,

dan model lengkap. Inilah pembagian jenis model yang akan dipergunakan sebagai

pemilihan dalam menentukan apakah salah satu dari ketiga jenis model di atas dapat

digunakan untuk mewakili hubungan dari kumpulan data dalam pemodelan loglinier

yang akan dilakukan.

2.2 Asumsi Terorikal Untuk Model Loglinier

Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki

mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak

ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena

model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel.

(26)

tersebut terbagi menjadi variabel independen dan dependen, maka (Von eye, 2002)

terdapat beberapa hal yang harus diperhatikan. Berikut ini akan dijelaskan beberapa

contoh model loglinier yang biasa digunakan.

Jika tidak ada variabel yang mempengaruhi model (zero-order), model

loglinier secara umum (Von eye, 2002) adalah sebagai berikut:

logE(Y) (2.6)

dengan: E(Y) Frekuensi yang diharapkan dalam setiap sel

  constant atau rata-rata umum

Jika semua variabel mempunyai status yang sama, dan hanya Main effect atau efek

utama yang digunakan (first-order), model loglinier secara umum (Von eye, 2002)

adalah sebagai berikut:

logE(Yij..)iX Yj ... (2.7)

dengan: E(Y_ij..) = Frekuensi yang diharapkan dalam setiap sel

 = constant atau rata-rata umum

Xi = Parameter pengaruh tingkat ke-i faktor X Y_j = Parameter pengaruh tingkat ke-j faktor Y

Jika variabel-variabel yang akan diteliti terbagi menjadi variabel independen dan

variabel dependen, dimisalkan terdapat dua variabel independen A dan B dan dua

variabel dependen C dan D, model loglinier yang dipergunakan adalah sebagai berikut

(Von eye, 2002):

E

 

Y_ijkl A_i B_j AB_ij C_k D_l CD_kl (2.8)

dengan: E

 

Y_ijkl = Frekuensi yang diharapkan dalam setiap sel

(27)

Bj = Pengaruh tingkat ke-j faktor B

AB_ij = Interaksi tingkat ke-i dan j faktor A dan B

C = Pengaruh tingkat ke-k faktor C _k

D = Pengaruh tingkat ke-l faktor D _l

CD = Interaksi tingkat ke-k dan l faktor C dan D _kl

Model tersebut diasumsikan bahwa penelitian tidak menginginkan adanya interaksi

antar variabel independen dan variabel dependen.

2.3 Tabel Kontingensi

Tabel kontingensi merupakan suatu analisis teknik penyusunan data yang cukup

sederhana untuk melihat hubungan antar variabel dalam satu tabel (Friendly, 2000).

Dalam hal ini, variabel yang dianalisis merupakan variabel kategorik yang memiliki

skala nominal atau ordinal. Penggunaan tabel kontingensi yang akan dibahas pada

penelitian ini penulis kelompokkan menjadi dua yaitu tabel kontingensi dua faktor dan

tabel kontingensi tiga faktor.

2.3.1 Tabel Kontingensi Dua Faktor

Tabel kontingensi mulai digunakan ketika terdapat lebih dari satu variabel kategorik

yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian

dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Andaikan

terdapat suatu percobaan yang terdiri dari n pengamatan yang diklasifikasikan

menurut 2 variabel kategorik, maka variabel 1 mempunyai i tingkat/kategorik: A1,

A2, A3, . . . , Ai dan variabel 2 mempunyai j tingkat/kategorik: B1, B2, B3, . . . , Bj .

Kemudian anggap Y_ij menyatakan banyak peristiwa variabel-1 ada pada

tingkat ke-i dan variabel-2 pada tingkat ke-j, dengan i = 1, 2, 3, . . . , I dan j = 1, 2, 3,

(28)

Tabel 2.1 Tabel Kontingensi I × J

Variabel 2

B ₁ B ₂ B . . . ₃ B_j Jumlah baris

Variabel 1

A ₁ Y ₁₁ Y ₁₂ Y . . . ₁₃ Y₁_j n ₁

A ₂ Y ₂₁ Y ₂₂ Y . . . ₂₃ Y2_j n 2

A ₃ Y ₃₁ Y ₃₂ Y . . . ₃₃ Y₃_j n ₃

. . . . . . . . . . . . . . . . . .

A i Y b1 Y b2 Y . . . b3 Ybj n i

Jumlah kolom m ₁ m ₂ m . . . ₃ mj nm1 ...mj

n₁...n_i

Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk masing-masing sel

dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk A dan _i

j

B . Probabilitas untuk A = _i P dan probabilitas untuk _i_. B_j = P._j. Kemudian, untuk menghitung besarnya P dan _i_. P_._j dapat ditaksir dengan

N n Pˆi.  i ,

N m

Pˆ.j  j , sehingga

taksiran nilai harapannya adalah

N m n P P N

mij i j i j

. ˆ . ˆ .

ˆ  _. _.  .

Dari tabel kontingensi dua faktor yang terbentuk, model loglinier akan

menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Dengan

demikian, bentuk model loglinier untuk dua faktor dapat ditulis sebagai berikut:

(29)

Model di atas disebut sebagai model lengkap karena memasukkan semua efek

yang mungkin terbentuk, baik itu efek untuk 1-faktor dan juga efek 2-faktor. Sebagai

contoh misalkan dalam tabel kontingensi 2X2, maka akan terdapat empat parameter

yang terdiri dari ,_iX,Y_j,_ijXY. Kemudian jika ingin mendapatkan sebuah model yang dapat menghilangkan salah satu efek di atas yang tidak memberikan kecocokan

terbaik dengan model, maka model non-lengkap harus dibentuk.

Pembentukan model ini dapat dilakukan dengan membuat beberapa efek

parameter menjadi bernilai nol. Misalkan dianggap _ijXY 0 (diasumsikan bahwa variabel X tidak berasosiasi dengan variabel Y), maka model yang terbentuk akan

menjadi model loglinier non-lengkap sebagai berikut:

logmˆ_ij  _iX Y_j (2.10)

Bentuk model seperti ini disebut sebagai model independen karena hanya memuat

efek utamanya saja yakni X dan Y tanpa interaksi.

Uji keindependenan model loglinier untuk dua faktor, yaitu:

j i ij PP

P

H₀ :  _. _.

j i ij P P

P

H₁:  _. _.

Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:











i j ij

ij ij m m Y ˆ ˆ 2 2

 (2.11)

Sedangkan untuk uji kecocokan datanya dengan uji Rasio Likelihood dapat

dirumuskan:



    

i j ij

ij ij m Y Y G ˆ ln 2 2 (2.12) dengan: ij

Y = Observasi pada variabel i dan j

ij

mˆ = Frekuensi yang diharapkan untuk Y_ij

(30)

Kriteria Uji:

Tolak H0 jika 2 atau G2 hitung  2df; dengan kata lain terdapat asosiasi antara dua variabel yang diselidiki dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆ_ij  _iX Y_j diterima.

2.3.2 Tabel Kontingensi Tiga Faktor

Seperti halnya pada tabel kontingensi I × J yang mempunyai i

tingkat/kategorik untuk variabel pertama dan mempunyai j tingkat/kategorik untuk

variabel kedua, maka pada tabel kontingensi I × J × K juga berlaku sama. Misal Y_ijk

menyatakan banyak peristiwa variabel-1 ada pada tingkat ke-i, variabel-2 pada tingkat

ke-j, dan variabel-3 pada tingkat ke-k, dengan i = 1, 2, 3, . . . , I , j = 1, 2, 3, . . . , J

dan k = 1, 2, 3, . . . , K. Maka data tersebut dapat disusun dalam tabel kategorik

I × J × K sebagai berikut:

Tabel 2.2 Tabel Kontingensi I × J × K

Variabel 2

Jumlah

1 2 ... j

Variabel 3 1 2 ... k

V a r i a b e l

1

1 ... _..

2 ... _..

⋮ ⋮ ⋮ … ⋮ ⋮

i … _..

(31)

Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk tiap sel

dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk Y_i_.., Y_{. j}_.,

dan Y_.._k. Probabilitas untuk Y_i_.. = P , probabilitas untuk _i_.. Y_{. j}_. = P_{. j}_. dan probabilitas untuk Y..k = P..k. Kemudian, untuk menghitung besarnya P , i.. P. j., dan P...k dapat

ditaksir dengan

N Y

P i

i .. ..

ˆ _ _,

N Y

Pˆ_._j_.  .j., dan

N Y

P k

k .. ..

ˆ _ _{, sehingga taksiran nilai}

harapannya adalah mˆ_ijk  N.P_i_..P_._j_.P_.._k

 

..

 

.₂.

 

..

N Y Y

Y_i _j _k

 .

Dari tabel kontingensi tiga faktor yang terbentuk, model loglinier akan

menggambarkan pola asosiasi atau hubungan yang terjadi antar tiga variabel. Dengan

demikian, bentuk lengkap model loglinier untuk tiga faktor dapat ditulis sebagai

berikut (Agresti, 1990):

logmˆ_ijk _iX Y_j _kZ _ijXY _ikXZ YZ_jk _ijkXYZ (2.13)

dengan:

logmˆijk = Logaritma dari frekuensi sel ijk  = rata – rata logaritma seluruh sel ijk

X_i = Parameter pengaruh variabel pertama yang ke-i terhadap model Y_j = Parameter pengaruh variabel kedua yang ke-j terhadap model Z_k = Parameter pengaruh variabel ketiga yang ke-k terhadap model _ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan variabel kedua yang ke-j terhadap model

XZ ik

 = Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model

YZ_jk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

(32)

Kemudian, jika diasumsikan dari model di atas interaksi _ijXY, _ikXZ, _ikXZ, YZ_jk , serta XYZ

ijk

 bernilai 0, maka hal ini berarti X, Y,dan Z secara masing-masing tidak berasosiasi dan hanya main effects (efek utama) nya saja yang berhubungan secara

independen. Model loglinier independen untuk tiga faktor dapat ditulis sebagai

berikut:

logmˆ_ijk _iX Y_j Z_k (2.14)

Uji keindependenan model loglinier untuk tiga faktor, yaitu:

H₀ :P_ijk  P_i_..P_._j_.P_.._k

H1:Pijk  Pi..P.j.P..k

Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:











i j k ijk

ijk ijk

m m Y

ˆ ˆ 2 2

 (2.15)

dengan:

ijk

Y = Observasi pada variabel i, j, dan k

ijk

mˆ = Frekuensi yang diharapkan untuk Y_ijk

degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05

Kriteria Uji:

Tolak H0 jika 2 hitung  2df; dengan kata lain terdapat asosiasi antar ketiga variabel dan terima H0 jika 2 hitung < 2df; dengan kata lain model

Z k Y

j X i ijk

mˆ   

log diterima.

2.4 Pengujian Kecocokan Model

Pengujian analisis model loglinier dapat dilakukan dengan dua pendekatan uji

(33)

1. Pendekatan Uji Chi-Square

Uji Chi-Square yang digunakan untuk mengetahui hubungan dari tiga variabel

yang diselidiki dapat ditulis sebagai:











i j k ijk

ijk ijk

m m Y

ˆ ˆ 2 2

 (2.16)

2. Pendekatan Uji Rasio likelihood G2

Pendekatan ini digunakan untuk menguji kecocokan model yang

memperhatikan ada atau tidaknya interaksi antar variabel. Dengan kata lain uji

ini melihat seberapa cocok model dengan data. Untuk tabel tiga faktor dapat

ditulis sebagai berikut:



    

i j k ijk

ijk ijk

m Y Y

G

ˆ ln 2

2

(2.17)

degree of freedom nya disesuaikan dengan model yang terbentuk selama proses

seleksi dan diambil  0,05

Kriteria uji:

Tolak H0 jika 2 atau G2  2df; atau p-value <  yang berarti terdapat hubungan yang signifikan antar interaksi variabel ataupun komponen yang sedang

diuji sehingga menyebabkan adanya depedensi dan terima H0 jika 2 atau G2   

2df; yang berarti tidak terdapat hubungan yang signifikan.

Pengujian statistik rasio likelihood ini tidak hanya dapat digunakan untuk

menguji satu model saja, tetapi juga dapat digunakan terhadap dua model untuk

melihat perubahan nilai yang ada. Pada titik ini uji rasio likelihood dapat digunakan

untuk membandingkan model secara keseluruhan dengan model yang lebih rendah

(yaitu membandingkan model lengkap dengan satu interaksi atau pengaruh utama

yang lebih rendah) untuk menilai hubungan diantara kedua model itu. Persamaannya

(34)

 

2

 

₁ 2

2 2

M G M G

G perbandingan   (2.18)

 

2 2

M

G = statistik likelihood G2 untuk model (2)

 

1

2

M

G = statistik likelihood G2 untuk model (1)

Derajat kebebasan (degree of freedom) = derajat kebebasan model (2) - derajat

kebebasan model (1).

2.5 Seleksi Model

Bagian ini menjelaskan tentang strategi untuk memilih model loglinier setelah

variabel kategorik diselidiki. Strategi dasar dalam pemodelan loglinier melibatkan

model yang cocok untuk frekuensi yang diamati dalam tabulasi silang variabel

kategorik. Model kemudian dapat diwakili oleh satu set frekuensi harapan yang

mungkin. Setelah frekuensi harapan diperoleh, kemudian membandingkan

model-model yang hirarkis satu sama lain dan menyeleksi model-model yang terbentuk yang

merupakan model yang paling signifikan yang sesuai dengan data.

Dalam hal pengerjaannya proses seleksi untuk memilih model akan menjadi

sulit bersamaan dengan meningkatnya jumlah variabel karena terjadinya peningkatan

yang pesat dalam asosiasi yang mungkin dan interaksi yang ada. Pencocokan semua

model yang mungkin menjadi tidak praktis ketika jumlah variabel kategorik melebihi

tiga. Oleh karena itu, seleksi model bertujuan untuk menyeimbangkan dua tujuan yang

membahas beberapa hal di bawah ini (Friel, 2005):

a. Permasalahan mengenai komponen manakah dari model yang signifikan.

b. Manakah model yang paling cocok dengan data yang digunakan.

Maka dari itu, terdapat dua metode yang digunakan untuk menentukan signifikansi

dari komponen-komponen dalam model yaitu dengan dengan Metode Hirarkis

(35)

2.6 Metode Hirarkis Backward

Metode Hirarkis Backward digunakan untuk menganalisis proses terbentuknya sebuah

model loglinier hirarkis non-lengkap yang dilakukan dengan menyeleksi dari model

lengkap hingga pada model yang sederhana. Model lengkap mencakup semua

kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai

dengan jumlah variabel yang digunakan dalam penelitian ini, yakni sebanyak tiga

variabel kategorik. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk

menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood 2

G

dengan 2_df;_ (Chapter 14, hal: 144). Mengingat bahwa model lengkap ini memiliki jumlah yang sama sel-sel nya dalam tabel kontingensi, seperti halnya efek dan

frekuensi sel yang diharapkan akan selalu bernilai sama dengan frekuensi yang

diamati tanpa derajat kebebasan yang tersisa (Knoke dan Burke, 1980 dikutip dari

Jeansonne).

Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat

logmˆ_ijk _iX Y_j _kZ _ijXY _ikXZ YZ_jk _ijkXYZ

2.7 Metode Forward

Metode Forward digunakan untuk menganalisis proses penambahan

komponen-komponen model menjadi signifikan untuk model akhir dengan dibentuknya sebuah

model order nol kemudian menambahakan efek order pertama, order kedua, dan order

ketiga. Setelah itu, pada setiap tahap dipilih efek order yang memberikan peningkatan

signifikansi terbesar dalam kesesuaian datanya setelah dilakukan pengujian (Friel,

2005). Akan tetapi, (Agresti, 1990) menjelaskan metode ini lebih dikenal sebagai

suatu metode yang digunakan untuk mengevaluasi sebuah model yang proses

pemodelannya dilakukan dengan dibentuknya model independen sampai model

lengkap. Nilai p-maksimum untuk model yang dihasilkan adalah kriteria yang

mungkin karena akan menghasilkan nilai G2 yang kecil, yang berarti baik untuk

model. Bentuk umum model loglinier order nol untuk tiga variabel kategorik, yaitu:

(36)

BAB 3

PEMBAHASAN

3.1 Pendekatan Hirarkis Untuk Pemodelan Loglinier

Untuk menyelesaikan suatu masalah yang berhubungan dengan model yang akan

terbentuk dari variabel kategorik yang diselidiki, maka pemodelan loglinier penting

untuk dilakukan. Hal ini berguna untuk menentukan kecocokan model yang

memperhatikan ada atau tidaknya interaksi antar variabel karena ternyata tidak semua

interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model

lengkap menjadi signifikan dalam suatu model yang akan terbentuk. Tentunya akan

menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam

model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang

ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah

melalui uji kecocokan datanya.

Dalam hal ini untuk mendapatkan model yang dapat mewakili kumpulan data

secara tepat yang berkaitan dengan hal di atas, cara yang dapat dilakukan adalah

dengan melakukan suatu teknik pemodelan loglinier dengan dua metode, yakni

dengan metode Hirarkis Backward dan metode Forward. Metode-metode ini dapat

diselesaikan dengan bantuan program komputer.

Metode Hirarkis Backward dapat digunakan untuk menguji satu per satu

model yang memuat efek 1-faktor untuk setiap variabel serta semua efek interaksi

2-faktor dan interaksi 3-2-faktor. Apabila melalui hasil uji terdapat interaksi yang tidak

memberikan kecocokan yang baik dengan data, maka harus dikeluarkan dan begitu

seterusnya. Dengan demikian, metode ini lebih dikenal dengan mengeliminasi model

(37)

3.1.1 Model Lengkap

Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk

setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk

memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap

independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi

2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan

jumlah independen sehingga model seperti ini sering disebut juga sebagai model

lengkap (chass.ncsu.edu, 3 Oktober 2010).

Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat

logmˆ_ijk _iX Y_j _kZ _ijXY XZ_ik YZ_jk _ijkXYZ

Perlu dicatat bahwa transformasi logaritma dari mˆ_ijk bisa dilakukan karena hal

itu membatasi agar frekuensi yang diharapkan tetap dalam kisaran yang dapat

diterima. Konsekuensi dari menentukan model loglinier untuk logmˆ_ijk adalah

diperolehnya model multiplikatif untuk mˆ_ijk, yaitu:

mˆ_ijk exp



_iX Y_j _kZ _ijXY _ikXZ YZ_jk _ijkXYZ



_iXY_j_kZ_ijXYYZ_jkYZ_jk_ijkXYZ (3.1)

Dari persamaan di atas dapat dilihat bahwa model lengkap berisi semua

variabel yang dianalisis dan semua interaksi yang mungkin antara variabel X, Y, dan Z

yang tidak ada pembatasan yang dikenakan pada data sesuai dengan prinsip hirarkis

yakni memasukkan semua order yang paling tinggi dengan order yang lebih rendah

tetap ada didalam model. Namun, dari persamaan (2.13) dan (3.1) mengandung

terlalu banyak parameter yang akan diidentifikasi. Mengingat nilai untuk frekuensi

yang diharapkan mˆ_ijk tidak ada solusi unik untuk parameter-parameter  dan  . Oleh karena itu, batasan-batasan harus dipaksakan pada parameter model loglinier untuk

membuat parameter-parameter itu lebih mudah diidentifikasi. Salah satu pilihan

(38)











 k

Z k

i j

Y j X

i   0

 ,

























i j i k j k

YZ jk YZ

jk XZ

ik XZ

ik XY

ij XY

ij      0

 ,













i j k

XYZ ijk XYZ

ijk XYZ

ijk   0

 ,

Parameterisasi seperti ini di mana setiap satuan jumlah parameter menjadi bernilai nol

atas masing-masing tandanya disebut effect coding. Pada effect coding,  dinotasikan sebagai rata-rata untuk logmˆ_ijk.

3.1.2 Model Non-lengkap

Seperti disebutkan di atas, dalam model loglinier lengkap semua kemungkinan

interaksi ada. Dengan kata lain, tidak ada pembatasan yang dikenakan pada

parameter-parameter model selain dari pembatasan untuk mengidentifikasi. Namun,

pembatasan parameter-parameter model menjadi penting dilakukan karena bertujuan

untuk menentukan dan menguji model yang lebih pelit yaitu model di mana beberapa

pembatasan dikenakan pada parameter. Model loglinier seperti ini di mana parameter

dibatasi dalam beberapa cara disebut sebagai model non-lengkap.

Ada berbagai jenis pembatasan yang dapat dikenakan kepada

parameter-parameter model loglinier. Salah satu jenis khusus pembatasan menyebabkan

terbentuknya kumpulan model loglinier hirarkis. Ini adalah model dimana

parameter-parameter loglinier secara tetap dibuat menjadi bernilai nol. Dengan demikian apabila

interaksi tertentu bernilai 0, semua order interaksi yang lebih tinggi berisi semua

indeks sebagai subset juga harus bernilai 0. Sebagai contoh jika asosiasi parsial antara

X dan Y dari persamaan (2.13) yaitu

 

_ijXY diasumsikan tidak ikut dalam model, maka interaksi tiga variabel _ijkXYZ harus bernilai 0.

Menerapkan pembatasan ini untuk persamaan model loglinier lengkap di atas hasilnya

(39)

logmˆ_ijk _iX Y_j _kZ _ikXZ YZ_jk (3.2)

Contoh lain dari model loglinier hirarkis yang non-lengkap adalah model independen

untuk trivariat sesuai persamaan (2.14), yaitu:

logmˆ_ijk _iX Y_j Z_k

Model loglinier hirarkis adalah model loglinier yang paling populer karena dalam

sebagian besar aplikasi secara relatif lebih mudah untuk mengestimasi parameter

karena keberadaan dari statistik minimum yang sederhana.

3.2 Konfigurasi Model Loglinier Tiga Faktor

Bentuk model loglinier tiga faktor dapat dibagi menjadi beberapa konfigurasi yang

berguna untuk lebih mengetahui pembagian jenis-jenis model yang ada, yakni:

Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor

No. Model Konfigurasi

1. Model Independen

logmˆ_ijk _iX Y_j Z_k C1C2C3

2. Model Satu Interaksi Dua Faktor

2.1 logmˆ_ijk  _iX Y_j _kZ _ijXY C12 C3

2.2 logmˆ_ijk  _iX Y_j _kZ _ikXZ C13 C2

2.3 logmˆ_ijk _iX Y_j _kZ YZ_jk C1 C23

3. Model Dua Interaksi Dua Faktor

3.1 logmˆ_ijk  _iX Y_j _kZ _ijXY XZ_ik C12 C13

3.2 logmˆ_ijk _iX Y_j Z_k _ijXY YZ_jk C12 C23

3.3 logmˆ_ijk _iX Y_j _kZ _ikXZ YZ_jk C13 C23

4. Model Tanpa Interaksi Tiga Faktor

logmˆ_ijk  _iX Y_j Z_k _ijXY _ikXZ YZ_jk C12 C13 C23

5. Model Lengkap

(40)

Sebagai tambahan bahwa untuk model lengkap di atas terdapat tiga jenis efek order

didalamnya, yakni efek order pertama, efek order kedua, dan efek order ketiga. Efek

order pertama adalah X i

 , Y_j, dan Z k

 . Efek order kedua adalah _ijXY, XZ ik

 , dan YZ_jk .

Efek order ketiga adalah _ijkXYZ.

3.3 Derajat Bebas

Derajat bebas adalah banyaknya sel dalam tabel klasifikasi silang dikurangi

banyaknya parameter yang ditaksir dalam model. Derajat bebas untuk tabel tiga faktor

ditulis pada tabel berikut:

Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor

Bentuk Derajat Bebas

 1

X

 

I 1

Y

 

J1 Z



K 1



XY

  

I1 J1 XZ

 

I1 K 1



YZ

 

J 1 K 1



XYZ

  

I1 J 1 K 1



(Sumber: Friel, 2005)

3.4 Algoritma Hirarkis Backward

Algoritma Hirarkis Backward dimulai dengan dibentuknya suatu model lengkap.

Kemudian, komponen dari model itu dievaluasi untuk melihat apakah terdapat efek

yang dapat dieliminasi dengan melihat hasil uji kecocokan modelnya. Proses ini terus

berlangsung sampai tidak ada efek yang harus dikeluarkan dari model. Pemodelan

loglinier Hirarkis Backward menggunakan eliminasi mundur yang digunakan untuk

menemukan model terbaik, yaitu model yang memiliki interaksi yang signifikan

(41)

Adapun algoritmanya secara lengkap sebagai berikut (Chapter 14 dan Agresti, 1990):

Langkah 1

Analisis dengan memasukkan semua variabel pada model lengkap, dengan asumsi

bahwa interaksi tiga faktor terdapat dalam model. Kemudian anggap model lengkap

dengan konfigurasi C123 sebagai model terbaik, dalam hal ini disebut sebagai model

(0).

Langkah 2

Keluarkan interaksi tiga fakor dari model sehingga menjadi model (1), yaitu model

dengan konfigurasi C12 C13 C23. Pada model ini semua interaksi dua faktor ada atau

signifikan dalam model, tetapi tidak ada interaksi antara ketiga faktor.

Langkah 3

Lakukan pengujian dengan Conditional Test Statistic (CTS) G2 apakah model (1)

masih merupakan model terbaik, dengan hipotesis sebagai berikut:

H0 : model (1) = model terbaik

H1 : model (0) = model terbaik

Conditional Test Statistic tersebut adalah : G2(1-0) = G2(1) - G2(0)

dimana : G2(1) = statistik likelihood G2 untuk model (1)

G2(0) = statistik likelihood G2 untuk model (0)

Langkah 4

Bandingkan G2(1-0) dengan 2df;, dengan kriteria penolakan G2  2df; dan untuk kriteria penerimaan jika G2 < 2_df;_.

Derajat kebebasan (degree of freedom) = derajat kebebasan model (0) - derajat

(42)

Langkah 5

Jika H0 diterima maka model (1) merupakan model terbaik. Jika H0 diterima,

bandingkan model (1) dengan model (2), yaitu model yang diperoleh dari model (1)

apabila salah satu dari interaksi dua faktor dikeluarkan dari model.

Langkah 6

Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai 2

G

terkecil, seandainya salah satu interaksi dua faktor dikeluarkan dari model. Hal ini

dilakukan karena untuk