MODEL LOG LINEAR MULTIVARIATE UNTUK TABEL KONTINGENSI TAK SEMPURNA BERDIMENSI TIGA. (Studi Kasus:Jumlah Penduduk Desa Simpang Agung Tahun 2011)

(1)

MODEL LOG LINEAR MULTIVARIATE UNTUK TABEL KONTINGENSI TAK SEMPURNA BERDIMENSI TIGA

(Studi Kasus:Jumlah Penduduk Desa Simpang Agung Tahun 2011)

SOFYAN ARI HANANTO

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA

2012 M/1433 H

(2)

MODEL LOG LINEAR MULTIVARIATE UNTUK TABEL KONTINGENSI TAK SEMPURNA BERDIMENSI TIGA

(Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011)

Skripsi

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains

Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah

Oleh:

Sofyan Ari Hananto 108094000026

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA 2012 M / 1433 H

(3)

(4)

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI ADALAH BENAR-BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI LAIN ATAU LEMBAGA MANAPUN.

Jakarta, Juli 2012

Sofyan Ari Hananto 108094000026

(5)

iv

PERSEMBAHAN DAN MOTTO

Alhamdulillah ,

Skripsi ini aku persembahkan untuk:

Bapak, Ibu, adikku (Oktavia Sulistia Handayani), kakak2ku ( Mas Yuan & Mb Dewi), dan teman dekatku Eva Nurmalasari serta Seluruh Keluarga Besarku yang tak henti-hentinya memberikan dorongan dalam menempuh pendidikan ini. Hidupku terasa lengkap ketika bisa berada di tengah-tengah kalian.

Sahabat-sahabatku yang selalu membantu, mengingatkanku, serta memberikan banyak inspirasi dan semangat bagiku.

Dan semua orang yang telah memberikan warna dalam hidupku, terimakasih atas ilmu, nasehat serta pengalaman yang diberikan.

“Harapan bukanlah Mimpi, tapi Harapan adalah Sesuatu yang dapat mewujudkan Mimpi”

“Niat adalah ukuran dalam menilai benarnya suatu perbuatan, oleh karenanya, ketika niatnya benar, maka perbuatan itu benar, dan jika niatnya buruk, maka perbuatan itu buruk”

(Imam An Nawawi)

(6)

v ABSTRAK

Sofyan Ari Hananto, Model Log Linear Multivariate Untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga (Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011) di bawah bimbingan Bambang Ruswandi dan Yanne Irene.

Tabel kontingensi merupakan suatu tabel yang menggambarkan tingkat dari masing-masing variabel kategori berdasarkan frekuensi pengamatan. Suatu tabel kontingensi dikatakan tak sempurna jika dan hanya jika tabel tersebut mempunyai sebuah sel kosong atau lebih untuk ditinjau. Dalam analisis statitistika, salah satu model untuk menganalisis data kategori adalah model log linear. Model log linear digunakan untuk menganalisa hubungan antara variabel-variabel kategori yang membentuk tabel kontingensi sembarang dimensi, yang dalam penelitian ini digunakan untuk analisis tabel kontingensi tiga dimensi.

Studi kasus dalam penelitian ini adalah jumlah penduduk yang dipengaruhi oleh variabel tingkat umur (X), variabel tingkat pendidikan (Y) dan variabel jenis kelamin (Z). Tabel kontingensi jumlah penduduk dalam penelitian ini merupakan tabel kontingensi tak sempurna karena untuk tingkat umur anak-anak tidak ada yang mempunyai tingkat pendidikan SLTA atau Perguruan Tinggi. Untuk mengetahui variabel mana yang saling terkait dari ketiga variable tersebut digunakan analisis model log linear tiga dimensi. Berdasarkan hasil analisis data penelitian, model log linear yang terbaik untuk studi kasus jumlah penduduk Desa Simpang Agung adalah model log linear dengan persamaan:

𝐥𝐨𝐠 𝒎_𝒊𝒋𝒌 = 𝝀 + 𝝀_𝒊^𝑿+ 𝝀_𝒋^𝒀+ 𝝀_𝒌^𝒁+ 𝝀_𝒊𝒋^𝑿𝒀+ 𝝀_𝒋𝒌^𝒀𝒁, yang berarti tingkat pendidikan (Y) berinteraksi terhadap tingkat umur (X) dan jenis kelamin (Z) dalam menggambarkan dinamika jumlah penduduk Desa Simpang Agung, atau variabel tingkat pendidikan (Y) menjadi variabel dependen diantara variabel independen tingkat umur (X) dan jenis kelamin (Z).

Kata Kunci: Variabel Kategori, Tabel Kontingensi Tak Sempurna dan Model Log linear.

(7)

vi ABSTRACT

Sofyan Ari Hananto, Model Log Linear Multivariate Untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga (Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011) di bawah bimbingan Bambang Ruswandi dan Yanne Irene.

Contingency is table delineates of each category variable rate based on the frequency of observation. A table of contingency said to be imperfect if an only if the table had a cell vaccum or more for review. In an analysis statitistika , one of the models to analyze data category is the kind of log linear. Model log linear model used to analyze the relation between variables category forming a table contingency just any dimensions, that in research is used for table of contingency analysis of three dimension.

Case studies in this study is a populations that is influenced by age-level variables (X), variable (Y) level of education and gender variable (Z). Contingency table population in this study is imperfect because of the contingency table for rate children age no one has any education level Senior High School (SLTA) or college (PT). To find out which variables are interrelated from the third variable is used log linear model analysis of three dimensions. Based on the results of the analysis of research data, log linear model is the best for a case study of the population of the village is the junction of log linear with the equation: 𝐥𝐨𝐠 𝒎_𝒊𝒋𝒌 = 𝝀 + 𝝀_𝒊^𝑿+ 𝝀_𝒋^𝒀+ 𝝀_𝒌^𝒁+ 𝝀_𝒊𝒋^𝑿𝒀+ 𝝀_𝒋𝒌^𝒀𝒁, that means the level of education (Y) affect the level of age (X) and gender (Z) in describing the dynamics of the population of the village of Simpang Agung, education level or variable (Y) being the dependent variable independent variable levels of ege between (X) and gender (Z).

Keyword: Variable Categories, Contingency Tables Are Perfect an the Log linear Models.

(8)

vii KATA PENGANTAR

Assalamu’alaikum Wr. Wb.

Alhamdulillah, puji syukur selalu penulis panjatkan kepada ALLAH SWT, atas rahmat serta kenikmatan yang diberikan olehNya. Shalawat beserta salam semoga selalu tercurahkan kepada Nabi Besar Muhammad SAW, keluarga, sahabat dan segenap umatnya sehingga penulis dapat menyelesaikan skripsi ini.

Penyusunan skripsi ini ditujukan sebagai syarat kelulusan yang harus ditempuh mahasiswa Progam Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta dalam mencapai jenjang pendidikan sarjana srata satu.

Dalam penyusunan skripsi ini penulis banyak mendapat bantuan dari berbagai pihak, sehingga penulis dapat menyelesaikan skripsi ini, Dalam Kesempatan ini penulis ingin menyampaikan terima kasih kepada:

1. Kedua orang tua, kakak dan adikku tercinta serta seluruh keluarga besar penulis yang selalu memberikan kasih sayang dan selalu mendoakan penulis sehingga dapat menyelesaikan skripsi ini.

2. Teman-teman Matematika angkatan 2008 yang selalu bersama dan memberikan dukungan selama 4 tahun dalam kuliah maupun penyusunan skripsi.

(9)

viii 3. Bapak Bambang Ruswandi dan Ibu Yanne Irene selaku pebimbing pertama dan kedua atas segala bimbingan dan bantuannya dalam penyusunan skripsi ini.

4. Ibu Irma Fauziah dan Ibu Summa’ina selaku penguji pertama dan kedua atas segala masukan dan perbaikan dalam penyusunan skripsi ini.

5. Teman dekat dan baikku Eva Nurmala Sari yang telah banyak membantu dalam penyusunan skripsi dan doa serta dukungannya.

6. Para pejabat pemerintahan Desa Simpang Agung yang telah bersedia memberikan bantuan data dalam penelitian ini.

Penulis menyadari sepenuhnya bahwa skripsi ini masih jauh dari kesempurnaan, masih banyak kekurangan dan kelemahan yang ditemukan, hal ini disebabkan karena keterbatasan kemampuan Penulis. Untuk itu dengan segala kerendahan hati penulis selalu mengharapkan kritikan dan saran yang sifatnya membangun dari pembaca.

Wassalamu’alaikum Wr.Wb.

Jakarta, Juli 2012 Penulis

Sofyan Ari Hananto

(10)

ix DAFTAR ISI

HALAMAN JUDUL ... i

LEMBAR PENGESAHAN ... ii

PERNYATAAN ... iii

PERSEMBAHAN DAN MOTTO ... iv

ABSTRAK ... v

ABSTRACT ... vi

KATA PENGANTAR ... vii

DAFTAR ISI ... ix

DAFTAR TABEL ... xii

DAFTAR LAMPIRAN ... xiii

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 4

1.3 Pembatasan Masalah ... 5

1.4 Tujuan Penelitian ... 5

1.5 Manfaat Penelitian ... 5

BAB II LANDASAN TEORI ... 6

2.1 Variabel Data ... 6

2.2 Distribusa Poisson ... 7

(11)

x

2.3 Tabel Kontingensi ... 7

2.3.1 Tabel Kontingensi Dua Dimensi ... 8

2.3.2 Tabel Kontingensi Tiga Dimensi ... 12

2.4 Model Log Linear ... 13

2.4.1 Model Log Linear Dua Dimensi ... 13

2.4.2 Model Log Linear Tiga Dimensi ... 14

2.4.3 Maksimum Likelihood Untuk Model Log Linear ... 15

BAB III METODOLOGI PENELITIAN ... 19

3.1 Data dan Variabel ... 19

3.2 Metode Analisis Data ... 22

3.2.1 Estimasi Frekuensi Harapan ... 22

3.2.2 Pengujian Hipotesis ... 24

3.3 Alur Penelitian ... 29

BAB IV HASIL DAN PEMBAHASAN ... 30

4.1 Deskripsi Data ... 30

4.2 Hasil Estimasi Frekuensi Harapan ... 32

4.3 Pemilihan Model ... 40

4.3.1 Uji Chi-Square (𝜒²) ... 40

4.3.2 Pengujian Model ... 42

4.3.3 Analisis Residual (Pearson Residual) ... 43

4.3.4 Parameter Model Log Linear ... 45

(12)

xi

BAB V KESIMPULAN DAN SARAN ... 46

5.1 Kesimpulan ... 46

5.2 Saran ... 47

DAFTAR PUSTAKA ... 48

LAMPIRAN ... 49

(13)

xii DAFTAR TABEL

Tabel 2.1 Tabel Kontingensi 2 x 2 ... 8

Tabel 2.2 Tabel Kontingensi I x J ... 9

Tabel 2.3 Tabel Probabilitas 2 Dimensi ... 11

Tabel 3.1 Tabel Kontingensi Tiga Dimensi ... 20

Tabel 3.2 Tabel Statistik Cukup Minimal ... 21

Tabel 3.3 Tabel Derajat Bebas Untuk Tabel Kontingensi Tak Sempurna ... 25

Tabel 4.1 Data Jumlah Penduduk Desa Simpang Agung ... 30

Tabel 4.2 Tabel Estimasi Frekuensi Harapan Model (X, Y, Z) ... 32

Tabel 4.3 Tabel Estimasi Frekuensi Harapan Model (X, Y Z) ... 33

Tabel 4.4 Tabel Estimasi Frekuensi Harapan Model (Y, X Z) ... 34

Tabel 4.5 Tabel Estimasi Frekuensi Harapan Model (Z, XY) ... 35

Tabel 4.6 Tabel Estimasi Frekuensi Harapan Model (XY, XZ)... 36

Tabel 4.7 Tabel Estimasi Frekuensi Harapan Model (XY, YZ)... 37

Tabel 4.6 Tabel Estimasi Frekuensi Harapan Model (XZ, YZ) ... 38

Tabel 4.7 Tabel Estimasi Frekuensi Harapan Model (XY, XZ, YZ)... 39

Tabel 4.9 Tabel Nilai Chi-Square (𝜒²) ... 40

Tabel 4.10 Tabel Nilai Goodness of fit (𝐺²) ... 42

Tabel 4.11 Analisis Residual (Pearson Residuals)... 43

Tabel 4.12 Tabel Nilai Masing-masing Parameter ... 45

(14)

xiii DAFTAR LAMPIRAN

Lampiran 1 Data Jumlah Penduduk Desa Simpang Agung Kecamatan Seputih Agung Lampung Tengah Tahun 2011 ... 49 Lampiran 2 Tabel 5.1.2 Tabel Statistik Cukup Minimal ... 50 Lampiran 3 Nilai Estimasi Frekuensi Masing-Masing Model ... 52 Lampiran 4 Perhitungan Nilai Chi-Square dan Goodness of Fit Masing-Masing Model ... 69 Lampiran 5 Perhitungan Parameter Untuk Persamaan Model Log Linear .….. 72

(15)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Data adalah informasi tentang sesuatu yang merupakan sarana untuk memudahkan penafsiran dan memahami maknanya. Dalam kehidupan sehari–hari sering dijumpai data yang dikelompokkan ke dalam suatu kategori tertentu.

Misalnya data di bidang kependudukan, kesehatan, ekonomi dan lain–lain. Dalam penelitian banyak ditemukan situasi dimana data yang dikumpulkan dapat dikategorikan menjadi satu atau lebih kategori. Data kategori merupakan data suatu pengamatan yang mengandung variabel–variabel yang berkategori sekaligus merupakan data berupa frekuensi pengamatan. Cara yang digunakan untuk menyajikan data kategorik agar sistematis perlu disusun dalam suatu tabel tabulasi silang yang disebut tabel kontingensi.

Tabel kontingensi merupakan suatu tabel yang memperlihatkan tingkat dari masing–masing variabel kategorik berdasarkan frekuensi pengamatan. Setiap frekuensi yang diamati dalam suatu tabel kontingensi h x k, terdapat frekuensi harapan atau frekuensi teoritis yang dihitung dengan kendala terhadap suatu hipotesis sesuai dengan aturan probabilitas. Frekuensi yang terdapat dalam sel–sel dari tabel kontingensi disebut frekuensi sel. Frekuensi total dari setiap baris atau setiap kolom disebut frekuensi marjinal [1]. Tabel kontingensi dapat terdiri dari dua dimensi, tiga dimensi, empat dimensi dan seterusnya. Dengan tabel kontingensi diharapkan akan mempermudah dalam penyusunan perhitungan,

(16)

2 penyajian hasil analisis, dan mempermudah dalam memahami situasi pada rancangan yang kompleks.

Tabel kontingensi umumnya berbentuk sempurna, namun ada juga tabel kontingensi yang tak sempurna. Suatu tabel kontingensi dikatakan tak sempurna jika dan hanya jika tabel tersebut mempunyai sebuah sel kosong atau lebih untuk populasi yang ditinjau. Sel kosong ini disebut sel kosong struktural atau sel kosong murni [8]. Misalnya data jumlah penduduk menurut umur, pendidikan dan jenis kelamin. Dalam kategori tertentu ada sel yang kosong, dikarenakan tidak ada yang memenuhi kategori tersebut. Sebagai contoh kelompok umur anak–anak dalam kategori pendidikan tinggi, selnya akan kosong, karena tidak ada kelompok umur anak–anak yang sudah memperoleh pendidikan tinggi.

Dalam analisis statistika, salah satu model untuk menganalisis data kategorik adalah model log linear. Model log linear digunakan untuk menganalisa hubungan antara variabel–variabel kategorik yang membentuk tabel kontingensi sembarang dimensi. Dimensi adalah banyaknya variabel yang berpengaruh terhadap suatu kasus, mulai dari satu dimensi (sederhana), dua dimensi, dan tiga dimensi atau lebih (multidimensi).

Dari penelitian yang dilakukan oleh Angela Jeanson dengan judul “ Loglinear Models ” yang mengaplikasikan model log linear tabel kontingensi dua dimensi dalam bidang kesehatan yaitu tentang jumlah penyakit jantung yang dipengaruhi oleh variabel berat badan dan jenis kelamin, yang menyimpulkan langkah-langkah dalam pembuatan model log linear dua dimensi dan contoh

(17)

3 penyelesaian dalam masalah tabel kontingensi. Begitu pula dari hasil penelitian Mamik Lestyorini tahun 2010 yang menerapkan model log linier untuk tabel kontingensi berdimensi empat dengan mengambil studi kasus Akses Internet Mahasiswa Jurusan Pendidikan Matematika di Universitas Negeri Yogyakarta.

Dalam penelitian tersebut variabel yang mempengaruhi adalah variabel program studi, jenis kelamin, banyaknya uang saku dan waktu yang diperlukan untuk akses internet setiap harinya. Dari penelitian tersebut disimpulkan bahwa dari keempat variabel yang diamati, variabel program studi berinteraksi dengan jenis kelamin, variabel program studi berinteraksi dengan banyaknya uang saku, dan variabel program studi berinteraksi dengan waktu akses internet. Sehingga dari hasil penelitian tersebut diperoleh model: log 𝜇_𝑖𝑗𝑘 = 𝜆 + 𝜆^𝑊_𝑖 + 𝜆_𝑗^𝑋 + 𝜆^𝑌_𝑘+ 𝜆_𝑙^𝑍 + 𝜆_𝑖𝑗^𝑊𝑋 + 𝜆_𝑖𝑘^𝑊𝑌 + 𝜆_𝑖𝑙^𝑊𝑍.

Dinamika jumlah penduduk adalah hal yang sering kali menjadi dasar dari permasalahan di suatu daerah, mulai dari masalah ekonomi, kesehatan, pendidikan dan sebagainya. Jumlah penduduk suatu daerah dapat diketahui melalui sensus, registrasi dan survey penduduk. Hal yang sering dikaitkan dengan penyebab pertumbuhan penduduk diantaranya adalah tingkat kelahiran dan tingkat pendidikan penduduk di daerah tersebut. Tingkat pendidikan sangat berpengaruh dalam pertambahan jumlah penduduk karena semakin rendah rata-rata tingkat pendidikan dapat mengakibatkan banyak terjadi pernikahan usia dini sehingga meningkatkan tingkat kelahiran.

Jumlah penduduk dapat juga disajikan dalam bentuk piramida penduduk yang mempunyai komposisi jenis kelamin dan kelompok umur. Misalnya, jika

(18)

4 jumlah usia muda lebih banyak dari usia dewasa dan usia tua hal ini menunjukkan bahwa pertumbuhan penduduk sangat tinggi. Sebaliknya, jika jumlah penduduk usia muda lebih rendah dari jumlah penduduk usia dewasa dan usia tua menandakan bahwa pertumbuhan penduduk rendah. Namun, berkaitan dengan penelitian ini, peneliti akan menyajikan jumlah penduduk ke dalam bentuk tabel kontingensi tiga dimensi yang tak sempurna dikaitkan dengan kelompok umur, tingkat pendidikan dan jenis kelamin. Kelompok umur anak–anak dalam kategori pendidikan tinggi selnya akan kosong, karena tidak ada kelompok umur anak–

anak yang sudah memperoleh pendidikan tinggi. Oleh sebab itu, peneliti ingin mengaplikasikan model log linear dalam bidang kependudukan yang diberi judul

“ Model Log Linear Multivariate untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga “ yang mengambil studi kasus jumlah penduduk Desa Simpang Agung, Kecamatan Seputih Agung, Lampung Tengah tahun 2011.

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka dapat diuraikan perumusan masalah sebagai berikut:

1. Bagaimana menentukan model log linear yang tepat untuk tabel kontingensi tak sempurna dalam menggambarkan dinamika jumlah penduduk desa Simpang Agung menurut umur, jenis kelamin dan tingkat pendidikan?

2. Bagaimana keterkaitan antara faktor umur, jenis kelamin dan tingkat pendidikan dalam menentukan model log linear label kontingensi tak sempurna untuk dinamika jumlah penduduk Desa Simpang Agung?

(19)

5 1.3 Pembatasan Masalah

Dalam penelitian ini dilakukan pembatasan masalah dalam hal variabel yang dibahas yaitu faktor tingkat pendidikan (SD, SLTP, SMA, PT), faktor jenis kelamin (laki-laki dan perempuan) dan faktor umur (anak–anak umur 5–13 tahun, remaja umur 14–22 tahun, Dewasa umur 23-31 tahun, Usia Lanjut umur 32–40 tahun). Sedangkan data yang digunakan adalah data jumlah penduduk desa Simpang Agung tahun 2011.

1.4 Tujuan Penelitian

Adapun tujuan penelitian ini adalah:

1. Mendeskripsikan analisis model log linear untuk tabel kontingensi tak sempurna berdimensi tiga.

2. Mengetahui interaksi antara faktor umur, jenis kelamin dan tingkat pendidikan dalam menentukan model log linear tabel kontingensi tak sempurna untuk dinamika jumlah penduduk Desa Simpang Agung.

1.5 Manfaat Penelitian

Manfaat penelitian ini diantaranya adalah:

1. Sebagai tambahan pengetahuan tentang penerapan model log linear multivariat tiga dimensi dalam kehidupan sehari–hari.

2. Sebagai bahan referensi bagi peneliti lain yang ingin mengaplikasikan model log linear tiga dimensi dalam bidang yang lain.

(20)

6

BAB II

LANDASAN TEORI

2.1 Variabel Data

Dalam melakukan observasi perlu ditentukan karakter yang akan diobservasi dari unit pengamatan yang disebut variabel. Variabel merupakan atribut dari sekelompok objek yang diteliti dari masing–masing objeknya [2].

Variabel dapat dibedakan menjadi variabel kontinu dan diskrit. Variabel kontinu adalah variabel yang besarannya dapat menempati semua nilai yang ada diantara dua titik. Variabel diskrit merupakan variabel yang besarannya tidak dapat menempati semua nilai. Suatu variabel dikatakan kategorik jika variabel tersebut mempunyai skala pengukuran yang terdiri dari sekumpulan kategorik tertentu.

Variabel kategorik juga merupakan bagian dari variabel diskrit yang memiliki nilai dikotomi atau polikotomi.

Dalam statistika suatu pengukuran obyek pengamatan dibedakan menjadi empat skala pengukuran yaitu: skala nominal, skala ordinal, skala interval dan skala rasio [2]. Skala nominal mengklasifikasikan objek atau kejadian-kejadian ke dalam berbagai kelompok kategori untuk menunjukkan kesamaan atau perbedaan ciri-ciri objek. Kategori tersebut dan dilambangkan dengan kata-kata, simbol, atau angka. Tingkat pengukuran nominal adalah kualitatif. Skala ordinal tidak memberikan nilai absolut pada obyek, tetapi hanya urutan relatif. Misalnya si A sangat baik, B baik, C cukup, dan D kurang. Ciri lain dari skala ordinal adalah mempunyai nilai mutlak nol dan tingkat pengukuran yang kualitatif. Skala

(21)

7 interval memberikan data yang berasal dari obyek atau kategori yang diurutkan berdasarkan suatu atribut tertentu, dimana jarak antara setiap kategori adalah sama namun tidak bisa dibandingkan dan tidak mempunyai nilai nol mutlak. Skala rasio mempunyai sifat skala interval ditambah satu sifat lain yaitu memberikan keterangan tentang nilai nol mutlak dari obyek yang diukur.

2.2 Distribusi Poisson

Distribusi poisson merupakan pengembangan dari distribusi binomial yang mengkalkulasikan distribusi probabilitas dengan kemungkinan sukses (p) sangat kecil dan jumlah eksperimen (n) sangat besar. Nilai–nilai probabilitas distribusi poisson bergantung pada parameter µ yaitu rata–rata banyaknya hasil percobaan yang terjadi selama selang waktu dan daerah tertentu. Rumus umum distribusi poisson adalah [3]:

𝑃_𝑟 𝑋 = ^𝜆^𝑥^𝑒^−𝜆

𝑥 ! (2.1) dimana 𝜆 = rata – rata distribusi

𝑥 = banyaknya hasil pengamatan dalam selang waktu tertentu 𝑒 = konstanta 2,71828 (bilangan natural)

2.3 Tabel Kontingensi

Tabel kontingensi merupakan suatu tabel yang menggambarkan tingkat dari masing–masing variabel kategorik berdasarkan frekuensi pengamatan. Setiap frekuensi yang diamati dalam suatu tabel kontingensi h x k, terdapat frekuensi harapan atau frekuensi teoritis yang dihitung dengan suatu hipotesis sesuai dengan aturan probabilitas. Frekuensi yang terdapat dalam sel–sel dari tabel kontingensi

(22)

8 disebut frekuensi sel. Frekuensi total dari setiap baris atau setiap kolom disebut frekuensi marjinal [4]. Tabel kontingensi dapat terdiri dari dua dimensi, tiga dimensi, empat dimensi dan seterusnya. Dengan tabel kontingensi diharapkan dapat mempermudah dalam penyusunan perhitungan, penyajian hasil analisis, dan mempermudah dalam memahami situasi pada rancangan yang kompleks.

2.3.1 Tabel Kontingensi Dua Dimensi a. Tabel kontingensi 2 x 2

Tabel kontingensi 2 x 2 mengklasifikasikan dua variabel X dan Y yang masing-masing mempunyai 2 kategorik yaitu i baris dan j kolom [4]. Secara umum dapat ditulis dalam tabel berikut ini:

Tabel 2.1 Tabel kontingensi 2 x 2

Keterangan:

𝑎_𝑖𝑗 = frekuensi pengamatan pada baris ke i dan kolom ke j 𝑛_𝑖. = total marjinal pada baris ke I (i = 1, 2)

𝑛_.𝑗 = total marjinal pada kolom ke j ( j = 1,2) n = total pengamatan

Variabel (Y) Total

Y1 Y2

Variabel (X)

X1 𝑎₁₁ 𝑎₁₂ 𝑛_1.

X2 𝑎₂₁ 𝑎₂₂ 𝑛_2.

Total 𝑛_.1 𝑛_.2 𝑛

(23)

9 b. Tabel kontingensi I x J

Tabel kontingensi I x J merupakan perluasan dari tabel kontingensi dua dimensi yang berukuran 2 x 2,dimana I menyatakan baris pada variabel X dan J menyatakan kolom pada variabel Y. Tabel kontingensi I x J dapat disajikan dalam tabel 2.

Tabel 2.2 Tabel Kontingensi I x J Variabel 2

(Y)

Total

Y1 Y2 ... Yj

Variabel 1 (X)

X1 𝑎₁₁ 𝑎₁₁ ... 𝑎_1𝑗 𝑛_1.

X2 𝑎₂₁ 𝑎₂₁ ... 𝑎_2𝑗 𝑛_2.

. .

Xi 𝑎_𝑖1 𝑎_𝑖1 ... 𝑎_𝑖𝑗 𝑛_𝑖.

Total 𝑛_.1 𝑛_.1 ... 𝑛_.𝑗 n Keterangan:

𝑎_𝑖𝑗 = frekuensi pengamatan pada baris ke-i dan kolom ke-j 𝑛_𝑖. = total marjinal pada variabel baris

𝑛_.𝑗 = total marjinal pada variabel kolom

n = total frekuensi pengamatan

(24)

10 Distribusi probabilitas untuk tabel kontingensi berhubungan dengan skema sampling, misalkan setiap objek dari sampel yang dipilih secara acak dari beberapa populasi kemudian diklasifikasikan ke dalam dua variabel X dan Y.

Misalkan 𝑝_𝑖𝑗 = 𝑃(𝑋 = 𝑖, 𝑌 = 𝑗) menunjukkan probabilitas (X,Y) terdapat dalam sel di baris i dan kolom j dengan _𝑖,𝑗𝑝_𝑖𝑗 = 1 [3].

𝑝_𝑖𝑗 = ^𝑛^𝑖𝑗

𝑛 (2.2) Kemudian dapat dihitung gabungan probabilitas antara probabilitas baris

dan probabilitas kolom. Untuk total probabilitas baris dilambangkan 𝑝_𝑖+ dan total probabilitas kolom dilambangkan 𝑝_+𝑗 .

𝑝_𝑖+ = 𝑝₁₁ + 𝑝₁₂ dan 𝑝_+𝑗 = 𝑝₁₁ + 𝑝₂₁ (2.3) Secara umum dua variabel dikatakan independen jika

𝑝_𝑖𝑗 = 𝑝_𝑖. × 𝑝_.𝑗 (2.4) Dalam tabel kontingensi dua dimensi, 𝑛_𝑖𝑗 adalah frekuensi pengamatan pada baris ke-i dan kolom ke-j, 𝑛_𝑖+ adalah frekuensi marjinal baris ke-i dan 𝑛_+𝑗 adalah frekuensi marginal untuk kolom ke-j serta 𝑝_𝑖𝑗 adalah probabilitas pengamatan, dimana:

𝑝_𝑖 _𝑗 _𝑖𝑗 = 1 𝑝_𝑖.= 𝑝_𝑗 _𝑖𝑗 𝑝_.𝑗 = 𝑝_𝑗 _𝑖𝑗

𝑛_𝑖 _𝑗 _𝑖𝑗 = 𝑛 𝑛_𝑖. = 𝑛_𝑗 _𝑖𝑗 𝑛_.𝑗 = 𝑛_𝑗 _𝑖𝑗

Dalam tabel kontingensi dua dimensi, dilambangkan 𝑚_𝑖𝑗 adalah frekuensi harapan untuk baris ke-i dan kolom ke-j, dimana ukuran sampel n dan probabilitas 𝑝_𝑖𝑗 maka:

(25)

11 𝑚_𝑖𝑗 = n × 𝑝_𝑖𝑗 = n × 𝑝_𝑖+ × 𝑝_+𝑗

𝑚_𝑖𝑗 = n × ^𝑛^𝑖.

𝑛 × ^𝑛^.𝑗

𝑛 ( subtitusikan persamaan 2.2) 𝑚_𝑖𝑗 = ^𝑛^𝑖.^(𝑛^.𝑗⁾

𝑛 (2.5) Berikut adalah tabel kontingensi probabilitas untuk 2 dimensi berukuran I x J :

Tabel 2.3 Tabel Probabilitas 2 Dimensi Variabel 2

(Y)

Total

Y1 Y2 ... Yj

Variabel 1 (X)

X1 𝑝₁₁ 𝑝₁₁ ... 𝑝_1𝑗 𝑝_1.

X2 𝑝₂₁ 𝑝₂₁ ... 𝑝_2𝑗 𝑝_2.

. .

Xi 𝑝_𝑖1 𝑝_𝑖1 ... 𝑝_𝑖𝑗 𝑝_𝑖.

Total 𝑝_.1 𝑝_.1 ... 𝑝_+𝑗 1 Keterangan:

𝑝_𝑖𝑗 : probabilitas pengamatan pada baris ke-i dan kolom ke-j

𝑝_𝑖. : probabilitas pengamatan kategori 𝑋_𝑖

𝑝_.𝑗: probabilitas pengamatan kategori 𝑌_𝑗

(26)

12 2.3.2 Tabel Kontingensi Tiga Dimensi

Tabel kontingensi tiga dimensi mempunyai tiga variabel kategorik (X, Y, Z) yang berturut–turut mempunyai i, j, k sel. Tabel kontingensi tiga dimensi merupakan tabel yang menyajikan konsep dasar hubungan antara variabel X dengan variabel Y, dimana terdapat variabel kontrol tunggal Z dan semuanya adalah variabel kategorik [5]. Tabel tersebut mempunyai i, j, dan k sel, yang terdiri atas I baris, J kolom dan K lapis (kontrol). Tabel kontingensi tiga dimensi disebut juga tabel I x J x K (tabel kontingensi tiga dimensi dapat disajikan seperti lampiran II).

Dalam tabel kontingensi tiga dimensi, 𝑛_𝑖𝑗𝑘 adalah frekuensi pengamatan pada baris ke-I, kolom ke-j dan lapis ke-k, 𝑛_𝑖.. adalah frekuensi marjinal baris ke-I, 𝑛_{.𝑗 .} adalah frekuensi marginal untuk kolom ke-j dan 𝑛_..𝑘 adalah frekuensi marginal untuk lapis ke-k serta 𝑝_𝑖𝑗𝑘 adalah probabilitas pengamatan, dimana:

_𝑖 _𝑗 _𝑘𝑝_𝑖𝑗𝑘 = 1 𝑝_𝑖..= 𝑝_𝑗 _𝑘 _𝑖𝑗𝑘

𝑝_{.𝑗 .}= 𝑝_𝑖 _𝑘 _𝑖𝑗𝑘 𝑝_..𝑘 = 𝑝_𝑖 _𝑗 _𝑖𝑗𝑘

𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 = 𝑛 𝑛_𝑖.. = 𝑛_𝑗 _𝑘 _𝑖𝑗𝑘

𝑝_{.𝑗 .} = 𝑛_𝑗 _𝑘 _𝑖𝑗𝑘 𝑛_..𝑘 = 𝑝_𝑖 _𝑗 _𝑖𝑗𝑘

Dalam tabel kontingensi tiga dimensi, frekuensi harapan untuk masing- masing sel dilambangkan 𝑚_𝑖𝑗𝑘, yaitu frekuensi harapan untuk baris ke-i, kolom ke-j, dan lapis ke- k, dimana ukuran sampel n dan probabilitas 𝑝_𝑖𝑗𝑘 maka:

(27)

13 𝑚_𝑖𝑗𝑘 = n × 𝑝_𝑖𝑗𝑘 = n × 𝑝_𝑖.. × 𝑝_{.𝑗 .} × 𝑝_..𝑘

𝑚_𝑖𝑗𝑘 = n × ^𝑛^𝑖..

𝑛 × ^𝑛^{.𝑗 .}

𝑛 × ^𝑛^..𝑘

𝑛 ( subtitusikan persamaan 2.2)

𝑚_𝑖𝑗𝑘 = ^𝑛^𝑖..^𝑛^{.𝑗 .}^(𝑛^..𝑘⁾

𝑛² (2.5) 2.4 Model Log Linear

2.4.1 Model Log Linear untuk Tabel Dua Dimensi a. Model Bebas ( Independen)

Diberikan dua variabel X baris dan Y kolom yang saling bebas, maka model log linear dapat disajikan dalam bentuk [4]:

log 𝑚_𝑖𝑗 = 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌 (2.6) Dimana :

𝑚_𝑖𝑗𝑘 : frekuensi harapan dalam sel i j 𝜆 : parameter rata–rata keseluruhan 𝜆_𝑖^𝑋 : parameter pengaruh tingkat i faktor X 𝜆_𝑗^𝑌 : parameter pengaruh tingkat j faktor Y

Dengan asumsi _𝑖𝜆_𝑖^𝑋 = 𝜆_𝑗 _𝑗^𝑌 = 0 dan derajat bebas (I-1) (J-1) b. Model Lengkap ( Saturated)

Model lengkap adalah model yang menjelaskan jika kedua variabel X dan Y saling berinteraksi atau terdapat hubungan langsung antara kedua variabel tersebut. Maka model log linear lengkap dapat ditulis [4] :

log 𝑚_𝑖𝑗 = 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑖𝑗^𝑋𝑌 (2.7)

(28)

14 Dimana :

𝑚_𝑖𝑗𝑘 : frekuensi harapan dalam sel i j 𝜆 : parameter rata – rata keseluruhan 𝜆_𝑖^𝑋 : parameter pengaruh tingkat i faktor X 𝜆_𝑗^𝑌 : parameter pengaruh tingkat j faktor Y

𝜆_𝑖𝑗^𝑋𝑌: parameter pengaruh tingkat interaksi i,j pada faktor X dan Y

Dengan asumsi _𝑖𝜆_𝑖^𝑋 = 𝜆_𝑗 _𝑗^𝑌 = 𝜆_𝑖 _𝑖^𝑋𝑌 = 𝜆_𝑗 _𝑗^𝑋𝑌 = 0 dan derajat bebas (I-1) (J-1).

2.4.2 Model Log Linear untuk Tabel Tiga Dimensi a. Model Bebas (Independen)

Diberikan tiga variabel X baris, Y kolom dan Z lapis, dimana ketiga variabel tersebut saling bebas, maka model log linear dapat disajikan dalam bentuk [4]:

log 𝑚_𝑖𝑗𝑘 = 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 (2.8) Dimana :

𝑚_𝑖𝑗𝑘 : frekuensi harapan dalam sel i j 𝜆 : parameter rata – rata keseluruhan 𝜆_𝑖^𝑋 : parameter pengaruh tingkat i faktor X 𝜆_𝑗^𝑌 : parameter pengaruh tingkat j faktor Y 𝜆_𝑘^𝑍 : parameter pengaruh tingkat k faktor Z

Dengan asumsi _𝑖𝜆_𝑖^𝑋 = 𝜆_𝑗 _𝑗^𝑌 = 𝜆_𝑘 _𝑘^𝑍 = 0 dan derajat bebas (I-1) (J-1) (K-1)

(29)

15 b. Model Lengkap ( Saturated)

Untuk tabel tiga dimensi terdapat tiga variabel X, Y, dan Z yang memungkinkan terjadinya interaksi antara variabel XZ dengan variabel kontrol Y, atau memungkinkan terjadinya interaksi antara variabel YZ dengan variabel kontrol X. Serta memungkinkan terjadinya interaksi antara variabel XY dengan variabel XZ, atau pun ketiga variabel tersebut saling berinteraksi (XYZ). Sehingga model lengkap log linear tabel tiga dimensi dapat disajikan dalam bentuk [5]:

log 𝑚_𝑖𝑗𝑘 = 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑗^𝑋𝑌 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑍 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 (2.9) Dimana :

𝑚_𝑖𝑗𝑘 : frekuensi harapan dalam sel i j 𝜆 : parameter rata–rata keseluruhan 𝜆_𝑖^𝑋 : parameter pengaruh tingkat i faktor X 𝜆_𝑗^𝑌 : parameter pengaruh tingkat j faktor Y 𝜆_𝑘^𝑍 : parameter pengaruh tingkat k faktor Z 𝜆_𝑖𝑗^𝑋𝑌: parameter pengaruh faktor interaksi sel- ij 𝜆_𝑖𝑘^𝑋𝑍: parameter pengaruh faktor interaksi sel- ik 𝜆_𝑗𝑘^𝑌𝑍: parameter pengaruh faktor interaksi sel- jk 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍: parameter pengaruh faktor interaksi sel- ijk

2.4.3 Maksimum Likelihood Untuk Model Log Linear Tiga Dimensi

Dimisalkan sebuah sampel {𝑛_𝑖𝑗𝑘} untuk klasifikasi silang dari tiga variabel X, Y dan Z. Diasumsikan ketiga variabel dalah variabel random

(30)

16

poisson dengan nilai harapan 𝑚_𝑖𝑗𝑘. Fungsi kepadatan probabilitas poisson bersamaa dari 𝑛_𝑖𝑗𝑘 adalah [4]:

^{exp −}^𝑚^𝑖𝑗𝑘 ^(𝑚^𝑖𝑗𝑘⁾^{𝑛𝑖𝑗𝑘}

𝑛_𝑖𝑗𝑘! 𝑘

𝑗

𝑖 (2.10) Sehingga maksimum likelihood dapat dinyatakan dalam bentuk:

L(𝑚) = 𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 log 𝑚_𝑖𝑗𝑘 − 𝑚_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 (2.11) Karena log 𝑚_𝑖𝑗𝑘 = 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋+ 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 maka:

𝑚_𝑖𝑗𝑘 = 𝑒𝑥𝑝(𝜆 + 𝜆_𝑖^𝑋+ 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍) (2.12) Dari persamaan (2.11) dan persamaan (2.12) diperoleh bentuk log likelihood:

L(𝑚) = 𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 log 𝑚_𝑖𝑗𝑘 − 𝑚_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘

= _𝑖 _𝑗 _𝑘𝑛_𝑖𝑗𝑘 log(𝑒𝑥𝑝 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍) − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

= _𝑖 _𝑗 _𝑘𝑛_𝑖𝑗𝑘 𝜆 + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋+

𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

= _𝑖 _𝑗 _𝑘𝑛_𝑖𝑗𝑘 𝜆 + 𝑛_𝑗 _𝑘 _𝑖𝑗𝑘 𝜆_𝑖^𝑋 + 𝑛_𝑖 _𝑘 _𝑖𝑗𝑘 𝜆^𝑌_𝑖 + 𝑛_𝑖 _𝑗 _𝑖𝑗𝑘 𝜆_𝑖^𝑍 + 𝑛_𝑘 _𝑖𝑗𝑘 𝜆_𝑖𝑘^𝑋𝑌 + 𝑛_𝑗 _𝑖𝑗𝑘 𝜆_𝑖𝑘^𝑋𝑍 + 𝑛_𝑖 _𝑖𝑗𝑘 𝜆^𝑌𝑍_𝑖𝑘 + 𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋+ 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

Maka diperoleh:

L(m)=𝑛 𝜆 + 𝑛_𝑖 _𝑖..𝜆_𝑖^𝑋 + 𝑛_𝑗 _{.𝑗 .}𝜆_𝑗^𝑌 + 𝑛_𝑖 _..𝑘 𝜆_𝑘^𝑍 + 𝑛_𝑖 _𝑗 _{𝑖𝑗 .}𝜆_𝑖𝑘^𝑋𝑌 + 𝑛_𝑖 _𝑘 _𝑖.𝑘 𝜆_𝑖𝑘^𝑋𝑍 + 𝑛_𝑗 _𝑘 _.𝑗𝑘 𝜆_𝑖𝑘^𝑌𝑍 + 𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

(31)

17 Dari persamaan (2.14) dapat dicari turunan terhadap parameter-parameter sehingga diperoleh estimasi maksimum likelihood setiap model (𝑚_𝑖𝑗𝑘):

1) Turunan terhadap 𝜆 diperoleh

L(𝑚) = 𝑛 𝜆 + 𝑛_𝑖 _𝑖..𝜆_𝑖^𝑋 + 𝑛_𝑗 _{.𝑗 .}𝜆_𝑗^𝑌+ 𝑛_𝑖 _..𝑘 𝜆_𝑘^𝑍 + 𝑛_𝑖 _𝑗 _{𝑖𝑗 .}𝜆_𝑖𝑘^𝑋𝑌 +

𝑛_𝑖 _𝑘 _𝑖.𝑘 𝜆_𝑖𝑘^𝑋𝑍+ 𝑛_𝑗 _𝑘 _.𝑗𝑘 𝜆_𝑖𝑘^𝑌𝑍+ 𝑛_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

𝜕𝐿

𝜕𝜆= n − (𝑒𝑥𝑝(𝜆 + 𝜆_𝑖 _𝑗 _𝑘 _𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋 + 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍)

𝜕𝐿

𝜕𝜆 = n − 𝑚_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘

𝜕𝐿

𝜕𝜆 = 0 maka:

0 = n − 𝑚_𝑖 _𝑗 _𝑘 _𝑖𝑗𝑘

n = _𝑖 _𝑗 _𝑘𝑚_𝑖𝑗𝑘 n = 𝑚_…

n = 𝑚_… berarti total estimasi frekuensi harapan sama dengan total frekuensi pengamatan. Berdasarkan penjabaran di atas dapat diperoleh turunan terhadap parameter-parameter lainnya, yaitu:

2) Turunan terhadap 𝜆_𝑖^𝑋 diperoleh:

𝑚_𝑖.. =𝑛_𝑖.. dengan i= 1,2,…,I

3) Turunan terhadap 𝜆_𝑗^𝑌 diperoleh:

𝑚_{.𝑗 .} =𝑛_{.𝑗 .} dengan j= 1,2,…,J

(32)

18 4) Turunan terhadap 𝜆_𝑘^𝑍 diperoleh:

𝑚_..𝑘 =𝑛_..𝑘 dengan k= 1,2,…,K 5) Turunan terhadap 𝜆_𝑖𝑗^𝑋𝑌 diperoleh:

𝑚_{𝑖𝑗 .} =𝑛_{𝑖𝑗 .} dengan i= 1,2,…,I ; j=1,2,….J 6) Turunan terhadap 𝜆_𝑖𝑘^𝑋𝑍 diperoleh:

𝑚_𝑖.𝑘 =𝑛_𝑖.𝑘 dengan i= 1,2,…,I ; k=1,2,….K 7) Turunan terhadap 𝜆_𝑗𝑘^𝑌𝑍 diperoleh:

𝑚_.𝑗𝑘 =𝑛_.𝑗𝑘 dengan j= 1,2,…,J ; k=1,2,….K

(33)

19

BAB III

METODOLOGI PENELITIAN

3.1 Data dan Variabel

Data yang digunakan dalam penelitian ini adalah data sekunder dari Badan Sensus Kependudukan Kabupaten Lampung Tengah mengenai jumlah penduduk Desa Simpang Agung, Kecamatan Seputih Agung Lampung Tengah Tahun 2011, yang dicatat berdasarkan variabel umur, jenis kelamin dan tingkat pendidikan.

Data dari variabel tersebut berbentuk kategori dimana untuk variabel umur terdiri atas anak-anak (5-13 tahun), remaja (14-22 tahun), dewasa (23-31 tahun), dan usia lanjut (32-40 tahun). Kemudian untuk variabel tingkat pendidikan terdiri atas tingkat pendidikan SD sederajat, SLTP sederajat, SLTA sederajat dan Perguruan Tinggi. Variabel jenis kelamin terdiri atas laki-laki dan perempuan.

Data sekunder yang didapat, dicatat dalam bentuk formulir biodata penduduk untuk WNI (per keluarga) yang terdiri dari 1300 Kepala Keluarga. Dari formulir biodata penduduk tersebut dibuat suatu tabel distribusi frekuensi untuk jumlah penduduk berdasarkan variabel yang telah ditentukan sebelumnya yang kemudian dimasukkan dalam tabel kontingensi berdimensi tiga. Berikut gambaran tabel kontingensi tiga dimensi berdasarkan data penelitian.

(34)

20 Tabel 3.1 Tabel Kontingensi Tiga Dimensi

laki-laki perempuan

Anak - anak

SD 𝑛₁₁₁ 𝑛₁₁₂

SLTP 𝑛₁₂₁ 𝑛₁₂₂

SLTA 𝑛₁₃₁ 𝑛₁₃₂

PT 𝑛₁₄₁ 𝑛₁₄₂

Remaja

SD 𝑛₂₁₁ 𝑛₂₁₂

SLTP 𝑛₂₂₁ 𝑛₂₂₂

SLTA 𝑛₂₃₁ 𝑛₂₃₂

PT 𝑛₂₄₁ 𝑛₂₄₂

Dewasa

SD 𝑛₃₁₁ 𝑛₃₁₂

SLTP 𝑛₃₂₁ 𝑛₃₂₂

SLTA 𝑛₃₃₁ 𝑛₃₃₂

PT 𝑛₃₄₁ 𝑛₃₄₂

Lanjut Usia

SD 𝑛₄₁₁ 𝑛₄₁₂

SLTP 𝑛₄₂₁ 𝑛₄₂₂

SLTA 𝑛₄₃₁ 𝑛₄₃₂

PT 𝑛₄₄₁ 𝑛₄₄₂

Dari tabel 3.1, misalnya 𝑛₁₁₁ menjelaskan bahwa frekuensi jumlah penduduk untuk kategori umur anak-anak, tingkat pendidikan SD dan jenis kelamin laki-laki. Kemudian 𝑛₂₁₂ menjelaskan frekuensi jumlah penduduk untuk kategori umur remaja, tingkat pendidikan SD dan jenis kelamin perempuan.

Untuk 𝑛₃₄₁ menjelaskan frekuensi jumlah penduduk kategori umur dewasa, tingkat pendidikan SLTA dan jenis kelamin laki-laki. Sedangkan 𝑛₄₄₂ menjelaskan frekuensi jumlah penduduk untuk kategori umur lanjut usia, tingkat pendidikan Perguruan Tinggi dan jenis kelamin perempuan.

(35)

21 Setelah terbentuk tabel kontingensi seperti tabel di atas, selanjutnya dicari nilai statistik cukup minimal. Statistik cukup minimal merupakan koefisien dari masing-masing variabel berdasarkan beberapa kemungkinan model log linear tiga dimensi. Dengan 𝑛_𝑖𝑗𝑘 adalah frekuensi dari setiap variabel yang diamati, maka statistik cukup minimal berdasarkan model log linear tiga dimensi adalah sebagai berikut:

Tabel 3.2 Tabel Statistik Cukup Minimal Model Log

Linear

Statistik Cukup Minimal

(X, Y, Z) 𝑛_𝑖.., 𝑛_{.𝑗 .}, 𝑛_..𝑘 (X, YZ) 𝑛_𝑖.., 𝑛_.𝑗𝑘 (Y, XZ) 𝑛_{.𝑗 .}, 𝑛_𝑖.𝑘 (Z, XY) 𝑛_..𝑘, 𝑛_{𝑖𝑗 .} (XY, XZ) 𝑛_{𝑖𝑗 .}, 𝑛_𝑖.𝑘 (XY, YZ) 𝑛_{𝑖𝑗 .}, 𝑛_.𝑗𝑘 (XZ, YZ) 𝑛_𝑖.𝑘, 𝑛_.𝑗𝑘 (XY, XZ, YZ) 𝑛_{𝑖𝑗 .}, 𝑛_𝑖.𝑘, 𝑛_.𝑗𝑘 Keterangan:

(X, Y, Z) = model yang ketiga faktornya tidak ada interaksi

(X, YZ) = model yang hanya terdapat satu interaksi (interaksi antara faktor Y dan faktor Z)

Begitu juga untuk model-model yang lainnya.

(36)

22 3.2 Metode Analisis Data

3.2.1 Estimasi Frekuensi Harapan

Secara umum persamaan model log linear tabel kontingensi tak sempurna tiga dimensi dapat disajikan dalam bentuk [8]:

log 𝜇_𝑖𝑗𝑘 = µ + 𝜆_𝑖^𝑋 + 𝜆_𝑗^𝑌+ 𝜆_𝑘^𝑍 + 𝜆_𝑖𝑗^𝑋𝑌 + 𝜆_𝑖𝑘^𝑋𝑍 + 𝜆_𝑗𝑘^𝑌𝑋+ 𝜆_𝑖𝑗𝑘^𝑋𝑌𝑍 (3.3)

Dengan syarat sebagai berikut:

𝛿_𝑖 _𝑖𝜆_𝑖^𝑋 = 0, 𝛿_𝑗 _𝑗𝜆_𝑗^𝑌 = 0, 𝛿_𝑘 _𝑘𝜆_𝑘^𝑍 =0

𝛿_𝑖𝑗 _𝑖𝑗𝜆_𝑖𝑗^𝑋𝑌 = 0, 𝛿_𝑖𝑘 _𝑖𝑘𝜆_𝑖𝑘^𝑋𝑍 = 0, 𝛿_𝑗𝑘 _𝑗𝑘𝜆_𝑗𝑘^𝑌𝑍 =0 , 𝛿_𝑗𝑘 _𝑗𝑘𝜆_𝑗𝑘^𝑌𝑍 = 0

Dimana 𝛿_𝑖𝑗𝑘 = 0 untuk sel kosong, dan 𝛿_𝑖𝑗𝑘 = 1 untuk lainnya

Dalam persamaan model log linear tabel tiga dimensi lengkap terdapat 8 kemungkinan model yang dapat dibentuk yaitu [7]: model ketiga faktor independen (X, Y, Z), model yang salah satu faktor independen terhadap dua faktor lainnya (X, YZ), (Y, XZ), (Z, XY), dan model yang saling dependen (XY, XZ), (XY, YZ), (XZ, YZ), dan (XY, XZ, YZ).

Diasumsikan 𝑝_𝑖𝑗𝑘 adalah probabilitas untuk tabel kontingensi tiga dimensi dengan persamaan:

𝑝_𝑖𝑗𝑘 =^𝑛^𝑖𝑗𝑘

𝑛… (3.4) Sedangkan jika 𝑚_𝑖𝑗𝑘 adalah estimasi frekuensi harapan untuk baris ke i, kolom ke j, dan lapis k.

𝑚_𝑖𝑗𝑘 = 𝛿_𝑖𝑗𝑘 × 𝑛_… × 𝑝_𝑖𝑗𝑘 (3.5)

(37)

23 Dengan 𝛿_𝑖𝑗𝑘 = 1, untuk sel yang terisi

0, untuk sel yang kosong

Nilai estimasi frekuensi harapan 𝑚_𝑖𝑗𝑘 berdasarkan model-model yang dapat dibentuk dalam model log linear tabel tiga dimensi adalah [7]:

a. Model independen penuh (X, Y, Z) 𝑚_𝑖𝑗𝑘⁽⁰⁾ = 𝑛_… × 𝑝_𝑖𝑗𝑘

= 𝑛_… × 𝑝_𝑖..× 𝑝_{.𝑗 .}× 𝑝_..𝑘

= 𝑛_… × ^𝑛^𝑖..

𝑛… ×^𝑛^.𝑗.

𝑛… × ^𝑛^..𝑘

𝑛…

= 𝛿_𝑖𝑗𝑘× ^𝑛^𝑖..^×^𝑛^.𝑗.^×^𝑛^..𝑘

(𝑛…)²

Dengan 𝛿_𝑖𝑗𝑘 = 1, untuk sel yang terisi 0, untuk sel yang kosong b. Model (X, YZ)

𝑚_𝑖𝑗𝑘⁽¹⁾ = 𝑛_… × 𝑝_𝑖.. × 𝑝_.𝑗𝑘

= 𝑛_… × ^𝑛^𝑖..

𝑛… × ^𝑛^.𝑗𝑘

𝑛…

= 𝛿_𝑖𝑗𝑘 ×^𝑛^𝑖..^{× 𝑛}^.𝑗𝑘

𝑛…

Dengan 𝛿_𝑖𝑗𝑘 = 1, untuk sel yang terisi 0, untuk sel yang kosong c. Model (Y, XZ)

𝑚_𝑖𝑗𝑘⁽³⁾ = 𝛿_𝑖𝑗𝑘 × 𝑛_… × 𝑝_{.𝑗 .} × 𝑝_𝑖.𝑘 d. Model (Z, XY)

𝑚_𝑖𝑗𝑘⁽²⁾ =𝛿_𝑖𝑗𝑘 × 𝑛_… × 𝑝_{𝑖𝑗 .} × 𝑝_..𝑘

(38)

24 e. Model (XY, XZ)

𝑚_𝑖𝑗𝑘⁽⁴⁾ = 𝑛_… ×^𝑝^{𝑖𝑗 .}^{× 𝑝}^𝑖.𝑘

𝑝_𝑖..

= 𝑛_… × ^𝑛^{𝑖𝑗 .}

𝑛_… × ^𝑛^𝑖.𝑘

𝑛_… × ^𝑛^…

𝑛_𝑖..

=𝛿_𝑖𝑗𝑘 ×^𝑛^{𝑖𝑗 .}^{× 𝑛}^𝑖.𝑘

𝑛_𝑖..

Dengan 𝛿_𝑖𝑗𝑘 = 1, untuk sel yang terisi 0, untuk sel yang kosong f. Model (XY, YZ)

𝑚_𝑖𝑗𝑘⁽⁵⁾ = 𝛿_𝑖𝑗𝑘 ×^𝑛^{𝑖𝑗 .}^{× 𝑛}^.𝑗𝑘

𝑛_{.𝑗 .}

g. Model (XZ, YZ)

𝑚_𝑖𝑗𝑘⁽⁶⁾ = 𝛿_𝑖𝑗𝑘 ×^𝑛^𝑖.𝑘^{× 𝑛}^.𝑗𝑘

𝑛..𝑘

3.2.2 Pengujian Hipotesis

Langkah-langkah dalam pengujian hipotesis ini adalah:

1. Uji Chi-Square

Setelah diperoleh estimasi frekuensi harapan, perlu dibandingkan frekuensi-frekuensi hasil pengamatan dengan estimasi frekuensi harapan menggunakan uji Chi-Square dan uji Goodness of fit untuk mengetahui kelayakan setiap model.

Sebelum dilakukan pengujian Chi-Square perlu dihitung nilai derajat bebas untuk setiap variabel. Perhitungan nilai derajat bebas pada tabel kontingensi tak sempurna yaitu derajat bebas pada tabel kontingensi sempurna dikurangi banyaknya sel kosong dalam tabel kontingensi tak sempurna.

(39)

25 Tabel 3.3 Tabel Derajat Bebas Untuk Tabel Kontingensi Tak Sempurna

Model Log Linear Derajat Bebas

(X, Y, Z) IJK-I-J-K+2-n

(X, YZ) (JK-1) (I-1)-n

(Y, XZ) (IK-1) (J-1)-n

(Z, XY) (IJ-1) (K-1)-n

(XY, XZ) I(J-1) (K-1)-n

(XY, YZ) J(I-1) (K-1)-n

(XZ, YZ) K(I-1) (J-1)-n

(XY, XZ, YZ) (I-1) (J-1) (K-1)-n

Dimana n= banyaknya sel kosong dalam tabel kontingensi tak sempurna Hipotesis untuk uji ini adalah:

1. 𝐻₀ : 𝑝_𝑖𝑗𝑘 = 𝑝_𝑖..× 𝑝_{.𝑗 .}× 𝑝_..𝑘 𝐻₁ : 𝑝_𝑖𝑗𝑘 ≠ 𝑝_𝑖..× 𝑝_{.𝑗 .}× 𝑝_..𝑘 2. 𝐻₀ : 𝑝_𝑖𝑗𝑘 = 𝑝_𝑖..× 𝑝_.𝑗𝑘

𝐻₁ : 𝑝_𝑖𝑗𝑘 ≠ 𝑝_𝑖..× 𝑝_.𝑗𝑘 3. 𝐻₀ : 𝑝_𝑖𝑗𝑘 = 𝑝_𝑖..× 𝑝_𝑖.𝑘 𝐻₁ : 𝑝_𝑖𝑗𝑘 ≠ 𝑝_𝑖..× 𝑝_𝑖.𝑘 4. 𝐻₀ : 𝑝_𝑖𝑗𝑘 = 𝑝_𝑖..× 𝑝_.𝑗𝑘 𝐻₁ : 𝑝_𝑖𝑗𝑘 ≠ 𝑝_𝑖..× 𝑝_.𝑗𝑘 5. 𝐻₀ : 𝑝_𝑖𝑗𝑘 = 𝑝_{𝑖𝑗 .}× 𝑝_𝑖.𝑘/𝑝_𝑖..

𝐻₁ : 𝑝_𝑖𝑗𝑘 ≠ 𝑝_{𝑖𝑗 .}× 𝑝_𝑖.𝑘/𝑝_𝑖..