MODEL LOG LINEAR MULTIVARIATE UNTUK TABEL KONTINGENSI TAK SEMPURNA BERDIMENSI TIGA
(Studi Kasus:Jumlah Penduduk Desa Simpang Agung Tahun 2011)
SOFYAN ARI HANANTO
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA
2012 M/1433 H
MODEL LOG LINEAR MULTIVARIATE UNTUK TABEL KONTINGENSI TAK SEMPURNA BERDIMENSI TIGA
(Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011)
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah
Oleh:
Sofyan Ari Hananto 108094000026
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA 2012 M / 1433 H
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI ADALAH BENAR-BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI LAIN ATAU LEMBAGA MANAPUN.
Jakarta, Juli 2012
Sofyan Ari Hananto 108094000026
iv
PERSEMBAHAN DAN MOTTO
Alhamdulillah ,
Skripsi ini aku persembahkan untuk:
Bapak, Ibu, adikku (Oktavia Sulistia Handayani), kakak2ku ( Mas Yuan & Mb Dewi), dan teman dekatku Eva Nurmalasari serta Seluruh Keluarga Besarku yang tak henti-hentinya memberikan dorongan dalam menempuh pendidikan ini. Hidupku terasa lengkap ketika bisa berada di tengah-tengah kalian.
Sahabat-sahabatku yang selalu membantu, mengingatkanku, serta memberikan banyak inspirasi dan semangat bagiku.
Dan semua orang yang telah memberikan warna dalam hidupku, terimakasih atas ilmu, nasehat serta pengalaman yang diberikan.
βHarapan bukanlah Mimpi, tapi Harapan adalah Sesuatu yang dapat mewujudkan Mimpiβ
βNiat adalah ukuran dalam menilai benarnya suatu perbuatan, oleh karenanya, ketika niatnya benar, maka perbuatan itu benar, dan jika niatnya buruk, maka perbuatan itu burukβ
(Imam An Nawawi)
v ABSTRAK
Sofyan Ari Hananto, Model Log Linear Multivariate Untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga (Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011) di bawah bimbingan Bambang Ruswandi dan Yanne Irene.
Tabel kontingensi merupakan suatu tabel yang menggambarkan tingkat dari masing-masing variabel kategori berdasarkan frekuensi pengamatan. Suatu tabel kontingensi dikatakan tak sempurna jika dan hanya jika tabel tersebut mempunyai sebuah sel kosong atau lebih untuk ditinjau. Dalam analisis statitistika, salah satu model untuk menganalisis data kategori adalah model log linear. Model log linear digunakan untuk menganalisa hubungan antara variabel-variabel kategori yang membentuk tabel kontingensi sembarang dimensi, yang dalam penelitian ini digunakan untuk analisis tabel kontingensi tiga dimensi.
Studi kasus dalam penelitian ini adalah jumlah penduduk yang dipengaruhi oleh variabel tingkat umur (X), variabel tingkat pendidikan (Y) dan variabel jenis kelamin (Z). Tabel kontingensi jumlah penduduk dalam penelitian ini merupakan tabel kontingensi tak sempurna karena untuk tingkat umur anak-anak tidak ada yang mempunyai tingkat pendidikan SLTA atau Perguruan Tinggi. Untuk mengetahui variabel mana yang saling terkait dari ketiga variable tersebut digunakan analisis model log linear tiga dimensi. Berdasarkan hasil analisis data penelitian, model log linear yang terbaik untuk studi kasus jumlah penduduk Desa Simpang Agung adalah model log linear dengan persamaan:
π₯π¨π ππππ = π + πππΏ+ πππ+ πππ+ ππππΏπ+ πππππ, yang berarti tingkat pendidikan (Y) berinteraksi terhadap tingkat umur (X) dan jenis kelamin (Z) dalam menggambarkan dinamika jumlah penduduk Desa Simpang Agung, atau variabel tingkat pendidikan (Y) menjadi variabel dependen diantara variabel independen tingkat umur (X) dan jenis kelamin (Z).
Kata Kunci: Variabel Kategori, Tabel Kontingensi Tak Sempurna dan Model Log linear.
vi ABSTRACT
Sofyan Ari Hananto, Model Log Linear Multivariate Untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga (Studi Kasus: Jumlah Penduduk Desa Simpang Agung Tahun 2011) di bawah bimbingan Bambang Ruswandi dan Yanne Irene.
Contingency is table delineates of each category variable rate based on the frequency of observation. A table of contingency said to be imperfect if an only if the table had a cell vaccum or more for review. In an analysis statitistika , one of the models to analyze data category is the kind of log linear. Model log linear model used to analyze the relation between variables category forming a table contingency just any dimensions, that in research is used for table of contingency analysis of three dimension.
Case studies in this study is a populations that is influenced by age-level variables (X), variable (Y) level of education and gender variable (Z). Contingency table population in this study is imperfect because of the contingency table for rate children age no one has any education level Senior High School (SLTA) or college (PT). To find out which variables are interrelated from the third variable is used log linear model analysis of three dimensions. Based on the results of the analysis of research data, log linear model is the best for a case study of the population of the village is the junction of log linear with the equation: π₯π¨π ππππ = π + πππΏ+ πππ+ πππ+ ππππΏπ+ πππππ, that means the level of education (Y) affect the level of age (X) and gender (Z) in describing the dynamics of the population of the village of Simpang Agung, education level or variable (Y) being the dependent variable independent variable levels of ege between (X) and gender (Z).
Keyword: Variable Categories, Contingency Tables Are Perfect an the Log linear Models.
vii KATA PENGANTAR
Assalamuβalaikum Wr. Wb.
Alhamdulillah, puji syukur selalu penulis panjatkan kepada ALLAH SWT, atas rahmat serta kenikmatan yang diberikan olehNya. Shalawat beserta salam semoga selalu tercurahkan kepada Nabi Besar Muhammad SAW, keluarga, sahabat dan segenap umatnya sehingga penulis dapat menyelesaikan skripsi ini.
Penyusunan skripsi ini ditujukan sebagai syarat kelulusan yang harus ditempuh mahasiswa Progam Studi Matematika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta dalam mencapai jenjang pendidikan sarjana srata satu.
Dalam penyusunan skripsi ini penulis banyak mendapat bantuan dari berbagai pihak, sehingga penulis dapat menyelesaikan skripsi ini, Dalam Kesempatan ini penulis ingin menyampaikan terima kasih kepada:
1. Kedua orang tua, kakak dan adikku tercinta serta seluruh keluarga besar penulis yang selalu memberikan kasih sayang dan selalu mendoakan penulis sehingga dapat menyelesaikan skripsi ini.
2. Teman-teman Matematika angkatan 2008 yang selalu bersama dan memberikan dukungan selama 4 tahun dalam kuliah maupun penyusunan skripsi.
viii 3. Bapak Bambang Ruswandi dan Ibu Yanne Irene selaku pebimbing pertama dan kedua atas segala bimbingan dan bantuannya dalam penyusunan skripsi ini.
4. Ibu Irma Fauziah dan Ibu Summaβina selaku penguji pertama dan kedua atas segala masukan dan perbaikan dalam penyusunan skripsi ini.
5. Teman dekat dan baikku Eva Nurmala Sari yang telah banyak membantu dalam penyusunan skripsi dan doa serta dukungannya.
6. Para pejabat pemerintahan Desa Simpang Agung yang telah bersedia memberikan bantuan data dalam penelitian ini.
Penulis menyadari sepenuhnya bahwa skripsi ini masih jauh dari kesempurnaan, masih banyak kekurangan dan kelemahan yang ditemukan, hal ini disebabkan karena keterbatasan kemampuan Penulis. Untuk itu dengan segala kerendahan hati penulis selalu mengharapkan kritikan dan saran yang sifatnya membangun dari pembaca.
Wassalamuβalaikum Wr.Wb.
Jakarta, Juli 2012 Penulis
Sofyan Ari Hananto
ix DAFTAR ISI
HALAMAN JUDUL ... i
LEMBAR PENGESAHAN ... ii
PERNYATAAN ... iii
PERSEMBAHAN DAN MOTTO ... iv
ABSTRAK ... v
ABSTRACT ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... ix
DAFTAR TABEL ... xii
DAFTAR LAMPIRAN ... xiii
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 4
1.3 Pembatasan Masalah ... 5
1.4 Tujuan Penelitian ... 5
1.5 Manfaat Penelitian ... 5
BAB II LANDASAN TEORI ... 6
2.1 Variabel Data ... 6
2.2 Distribusa Poisson ... 7
x
2.3 Tabel Kontingensi ... 7
2.3.1 Tabel Kontingensi Dua Dimensi ... 8
2.3.2 Tabel Kontingensi Tiga Dimensi ... 12
2.4 Model Log Linear ... 13
2.4.1 Model Log Linear Dua Dimensi ... 13
2.4.2 Model Log Linear Tiga Dimensi ... 14
2.4.3 Maksimum Likelihood Untuk Model Log Linear ... 15
BAB III METODOLOGI PENELITIAN ... 19
3.1 Data dan Variabel ... 19
3.2 Metode Analisis Data ... 22
3.2.1 Estimasi Frekuensi Harapan ... 22
3.2.2 Pengujian Hipotesis ... 24
3.3 Alur Penelitian ... 29
BAB IV HASIL DAN PEMBAHASAN ... 30
4.1 Deskripsi Data ... 30
4.2 Hasil Estimasi Frekuensi Harapan ... 32
4.3 Pemilihan Model ... 40
4.3.1 Uji Chi-Square (π2) ... 40
4.3.2 Pengujian Model ... 42
4.3.3 Analisis Residual (Pearson Residual) ... 43
4.3.4 Parameter Model Log Linear ... 45
xi
BAB V KESIMPULAN DAN SARAN ... 46
5.1 Kesimpulan ... 46
5.2 Saran ... 47
DAFTAR PUSTAKA ... 48
LAMPIRAN ... 49
xii DAFTAR TABEL
Tabel 2.1 Tabel Kontingensi 2 x 2 ... 8
Tabel 2.2 Tabel Kontingensi I x J ... 9
Tabel 2.3 Tabel Probabilitas 2 Dimensi ... 11
Tabel 3.1 Tabel Kontingensi Tiga Dimensi ... 20
Tabel 3.2 Tabel Statistik Cukup Minimal ... 21
Tabel 3.3 Tabel Derajat Bebas Untuk Tabel Kontingensi Tak Sempurna ... 25
Tabel 4.1 Data Jumlah Penduduk Desa Simpang Agung ... 30
Tabel 4.2 Tabel Estimasi Frekuensi Harapan Model (X, Y, Z) ... 32
Tabel 4.3 Tabel Estimasi Frekuensi Harapan Model (X, Y Z) ... 33
Tabel 4.4 Tabel Estimasi Frekuensi Harapan Model (Y, X Z) ... 34
Tabel 4.5 Tabel Estimasi Frekuensi Harapan Model (Z, XY) ... 35
Tabel 4.6 Tabel Estimasi Frekuensi Harapan Model (XY, XZ)... 36
Tabel 4.7 Tabel Estimasi Frekuensi Harapan Model (XY, YZ)... 37
Tabel 4.6 Tabel Estimasi Frekuensi Harapan Model (XZ, YZ) ... 38
Tabel 4.7 Tabel Estimasi Frekuensi Harapan Model (XY, XZ, YZ)... 39
Tabel 4.9 Tabel Nilai Chi-Square (π2) ... 40
Tabel 4.10 Tabel Nilai Goodness of fit (πΊ2) ... 42
Tabel 4.11 Analisis Residual (Pearson Residuals)... 43
Tabel 4.12 Tabel Nilai Masing-masing Parameter ... 45
xiii DAFTAR LAMPIRAN
Lampiran 1 Data Jumlah Penduduk Desa Simpang Agung Kecamatan Seputih Agung Lampung Tengah Tahun 2011 ... 49 Lampiran 2 Tabel 5.1.2 Tabel Statistik Cukup Minimal ... 50 Lampiran 3 Nilai Estimasi Frekuensi Masing-Masing Model ... 52 Lampiran 4 Perhitungan Nilai Chi-Square dan Goodness of Fit Masing-Masing Model ... 69 Lampiran 5 Perhitungan Parameter Untuk Persamaan Model Log Linear .β¦.. 72
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Data adalah informasi tentang sesuatu yang merupakan sarana untuk memudahkan penafsiran dan memahami maknanya. Dalam kehidupan sehariβhari sering dijumpai data yang dikelompokkan ke dalam suatu kategori tertentu.
Misalnya data di bidang kependudukan, kesehatan, ekonomi dan lainβlain. Dalam penelitian banyak ditemukan situasi dimana data yang dikumpulkan dapat dikategorikan menjadi satu atau lebih kategori. Data kategori merupakan data suatu pengamatan yang mengandung variabelβvariabel yang berkategori sekaligus merupakan data berupa frekuensi pengamatan. Cara yang digunakan untuk menyajikan data kategorik agar sistematis perlu disusun dalam suatu tabel tabulasi silang yang disebut tabel kontingensi.
Tabel kontingensi merupakan suatu tabel yang memperlihatkan tingkat dari masingβmasing variabel kategorik berdasarkan frekuensi pengamatan. Setiap frekuensi yang diamati dalam suatu tabel kontingensi h x k, terdapat frekuensi harapan atau frekuensi teoritis yang dihitung dengan kendala terhadap suatu hipotesis sesuai dengan aturan probabilitas. Frekuensi yang terdapat dalam selβsel dari tabel kontingensi disebut frekuensi sel. Frekuensi total dari setiap baris atau setiap kolom disebut frekuensi marjinal [1]. Tabel kontingensi dapat terdiri dari dua dimensi, tiga dimensi, empat dimensi dan seterusnya. Dengan tabel kontingensi diharapkan akan mempermudah dalam penyusunan perhitungan,
2 penyajian hasil analisis, dan mempermudah dalam memahami situasi pada rancangan yang kompleks.
Tabel kontingensi umumnya berbentuk sempurna, namun ada juga tabel kontingensi yang tak sempurna. Suatu tabel kontingensi dikatakan tak sempurna jika dan hanya jika tabel tersebut mempunyai sebuah sel kosong atau lebih untuk populasi yang ditinjau. Sel kosong ini disebut sel kosong struktural atau sel kosong murni [8]. Misalnya data jumlah penduduk menurut umur, pendidikan dan jenis kelamin. Dalam kategori tertentu ada sel yang kosong, dikarenakan tidak ada yang memenuhi kategori tersebut. Sebagai contoh kelompok umur anakβanak dalam kategori pendidikan tinggi, selnya akan kosong, karena tidak ada kelompok umur anakβanak yang sudah memperoleh pendidikan tinggi.
Dalam analisis statistika, salah satu model untuk menganalisis data kategorik adalah model log linear. Model log linear digunakan untuk menganalisa hubungan antara variabelβvariabel kategorik yang membentuk tabel kontingensi sembarang dimensi. Dimensi adalah banyaknya variabel yang berpengaruh terhadap suatu kasus, mulai dari satu dimensi (sederhana), dua dimensi, dan tiga dimensi atau lebih (multidimensi).
Dari penelitian yang dilakukan oleh Angela Jeanson dengan judul β Loglinear Models β yang mengaplikasikan model log linear tabel kontingensi dua dimensi dalam bidang kesehatan yaitu tentang jumlah penyakit jantung yang dipengaruhi oleh variabel berat badan dan jenis kelamin, yang menyimpulkan langkah-langkah dalam pembuatan model log linear dua dimensi dan contoh
3 penyelesaian dalam masalah tabel kontingensi. Begitu pula dari hasil penelitian Mamik Lestyorini tahun 2010 yang menerapkan model log linier untuk tabel kontingensi berdimensi empat dengan mengambil studi kasus Akses Internet Mahasiswa Jurusan Pendidikan Matematika di Universitas Negeri Yogyakarta.
Dalam penelitian tersebut variabel yang mempengaruhi adalah variabel program studi, jenis kelamin, banyaknya uang saku dan waktu yang diperlukan untuk akses internet setiap harinya. Dari penelitian tersebut disimpulkan bahwa dari keempat variabel yang diamati, variabel program studi berinteraksi dengan jenis kelamin, variabel program studi berinteraksi dengan banyaknya uang saku, dan variabel program studi berinteraksi dengan waktu akses internet. Sehingga dari hasil penelitian tersebut diperoleh model: log ππππ = π + πππ + πππ + πππ+ πππ + πππππ + πππππ + πππππ.
Dinamika jumlah penduduk adalah hal yang sering kali menjadi dasar dari permasalahan di suatu daerah, mulai dari masalah ekonomi, kesehatan, pendidikan dan sebagainya. Jumlah penduduk suatu daerah dapat diketahui melalui sensus, registrasi dan survey penduduk. Hal yang sering dikaitkan dengan penyebab pertumbuhan penduduk diantaranya adalah tingkat kelahiran dan tingkat pendidikan penduduk di daerah tersebut. Tingkat pendidikan sangat berpengaruh dalam pertambahan jumlah penduduk karena semakin rendah rata-rata tingkat pendidikan dapat mengakibatkan banyak terjadi pernikahan usia dini sehingga meningkatkan tingkat kelahiran.
Jumlah penduduk dapat juga disajikan dalam bentuk piramida penduduk yang mempunyai komposisi jenis kelamin dan kelompok umur. Misalnya, jika
4 jumlah usia muda lebih banyak dari usia dewasa dan usia tua hal ini menunjukkan bahwa pertumbuhan penduduk sangat tinggi. Sebaliknya, jika jumlah penduduk usia muda lebih rendah dari jumlah penduduk usia dewasa dan usia tua menandakan bahwa pertumbuhan penduduk rendah. Namun, berkaitan dengan penelitian ini, peneliti akan menyajikan jumlah penduduk ke dalam bentuk tabel kontingensi tiga dimensi yang tak sempurna dikaitkan dengan kelompok umur, tingkat pendidikan dan jenis kelamin. Kelompok umur anakβanak dalam kategori pendidikan tinggi selnya akan kosong, karena tidak ada kelompok umur anakβ
anak yang sudah memperoleh pendidikan tinggi. Oleh sebab itu, peneliti ingin mengaplikasikan model log linear dalam bidang kependudukan yang diberi judul
β Model Log Linear Multivariate untuk Tabel Kontingensi Tak Sempurna Berdimensi Tiga β yang mengambil studi kasus jumlah penduduk Desa Simpang Agung, Kecamatan Seputih Agung, Lampung Tengah tahun 2011.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, maka dapat diuraikan perumusan masalah sebagai berikut:
1. Bagaimana menentukan model log linear yang tepat untuk tabel kontingensi tak sempurna dalam menggambarkan dinamika jumlah penduduk desa Simpang Agung menurut umur, jenis kelamin dan tingkat pendidikan?
2. Bagaimana keterkaitan antara faktor umur, jenis kelamin dan tingkat pendidikan dalam menentukan model log linear label kontingensi tak sempurna untuk dinamika jumlah penduduk Desa Simpang Agung?
5 1.3 Pembatasan Masalah
Dalam penelitian ini dilakukan pembatasan masalah dalam hal variabel yang dibahas yaitu faktor tingkat pendidikan (SD, SLTP, SMA, PT), faktor jenis kelamin (laki-laki dan perempuan) dan faktor umur (anakβanak umur 5β13 tahun, remaja umur 14β22 tahun, Dewasa umur 23-31 tahun, Usia Lanjut umur 32β40 tahun). Sedangkan data yang digunakan adalah data jumlah penduduk desa Simpang Agung tahun 2011.
1.4 Tujuan Penelitian
Adapun tujuan penelitian ini adalah:
1. Mendeskripsikan analisis model log linear untuk tabel kontingensi tak sempurna berdimensi tiga.
2. Mengetahui interaksi antara faktor umur, jenis kelamin dan tingkat pendidikan dalam menentukan model log linear tabel kontingensi tak sempurna untuk dinamika jumlah penduduk Desa Simpang Agung.
1.5 Manfaat Penelitian
Manfaat penelitian ini diantaranya adalah:
1. Sebagai tambahan pengetahuan tentang penerapan model log linear multivariat tiga dimensi dalam kehidupan sehariβhari.
2. Sebagai bahan referensi bagi peneliti lain yang ingin mengaplikasikan model log linear tiga dimensi dalam bidang yang lain.
6
BAB II
LANDASAN TEORI
2.1 Variabel Data
Dalam melakukan observasi perlu ditentukan karakter yang akan diobservasi dari unit pengamatan yang disebut variabel. Variabel merupakan atribut dari sekelompok objek yang diteliti dari masingβmasing objeknya [2].
Variabel dapat dibedakan menjadi variabel kontinu dan diskrit. Variabel kontinu adalah variabel yang besarannya dapat menempati semua nilai yang ada diantara dua titik. Variabel diskrit merupakan variabel yang besarannya tidak dapat menempati semua nilai. Suatu variabel dikatakan kategorik jika variabel tersebut mempunyai skala pengukuran yang terdiri dari sekumpulan kategorik tertentu.
Variabel kategorik juga merupakan bagian dari variabel diskrit yang memiliki nilai dikotomi atau polikotomi.
Dalam statistika suatu pengukuran obyek pengamatan dibedakan menjadi empat skala pengukuran yaitu: skala nominal, skala ordinal, skala interval dan skala rasio [2]. Skala nominal mengklasifikasikan objek atau kejadian-kejadian ke dalam berbagai kelompok kategori untuk menunjukkan kesamaan atau perbedaan ciri-ciri objek. Kategori tersebut dan dilambangkan dengan kata-kata, simbol, atau angka. Tingkat pengukuran nominal adalah kualitatif. Skala ordinal tidak memberikan nilai absolut pada obyek, tetapi hanya urutan relatif. Misalnya si A sangat baik, B baik, C cukup, dan D kurang. Ciri lain dari skala ordinal adalah mempunyai nilai mutlak nol dan tingkat pengukuran yang kualitatif. Skala
7 interval memberikan data yang berasal dari obyek atau kategori yang diurutkan berdasarkan suatu atribut tertentu, dimana jarak antara setiap kategori adalah sama namun tidak bisa dibandingkan dan tidak mempunyai nilai nol mutlak. Skala rasio mempunyai sifat skala interval ditambah satu sifat lain yaitu memberikan keterangan tentang nilai nol mutlak dari obyek yang diukur.
2.2 Distribusi Poisson
Distribusi poisson merupakan pengembangan dari distribusi binomial yang mengkalkulasikan distribusi probabilitas dengan kemungkinan sukses (p) sangat kecil dan jumlah eksperimen (n) sangat besar. Nilaiβnilai probabilitas distribusi poisson bergantung pada parameter Β΅ yaitu rataβrata banyaknya hasil percobaan yang terjadi selama selang waktu dan daerah tertentu. Rumus umum distribusi poisson adalah [3]:
ππ π = ππ₯πβπ
π₯ ! (2.1) dimana π = rata β rata distribusi
π₯ = banyaknya hasil pengamatan dalam selang waktu tertentu π = konstanta 2,71828 (bilangan natural)
2.3 Tabel Kontingensi
Tabel kontingensi merupakan suatu tabel yang menggambarkan tingkat dari masingβmasing variabel kategorik berdasarkan frekuensi pengamatan. Setiap frekuensi yang diamati dalam suatu tabel kontingensi h x k, terdapat frekuensi harapan atau frekuensi teoritis yang dihitung dengan suatu hipotesis sesuai dengan aturan probabilitas. Frekuensi yang terdapat dalam selβsel dari tabel kontingensi
8 disebut frekuensi sel. Frekuensi total dari setiap baris atau setiap kolom disebut frekuensi marjinal [4]. Tabel kontingensi dapat terdiri dari dua dimensi, tiga dimensi, empat dimensi dan seterusnya. Dengan tabel kontingensi diharapkan dapat mempermudah dalam penyusunan perhitungan, penyajian hasil analisis, dan mempermudah dalam memahami situasi pada rancangan yang kompleks.
2.3.1 Tabel Kontingensi Dua Dimensi a. Tabel kontingensi 2 x 2
Tabel kontingensi 2 x 2 mengklasifikasikan dua variabel X dan Y yang masing-masing mempunyai 2 kategorik yaitu i baris dan j kolom [4]. Secara umum dapat ditulis dalam tabel berikut ini:
Tabel 2.1 Tabel kontingensi 2 x 2
Keterangan:
πππ = frekuensi pengamatan pada baris ke i dan kolom ke j ππ. = total marjinal pada baris ke I (i = 1, 2)
π.π = total marjinal pada kolom ke j ( j = 1,2) n = total pengamatan
Variabel (Y) Total
Y1 Y2
Variabel (X)
X1 π11 π12 π1.
X2 π21 π22 π2.
Total π.1 π.2 π
9 b. Tabel kontingensi I x J
Tabel kontingensi I x J merupakan perluasan dari tabel kontingensi dua dimensi yang berukuran 2 x 2,dimana I menyatakan baris pada variabel X dan J menyatakan kolom pada variabel Y. Tabel kontingensi I x J dapat disajikan dalam tabel 2.
Tabel 2.2 Tabel Kontingensi I x J Variabel 2
(Y)
Total
Y1 Y2 ... Yj
Variabel 1 (X)
X1 π11 π11 ... π1π π1.
X2 π21 π21 ... π2π π2.
. .
. .
. .
. .
. .
Xi ππ1 ππ1 ... πππ ππ.
Total π.1 π.1 ... π.π n Keterangan:
πππ = frekuensi pengamatan pada baris ke-i dan kolom ke-j ππ. = total marjinal pada variabel baris
π.π = total marjinal pada variabel kolom
n = total frekuensi pengamatan
10 Distribusi probabilitas untuk tabel kontingensi berhubungan dengan skema sampling, misalkan setiap objek dari sampel yang dipilih secara acak dari beberapa populasi kemudian diklasifikasikan ke dalam dua variabel X dan Y.
Misalkan πππ = π(π = π, π = π) menunjukkan probabilitas (X,Y) terdapat dalam sel di baris i dan kolom j dengan π,ππππ = 1 [3].
πππ = πππ
π (2.2) Kemudian dapat dihitung gabungan probabilitas antara probabilitas baris
dan probabilitas kolom. Untuk total probabilitas baris dilambangkan ππ+ dan total probabilitas kolom dilambangkan π+π .
ππ+ = π11 + π12 dan π+π = π11 + π21 (2.3) Secara umum dua variabel dikatakan independen jika
πππ = ππ. Γ π.π (2.4) Dalam tabel kontingensi dua dimensi, πππ adalah frekuensi pengamatan pada baris ke-i dan kolom ke-j, ππ+ adalah frekuensi marjinal baris ke-i dan π+π adalah frekuensi marginal untuk kolom ke-j serta πππ adalah probabilitas pengamatan, dimana:
ππ π ππ = 1 ππ.= ππ ππ π.π = ππ ππ
ππ π ππ = π ππ. = ππ ππ π.π = ππ ππ
Dalam tabel kontingensi dua dimensi, dilambangkan πππ adalah frekuensi harapan untuk baris ke-i dan kolom ke-j, dimana ukuran sampel n dan probabilitas πππ maka:
11 πππ = n Γ πππ = n Γ ππ+ Γ π+π
πππ = n Γ ππ.
π Γ π.π
π ( subtitusikan persamaan 2.2) πππ = ππ. (π.π)
π (2.5) Berikut adalah tabel kontingensi probabilitas untuk 2 dimensi berukuran I x J :
Tabel 2.3 Tabel Probabilitas 2 Dimensi Variabel 2
(Y)
Total
Y1 Y2 ... Yj
Variabel 1 (X)
X1 π11 π11 ... π1π π1.
X2 π21 π21 ... π2π π2.
. .
. .
. .
. .
. .
Xi ππ1 ππ1 ... πππ ππ.
Total π.1 π.1 ... π+π 1 Keterangan:
πππ : probabilitas pengamatan pada baris ke-i dan kolom ke-j
ππ. : probabilitas pengamatan kategori ππ
π.π : probabilitas pengamatan kategori ππ
12 2.3.2 Tabel Kontingensi Tiga Dimensi
Tabel kontingensi tiga dimensi mempunyai tiga variabel kategorik (X, Y, Z) yang berturutβturut mempunyai i, j, k sel. Tabel kontingensi tiga dimensi merupakan tabel yang menyajikan konsep dasar hubungan antara variabel X dengan variabel Y, dimana terdapat variabel kontrol tunggal Z dan semuanya adalah variabel kategorik [5]. Tabel tersebut mempunyai i, j, dan k sel, yang terdiri atas I baris, J kolom dan K lapis (kontrol). Tabel kontingensi tiga dimensi disebut juga tabel I x J x K (tabel kontingensi tiga dimensi dapat disajikan seperti lampiran II).
Dalam tabel kontingensi tiga dimensi, ππππ adalah frekuensi pengamatan pada baris ke-I, kolom ke-j dan lapis ke-k, ππ.. adalah frekuensi marjinal baris ke-I, π.π . adalah frekuensi marginal untuk kolom ke-j dan π..π adalah frekuensi marginal untuk lapis ke-k serta ππππ adalah probabilitas pengamatan, dimana:
π π πππππ = 1 ππ..= ππ π πππ
π.π .= ππ π πππ π..π = ππ π πππ
ππ π π πππ = π ππ.. = ππ π πππ
π.π . = ππ π πππ π..π = ππ π πππ
Dalam tabel kontingensi tiga dimensi, frekuensi harapan untuk masing- masing sel dilambangkan ππππ, yaitu frekuensi harapan untuk baris ke-i, kolom ke-j, dan lapis ke- k, dimana ukuran sampel n dan probabilitas ππππ maka:
13 ππππ = n Γ ππππ = n Γ ππ.. Γ π.π . Γ π..π
ππππ = n Γ ππ..
π Γ π.π .
π Γ π..π
π ( subtitusikan persamaan 2.2)
ππππ = ππ.. π.π . (π..π)
π2 (2.5) 2.4 Model Log Linear
2.4.1 Model Log Linear untuk Tabel Dua Dimensi a. Model Bebas ( Independen)
Diberikan dua variabel X baris dan Y kolom yang saling bebas, maka model log linear dapat disajikan dalam bentuk [4]:
log πππ = π + πππ + πππ (2.6) Dimana :
ππππ : frekuensi harapan dalam sel i j π : parameter rataβrata keseluruhan πππ : parameter pengaruh tingkat i faktor X πππ : parameter pengaruh tingkat j faktor Y
Dengan asumsi ππππ = ππ ππ = 0 dan derajat bebas (I-1) (J-1) b. Model Lengkap ( Saturated)
Model lengkap adalah model yang menjelaskan jika kedua variabel X dan Y saling berinteraksi atau terdapat hubungan langsung antara kedua variabel tersebut. Maka model log linear lengkap dapat ditulis [4] :
log πππ = π + πππ + πππ+ πππππ (2.7)
14 Dimana :
ππππ : frekuensi harapan dalam sel i j π : parameter rata β rata keseluruhan πππ : parameter pengaruh tingkat i faktor X πππ : parameter pengaruh tingkat j faktor Y
πππππ: parameter pengaruh tingkat interaksi i,j pada faktor X dan Y
Dengan asumsi ππππ = ππ ππ = ππ πππ = ππ πππ = 0 dan derajat bebas (I-1) (J-1).
2.4.2 Model Log Linear untuk Tabel Tiga Dimensi a. Model Bebas (Independen)
Diberikan tiga variabel X baris, Y kolom dan Z lapis, dimana ketiga variabel tersebut saling bebas, maka model log linear dapat disajikan dalam bentuk [4]:
log ππππ = π + πππ + πππ+ πππ (2.8) Dimana :
ππππ : frekuensi harapan dalam sel i j π : parameter rata β rata keseluruhan πππ : parameter pengaruh tingkat i faktor X πππ : parameter pengaruh tingkat j faktor Y πππ : parameter pengaruh tingkat k faktor Z
Dengan asumsi ππππ = ππ ππ = ππ ππ = 0 dan derajat bebas (I-1) (J-1) (K-1)
15 b. Model Lengkap ( Saturated)
Untuk tabel tiga dimensi terdapat tiga variabel X, Y, dan Z yang memungkinkan terjadinya interaksi antara variabel XZ dengan variabel kontrol Y, atau memungkinkan terjadinya interaksi antara variabel YZ dengan variabel kontrol X. Serta memungkinkan terjadinya interaksi antara variabel XY dengan variabel XZ, atau pun ketiga variabel tersebut saling berinteraksi (XYZ). Sehingga model lengkap log linear tabel tiga dimensi dapat disajikan dalam bentuk [5]:
log ππππ = π + πππ + πππ+ πππ + πππππ + πππππ + πππππ + πππππππ (2.9) Dimana :
ππππ : frekuensi harapan dalam sel i j π : parameter rataβrata keseluruhan πππ : parameter pengaruh tingkat i faktor X πππ : parameter pengaruh tingkat j faktor Y πππ : parameter pengaruh tingkat k faktor Z πππππ: parameter pengaruh faktor interaksi sel- ij πππππ: parameter pengaruh faktor interaksi sel- ik πππππ: parameter pengaruh faktor interaksi sel- jk πππππππ: parameter pengaruh faktor interaksi sel- ijk
2.4.3 Maksimum Likelihood Untuk Model Log Linear Tiga Dimensi
Dimisalkan sebuah sampel {ππππ} untuk klasifikasi silang dari tiga variabel X, Y dan Z. Diasumsikan ketiga variabel dalah variabel random
16
poisson dengan nilai harapan ππππ. Fungsi kepadatan probabilitas poisson bersamaa dari ππππ adalah [4]:
exp β ππππ (ππππ)ππππ
ππππ! π
π
π (2.10) Sehingga maksimum likelihood dapat dinyatakan dalam bentuk:
L(π) = ππ π π πππ log ππππ β ππ π π πππ (2.11) Karena log ππππ = π + πππ + πππ+ πππ + πππππ + πππππ+ πππππππ maka:
ππππ = ππ₯π(π + πππ+ πππ+ πππ + πππππ + πππππ + πππππππ) (2.12) Dari persamaan (2.11) dan persamaan (2.12) diperoleh bentuk log likelihood:
L(π) = ππ π π πππ log ππππ β ππ π π πππ
= π π πππππ log(ππ₯π π + πππ + πππ+ πππ + πππππ + πππππ + πππππππ) β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ + πππππππ)
= π π πππππ π + πππ + πππ+ πππ + πππππ + πππππ+
πππππππ β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ + πππππππ)
= π π πππππ π + ππ π πππ πππ + ππ π πππ πππ + ππ π πππ πππ + ππ πππ πππππ + ππ πππ πππππ + ππ πππ πππππ + ππ π π πππ πππππππ β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ+ πππππππ)
Maka diperoleh:
L(m)=π π + ππ π..πππ + ππ .π .πππ + ππ ..π πππ + ππ π ππ .πππππ + ππ π π.π πππππ + ππ π .ππ πππππ + ππ π π πππ πππππππ β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ + πππππππ)
17 Dari persamaan (2.14) dapat dicari turunan terhadap parameter-parameter sehingga diperoleh estimasi maksimum likelihood setiap model (ππππ):
1) Turunan terhadap π diperoleh
L(π) = π π + ππ π..πππ + ππ .π .πππ+ ππ ..π πππ + ππ π ππ .πππππ +
ππ π π.π πππππ+ ππ π .ππ πππππ+ ππ π π πππ πππππππ β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ + πππππππ)
ππΏ
ππ= n β (ππ₯π(π + ππ π π ππ + πππ+ πππ + πππππ + πππππ + πππππππ)
ππΏ
ππ = n β ππ π π πππ
ππΏ
ππ = 0 maka:
0 = n β ππ π π πππ
n = π π πππππ n = πβ¦
n = πβ¦ berarti total estimasi frekuensi harapan sama dengan total frekuensi pengamatan. Berdasarkan penjabaran di atas dapat diperoleh turunan terhadap parameter-parameter lainnya, yaitu:
2) Turunan terhadap πππ diperoleh:
ππ.. =ππ.. dengan i= 1,2,β¦,I
3) Turunan terhadap πππ diperoleh:
π.π . =π.π . dengan j= 1,2,β¦,J
18 4) Turunan terhadap πππ diperoleh:
π..π =π..π dengan k= 1,2,β¦,K 5) Turunan terhadap πππππ diperoleh:
πππ . =πππ . dengan i= 1,2,β¦,I ; j=1,2,β¦.J 6) Turunan terhadap πππππ diperoleh:
ππ.π =ππ.π dengan i= 1,2,β¦,I ; k=1,2,β¦.K 7) Turunan terhadap πππππ diperoleh:
π.ππ =π.ππ dengan j= 1,2,β¦,J ; k=1,2,β¦.K
19
BAB III
METODOLOGI PENELITIAN
3.1 Data dan Variabel
Data yang digunakan dalam penelitian ini adalah data sekunder dari Badan Sensus Kependudukan Kabupaten Lampung Tengah mengenai jumlah penduduk Desa Simpang Agung, Kecamatan Seputih Agung Lampung Tengah Tahun 2011, yang dicatat berdasarkan variabel umur, jenis kelamin dan tingkat pendidikan.
Data dari variabel tersebut berbentuk kategori dimana untuk variabel umur terdiri atas anak-anak (5-13 tahun), remaja (14-22 tahun), dewasa (23-31 tahun), dan usia lanjut (32-40 tahun). Kemudian untuk variabel tingkat pendidikan terdiri atas tingkat pendidikan SD sederajat, SLTP sederajat, SLTA sederajat dan Perguruan Tinggi. Variabel jenis kelamin terdiri atas laki-laki dan perempuan.
Data sekunder yang didapat, dicatat dalam bentuk formulir biodata penduduk untuk WNI (per keluarga) yang terdiri dari 1300 Kepala Keluarga. Dari formulir biodata penduduk tersebut dibuat suatu tabel distribusi frekuensi untuk jumlah penduduk berdasarkan variabel yang telah ditentukan sebelumnya yang kemudian dimasukkan dalam tabel kontingensi berdimensi tiga. Berikut gambaran tabel kontingensi tiga dimensi berdasarkan data penelitian.
20 Tabel 3.1 Tabel Kontingensi Tiga Dimensi
laki-laki perempuan
Anak - anak
SD π111 π112
SLTP π121 π122
SLTA π131 π132
PT π141 π142
Remaja
SD π211 π212
SLTP π221 π222
SLTA π231 π232
PT π241 π242
Dewasa
SD π311 π312
SLTP π321 π322
SLTA π331 π332
PT π341 π342
Lanjut Usia
SD π411 π412
SLTP π421 π422
SLTA π431 π432
PT π441 π442
Dari tabel 3.1, misalnya π111 menjelaskan bahwa frekuensi jumlah penduduk untuk kategori umur anak-anak, tingkat pendidikan SD dan jenis kelamin laki-laki. Kemudian π212 menjelaskan frekuensi jumlah penduduk untuk kategori umur remaja, tingkat pendidikan SD dan jenis kelamin perempuan.
Untuk π341 menjelaskan frekuensi jumlah penduduk kategori umur dewasa, tingkat pendidikan SLTA dan jenis kelamin laki-laki. Sedangkan π442 menjelaskan frekuensi jumlah penduduk untuk kategori umur lanjut usia, tingkat pendidikan Perguruan Tinggi dan jenis kelamin perempuan.
21 Setelah terbentuk tabel kontingensi seperti tabel di atas, selanjutnya dicari nilai statistik cukup minimal. Statistik cukup minimal merupakan koefisien dari masing-masing variabel berdasarkan beberapa kemungkinan model log linear tiga dimensi. Dengan ππππ adalah frekuensi dari setiap variabel yang diamati, maka statistik cukup minimal berdasarkan model log linear tiga dimensi adalah sebagai berikut:
Tabel 3.2 Tabel Statistik Cukup Minimal Model Log
Linear
Statistik Cukup Minimal
(X, Y, Z) ππ.., π.π ., π..π (X, YZ) ππ.., π.ππ (Y, XZ) π.π ., ππ.π (Z, XY) π..π, πππ . (XY, XZ) πππ ., ππ.π (XY, YZ) πππ ., π.ππ (XZ, YZ) ππ.π, π.ππ (XY, XZ, YZ) πππ ., ππ.π, π.ππ Keterangan:
(X, Y, Z) = model yang ketiga faktornya tidak ada interaksi
(X, YZ) = model yang hanya terdapat satu interaksi (interaksi antara faktor Y dan faktor Z)
Begitu juga untuk model-model yang lainnya.
22 3.2 Metode Analisis Data
3.2.1 Estimasi Frekuensi Harapan
Secara umum persamaan model log linear tabel kontingensi tak sempurna tiga dimensi dapat disajikan dalam bentuk [8]:
log ππππ = Β΅ + πππ + πππ+ πππ + πππππ + πππππ + πππππ+ πππππππ (3.3)
Dengan syarat sebagai berikut:
πΏπ ππππ = 0, πΏπ ππππ = 0, πΏπ ππππ =0
πΏππ πππππππ = 0, πΏππ πππππππ = 0, πΏππ πππππππ =0 , πΏππ πππππππ = 0
Dimana πΏπππ = 0 untuk sel kosong, dan πΏπππ = 1 untuk lainnya
Dalam persamaan model log linear tabel tiga dimensi lengkap terdapat 8 kemungkinan model yang dapat dibentuk yaitu [7]: model ketiga faktor independen (X, Y, Z), model yang salah satu faktor independen terhadap dua faktor lainnya (X, YZ), (Y, XZ), (Z, XY), dan model yang saling dependen (XY, XZ), (XY, YZ), (XZ, YZ), dan (XY, XZ, YZ).
Diasumsikan ππππ adalah probabilitas untuk tabel kontingensi tiga dimensi dengan persamaan:
ππππ =ππππ
πβ¦ (3.4) Sedangkan jika ππππ adalah estimasi frekuensi harapan untuk baris ke i, kolom ke j, dan lapis k.
ππππ = πΏπππ Γ πβ¦ Γ ππππ (3.5)
23 Dengan πΏπππ = 1, untuk sel yang terisi
0, untuk sel yang kosong
Nilai estimasi frekuensi harapan ππππ berdasarkan model-model yang dapat dibentuk dalam model log linear tabel tiga dimensi adalah [7]:
a. Model independen penuh (X, Y, Z) ππππ(0) = πβ¦ Γ ππππ
= πβ¦ Γ ππ..Γ π.π .Γ π..π
= πβ¦ Γ ππ..
πβ¦ Γπ.π.
πβ¦ Γ π..π
πβ¦
= πΏπππΓ ππ.. Γ π.π.Γ π..π
(πβ¦)2
Dengan πΏπππ = 1, untuk sel yang terisi 0, untuk sel yang kosong b. Model (X, YZ)
ππππ(1) = πβ¦ Γ ππ.. Γ π.ππ
= πβ¦ Γ ππ..
πβ¦ Γ π.ππ
πβ¦
= πΏπππ Γππ..Γ π.ππ
πβ¦
Dengan πΏπππ = 1, untuk sel yang terisi 0, untuk sel yang kosong c. Model (Y, XZ)
ππππ(3) = πΏπππ Γ πβ¦ Γ π.π . Γ ππ.π d. Model (Z, XY)
ππππ(2) =πΏπππ Γ πβ¦ Γ πππ . Γ π..π
24 e. Model (XY, XZ)
ππππ(4) = πβ¦ Γπππ . Γ ππ.π
ππ..
= πβ¦ Γ πππ .
πβ¦ Γ ππ.π
πβ¦ Γ πβ¦
ππ..
=πΏπππ Γπππ . Γ ππ.π
ππ..
Dengan πΏπππ = 1, untuk sel yang terisi 0, untuk sel yang kosong f. Model (XY, YZ)
ππππ(5) = πΏπππ Γπππ . Γ π.ππ
π.π .
g. Model (XZ, YZ)
ππππ(6) = πΏπππ Γππ.π Γ π.ππ
π..π
3.2.2 Pengujian Hipotesis
Langkah-langkah dalam pengujian hipotesis ini adalah:
1. Uji Chi-Square
Setelah diperoleh estimasi frekuensi harapan, perlu dibandingkan frekuensi-frekuensi hasil pengamatan dengan estimasi frekuensi harapan menggunakan uji Chi-Square dan uji Goodness of fit untuk mengetahui kelayakan setiap model.
Sebelum dilakukan pengujian Chi-Square perlu dihitung nilai derajat bebas untuk setiap variabel. Perhitungan nilai derajat bebas pada tabel kontingensi tak sempurna yaitu derajat bebas pada tabel kontingensi sempurna dikurangi banyaknya sel kosong dalam tabel kontingensi tak sempurna.
25 Tabel 3.3 Tabel Derajat Bebas Untuk Tabel Kontingensi Tak Sempurna
Model Log Linear Derajat Bebas
(X, Y, Z) IJK-I-J-K+2-n
(X, YZ) (JK-1) (I-1)-n
(Y, XZ) (IK-1) (J-1)-n
(Z, XY) (IJ-1) (K-1)-n
(XY, XZ) I(J-1) (K-1)-n
(XY, YZ) J(I-1) (K-1)-n
(XZ, YZ) K(I-1) (J-1)-n
(XY, XZ, YZ) (I-1) (J-1) (K-1)-n
Dimana n= banyaknya sel kosong dalam tabel kontingensi tak sempurna Hipotesis untuk uji ini adalah:
1. π»0 : ππππ = ππ..Γ π.π .Γ π..π π»1 : ππππ β ππ..Γ π.π .Γ π..π 2. π»0 : ππππ = ππ..Γ π.ππ
π»1 : ππππ β ππ..Γ π.ππ 3. π»0 : ππππ = ππ..Γ ππ.π π»1 : ππππ β ππ..Γ ππ.π 4. π»0 : ππππ = ππ..Γ π.ππ π»1 : ππππ β ππ..Γ π.ππ 5. π»0 : ππππ = πππ .Γ ππ.π/ππ..
π»1 : ππππ β πππ .Γ ππ.π/ππ..