• Tidak ada hasil yang ditemukan

KARAKTERISTIK PENDUGA PARAMETER GENERALIZED ESTIMATING EQUATION (GEE) PADA DATA LONGITUDINAL. (Skripsi) Oleh NAELU RASYIDA

N/A
N/A
Protected

Academic year: 2021

Membagikan "KARAKTERISTIK PENDUGA PARAMETER GENERALIZED ESTIMATING EQUATION (GEE) PADA DATA LONGITUDINAL. (Skripsi) Oleh NAELU RASYIDA"

Copied!
33
0
0

Teks penuh

(1)

KARAKTERISTIK PENDUGA PARAMETER GENERALIZED ESTIMATING EQUATION (GEE)

PADA DATA LONGITUDINAL (Skripsi)

Oleh

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG

BANDARLAMPUNG 2016

(2)

ABSTRACT

PARAMETER ESTIMATIONโ€™S CHARACTERISTICS OF GENERALIZED ESTIMATING EQUATION (GEE)

ON LONGITUDINAL DATA

By

NAELU RASYIDA

Repeated measurement on longitudinal data can caused autocorrelation. The method to modelling autocorrelation data is Generalized Estimating Equation (GEE), since in this method the correlation is counted so that obtained more efficient model. In this study, will be discussed about parameter estimationโ€™s characteristics on GEE includes unbiased and efficient. Parameter estimator on GEE can be proved unbiased, and the efficiency depend on the best correlation structure choosed. If there are some possibility of the correlation structures to chosen, so the most efficient is that obtained smallest Quasi Information Criterion value.

(3)

ABSTRAK

KARAKTERISTIK PENDUGA PARAMETER GENERALIZED ESTIMATING EQUATION (GEE)

PADA DATA LONGITUDINAL

Oleh

NAELU RASYIDA

Pengukuran berulang pada data longitudinal dapat menyebabkan adanya autokorelasi. Metode yang cocok untuk memodelkan data yang mengandung autokorelasi adalah Generalized Estimating Equation (GEE), karena dalam metode ini korelasi diperhitungkan sehingga menghasilkan model yang lebih efisien. Dalam penelitian ini, akan dikaji mengenai karakteristik penduga parameter pada GEE yang meliputi sifat takbias dan efisien. Penduga parameter pada GEE terbukti takbias, dan keefisienannya tergantung pada pemilihan struktur korelasi yang terbaik. Jika terdapat beberapa struktur korelasi yang mungkin untuk dipilih, maka model yang paling efisien adalah yang menghasilkan nilai Quasi Information

Criterion terkecil.

(4)

KARAKTERISTIK PENDUGA PARAMETER GENERALIZED ESTIMATING EQUATION (GEE)

PADA DATA LONGITUDINAL

Oleh

NAELU RASYIDA

Skripsi

Sebagai Salah Satu Syarat untuk Memperoleh Gelar SARJANA SAINS

Pada

Jurusan Matematika

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG

BANDAR LAMPUNG 2016

(5)
(6)
(7)

RIWAYAT HIDUP

Penulis dilahirkan di Pringsewu pada tanggal 14 Mei 1995, anak pertama dari dua bersaudara pasangan Bapak Sukirno dan Ibu Nurhasanah.

Penulis menyelesaikan pendidikan formal di Taman Kanak-Kanak KH. Gholib Pringsewu pada tahun 2001, Sekolah Dasar Negeri 2 Rejosari Pringsewu pada tahun 2007, Sekolah Menengah Pertama Negeri 1 Pringsewu pada tahun 2010, Sekolah Menengah Atas Negeri 1 Gadingrejo pada tahun 2012, dan diterima sebagai mahasiswa di Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung pada tahun 2012 melalui jalur SNMPTN tertulis.

Selama menjadi mahasiswa Universitas Lampung, penulis aktif dalam organisasi kemahasiswaan yaitu sebagai anggota Himpunan Mahasiswa Jurusan Matematika FMIPA Universitas Lampung periode 2013-2015 dan sebagai anggota Badan Eksekutif Mahasiswa FMIPA Universitas Lampung periode 2013-2015. Penulis juga pernah menjadi asisten mata kuliah Statistika Dasar dan Statistika Matematika di Jurusan Matematika FMIPA Universitas Lampung.

Penulis telah melaksanakan Kerja Praktik (KP) di Dinas Peternakan dan Kesehatan Hewan Provinsi Lampung pada tahun 2015, dan Kuliah Kerja Nyata (KKN) pada tahun 2015 di Desa Gunung Timbul, Kec. Tumijajar, Kab. Tulangbawang Barat.

(8)
(9)

Bismillaahirrohmanirrohiim

Alhamdulillahirobbilโ€™alamiinโ€ฆ

Dengan penuh rasa syukur kepada Allah SWT, kupersembahkan karya kecilku ini untuk

Bapak dan Ibu,

yang sangat aku cintai

Adikku,

yang aku sayangi

Dosen Pembimbing dan Penguji,

yang selalu memotivasiku

Sahabat-sahabatku,

yang selalu menyemangatiku Serta

Almamater tercinta

(10)

Hidup adalah Ibadah

Semakin Kamu Belajar,

Semakin Kamu Tahu Bahwa

Kamu Tidak Tahu

Carilah Ilmu Sejak Dari Buaian

Hingga Ke Liang Lahat

(11)

SANWACANA

Puji syukur kehadirat Allah SWT yang telah melimpahkan karunia-Nya kepada penulis sehingga penulis dapat menyelesaikan skripsi ini yang berjudul

โ€œKarakteristik Penduga Parameter Generalized Estimating Equation (GEE) Pada Data Longitudinalโ€. Tak lupa shalawat serta salam selalu tercurah kepada

Rosululloh Muhammad SAW yang selalu kita harapkan syafaatnya kelak, aamiin.

Banyak pihak yang telah membantu penulis dalam menyelesaikan laporan skripsi ini. Oleh karena itu, penulis mengucapkan terimakasih yang sebesar-besarnya kepada :

1. Bapak Ir. Warsono, M.S., Ph.D. selaku pembimbing pertama yang telah memberikan ide, pengarahan, serta meluangkan waktu ditengah kesibukannya untuk membimbing penulis.

2. Ibu Widiarti, S.Si., M.Si. selaku pembimbing kedua yang selalu membimbing penulis dengan sabarnya dan banyak memberikan masukan serta motivasi kepada penulis dalam menyelesaikan skripsi ini.

3. Ibu Dian Kurniasari, S.Si., M.Sc. selaku penguji yang telah banyak memberikan masukan, kritik dan saran yang sangat membangun demi kesempurnaan skripsi ini.

(12)

4. Bapak Drs. Suharsono S., M.S., M.Sc., Ph.D. selaku pembimbing akademik. 5. Bapak Drs. Tiryono Ruby, M.Sc., Ph.D. selaku Ketua Jurusan Matematika

FMIPA Universitas Lampung.

6. Bapak Prof. Warsito, S.Si., DEA., Ph.D. selaku Dekan FMIPA Universitas Lampung.

7. Seluruh dosen Jurusan Matematika FMIPA Universitas Lampung.

8. Bapak Sukirno dan Ibu Nurhasanah, orang tua tercinta yang telah membesarkan dan mendidik dengan penuh kasih sayang, selalu mendukung, menyemangati, memotivasi dan tiada hentinya mendoakan penulis.

9. Nurul Annisa Fadila, adik yang paling menggemaskan, yang selalu menyemangati dan mendoakan penulis.

10. Wanita-wanita rusuh (Anisa/Icha, Lina, Grita, Citra, Hana, Merda, Sella) dan keluarga besar Matematika 2012 yang telah berjuang bersama dan banyak memberikan semangat serta motivasi kepada penulis.

11. Aan Chumaidi Ab. yang selalu menyemangati dan memotivasi penulis. 12. Semua pihak yang terlibat dalam penyelesaian skripsi ini yang tidak dapat

penulis sebutkan satu per satu.

Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan karena kesempurnaan hanyalah milik Allah SWT. Penulis sangat mengharapkan kritik dan saran yang membangun. Penulis juga berharap agar tulisan ini bermanfaat bagi pembaca.

Bandarlampung, Oktober 2016

(13)

DAFTAR ISI

Halaman

DAFTAR TABEL ... xv

I. PENDAHULUAN ... 1

1.1 Latar Belakang dan Masalah ... 1

1.2 Tujuan Penelitian ... 2

1.3 Manfaat Penelitian ... 3

II. TINJAUAN PUSTAKA ... 4

2.1 Data Longitudinal ... 4

2.2 Generalized Linear Model (GLM) ... 4

2.3 Generalized Estimating Equation (GEE) ... 5

2.3.1 Struktur Data ... 6

2.3.2 Pemilihan Working Correlation Matrix ... 7

2.3.3 Menduga Kovarians dari Penduga Parameter... 10

2.4 Quasi-likelihood Information Criterion (QIC) ... 11

2.5 Sifat-Sifat Penduga yang Baik ... 12

III. METODOLOGI PENELITIAN ... 14

(14)

xiv

3.2 Metode Penelitian ... 14

IV. HASIL DAN PEMBAHASAN ... 16

4.1 Sifat Tak Bias ... 19

4.2 Penduga Efisien ... 20

V. KESIMPULAN ... 33

DAFTAR PUSTAKA ... 34 LAMPIRAN

(15)

DAFTAR TABEL

Halaman

Tabel 4.1 Respon Pengaruh Obat Pada Penderita Depresi ... 24

Tabel 4.2 Keterangan Syntax Program ... 26

Tabel 4.3 Struktur Korelasi Autoregressive ... 27

Table 4.4 Struktur Korelasi Exchangable ... 27

Table 4.5 Struktur Matriks Varians-Kovarians Model-Based Autoregressive 28 Table 4.6 Struktur Matriks Varians-Kovarians Model-Based Exchangable .... 29

Tabel 4.7 Struktur Matriks Varians-Kovarians Empirical Autoregressive ... 29

Tabel 4.8 Struktur Matriks Varians-Kovarians Empirical Exchangable ... 30

Table 4.9 Dugaan Parameter Berdasarkan Struktur Korelasi ... 31

(16)

I. PENDAHULUAN

1.1 Latar Belakang dan Masalah

Analisis statistika banyak digunakan dalam berbagai bidang seperti ilmu sosial, kesehatan, pendidikan, dan lain-lain. Dalam analisis statistika, terdapat beberapa teknik pengamatan dalam mengumpulkan data, seperti pengamatan cross section,

time series, dan longitudinal. Pengamatan longitudinal merupakan pengamatan

yang menggabungkan antara pengamatan cross section dan time series.

Kelebihan pengamatan longitudinal dari pengamatan yang lain yaitu mampu memberikan informasi tentang dinamika perubahan pada data cross section dari waktu ke waktu. Namun pengukuran secara berulang pada pengamatan longitudinal dapat menyebabkan terjadinya autokorelasi. Untuk memodelkan data yang mengandung autokorelasi tidak bisa menggunakan model linear biasa maupun model linear yang diumumkan atau yang biasa disebut Generalized Linear Model (GLM). Liang dan Zeger (1986) mengusulkan metode Generalized Estimating

Equation (GEE) untuk mengatasi data yang berkorelasi.

GEE merupakan metode yang memodelkan sebuah fungsi yang diketahui dari harapan marginal variabel dependent sebagai fungsi linear dari satu atau lebih variabel penjelas. GEE umumnya digunakan untuk menduga parameter regresi

(17)

2

dalam model marginal dan menentukan struktur korelasinya. Pendugaan parameter pada GEE dilakukan menggunakan metode quasi-likelihood dimana hanya mengasumsikan hubungan antara ยต dan var(Y) daripada distribusi peluang untuk Y.

Quasi-likelihood melambangkan variansnya berupa ฯ•var(Y), dimana ฯ• merupakan

dugaan berdasarkan perubahan yang diobservasi dalam data sampel. Pendugaan

quasi-likelihood bukanlah maximum likelihood karena metodenya tidak secara

lengkap menggunakan distribusi untuk Y, dan oleh karena itu tidak ada fungsi

likelihood.

Pendugaan parameter menggunakan metode GEE untuk kasus data longitudinal yang berdistribusi normal telah dilakukan oleh Hedeker dan Gibbons dalam bukunya yang berjudul Longitudinal Data Analysis (2006). Pada buku tersebut tidak dikaji karakteristik dari penduga yang didapatkan. Karakteristik suatu penduga perlu dievaluasi untuk mendapatkan informasi tentang sifat-sifat dari penduganya. Berdasarkan hal tersebut, penulis tertarik untuk mengkaji karakteristik penduga parameter dari metode GEE yang meliputi sifat tak bias dan efisien.

1.2 Tujuan Penelitian

Adapun tujuan dari penelitian ini yaitu :

1. Menentukan penduga parameter model data longitudinal menggunakan metode GEE.

(18)

3

1.3 Manfaat Penelitian

Adapun manfaat yang bisa didapatkan dari penelitian ini yaitu : 1. Menambah wawasan mengenai metode GEE.

2. Mendapat dugaan parameter model data longitudinal menggunakan metode GEE.

(19)

II. TINJAUAN PUSTAKA

2.1 Data Longitudinal

Menurut (Johnston, 1984) data panel biasa disebut juga data longitudinal atau data runtun waktu silang (cross-sectional time series), di mana banyak kasus (orang, perusahaan, negara dan lain-lain) diamati pada dua periode waktu atau lebih yang diindikasikan dengan penggunaan data time series. Data panel dapat menjelaskan dua macam informasi yaitu informasi cross-section pada perbedaan antar subyek, dan informasi time series yang merefleksikan perubahan pada dimensi waktu. Ketika kedua informasi tersebut tersedia, maka analisis data panel dapat digunakan.

2.2 Generalized Linear Model (GLM)

Menurut Agresti (2015), Generalized Linear Models (GLM) memperluas model regresi linear dasar meliputi distribusi respon tidak normal dan kemungkinan fungsi tidak linear dari nilai tengahnya. GLM mempunyai tiga komponen yaitu :

1. Komponen acak (random component), menetapkan variabel respon y dan distribusi peluangnya. Suatu pengamatan ๐’š = (๐‘ฆ1, โ€ฆ , ๐‘ฆ๐‘›)๐‘‡ pada distribusinya diperlakukan saling bebas (independent).

(20)

5

2. Prediktor linear (linear predictor). Untuk sebuah vektor parameter ๐œท = (๐›ฝ1, โ€ฆ , ๐›ฝ๐‘)๐‘‡ dan sebuah X matriks model n x p yang berisi nilai-nilai dari variabel penjelas p untuk n pengamatan, prediktor linearnya adalah ๐‘ฟ๐œท. 3. Fungsi link (link function), yaitu fungsi g yang digunakan untuk setiap

komponen penjelas dari E(y) yang merelasikannya ke prediktor linear, sehingga persamaan pada GLM adalah

g[E(y)]=Xฮฒ.

Dalam model linear klasik, fungsi link bisa berupa fungsi yang identik atau kanonik. Suatu fungsi link dikatakan fungsi link kanonik bila parameter kanoniknya sama dengan fungsi linknya, yaitu

๐œ‚ = ๐œƒ dimana ๐œƒ adalah parameter kanonik.

Berikut fungsi link kanonik untuk beberapa distribusi :

Distribusi Fungsi link kanonik

Normal ๐œ‚ = ๐œ‡ Poisson ๐œ‚ = log ๐œ‡

Binomial ๐œ‚ = log (๐œ‡โ„(1 โˆ’ ๐œ‡)) Gamma ๐œ‚ = ๐œ‡โˆ’1

2.3 Generalized Estimating Equation (GEE)

Menurut Nelder dan Wedderburn (1972) , metode GEE adalah perluasan dari GLM dengan tambahan :

1. Varians dari ๐‘ฆ๐‘– adalah ๐‘ฃ๐‘– = ๐‘ฃ๐‘–(๐œ‡๐‘–) dan merupakan sebuah fungsi yang ditentukan dari nilai tengah ๐œ‡๐‘–.

(21)

6

2. ๐‘ฆ๐‘– merupakan keluarga eksponensial. Distribusinya antara lain binomial, poisson, gamma, dan invers Gaussian. Ketika diasumsikan distribusi dari ๐‘ฆ๐‘– adalah normal dan menetapkan fungsi link identitas g(ยตi) = ยตi, hal ini sama

dengan menyusun model sebagai GLM.

GEE digunakan untuk mengatasi data yang berkorelasi dan merupakan sebuah perluasan dari quasi-score equation. Metode GEE memodelkan sebuah fungsi yang diketahui dari harapan marginal variabel dependent sebagai fungsi linear dari satu atau lebih variabel penjelas. GEE mendeskripsikan komponen acak model untuk setiap respon marginal dengan sebuah fungsi link umum dan varians, serupa dengan model GLM. Model GEE secara umum sama dengan model GLM yaitu

g[E(y)]=Xiฮฒ dimana ๐œท = [ ๐›ฝ0 ๐›ฝ1 โ‹ฎ ๐›ฝ๐‘ ] ๐‘‘๐‘Ž๐‘› ๐‘ฟ๐‘– = [ 1 ๐‘‹๐‘–11 ๐‘‹๐‘–12 โ‹ฏ ๐‘‹๐‘–1๐‘ 1 ๐‘‹๐‘–21 ๐‘‹๐‘–22 โ‹ฏ ๐‘‹๐‘–2๐‘ โ‹ฎ 1 โ‹ฎ ๐‘‹๐‘–๐‘›๐‘–1 โ‹ฎ โ‹ฑ โ‹ฎ ๐‘‹๐‘–๐‘›๐‘–2 โ‹ฏ ๐‘‹๐‘–๐‘›๐‘–๐‘]

Penduga GEE dari ๐œท didapatkan dengan menyelesaikan persamaan

โˆ‘ ๐‘ซ๐’Šโ€ฒ[๐‘ฝ(๐œถฬ‚)]โˆ’๐Ÿ(๐’š๐’Šโˆ’ ๐๐’Š) ๐‘

๐‘–=1

= 0

dimana ๐›ผฬ‚ adalah penduga yang konsisten bagi ๐›ผ dan ๐‘ซ๐‘– = ๐œ•๐๐’Šโ„๐œ•๐œท

2.3.1 Struktur Data

Menurut Kleinbaum (2010), persamaan untuk GEE adalah sebagai berikut ๐‘Œ๐‘–๐‘— = ๐›ฝ0+ ๐›ฝ1๐‘‹๐‘–๐‘—1+ ๐›ฝ2๐‘‹๐‘–๐‘—2+ โ‹ฏ + ๐›ฝ๐‘๐‘‹๐‘–๐‘—๐‘+ ๐œ€

(22)

7

Dimana ๐‘Œ๐‘–๐‘— melambangkan respon dari subyek ke-i pada pengamatan ke-j, untuk i

= 1, โ€ฆ, n dan j = 1, โ€ฆ, ti, ๐‘‹๐‘–๐‘—๐‘ adalah variabel penjelas ke-p pada subyek ke-i pengamatan ke-j, ๐œ€ mengandung autokorelasi akibat pengamatan yang berulang.

2.3.2 Pemilihan Working Correlation Matrix

Liang dan Zeger (1986) telah memperoleh beberapa dugaan struktur working

correlation untuk digunakan dalam pendugaan GEE. Berikut ini beberapa pilihan

untuk R dengan rumus matriks untuk t = 4.

1. Independence : R = R0 = I ๐‘ = [ 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 ]

Dalam kasus ini, penyelesaian GEE sama seperti menentukan model regresi biasa untuk data independent, dan menghasilkan parameter dugaan yang sama. Tetapi, galat bakunya berbeda.

2. Fixed : R = R0

Matriks korelasi fixed terjadi ketika ada determinasi bentuk dari analisis sebelumnya. Maka langsung masukkan matriks kovariansnya.

(23)

8 3. Exchangeable ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฆ๐‘–๐‘—, ๐‘ฆ๐‘–,๐‘—โ€ฒ) = {1 ๐‘— = ๐‘—โ€ฒ ๐›ผ ๐‘— โ‰  ๐‘—โ€ฒ} ๐‘ = [ 1 ๐›ผ ๐›ผ 1 ๐›ผ ๐›ผ ๐›ผ ๐›ผ ๐›ผ ๐›ผ ๐›ผ ๐›ผ 1 ๐›ผ ๐›ผ 1 ] ๐›ผฬ‚ = 1 (๐‘โˆ—โˆ’ ๐‘)๐œ™โˆ‘ โˆ‘ ๐‘’๐‘–๐‘—๐‘’๐‘–๐‘—โ€ฒ ๐‘—<๐‘—โ€ฒ ๐พ ๐‘–=1 ๐‘โˆ— = 0.5 โˆ‘ ๐‘›๐‘–(๐‘›๐‘– โˆ’ 1) ๐พ ๐‘–=1

Rincian struktur korelasi ini memuat konstanta korelasi-korelasi antara dua pengukuran dalam sebuah subyek, yaitu, Rjjโ€™ = ฮฑ, untuk j โ‰  jโ€™. struktur korelasi ini

diasumsikan dalam sebuah model random effects dengan sebuah intersep acak dan juga diketahui sebagai compound symmetry dalam literatur pengukuran berulang ANOVA. 4. Unstructured ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฆ๐‘–๐‘—, ๐‘ฆ๐‘–,๐‘—โ€ฒ) = { 1 ๐‘— = ๐‘—โ€ฒ ๐›ผ๐‘—๐‘—โ€ฒ ๐‘— โ‰  ๐‘—โ€ฒ} ๐‘ = [ 1 ๐›ผ21 ๐›ผ21 1 ๐›ผ31 ๐›ผ41 ๐›ผ32 ๐›ผ42 ๐›ผ31 ๐›ผ32 ๐›ผ41 ๐›ผ42 1 ๐›ผ43 ๐›ผ43 1 ] ๐›ผฬ‚๐‘—๐‘—โ€ฒ = 1 (๐พ โˆ’ ๐‘)๐œ™โˆ‘ ๐‘’๐‘–๐‘—๐‘’๐‘–๐‘—โ€ฒ ๐พ ๐‘–=1

(24)

9

Ketika matriks korelasi tidak terinci secara lengkap, ada ๐‘ก(๐‘ก โˆ’ 1)/2 parameter untuk diestimasi. Struktur ini menyediakan estimasi yang lebih efisien untuk ฮฒ tapi hanya digunakan ketika ada secara relative beberapa waktu observasi atau kondisi. Sebagai tambahan, ketika ada data hilang dan/atau macam-macam jumlah observasi tiap subyek, penduga dari struktur korelasi lengkap mungkin hasil dalam sebuah matriks definit nonpositive dan penduga parameter mungkin tidak dihasilkan.

5. m-dependent ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฆ๐‘–๐‘—, ๐‘ฆ๐‘–,๐‘—+๐‘ ) = { 1 ; ๐‘  = 0 ๐›ผ๐‘  ; ๐‘  = 1, 2, โ€ฆ , ๐‘š 0 ; ๐‘  > ๐‘š ๐‘ = [ 1 ๐›ผ1 ๐›ผ1 1 ๐›ผ2 0 ๐›ผ1 ๐›ผ2 ๐›ผ2 ๐›ผ1 0 ๐›ผ2 1 ๐›ผ1 ๐›ผ1 1 ] ๐›ผฬ‚๐‘ก= 1 (๐พ๐‘กโˆ’ ๐‘)๐œ™โˆ‘ โˆ‘ ๐‘’๐‘–๐‘—๐‘’๐‘–,๐‘—+๐‘ก ๐‘—โ‰ค๐‘›๐‘–โˆ’๐‘ก ๐พ ๐‘–=1 ๐พ๐‘ก = โˆ‘(๐‘›๐‘– โˆ’ ๐‘ก) ๐พ ๐‘–=1

Dengan struktur m-dependent, korelasi tergantung pada jarak antara pengukuran. Sehingga, nilainya mendekati nol untuk s > m.

6. Auto-regressive (AR-1)

๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฆ๐‘–๐‘—, ๐‘ฆ๐‘–,๐‘—+๐‘ ) = ๐›ผ๐‘  ; ๐‘  = 0, 1, 2, โ€ฆ , ๐‘ก ๐‘– โˆ’ ๐‘—

(25)

10 ๐‘ = [ 1 ๐›ผ ๐›ผ 1 ๐›ผ2 ๐›ผ3 ๐›ผ ๐›ผ2 ๐›ผ2 ๐›ผ ๐›ผ3 ๐›ผ2 1 ๐›ผ ๐›ผ 1 ] ๐›ผฬ‚ = 1 (๐พ1โˆ’ ๐‘)๐œ™โˆ‘ โˆ‘ ๐‘’๐‘–๐‘—๐‘’๐‘–,๐‘—+1 ๐‘—โ‰ค๐‘›๐‘–โˆ’1 ๐พ ๐‘–=1 ๐พ1 = โˆ‘(๐‘›๐‘–โˆ’ 1) ๐พ ๐‘–=1

Dengan sebuah struktur korelasi auto-regressive, korelasi tergantung pada jarak antar pengukuran, semakin jauh jaraknya maka nilai korelasinya semakin kecil.

2.3.3 Menduga Kovarians dari Penduga Parameter

Setelah penduga GEE diperoleh, kemudian kovariansnya juga diduga. Penduga

model-based dari matriks kovarians untuk ๐œทฬ‚ adalah invers dari matriks informasi terobservasi ๐‘ฝ๐’Ž(๐œทฬ‚) = ๐‘ฐ0โˆ’1 dimana ๐‘ฐ0 = โˆ‘ ๐‘ซ๐‘–โ€ฒ ๐‘› ๐‘–=1 ๐‘ฝ๐‘–โˆ’1๐‘ซ๐‘–

ini merupakan penduga yang konsisten jika model dan matriks working correlation ditentukan secara spesifik (Albert dan McShane, 1995).

Penduga empirical sandwich (robust) dari Cov(๐œทฬ‚) diberikan sebagai berikut ๐‘ฐ0โˆ’1๐‘ฐ1๐‘ฐ0โˆ’1= ๐‘ฝ๐’†(๐œทฬ‚)

(26)

11

๐‘ฐ1 = โˆ‘ ๐‘ซ๐‘–โ€ฒ ๐‘›

๐‘–=1

๐‘ฝ๐‘–โˆ’1๐ถ๐‘œ๐‘ฃ(๐’€๐‘–)๐‘ฝ๐‘–โˆ’1๐‘ซ๐‘–

Cov(๐’€๐‘–) diduga dengan

(๐’€๐’Šโˆ’ ๐๐’Š(๐œทฬ‚)) (๐’€๐’Šโˆ’ ๐๐’Š(๐œทฬ‚))โ€ฒ

ini adalah penduga yang tetap konsisten ketika V(ยตij) โ‰  ๐‘ฃ(๐œ‡ฬ‚๐‘–๐‘—), atau ketika ๐‘น๐’Š(๐œถ) bukan matriks korelasi dari Yi, atau ketika korelasi sebenarnya berubah-ubah untuk

setiap subyek.

2.4 Quasi-likelihood Information Criterion (QIC)

Quasi-likelihood information criterion (QIC) merupakan modifikasi dari Akaike information criterion (AIC) yang diterapkan pada model GEE. QIC didefinisikan

sebagai berikut

๐‘„๐ผ๐ถ = โˆ’2๐š€(๐œทฬ‚, ๐œ™) + 2๐‘ก๐‘Ÿ๐‘Ž๐‘๐‘’[๐‘ฝ๐’Žโˆ’๐Ÿ(๐œทฬ‚)๐‘ฝ ๐’†(๐œทฬ‚)]

Dimana ๐š€(๐œทฬ‚, ๐œ™) merupakan fungsi quasi-likelihood yang didefinisikan ๐š€(๐œทฬ‚, ๐œ™) = ๐š€๐‘–๐‘— ๐œ™ ๐œ™ diduga dengan ๐œ™ฬ‚ = 1 ๐‘ โˆ’ ๐‘โˆ‘ โˆ‘ ๐‘’๐‘–๐‘— 2 ๐‘›๐‘– ๐‘—=1 ๐พ ๐‘–=1 (Pan, 2001).

McCullagh dan Nelder (1989) mendefinisikan beberapa fungsi ๐š€๐‘–๐‘— untuk beberapa distribusi sebagai berikut

(27)

12 1. Normal ๐š€๐‘–๐‘— = โˆ’1 2(๐‘ฆ๐‘–๐‘— โˆ’ ๐œ‡๐‘–๐‘—) 2 2. Inverse Gaussian ๐š€๐‘–๐‘— =(๐œ‡๐‘–๐‘—โˆ’ 0,5๐‘ฆ๐‘–๐‘—) ๐œ‡๐‘–๐‘—2 3. Gamma ๐š€๐‘–๐‘— = โˆ’ [๐‘ฆ๐‘–๐‘— ๐œ‡๐‘–๐‘—+ log (๐œ‡๐‘–๐‘—)] 4. Negative Binomial ๐š€๐‘–๐‘— = [log ฮ“ (๐‘ฆ๐‘–๐‘—+ 1 ๐‘˜) โˆ’ log ฮ“ ( 1 ๐‘˜) + ๐‘ฆ๐‘–๐‘—log ( ๐‘˜๐œ‡๐‘–๐‘— 1 + ๐‘˜๐œ‡๐‘–๐‘— ) +1 ๐‘˜log ( 1 1 + ๐‘˜๐œ‡๐‘–๐‘— )] 5. Poisson ๐š€๐‘–๐‘— = ๐‘ฆ๐‘–๐‘—log(๐œ‡๐‘–๐‘—) โˆ’ ๐œ‡๐‘–๐‘— 6. Binomial ๐š€๐‘–๐‘— = ๐‘Ÿ๐‘–๐‘—log(๐‘๐‘–๐‘—) โˆ’ ( ๐‘ฆ๐‘–๐‘— โˆ’ ๐œ‡๐‘–๐‘—) log(1 โˆ’ ๐‘๐‘–๐‘—)

2.5 Sifat-Sifat Penduga yang Baik

Suatu penduga dikatakan penduga yang baik jika penduga tersebut memiliki sifat tak bias dan efisien. Berikut ini akan didefinisikan sifat-sifat penduga yang baik.

1. Sifat Tak Bias

Penduga ๐‘ˆ(๐‘ฟ) dikatakan sebagai penduga tak bias bagi g(๐œฝ) jika ๐ธ(๐‘ˆ(๐‘ฟ)) = g(๐œฝ), โˆ€๐œฝ โˆˆ ๐›€

(28)

13

2. Sifat Efisien

Setelah diketahui sifat ketakbiasan suatu penduga, selanjutnya yaitu menyelidiki apakah penduga tersebut efisien. Suatu penduga dikatakan efisien jika variansnya minimum. Sifat varians minimum suatu penduga didefinisikan sebagai berikut.

Jika T* merupakan penduga bagi g(๐œฝ), dan ada T sebarang penduga bagi g(๐œฝ), maka T* dikatakan penduga dengan varians minimum jika

๐‘‰๐‘Ž๐‘Ÿ(๐‘‡โˆ—) โ‰ค ๐‘‰๐‘Ž๐‘Ÿ(๐‘‡)

(Hoog and Craig, 1995).

Varians minimum suatu penduga juga dapat diketahui dengan menggunakan pertidaksamaan Rao-Cramer dengan definisi sebagai berikut.

Misal T* merupakan penduga tak bias g(๐œฝ), maka untuk sebarang penduga tak bias

T bagi g(๐œฝ) disebut penduga yang efisien jika Var(T*) โ‰ค Var(T) untuk setiap ๐œฝ โˆˆ ๐›€

dimana ๐‘‰๐‘Ž๐‘Ÿ(๐‘‡) โ‰ฅ ( ๐œ• ๐œ•๐œฝ๐‘”(๐œฝ)) 2 ๐‘›. ๐ธ [๐œ•๐œฝ๐œ• ln ๐‘“(๐‘ฟ; ๐œฝ)] 2

(29)

III. METODOLOGI PENELITIAN

3.1 Waktu dan Tempat Penelitian

Penulis melakukan penelitian ini pada semester genap tahun ajaran 2015-2016 di Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung.

3.2 Metode Penelitian

Adapun langkah-langkah peneliti dalam melakukan penelitian ini yaitu :

1. Mengkaji jurnal-jurnal dan penelitian-penelitian terdahulu mengenai metode

Generalized Estimating Equation (GEE).

2. Melakukan estimasi parameter dari model yang didapat menggunakan metode GEE. Menurut Stokes, Davis, and Koch (2012), langkah-langkah dalam menduga parameter dengan metode GEE adalah sebagai berikut :

a. Merelasikan respon marginal ๐œ‡๐‘–๐‘— = ๐ธ(๐‘ฆ๐‘–๐‘—) dengan kombinasi linear dari kovariat yaitu g(ยตij) = ๐‘ฅ๐‘–๐‘—โ€ฒฮฒ, dimana ๐œท = (๐›ฝ1, ๐›ฝ2, โ€ฆ , ๐›ฝ๐‘)โ€ฒ adalah vektor p x

1 dari parameter yang tidak diketahui dan g adalah fungsi link yang diketahui. Vektor parameter ๐œท mengkarakteristikkan bagaimana distribusi respon cross-sectional tergantung pada variabel penjelas.

(30)

15

b. Memilih bentuk working correlation matrix Ri(ฮฑ) untuk setiap ๐‘ฆ๐‘– = (๐‘ฆ๐‘–1, ๐‘ฆ๐‘–2, โ€ฆ , ๐‘ฆ๐‘–๐‘ก๐‘–)โ€ฒ, dimana ti โ‰ค t.

c. Mengestimasi vektor parameter ๐œท. Penduga GEE dari ๐œท didapatkan dengan menyelesaikan persamaan โˆ‘ ๐‘ซ๐’Šโ€ฒ[๐‘ฝ(๐œถฬ‚)]โˆ’๐Ÿ(๐’š ๐’Šโˆ’ ๐๐’Š) ๐‘ ๐‘–=1 = 0

dimana ๐›ผฬ‚ adalah penduga yang konsisten bagi ๐›ผ dan ๐‘ซ๐‘– = ๐œ•๐๐’Šโ„๐œ•๐œท. 3. Mengkaji sifat tak bias penduga ๐œท.

(31)

V. KESIMPULAN

Berdasarkan penelitian yang telah dilakukan, maka diperoleh :

1. Penduga GEE untuk ๐œท dengan distribusi marginalnya normal adalah

๐œทฬ‚ = [โˆ‘ ๐‘ฟ๐’Šโ€ฒ[๐‘ฝ(๐œถฬ‚)]โˆ’๐Ÿ๐‘ฟ ๐‘– ๐‘ ๐‘–=1 ] โˆ’1 [โˆ‘ ๐‘ฟ๐’Šโ€ฒ[๐‘ฝ(๐œถฬ‚)]โˆ’๐Ÿ๐’š ๐’Š ๐‘ ๐‘–=1 ]

2. Penduga GEE merupakan penduga yang takbias karena ๐ธ(๐œทฬ‚) = ๐œท.

3. Penduga GEE lebih efisien jika pemilihan struktur korelasinya tepat, yaitu struktur korelasi yang menghasilkan nilai QIC terkecil. Dalam penelitian ini, nilai QIC terkecil dihasilkan dari struktur korelasi autoregressive yaitu 1024,8207 daripada struktur korelasi exchangeable yaitu 1024,8260.

(32)

DAFTAR PUSTAKA

Agresti, A. 2007. An Introduction to Categorical Data Analysis Second Edition. John Wiley and Sons, Inc, New Jersey.

Agresti, A. 2015. Foundations of Linear and Generalized Linear Models. John Wiley and Sons, Inc, New Jersey.

Albert, P. and McShane, L. 1995. A Generalized Estimating Equation Approach for

Spatially Correlated Binary Data : Application to The Analysis of Neuroimaging Data. Biometrics.

Bain, L.J. and Engelhardt, M. 1992. Introduction to Probability and Mathematical

Statistics Second Edition. Duxbury Press, California.

Hedeker, D. and Gibbons, R.D. 2006. Longitudinal Data Analysis. John Wiley and Sons, New Jersey.

Hogg, R.V. and Craig, A.T. 1995. Introduction to Mathematical Statistics. Prentice-Hall, New Jersey.

Johnston, J. 1984. Econometric Methods. McGraw Hill, USA.

Kleinbaum, D.G. 2010. Logistic Regression. Springer Series in Statistics, New York.

Liang, K.Y. and Zeger, S.L. 1986. Longitudinal Data Analysis Using Generalized

Linear Models. Biometrics.

McCullagh, P. and Nelder, J.A. 1989. Generalized Linear Model, 2th Edition. Chapman & Hall, London.

Nelder, J.A. and Wedderburn, R.W.M. 1972. Generalized Linear Model. Journal

of The Royal Statistical.

Pan, W. 2001. Akaikeโ€™s Information criterion in Generalized Estimating Equation. Bioimetrics.

(33)

35

Stokes, M.E., Davis, C.S. and Koch, G.G. 2012. Categorical Data Analysis Using

SAS, Third Edition. SAS Intitute Inc, Cary NL.

Swan, T. 2006. Generalized Estimating Equation When The Response Variable Has

a Tweedie Distribution : An Application For Multi-site Rainfall Modelling.

University of Southern Queensland, Toowoomba QLD.

Utami, dkk. 2014. Generalized Method of Momentโ€™s Characteristics on Panel Data.

Referensi

Dokumen terkait