• Tidak ada hasil yang ditemukan

ANALISIS DAN PENANGANAN PENCILAN PADA DATA LONGITUDINAL VIARTI EMINITA

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS DAN PENANGANAN PENCILAN PADA DATA LONGITUDINAL VIARTI EMINITA"

Copied!
59
0
0

Teks penuh

(1)

ANALISIS DAN PENANGANAN PENCILAN PADA

DATA LONGITUDINAL

VIARTI EMINITA

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2014

(2)
(3)
(4)
(5)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*

Dengan ini saya menyatakan bahwa tesis berjudul Analisis dan Penangan Pencilan pada Data Longitudinal adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Januari 2014

Viarti Eminita

(6)

RINGKASAN

VIARTI EMINITA. Analisis dan Penanganan Pencilan pada Data Longitudinal. Dibimbing oleh INDAHWATI dan ANANG KURNIA.

Suatu studi longitudinal dicirikan dengan percobaan yang pengukurannya dilakukan secara berulang antar waktu pada setiap individu. Pada studi ini dimungkinkan untuk mempelajari perubahan respon antar waktu beserta faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi maupun level individu. Metode yang dapat digunakan untuk analisis data longitudinal berbasis model linier adalah model linier campuran (GLMM).

Metode pendugaan pada model linier campuran didasarkan pada asumsi bahwa pengaruh spesifik subyek dan galat intra-subyek menyebar normal. Namun, dalam berbagai kasus tidak jarang ditemui hal yang menyebabkan tidak terpenuhinya asumsi tersebut. Salah satu penyebab tidak terpenuhinya asumsi karena ada pencilan pada data amatan. Pengamatan pencilan mengakibatkan kenormalan dari sebaran data menjadi terganggu, akibatnya matriks peragam akan kehilangan efisiensinya dan sifat penduga menjadi bias dan tidak konsisten (Yohai 2006). Pada data longitudinal terdapat dua jenis pencilan, yaitu pencilan pada galat intra-subyek dan pencilan pada pengaruh spesifik subjek.

Kooler (2013) memodifikasi fungsi-ψ Huber yang lebih halus dari fungsi-ψ Huber klasik yang belum stabil secara numerik dan menggunakan pendekatan DAS (Design Adaptif Scale) untuk menduga parameter skala dan matriks peragam pada model linier campuran. Pendekatan ini menggunakan fungsi pembobot yang bukan hanya tergantung pada fungsi-ρ tetapi juga dari konstanta κ yang mempertahankan konsistensi penduga.

Penelitian ini bertujuan untuk mengkaji kinerja penduga kekar Huber pada galat intra-subyek dan pengaruh intersep acak yang bersebaran simetrik dan nonsimetrik melalui data simulasi sebagai akibat adanya pencilan pada beberapa kondisi data. Tujuan lain adalah menangani pencilan pada suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral pada pasien terinfeksi HIV, serta memprediksi keadaan pasien pada kondisi dan waktu tertentu dengan metode pendugaan kekar Huber.

Simulasi dilakukan untuk melihat pengaruh kontaminasi pencilan pada data longitudinal dengan tiga kondisi kontaminasi, yaitu kontaminasi pencilan pada galat intra-subyek, kontaminasi pencilan pada pengaruh intersep acak, dan kontaminasi pada keduanya. Simulasi ini juga mengkaji pengaruh proporsi pencilan yang berbeda-beda, yaitu pada proporsi 0% (tanpa pencilan), 5%, 10%, dan 15%. Selain itu, simulasi juga melihat pengaruh tidak terpenuhinya asumsi sebaran normal pada pengaruh intersep acak dan galat intra subyek. Kedua pengaruh tersebut dikondisikan bersebaran t mewakili sebaran simetrik dan bersebaran chi-square mewakili sebaran nonsimetrik. Data simulasi dibangkitkan berdasarkan model linier campuran dengan intersep acak. Evaluasi penduga dilakukan berdasarkan kondisi data yang berbeda dan diulang sebanyak 500 kali.

Data terapan dalam penelitian ini adalah data sekunder dari suatu percobaan klinis (http://www.biostat.umn.edu/~brad/software.html) yang melibatkan n = 467 pasien terinfeksi HIV yang terdiagnosa sebagai penderita AIDS atau memiliki jumlah sel CD4+ ≤ 300/ml3darah. Banyaknya sel CD4+ dicatat pada saat terlibat

(7)

dalam studi (t=0), dan kunjungan pada bulan ke 2, 6, 12, dan 18, sehingga maksimum mi= 5.

Kajian simulasi menunjukkan bahwa nilai Relatif Bias (RB), Root Relatif

Mean Square Error (RRMSE) dan rata-rata Mean Absolute Percentage Error

(MAPE) penduga dari model linier campuran dengan intersep acak pada metode pendugaan klasik dan kekar semakin besar seiring meningkatnya proporsi kontaminasi pencilan yang dicobakan, terutama pada proporsi 15%. Pada kasus kontaminasi pencilan metode pendugaan kekar menghasilkan penduga yang lebih baik dari pada metode pendugaan klasik, namun untuk kondisi galat intra-subyek atau pengaruh intersep acak yang bersebaran simetrik atau nonsimetrik kedua metode menghasilkan sifat penduga yang sama. Intersep acak yang terkontaminasi pencilan atau menyebar mengikuti sebaran simetrik atau non simetrik hanya mempengaruhi sifat parameter intersep saja. Secara umum metode pendugaan kekar cukup mampu meningkatkan efisiensi pendugaan.

Data pasien terinfeksi HIV pada kajian terapan memiliki banyak data hilang, karena tidak semua pasien yang melakukan pengukuran pada lima kali kunjungan, selain itu terlihat juga jumlah sel CD4+ pasien dan pengaruh waktu terhadap jumlah sel berbeda-beda untuk setiap pasien. Beberapa pasien memiliki jumlah sel CD4+ yang semakin menurun untuk tiap kunjungan berikutmya, tetapi ada juga yang semakin bertambah jumlahnya, sehingga model linier campuran yang digunakan adalah model dengan intersep acak dan slope acak. Selain itu, pada data dapat juga dilihat ada banyak pencilan, baik pencilan pada galat intra subyek maupun pencilan pada pengaruh spesifik subyek. Hal ini perlu diatasi agar nilai prediksi yang diperoleh tepat dan akurat. Hasil analisis terhadap penduga parameter menunjukkan bahwa peubah TIME dan PrevOI berpengaruh nyata terhadap perubahan jumlah sel CD4+ pasien. Selan itu, terjadi hubungan yang sangat

kuat antara intersep acak dan slope acak. Hal ini berarti bahwa penurunan jumlah sel CD4+ antar pasien dipengaruhi oleh jumlah sel CD4+ yang dimiliki pada awal studi.

(8)

SUMMARY

VIARTI EMINITA. Analysis and Solving Outliers to Longitdinal Data. Supervised by INDAHWATI and ANANG KURNIA.

Longitudinal study is characterized by individuals in the study are followed over a period of time and, for each subject, data are collected at multiple time points. The study is possible to learn the response changes over time with the factors that affects, both at the population level and individual level. The exact method used for analysis of longitudinal data base of linear model is general linear mixed models (GLMM).

Estimation methods in linear mixed models are based on the assumption that the random effects and intra-subject error distributed normally. In practice, however, the assumed parametric distributions may not hold. Moreover, outliers may be present. Outlier observations lead to the normality of data distribution be disrupted, so covariance matrix will be inefficient and properties of estimators be biased and inconsistent (Yohai 2006). There are two types of outliers in longitudinal data, first outliers at individual level, sometimes called e-outliers, which arise among the repeated measurements within a given individual. Second outliers at population level, sometimes called b-outliers, which are unusual individuals in the sample.

Kooler (2013) modify the Huber ψ-function more smooth than the classic Huber ψ-function which is numerically unstable and using DAS (Design Adaptive Scale) method to estimate the scale parameter and covariance matrix in linear mixed models. These method use weight function that not only depends on ρ-function used but use a constant κ that ensure consistency of the esimate.

This study aims to assess the performance of the Huber robust estimator to intra-subject error and random intercept effect are both symmetric and nonsimetrik distribution through simulation data as affect any outliers in some data conditions. Furthermore, applying the best estimator method to resolving outliers in a clinical trial to compare the efficacy and safety of two antiretroviral drugs in HIV-infected patients, as well as predict the condition of the patient at any given time.

Simulation was conducted to asses the effect of outlier contamination on longitudinal data with three conditions of contamination, the contamination of outliers on intra-subject error, the random intercept effect, and contamination in both. The simulations also examined the proportion of different outliers, there are proportion of 0% (without outliers), 5%, 10%, and 15%. In addition, the simulation was also conducted to asses the effect of non-compliance of normal distribution assumption on random intercept effect and intra-subject error. Both of these effects will be conditioned to spread t distribution representing symmetric distribution and spread chi-square distribution represents nonsimetric distribution. Simulation data are built based on linear mixed models with random intercept Evaluation is based on different data conditions and repeated 500 times.

Applied data in this research is secondary data from a clinical trial (http://www.biostat.umn.edu/~brad/software.html) involving n = 467 HIV-infected patients were diagnosed AIDS or have CD4+ counts ≤ 300 ml3/blood.

(9)

CD4+ counts are recorded at the entry study (t = 0), and again at the 2-, 6-, 12-, and 18-month visits (so that mi ≤ 5).

Simulation study for both method showed that values of Relatif Bias (RB),

Root Relatif Mean Square Error (RRMSE) and Average of Mean Absolute Persentage Error (MAPE) of estimator for linear mixed model with random

intercept are greater with increasing proportion of outlier contamination is tested, spesially 15% proportion case. Robust estimation gave good performance in outlier contamination case than classical method, but they are same performance for intra-subject error and random intercept effect follow simetric and nonsimetric distribution. Random intercept contaminated by outliers or it follows simetric and nonsimetric distribution affect only characteristic of fixed intercept estimator. Generally, in this study the robust estimator method increase efficiency of prediction.

Data of patient with HIV infection have many missing value, because some patient was not measured at five times, otherwise it looked also the different effect of time on patient's CD4+ counts for each patient. Some patients had a CD4+ counts decreased for each next visit, but there were also increasing in counts, so the mixed linear model used is the model with random intercept and slope. Many outlier canteminated data, both outlier in intra-subject error and spesific subject effects. Those problem must be solved for produce precise and accuracy prediction. Analyze to coefficient estimator showed that TIME and PrevOI variables affect significantly to CD4+ count. There is negative correlation between random intersept and random slope. This indicates that the decrease in CD4+ count among patients affected by the CD4+ count held at the beginning of study. Keywords: longitudinal data, linear mixed models, outliers, robust estimation.

(10)

© Hak Cipta Milik IPB, Tahun 2014

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB

(11)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika

ANALISIS DAN PENANGANAN PENCILAN PADA

DATA LONGITUDINAL

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2014

(12)
(13)

Judul Tesis : Analisis dan Penanganan Pencilan pada Data Longitudinal Nama : Viarti Eminita

NIM : G151110031 Disetujui oleh Komisi Pembimbing Dr. Ir. Indahwati, M. Si Ketua Dr. Anang Kurnia, M. Si Anggota Diketahui oleh

Ketua Program Studi Statistika

Dr. Ir. Erfiani, M. Si

Dekan Sekolah Pascasarjana

Dr. Ir. Dahrul Syah, M. Sc. Agr

(14)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2013 ini ialah data longitudinal, dengan judul Analisis dan Penanganan Pencilan pada Data Longitudinal. Keberhasilan penulisan tesis ini tidak lepas dari bantuan, bimbingan, dan arahan dari berbagai pihak.

Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Indahwati, M. Si. dan Bapak Dr. Ir. Anang Kurnia selaku pembimbing yang telah meluangkan waktu untuk memberikan bimbingan, arahan, dan saran kepada penulis dalam menyelesaikan tesis ini. Terimakasih untuk Ibu Dr. Ir. Anik Djuraidah, MS selaku penguji tesis dan Ibu Dr. Ir. Erfiani, M.Si. selaku Ketua Program Studi Statistika S2. Disamping itu, penulis juga mengucapkan terimakasih kepada seluruh staf administrasi Rektorat dan staf Program Studi Statistika yang telah turut membantu kelancaran administrasi dalam penyelesaian tesis ini.

Ungkapkan terimakasih terkhusus penulis sampaikan kepada ayahanda (Banjar), Ibunda (Rasina), kakak (Yulitria Eminita, S.Pd) dan adikku (Emilisa), serta seluruh keluarga atas do’a yang tulus, pengorbanan yang tak ternilai, dukungan dan kasih sayangnya. Terimakasih juga untuk teman-teman Statistika (S1, S2, dan S3) dan Statistika Terapan (S2) atas bantuan, saran, dan ilmu yang positif.

Penulis menyadari sepenuhnya bahwa tesis ini masih banyak kekurangan dan jauh dari kesempurnaan. Oleh karena itu, penulis mengharapkan kritik dan saran yang bersifat membangun guna menyempurnakan tesis ini dan karya ilmiah secara utuh. Semoga tesis ini dapat menambah wawasan dan bermanfaat.

Bogor, Januari 2014

(15)

DAFTAR ISI

DAFTAR TABEL ... vi DAFTAR GAMBAR ... vi DAFTAR LAMPIRAN ... vi 1 PENDAHULUAN ... 1 1.1 Latar Belakang ... 1 1.2 Tujuan Penelitian ... 2 2 TINJAUAN PUSTAKA ... 3 2.1 Data Longitudinal ... 3 2.2 Pencilan ... 4

2.3 Model Linier Campuran ... 4

2.4 Metode Pendugaan Parameter ... 5

2.5 Metode Pendugaan Kekar Huber... 6

3 METODE ... 11

3.1 Data ... 11

3.2 Metode Analisis ... 11

4 HASIL DAN PEMBAHASAN ... 16

4.1 Kajian Simulasi Kontaminasi Pencilan ... 16

4.2 Kajian Simulasi Ketaknormalan Pengaruh Acak ... 19

4.3 Kajian Terapan ... 24

5 SIMPULAN DAN SARAN ... 34

5.1 Simpulan ... 34

5.2 Saran ... 34

DAFTAR PUSTAKA ... 35

LAMPIRAN ... 34

(16)

DAFTAR TABEL

1. Rata-rata MAPE (%) penduga respon ( ) dari model linier campuran

dengan dan tanpa kontaminasi pencilan ... 18

2. Nilai rata-rata MAPE (%) penduga respon ( ) dari model linier campuran dengan pengaruh intersep acak menyebar t dan menyebar chi-square ... 21

3. Rata-rata MAPE (%) penduga respon ( ) dari model linier campuran dengan galat intra subyek menyebar t dan menyebar chi-square ... 24

4. Nilai dugaan parameter beserta hasil uji dari metode pendugaan klasik ... 27

5. Nilai dugaan parameter beserta hasil uji dari metode pendugaan kekar ... 29

(17)

DAFTAR GAMBAR

1. Diagram Alir Kajian Simulasi ... 14 2. Diagram Alir Kajian Terapan... 15 3. Nilai RB(%) penduga parameter model linier campuran dengan dan

tanpa kontaminasi pencilan (a) β0 (b) β1. ... 17

4. Nilai RRMSE (%) penduga parameter model linier campuran dengan dan tanpa kontaminasi pencilan ... 17 5. Nilai RB (%) penduga parameter model linier campuran dengan

pengaruh intersep acak menyebar t ... 19 6. Nilai RRMSE (%) penduga parameter model linier campuran dengan

pengaruh intersep acak menyebar t ... 20 7. Nilai RB (%) penduga parameter model linier campuran dengan

pengaruh intersep acak menyebar chi-square ... 20 8. Nilai RRMSE (%) penduga parameter model linier campuran dengan

pengaruh intersep acak menyebar chi-square ... 21 9. Nilai RB (%) penduga parameter model linier campuran dengan galat

intra subyek menyebar t ... 22 10. Nilai RRMSE (%) penduga parameter model linier campuran dengan

galat intra subyek menyebar t ... 22 11. Nilai RB (%) penduga parameter model linier campuran dengan galat

intra subyek menyebar chi-square ... 23 12. Nilai RRMSE (%) penduga parameter model linier campuran dengan

galat intra subyek menyebar chi-square ... 24 13. Plot jumlah sel CD4+ setiap pasien yang diukur pada 5 titik waktu ... 25 14. Boxplot data asal jumlah sel CD4+ pasien pada 5 titik waktu pengamatan.

... 26 15. Boxplot data transformasi akar dari jumlah sel CD4+ pasien pada 5 titik

waktu pengamatan. ... 27 16. Boxplot sisaan baku dari metode pendugaan klasik ... 28 17. Boxplot pengaruh acak baku dari metode pendugaan klasik (a) intersep

acak (b) slop acak ... 28 18. Boxplot sisaan baku dari metode pendugaan kekar ... 30 19. Boxplot pengaruh acak yang dibakukan dari metode pendugaan kekar

(a) intersep acak (b) slop acak ... 31 20. Diagram pencar antara kedua pengaruh spesifik subyek (intersep acak

(18)

DAFTAR LAMPIRAN

1. Nilai RB(%) penduga parameter model linier campuran dengan dan tanpa kontaminasi pencilan. ... 36 2. Nilai RRMSE (%) penduga parameter model linier campuran dengan

dan tanpa kontaminasi pencilan. ... 36 3. Nilai RB (%) penduga parameter model linier campuran dengan

pengaruh spesifik subyek menyebar t dan χ2 ... 37 4. Nilai RRMSE (%) penduga parameter model linier campuran dengan

pengaruh spesifik subyek menyebar t dan χ2 ... 37 5. Nilai RB (%) penduga parameter model linier campuran dengan galat

intra subyek menyebar t dan χ2 ... 38 6. Nilai RRMSE (%) penduga parameter model linier campuran dengan

galat intra subyek menyebar t dan χ2 ... 38 7. Data percobaan klinis pasien terinfeksi HIV ... 39 8. Pengaruh spesifik subyek setiap pasien ... 40

(19)

1 PENDAHULUAN

1.1 Latar Belakang

Suatu studi longitudinal dicirikan dengan percobaan yang pengukurannya dilakukan secara berulang antar waktu pada setiap individu. Pada studi ini dimungkinkan untuk mempelajari perubahan respon antar waktu beserta faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi maupun level individu. Studi longitudinal banyak diaplikasikan dalam berbagai bidang. Studi ini disebut dengan studi panel dalam bidang ekonomi, dan studi cohort dalam penelitian epidemiologi. Studi longitudinal juga sering diterapkan dalam bidang biologi dan biomedis.

Karakteristik dalam analisis data longitudinal yaitu pengamatan berulang yang dilakukan pada setiap individu atau subyek tidak saling bebas, tapi saling bebas antar individu. Korelasi antar pengamatan berulang dapat dimodelkan secara eksplisit melalui pola matriks kovarian, maupun secara implisit melalui pengaruh acak. Metode yang dapat digunakan untuk analisis data longitudinal berbasis model linier adalah model linier campuran (General Linear Mixed

Model/GLMM). Model linear campuran dapat digunakan untuk menganalisis data

longitudinal karena mengakomodir korelasi antar pengamatan berulang dan keheterogenan antar subyek, juga memungkinkan inferensi terhadap subyek tertentu.

Metode pendugaan pada model linier campuran didasarkan pada asumsi bahwa pengaruh acak dan galat intra-subyek menyebar normal. Namun, dalam berbagai kasus tidak jarang ditemui hal yang menyebabkan tidak terpenuhinya asumsi tersebut. Salah satu penyebab tidak terpenuhinya asumsi klasik adalah adanya pencilan pada data amatan. Pengamatan pencilan mengakibatkan kenormalan dari sebaran data menjadi terganggu, akibatnya matriks peragam akan kehilangan efisiensinya dan sifat penduga menjadi bias dan tidak konsisten (Yohai 2006). Metode pendugaan klasik dapat menjadi tidak efisien ketika asumsi sebaran data tidak terpenuhi. Oleh karena itu, diperlukan suatu metode yang bersifat kekar untuk membatasi potensi bias yang dapat digunakan baik pada saat asumsi sebaran terpenuhi maupun tidak terpenuhi (Richardson dan Welsh 1995). Dua jenis pencilan yang terdapat dalam data longitudinal, yaitu pencilan pada galat intra-subyek dan pencilan pada pengaruh spesifik subyek. Kedua pencilan tersebut terkadang sulit untuk dibedakan.

Huber (1968) memperkenalkan fungsi- Huber sebagai alternatif penduga regresi kekar untuk MKT dan fungsi-ψ Huber yang dapat membatasi pengaruh pencilan. Richardson dan Welsh (1995) mempelajari sifat-sifat asimtotik dari penduga kemungkinan maksimum kekar (Robust Maximum Likelihood

Estimator/RMLE) dengan penduga kemungkinan maksimum berkendala kekar

(Robust Restricted Maximum Likelihood Estimator/RREMLE). Pendekatan RREMLE pada komponen ragamnya menghasilkan bias yang lebih kecil dibandingkan penduga RML. Staudenmayer dan Wand (2008) mengembangkan generalisasi pendekatan kekar terhadap pencilan menggunakan sebaran peubah ganda t pada model linier campuran, dan pendekatan ini digunakan untuk data yang sebarannya simetrik dan berekor gemuk atau panjang. Gill (2000) mengkaji

(20)

2

analisis model linier campuran yang lebih kekar terhadap pencilan pada data longitudinal dengan pendugaan Bayes empirik kekar yang mengasumsikan galat mengikuti proses AR(1) dengan fungsi- Huber yang membatasi pengaruh pencilan. Kooler (2013) memodifikasi fungsi-ψ Huber yang lebih halus dari fungsi-ψ Huber klasik yang belum stabil secara numerik dan mengembangkan suatu metode DAS (Design Adaptif Scale) untuk menduga parameter skala dan matriks peragam pada model linier campuran. Pendekatan ini menggunakan fungsi pembobot yang bukan hanya tergantung pada fungsi-ρ Huber tetapi juga menggunakan konstanta κ yang mempertahankan konsistensi penduga.

Penelitian ini mengkaji lebih lanjut sifat tak kekar dari penduga klasik dan penduga kekar Huber melalui data simulasi. Selanjutnya, penduga kekar Huber tersebut diaplikasikan dalam penanganan pencilan pada data percobaan klinis pasien terinfeksi HIV (http://www.biostat.umn.edu/~brad/software.html). Guo dan Carlin (2004) menggunakan data tersebut untuk melihat pengaruh waktu dan pemberian dua jenis obat kepada pasien terhadap perkembangan penyakit. Penelitian tersebut menggunakan metode pemodelan bersama (joint modeling) untuk memodelkan pengaruhnya dan pendekatan transformasi untuk mengatasi masalah pelanggaran asumsi kenormalan. Dalam penelitian ini digunakan penduga kekar Huber pada data tersebut untuk mengatasi pelanggaran asumsi kenormalan akibat adanya pencilan.

1.2 Tujuan Penelitian

Penelitian bertujuan untuk mengkaji kinerja penduga kekar Huber pada galat intra-subyek dan pengaruh intersep acak yang bersebaran simetrik dan nonsimetrik melalui data simulasi sebagai akibat adanya pencilan pada beberapa kondisi data. Tujuan lain adalah menangani pencilan pada suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral pada pasien terinfeksi HIV, serta memprediksi keadaan pasien pada kondisi dan waktu tertentu.

(21)

3

2 TINJAUAN PUSTAKA

2.1 Data Longitudinal

Data longitudinal biasanya digunakan untuk mempelajari perubahan respon antar waktu beserta faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi maupun level individu. Data longitudinal dicirikan dengan pengamatan berulang dalam subyek yang sama cenderung berkorelasi (Zeger et

al. 1988). Korelasi antar pengamatan berulang dapat dimodelkan secara eksplisit

menggunakan pola matriks kovarian, maupun secara implisit melalui pengaruh acak. Ada dua pendekatan umum yang digunakan pada analisis data longitudinal dalam memodelkan keheterogenan antar subyek (Zeger et al. 1988). Pendekatan pertama adalah pendekatan spesifik subjek. Pendekatan ini salah satunya melalui model campuran dengan pengaruh spesifik subyek diasumsikan mengikuti suatu sebaran parametrik tertentu. Pendekatan kedua adalah pendekatan rataan populasi yaitu memodelkan rataan popuasi sebagai fungsi dari kovariat tanpa secara eksplisit memperhitungkan keheterogenan dari subyek ke subyek. Dalam pendekatan ini, matriks kovarian dari peubah respon secara langsung dimodelkan melalui struktur kovarian bagi galat intra-subyek. Kedua model tersebut memiliki perbedaan yang mendasar yaitu model spesifik subyek memungkinkan inferensi terhadap subyek tertentu, sedangkan pada model rataan populasi tidak.

Data longitudinal dapat dimodelkan menggunakan model linier campuran. Barisan pengukuran untuk peubah respon kontinu bagi subyek ke-i (i = 1, 2, …,n) adalah (Verbeke dan Molenberghs 2000):

, =1, 2, …, , (2.1)

dengan

= vektor peubah respon dari subyek ke-i

= banyaknya deret data longitudinal dari subyek ke-i

= matriks rancangan masing-masing berdimensi tixp dan tixq = pengaruh tetap berdimensi px1

= pengaruh acak berdimensi qx1

= vektor galat intra-subyek berdimensi tix1.

Model tersebut mengasumsikan bahwa saling bebas dengan , sedangkan vektor pengaruh acak , dan , . Oleh karena itu, sebaran marginal menyebar normal dengan nilai tengah dan matriks kovarian . Matriks D dan merupakan matriks simetrik definit positif.

(22)

4

2.2 Pencilan

Wu (2010) mendefinisikan pencilan sebagai suatu pengamatan yang jelas berbeda jauh dari keseluruhan data atau tidak konsisten terhadap mayoritas data. Pengaruh spesifik subyek dan galat intra-subyek dalam model linier campuran (2.1) diasumsikan memiliki sebaran normal, karena inferensia menggunakan fungsi kemungkinan yang berdasarkan pada sebaran yang diasumsikan. Suatu pengamatan dengan ragam yang besar secara otomatis merupakan pencilan ketika diketahui ragam prior pengamatan tersebut kecil (Weiss 1994). Pada praktiknya, asumsi sebaran parametrik mungkin tidak terpenuhi jika ada pencilan. Inferensia yang menggunakan fungsi kemungkinan pada model pengaruh acak sangat sensitif terhadap pencilan, yaitu dapat berpengaruh besar terhadap hasil dan kesimpulan.

Pada data longitudinal ada dua jenis pencilan, yaitu:

1 Pencilan diantara pengamatan berulang dalam suatu subyek atau biasanya dinamakan e-outlier, walaupun individu tersebut bukan sebagai pencilan. 2 Pencilan individu yang jelas berbeda dari keseluruhan individu dalam contoh,

pencilan ini sering disebut b-outlier.

Kedua jenis pencilan ini terkadang sulit untuk dibedakan jika data memiliki banyak dimensi, misalnya data longitudinal. Statistik kedua pencilan tersebut berbeda untuk setiap subyek, yaitu statistik untuk pengamatan dan pengaruh acak (Weiss 1994). Metode pendugaan kekar biasanya digunakan untuk mengatasi hal ini, karena metode kekar kurang sensitif terhadap pencilan. Metode pendugaan kekar dapat digunakan ketika asumsi terpenuhi ataupun tidak terpenuhi.

2.3 Model Linier Campuran

Model linier campuran secara umum dapat dimodelkan dengan formula sebagai berikut (Kooler 2013):

(2.2)

dengan y merupakan vektor pengamatan berukuran mx1. X merupakan matriks rancangan mxp untuk pengaruh tetap dan Z berukuran mxq adalah matriks rancangan bagi pengaruh acak b. Pengaruh acak b (qx1) dan galat ε menyebar normal dan saling bebas satu sama lain, yaitu

~N(0,σ2Ve), b~ N(0,σ2Vb(θ)), dan cov( ,b) = 0. (2.3)

Jumlah total pengamatan dinotasikan dengan m = ∑ =1 , dengan n banyaknya subyek yang diamati, sedangkan banyaknya pengaruh acak adalah q. Matriks peragam bagi pengaruh acak, σ2Vb(θ) memiliki r parameter θ = (θ1, θ2,

..., θr ) yang merupakan matriks blok diagonal berukuran qxq dengan K blok, sedangkan σ2Ve diasumsikan merupakan matriks diagonal berukuran mxm dan

(23)

5 2.4 Metode Pendugaan Parameter

Kooler (2013) menotasikan komponen ragam dengan faktor skala (σ), yakni

dan , , serta mendefinisikan model linier campuran dengan pengaruh acak spherical sebagai berikut:

θ ,

( ) (2.4)

Dalam hal ini y~N( ,σ2Vy(θ)) dengan Ub(θ) merupakan faktor Cholesky segitiga

bawah dari Vb(θ), sedemikian sehingga Vb(θ) = Ub(θ)Ub(θ)׳ dan Ve = UeUe׳,

sedangkan b = Ub(θ)b* dan ε = Ueε*. Komponen b* bersesuaian dengan

komponen ragam yang diasumsikan bernilai nol. Vy(θ) = ZVb(θ)Z׳ + Ve.

Berdasarkan persamaan (2.3), maka fungsi log kemungkinannya adalah:

l ,θ l ,θ (2.5) = 2log 1 2l 1 2 y 1

- merupakan gabungan antara galat intra-subyek dengan pengaruh acak. Searle et al. (1992) mendefinisikan kembali fungsi log kemungkinan (2.5) dengan memisahkan pengaruh galat intra subyek dengan pengaruh acak

θ = 2log 1 2l 1 2( ( ) ( ) )/ (2.6)

dengan ε*( *) = Ue-1(y- -ZUb(θ)b*). Berdasarkan persamaan (2.6) yang diturunkan terhadap dan b* diperoleh persamaan model campuran Henderson, yaitu: * e e b b b e b q+ * ̂ ̂ + = [ e e ] (2.7) ̂ dan ̂ merupakan penduga kemungkinan maksimum bagi dan Best Linear

Unbiased Predictor (BLUP) bagi b*. Untuk θ dan diketahui pendugaan dapat

dilakukan dengan mengoptimisasi fungsi log kemungkinan kemudian memprediksi b* dengan menggunakan persamaan (2.7). Penduga bagi dan b* dapat juga dihitung dengan menggunakan persamaan (2.7) secara bersamaan. Turunan pertama dari persamaan (2.6) terhadap dan b dapat ditulis juga ke dalam bentuk persamaan berikut, yaitu:

e 1 ( ̂ ̂ )

(2.8) ( ( ̂ ̂ ) ̂ ) =0

dengan ( ̂ ̂ ) ( ̂ ̂ ). Persamaan pendugaan bagi dan b*

pada persamaan (2.7) atau (2.8) selanjutnya disebut persamaan pendugaan pertama dan kedua.

(24)

6

Persamaan pendugaan bagi θ dan σ dapat diperoleh dari turunan pertama

fungsi kemungkinan maksimum (2.6) terhadap θ dan σ, persamaan ini selanjutnya

disebut persamaan pendugaan ketiga dan keempat, yaitu: ̂ ̂ ̂ ̂ = ̂2

(2.9) ̂ e ( b θ̂ / θl) ̂ = ̂/2 tr( y 1( ̂) ( b θ̂ / θl) ), l=1,2,…,

Sifat dalam pendugaan ML adalah tidak adanya pertimbangan mengenai hilangnya derajat bebas sebagai akibat menduga pengaruh tetap , maka penduga MLE bagi θ merupakan penduga yang berbias. Untuk mengeliminasi bias ini dikembangkan bentuk alternatif dari metode MLE yakni penduga REML. Metode sederhana untuk mencari persamaan pendugaan dengan metode REML adalah dengan mengganti sisi kanan dari persamaan (2.9) dengan nilai harapan dari penduga pada sisi kanan. Catat bahwa

̂ - ̂ , θ ( θ̂ θ), ( ̂ (θ̂) ̂ ) ( [ ̂ ̂] (θ̂))

Persamaan pendugaan REML ketiga dan keempat adalah:

̂ ̂ [ ̂ ̂ ] (2.10)

̂ l(θ̂) ̂ tr ( * ̂ ̂ + l(θ̂)) (2.11)

2.5 Metode Pendugaan Kekar Huber

2.5.1 Metode pendugaan kekar huber klasik

Penduga Huber pertama kali dikenalkan oleh Huber pada tahun 1964 sebagai alternatif penduga regresi kekar untuk MKT. Metode ini mengasumsikan bahwa diketahui dan merupakan parameter yang hanya digunakan untuk menduga pengaruh tetap . Salah satu fungsi- Huber (fungsi obyektif) adalah:

= { 1

2 2 ≤

1

2 2

dengan c merupakan konstanta yang ditetapkan. Penentuan nilai c ini sangat penting, yaitu jika nilainya besar penduga kekar yang dihasilkan sama dengan penduga klasik, tapi jika nilainya kecil penduga yang dihasilkan lebih kekar (Wu 2010). Sedangkan fungsi-ψ Huber (fungsi pengaruh) yang merupakan turunan

pertama dari fungsi obyektif di atas adalah: = ρ

={

(25)

7 Fungsi ini merupakan fungsi yang digunakan untuk memboboti data pencilan. Pengaruh pencilan dapat dibatasi menggunakan fungsi-ψ Huber ̂ dan ψb ̂ untuk menggantikan ̂ dan ̂ pada persamaan pendugaan (2.8).

2.5.2 Penduga Kekar bagi Pengaruh Tetap dan Pengaruh Acak

Pendekatan yang digunakan untuk persamaan pendugaan kekar adalah pendekatan yang hampir sama dengan proposal II Huber (1964). Adanya struktur korelasi dari b*akan menyebabkan struktur matriks Ub menjadi tidak diagonal, sehingga metode pendugaan kekar bagi pengaruh tetap dan acak dibagi menjadi dua kasus, yaitu Ub merupakan matriks diagonal dan Ub bukan merupakan matriks diagonal (Kooler 2013).

(i) Ub Merupakan Matriks Diagonal

Asumsikan θ dan σ diketahui, maka persamaan penduga kekar bagi dan b*

adalah:

e 1 ψe( ̂ / )/ =0

(2.12) ψ ̂ ψb ̂ / =0

dengan = yang digunakan untuk menyeimbangkan ̂ dan ̂ jika fungsi- Huber yang digunakan berbeda. Faktor skala dan adalah sama seperti fungsi pengaruh pada penduga-M. Jika , maka faktor skala diabaikan. Misalkan ̂ , ̂ , dan

̂ ̂ = iag( ) ̂ ( ̂ ) = iag( ) Perluasan pertama pada ̂ dan ̂ disekitar dan b* adalah:

̂ e 1 b

̂ b

Substitusikan persamaan di atas ke dalam (2.12) dan formula untuk matriks Ue secara umum dapat diperbaiki dengan mengganti De dengan (Ue-1DeUe-1,

sehingga persamaan pendugaan menjadi: * ( e 1) e e 1 ( e 1) e e 1 b b ( e 1) e e 1 b ( e 1) e e 1 b b + [ ] * ψ ψ ψ +

dengan e/ yang merupakan matriks diagonal. Algoritma sederhana dilakukan dengan menghitung ̂ dan ̂ yang diproses secara bergantian pada suatu himpunan pembobot yang diberikan dan memperbaharui pembobot tersebut. Algoritma berhenti ketika perubahan relatif dari nilai penduga yang diperoleh cukup kecil atau konvergen.

(26)

8

(ii) Ub Merupakan Matriks Nondiagonal

Jika Ub(θ) tidak diagonal, maka kesederhanaan dari fungsi pembobot huber untuk b* menjadi lebih sulit, oleh karena adanya struktur korelasi dari b*, misalnya untuk model yang memiliki intersep dan slope acak. Misalkan k(j) merupakan suatu fungsi yang memetakan pengaruh acak ke-j dengan blok ke-k yang sesuai, maka jarak Mahalanobis kuadrat diduga dengan pengaruh acak, yaitu:

d = (d(bk(j)/σ))j = 1, …, q , dengan d(bk) = (bk*) ׳bk*,

maka pembobot kekar untuk pengaruh acak ke-j adalah: ,ψ √ /√ , jika 0

ψ , jika =0

Pembobot kekar di atas dapat dinyatakan dalam bentuk matriks pembobot: Wb(d) = Diag(wb(dk(j)))j = 1, …,q,

sehingga persamaan pendugaan kekar menjadi: 1 ̂

(2.13) 1 1 ψ ̂ ̂ =0

dengan merupakan matriks diagonal dengan elemen

yang tergantung pada ukuran blok sk(j), ̃ ,

̃ = 0*

( (( ) ) )+ ,

Misalkan We didefinisikan analog dengan Wb, yaitu: We = Diag(we( i*/ )j = 1, …,q,

dengan

,ψψ , jika / , jika 0=0

maka dengan mensubstitusi matriks pembobot ini ke dalam persamaan (2.13) diperoleh sistem persamaan linier berikut untuk menduga dan b*

* ( e 1) e e 1 ( e 1) e e 1 b b ( e 1) e e 1 b ( e 1) e e 1 b b + [ ̂ ̂ ] = * ( e 1) b ( e 1) +

2.5.3 Persamaan pendugaan parameter skala (σ)

Kooler (2008) mengembangkan suatu pendekatan khusus yang digunakan untuk menduga σ pada regresi linier, yakni pendekatan DAS. Pendekatan ini

(27)

9 Huber tetapi juga dari konstanta κ yang mempertahankan konsistensi penduga. Pendekatan ini kemudian diaplikasikan ke persamaan pendugaan ketiga (2.9) untuk memperoleh penduga bagi σ, yaitu (Kooler 2013):

̂ ∑ ( ̂ ̂) ̂ *( ̂) + ( ̂ ̂) ̂ =0 (2.14)

Notasi ( ) digunakan untuk membedakan fungsi pembobot yang digunakan untuk peragam (θ) dan skala ( ). didefinisikan sebagai:

* ( ̂ ̂) ̂ ̂ + * ( ̂ ̂)+ (2.15) dengan e σ = 0* e σ 2+/ 0* e σ +

Fungsi pembobot yang digunakan pada penduga skala adalah pembobot kekar kuadrat yang digunakan pada pengaruh tetap dan acak, yakni

e σ

={(

) , jika 0 e σ 0 , jika =0

2.5.4 Persamaan pendugaan parameter peragam (θ)

Pendugaan kekar bagi parameter komponen peragam menggunakan persamaan pendugaan keempat (2.9) yang diadopsi dari metode kooler (2013). Pendugaan parameter peragam juga menggunakan metode DAS seperti pada pendugaan parameter skala ( ). Berdasarkan struktur korelasi dari b*, pendugaan parameter peragam dibedakan menjadi dua kasus, yaitu Ub(θ) merupakan matriks

diagonal dan Ub(θ) bukan merupakan matriks diagonal.

(i) Ub(θ) merupakan matriks diagonal

Asumsi bahwa Ub(θ) diagonal, menyebabkan Ql(θ) mendekati satu atau nol,

sehingga dapat dihilangkan dari persamaan pendugaan keempat (2.11). Persamaan pendugaan keempat dikekarkan sama seperti persamaan ketiga untuk mendapatkan: ∑ b,j2 b σ ( ̂ j/ b,j2 σ̂) [( ̂j/ e,j2 σ̂) 2 b σ ] q j=1 =0 (2.16) dengan adalah [ ( ̂ ̂) *( ̂ ̂) +] (2.17) dengan * + * +

(28)

10

(ii) Ub(θ) merupakan matriks nondiagonal

Jika Ub(θ) tidak diagonal maka hal ini akan mempengaruhi struktur blok.

Normalisasi dari diganti dengan matriks Tb,i yang didefinisikan pada setiap

blok i dan misalkan s merupakan dimensi dari tiap blok (s > 1). Persamaan pendugaan keempat dikekarkan sama seperti persamaan ketiga untuk mendapatkan: b ( ( b, 1/2 ̂ / ̂)) ̂ l ̂ ̂ /σ̂ 2 b ( ( b, 1/2 ̂ / ̂)) =1 tr( b, l ̂ )=0 (2.18) dengan b = ( b -( -s b ) b ( - b )) / , b = *( - b ) b ( - b )+=0, untuk χ ,

sedangkan b =min 1/b,1/d merupakan fungsi pembobot untuk ukuran matriks dan b =min(1/b ,1/d) adalah fungsi pembobot untuk bentuk (shape).

2.5.5 Pemulusan Fungsi Huber

Penggunaan fungsi-ψ yang tidak dihaluskan pada regresi linier kekar akan

menghasilkan ketidakstabilan numerik. Kooler (2013) mengembangkan suatu metode dengan menggunakan fungsi-ψ Huber yang dihaluskan dengan definisi

sebagai berikut:

= { , ≤ tanda , selainnya

dengan k = c + s1/(s+1) dan d = c – s1/(s+1), dengan nilai c merupakan konstanta

yang ditetapkan dari fungsi-ψ klasik. Nilai c yang biasa dipilih adalah 1,345. Nilai s = 10 akan menghasilkan sifat asimtotik yang sama pada fungsi Huber klasik dan

(29)

11

3 METODE

3.1 Data

Data dalam penelitian ini terdiri dari dua sumber yaitu data simulasi dan data terapan. Data simulasi berguna untuk mengukur kinerja penduga kekar Huber pada data longitudinal. Data terapan sebagai penerapan contoh kasus dari metode pendugaan kekar Huber diambil dari data longitudinal dalam percobaan klinis. 3.1.1 Data Simulasi

Data simulasi dalam penelitian ini adalah data yang dirancang berdasarkan model linier campuran dengan intersep acak, yaitu:

= 0 1time 0 , =1, 2, …, , =1, 2, …,

dengan n = 100 dan m = 5. 0 dan 1 merupakan parameter dari pengaruh tetap, sedangkan 0 adalah pengaruh intersep acak yang menggambarkan pengaruh

intersep acak ke-i dan merupakan galat intra subyek ke-i pada waktu ke-j. Keragaman data simulasi adalah sebagai berikut:

(i). Data dengan pencilan-e (0%, 5%, 10%, 15%) (ii). Data dengan pencilan-b (0%, 5%, 10%, 15%)

(iii). Data dengan pencilan-e dan pencilan-b (0%, 5%, 10%, 15%) (iv). Data dengan dan b0 bersebaran chi-square (db=1,2,3,4,5 dan 6)

(v). Data dengan dan b0 bersebaran t-student (db=1,2,3,4, 5 dan 6)

3.1.2 Data Terapan

Data terapan dalam penelitian ini berupa data sekunder dari suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral dalam menangani pasien-pasien yang gagal atau tidak toleran terhadap terapi zidovudine (AZT), percobaan melibatkan n=467 pasien terinfeksi HIV yang terdiagnosa sebagai penderita AIDS atau memiliki jumlah sel CD4+ ≤ 300/ml3darah. Pasien dibagi secara acak untuk menerima salah satu dari dua jenis obat, yaitu didanosine (ddI) atau zalzitabine (ddC). Banyaknya sel CD4+ dicatat pada saat terlibat dalam studi (t = 0), dan kunjungan pada bulan ke 2, 6, 12, dan 18, sehingga maks mi= 5. Data ini digunakan oleh Guo dan Carlin (2004) untuk

pemodelan bersama data longitudinal dan data daya tahan hidup dari penderita HIV. Data diambil dari http://www.biostat.umn.edu/~brad/software.html. Peubah penjelasnya adalah Drug (ddI = 1, ddc = 0), Gender (male = 1, female = 0), PrevOI (terdiagnosa AIDS pada saat studi = 1, belum terdiagnosa AIDS pada saat studi = 0), dan Stratum (gagal AZT = 1, tidak toleran AZT = 0).

3.2 Metode Analisis 3.2.1 Kajian Simulasi

Simulasi ini dilakukan untuk mengkaji pengaruh kombinasi beberapa kondisi pencilan terhadap penduga parameter serta mempelajari sifat-sifat dari

(30)

12

penduga yang diperoleh. Tahapan-tahapan yang dilakukan dalam analisis ini sebagai berikut yang diringkas pada Gambar 1:

1. Pembangkitan data longitudinal dengan berbagai kondisi dengan langkah-langkah sebagai berikut

(i). Menentukan parameter 0 dan 1 yang ditetapkan secara berturut-turut

50 dan -2.

(ii). Membangkitkan pengaruh acak dari sebaran 0 1 (iii). Membangkitkan pengaruh acak dari sebaran 0 2

(iv). Menentukan nilai t , yaitu 0, 2, 6, 12, dan 18 yang diulang sebanyak n kali. t merupakan waktu pengamatan berulang.

(v). Menentukan nilai 0 1t 0 . Hasil ini digunakan sebagai data dengan 0% pencilan (tanpa pencilan).

(vi). Membangkitkan n pengaruh acak 0 dari sebaran 10 0= .

(vii). Membangkitkan nm pengaruh acak dari sebaran ,σ2=

(viii). Skenario 1: Ambil secara acak 0 yang diperoleh dari langkah ii

sebanyak 95% dan dari langkah (vi) sebanyak 5% sebagai pencilan pengaruh intersep acak (pencilan-b) kemudian digabungkan. Tentukan nilai Y pada langkah (v) dengan menggunakan 0 baru yang terkontaminasi pencilan-b.

(ix). Skenario 2: Ambil secara acak yang diperoleh dari langkah iii sebanyak 95% dan dari langkah (vii) sebanyak 5% sebagai pencilan

e-outlier kemudian digabungkan. Tentukan nila Y pada langkah (v)

dengan menggunakan baru yang terkontaminasi pencilan-e.

(x). Skenario 3: Ambil secara acak , yang diperoleh dari langkah ii dan iii sebanyak 95% dan dari langkah (vi) sebanyak 5% sebagai pencilan pengaruh acak (b-outlier) dan dari langkah (vii) sebanyak 5% sebagai pencilan-e, sehingga ada dua kombinasi pencilan yaitu pencilan-e dan pencilan-b. Tentukan nilai Y pada langkah (v) dengan menggunakan dan baru yang terkontaminasi pencilan-e dan pencilan-b.

(xi). Ulangi langkah viii-x untuk kasus kontaminasi pencilan 10% dan 15% (Skenario 4-9)

(xii). Skenario 10: Pembangkitan data dengan pengaruh acak dari sebaran (db=1,2,3,4,5 dan 6).

(xiii). Skenario11: Pembangkitan data dengan pengaruh acak dari sebaran dari sebaran (db=1,2,3,4,5 dan 6).

(xiv). Skenario12: Pembangkitan data dengan pengaruh acak dari sebaran dari sebaran t-student (db=2,3,4,5, dan 6).

(xv). Skenario13: Pembangkitan data dengan pengaruh acak dari sebaran dari sebaran t-student (db=2,3,4,5, dan 6).

2. Menghitung pengaruh tetap ( dan ) dan penduga respon terhadap masing-masing kondisi data menggunakan metode pendugaan klasik dengan metode pendugaan kekar Huber yang disarankan, dengan algoritma pendugaan sebagai berikut:

(31)

13 a. Hitung penduga awal. Pemilihan penduga awal pada algoritma dapat diperoleh dari penduga kekar klasik, yaitu menggunakan proposal II Huber (1964).

b. Untuk ̂ ̂ yang diketahui dari langkah 1, Hitung ̂ dan ̂ dengan menggunakan persamaan (2.13).

c. Hitung ̂ menggunakan persamaan (2.14), dengan menggunakan ̂ dan ̂ yang telah ditentukan pada langkah 2.

d. Periksa persamaan pendugaan bagi ̂ dengan (2.16) hingga konvergen. Jika belum terpenuhi kembali ke langkah 2 dengan ̂ yang baru.

3. Proses membangkitkan data pada langkah 1 dan pendugaan parameter pada langkah 2 diulang sebanyak B=500 kali.

4. Menghitung bias relatif (Relatif Bias/RB) dan kuadrat tengah galat relatif (Relatif Root Mean Square Error) bagi , , dan MAPE (Mean Absolute

Persentage Error) untuk setiap pasien. RB 1∑ ( ̂ ) 100 500 =1 RRMSE ∑ ( ̂ ) 100 MAPEi ( ∑ | ̂ | )

5. Mengevaluasi kinerja metode pendugaan klasik dan metode pendugaan kekar berdasarkan nilai RB, RRMSE, dan rata-rata MAPE.

3.2.2 Kajian Terapan

Pendekatan terapan bertujuan untuk memprediksi nilai pengamatan dari individu pada kondisi tertentu. Pendekatan ini dilakukan dengan cara menerapkan penduga dengan metode pendugaan REML dan metode pendugaan kekar Huber yang disarankan untuk menangani pencilan pada suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral pada pasien terinfeksi HIV. Tahapan-tahapan yang dilakukan dalam analisis ini dan diringkas pada Gambar 2, yaitu:

1. Mengidentifikasi adanya pencilan pada data pasien terinfeksi HIV dengan menganalisis galat intra-subyek dan pengaruh intersep acak secara eksploratif melalui diagram kotak garis (boxplot) dari sisaan baku.

2. Menghitung penduga parameter menggunakan prosedur berikut:

i. Data terapan dengan pendugaan parameter menggunakan metode pendugaan terbaik dari hasil simulasi (metode pendugaan kekar)

ii. Data terapan ditransformasi menggunakan trasnformasi Box-Cox, kemudian menduga parameter menggunakan metode klasik (REML) 3. Memprediksi kondisi pasien pada kondisi dan waktu tertentu menggunakan

(32)

14

(33)

15

(34)

16

4 HASIL DAN PEMBAHASAN

Pada bab ini dibahas mengenai kajian simulasi dan kajian terapan. Simulasi dilakukan untuk mengevaluasi penduga yang diperoleh dengan menggunakan metode pendugaan klasik dan metode pendugaan kekar Huber. Evaluasi dilakukan dengan melihat nilai RB, RRMSE, dan rata-rata MAPE. Nilai-nilai tersebut diperoleh dari hasil simulasi yang diulang sebanyak B=500 kali. Setelah menyelidiki metode mana yang lebih kekar terhadap pencilan, selanjutnya metode tersebut akan diaplikasikan pada data terapan yang terkontaminasi pencilan. Data terapan merupakan data yang diperoleh dari studi longitudinal pada percobaan klinis terhadap pasien penderita HIV.

4.1 Kajian Simulasi Kontaminasi Pencilan

Simulasi ini dilakukan untuk melihat pengaruh kontaminasi pencilan pada data longitudinal dengan tiga kondisi kontaminasi. Kondisi kontaminasi pencilan tersebut adalah kontaminasi pencilan pada galat intra-subyek (pencilan-e), kontaminasi pencilan pada pengaruh intersep acak (pencilan-b), dan kontaminasi pada keduanya (pencilan-eb). Simulasi juga dikaji pada proporsi pencilan yang berbeda-beda, yaitu pada proporsi 0% (tanpa pencilan), 5%, 10%, dan 15%. Simulasi dibangun berdasarkan model linier campuran. Model yang digunakan model linier campuran dengan intersep acak (b0i).

= 0 1time 0 , =1, 2, …, 100, =1, 2, …, 5.

Pengaruh pencilan tersebut dievaluasi pada dua parameter yang diduga dengan model linier campuran, yaitu pengaruh tetap β0 dan β1. Selain itu hasil prediksi

juga dievaluasi dengan rata-rata MAPE. Pendugaan dilakukan menggunakan dua metode yaitu metode pendugaan klasik dan metode pendugaan kekar Huber. Gambaran secara grafis dari RB pada kasus kontaminasi pencilan untuk setiap parameter disajikan pada Gambar 3.

Pada Gambar 3 (a) untuk pengaruh tetap 0 memperlihatkan bahwa semakin

besar persen kontaminasi pencilan yang dicobakan, maka semakin besar nilai RB atau resiko bias yang dihasilkan. Selain itu, penerapan metode pendugaan kekar pada ketiga kasus kontaminasi pencilan selalu menghasilkan nilai RB yang lebih kecil daripada penerapan metode pendugaan klasik. Pencilan-eb menghasilkan nilai RB paling besar dibandingkan kasus kontaminasi pencilan lainnya. Hal ini berarti bahwa pencilan-eb sangat berisiko jika terdapat pada data yang dicobakan. Pengaruh tetap waktu ( 1) pada Gambar 3 (b)menghasilkan nilai RB yang relatif

kecil dan tidak berbeda jauh, sehingga ketiga kasus pencilan kurang berpengaruh pada pendugaan pengaruh tetap, terutama pengaruh slope. Hal ini karena sifat dari kontaminasi pencilan yang diberikan, yaitu acak dan model yang digunakan hanya mengandung intersep acak saja.

(35)

17

Nilai-nilai RRMSE untuk parameter β0 dan β1 diberikan pada Gambar 4.

Nilai-nilai yang diperoleh juga memberikan gambaran yang sama dengan nilai-nilai pada RB, namun berbeda untuk parameter β1. Parameter β1 pada Gambar 4

(b) memberikan gambaran yang hampir sama dengan β0, yaitu semakin besar

persen kontaminasi pencilan yang dicobakan, maka semakin besar nilai RRMSE yang dihasilkan. MSE mengandung 2 komponen, yaitu keragaman penduga (ketepatan) dan biasnya (keakuratan) (Casella dan Berger 2002). Penduga dengan sifat MSE yang baik merupakan penduga yang mengontrol keragaman dan bias. Nilai RRMSE yang besar menunjukkan keragaman penduga yang besar, sehingga semakin beresiko pada hasil pendugaan, yaitu ketepatan pendugaannya semakin rendah.

(a) (b)

Gambar 3 Nilai RB(%) penduga parameter model linier campuran dengan dan tanpa kontaminasi pencilan (a) β0 (b) β1.

(a) (b)

Gambar 4 Nilai RRMSE (%) penduga parameter model linier campuran dengan dan tanpa kontaminasi pencilan

(36)

18

Suatu penduga yang baik seharusnya memiliki ragam dan bias yang kecil. Oleh karena itu, metode pendugaan yang dapat mengontrol bias dan ragam penduga sangat diperlukan agar statistik yang dihasilkan efisien dan presisi dugaannya tinggi. Berdasarkan Gambar 3 dan Gambar 4, metode pendugaan kekar sudah cukup baik dalam mengontrol hal tersebut.

Kedua grafik pada Gambar 4, baik pada penduga β0 maupun β1

memperlihatkan bahwa pencilan-b tidak mempengaruhi keakuratan kedua penduga yang didukung dari nilai RRMSE yang sangat kecil atau mendekati nilai nol, hal ini berbeda dengan pencilan pencilan-e dan pencilan-eb. Kedua pencilan tersebut dapat mempengaruhi kekauratan pendugaan yang juga didukung dari nilai RRMSE yang lebih besar dari pada pencilan-b.

Pendugaan pada respon bukan hanya menggunakan penduga bagi parameter tatapnya saja (β0 dan β1), tapi juga memerlukan penduga bagi ragam. Pada model

yang digunakan untuk simulasi hanya ada dua ragam, yaitu ragam bagi pengaruh acak spesifik subyek ( b0) dan ragam bagi pengaruh galat intra-subyek ( ε).

Metode pendugaan klasik menggunakan metode REMLE untuk menduga ragam, sedangkan metode pendugaan kekar menggunakan metode DAS. Tabel 1 memperlihatkan bahwa semakin besar persen kontaminasi pencilan yang dicobakan, maka semakin besar nilai MAPE yang dihasilkan. Selain itu, penerapan metode pendugaan kekar pada ketiga kasus kontaminasi pencilan menghasilkan nilai MAPE yang hampir sama dengan penerapan metode pendugaan klasik. Hal ini karena metode pendugaan klasik mempunyai prinsip meminimumkan ragam galat. Pencilan-eb menghasilkan nilai MAPE paling besar dibandingkan kasus kontaminasi pencilan lainnya, sehingga pencilan ini sangat berisiko jika terdapat pada data.

Tabel 1 Rata-rata MAPE (%) penduga respon ( ̂) dari model linier campuran dengan dan tanpa kontaminasi pencilan

Metode Kontaminasi pencilan Persen pencilan 0 5 10 15 Klasik Pencilan.e 3,700 5,566 7,282 8,966 Pencilan.b 3,700 4,553 5,419 5,890 Pencilan.eb 3,700 6,258 8,439 10,847 Kekar Pencilan.e 3,669 4,847 7,336 7,731 Pencilan.b 3,669 4,463 5,254 5,665 Pencilan.eb 3,669 5,729 7,441 11,182

Pada kasus riil sangat sulit untuk membedakan kedua pencilan tersebut, sehingga penerapan metode pendugaan kekar Huber pada ketiga kondisi kontaminasi pencilan tersebut sangat diperlukan. Metode pendugaan ini secara umum dapat memperbaiki keakuratan penduga dalam menduga parameter β0 dan

β1 agar diperoleh prediksi yang lebih kekar terhadap pencilan dan keakuratan

dalam memprediksi respon lebih tinggi. Nilai-nilai RB, RRMSE untuk penduga parameter dan MAPE untuk setiap subyek pada kasus kontaminasi pencilan dapat dilihat pada Lampiran 1-2.

(37)

19 4.2 Kajian Simulasi Ketaknormalan Pengaruh Acak

Simulasi ini digunakan untuk melihat pengaruh tidak terpenuhinya asumsi sebaran normal pada intersep acak dan galat intra subyek, keduanya dikondisikan menyebar t mewakili sebaran simetrik dan menyebar chi-square mewakili sebaran nonsimetrik. Simulasi pada skenario 10-13 dibangun berdasarkan model campuran linier dengan intersep acak. Pengaruh tersebut dievaluasi sama seperti pada kajian simulasi kontaminasi pencilan sebelumnya.

4.2.1 Pendekatan kekar untuk pengaruh intersep acak

Simulasi ini dibangun dari skenario 10 dan 12, yaitu pengaruh intersep acak menyebar t dan menyebar chi-square. Gambaran secara grafis dari bias relatif (RB) untuk setiap parameter dengan pengaruh intersep acak menyebar t disajikan pada Gambar 5. Grafik pada Gambar 5 memperlihatkan bahwa nilai RB dari penduga β0 yang diduga menggunakan metode pendugaan klasik kurang stabil

dibandingkan dengan metode pendugaan kekar, terutama pada db=1. Kedua metode pendugaan untuk pengaruh intersep acak yang menyebar t memberikan nilai RB yang tidak berbeda jauh dan memiliki nilai yang sangat kecil (mendekati nol) untuk parameter 1.Hal ini karena sifat dari sebaran t yang simetris, memiliki

ekor lebih panjang daripada normal dan semakin mendekati normal jika db sebaran semakin besar. Selain itu, model yang digunakan hanya mengandung intersep acak saja, sehingga kurang berpengaruh pada hasil penduga 1.

Nilai RRMSE untuk penduga parameter model linier campuran dengan pengaruh intersep acak menyebar t disajikan dengan grafik pada Gambar 6. Nilai RRMSE secara umum memberikan gambaran yang hampir sama dengan nilai RB, yaitu memberikan resiko yang sangat besar pada db=1untuk penduga β0 dan

kurang berpengaruh terhadap penduga β1. Oleh karena itu, metode pendugaan

kekar cukup lebih stabil dalam menangani pengaruh spesifik subyek yang menyebar sebaran simetrik namun memiliki ekor yang lebih panjang dari pada normal (sebaran t).

(a) β0 (b) β1

Gambar 5 Nilai RB (%) penduga parameter model linier campuran dengan pengaruh intersep acak menyebar t

(38)

20

Gambaran secara grafis nilai RB dari penduga parameter untuk skenario 12, yaitu pengaruh intersep acak menyebar chi-square yang mewakili sebaran nonsimetrik diperlihatkan pada Gambar 7. Nilai RB pada penduga o semakin

besar seiring membesarnya derajat bebas yang dicobakan. Distribusi chi-square memiliki karakteristik distribusi yang menjulur ke kanan, positif dan nilai tengahnya semakin besar seiring membesarnya derajat bebas yang dicobakan (Casella dan Berger 2002). Hal ini dapat mempengaruhi sifat penduga β0, yaitu

biasnya semakin besar. Hal yang berbeda ditunjukkan pada penduga β1, nilai RB

yang dihasilkan kecil (mendekati nol), sehingga pengaruh intersep acak menyebar

chi-square tidak berpengaruh terhadap pendugaan β1. Kedua metode penduga memberikan nilai RB yang tidak berbeda jauh dan penduga parameter β0 atau β1

memiliki pola fluktuatif yang hampir sama pada setiap derajat bebas yang dicobakan. Grafik pada Gambar 7(a) untuk parameter β0 memperlihatkan bahwa

metode pendugaan klasik dan metode pendugaan kekar memiliki pola nilai RB yang sama, selain itu kedua metode menghasilkan penduga yang berbias ke atas. Hal ini dapat dilihat juga pada penduga β1 (b), walaupun pada setiap derajat bebas

yang dicobakan memiliki pola yang berbeda, namun nilai RB kecil (mendekati nol).

Nilai RRMSE untuk penduga parameter model linier campuran dengan pengaruh intersep acak menyebar chi-square disajikan dengan grafik pada

(b) β0 (b) β1

Gambar 6 Nilai RRMSE (%) penduga parameter model linier campuran dengan pengaruh intersep acak menyebar t

(a) β0 (b) β1

Gambar 7 Nilai RB (%) penduga parameter model linier campuran dengan pengaruh intersep acak menyebar chi-square

(39)

21 Gambar 8. Gafik ini memperlihatkan bahwa nilai RRMSE untuk penduga β0

menggunakan kedua metode hampir sama untuk setiap derajat bebas yang dicobakan, selain itu terlihat juga bahwa grafik metode pendugaan kekar memiliki fluktuasi yang lebih stabil daripada metode pendugaan klasik. Hal ini menunjukkan bahwa metode pendugaan kekar lebih akurat dibandingkan metode pendugaan klasik pada derajat bebas yang dicobakan. Nilai RRMSE pada penduga β1 juga memiliki pola yang sama untuk kedua metode pendugaan, kecuali pada

derajat bebas 1, 2, dan 3, kemudian nilai RRMSE menurun seiring membesarnya derajat bebas yang dicobakan. Nilai-nilai RB dan RRMSE untuk penduga parameter pada kasus pengaruh intersep acak menyebar t dan chi-square dapat dilihat pada Lampiran 3-4.

Tabel 2 menerangkan bahwa nilai MAPE untuk kasus pengaruh intersep acak menyebar t adalah stabil untuk kedua metode pendugaan dan nilainya tidak berbeda jauh, walaupun metode pendugaan kekar lebih kecil dibandingkan metode pendugaan klasik. Sedangkan untuk kasus pengaruh intersep acak menyebar chi-square, nilai MAPE semakin kecil seiring besarnya derajat bebas yang dicobakan, namun tidak berbeda jauh. Oleh karena kedua metode penduga memberikan nilai RB, RRMSE, dan MAPE yang tidak berbeda jauh, maka kedua metode dapat digunakan pada kasus pengaruh intersep acak menyebar t atau

chi-square, namun secara umum metode pendugaan kekar menghasilkan penduga

yang lebih stabil dibandingkan metode pendugaan klasik.

Tabel 2 Nilai rata-rata MAPE (%) penduga respon ( ̂) dari model linier campuran dengan pengaruh intersep acak menyebar t dan menyebar chi-square

derajat bebas bi ~ t bi ~ chi-square

Klasik Kekar Klasik Kekar

1 2,497 2,454 2,578 2,618 2 2,564 2,526 2,454 2,421 3 2,512 2,474 2,344 2,306 4 2,573 2,524 2,251 2,219 5 2,553 2,518 2,152 2,122 6 2,539 2,481 2,14 2,106 (a) β0 (b) β1

Gambar 8 Nilai RRMSE (%) penduga parameter model linier campuran dengan pengaruh intersep acak menyebar chi-square

(40)

22

4.2.2 Pendekatan kekar untuk galat intra-subyek

Simulasi ini dibangun dari skenario 11 dan 13, yaitu galat intra-subyek menyebar t dan menyebar chi-square. Gambaran secara grafis dari bias relatif (RB) untuk setiap parameter dengan galat intra subyek menyebar t disajikan pada Gambar 9. Grafik pada Gambar 9 memperlihatkan bahwa nilai RB untuk penduga β0 yang diduga menggunakan kedua metode pendugaan hampir memiliki pola

yang sama, namun metode pendugaan klasik tidak stabil pada db = 1. Metode pendugaan kekar menghasilkan nilai RB yang stabil disekitar nol untuk setiap derajat bebas yang dicobakan. Pada Gambar 9 dapat dilihat juga bahwa penduga β1 memiliki pola fluktuasi bias relatif yang hampir sama untuk kedua metode

pendugaan. Sama seperti pada penduga β0, metode pendugaan kekar tetap stabil

disekitar nol, sedangkan metode pendugaan klasik pada db=1 menghasilkan nilai RB yang lebih besar dibandingkan derajat bebas lainnya yang dicobakan.

Nilai RRMSE untuk penduga parameter model linier campuran dengan galat intra subyek menyebar t disajikan dengan grafik pada Gambar 10. Gafik pada Gambar 10 memperlihatkan bahwa nilai RRMSE untuk penduga β0 dari kedua

metode pendugaan hampir sama, tetapi nilai RRMSE pada derajat bebas 1 yang diduga dengan metode pendugaan kekar tetap stabil dibandingkan metode klasik. Penduga β1 memperlihatkan hal yang sama dengan penduga β0, yakni memiliki

(a) β0 (b) β1

Gambar 9 Nilai RB (%) penduga parameter model linier campuran dengan galat intra subyek menyebar t

(a) β0 (b) β1

Gambar 10 Nilai RRMSE (%) penduga parameter model linier campuran dengan galat intra subyek menyebar t

(41)

23 pola yang sama untuk kedua metode pendugaan. Oleh karena metode pendugaan kekar memiliki nilai yang lebih stabil pada setiap derajat bebas yang dicobakan, maka metode ini lebih tepat digunakan dalam menduga parameter model linier campuran ketika galat intra subyek menyebar sebaran simetrik yang ekornya lebih panjang dari pada normal (sebaran t). Grafik pada Gambar 9 dan Gambar 10 secara umum memperlihatkan metode pendugaan kekar menghasilkan penduga yang lebih baik dari pada metode pendugaan klasik dalam menangani pengaruh galat intra subyek yang menyebar sebaran simetrik (sebaran t).

Gambar 11 memperlihatkan nilai bias relatif dari penduga β0 dan β1

menggunakan dua metode penduga dimana data diketahui galat intra subyek menyebar chi-square. Gambar 11 (a) memberikan gambaran nilai RB dari penduga β0. Gambar ini memperlihatkan bahwa untuk kedua metode pendugaan

nilai bias relatif semakin besar seiring bertambah besar derajat bebas yang dicobakan. Selain itu juga nilai bias relatif yang diperoleh dari metode pendugaan kekar selalu berada dibawah metode pendugaan klasik, namun perbedaannya sangat kecil. Nilai bias relatif untuk penduga β1 dapat dilihat pada Gambar 11 (b).

Grafik pada gambar tersebut memperlihatkan hal yang berbeda dari penduga β0.

Kedua metode pendugaan memberikan pola bias relatif yang hampir sama pada setiap derajat bebas yang dicobakan dan memiliki nilai disekitar nol. Hal ini berarti galat intra subyek menyebar chi-square tidak pempengaruhi penduga β1

untuk setiap derajat bebas yang dicobakan. Hal ini karena model yang digunakan hanya mengandung intersep acak saja dan pengamatan berulang yang dicobakan untuk setiap subjek sedikit.

Nilai RRMSE untuk penduga parameter model linier campuran dengan galat intra subyek menyebar chi-square disajikan dengan grafik pada Gambar 12. Gafik pada Gambar 12 memperlihatkan bahwa nilai RRMSE untuk penduga β0 dari

kedua metode penduga menghasilkan pola trend yang sama, walaupun pada derajat bebas 2 nilai RRMSE yang dihasilkan lebih besar dibanding metode klasik. Hal ini disebabkan adanya pencilan pada nilai RRMSE. Nilai RRMSE pada penduga β1 diperlihatkan pada Gambar 12 (b). Gambar tersebut

memperlihatkan bahwa kedua metode penduga memberikan pola yang hampir sama untuk RRMSE, yaitu semakin besar seiring besarnya derajat bebas sebaran

(a) β0 (b) β1

Gambar 11 Nilai RB (%) penduga parameter model linier campuran dengan galat intra subyek menyebar chi-square

Gambar

Gambar 1 Diagram Alir Kajian Simulasi
Gambar 2 Diagram Alir Kajian Terapan
Gambar 3  Nilai RB(%) penduga parameter model linier campuran dengan dan  tanpa kontaminasi pencilan (a) β 0  (b) β 1
Tabel  1    Rata-rata  MAPE  (%)  penduga  respon  ( ̂)  dari  model  linier  campuran  dengan dan tanpa kontaminasi pencilan
+7

Referensi

Garis besar

Dokumen terkait

Perbandingan berbalik nilai yaitu perbandingan antara a dan b berbanding terbalik yang artinya jika nilai a naik maka nilai b turun demikian juga sebaliknya. No Banyaknya Mangga

Rasulullah SAW, para sahabatnya dan para ulama sangat memberikan perhatian yang besar terhadap bagaimana mengucapkan lafazh-lafazh al-Qur’an secara baik dan

Hipotesis penelitian ini adalah bahwa berkat perubahan diri yang tidak disadari, orang memberikan penilaian berlebihan (bias overestimasi) tentang perubahan dunia

Di Indonesia, ruang lingkup pengaturan regulasi terkait penyelenggara tekfin berdasarkan pasal 15 Peraturan OJK Nomor 77/POJK.01/2016 tentang Layanan Pinjam Meminjam

Kedudukan lingkaran L1 terhadap L2 ditentukan oleh nilai diskriminan D = b2– 4ac, hasil dari substitusi kedua persamaan lingkaran tersebut dengan ketentuan

Berdasarkan tingkat konsumsi protein tersebut diatas rata-rata tingkat konsumsi protein pada anak balita stunting di Desa Kopen Kecamatan Teras Kabupaten Boyolali sebesar

[r]

Universitas Kristen Maranatha... Universitas Kristen