ANALISIS MODEL PELUANG BERTAHAN HIDUP (SURVIVAL) DAN APLIKASINYA ( Survival Analysis Model and its Application)
Sunarti Fajariyah
Guru MTs Negeri 1 Kota Tangerang [email protected]
Abstrak:Mortalitas merupakan salah satu diantara tiga komponen demograpi yang dapat mempengaruhi perubahan penduduk, selain kelahiran dan migrasi. Informasi tentang peluang kematian menurut umur suatu wilayah disajikan dalam bentuk tabel yang dikenal dengan life table. Model life table merupakan model Survival yang menyatakan peluang seseorang dapat bertahan hidup hingga atau lebih dari waktu tertentu. Seperti halnya model-model yang ada dalam bidang demografi, model teoritis dari life table merupakan model yang kontinu. Namun informasi saat ini pada umumnya menggunakan bentuk diskret.
Penelitian ini untuk melakukan pendugaan parameter fungsi Survival terhadap fungsi sebaran yang sering digunakan serta mengaplikasikannya terhadap data tabel hayat Banten tahun 2005. Untuk memperoleh parameter dari fungsi Survival berdasarkan beberapa fungsi sebaran, data yang digunakan adalah data hipotetik. Pendugaan parameter dengan menggunakan metode Maximum likelihood. Dari hasil penelitian disimpulkan bahwa sebaran Weibull merupakan funsi sebaran yang terbaik dibandingkan dengan empat fungsi sebaran lainnya.
Kata Kunci : Fungsi sebaran, Metode, Maximum Likelihood
Abstract:Mortality is one of three demograpic components which influence population change, besides fertilities and migration.
Information on probability of death according to age in a region is presented in a table known as life table. Life table model reflects a survival model, which model express probability that someone can live on or more than certain time. Although modeling in mathematical demography are usually based on continuous models, but in practice, they are approximated using
discrete models. The objectives of this study are to estimate the parameters of survival function based on certain distribution function; and to apply the survival function to Banten life table data on the year 2005 to obtain the model of Banten survival function.
To obtain the parameters of survival function based on some distribution functions, hypothetical data are implemented. The hypothetical data are generated from exponential, Weibull, log-normal, log-logistic and Gompertz distribution. Maximum likelihood method is used to estimate the distribution parameters. The results of analysis on the hypothetical data show good value of R2 when an appropriate distribution are chosen. Regarding the life table of Banten, Weibull distribution shows the best fit compared to the other distributions.
Keywords: Distribution functions, Maximum Likelihood method
PENDAHULUAN A. Latar Belakang
Mortalitas atau kematian merupakan salah satu di antaratiga komponen demografi yang dapat mempengaruhi perubahan penduduk, selain fertilitas (kelahiran) dan migrasi. Informasi tentang kematian penting baik bagi pemerintah maupun lembaga swasta. Salah satu diantaranya adalah perlunya angka peluang kematian menurut umur dalam proyeksi penduduk. Secara umum informasi tentang peluang kematian menurut umur suatu wilayah disajikan dalam bentuk tabel, yang dikenal dengan sebutan life table(tabel hayat/tabel mortalitas).
Seperti telah dijelaskan sebelumnya, tabel hayat merupakan komponen penting dalam proyeksi penduduk, disamping fertilitas dan migrasi. Selanjutnya proyeksi penduduk dapat digunakan dalam bidang pendidikan yaitu untuk memperkirakan jumlah penduduk usia sekolah, jumlah murid, jumlah guru, gedung-gedung sekolah dan pendidikan pada masa yang akan datang (Pollard et al. 1982).
Selain itu model tabel hayat juga dapat diaplikasikan dalam bidang pendidikan untuk menduga angka harapan melanjutkan sekolahdan tingkat putus sekolah.
Seperti halnya model-model yang ada dalam bidang demografi lainnya, model teoritis dari life table merupakan model yang kontinu.
Namun informasi saat ini pada umumnya masih dalam bentuk diskret.
Model life table merupakan model Survival, yang menyatakan peluang seseorang dapat bertahan hidup hingga atau lebih dari waktu tertentu. Secara teoritis, banyak model-model Survival yang telah dikenal dan sering digunakan. Maksud dari penelitian ini adalah mencari model teoritis dari fungsi Survival yang sesuai dengan model life table.
B. Tujuan Penelitian
1 Melakukan pendugaan parameter fungsi Survival terhadap sebaran yang sering digunakan.
2 Mengaplikasikan fungsi Survival terhadap data tabel hayat Banten tahun 2005 untuk memperoleh model fungsi Survival Banten.
KAJIAN TEORI MODEL FUNGSI SURVIVAL
A. Fungsi Survival
Fungsi SurvivalS(x) adalah fungsi yang menyatakan peluang seseorang dapat bertahan hidup hingga atau lebih dari waktu x, yang didefinisikan sebagai berikut:S x( )P X( x), dengan peubah acak Xmenyatakan waktu bertahan hidup (Lee 1992). Fungsi Survival merupakan fungsi tak naik, pada saat
0, ( ) 1; , ( ) 0
x S x x S x Pada Tabel 1 dibawah ini disajikan pasangan sebaran dan fungsi Survival dari sebaran-sebaran Eksponensial, Weibull, Log- normal, Log-logistik dan Gompertz.
Tabel 1 Tabel sebaran dan fungsi Survival S(x)
B. Metode Kemungkinan
Maksimum(Maximum Likelihood) Metode kemungkinan maksimum merupakan salah satu metode pendugaan parameter yang menghasilkan nilai dugaan dengan memaksimumkan fungsi kemungkinan (likelihood).
Misal X1,...,Xn adalah nilai-nilai suatu contoh acak berukuran n yang ditarik dari suatu populasi diskret atau kontinu dengan fungsi kepekatan peluangnya
( ; )
f x , maka fungsi kemungkinannya didefinisikan sebagai
1
1
( ; ,..., ) ( ; ).
n
n i
i
L X X f X
yang merupakan fungsi kepekatan bersamanya. Untuk suatu fungsi kemungkinan L( ) ,
ˆ merupakan penduga kemungkinan maksimum bagi
(Serfling 1980).Seringkali penduga
ˆ diperoleh dengan menyelesaikan sistem persamaan fungsi kemungkinan,ˆ
log 0, ( 1,..., ),
i
L i k
Jika
ˆ merupakan penduga kemungkinan maksimum bagi
maka untuk sembarang Sebaran Fungsi Survival S(x) 1. Eksponensial S x( )ex2. Weibull (1 )
( )
x
S x e
3. Log-normal
2 2
Log[ ]
( ) /(2 )
0
( ) 1 1
2
x
S x e t dt
4. Log-logistik 1
( ) 1 k
S x e x
5. Gompertz ( 1 )
( )
e ex
S x e
fungsi g( ) penduga kemungkinan maksimum bagi g( ) adalah g( ).ˆ
METODOLOGI PENELITIAN A. Sumber Data
Penelitian ini menggunakan dua jenis data, yaitu:
1 Data hipotetik.
2 Data Survival Banten (data tabel hayat Banten tahun 2005).
Data hipotetik digunakan untuk melakukan pendugaan parameter beberapa fungsi Survival. Sedangkan untuk aplikasi model digunakan data SurvivalBanten.
B. Langah-langkah Penelitian
1 Membangkitkan data hipotetik dengan menggunakan lima sebaran, kemudian melakukan pendugaan parameter dengan menggunakan metode Maximum Likelihoodterhadap sebaran-sebaran Eksponensial, Weibull, Log-normal, Log-logistik dan Gompertz.
2 Dengan menggunakan data Survival Banten dan metode Maximum Likelihood, dilakukan pendugaan parameter terhadap sebaran Eksponensial, Weibull, Log-normal, Log-logistik dan Gompertz untuk memperoleh modelfungsi Survival Banten.
3 Untuk menguji kesesuaian data dan model dilakukan uji R2(koefisien determinasi).
HASIL DAN PEMBAHASAN
A. Pendugaan Parameter Fungsi Survival Sebaran Eksponensial
Dengan menggunakan data hipotetik yang dibangkitkan berdasarkan parameter
0,05 + RandomReal [{-0,007 , 0,007}], dilakukan pendugaan parameter terhadap sebaranEksponensial, dibantu Software Mathematica 6.0dengan menggunakan metode Maximum Likelihood. Hasil pendugaan parameter diperoleh persamaan fungsi Survival pada sebaran Eksponensial adalah S x( )e0,052x, seperti terlihat pada Gambar 1 di bawah ini.
Gambar 1 Kurva fungsi Survival sebaran Eksponensial.
B. Pendugaan Parameter Fungsi Survival Sebaran Weibull
Dengan menggunakan data hipotetik yang dibangkitkan berdasarkan parameter
1,5 + RandomReal [{-0,2 , 0,2}] dan
30 + RandomReal [{-2 , 2}], dilakukan pendugaan parameter terhadap sebaran Weibull, dibantu Software Mathematica 6.0 dengan menggunakan metode Maximum Likelihood. Hasil pendugaan parameter diperoleh persamaan fungsi Survival sebaran Weibull adalah1 1,5
( )
31,32
( )
x
S x e
, seperti terlihat pada Gambar 2 di bawah ini.
0,052
( ) x
S x e R2 0, 990
20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
_____Nilai Dugaan...Nilai Sebenarnya
Gambar 2 Kurva fungsi Survival sebaran Weibull.
C. Pendugaan Parameter Fungsi Survival Sebaran Log-normal
Dengan menggunakan data hipotetik yang dibangkitkan berdasarkan parameter
4 + RandomReal [{-0,1 , 0,1}] dan 0,2 + RandomReal [{-0,02 , 0,02}], dilakukan pendugaan parameter terhadap sebaran Log- normal, dibantu Software Mathematica 6.0 dengan menggunakan metode Maximum Likelihood. Hasil pendugaan parameter diperoleh persamaan fungsiSurvival sebaran Log-normal adalah2 2
Log[ ] 4 0,2
( 4) /(2(0,2) ) 0
( ) 1 1
0, 2 2
x
S x e t dt
,sepertiterlihat pada Gambar 3 di bawah ini.
Gambar 3 KurvafungsiSurvival sebaran Lognormal.
D. Pendugaan Parameter Fungsi SurvivalSebaran Log-logistik
Dengan menggunakan data hipotetik yang dibangkitkan berdasarkan parameter
-10 + RandomReal [{-0,4 , 0,4}] dan 3 + RandomReal [{-0,05 , 0,05}] dilakukan pendugaan parameter terhadap sebaran Log- logistik, dibantu Software Mathematica 6.0 dengan menggunakan metode Maximum Likelihood. Hasil pendugaan parameter diperoleh persamaan fungsi Survival sebaranLog-logistik S(x)=10,27 3,07
1 1 e x , seperti pada Gambar 4 di bawah ini.:
Gambar 4 Kurva fungsi Survival sebaran Log-logistik.
E. Pendugaan Parameter Fungsi Survival Sebaran Gompertz
Dengan menggunakan data hipotetik yang dibangkitkan berdasarkan parameter
-3 + RandomReal [{-0,6 , 0,6}] dan
-0,01 + RandomReal [{-0,001 , 0,001}], dilakukan pendugaan parameter terhadap sebaranGompertz, dibantu Software Mathematica 6.0 dengan menggunakan metode Maximum Likelihood. Hasil pendugaan parameter diperoleh persamaan fungsi Survival sebaran Gompertz adalah1 1,5
( )
31,32
( )
x
S x e
R2 0, 996
20 40 60 80 100 Umur x
0.2 0.4 0.6 0.8 1.0 S x
_____Nilai Dugaan...Nilai Sebenarnya
2 2
Log[ ] 4 0,2
( 4) /(2(0,2) )
0
( ) 1 1
0, 2 2
x
S x e t dt
2 0, 985 R
2 0 4 0 6 0 8 0 1 0 0
U mu rx 0 .2
0 .4 0 .6 0 .8 1 .0 S x
_____Nilai Dugaan
...
Nilai Sebenarnya narnya10,27 3,07
( ) 1 S x 1
e x
,
2 0, 992 R
20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
_____Nilai Dugaan...Nilai Sebenarnya
2,73( 1 0,003 ) 0,003
( )
e e x
S x e
, seperti terlihat pada Gambar 5 di bawah ini.
Gambar 5 Kurva fungsi Survival sebaran Gompertz.
Berdasarkan hasil pendugaan parameter dari beberapa sebaranSurvivaldi atas, pada Tabel2dapat dilihat perbedaan nilai koefisien penentu (determinasi) yang dilambangkan denganR2 masing-masing fungsi Survival.
Koefisien Penentu (Determinasi) (Agresti, Finlay 1986)
2
2 1
2 1
( ˆ)
1
( )
n
i i
i n
i i
y y R
y y
denganyi=aktual,ˆi
y = dugaan, dan y=rata-rata
Tabel 2 Perbandingan nilai R2 fungsi Survival
Eksponensial WeibullLog-normal Log- logistik Gompertz
R20,990 0,9960,985 0,992 0,748 Nilai R2dinilai baik jika mendekati 1
Berdasarkan hasil di atas dapat dinyatakan bahwa jika kita melakukan pendugaan parameter dengan menggunakan metode
Maximum Likelihood, dengan memilih sebaranyang tepat, akan diperoleh hasil dugaan yang sangat baik. Oleh karena itu hal yang paling penting dalam pemilihan model adalah memperhatikan bentuk sebaran dari data yang kita gunakan.
F. Pendugaan Parameter Fungsi Survival Banten
Dengan mengaplikasikan hasil penelitian tentang pendugaan parameter pada sebaran-sebaran di atas dengan menggunakan metode Maximum Likelihood, terhadap data Survival Banten, diperoleh model fungsi Survival Banten sebagai berikut.
1 Sebaran Weibull
Hasil pendugaan parameter pada data Survival Banten terhadap sebaran Weibull dapat dilihat pada Gambar 6.
Gambar 6 Kurva fungsi Survival Banten (kurva mulus) sebaran Weibull.
2 Sebaran Log-normal
Hasil pendugaan parameter pada data Survival Banten dengan sebaran Log-normal dapat dilihat pada Gambar 7.
2,73( 1 0,003 ) 0,003
( )
e e x
S x e
R2 0, 748
0 20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
_____Nilai Dugaan...Nilai Sebenarnya
1 4
( )
75,04
( )
x
S x e
R2 0, 958
20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
Nilai Dugaan...Nilai Sebenarnya
Gambar 7 Kurva fungsi Survival Banten (kurva mulus) sebaran Log-normal.
3 Sebaran Log-logistik
Hasil pendugaan parameter pada data Survival Banten dengan sebaran Log-logistik dapat dilihat pada pada Gambar 8.
Gambar 8 Kurva fungsi Survival Banten (kurva mulus) sebaran Log-logistik
Setelah dilakukan pendugaan parameter pada sebaran Eksponensial dan Gompertz dengan
menggunakan data Survival Banten diperoleh hasil yang tidak memuaskan karena bentuk kurva seperti terlihat pada Gambar 1 dan 5 di atas, yang sangat berbeda dengan bentuk kurva data Survival Banten.
Berdasarkan hasil pendugaan parameter dari sebaran di atas, pada Tabel 3 dapat dilihat perbedaan nilai koefisien penentu (determinasi) yang dilambangkan denganR2 masing-masing fungsi Survival Banten.
Tabel 3 Perbandingan nilai R2 fungsi Survival
Dari Tabel 3 terlihat nilai R2 yang tinggi terdapat pada fungsi Survivalsebaran
Weibull. Berdasarkan hal
tersebut fungsi Survival Banten menggunakan sebaran Weibull denganpersamaan
fungsiSurvival
1 4
( )
75,04
( )
x
S x e
.
G. Model Tabel Hayat Kontinu Rachmadani
Rachmadani (2006) telah melakukan penelitian untuk menyusun tabel hayat dengan menggunakan pendekatan kontinu dengan menganalisis data tentang laju kematian
(( )x ).Model yang diperoleh adalah
0,051
( 0,0157 0,0157)
( ) e x
S x e .
Dengan menggunakan data Survival Banten pada model Rachmadani dan model fungsi SurvivalWeibull, diperoleh nilaiR20,942untuk model Rachmadani, sedangkan untuk model fungsi Survival Weibull diperoleh nilaiR2 0,958. Nilai
R2 modelSurvival Weibull lebih besar dari model Rachmadani. Berdasarkan hal tersebut maka model fungsi Survival Weibull digunakan dalam model fungsi Survival Banten untuk menyusun tabel hayat kontinu Banten (lihat Gambar 9).
2 2
Log[ ] 4,11 0,29
( 4,11) /(2(0,29) ) 0
( ) 1 1
0, 29 2
x
S x e t dt
2 0,852 R
20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
15,03 3,58
( ) 1 S x 1
e x
2 0,870 R
20 40 60 80 100
Umur x 0.2
0.4 0.6 0.8 1.0 S x
_____Nilai Dugaan...Data Banten _____Nilai Dugaan...Data Banten
Gambar 9 Perbandingan kurva fungsi Survival model Rachmadani dan Weibull.
KESIMPULAN
1 Metode Maximum Likelihood dapat digunakan untuk melakukan pendugaan parameter dengan baik terhadap fungsi Survival bila dapat memilih sebaran yang tepat.
2 Model life tabledapat didekati dengan model kontinu, yaitu dengan menggunakan sebaran Weibull, Log- normal dan Log-logistik.
3 Berdasarkan metode Maximum Likelihood dengan menggunakan data Survival Banten, sebaran Weibull merupakan sebaran yang terbaik dibandingkan dengan ke-empat sebaran lainnya.
SARAN
Perlu dikembangkan fungsi Survival lain yang dapat lebih menggambarkan perilaku data.
DAFTAR PUSTAKA
Agresti, Finlay. 1986. Statistical Methods for the Social Sciences. Ed. Ke-2.
California. D. ellen Publishing Company.
Lee ET. 1992. Statistical Methods for Survival Data Analysis. Ed Ke-2.
New York: A Wiley Interscience Publication.
Pollard AH, Yusuf Farhat, Pollard G N.1982.
Teknik Demografi. Munir Rozy,
Budiarto, penerjemah, Jakarta: Bina Aksara. Terjemahan dari:
Demographic Techniques.
Rachmadani, N. 2006. Penyusunan Tabel Hayat. Skripsi.Departemen Matematika FMIPA-IPB.
Serfling, Robert J. 1980. Approximation Theorems of Mathematical Statistics.
John Wiley and Sons.