3 Metode Parametrik
3.2 Beberapa distribusi parametrik
3.2.6 Distribusi Log-logistik
Seperti halnya log-normal, nama log-logistik diberikan karena log(T ) berdistri-busi logistik. Distriberdistri-busi logistik sendiri mempunyai fungsi densitas
f (y) = exp[(y − µ)/σ]
σ(1 + exp[(y − µ)/σ])2 (3.18)
dengan−∞ < y < ∞ adalah variabel random logistik dengan parameter −∞ < µ < ∞ dan −∞ < σ < ∞.
Fungsi Survival distribusi log-logistik adalah
S(t) = 1
1 + (λt)α (3.19)
Fungsi hazard distribusi ini dapat diturunkan mulai dari fungsi kumulatif hazard-nya H(t) = − log[S(t)] = log((1 + (λt)α) (3.20) kemudian diperoleh h(t) = dH(t)/dt = λα(λt) α−1 1 + (λt)α . (3.21)
Fungsi densitas log-logistik
f (t) = S(t)h(t) = λα(λt) α−1 1 + (λt)α 1 1 + (λt)α (3.22) = λα(λt) α−1 [1 + (λt)α]2 (3.23)
Distribusi ini memiliki S(t), h(t) dan f (t) yang eksplisit relatif sederhana dibandingkan dengan, misalnya, log-normal.
3.3 Estimasi parameter
Estimasi parameter suatu model survival parametrik dapat dilakukan dengan me-tode Estimasi Kebolehjadian Maksimum (Maximum Likelihood Estimation).
3.3. Estimasi parameter 29
Definisi 3.1
Fungsi kebolehjadian (likelihood function) adalah fungsi dari parameter yang di-bentuk melalui probabilitas bersama dengan diberikan realisasi atau data yang berasal dari variabel random survival T . Apabila f (t; θ) adalah fungsi
proba-bilitas bersama, dengant adalah realisasi dari T , maka fungsi dari parameter θ
yang didefinisikan sebagai
L(θ | t) = f(t; θ)
dinamakan fungsi kebolehjadian.
Untuk data survival yang diasumsikan independen dan identik serta lengkap, apabila adat1, t2, . . . , tnobservasi, fungsi kebolehjadian-nya adalah
L(θ | t) = n Y
i=1
f (ti; θ) (3.24)
Untuk data survival yang tidak lengkap, baik karena tersensor maupun terpotong, fungsi kebolehjadian ditentukan sebagaimana berikut ini.
Data survival dengan kemungkinan tersensor kanan dapat direpresentasikan sebagai pasangan nilai observasi survival dengan status tersensornya yaitu(ti, δi), i = 1, 2, . . . , n dengan
δi = (
0 jika i tersensor
1 jika i mendapatkan kejadian (event) (3.25) Dengan asumsi masing-masing (Ti, δi) independen satu dengan yang lain, fungsi likelihood untuk data tersensor kanan adalah:
L(θ) ∝ n Y
i=1
f (ti; θ)δiS(ti; θ)1−δi (3.26)
dengan θ = (θ1, . . . , θp) adalah p parameter yang akan diestimasi; f (ti; θ) adalah fungsi densitas untuk i yang mendapatkan kejadian dan S(ti; θ) adalah fungsi survival untuki yang tidak mendapatkan kejadian.
Fungsi log-likelihood untuk data tersensor kanan dari fungsi kebolehjadian (3.26) adalah ℓ(θ) ∝ n X i=1 (δi) log(f (ti; θ)) + n X i=1 (1 − δi) log(S(ti; θ)) (3.27)
Untuk data yang mungkin memuat observasi lengkap, tersensor-kanan pada titik waktu R dan terpotong-kiri pada titik waktu L, fungsi probabilitas maupun
3.3. Estimasi parameter 30
fungsi survival pembentuk (3.26) kondisional terhadap probabilitas survive sam-pai ke L, karena untuk observasi yang terpotong-kiri hanya terjadi bila t ≥ L (Lihat Definisi 1.2, Bab 1) Untuk data yang tersensor-kanan tipe I, variabel indi-katorδ ditentukan sebagai berikut
δi = (
0 jika ti > R
1 jika ti ≤ R (3.28)
atau ditulis dengan fungsi indikator,δi = I(ti ≤ R). Fungsi kebolehjadian-nya adalah
L(θ) ∝ n Y i=1 f (ti; θ) S(L) δi S(ti; θ) S(L) 1−δi (3.29)
Dengan cara yang sama fungsi kebolehjadian untuk observasi yang merupak-an kombinasi dari terpotong-kiri, tersensor-kmerupak-anmerupak-an, terpotong-kmerupak-anmerupak-an, tersensor-kiri dan observasi yang lengkap dapat disusun.
Untuk mendapatkan estimasi dari θ dapat digunakan metode kebolehjadian maksimum (MLE: Maximum Likelihood Estimation).
Definisi 3.2
Estimasi kebolehjadian Maksimum θ, ditulis ˆθ adalah (ˆθ1, . . . , ˆθp) yang
memak-simumkanL(θ):
Ł(ˆθ) = max
θ L(θ) (3.30)
Pengerjaan terkait derivatif lebih mudah dilakukan pada log(L(θ)) atau log-likehood, dinotasikan dengan ℓ(θ), dibandingkan pada L(θ). Karena fungsi log merupakan fungsi yang naik tegas (strictly increasing), maka ˆθ yang memaksi-mumkanℓ(θ) juga memaksimumkan L(θ), sehingga estimasi kebolehjadian mak-simum dapat diperoleh dari
ℓ(ˆθ) = max
θ ℓ(θ) (3.31)
Untuk mendapatkan MLE ˆθ perlu dihitung terlebih dahulu titik kritis dari ℓ(ˆθ) melalui penyelesaian
∂ℓ(θ) ∂θj
= 0, j = 1, 2, . . . , p (3.32)
Apabila dapat diperoleh penyelesaian dari (3.32), perlu diperiksa apakah ˆθ me-mang memaksimalkanℓ(θ).
Untuk permasalahan yang tidak dapat diselesaikan secara analitis, metode nu-merik seperti misalnya metode Newton-Rhapson dapat digunakan untuk mencari ˆ
3.3. Estimasi parameter 31
Contoh 3.3
Carilah estimator untuk parameterλ pada model survival eksponensial yang datanya dapat
terkena sensor-kanan.
Jawab:
Fungsi kebolehjadian untuk parameterλ dengan diketahui data berdistribusi eksponensial
adalah: L(λ) = n Y i=1 (λ exp(−λti))δi (exp(−λti))1−δi = n Y i=1 λδi exp(−λti)
sehingga fungsi log-likelihood nya adalah
ℓ(λ) = log λ n X i=1 δi− λ n X i=1 ti
Untuk data yang tersensor kanan,Pni=1δi = k, dengan k adalah banyaknya data yang
lengkap. Untuk data survival yang lengkapk = n
Kemudian dicari titik kritisℓ(λ) melalui ∂ℓ(λ)/∂λ = 0, ∂ℓ(λ)
∂λ =
∂ (k log λ − λPni=1ti) ∂λ = k λ− n X i=1 ti. Penyelesaian dari k λ− n X i=1 ti = 0 adalah ˆ λ = Pnk i=1ti.
yang merupakan MLE dariλ
Pada contoh 3.3 telah diperoleh estimator titik dari parameterλ, bila diberikan data survival berdistribusi eksponensial. Inferensi lebih lanjut dapat dilakukan dengan menghitung interval konfidensi100(1 − α)% berdasarkan statistik 2kˆλ/λ yang berdistribusi chi-square dengan derajad bebas 2k. Rumus ini berlaku baik untuk data lengkap maupun data yang memuat observasi tersensor-kanan.
3.3. Estimasi parameter 32
Contoh 3.4
Diketahui waktu remisi (minggu) dari 21 pasien leukemia akut sebagai berikut: 1, 1, 2, 2, 3, 4, 4, 5, 5, 6, 8, 8, 9,10, 10, 12, 14, 16, 20, 24, 34
Hitung interval konfidensi 95% untukλ dari data di atas, dengan asumsi data berdistribusi
eksponensial.
Jawab: Dihitung terlebih dahulu estimasiλ. Karena data di atas lengkap, k = n ˆ
λ = Pnn i=1ti
= 21
198 = 0,1060606
Interval konfidensi 95% untukλ ˆ λχ22n,α/2 2n < λ < ˆ λχ22n,1−α/2 2n 0, 106 × 25, 999 42 < λ < 0, 106 × 62, 777 42 0, 066 < λ < 0, 156 Contoh 3.5
Dalam suatu penelitian 10 tikus percobaan terpapar (exposed) ke suatu jenis penyakit kanker. Setelah 5 tikus mati percobaan dihentikan diperoleh data lama hidup tikus sbb: 4, 5, 8, 9, 10, 10+, 10+, 10+, 10+, 10+. (tanda + menunjukkan tersensor-kanan). Hitung interval konfidensi 95% untukλ, bila diasumsikan data berdistribusi eksponensial.
Jawab:
Estimasi untukλ dalam hal ini adalah untuk data tersensor-kanan, ˆ
λ = Pnk i=1ti
= 5
86 = 0,05814
Nilai estimasi ini menghasilkan nilai log-likelihoodℓ(0,05814) = −19,22455.
Gam-bar fungsi log=likehood ini dapat dilihat pada GamGam-bar 3.9. Garis tegak putus-putus me-nunjukkan nilai MLE dan log-likelihood maksimalnya.
Interval konfidensi 95% untukλ ˆ λχ22k,α/2 2k < λ < ˆ λχ22k,1−α/2 2k 0,05814 × 3,246973 10 < λ < 0,05814 × 20,48318 10 0,0189 < λ < 0,1191
3.4. Latihan Bab 3 33 0.00 0.05 0.10 0.15 0.20 0.25 0.30 −32 −30 −28 −26 −24 −22 −20 λ log−lik elihood
Gambar 3.9: Nilai MLE dan log-likelihood pada Contoh 3.5.
3.4 Latihan Bab 3
3.1. Tahan hidup suatu jenis lampu pijar diketahui berdistribusi eksponensial dengan hazard 0,001 kerusakan per jam penggunaan
(a) Hitung mean tahan hidup lampu pijar tersebut! (b) Hitung median tahan hidup lampu pijar tersebut!
(c) Berapa probabilitas lampu pijar tersebut masih hidup setelah 2.000 jam penggunaan?
3.2. Lama (dalam satuan hari) berkembangnya tumor pada populasi tikus per-cobaan yang terpapar (exposed) oleh suatu zat penyebab kanker diketahui berdistribusi Weibull denganα = 2 dan λ =0,001
(a) Hitung probabilitas seekor tikus yang telah terpapar belum terkena tu-mor pada hari ke 30
(b) Hitung mean lama hari sampai terkena tumor (Γ(0,5) =√ π) (c) Hitung hazard rate pada hari ke 30
(d) Hitung median lama hari sampai terkena tumor
3.3. Distribusi Eksponensial dua parameter, biasa digunakan dalam permasalah-an garpermasalah-ansi, mempunyai densitas
f (t) = (
λ exp(−λ(t − G)) t ≥ G
3.4. Latihan Bab 3 34
denganG adalah waktu garansi.
(a) Carilah fungsi Survival dan fungsi hazard nya (b) Carilah mean dan median nya
3.4. Lihat kembali pada matakuliah Pengantar Statistika Matematika. Tunjuk-kanlah bahwa bila ˆλ = n/P ti dengan ti berdistribusi eksponensial dan independen, maka statistik2nˆλ/λ akan berdistribusi chi-square dengan de-rajad bebas2n!
3.5. Diketahui data antar kejadian sebagai berikut:3, 4, 4, 8, 8+, 9+, 10, 12+, 18, dengan ”+” menunjukkan data tersensor kanan.
(a) Dengan menganggap data berdistribusi eksponensial dengan fungsi hazardh(t) = λ, estimasilah parameter λ
(b) Gambarlah fungsi Survival dengan menggunakan hasil estimasiλ (c) Hitung median survival time-nya
3.6. Merujuk pada Soal 1.4, Bab 1:
(a) Dengan mengasumsikan lama hidup berdistribusi eksponensial, hi-tunglah estimasi fungsi hazard dari masing-masing kelompok yaitu AG positive (notasikan denganh1(t)) dan AG negative (notasikan de-nganh2(t));
(b) Buatlah sket grafik fungsi survival untuk AG positive maupun AG
ne-gative pada satu gambar dengan skala yang sama. Interpretasikan
ha-silnya.
3.7. Carilah median distribusi Gompertz!
3.8. Tunjukkanlah, apabila T berdistribusi Weibull, maka Y = log(T ) yang terpotong-kiri padaT > 0 akan berdistribusi Gompertz!