JMA, VOL. 8, NO.1, JULI, 2009, 57 - 66 57
57
PENDUGAAN PARAMETER DERET WAKTU
HIDDEN
MARKOV DUA WAKTU SEBELUMNYA
B. SETIAWATY DAN S. F. NIKMAH
Departemen Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Jl Meranti, Kampus IPB Darmaga, Bogor 16680 Indonesia
Abstrak: Pendugaan parameter deret waktu Hidden Markov dua waktu sebelumnya dilakukan mengunakan Metode Maximum Likelihood dan pendugaan ulang menggunakan metode Expectation Maximization. Dari kajian ini diperoleh algoritma untuk menduga parameter model.
Kata kunci: Rantai Markov, Hidden Markov, Deret waktu Hidden Markov, Metode Expectation Maximization.
1. PENDAHULUAN
Tulisan ini merupakan kajian tentang pendugaan parameter untuk deret waktu Hidden Markov dua waktu sebelumnya. Pendugaan parameter menggunakan metode Maximum Likelihood dan pendugaan ulangnya menggunakan metode Expectatition Maximization (Metode EM). Dari kedua metode tersebut kemudian diturunkan suatu algoritma yang dapat dipakai secara umum untuk menduga parameter model deret waktu Hidden Markov dua waktu sebelumnya. Tulisan ini dimulai dengan definisi model deret waktu Hidden Markov dua waktu sebelumnya beserta sifat-sifatnya. Pada bagian 3 dibahas Pendugaan Parameter model dan terakhir pada bagian 4 dibahas pendugaan ulang parameter dan algoritmanya.
2. MODEL DERET WAKTU HIDDEN MARKOV
DUA WAKTU SEBELUMNYA
Pasangan proses stokastik { (X Yk ,k k) : yang terdefinisi pada ruang peluang ( , , ) F P dan mempunyai nilai pada SY disebut model hidden
58 B. SETIAWATY DAN S. F. NIKMAH
Markov apabila {Xk} adalah rantai Markov dengan state berhingga dan diasumsikan bahwa rantai Markov {Xk} tidak diamati. Sehingga {Xk}
tersembunyi (hidden) di balik proses observasi
Yk . Banyaknya elemen dari Sdisebut ukuran (orde) dari model hidden Markov.
Pada bagian ini dibahas model hidden Markov yang merupakan deret waktu yang mempertimbangkan dua waktu sebelumnya dan berbentuk:
* * * 1 2 1 1 2 2 t t t t X t X t X t Y Y Y (2.1) di mana: { }t adalah barisan peubah acak yang saling bebas dan menyebar normal
N(0, 2).
{ }Yt adalah proses yang diamati dan bernilai skalar
*t
X adalah rantai Markov dengan ruang state S*
1, 2 dan* * * 11 12 * * 21 22 p p P p p
merupakan matriks peluang transisinya, dengan
* * * 1 ( | ) ji t t p P X j X i * * * ( ) , t t t X X X
, dengan .,. menyatakan hasil kali dalam di
N
R .
1, , dan adalah konstanta real2 1 2 .
Perhatikan bahwa model ini dicirikan oleh parameter
2
1, 2, , ,1 2 .
Dengan menggunakan metode EM akan diduga parameter
2
1, 2, , ,1 2
dari data Y.
Dalam kasus ini Yt tidak hanya bergantung pada
*
t
X tetapi juga bergantung pada Xt*1 dan
* 2
t
X sehingga agar tetap memenuhi sifat Markov perlu didefinisikan proses baru Xt di mana
* * * 1 2 * * * 1 2 * * * 1 2 * * * 1 2 * * * 1 2 * 1, jika 1, 1 dan 1 2, jika 1, 2 dan 1 3, jika 2, 1 dan 1 4, jika 2, 2 dan 1 5, jika 1, 1 dan 2 6, jika t t t t t t t t t t t t t t t t t t t t t t X X X X X X X X X X X X X X X X X X X X X X * * 1 2 * * * 1 2 * * * 1 2 1, 2 dan 2 7, jika 2, 1 dan 2 8, jika 2, 2 dan 2. t t t t t t t t t t X X X X X X X X X X (2.2) Lemma 2.1:
JMA, VOL. 8, NO.1, JULI, 2009, 57 - 66 59
59
Xt merupakan rantai Markov dengan ruang stateS
1, 2,3, 4,5,6,7,8
danmatriks peluang transisi P sebagai berikut.
* * 11 11 * * 12 12 * * 21 21 * * 22 22 * * 11 11 * * 12 12 * * 21 21 * * 22 22 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (2.3) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 p p p p p p p p P p p p p p p p p
Bukti: Lihat Setiawaty (2007)
Selanjutnya karena t~
2
0,
N bebas stokastik identik maka dapat diperoleh fungsi sebaran bagi t sebagai berikut.
2
2
22 0 0 0 1 1 exp exp 2 2 2 2 t t t y y t t t t t t t F y P y d d
. (2.4) Berdasarkan persamaan (2.4) diperoleh fungsi sebaran bagi Yt
*
* * 1 2 * * * 1 2 1 1 2 2 1 1 2 2 . Xt Xt Xt Xt Xt Xt Yt t t t t t t t t t t F y P Y y P Y Y y P y Y Y t Misalkan
*
*
*
1 2 1 1 2 2 t t t t X t X t X v y Y Y maka
22 0 1 exp 2 2
t v t t t Y F y d dan
*
*
*
1 2 2 2 2 1 1 2 2 2 1 exp 2 2 1 exp 2 2 . t t t t t Y t Y t t t t X t X t X v v f y F y y y y Y Y (2.5)60 B. SETIAWATY DAN S. F. NIKMAH
Misalkan
Yt adalah medan- yang dibangun oleh
Y Y0, ,...,1 Yt
. Karena
Xtmerupakan rantai Markov 8-state maka terdapat 8 fungsi kerapatan peluang bagi
Yt . Kumpulan fungsi kerapatan peluang tersebut dilambangkan dengant . ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
(
1 1 1 1 2 2 1)
2 2 1 1 1 1 1 1 1 1 1 exp 2 | 1, ; | 2, ; | 3, ; | 4, ; | 5, ; | 6, ; | 7, ; | 8, ; 2 t t t t t t t t t t t t t t t t t t t t t t t t t t t t y Y Y f y X f y X f y X f y X f y X f y X f y X f y X Y Y Y Y Y Y Y Y m f m f m s p q q q q h q q q q s - -- - - -= = = = = = = = = ìï -ï í é ù ê ú ê ú ê ú ê ú ê ú ê ú ê ú= = ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ë û ( ) ( ) ( )(
)
( ) ( ) ( )(
)
( ) ( ) ( )(
)
( ) 2 1 1 1 2 2 2 1 2 2 2 1 1 1 2 2 1 2 2 2 1 1 2 2 2 1 2 1 1 1 1 exp 2 2 1 exp 2 2 1 exp 2 1 exp 2 2 t t t t t t t t t t t y Y Y y Y Y y Y Y y Y m f m f m s p s m f m f m s p s m f m f m s p m f s p s - -- -- -- - - - -- - - - -- - - - -- - -üïï ï ïý ï ï ï ï ï ï î þ ì ü ï ï ï ï ï- ï í ý ï ï ï ï ï ï î þ ì ü ï ï ï ï ï ï í ý ï ï ï ï ï ï î þ ì ü ï ï ï ï ï ï í ý ï ï ï ï ï ï î þ ( ) ( )(
)
( ) ( ) ( )(
)
( ) ( ) ( )(
)
( ) ( ) ( )(
)
2 1 2 2 2 2 2 1 1 1 2 2 2 2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 2 2 2 2 2 2 1 exp 2 2 1 exp 2 1 exp 2 2 2 t t t t t t t t t t Y y Y Y y Y Y y Y Y m f m s m f m f m s p s m f m f m s p m f m f m s p s s -- -- -- -- - - - -- - - - -- - - -é ì ü ï - ï ï ï ï ï í ý ï ï ï ï ï ï î þ ì ü ï ï ï ï ï ï í ý ï ï ï ï ï ï î þ ì ü ï ï ï ï ï ï í ý ï ï ï ï ï ï î þ ì ü ï - ï ï ï ï ï í ý ï ï ï ï ï ï î þ ù ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ê ú ë û (2.6) Misalkan ˆt t| 1 melambangkan vektor
8 1
di mana elemen ke-j pada vektormerepresentasikan P X
t j|Yt1;
dan me-lambangkan perkalian elemenper elemen, maka
1 1 1 1 1 1 1 1 | 1 1 1 1 1 1 ; 1 ; 2 ; 2 ; 3 ; 3 ; 4 ; 4 ; ˆ 5 ; 6 ; 7 ; 8 ; | | , | | , | | , | | , | | | | | t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t P f y P f y P f y P f y P f y P P P X X X X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y
1 1 1 1 5 ; 6 ; 7 ; 8 ; . (2.7) , | , | , | , t t t t t t t t t t f y f y f y X X X Y Y Y YJMA, VOL. 8, NO.1, JULI, 2009, 57 - 66 61 61 Misalkan 1
1,1,1,1,1,1,1,1
, maka
1 | 1 2 1 1 1 1 2 2 1 1 2 2 1 1 1 2 2 2 1 1 2 2 2 1 1 1 2 2 1 1 2 ˆ | ; 1 1 | ; . exp 2 2 1 2 | ; . exp 2 2 1 3 | ; . exp 2 2 t t t t t t t t t t t t t t t t t t t t f y y Y Y P y Y Y P y Y Y P X X X 1 Y Y Y
2 2 1 1 2 2 2 1 1 2 1 1 1 1 2 2 2 1 2 2 1 1 1 2 2 2 1 2 1 4 | ; . exp 2 2 2 1 5 | ; . exp 2 2 1 2 6 | ; . exp 2 2 7 | t t t t t t t t t t t t t t t t t y Y Y P y Y Y P y Y Y P P X X X X Y Y Y Y
2 2 1 1 1 2 2 2 1 2 2 2 1 1 2 2 2 2 1 2 1 ; . exp 2 2 1 8 | ; . exp 2 2 . t t t t t t t t y Y Y y Y Y P X Y (2.8) Salah satu pendekatan yang dapat digunakan untuk memilih nilai awal bagi ˆtt1adalah dengan membuat 1 0 sama dengan vektor dari peluang tak bersyarat
i yang memenuhi sifat ergodic, yaitu P dan
8 1 1 i i
. Perhatikan bahwa 1 1 ( , | , ) ( | , ) ( | , ) t t t t t t t P y X j P X j f y Y Y Y sehingga
| 1
| | 1 ˆ ˆ ˆ 1 t t t t t t t t , selain itu 1| | ˆ ˆ t t P t t dan ˆ | ˆ| m t m t P t t . 3. PENDUGAAN PARAMETERPenduga ˆ diperoleh dengan memaksimumkan fungsi log likelihood
1
1 log ; T t t t f y
L Y .62 B. SETIAWATY DAN S. F. NIKMAH
Dengan membuat turunan pertama dari fungsi log likelihood terhadap parameter
sama dengan nol maka berdasarkan persamaan 2.8 diperoleh penduga parameter ˆ sebagai berikut.
1 2 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 1 2 1 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ T T t t Apz Ap Br Cs D Eq F G B rz r C sz s D z q E qz q F z s G z r
(3.1)
2 1 1 1 2 2 2 2 2 2 2 1 2 2 1 2 1 2 2 1 1 1 1 ˆ 1 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ T T t t B z r B C Dq E Fs Gr H p C z s D qz q E z q F sz s G rz r H pz (3.2)
1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 ˆ T T t t A ac ce Ac Bd Cc Dd Ec Fd Gc H d B ad de C bc ce D bd de E ac cf F ad df G bc cf H bd df (3.3)
2 1 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 ˆ T T t t A ae ce Ae Be Ce De Ef Ff Gf H f B ae de C be ce D be de E af cf F af df G bf cf H bf df (3.4)
2 2 2 1 2 1 2 2 2 2 1 2 2 2 2 1 2 1 2 1 2 2 2 1 2 1 2 1 ˆ T T t t A a c e B a d e A B C D E F G H b d fC b
c
e
D b
d
e
E a
c
f
F a
d
f
G b
c
f
H
(3.5) dengan:
t ˆ1
,
t ˆ2
,
t 1 ˆ1
a y b y c y
t 1 ˆ2
,
t 2 ˆ1
,
t 2 ˆ2
d y e y f y JMA, VOL. 8, NO.1, JULI, 2009, 57 - 66 63 63
1 ˆ ˆ1 2
,
1 ˆ2 ,
1 ˆ1 p r q
ˆ ˆ1 2
,
t ˆ1 t 1 ˆ2 t 2
s z y y y
1
1
1 1 ˆ ˆ 1| ; | 1, ; ˆ | ; t t t t t t t A P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 2 | ; | 2, ; ˆ | ; t t t t t t t B f y X f y P X Y Y Y
1
1
1 1 ˆ ˆ 3 | ; | 3, ; ˆ | ; t t t t t t t C P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 4 | ; | 4, ; ˆ | ; t t t t t t t D P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 5 | ; | 5, ; ˆ | ; t t t t t t t E P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 6 | ; | 6, ; ˆ | ; t t t t t t t F P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 7 | ; | 7, ; ˆ | ; t t t t t t t G P f y X f y X Y Y Y
1
1
1 1 ˆ ˆ 8 | ; | 8, ; ˆ | ; t t t t t . t t H P f y X f y X Y Y Y Untuk menduga parameter P digunakan formula (3.6) berikut yang diperolehdari Hamilton (1990).
1 2 1 2 ˆ , | ; ˆ ˆ | ; T t t T t ij T t T t P X j X i p P X i
Y Y (3.6) di mana menurut Kim (1994)
1 -1 -1 -1 -1 -1 | ˆ , | ; ˆ ˆ | ; | , ; ˆ ˆ | ; | , ; ˆ ˆ | ; , | ; ˆ | ; ˆ ˆ | ; | ; | ˆ | ; ˆ t t T t T t t T t T t t T t T t t T t T t T t T t t t T t P X j X i P X j P X i X j P X j P X i X j P X j P X i X j P X j P X j P X i P X j X i P X j Y Y Y Y Y Y Y Y Y Y Y ( ) ( ) 1| ( ) | ˆ . ˆ j i T t T ji j t T a (3.7) dan
( ) ( ) 4 4 | 1| 1 1 ( ) 1 1 | ˆ ˆ ˆ ˆ | ; , | ; . ˆ j i t T t T ji t T t t T j j j t T a P X i P X j X i Y
Y
64 B. SETIAWATY DAN S. F. NIKMAH
4. PENDUGAAN ULANG PARAMETER DAN ALGORITMA
Karena persamaan (3.1) sampai (3.7) tak linear, maka tidak mungkin untuk memperoleh ˆ secara analitik sebagai fungsi dari
Y1,Y2,Y3,,YT
. Sehinggauntuk mencari penduga kemungkinan maksimum digunakan algoritma iteratif dari metode EM.
4.1 Metode Expectation Maximization (Metode EM): Algoritma EM
dikembangkan oleh Baum and Petrie (1966) dengan ide dasar sebagai berikut. Misalkan
P:
adalah koleksi ukuran peluang yang terdefinisi pada ruang( , )G dan kontinu absolut terhadap P0. Misalkan YG. Definisikan fungsi likelihood untuk menentukan penduga parameter berdasarkan informasi Y sebagai 0 0 ( ) dP L E dP Y
dan penduga maksimum likelihood didefinisikan sebagai ˆ arg max ( )L
.
Secara umum penduga maksimum likelihood ˆ sulit dihitung secara langsung. Algoritma EM memberikan suatu metode iteratif untuk mengaproksimasi ˆ, dengan prosedur sebagai berikut.
Langkah 1: Set p0 dan pilih ˆ0.
Langkah 2: [Langkah-E]
Set ˆp
dan hitung Q
,
E log dPdP Y . Langkah 3: [Langkah-M]
Tentukan ˆp 1 arg maxQ
,
. Langkah 4: p p 1Ulangi langkah 2 sampai kriteria berhenti dipenuhi.
Catatan:
1. Barisan
ˆp:p0
memberikan barisan
L
ˆp :p0
yang tak turun.2. Menurut ketaksamaan Jensen,
ˆp1, ˆp
log (ˆp 1) log (ˆp)Q L L .
JMA, VOL. 8, NO.1, JULI, 2009, 57 - 66 65
65
4.2 Pendugaan ulang parameter menggunakan metode EM: Dengan
menggunakan meode EM diperoleh algoritma untuk menduga ulang parameter model. Algoritma tersebut sebagai berikut.
Langkah 1:
Tentukan banyaknya data T yang akan diamati serta tentukan juga nilai
y y y0, ,1 2, ,yT dan matriks transisi P.
Beri nilai awal bagi ˆ yang dilambangkan dengan (0)
2
1 2 1 2 ˆ ˆ ˆ, , , ,ˆ ˆ ˆ .
Set k = 1
Langkah 2:
Tentukan fungsi kerapatan bersyarat bagi yt, yaitu t seperti pada persamaan 2.8, untuk setiap t1, 2, ,k
Langkah 3:
Penarikan kesimpulan optimal dan peramalan untuk setiap waktu t pada contoh dapat diperoleh melalui iterasi:
3.1. Tentukan nilai awal ˆ1 0
3.2. Beri nilai awal i1
3.3. Untuk ti, cari nilai dari
1;ˆ
ˆ 1 m t t t t t f y Y 1
11
ˆ ˆ ˆ t t t t t t t t 1 1 ˆ ˆ t t P t t 1 i i3.4. Ulangi mulai dari langkah (3.3)
Stop jika t k.
Langkah 4:
Tentukan nilai dari 2 1 2 ˆ ˆ1 21
ˆ ˆ, , , ,ˆ
yang ditentukan oleh persamaan 3.1 s/d 3.5.
Langkah 5:
Beri nama parameter yang dihasilkan pada langkah 4 dengan ( 1)
2
1 2 1 2ˆk ˆ ˆ, , , ,ˆ ˆ ˆ
c c
Langkah 6:
Cari Pyang baru menggunakan hasil Kim, C.J (1994) dan Hamilton, J. D. (1994), yaitu:
( ) ( ) ( ) ( ) | | 1| 1| ˆ j ˆ j . ˆ j ( )ˆ j t T t t P t T t t 66 B. SETIAWATY DAN S. F. NIKMAH | 1| 1 2 | 2 | 1| 1 2 1 | ˆ ˆ ˆ ˆ ˆ ˆ ˆ j i T t T t t ij j t t t ij T j i t T t t ij j t j t t p p p
Langkah 7:Gunakan parameter yang sudah dihasilkan untuk menentukan dugaan bagi Yˆk 1 ˆ | , ; k k k E Y X j Y
*
*
* 1 2 1 1 2 2 ˆ ˆ ˆ ˆ ˆ k k k y yk X k X X
1 | 1 1 1 1 ˆ ˆ ˆ ˆ ˆ | ; . | ; N . | , ; k k k k k k k k k k k j k Y E Y y f y dy E Y X j Y
Y
Y .jika kT , k = k + 1, ulangi langkah 2.
DAFTAR PUSTAKA
[1]. Baum, L.E. and Petrie, T. 1966. Statistical inference for probabilistic functions of finite state Markov chains. Annals of the Institute of Statistical Mathematics, 37:1554-1563. [2]. Hamilton, J. D. 1990. Analysis of Time Series Subject to Changes in Regime. Journal of
Econometrics, 45: 39 -70.
[3]. Hamilton, J. D. 1994. Time Series Analysis. Princeton University Press, New Jersey. [4]. Kim, C. J. 1994. Dynamic linear models with Markov-Swiching. Journal of
Econometrics,60: 1- 22.
[5]. Setiawaty, B. 2007. Laporan Hibah Penelitian PHK A2, Departemen Matematika FMIPA IPB.