APLIKASINYA PADA DNA
N U R M A I L Y
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
Dengan ini saya menyatakan bahwa tesis dengan judul “Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA” adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
NURMAILY.
The Study of Discrete Hidden Markov Model and Its Application on
DNA Sequence. Under supervision of
BERLIAN SETIAWATY
and
N. K.
KUTHA ARDANA.
A discrete hidden Markov model is a model which consists of the cause of event and
observation process. This model assumes that the cause of event is a Markov chain,
which is not observed directly. The observation process has discrete range.
Parameters of this model are transition probability matrices. They are estimated using
the maximum likelihood method and expectation maximization algorithm. The
estimation procedure involves the change of measure. The estimation of parameters
uses Mathematica 7.0, a functional programming based on algebraic computer
systems. The model is applied to the DNA
sequence. The estimated parameters are
used to calculate the expectation of DNA sequence. The result depends on the
decision of the initial value. There should be another study for determining the initial
value which gives the optimal result.
NURMAILY.
Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA. Di
bawah bimbingan
BERLIAN SETIAWATY
dan
N.K. KUTHA ARDANA.
Setiap kejadian berkaitan erat dengan penyebab kejadian. Jika penyebab kejadian
tersebut tidak diamati secara langsung dan membentuk rantai Markov, maka
pasangan kejadian dan penyebabnya dapat dimodelkan dengan model Hidden
Markov (Hidden Markov Model, HMM).
Semua proses didefinisikan pada ruang peluang
Ω
, ,
. Misalkan
;
adalah rantai Markov dengan state berhingga yang bersifat homogen dan diasumsikan
tidak diamati secara langsung, sedangkan
;
adalah proses
observasinya. Pasangan proses stokastik
,
merupakan model Hidden
Markov.
Model
Hidden
Markov (Elliot et al. 1995) yang digunakan pada karya ilmiah ini
adalah
+
Y CX W , untuk
di mana
, , … ,
,
, , ,
,
A
dan
C
merupakan
matriks peluang transisi dengan
dan
,
yang
memenuhi
∑ 1, , dan ∑ 1, .dan
memenuhi
| , |
| diag diag
diag diag .
Jika
, maka vektor
, , … ,
merupakan nilai harapan
dari
, yaitu
dan untuk
ergodic memenuhi
dan
∑
1
.
Parameter yang digunakan pada model di atas adalah
, 1
,
,
, 1
, 1
.
Akan ditentukan parameter baru dengan menggunakan algoritme EM
, 1
,
, ̂
, 1
, 1
,
∑
,
,
∑
,,
.
2.
Pendugaan Banyaknya Lompatan
=
,
,
,
Penduga banyaknya lompatan adalah
, 1
∑
,,
,
.
Penduga smoother banyaknya lompatan adalah
,
∑
,,
.
3.
Pendugaan Lamanya Waktu Kejadian
,
Penduga lamanya waktu kejadian adalah
, ∑ , , , .
Penduga smoother lamanya waktu kejadian adalah
, ∑ , , .
4.
Pendugaan untuk Proses Observasi
∑
,
,
,
,
.
Penduga untuk proses observasi adala
,
∑
,,
,
,
.
Penduga smoother untuk proses observasi adalah
,
∑
,,
.
Dari pendugaan rekursif dapat ditentukan parameter model sebagai berikut
,
1
,
.
̂
,
1
, 1
.
Nilai Harapan
adalah
|
∑ ∑
1 1 .
Model Hidden Markov diskret di atas diaplikasikan pada perubahan urutan basa DNA
pada spesies
Aspergillus niger
, dengan
N = 2. Dalam perkembangan lebih lanjut,
dibuat suatu program komputasi yang berbasis pemprograman fungsional untuk
menyelesaikan masalah tersebut. Software yang digunakan adalah Mathematica 7.0.
Hasil yang di peroleh pada penelitian ini sangat bergantung pada penentuan nilai
awal. Sampai saat ini hasil yang diperoleh belum cukup baik, karena belum
ditemukan cara untuk menentukan nilai awal yang paling baik sehingga hasil yang
diperoleh optimal.
© Hak Cipta milik IPB, tahun 2009 Hak Cipta dilindungi Undang-Undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
APLIKASINYA PADA DNA
N U R M A I L Y
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Matematika Terapan
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2009
Disetujui Komisi Pembimbing
Dr. Berlian Setiawaty, M.S. Ir. N. K. Kutha Ardana, M.Sc. Ketua Anggota
Diketahui
Ketua Program Studi Dekan Sekolah Pascasarjana Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S. Prof, Dr. Ir. Khairil A. Notodiputro, M.S.
Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat dan karunia-Nya sehingga tugas akhir yang berjudul “Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA” ini bisa terselesaikan sebagai salah satu syarat untuk menyelesaikan pendidikan pada Program Studi Matematika, Sekolah Pascasarjana Institut Pertanian Bogor.
Terimakasih yang mendalam penulis sampaikan kepada:
1. Dr. Berlian Setiawaty, M.S. dan Ir. N. K. Kutha Ardana, M.Sc. selaku pembimbing yang telah memberikan bimbingan dan motivasinya.
2. Dr. Ir. Wayan Mangku, M.Sc. selaku penguji yang telah memberikan saran dan kritiknya.
3. Departemen Agama Republik Indonesia yang telah memberikan beasiswa kepada penulis selama menempuh pendidikan di IPB.
4. Seluruh keluarga atas segala dukungan, doa dan kasih sayangnya.
5. Mahasiswa S2 Matematika Terapan IPB angkatan 2007, serta semua pihak yang telah membantu penulis.
Penulis menyadari bahwa tugas akhir ini masih begitu banyak kekurangan. Dengan segala keterbatasan yang ada, semoga tugas akhir ini bermanfaat.
APLIKASINYA PADA DNA
N U R M A I L Y
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
Dengan ini saya menyatakan bahwa tesis dengan judul “Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA” adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
NURMAILY.
The Study of Discrete Hidden Markov Model and Its Application on
DNA Sequence. Under supervision of
BERLIAN SETIAWATY
and
N. K.
KUTHA ARDANA.
A discrete hidden Markov model is a model which consists of the cause of event and
observation process. This model assumes that the cause of event is a Markov chain,
which is not observed directly. The observation process has discrete range.
Parameters of this model are transition probability matrices. They are estimated using
the maximum likelihood method and expectation maximization algorithm. The
estimation procedure involves the change of measure. The estimation of parameters
uses Mathematica 7.0, a functional programming based on algebraic computer
systems. The model is applied to the DNA
sequence. The estimated parameters are
used to calculate the expectation of DNA sequence. The result depends on the
decision of the initial value. There should be another study for determining the initial
value which gives the optimal result.
NURMAILY.
Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA. Di
bawah bimbingan
BERLIAN SETIAWATY
dan
N.K. KUTHA ARDANA.
Setiap kejadian berkaitan erat dengan penyebab kejadian. Jika penyebab kejadian
tersebut tidak diamati secara langsung dan membentuk rantai Markov, maka
pasangan kejadian dan penyebabnya dapat dimodelkan dengan model Hidden
Markov (Hidden Markov Model, HMM).
Semua proses didefinisikan pada ruang peluang
Ω
, ,
. Misalkan
;
adalah rantai Markov dengan state berhingga yang bersifat homogen dan diasumsikan
tidak diamati secara langsung, sedangkan
;
adalah proses
observasinya. Pasangan proses stokastik
,
merupakan model Hidden
Markov.
Model
Hidden
Markov (Elliot et al. 1995) yang digunakan pada karya ilmiah ini
adalah
+
Y CX W , untuk
di mana
, , … ,
,
, , ,
,
A
dan
C
merupakan
matriks peluang transisi dengan
dan
,
yang
memenuhi
∑ 1, , dan ∑ 1, .dan
memenuhi
| , |
| diag diag
diag diag .
Jika
, maka vektor
, , … ,
merupakan nilai harapan
dari
, yaitu
dan untuk
ergodic memenuhi
dan
∑
1
.
Parameter yang digunakan pada model di atas adalah
, 1
,
,
, 1
, 1
.
Akan ditentukan parameter baru dengan menggunakan algoritme EM
, 1
,
, ̂
, 1
, 1
,
∑
,
,
∑
,,
.
2.
Pendugaan Banyaknya Lompatan
=
,
,
,
Penduga banyaknya lompatan adalah
, 1
∑
,,
,
.
Penduga smoother banyaknya lompatan adalah
,
∑
,,
.
3.
Pendugaan Lamanya Waktu Kejadian
,
Penduga lamanya waktu kejadian adalah
, ∑ , , , .
Penduga smoother lamanya waktu kejadian adalah
, ∑ , , .
4.
Pendugaan untuk Proses Observasi
∑
,
,
,
,
.
Penduga untuk proses observasi adala
,
∑
,,
,
,
.
Penduga smoother untuk proses observasi adalah
,
∑
,,
.
Dari pendugaan rekursif dapat ditentukan parameter model sebagai berikut
,
1
,
.
̂
,
1
, 1
.
Nilai Harapan
adalah
|
∑ ∑
1 1 .
Model Hidden Markov diskret di atas diaplikasikan pada perubahan urutan basa DNA
pada spesies
Aspergillus niger
, dengan
N = 2. Dalam perkembangan lebih lanjut,
dibuat suatu program komputasi yang berbasis pemprograman fungsional untuk
menyelesaikan masalah tersebut. Software yang digunakan adalah Mathematica 7.0.
Hasil yang di peroleh pada penelitian ini sangat bergantung pada penentuan nilai
awal. Sampai saat ini hasil yang diperoleh belum cukup baik, karena belum
ditemukan cara untuk menentukan nilai awal yang paling baik sehingga hasil yang
diperoleh optimal.
© Hak Cipta milik IPB, tahun 2009 Hak Cipta dilindungi Undang-Undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
APLIKASINYA PADA DNA
N U R M A I L Y
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Matematika Terapan
SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2009
Disetujui Komisi Pembimbing
Dr. Berlian Setiawaty, M.S. Ir. N. K. Kutha Ardana, M.Sc. Ketua Anggota
Diketahui
Ketua Program Studi Dekan Sekolah Pascasarjana Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S. Prof, Dr. Ir. Khairil A. Notodiputro, M.S.
Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat dan karunia-Nya sehingga tugas akhir yang berjudul “Kajian Model Hidden Markov Diskret dan Aplikasinya pada DNA” ini bisa terselesaikan sebagai salah satu syarat untuk menyelesaikan pendidikan pada Program Studi Matematika, Sekolah Pascasarjana Institut Pertanian Bogor.
Terimakasih yang mendalam penulis sampaikan kepada:
1. Dr. Berlian Setiawaty, M.S. dan Ir. N. K. Kutha Ardana, M.Sc. selaku pembimbing yang telah memberikan bimbingan dan motivasinya.
2. Dr. Ir. Wayan Mangku, M.Sc. selaku penguji yang telah memberikan saran dan kritiknya.
3. Departemen Agama Republik Indonesia yang telah memberikan beasiswa kepada penulis selama menempuh pendidikan di IPB.
4. Seluruh keluarga atas segala dukungan, doa dan kasih sayangnya.
5. Mahasiswa S2 Matematika Terapan IPB angkatan 2007, serta semua pihak yang telah membantu penulis.
Penulis menyadari bahwa tugas akhir ini masih begitu banyak kekurangan. Dengan segala keterbatasan yang ada, semoga tugas akhir ini bermanfaat.
Penulis dilahirkan di Banda Aceh pada tanggal 21 Mei 1971 dari pasangan Bapak Rusli Tgk. Ali (Alm) dan Ibu Nurjannah. Penulis merupakan anak ketiga dari lima bersaudara.
Pendidikan sarjana ditempuh di Program Studi Matematika Fakultas Keguruan dan Ilmu Pendidikan Universitas Syiah Kuala Banda Aceh, lulus pada tahun 1996 dan pada tahun 2007 penulis diberi kesempatan melanjutkan studi di Program Studi Matematika Terapan, Sekolah Pascasarjana Institut Pertanian Bogor dengan beasiswa dari Departemen Agama Republik Indonesia.
DAFTAR ISI ……… xii
DAFTAR GAMBAR ……….. xiv
DAFTAR LAMPIRAN ………... xv
BAB 1 PENDAHULUAN
1.1 Latar Belakang ………... 1
1.2 Tujuan Penelitian ……….... 3
BAB 2 LANDASAN TEORI
2.1 Pengantar Teori Peluang ………... 4
2.2 Rantai Markov ……….... 10
2.3 Ruang Hasil Kali Dalam ………..
13
BAB 3 MODEL
HIDDEN
MARKOV
3.1
State
dan Proses Observasi dalam waktu diskret ………
15
3.2 Perubahan Ukuran ………...
21
3.3 Pendugaan Rekursif ……….
29
3.4 Pendugaan Parameter ………..
38
3.5 Nilai Harapan
……….. 47 3.6 Algoritme Pendugaan Parameter ………... 47 BAB 4 APLIKASI MODEL HIDDEN MARKOV DISKRET PADA DNA4.1 DNA Sebagai Materi Genetik ………. 50 4.2 Data Input DNA ……….. 52 4.3 Aplikasi Model Hidden Markov Diskret pada DNA ……….. 53 4.4 Hasil Komputasi ………
54
BAB 5 KESIMPULAN DAN SARAN
5.1 Kesimpulan ………...
58
5.2 Saran ……….
58
DAFTAR PUSTAKA ………. 59
Halaman
1 Pembentukan secara skematik struktur dsDNA dari gula fosfat
sebagai backbone dan basa nukleotida (A). Bentuk skematik
double-helix DNA (B)………
52
2 Grafik distribusi nilai dugaan urutan DNA menggunakan penduga
smoother
untuk 2 penyebab kejadian (
N =
2). Banyaknya data,
T
= 1000. Nilai awal
. 1
.
. 9
. 4 ,
.1
.
. 9
.
.4
.
.4
. 9
dan
.49
. 1
..………...
55
3
Grafik distribusi nilai dugaan urutan DNA menggunakan penduga
smoother
untuk 2 penyebab kejadian (
N =
2). Banyaknya data,
T
= 1000. Nilai awal
.
.
.
.
,
.
.
.
.
.
.1
.
.4
dan
.
DAFTAR LAMPIRAN
Halaman
1
Bukti Teorema 3.3.5 ………... 61
2
Program 1...
66
3
Program 2...
72
4
Tabel nilai harapan model dari Program 1...
78
BAB I
PENDAHULUAN
1.1 Latar Belakang
Dalam kehidupan sehari-hari banyak fenomena yang dapat dimodelkan dengan proses
stokastik. Setiap kejadian berkaitan erat dengan penyebab kejadian tersebut. Jika
penyebab kejadian tersebut tidak diamati secara langsung dan membentuk rantai
Markov, maka pasangan kejadian dan penyebabnya dapat dimodelkan dengan model
Hidden
Markov (
Hidden
Markov
Model
, HMM).
Misalkan
;
adalah penyebab kejadian yang tidak diamati secara langsung
dan membentuk rantai Markov yang bersifat homogen, sedangkan
;
merupakan proses observasi, maka pasangan
,
merupakan
Hidden
Markov
Model
. Untuk
dan
peubah acak diskret maka pasangan
,
merupakan
Hidden
Markov
Model
diskret.
Karakteristik dari Model
Hidden
Markov dicirikan oleh parameter-parameternya,
antara lain berupa matriks peluang transisi. Parameter tersebut diduga melalui
pendugaan ulang parameter dengan menggunakan algoritme
Expectation
Maximization
(EM), sehingga diperoleh parameter model dalam bentuk pendugaan
rekursif. Pendugaan rekursif ini nantinya dapat dievaluasi kembali dengan
menggunakan parameter atau mungkin dengan data yang baru.
Aplikasi Model
Hidden
Markov diskret sudah banyak dikembangkan pada berbagai
bidang antara lain, di bidang biologi yaitu “Penerapan
Hidden
Markov Model dalam
Prediksi Gen Organisme Prokariotik” (Hermanto, 2007), di bidang kebahasaan yaitu
“Penggunaan
Hidden
Markov Model untuk Kompresi Kalimat” (Wibisono,2008),
”Sistem Pengenalan Bicara dengan Menggunakan Sistem
Hidden
Markov Model”
(Hasymi,1996), di bidang teknologi komunikasi yaitu “Algoritma Viterbi dalam
Metode HMM pada teknologi Speech Recognition” (Irfani, 2007),”Selecting
Hidden
2008), di bidang teknik yaitu “Aplikasi Pengenalan Wicara HMM untuk Kendali
Robot PDA” (Bachtiar, 2007), “Computational Issues in Parameter Estimation for
Stationary
Hidden
Markov Models” (Bulla dan Berzel, 2008), “Kajian
Hidden
Markov Diskret dan Aplikasinya pada Harga Gabah Kering Panen” (Jamal, 2008),
di bidang budaya yaitu “Pengenalan Karakter Mandarin Secara On-Line dengan
Menggunakan
Hidden
Markov Models” (Hadi, 2005).
Dalam tesis ini akan dibahas aplikasi Model
Hidden
Markov diskret Elliott
et al
.
1995 yang telah dikaji oleh Jamal (2008). Model ini diaplikasikan untuk
menggambarkan struktur urutan DNA pada spesies Aspergillus niger
.Dengan
menggunakan data urutan DNA pada spesies Aspergillus niger
,maka dapat diduga
parameter modelnya. Sebelum melakukan pendugaan parameter, terlebih dahulu
dilakukan perubahan ukuran peluang yang kemudian diinterpretasikan kembali
dengan menggunakan peluang asal. Perubahan ukuran peluang ini dibatasi oleh
turunan Radon-Nykodim.
Dalam ukuran peluang yang baru, dilakukan pendugaan parameter melalui pendugaan
ulang parameter. Hasilnya berupa pendugaan rekursif di antaranya penduga untuk
state
, penduga untuk banyaknya loncatan, penduga lamanya rantai Markov berada
pada suatu
state
tertentu dan penduga proses observasi. Pendugaan rekursif ini
kemudian digunakan untuk menentukan parameter dengan menggunakan algoritme
Expectation Maximization
(EM ).
Dalam perkembangan lebih lanjut, dibuat suatu program komputasi yang berbasis
pemprograman fungsional untuk menyelesaikan masalah Model
Hidden
Markov
diskret.
Software
yang digunakan adalah
Mathematica
7.0. Keuntungan
1.2 Tujuan Penelitian
Tujuan dari penelitian ini adalah
1.
Mengkaji Model
Hidden
Markov diskret (Elliot
et al
. 1995).
2.
Melakukan pendugaan parameter melalui pendugaan ulang parameter,
a.
Pendugaan untuk
state
,
b.
Pendugaan untuk banyaknya loncatan,
c.
Pendugaan lamanya rantai Markov berada pada suatu
state
,
d.
Pendugaan proses observasi.
4
2.1 Pengantar Teori Peluang
Definisi 2.1.1 Percobaan Acak (Ross 1996)
Dalam suatu percobaan seringkali dilakukan pengulangan yang biasanya dilakukan
dalam kondisi yang sama. Semua kemungkinan hasil yang akan muncul dapat
diketahui, namun hasil pada percobaan berikutnya tidak dapat diketahui dengan tepat.
Percobaan seperti ini, yang dapat diulang dalam kondisi yang sama, disebut
percobaan acak.
Definisi 2.1.2 Ruang Contoh dan Kejadian (Ghahramani 2005)
Himpunan dari semua kemungkinan hasil dari suatu percobaan acak disebut
Ruang
contoh
dan dinotasikan dengan
Ω
. Suatu kejadian
A
adalah himpunan bagian dari
Ω
.
Definisi 2.1.3 Medan-
σ
(Ghahramani 2005)
Medan-
σ
adalah himpunan yang anggotanya merupakan himpunan bagian dari
Ω
yang memenuhi:
1
;
2 Jika
, ,
maka
∞
;
3 Jika
maka
.
Definisi 2.1.4 Ukuran Peluang (Ghahramani 2005)
Misalkan
adalah
medan-
σ
dari ruang contoh
Ω
.
Ukuran Peluang
adalah suatu
fungsi
:
,1
pada
Ω,
yang memenuhi:
1
,
;
3 Jika
, ,
adalah himpunan yang saling lepas yaitu
A
i∩
A
j=
φ
untuk
setiap pasangan
i≠ j, maka
∑
∞ = ∞ =
=
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
1 1)
(
i i ii
P
A
A
P
U
. Pasangan
Ω, ,
) disebut
ruang
peluang.
Definisi 2.1.5 Kejadian Saling Bebas (Grimmet dan Stirzaker 2001)
Kejadian
A
dan
B
dikatakan saling bebas jika
P(A∩B)=P(A)P(B).Secara umum,
himpunan kejadian
{
A
i:
i
∈
I
}
dikatakan saling bebas jika
∏
∈ ∈
=
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
J i i J ii
P
A
A
P
I
(
)
untuk setiap himpunan bagian berhingga dari
J
dari
I
.
Definisi 2.1.6 Peluang Bersyarat (Ghahramani 2005)
Misalkan
Ω, ,
) adalah ruang peluang dan
,
maka peluang
A
dengan
syarat
B
didefinisikan sebagai
|
.
Definisi 2.1.7 Peubah Acak (Grimmet dan Stirzaker 2001)
Misalkan
Ω
adalah ruang contoh dan adalah
medan-
σ
dari
Ω. Suatu peubah acak
X
adalah
fungsi
: Ω
dengan
{
ω
∈
Ω
:
X
(
ω
)
∈
A
}
∈
untuk setiap
.
Definisi 2.1.8 Peubah Acak Diskret (Grimmet dan Stirzaker 2001)
Peubah acak
X
dikatakan diskret jika nilainya hanya pada himpunan bagian tercacah
Definisi 2.1.9 Fungsi Sebaran (Grimmet dan Stirzaker 2001)
Fungsi sebaran dari suatu peubah acak
X
adalah
:
,1 ,
yang didefinisikan
oleh
.
Definisi 2.1.10 Fungsi Kerapatan Peluang (Grimmet dan Stirzaker 2001)
Misalkan
Ω, ,
adalah ruang peluang. Fungsi kerapatan peluang dari peubah acak
diskret
X
adalah suatu fungsi
p
:
S
→
[ ]
0
,
1
yang didefinisikan oleh
)
(
)
(
x
P
X
x
p
X=
=
untuk setiap
x
∈
S
.
Definisi 2.1.11 Fungsi Kerapatan Peluang Bersama Dua Peubah Acak diskret
dan Marginal (Grimmet dan Stirzaker 2001)
Misalkan
Ω, ,
adalah ruang peluang. Fungsi kerapatan peluang bersama dari
peubah acak diskret
X
dan
Y
adalah suatu fungsi
p
:
S
×
S
→
[ ]
0
,
1
yang didefinisikan
oleh
p
XY(
x
,
y
)
=
P
(
X
=
x
,
Y
=
y
)
untuk setiap
x,y∈S.Fungsi kerapatan peluang marginal dari peubah acak
X
dan
Y
adalah berturut-turut
∑
,
∑
, .
Definisi 2.1.12 Fungsi Kerapatan Peluang Bersyarat (Ross 1996)
Jika
X
dan
Y
merupakan peubah acak diskret, maka fungsi kerapatan peluang
bersyarat dari
X
jika diberikan
Y=y
, terdefinisi untuk setiap
y
sedemikian sehingga
P(Y=y)
>0 adalah
Definisi 2.1.13 Bebas Stokastik Identik (Hogg
et al.
2005)
Misalkan
X
1,
X
2,...,
X
nadalah
n
peubah acak yang memiliki fungsi kerapatan yang
sama yaitu
sehingga
M
dan fungsi kerapatan bersamanya adalah
,
.
Peubah acak
X
1,
X
2,
K
,
X
ndisebut bebas
stokastik identik.
Definisi 2.1.14 Nilai Harapan Peubah Acak Diskret (Ghahramani 2005)
Jika
X
adalah peubah acak diskret dengan fungsi kerapatan peluang
)
(
)
(
x
P
X
x
p
X=
=
maka nilai harapan dari
X
adalah
∑
=
xX
x
xp
X
E
[
]
(
)
.
Definisi 2.1.15 Nilai Harapan Bersyarat (Ghahramani 2005)
Misalkan
X
dan
Y
adalah peubah acak diskret dengan fungsi kerapatan peluang
bersyarat dari
X
dengan syarat
Y=y
adalah
||
, maka nilai harapan bersyarat
dari
X
dengan syarat
Y=y
adalah
|
∑
||
.
Definisi 2.1.16 Fungsi Indikator (Cassela dan Berger 1990)
Misalkan
A
adalah suatu kejadian pada ruang peluang
Ω, ,
.
Fungsi indikator dari
1, jika
, jika
.
Definisi 2.1.17 Himpunan
P-Null
(Grimmet dan Stirzaker 2001)
Misalkan
Ω
, ,
adalah ruang peluang. Himpunan
P-Null
didefinisikan sebagai
Ω:
A,
,
.
Definisi 2.1.18 Ruang Peluang Lengkap (Billingsley 1986)
Ruang peluang
Ω, ,
disebut lengkap, jika
A⊂ B,B∈,
dan
P(B)=0maka
.
Definisi 2.1.19 Filtrasi (Grimmet dan Stirzaker 2001)
Misalkan adalah
medan-
σ
dan
, ,
merupakan barisan
submedan-dari
,
disebut
filtrasi
jika
untuk semua
k
∈
.
Definisi 2.1.20 Filtrasi Lengkap (Protter 1995)
Misalkan
Ω, ,
adalah ruang peluang lengkap. Misalkan =
;
adalah
sebuah filtrasi. Jika
memuat semua himpunan
P-Null
di
maka disebut filtrasi
lengkap.
Definisi 2.1.21 Terukur
(Measurable)
(Grimmet dan Stirzaker 2001)
Misalkan
X
adalah peubah acak diskret yang terdefinisi pada ruang peluang
Ω, ,
dan
S
adalah ruang
state X
. Jika
{
ω
∈
Ω
;
X
(
ω
)
∈
A
}
∈
untuk setiap
A⊂S,maka
X
Definisi 2.1.22
Adapted
(Grimmet dan Stirzaker 2001)
Misalkan
Ω, ,
adalah ruang peluang. Barisan peubah acak
;
dikatakan
adapted
terhadap filtrasi {
jika
terukur-
untuk setiap
.
Definisi 2.1.23
Predictable
(Grimmet dan Stirzaker 2001)
Misalkan
adalah
filtrasi
. Barisan peubah acak
;
dikatakan
predictable
(terduga), jika
terukur-
untuk setiap
k
.
Definisi 2.1.24 Nilai Harapan Bersyarat (Shreve 2004)
Misalkan
Ω, ,
adalah ruang peluang dan
adalah submedan-
σ
dari
.
Misalkan
X
adalah peubah acak yang terintegralkan pada
Ω, ,
. Maka
|
disebut nilai harapan bersyarat dari
X
jika diketahui , didefinisikan sebagai sebarang
peubah acak
Y
yang memenuhi:
1
Y
terukur- ;
2
∫
YdP
=
∫
XdP
∀
A
∈
A A
,
;
Persamaan
|
dapat ditulis
|
.
Teorema 2.1.25 Nilai Harapan Bersyarat (Billingsley 1986)
Misalkan
X
terintegralkan,
dan
adalah dua medan-
σ
yang memenuhi
,
maka berlaku:
|
|
| |
| .
Teorema 2.1.26. Sifat-sifat Nilai Harapan Bersyarat (Shreve 2004)
Misalkan
X,Y
, dan
XY
terintegralkan, maka berlaku:
1
|
;
3
|
|
| , , skalar
;
4 Jika
X
≥
0
, maka
|
;
5 Jika
Y
terukur- maka
|
|
.
Definisi 2.1.27. Kontinu Absolut (Billingsley 1986)
Jika
P
dan
_
P
adalah dua ukuran peluang pada
Ω,
. Ukuran peluang
P
dikatakan
kontinu absolut ke ukuran peluang
_P
jika untuk setiap
A∈F,P(A)=0mengakibatkan
_P
(A)=0,dinotasikan
_
P
P
<<
. Jika
_
P
P
<<
dan
P
<<
P
_maka
kedua ukuran dikatakan ekuivalen dan dinotasikan
._
P
P≡
Definisi 2.1.28 Radon-Nikodym (Billingsley 1986)
Jika
P
dan
_
P
adalah dua ukuran peluang pada
Ω,
sedemikian sehingga
,
_
P
P
<<
maka terdapat peubah acak tak negatif
Λ
sehingga
_
P
=
∫
Λ
A
dP
A
)
(
untuk semua
dinotasikan
=
Λ
.
2.2
Rantai Markov
Definisi 2.2.1 Ruang
State
(Grimmet dan Stirzaker 2001)
Misalkan
S
adalah himpunan nilai dari barisan peubah acak, maka
S
disebut ruang
state
.
Definisi 2.2.2 Proses Stokastik (Ross 1996)
Proses stokastik
X
=
;
terdefinisi pada ruang peluang
Ω, ,
adalah
Definisi 2.2.3 Rantai Markov dengan Waktu diskret (Grimmet dan Stirzaker
2001)
Misalkan
Ω, ,
adalah ruang peluang dan
S
adalah ruang
state.
Proses stokastik
;
dengan ruang
state S
, disebut rantai Markov dengan waktu diskret
jika untuk setiap
k
= {0,1,2,…}, berlaku:
|
,
,
|
untuk semua kemungkinan nilai dari
i
0,
i
1,...,
i
k,
i
k+1∈
S
.
Definisi 2.2.4 Matriks Peluang Transisi (Grimmet dan Stirzaker 2001)
Misalkan
X
=
;
adalah rantai Markov dengan
state S
berukuran
N.
matriks transisi
, dengan
|
untuk
S i
j, ∈
adalah matriks peluang transisi dari
X
.
Definisi 2.2.5 Rantai Markov Homogen (Grimmet dan Stirzaker 2001)
Misalkan
X
=
;
adalah rantai Markov dengan ruang
State
S,
dikatakan
homogen jika
|
|
untuk
j,i∈S.Definisi 2.2.6 Peluang Transisi
n-step
(
(a(jin))(Ross 1996)
Misalkan
X
=
adalah rantai Markov dengan ruang
state S.
Peluang transisi
n-step
dari
X
adalah peluang proses berpindah dari
state i
ke
state j
dengan
n
langkah yang didefinisikan oleh:
|
,
, ,
S
.
Definisi 2.2.7
Accessible
(Ross 1996)
Suatu
state j
disebut terakses (
accessible
) dari suatu
state i
, ditulis
i→ j,jika ada
Definisi 2.2.8
Communicate
(Ross 1996)
Dua
state i
dan
j
disebut berkomunikasi (
communicate
), ditulis
i↔ j,jika
state i
dapat diakses dari
state j
dan
state j
dapat diakses dari
state i.
Definisi 2.2.9 Kelas
State
(Ross 1996)
Himpunan tak kosong
S
disebut kelas
state
apabila semua pasangan
state
yang
merupakan anggota dari
S
berkomunikasi satu dengan yang lainnya, serta tidak ada
state
yang merupakan anggota
S
yang berkomunikasi dengan suatu
state
yang bukan
anggota dari
S.
Definisi 2.2.10
Irreducible
(Ross 1996)
Rantai Markov disebut tak tereduksi
(irreducible)
jika hanya terdapat satu kelas
state,
yaitu jika semua
state
-nya berkomunikasi satu dengan yang lainnya.
Definisi 2.2.11
Recurrent
(Ross 1996)
Peluang bahwa suatu proses yang dimulai dari
state i
akan bertransisi ke
state j
didefinisikan sebagai
∑
∞.
State i
berulang (
recurrent
) jika
1.
Teorema 2.2.12
Recurrent
(Ross 1996)
State i
berulang (
recurrent
) jika
∑
∞==
∞
0) ( n
n ii
a
.
Definisi 2.2.13 (Ross 1996)
1
Suatu
state i
disebut memiliki periode
d
jika
d
adalah persekutuan pembagi
2
Suatu
state
dengan periode = 1 disebut
aperiodic
, sedangkan
state
dengan
periode
≥
2 disebut
periodic
;
3
Suatu
state
disebut berulang positif jika
state
tersebut berulang serta berlaku: jika
proses dimulai dari
state i
, maka nilai harapan dari waktu sampai proses tersebut
kembali ke
state i
adalah bilangan berhingga;
4
Rantai Markov dengan
state
berulang positif dan
aperiodic
disebut
ergodic
.
Teorema 2.2.14 Nilai Harapan Rantai Markov Homogen (Ross 1996)
Misalkan
;
adalah rantai Markov yang
ergodic
dengan ruang
state
S
berukuran
N
dan misalkan
A
merupakan matriks peluang transisi berukuran
N
×
N
dengan
A
=
(
a
ji)
dan
|
maka nilai harapan dari
X
dinotasikan dengan
E[X]=π
yang memenuhi:
π
π
=
A
dan
1
.
1
∑
=
=
Nj j
π
2.3
Ruang Hasil Kali Dalam
Definisi 2.3.1 Ruang Vektor (Anton dan Rorres 2004)
V
disebut ruang vektor, jika untuk setiap vektor
u,v,w
∈V
dan sebarang skalar
k
dan
l
dipenuhi aksioma berikut:
1 Jika
u,v
∈V
, maka
u+v
∈V;
2
u+v=v+u;
3
u+
(
v
+
w
)
=(u+v)+w;
4 Ada
0
∈V
sehingga
0+u=u+0=u
,
∀u
∈V
;
5 Untuk
∀u
∈V
, ada -
u
∈V
sehingga
u+(-u)=(-u)+u=0;
6 Jika
k
adalah sebarang skalar dan
u
∈V
, maka
k u
∈V
;
8
(k+l)u=ku+lu;
9
k(lu)=(kl)u;
10
lu=u.
Definisi 2.3.2 Perkalian Dalam (Anton dan Rorres 2004)
Jika u = (
u
1,
u
2,
K
,
u
n) dan v = (
v
1,
v
2,
K
,
v
n) adalah sebarang vektor pada
,
maka
hasil kali dalam
euclied
u.v
didefinisikan oleh:
u.v=
u
1v
1+
u
2v
2+
K
+
u
nv
n.
Definisi 2.3.3 Ruang Hasil Kali Dalam (Anton dan Rorres 2004)
Sebuah hasil kali dalam pada ruang vektor real
V
adalah fungsi yang mengasosiasikan
bilangan real
u,vdengan masing-masing pasangan
vektor
u
dan
v
pada
V
sedemikian sehingga aksioma-aksioma berikut terpenuhi untuk semua
u, v, w
∈V
dan
skalar
k
.
1.
u,v = v,u;
2.
u+v,w = u,w + v,w;
3.
ku,v =k u,v;
4.
v,v ≥0;dan
v,v =0jika dan hanya jika
v =
0.
BAB III
MODEL
HIDDEN
MARKOV
3.1 State dan Proses Observasi dalam waktu diskret
Semua proses didefinisikan pada ruang peluang Ω, , . Misalkan
; adalah rantai Markov dengan state berhingga yang bersifat
homogen dan diasumsikan tidak diamati secara langsung, sedangkan
; adalah proses observasinya. Pasangan proses stokastik , merupakan model Hidden Markov.
Ruang state dari X adalah , , … , dengan , … , ,1, , … , , yaitu himpunan vektor satuan di , di mana hanya elemen ke-i yang bernilai
1 dan lainnya 0.
Misalkan , , , merupakan medan-σ yang dibangkitkan oleh
, , , dan merupakan filtrasi lengkap yang dibangkitkan oleh .
Karena merupakan rantai Markov homogen, maka berdasarkan sifat rantai
Markov diperoleh
, , ,
.
Lema 3.1.1 [Elliot et al.1995]
Misalkan merupakan peluang transisi dan
merupakan matriks peluang transisi yang memenuhi ∑ 1, maka
| | .
Bukti:
, , … , .
Sehingga dapat ditulis
.
Jadi
, , … ,
. ■
Didefinisikan
(3.1)
dengan
| |
|
| | | |
. Sehingga diperoleh persamaan state
. (3.2)
Lema 3.1.2 [Elliot et al.1995]
, . Bukti:
Karena , 1, untuk
, untuk ,
maka
, ∑ ,
Jika , maka vektor , , … , merupakan nilai harapan dari , yaitu dan untuk ergodic memenuhi dan
∑ 1.
Proses state tidak diamati secara langsung namun terdapat proses observasi yaitu
, , ,
di mana bersifat bebas stokastik identik, dan saling bebas. Ruang state dari adalah , , , dengan merupakan vektor satuan di .
Misalkan , , , , , , , merupakan medan-σ dari Ω yang dibangkitkan oleh , , , dan , , , dan merupakan filtrasi lengkap yang dibangkitkan oleh . Misalkan , , , merupakan medan-σ dari Ω yang dibangkitkan oleh , , , dan merupakan filtrasi lengkap yang dibangkitkan oleh , maka diperoleh
, , , , , , ,
.
Lema 3.1.3 [Elliot et al.1995]
Misalkan
C
=
(
c
ji)
M×N adalah matriks peluang transisi, di mana| dan memenuhi ∑ 1,1 , 1 ,
maka
| .
Bukti:
Misalkan
X
k=
e
i, maka| ∑ |
∑
Sehingga dapat ditulis | .
Jadi | | . ■
Didefinisikan
(3.3)
dengan
| |
| | | | | |
.
Sehingga dapat diperoleh suatu persamaan observasi
. (3.4)
Notasi 3.1.4
Misalkan , 1,
, dan , , , ,
dengan ∑ 1.
Misalkan | . Untuk
X
k=
e
l, maka| , |
∑ , |
|
,
, , ,
Sehingga dapat ditulis , | ∑ , .
Jadi , | ∑ , dan
, , , maka
| .
Lema 3.1.5 [Elliot et al.1995]
diag diag diag
dan
|
|
diag diag ,
di mana diag(z) merupakan matriks diagonal yang unsur diagonalnya adalah
vektor z.
Bukti:
dan .
Karena .
,
maka
diag
diag diag(
diag diag diag(
Lema 3.1.6 [Elliot et al.1995]
diag diag diag
dan
|
]
diag diag ,
di mana diag(z) merupakan matriks diagonal yang unsur diagonalnya adalah
vektor z.
Bukti:
dan .
Karena
, maka
diag
diag diag(
diag diag diag(
. ■
Sehingga didapat model hidden Markov Elliot et al. (1995) dalam waktu diskret
dengan ukuran peluang P pada ruang state S sebagai berikut:
, untuk (3.5)
di mana , , A dan C merupakan matriks peluang transisi dengan
yang memenuhi
∑ 1,
∑ 1, ,
dan memenuhi:
| , |
| diag diag
| diag diag .
3.2 Perubahan Ukuran
3.2.1 Teorema Bersyarat Bayes
Teorema 3.2.1 Teorema Bersyarat Bayes [Elliott et al.1995]
Misalkan Ω, , merupakan ruang peluang, merupakan submedan- dari dan merupakan ukuran peluang lain yang kontinu absolut terhadap P dengan
turunan Radon-Nikodym Λ. Jika adalah sebarang peubah acak terintegralkan dan terukur- , maka berlaku
[ | | |
.
Bukti:
Menurut definisi 2.1.22 harus ditunjukkan:
(i) |
|
terukur-Karena Λ| merupakan nilai harapan dari Λ dengan syarat maka
Λ| terukur- , dan Λ| yang merupakan nilai harapan dari Λ dengan syarat maka Λ| terukur- . Karena |
| merupakan pembagian
fungsi terukur- , maka |
(ii) | Λ|
Λ| ,
Definisikan
|
| , untuk Λ|
, untuk Λ| ,
maka | . Jadi terukur- .
Akan ditunjukkan
| , .
Ambil sebarang.
Misal : Λ| , sehingga . Maka dari definisi 2.1.22,
Λ| Λ dan Λ , sehingga atau Λ hampir pasti di G.
Selanjutnya : Λ| , maka dapat dituliskan di mana dan , sehingga
|
Λ
Λ Λ . (3.6)
Karena Λ hampir pasti pada , maka
Λ .
Selanjutnya
|
| | |
Λ
| ||
Λ|
| |Λ|
Λ
Λ ,
maka
Λ .
Sehingga persamaan (3.6) menjadi
Λ Λ
Λ
| . Jadi
|
| , . ■
Lema 3.2.2 [Elliott et al.1995]
Jika { merupakan barisan peubah acak yang bisa diintegralkan, maka
| | |
.
3.2.2 Perubahan Ukuran
Perubahan ukuran peluang diperoleh dengan mengubah ukuran peluang asal
menjadi peluang baru yang kemudian diinterpretasikan kembali ke dalam peluang
asal. Perubahan ukuran ini dibatasi oleh turunan Radon-Nikodym.
Di bawah ukuran P pada Ω, dan adalah medan- yang dibangkitkan , berlaku:
• X merupakan rantai Markov yang homogen dan memenuhi
, dan | .
• , di mana | dan
merupakan peubah acak yang bergantung pada .
Akan dikontruksikan suatu peluang baru pada Ω, yang kontinu absolut terhadap P. Misalkan ukuran peluang baru pada Ω, yang dibatasi oleh turunan Radon-Nikodym
Λk.
(
3.7)Definisikan
∏
, (3.8)dan
Λ ∏ , (3.9)
di mana 1,
, . Jadi adalah fungsi tak linear dari sehingga dapat
ditulis
∑
. (3.10)Lema 3.2.3 [Elliott et al.1995]
Bukti:
Berdasarkan definisi (3.8) dan (3.10), diperoleh
| ∏ 1
1 1 1
∑ 1
1 1
1
|
∑ 1
1 1
|
1
1∑ 1
1
1 1
1∑ 1
1
1.
Lema 3.2.4 [Elliott et al.1995]
Di bawah , , , merupakan peubah acak yang bebas stokastik identik yang menyebar seragam dengan peluang 1 pada masing-masing , 1 . Akan dibuktikan : .
Bukti:
Dengan sifat
, | , |
| 1 ,
dan menggunakan nilai harapan di bawah ukuran peluang , Lema 3.2.2 dan Lema 3.2.3, maka
1 [ , | , Λ 1Λ 1, |
1 |
Λ Λ1 1, |
Λ 1 1, |
Λ 1|
, |
| , (3.12)
berdasarkan (3.11) dan (3.12), diperoleh
1 | , |
∏
, |
∑
, |
, |
|
1
1
1 .
Karena 1 , 1, maka . Sehingga
1 1. ■
Sehingga di bawah ukuran pada Ω, akan berlaku:
• merupakan rantai Markov yang homogen dan memenuhi
, dan | .
• Y merupakan barisan peubah acak diskret dengan , , ,
yang bersifat bebas stokastik identik dan menyebar seragam dengan
Lema 3.2.5 [Elliot et al. 1995]
| .
Bukti:
Berdasarkan Persamaan (3.1), diperoleh
| | ,
|
. ■
Lema 3.2.6 [Elliot et al. 1995]
| .
Bukti:
Berdasarkan Lema 3.2.5 diperoleh,
| | , |
| |
|
. ■
Akan dikontruksi kembali ukuran peluang P pada Ω, yang kontinu absolut pada dengan turunan Radon-Nikodym Λ sehingga di bawah P, model (3.5) dipenuhi yaitu:
• merupakan rantai Markov homogen yang memenuhi
dan | .
• , di mana | dan
merupakan peubah acak yang bergantung pada . Misalkan
dan
Untuk menentukan P dari didefinisikan dan Λ yang merupakan invers dari dan Λ , yaitu
∏ , (3.14)
Λ ∏ , (3.15) dan Λ
.
, (3.16) dimana 1Lema 3.2.7 [Elliott et al.1995]
1. (3.17)
Bukti:
1
|
∑ 1 1
|
∑ 1 1|
∑
11|
∑ 1 1 ∑
1. ■
Lema 3.2.8 [Elliott et al.1995]
Di bawah ukuran P,
|
.Bukti:
Dengan menggunakan Lema 3.2.2
Λ 1 1, |
Λ 1|
Λ 1 1, |
Λ 1 |
1 1, |
1 |
,
(3.18)berdasarkan (3.17) dan (3.18) diperoleh
1| , |
∏ , |
, |
, , |
, |
( 1|
1 .
Sehingga berdasarkan notasi 3.1.4 dapat ditulis,
|
. ■ Dengan , maka|
.Sehingga persamaan observasinya dapat ditulis
.
3.3 Pendugaan Rekursif
Untuk melakukan pendugaan parameter, maka dibentuk suatu pendugaan rekursif
, , , dan merupakan filtrasi yang dibangkitkan oleh , , ,
dan , , , .
Dari subbab 3.2, di bawah ukuran pada Ω, berlaku
, di mana pada ( , memenuhi | , dan { bebas stokastik identik dengan 1 1 , serta dan saling bebas.
Definisikan
Λ , | untuk 1 , , sehingga
∑ ∑ Λ , | Λ ∑ , |
Λ | . (3.19)
Lema 3.3.1 [Elliot et al. 1995]
Untuk , , , maka Λ | , , Bukti:
Λ | , ∑ Λ | , ∑ Λ | , ∑ Λ | , Λ , |
, . ■
Notasi 3.3.2
Jika , merupakan barisan peubah acak bernilai skalar yang terintegralkan, dinotasikan
Dengan menggunakan Lema 3.2.2 dan persamaan (3.20) maka
| ΛΛ
.
(3.21)
Sebagai nilai awal
, di mana 1.
Misalkan 1 1,1, … ,1 . Maka
, 1 ∑ , 1. Akibatnya
, 1 Λ | , 1
Λ , 1 |
Λ , 1 |
, 1 )
, 1 )
. (3.22)
Jika 1 maka dari (3.19), (3.20) dan (3.22) diperoleh 1 , 1
Λ | , 1
Λ , 1 |
[Λ
∑ .
Misalkan proses ; bernilai skalar dan adapted terhadap serta memenuhi
, ,
∑ , , , ,
di mana , { , , adalah proses predictable terhadap , bernilai skalar, merupakan vektor berdimensi N, dan merupakan vektor
berdimensi M.
Notasi 3.3.3 Jika proses , adapted terhadap , dinotasikan , Λ | .
Notasi 3.3.4 Untuk penyederhanaan dinotasikan
∏ .
Teorema 3.3.5 [Elliot et al. 1995]
Untuk 1 dengan , , , adalah kolom ke-j dari matriks dan , , , adalah kolom ke-j dari matriks , maka
,
∑ , , , ,
diag Λ , | .
Bukti: (Lampiran 1)
3.3.1 Penduga untuk State
Dengan menggunakan Teorema 3.3.5 dan Lema 3.2.6, ambil
1, , maka penduga untuk state didefinisikan
, 1 , 1 , , ,
∑ ,
∑ , .
Jadi
, 1
∑ , . (3.23)
Bentuk pendugaan rekursif untuk nilai harapan tak ternormalkan dari , disebut unnormalized smoother, jika diketahui , 1. Bentuk ini dapat diperoleh dengan mengambil , , 1, 1
, , maka dengan menggunakan Teorema 3.3.5 diperoleh
, ∑ , , , ,
diag Λ , | .
∑ , , .
Jadi
, ∑ , , . (3.24)
3.3.2 Pendugaan Banyaknya Lompatan
Banyaknya rantai Markov berpindah dari state ke state sampai waktu ke-k didefinisikan sebagai berikut:
=∑ , , .
Dengan menggunakan , maka
=∑ , ,
∑ , , , ,
, ,
, ,
, , , )
, , ,
, , , .
Dan dengan menggunakan Teorema 3.3.5 dan Lema3.2.6 dapat didefinisikan
,
∑ , , , ,
diag Λ , |
∑ , , , , ,
diag Λ , |
∑ , Λ | , , ,
diag Λ , | .
Ambil , , , , , , ,
sehingga diperoleh
,
∑ , Λ , | , , ,
diag Λ , , |
∑ , , , ,
diag Λ , , |
∑ , , ∑ , , ,
diag Λ , , |
∑ , , , , ,
diag Λ , , |
∑ , , , ,
diag Λ , , |
∑ , , , ,
diag Λ , | }
∑ , , , ,
∑ , , , ,
diag
∑ , , ,
diag
∑ , , , .
Jadi
,
∑ , , , . (3.25)
Jika 1 diketahui, maka bentuk unnormalized smoother untuk adalah
Λ | , .
Ambil , , maka dengan menggunakan
Teorema 3.3.5 diperoleh
, ∑ , , . (3.26)
3.3.3 Pendugaan Lamanya Waktu Kejadian
Misalkan banyaknya kejadian rantai Markov X berada pada state ,
1 , sampai waktu ke-k didefinisikan
∑ ,
∑ , ,
, .
Dengan menggunakan Teorema 3.3.5, penduga untuk waktu kejadian dapat
didefinisikan
,
∑ , , , ,
∑ , , , , ,
diag Λ , |
∑ , Λ | , , ,
diag Λ , | .
Untuk , , , , , diperoleh ,
∑ , Λ , | , , ,
diag Λ , |
∑ , , , ,
∑ , , , , ,
∑ , , ∑ , , ,
∑ , , , , ,
∑ , , , .
Jadi
, ∑ , , , . (3.27)
Bentuk unnormalized smoother untuk jika diketahui adalah .
Ambil , , , maka dengan menggunakan
Teorema 3.3.5 diperoleh
, ∑ , , . (3.28)
3.3.4 Pendugaan untuk Proses Observasi
Banyak kejadian berada pada state , 1 , dan berada pada state
, 1 , sampai waktu ke-k, didefinisikan
∑ , , , 1 , 1 , maka
∑ , ,
, ,
, , .
Dengan menggunakan Teorema 3.3.7 dan Lema 3.3.2, dapat didefinisikan
,
∑ , , , ,
diag Λ , |
∑ , , , , ,
diag Λ , |
∑ , , Λ , | ,
diag Λ , | .
Untuk , , , , diperoleh ,
∑ , , Λ , , | ,
diag Λ , |
∑ , Λ , , | ,
∑ , Λ , , | ,
∑ , ,
∑ Λ , , | ,
∑ , ,
Λ , , | ,
∑ , , , , , ,
∑ , , ∏ , , , ,
∑ , , , , .
Jadi
,
Bentuk unnormalized smoother untuk dan memilih ,
1 , , maka dengan menggunakan Teorema 3.3.7 diperoleh
, ∑ , , . (3.30)
3.4 Pendugaan Parameter
Pendugaan parameter model Hidden Markov dilakukan dengan pendugaan ulang
parameter. Metode yang digunakan adalah algoritme EM dan hasilnya berupa
parameter dalam bentuk pendugaan rekursif.
3.4.1 Maksimum Likelihood
Misalkan , Θ adalah himpunan ukuran peluang yang terdefinisi pada
Ω, dan kontinu absolut terhadap . Misalkan , fungsi Likelihood yang digunakan untuk menghitung penduga parameter berdasarkan informasi
adalah
| ,
dan Maximum Likelihood Estimation (MLE) didefinisikan oleh
arg max .
3.4.2 Expectation Maximization
Langkah-langkah Excpectation Maximization (EM) adalah:
1. Set nilai awal parameter , dengan . 2. Set = dan hitung . , dengan , = log | . 3. Cari arg max , .
Parameter yang digunakan pada model (3.5) adalah
, 1 , , , 1 , 1 .
Akan ditentukan parameter baru dengan menggunakan algoritme EM
, 1 , , ̂ , 1 , 1 .
3.4.3 Pendugaan Parameter
Notasi 3.4.3.1
Untuk proses , , ditulis | . Dalam waktu diskret, kondisi ini mendefinisikan -optional projection.
Untuk menggantikan parameter dengan pada rantai Markov ,
didefinisikan oleh
∏
, , , , Λ ∏ dan Λ .Lema 3.4.3.2 [Elliot et al. 1995]
Di bawah ukuran peluang dan misalkan , maka , | .
Bukti:
, | Λ1, Λ 1
1
1, Λ 1
Λ 1
Λ 1, 1
Λ 1
1, 1
1
1, ∏ 1,
, , 1
1, ∏ 1 1,
∏ 1 1,
1, ∑ 1 1,
∑ 1 1,
1,
∑ 1 1,
1,
∑ 1 1,
1,
∑ 1 1,
∑ 1 1 ,
∑ 1 ∑ 1 1 ,
1
∑ 1 1
∑ 1
∑ 1 ,
karena ∑ 1, maka
, | . ■
Teorema 3.4.3.3 [Elliot et al. 1995]
Penduga baru untuk parameter pada waktu pengamatan diberikan oleh
Bukti:
log Λ log ∏ ∏ , , ,
∑ , ∑ , , log log
∑ , log log
∑ , log ∑ , log
∑ , log ,
di mana bebas terhadap dengan ∑ , log , sehingga
logΛ | ∑ , log
∑ , log |
∑ , log | |
∑ , log . (3.32)
Untuk memenuhi ∑ 1 dengan
∑ , ∑ , ∑ ∑ ∑ ,
∑ ∑
∑ 1
(3.33)
dan
∑ , . (3.34)
Akan ditentukan yang memaksimumkan persamaan (3.32) sebagai fungsi
objektif dengan persamaan (3.34) sebagai fungsi kendala. Dengan menggunakan
pengali lagrange diperoleh
, ∑ , log ∑ , .
Turunan pertama terhadap dan , serta dan sehingga
(3.35)
∑ ,
∑ , . (3.36)
Dari persamaan (3.35) diperoleh
.
(3.37)Substitusikan persamaan (3.37) ke persamaan (3.36)
∑ ,
∑ ,
∑ ,
∑ ,
1 ∑ ∑ , ,
,
1 ∑ ∑ ∑ , ,
1 ∑ ∑ , 1 ∑ 1 1
1,
.
Jadi
.
.
3.4.4 Penduga Parameter ̂
Untuk mengganti parameter dengan ̂ pada matriks , didefinisikan
∏
∏
̂ , , , Λ ∏ dan Λ .Lema 3.4.4.1 [Elliott et al.1995]
Di bawah ukuran dan misalkan = , maka
, | ̂ .
Bukti:
, | ,
, |
|
, ∏ ∏ , 1,
∏ ∏ , 1,
, ∏ 1,
∏ 1,
, ∑ 1,
1,
∑ 1,
1,
∑ 1,
∑ 1 ,
∑ ∑ 1 ,
1
∑ 1
∑
∑
,
karena ∑ ̂ 1, maka
, | ̂ .
Teorema 3.4.4.2 Penduga maksimum likelihood untuk parameter ̂ pada waktu pengamatan diberikan oleh
̂ .
Bukti:
log Λ log ∏ ∏ ∏ , ,
∑ ∑ ∑ , , log ̂ log
∑ ∑ log ̂ log
∑ ∑ log ̂ ∑ ∑ log
di mana bebas terhadap ̂ dengan ∑ ∑ log , sehingga
log Λ ∑ ∑1 1 log ̂
∑ ∑1 1 log ̂ |
∑ ∑ log ̂1 1 |
∑ ∑ log ̂ , (3.38)
Untuk ̂ memenuhi ∑ ̂ 1, maka
∑ ∑ ∑ , ̂ ∑ ∑ ∑ , ̂
∑ ∑ ̂
∑ 1
sehingga
∑ ∑ ̂ . (3.39)
Dengan menggunakan pengali lagrange, dapat ditentukan ̂ yang memaksimumkan persamaan (3.38) sebagai fungsi objektif dengan persamaan
(3.39) sebagai fungsi kendala, sehingga diperoleh
. ̂, ∑ ∑ log ̂ ∑ ∑ ̂ .
Dengan menggunakan turunan pertama terhadap ̂ dan , serta
̂ dan
sehingga diperoleh
̂ ̂
̂ . (3.40)
∑ ∑ ̂
Dari persamaan (3.40) diperoleh
̂
̂
.
(3.42)Substitusikan persamaan (3.42) ke persamaan (3.41)
∑ ∑ ̂
∑ ∑
∑ ∑
∑ ∑
∑ ∑ ∑
1 1 1 1, ,∑ ∑ ∑
1 1 1 1, ,∑ ∑
1 1 ,1 ∑ 1 1
1,
sehingga ̂ , 1 , 1 optimum bila
̂ 1
̂ . Jadi
3.5 Nilai Harapan
Nilai Penduga terhadap adalah
|
∑ |
∑ ∑ , |
∑ ∑ | |
∑ ∑ |
∑ ∑ .
3.5 Algoritme Pendugaan Parameter
Diketahui parameter model berbentuk
, 1 , , , 1 , 1 .
Akan ditentukan parameter baru
, 1 , , ̂ , 1 , 1 ,
yang memaksimumkan pseudo-loglikelihood bersyaratnya. Algoritme untuk
menduga parameter tersebut diperoleh dari Setiawaty dan Kristina (2005) dengan
beberapa penambahan langkah sebagai berikut:.
Langkah 1:
Tetapkan N (banyaknya state penyebab kejadian), T (banyaknya data) dan input
data .
Langkah 2:
Untuk N = 1 sampai dengan kriteria terpenuhi, maka tentukan nilai awal untuk:
Langkah 3:
Lakukan untuk 1 sampai dengan .
1 Tetapkan nilai awal untuk proses pendugaan
: vektor unit di
.
2 Lakukan untuk sampai dengan 1 a. Hitung penduga rekursif smoother
, ∑ , , . , ∑ , , . , ∑ , , . , ∑ , , . di mana
∏ ,
, 1 dengan 1 1,1, … ,1 . b. Hitung penduga parameter
1
̂ 1 . c. Tuliskan
1 . d. Tentukan 1 dari
3. Berikan nilai
1 1
1 .
4. Ulangi 1 sampai 3 untuk l berikutnya.
Langkah 4
Hitung nilai ∑ ∑ .
Langkah 5
Hitung nilai
1
∑∑
.
Langkah 6
BAB IV
APLIK