BAB III STATISTIK INFERENSI PADA RANTAI MARKOV

(1)

BAB III

STATISTIK INFERENSI

PADA RANTAI MARKOV

3.1 Pendahuluan

Pada Bab II telah dibahas mengenai rantai Markov berorde-r atau Ō(r) dan matriks peluang transisinya. Pada bagian ini, akan dibahas bagaimana menentukan orde rantai Markov dari barisan hasil pengamatan. Perhatikan barisan hasil pengamatan terhadap cuaca berikut sebagai contoh,

Diketahui barisan hasil pengamatan terhadap keadaan cuaca selama 20 hari sebagai berikut. Disini keadaan cuaca dibagi kedalam tiga kategori yaitu hujan (disimbolkan dengan angka 1), berawan (2), dan cerah (3).

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Obs 2 2 1 1 3 1 3 2 1 2 3 3 3 2 2 2 2 1 2 1 Tabel. 1 Contoh Hasil Pengamatan

Masalah disini ialah bagaimana menentukan orde dari barisan pengamatan tersebut, dengan kata lain bagaimana menentukan apakah keadaan berawan di hari ke-20 bergantung secara langsung hanya kepada hujan di hari ke-19, atau

(2)

bergantung pula pada hujan di hari ke-18, atau bahkan bergantung pada keadaan di hari ke-17, dan seterusnya.

Dalam melakukan pengujian terhadap rantai Markov, matriks peluang transisinya tidak harus diketahui, melainkan cukup dengan taksirannya. Penentuan penaksir titik sebuah parameter dapat ditempuh dengan menggunakan beberapa metode seperti metode momen, metode kuadrat terkecil, dan metode kemungkinan maksimum (maximum likelihood). Dari ketiga metode tersebut, dalam menaksir peluang transisi yang akan digunakan disini adalah metode kemungkinan maksimum karena metode tersebut merupakan metode yang paling banyak digunakan dibandingkan kedua metode lainnya. Gagasan dari metode ini ialah bahwa penaksir parameter yang wajar yang berdasarkan informasi sampel adalah nilai parameter yang menghasilkan peluang terbesar untuk mendapatkan sampel tersebut.

3.2 Estimasi Kemungkinan Maksimum Untuk P

Sebelumnya perhatikan cara membangun matriks yang menyatakan banyaknya transisi antar keadaan sebagai berikut. Secara umum definisikan matriks banyaknya transisi M sebagai berikut,

11 12 1 21 22 2 1 2 M n n n n nn m m m m m m m m m ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ … … … dengan m_ij =M V( _t = j V_t₋₁=i), i j, =1, 2, , n

Disini, mij menyatakan banyaknya transisi dari keadaan i ke j. Dari Tabel 1,

transisi dari keadaan 1 ke 1 hanya terjadi satu kali yaitu dari hari 3 ke hari ke-4. Dengan demikian, m11 = 1. Dengan cara yang sama, diperoleh matriks M dari

hasil observasi pada Tabel 1 sebagai berikut,

11 12 13 21 22 23 31 32 33 1 2 2 4 4 1 1 2 2 m m m m m m m m m ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ =_⎢ _{⎥ ⎢}= _⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ M (3.2.1) (c 3.1)

(3)

Kemudian dari matriks tersebut dicari matriks peluang transisi untuk rantai Markovnya. Peluang transisi tersebut ditaksir dengan menggunakan metode kemungkinan maksimum. Dudewicz dan Mishra [4] mendefinisikan fungsi kemungkinan (likelihood) sebagai berikut,

Definisi (Fungsi Kemungkinan) Andaikan V1, V2,…,Vt adalah t buah peubah

acak dengan fungsi distribusi F v v( , ,...,₁ ₂ v_t θ) dengan θ∈Θ merupakan

parameter yang tidak diketahui, maka fungsi kemungkinan ialah,

1 2

( ) ( , ,..., _t )

L θ = f v v v θ

Dengan mengambil V1, V2,…,Vt sampel acak yang berdistribusi identik dan saling

bebas, maka diperoleh fungsi kemungkinan sebagai berikut,

1 2 1 2 ( ) ( , ,..., ) ( ) ( ) ( ) t t L f v v v f v f v f v θ θ θ θ θ = =

Setiap θ θ= ( , ,..., )V V₁ ₂ V_t ∈Θ dimana ( ) sup{ ( ) :L θ = Lθ θ∈Θ , disebut penaksir } kemungkinan maksimum dari θ.

Penaksiran θ dengan menggunakan metode kemungkinan maksimum telah

banyak dibahas dalam buku-buku statistika. Namun, secara umum dalam pembahasannya fungsi distribusi (F v θ) maupun fungsi kepadatan peluang

(

f v θ) dari peubah acak V telah diketahui sebelumnya. Dudewicz dan Mishra [4] memberikan sebuah contoh menarik tentang bagaimana melakukan penaksiran kemungkinan maksimum dengan hanya mengetahui nilai-nilai peluang dari V untuk Ө tertentu.

Contoh (Penaksiran Kemungkinan Maksimum) Diketahui tabel peluang dari peubah acak V = {0,1,2,3,4} terhadap parameter yang berbeda-beda yaitu θ θ θ _1, ₂, ₃ sebagai berikut,

(4)

V 0 1 2 3 4 p(v I Ө1) 0,00 0,05 0,05 0,08 0,10 p(v I Ө2) 0,05 0,05 0,08 0,10 0,00 p(v I Ө3) 0,9 0,08 0,02 0,00 0,00

Di sini θ(0) = , (1) = , (2) = , (3) = , (4) = θ θ₃ θ θ₃ θ θ₂ θ θ₁ θ₁. Andaikan kita adakan

sedikit perubahan bahwa kita tahu θ∈Θ = { , }, θ θ₁ ₂ maka penaksiran

kemungkinan maksimum tidak lagi tunggal karena meskipun θ(0) = θ₂,

2

(2) =

θ θ , θ(3) = θ₁, θ(4) = θ₁ nilai (1)θ memiliki dua kemungkinan yaitu θ₁ dan θ₂. Hasil dari contoh diatas konsisten dengan definisi kita semula yaitu taksiran kemungkinan maksimum dari θ adalah θ yang memaksimumkan fungsi kemungkinan L(θ). Selain itu, hasil taksiran tersebut tidak harus tunggal.

Secara umum, untuk rantai Markov berorde 1 dengan n keadaan fungsi kemungkinannya adalah,

( )

1 1 0 1 1 0 0 0 1 1 0 1 1 0 1 1 0 , 1,2, , ( , , , , ) ( 1 ) ( ) ( ) n n n n n n ij t n t n t t t n t n t t t i i i i i m i ij i j n L p P V i V i V i V i P V V i P V i V i P V i p p p p p − − − − − = = = = = = = = = × × = = × = = × × × = ×

∏

0 0

Untuk mencari ˆp_kl pertama persamaan (3.2.2) ditulis,

0 , 1 1 ( ) ij kw, 1, 2, , n n m m i ij kw i j w i k L p p p p k n = = ≠ = ×

∏

×

∏

=

Karena pada langkah selanjutnya akan dicari turunan pertama persamaan (3.2.3)

terhadap Pkl, maka untuk mempermudah fungsi kemungkinannya dilog-kan

sehingga pij dan pkw terlepas dari pangkat mij dan mkw. Hal ini dapat dilakukan

karena fungsi log mempertahankan sifat kemonotonan. Dengan demikian, persamaan (3.2.3) menjadi,

(3.2.2)

(5)

0 0 0 , 1 1 , 1 1 , 1 log ( ) log

log log log

ij kw ij kw n n m m i ij kw i j w i k n n m m i ij kw i j l i k n i ij ij kw i j i k L p p p p p p p p m p m = = ≠ = = ≠ = ≠ ⎛ ⎞ ⎜ ⎟ = _⎜ × × _⎟ ⎜ ⎟ ⎝ ⎠ = + + = + +

∏

∑

1 dimana 1, 2, , n kw l p k n = =

∑

Dari (2.2.1), maka dalam persamaan (3.2.4) bagian dapat

dituliskan sebagai berikut,

1 log n kw kw w m p =

∑

1 1 1 1

log log log

log log(1 ), , 1, 2, , n n kw kw kl kl kw kw w w w l n n kl kl kw kl ks w s w l s w m p m p m p m p m p p k l = = ≠ = = ≠ ≠ = + = + − − =

∑

n n ≠ ≠ ≠ ⎛ ⎞ ⎜ ⎟ = + +_⎜ + − − _⎟ ⎜ ⎟ ⎝ ⎠ =

∑

sehingga persamaan (3.2.4) menjadi,

0

, 1 1 1

log ( ) log log log log(1 )

dimana , 1,2, , n n i ij ij kl kl kw kl ks i j w s i k w l s w L p p m p m p m p p k l n = = (3.2.4) =

Bagian selain tidak mengandung unsur

1 1 log n log(1 n ) kl kl kw kl ks w s w l s w m p m p p = = ≠ ≠ +

∑

− − p ˆ_kl

sehingga turunan pertama (3.2.5) terhadap ˆp adalah, _kl

(6)

0

, 1 1 1

1 1

log ( ) log log log log(1 )

log log(1 ) n n i ij ij kl kl kw kl ks i j w s kl kl i k w l s w n n kl kl kw kl ks w s kl w l s w kl kw kl L p p m p m p m p p P P m p m p p P m m p = = ≠ ≠ = = ≠ ≠ ⎛ ⎛ ⎞⎞ ∂ _{∂ ⎜} _⎜ _⎟_⎟ = _⎜ + +_⎜ + − − _⎟_⎟ ∂ ∂ _⎜ _⎜ _⎟_⎟ ⎝ ⎠ ⎝ ⎠ ⎛ ⎞ ∂ ⎜ ⎟ = _⎜ + − − _⎟ ∂ ⎜ ⎟ ⎝ ⎠ = −

∑

n = ≠

∑

1 1 (1 ) n n w w l kl ks s s w p p = ≠ = ≠ − −

∑

Nilai taksiran kemungkinan maksimum dari p adalah ˆ_kl p yang menjadi solusi _kl

dari log ( ) 0 kl L p P ∂ ₌ ∂ 1 1 0 (1 ) n kl kw n w kl w l kl ks s s w p _p m m p = ≠ = ≠ ⇒ − − −

∑

= 1 1 1 1 1 1 (1 ) (1 ) 0 (1 ) n n n n kl kl ks kw kl kl kw ks s s w q s w s w w l q l s q n n kl kl ks s w s w w l m p p m p p p p p p p = = = = ≠ ≠ ≠ ≠ ≠ = = ≠ ≠ ⎛ ⎞ ⎛ ⎞ _⎜ _⎟ ⎜ ⎟ _⎜ _⎟ ×_⎜ − − _⎟− × × − − − ⎜ ⎟ ⎜ ⎟ _⎜ _⎟ ⎝ ⎠ _⎝ _⎠ ⇒ = × − −

∑

∏

∑

∏

1 1 1 1 _kl n (1 _kl n _ks) _kw _kl n (1 _kl _kw n _ks) 0 s s w q s w s w w l q l s q p p p m p m p p = = = = ≠ ≠ ≠ ≠ ≠ ⎛ ⎞ ⎛ ⎞ _⎜ _⎟ ⎜ ⎟ _⎜ _⎟ ⎜ ⎟ _⎜ _⎟ ⎜ ⎟ _⎜ _⎟ ⎝ ⎠ _⎝ _⎠ ⇒ ×

∏

− −

∑

− × ×

∏

− − −

∑

=

Dengan menyelesaikan persamaan (3.2.8) untuk k, l = 1,2,...,n beserta (2.2.1) maka diperoleh penaksir kemungkinan maksimum untuk pkl yaitu

1

ˆ

kl kl n kj j

m

p

m

=

∑

Dengan demikian, matriks peluang transisi taksirannya adalah

(3.2.6)

(3.2.7)

(3.2.8)

(7)

1 11 12 1 1 1 1 1 11 12 1 21 22 2 21 22 2 2 2 1 1 1 1 2 1 2 1 1 1 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ n n n n 1 2 j j j j j j n n n n n n j j j j j j nn n n n n nn n n n nj nj nj j j j m m m m m m p p p m m m p p p _m _m _m p p p m m m m m m = = = = = = = = = ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎡ ⎤ _⎢ _⎥ ⎢ ⎥ _⎢ _⎥ ⎢ ⎥ _⎢ _⎥ ⎢ ⎥ _⎢ _⎥ ⎢ ⎥ _⎢ _⎥ ⎢ ⎥ ⎣ ⎦ _⎢ _⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ =

=

∑

P … … … … … …

Jadi, untuk barisan observasi pada tabel 1 matriks peluang transisinya adalah

11 12 13 21 22 23 31 32 33 1 2 2 5 5 5 ˆ ˆ ˆ 4 4 1 ˆ _ˆ _ˆ _ˆ 9 9 9 ˆ ˆ ˆ _{1 2 2} 5 5 5 p p p p p p p p p ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ _⎢ _⎥ ⎢ ⎥ ⎣ ⎦ = = P

Secara umum matriks M untuk Ō(r) adalah,

00 00 00 01 00 0 00 10 00 11 00 1 0 0 0 1 0 10 00 10 01 10 0 10 10 10 11 10 1 1 0 1 1 1 0 00 0 01 0 0 0 10 0 11 0 0 1 n n n n n n n nn n n n n n n n nn n n n n n n nn n nn n nn nn m m m m m m m m m m m m m m m m m m m m m m m m m m m ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ = ⎣ M ⎤ n nn ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ _⎥⎦ (3.2.10) (c 3.2) (3.2.11)

(8)

Disini mij…kl menyatakan banyaknya transisi dari keadaan i ke l dalam r langkah

melalui keadaan j pada satu langkah pertama dan seterusnya hingga melalui k di langkah ke r-1 sebelum ke l . Secara matematis dapat ditulis,

1 ( 1) ( , , , ), , , , 1, 2 ij kl t t t r t r m =M V =l V₋ =k V_{− −} = j V₋ =i i j k l= , ,n n nn

Sementara itu matriks peluang transisi taksirannya adalah,

00 00 00 01 00 0 00 10 00 11 00 1 0 0 0 1 0 10 00 10 01 10 0 10 10 10 11 10 1 1 0 1 1 1 0 00 0 01 0 0 0 10 0 11 0 0 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ n n n n n n n nn n n n n n n n nn n n n n n n nn n p p p p p p p p p p p p p p p p p p p p p p p p p = P 1 ˆ_{nn n} ˆ_{nn nn} p p ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ dimana 1 ( 1) ( _n , , , ij kl t t t r t r ) p =P V =l V₋ =k V_{− −} = j V₋ =i dan 1

ˆ

ij kl ij kl n ij kh h

m

p

m

=

∑

Berdasarkan (3.2.11) dan (3.2.13), untuk tabel 1 maka matriks banyak transisi M dan matriks peluang transisi taksiran Ō(2) adalah, ˆP

(3.2.12)

(3.2.13)

(3.2.14)

(9)

111 112 113 121 122 123 131 132 133 211 212 213 221 222 223 231 232 233 311 312 313 321 322 323 331 332 333 0 0 1 1 0 1 1 1 0 1 2 0 2 2 0 0 0 1 0 0 1 1 1 0 0 1 1 m m m m m m m m m m m m m m m m m m m m m m m m m m m ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢_⎢ ⎥_⎥ ⎢ _{⎥ ⎣} _⎦ ⎣ ⎦ = = M dan 111 112 113 121 122 123 131 132 133 211 212 213 221 222 223 231 232 233 311 312 313 321 322 323 331 332 333 0 0 1 1 ₀ 1 2 2 ˆ ˆ ˆ 1 1 0 ˆ ˆ ˆ _{2 2} ˆ ˆ ˆ _{1 2} 0 ˆ ˆ ˆ _{3 3} ˆ ˆ ˆ 1 1 0 2 2 ˆ ˆ ˆ 0 0 1 ˆ ˆ ˆ 0 0 1 ˆ ˆ ˆ 1 ˆ ˆ ˆ 2 ˆ p p p p p p p p p p p p p p p p p p p p p p p p p p p ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ = = P 1 0 2 1 1 0 2 2 ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦

Menentukan berapa orde dari barisan pengamatan pada tabel 1 sama dengan menentukan matriks peluang transisi mana yang akan digunakan, yaitu apakah (c 3.2) atau (c 3.4). Disisi lain, bisa saja ke-20 hasil pengamatan tersebut ternyata saling bebas. Dalam hal ini,

1 ( 1)

( , , , ) (

ij kl t t t r t r t ) l

p =P V =l V₋ =k V_{− −} = j V₋ = =i P V = =l p

Untuk kasus dimana ke-20 hasil pengamatan saling bebas, matriks banyak transisi dan matriks peluang transisi taksirannya adalah,

[

m1 m2 m3

] [

6 9 5

]

= = M dan

[

1 2 3

]

6 9 5 ˆ _ˆ _ˆ _ˆ 20 20 20 p p p ⎡ ⎤ = _{= ⎢} _⎥ ⎣ ⎦ P (c 3.3) (c 3.4) (c 3.5) (c 3.6)

(10)

Dengan adanya (c3.6), alternatif matriks peluang transisi untuk barisan hasil perngamatan pada tabel 1 bertambah.

Sebelum memeriksa matriks peluang transisi –beserta orde yang berpadanan– mana yang sesuai, ada baiknya periksa terlebih dahulu mana matriks peluang transisi yang tidak dapat digunakan untuk data yang dimiliki. Perhatikan jika barisan pengamatan pada tabel 1 diperlakukan sebagai Ō(3). Matriks M-nya adalah, 1111 1112 1113 1121 1122 1123 3331 3332 3333 0 0 0 0 0 0 0 1 0 m m m m m m m m m ⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ = = ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ _{⎥ ⎣} _⎦ ⎣ ⎦ M

Baris pertama dan kedua dari M bernilai 0. Oleh karena itu, matriks peluang transisi taksirannya adalah,

1111 1112 1113 1121 1122 1123 3331 3332 3333 0 0 0 ˆ ˆ ˆ _{0 0 0} ˆ ˆ ˆ 0 0 0 ˆ 0 0 0 ˆ ˆ ˆ 0 1 0 p p p p p p p p p ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ = _{= ⎢} _⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎢ ⎥ ⎣ ⎦ P

Perhatikan bahwa ada baris dimana jumlah seluruh elemennya tidak sama dengan 1, yaitu baris 1 dan 2. Oleh karena itu, berdasarkan (2.2.1) dapat disimpulkan bahwa matriks pada (c.3.8) bukan merupakan matriks peluang transisi suatu rantai Markov. Jadi, data pengamatan pada tabel 1 tidak dapat dimodelkan sebagai Ō(r) dengan r > 2.

Satu hal yang dapat disimpulkan dari ilustrasi diatas ialah, penentuan orde pada Ō(r) juga dipengaruhi oleh data barisan pengamatan yang dimiliki. Semakin tinggi orde, perulangan yang terjadi semakin sedikit. Hal ini terlihat dari matriks banyaknya transisi dimana pada contoh diatas, semakin tinggi orde yang digunakan, semakin kecil elemen-elemen matriks banyak transisinya. Oleh karena itu, semakin tinggi orde yang akan digunakan, semakin banyak pula data yang

(c 3.7)

(11)

diperlukan. Dalam praktek, pada kenyataannya orde tersebut secara umum tidak lebih dari lima.

Dalam aplikasi, penentuan orde suatu rantai Markov seringkali bersifat subjektif tergantung pemakai. Meskipun besarnya orde dapat meningkatkan kecocokan model terhadap kenyataan sebenarnya, demi kemudahan perhitungan –juga saat membangun model– orde diharapkan serendah mungkin (parsimoni). Meski demikian, beberapa batasan dapat dipertimbangkan misalnya,

(i) Kemudahan dalam memperoleh data.

(ii) Jika indeks parameter berkaitan dengan waktu, perhatikan indeks datanya. Jika data yang diambil merupakan data bulanan, maka indeks parameternya juga dalam bulan.

Masalah berikutnya adalah bagaimana menentukan orde rantai Markov yang tepat. Dalam tugas akhir ini, penentuan orde tersebut dilakukan bukan dengan menaksir, melainkan dengan cara memeriksa atau ’membandingkan’ orde mana yang paling sesuai dari beberapa alternatif pilihan orde yang memungkinkan. Sebagai contoh, untuk tabel 1 akan dibandingkan antara Ō(0), Ō(1), dan Ō(2).

3.3 Studi Deskriptif Ō(r)

Dalam melakukan pengujian terhadap orde rantai Markov, perlu dipahami terlebih dahulu bagaimana pengaruh orde pada suatu rantai Markov. Dari hal tersebut, dapat diperoleh karakteristik yang membedakan orde yang satu dengan lainnya. Selanjutnya, karakteristik tersebut dapat dijadikan dasar dalam pengujian orde rantai Markov. Sebagai contoh, berikut ini adalah plot dari Ō(0) dan Ō(1) dengan tiga keadaan dan t=100,

(12)

1 2 3 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Gambar. 1 Plot Ō(0) 1 2 3 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Gambar. 2 Plot Ō(1)

Secara deskriptif, terlihat perbedaan yang menarik antar rantai Markov dengan orde yang berbeda. Dari Gambar 1, perhatikan pola transisi berbentuk

1 2 3 1 2 3 dan 1 2 3 1 1.5 2 2.5 3

yang muncul secara berulang. Sementara itu, perhatikan pula pada Gambar 2 pola transisi yang berbentuk,

1 2 3 1 2 3 4 5 dan t V t t V t (c 3.9) (c 3.10) (c 3.11)

(13)

1

2

3

1 1.5 2 2.5 3 3.5 4 4.5 5

yang juga muncul beberapa kali. Pola-pola tersebut merupakan pola-pola transisi yang dominan dari kedua plot rantai Markov di atas. Dari ilustrasi tersebut dapat dibuat suatu dugaan bahwa semakin tinggi orde rantai Markov, maka semakin ’lebar’ pola transisinya. Hal ini sangat masuk akal karena kemunculan suatu keadaan bergantung secara langsung kepada r-keadaan sebelumnya dimana besar

r menyatakan orde dari rantai Markov yang terkait. Secara matematis, pola-pola

transisi tersebut dapat dinyatakan sebagai elemen dari matriks banyak transisi M. Pola transisi (c 3.9) dapat ditulis sebagai m131, (c 3.10) m313, (c 4.11) m13331, dan

(c.3.12) m13232. Dengan demikian, bentuk plot suatu rantai Markov dapat

digambarkan oleh matriks banyak transisinya.

(c 3.12)

3.4 Uji Kesesuaian Suatu Rantai Markov

Seperti yang telah diutarakan sebelumnya, orde rantai Markov ditentukan dengan cara memilih orde yang paling sesuai dari beberapa alternatif pilihan orde yang memungkinkan. Kemudian, yang perlu diperhatikan adalah sangat diharapkan bahwa orde bernilai serendah mungkin. Dari sini diperoleh 2 gambaran mengenai kriteria orde yang tepat yaitu,

(i) Semakin besar orde, semakin cocok model yang dimiliki dengan

kenyataan sebenarnya.

(ii) Orde rantai Markov yang rendah lebih diharapkan daripada orde yang

lebih tinggi karena akan membuat model yang dihasilkan lebih sederhana. Dari kedua poin diatas dapat dikatakan bahwa lebih baik memilih orde yang lebih rendah bila gambaran mengenai rantai makov yang direpresentasikannya tidak berbeda terlalu signifikan jika dibandingkan dengan orde yang lebih tinggi.

Dari paragraf diatas, diperoleh langkah awal dalam melakukan uji kesesuaian. Pertama, asumsikan terlebih dahulu bahwa rantai Markov tersebut Ō(r) dimana r menyatakan orde maksimum yang dikehendaki oleh peneliti atau orde yang masih dapat ditoleransi oleh data. Untuk data pada tabel 1, r = 2 karena untuk r = 3,

(14)

tidak terdapat matriks peluang transisinya. Selanjutnya, bandingkan dengan apa yang terjadi jika rantai Markov tersebut Ō(r-1). Dengan demikian, hipotesisnya adalah,

H0 : penggunaan Ō(r) tidak berbeda dengan Ō(r-1).

H1 : penggunaan Ō(r) berbeda dengan Ō(r-1).

Berdasarkan definisi orde rantai Markov, hipotesis tersebut dapat ditulis sebagai,

0 1 ( 1) 1 ( 1 0 ... ... : ( , , , ) ( , , ) : t t t r t r t t t r ij kl j kl H P V l V k V j V i P V l V k V j H p p − − − − − − − = = = = = = = = = ) dan 1 1 ( 1) 1 ( 1) 1 ... ... : ( , , , ) ( , , ) : t t t r t r t t t r ij kl j kl H P V l V k V j V i P V l V k V j H p p − − − − − − − = = = = ≠ = = = ≠

Berdasarkan Ō(r), transisi dari keadaan i ke l dalam r langkah melalui keadaan j pada satu langkah pertama dan seterusnya hingga melalui k di langkah ke r-1 sebelum ke l terjadi sebanyak mij…kl kali dimana mij…kl merupakan elemen dari

matriks banyaknya transisi M untuk Ō(r).

Sementara itu, mengacu kepada (3.2.15), berdasarkan Ō(r-1) transisi tersebut terjadi sebanyak, ˆ_{ij kl} _{ij k} _{j kl} m =m ×p dimana mij k =m V( t−1=k ,Vt r− −( 1)= j V, t r− =i), 2 ( 1) ( , , ) j kl t t t r p =p V =l V₋ =k V_{− −} = j 1 n ij k ij kl l m m = =

∑

, dan .

Pada paragraf sebelumnya, telah dibahas bahwa dalam melakukan pemilihan antara Ō(r) dengan Ō(r-1), bila gambaran mengenai rantai makov yang direpresentasikannya tidak berbeda terlalu signifikan, orde yang lebih rendah dipilih. Sementara itu, gambaran mengenai rantai Markov dapat direpresentasikan oleh banyaknya peluang transisi m. Dengan demikian, hipotesis H0 : penggunaan

(3.3.1)

(15)

Ō(r) tidak berbeda dengan Ō(r-1), akan didukung bila selisih banyaknya transisi antara Ō(r) dan Ō(r-1) ’kecil’ yaitu,

1 1 1 1 1 1 1 1 ˆ ( ) n n n n n n n n ij kl ij kl ij kl ij k j kl i j k l i j k l m m m m p = = = = = = = = c − = − ≤

∑∑ ∑∑

untuk suatu konstanta c. Masalah berikutnya adalah menentukan seberapa besar c sehingga selisih pada (3.4.1) dapat dianggap ’kecil’.

Sebelumnya, perhatikan sebuah Percobaan Bernoulli dengan dua kemungkinan keluaran, yaitu A1 dan A2 dengan peluangnya masing-masing adalah P(A1) = p1

dan P(A2) = p2 = 1-p1. Suatu sampel acak dari m kali percobaan diamati dimana

m1 dan m2 = m - m1 masing-masing menyatakan banyaknya keluaran dari jenis A1

dan A2. Berdasarkan teorema limit pusat untuk m → ∞,

1 1 1 1 ( ) (0,1) (1 ) m mp Z N mp p − = − ∼ Tulis Y = Z2, maka 2 ( ) ( ) ( ) ( ) 0 0 0 ( ) ( ) G y P Y y P Z y P y Z y y y F y F y = ≤ = ≤ = − ≤ ≤ ⎧ < ⎪ = ⎨ _≥ − − ⎪⎩

Dari, (3.4.2) untuk y≥0 fungsi kepadatan peluang Y,

(

)

₍

₎

2 2 2 2 2 y ( ) ( ) ( ) 1 ( ) ( ) ( ) 2 1 1 1 1 1 1 1 2 2 2 2 2 2 2 y y y y y F y F y G y g y f y f y y y y e e e e e y π π πy π − − − − − ∂ − − ∂ = = = + − ∂ ∂ ⎛ ⎞ ⎛ ⎞ = _⎜ + _⎟= _⎜ + _⎟= ⎝ ⎠ ⎝ ⎠

Dari definisi fungsi beta dimana

1 1 1 0 ( ) ( ) ( , ) (1 ) ( ) p q p q B p q x x dx p q − − Γ Γ = − = Γ +

∫

untuk p = q dan w = 2x-1 maka,

1 2 2 2 2 1 0 ( ) 2 (1 ) (2 ) p p p y d p − − Γ = − Γ

∫

y (3.4.1) (3.4.3)

sehingga untuk p = 0.5 berlaku

(16)

1 2 2 0 1 0 1 1 2 2 2 ₁ 2 (sin ) 2 2 dy y arc y π π ⎛ ⎞ ⎛ ⎞ Γ_{⎜ ⎟}= Γ _{⎜ ⎟}= × ⎝ ⎠ ⎝ ⎠ − ⎛ ⎞ = ×⎜_⎜ ⎟_⎟= ⎝ ⎠ =

∫

×

Berdasarkan (3.4.4) maka fungsi kepadatan peluang Y pada (3.4.3) dapat ditulis,

1 2 2 1 2 2 1 1 ( ) 2 2 0 0 1 0 1 2 2 y y y g y e y e y y y e y π π − − − − − = = 2 < ⎧ ⎪⎪ = ⎨ _≥ ⎛ ⎞ ⎪ Γ⎜ ⎟ ⎪ _{⎝ ⎠} ⎩

yang merupakan fungsi kepadatan peluang distribusi khi kuadrat dengan derajat kebebasan 1. Jadi, 2 2 1 1 (1) 1 1 ( ) (1 ) m mp Y mp p χ − = − ∼

Dengan sedikit manipulasi aljabar, (3.4.5) dapat diubah menjadi,

(

)

(

)

(

)

(

)

2 2 2 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 2 2 2 2 1 1 1 2 2 2 2 (1) 1 ( ) ( ) ( ) (1 ) (1 ) 1 ( ) (1 ) ( ) ( i i) i i m mp m mp m mp mp p mp m p m m m p m mp mp m p m mp m mp mp mp m mp mp χ = − ₌ − ₊ − − − − − − − = + − − − = + − =

∑

∼

Dengan melihat (3.4.6), perhatikan bahwa selisih banyaknya transisi pada (3.4.1) dapat dituliskan sebagai,

(

)

2 1 1 1 1 ( ) n n n n ij kl ij k j kl i j k l ij k j kl m m p c m p ∗ = = = = − ≤

∑∑ ∑∑

dengan c* untuk suatu konstanta real sembarang. Untuk memutuskan seberapa besar c* sehingga selisih tersebut dapat dikatakan ’kecil’, perlu dketahui terlebih

(3.4.4)

(3.4.5)

(3.4.6)

(17)

dahulu distribusi dari (3.4.7). Dengan mengacu kepada (3.4.6) tentu wajar jika ada dugaan bahwa (3.4.7) juga berdistribusi khi kuadrat dengan derajat kebebasan tertentu, sebut saja u. Tentunya hal ini perlu dibuktikan secara matematis. Akan tetapi, pembuktian disini tidak akan disajikan secara mendetail karena diperlukan dasar-dasar aljabar yang kuat dalam penurunannya.

Pertama, misalkan di setiap observasi dari n observasi yang menghasilkan n titik hasil pengamatan dalam sampel, terdapat peluang pi bahwa hasil yang diperoleh

berasal dari himpunan Si. Untuk setiap himpunan dari bilangan bulat non-negatif v1, ..., vn dimana , peluang dimana dari n observasi terdapat tepat v

1 r i i v n = =

∑

i hasil

observasi yang berasal dari Si untuk i = 1, ..., r, diberikan oleh,

1 1 1 ! ! ! r v v r r n p p v v

yang merupakan bentuk umum dari (p1 + ... + pr)n. Jadi, distribusi dari r grup

frekuensi v1, ..., vn adalah perumuman dari distribusi binomial yang dikenal

sebagai distribusi multinomial. Fungsi karakteristik gabungannya adalah,

(

1

)

1 1 exp r r _n it it j j r j E it x p e p e = ⎛ ⎞ = + + ⎜ ⎟ ⎝

∑

⎠ Tulis i i i v np x np i −

= , maka fungsi karakteristik gabungan dari xi adalah,

1 1 1 1 1 1 1 1 1 1 1 ( , , ) exp exp exp e r r j j j j j j j r r j j j r r r j j r j j j j j _j t i v it np r r np j j j j j _j j n t t _{i n} _t _p i i np np r v np t t E it x E it np t E i v it np E e np p e p e e ϕ = = = = = − = = − ⎛ ⎛ ₋ ⎞⎞ ⎛ ⎞ _⎜ _⎟ ⎜ ⎟ = _⎜ _⎟= ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ _⎝ _⎝ _⎠_⎠ ⎛ ⎞ ⎛ ⎛ ⎞⎞ _⎜ ∑ _⎟ ∑ ⎜ ⎜ ⎟⎟ = − = ⎜ ⎟ ⎜ ⎟ ⎜ _⎝ _⎠⎟ _⎜ _⎟ ⎝ ⎠ _⎝ _⎠ ⎛ ⎞ ∑ ⎜ ⎟ = + + ⎜ ⎟ ⎝ ⎠

∑

Dengan uraian MacLaurin, untuk t1,..., tn konstan,

(18)

3 2 ₂ 1 1 1 1 2 1 2 ₂ 1 1 1 log ( , , ) log 1 ( ) 2 1 1 ( ) 2 2 r r r r j j j j j j j j r r j j j j j i t t i n t p n t p t O n n n t t p O n ϕ − = = = − = = ⎡ ⎤ = − + _⎢ + − + _⎥ ⎣ ⎦ ⎛ ⎞ = − + _⎜ _⎟ + ⎝ ⎠

∑

Berdasarkan (3.4.9) maka (3.4.8) menjadi,

2 1 2 2 1 1 1 1 ( ) 2 2 1 ( , , ) r r j j j j j t t p O n r t t e ϕ − = = ⎛ ⎞ ⎜ ⎟ − + _⎜ _⎟ + ⎝ ⎠ ∑ ∑ = Selanjuntya untuk n → ∞, 2 2 1 1 1 1 1 2 ( , , ) 2 1, , ) lim ( r r j j j j j r t t p Q t t r n

ϕ

t t e e = = ⎡ _⎛ _⎞⎤ ⎢ _⎜ _⎟⎥ − _⎢ − _⎥ ⎜ ⎟ ₋ ⎝ ⎠ ⎢ ⎥ ⎣ ⎦ →∞ ∑ ∑ = = Bentuk kuadratik 2 2 1 1 1 ( , , )_r r _j r _j _j j j Q t t t t p = = ⎛ ⎞ = _{− ⎜} _⎟ ⎝ ⎠

∑

dapat ditulis sebagai perkalian matriks dan vektor dimana

dan, t t tΛ 1 2 (t t tr) = t t 1 1 2 1 1 2 2 2 1 2 1 0 0 0 1 0 0 0 1 t r r r r r r r p p p p p p p p p p p p p p p × = − ⎛ ⎞ ⎛ _{⎞ ⎜} _⎟ ⎜ _{⎟ ⎜} _⎟ ⎜ ⎟ = _{− ⎜} _⎟ ⎜ _{⎟ ⎜} _⎟ ⎜ ⎟ ⎜ _{⎟ ⎜} _⎟ ⎝ _{⎠ ⎝} _⎠ I Λ pp

Disini Q(t1, t2, ..., tr) adalah non-negatif dengan rank r-1 (Cramer [6] hal 109-110)

dan matriks Λ memiliki r-1 nilai karakteristik bernilai 1 dan nilai karakteristik

ke-r beke-rnilai nol.

Seiring dengan n → ∞, fungsi karakteristik gabungan x1, x2, ..., xr menuju bentuk

(3.4.11) yang merupakan fungsi karakteristik gabungan distribusi normal singular dengan rank r-1 dan total massa yang terletak pada hyperplane

∑

xj pj =0. Dengan demikian, secara limit, x1, x2, ..., xr terdistribusi normal singular dengan

mean nol dan matriks momen Λ seperti pada (3.3.13).

(3.4.9)

(3.4.10)

(3.4.11)

(3.4.12)

(19)

Selanjutnya, untuk x1, x2, ..., xr berdistribusi normal dengan mean nol dan matriks

momen Λ, maka terdapat transformasi ortogonal y= Cx

r

yang menggantikan variabel lama x = {x1, x2, ..., xr} dengan variabel baru y = {y1, y2, ..., yr} dimana

matriks momen transformasinya, B = CΛCt adalah matriks diagonal dengan r-1 eleman diagonal bernilai 1 dan satu elemen lainnya bernilai nol. Artinya, variabel

y1, y2, ..., yr-1 berdistribusi normal baku dan yr berdistribusi normal dengan mean

dan variansi 0 (Cramer [6] hal 313). Dengan demikian berdasarkan (3.4.5) maka,

1 2 2 2 1 1 1 1 r r r i i i i i i x y − y χ ₋ = = = = =

∑

∼

Dengan demikian, berdasarkan (3.4.14) statistik uji (3.4.7) berdistribusi khi kuadrat dengan derajat kebebasan nr+1– 1 yaitu,

(

)

1 2 1 1 1 1 1 ( ) r n n n n ij kl ij k j kl n i j k l ij k j kl m m p m p χ +− = = = = −

∑∑ ∑∑

∼

Selanjutnya, pada bab berikutnya akan dipaparkan langkah-langkah dalam menggunakan statistik uji (3.4.15) dalam menguji orde barisan basa nukleotida dari spesies Homo Sapiens.

(3.4.14)