Solusi Filter Kalman Semi-infinite Positif untuk Solusi Sistem Diskrit
Budi Rudianto1, Narwen2
Jurusan Matematika FMIPA Universitas Andalas Kampus UNAND Limau Manis, Padang 25163
[email protected] Abstrak
Pada makalah ini dibahas Solusi Masalah Filter Kalman Deterministik Diskrit pada interval yang semi-infinite untuk model kontrol pelacakan linear-kuadrat dengan kondisi awal tidak tetap. Dengan memperhatikan solusi masalah deterministik dan ruang keadaan filter Kalman, akan ditentukan nilai π₯, π’, π₯0 agar fungsi tujuan pada persamaan π½ π₯, π’, π₯0 = min12 βπ=1 π’πππ ππ’π + (πΆπ₯ πβ π¦ π)ππ(πΆπ₯ π β π¦ )π menjadi optimal.
Kata kunci: Filter Kalman deterministik, interval semi-infinite 1 Pendahuluan
Sontag [4] menjelaskan tentang analogi deterministik dari masalah Filter Kalman pada interval-finite. Model deterministik memungkinkan perluasan secara alami menjadi interval yang semi-infinite. Perluasan interval ini menjadi menarik karena untuk masalah kontrol stokastik dengan linear-kuadrat dapat diperluas menjadi interval semi- infinite yang mengarah kepada kelengkapan fungsi tujuan (lihat contoh [1]). Menurut Sontag [4], model yang akan diperhatikan adalah model yang berbentuk
π½ π₯, π’, π₯0 = π’0+β ππ π’ + (πΆπ₯ β π¦ )ππ(πΆπ₯β π¦ ) ππ‘ , (1) π₯ = π΄π₯ + π΅π’ , (2) π₯ 0 = π₯0 , (3) Selanjutnya, diasumsikan bahwa pasangan π₯, π’ β ππ₯0+ π , dengan π adalah subruang vektor pada Ruang Hilbert πΏπ2[0, +β) Γ πΏπ2[0, +β) , (dengan πΏπ2[0, +β) Ruang Hilbert pada π π sebagai nilai fungsi kuadrat yang terintegralkan). Sementara itu, π didefinisikan sebagai
π = π₯, π’ β πΏπ2 0, +β Γ πΏπ2 0, +β , π₯ β πΏπ2 0, +β , π₯ = π΄π₯ + π΅π’ , π₯ 0 = π₯0
Perhatikan bahwa A adalah matriks bujursangkar berukuran π Γ π, B matriks bujursangkar berukuran π Γ π, π = π π matriks berukuran π Γ π dan definit postif, π = ππ matriks berukuran π Γ π dan definit postif , C matriks berukuran π Γ π.
Sedangkan nilai π¦ , ditentukan oleh π¦ β πΏπ2 0, +β .
2 Metode Penelitian
Pada makalah ini dapat diperhatikan bahwa pada persamaan (1)-(3) untuk π₯0 yang tidak ditentukan, maka untuk memenuhi kriteria tersebut haruslah semua peubah berbentuk
π₯, π’, π₯0 β πΏπ2 0, +β Γ πΏπ2 0, +β Γ π π.
Sehingga interpretasi persamaan (1)-(3) merupakan estimasi dari bentuk : π₯ = π΄π₯ + π΅π’,
π¦ = πΆπ₯ + π£,
Selanjutnya, akan ditentukan nilai π₯ yang memenuhi pengamatan π¦ dengan melakukan minimisasi perturbasi π’, π£ dan memilih kondisi awal π₯0.
3 Hasil Dan Pembahasan
Solusi Masalah Deterministik
Misalkan persamaan aljabar Riccati diberikan sebagai :
πΎπ΄ + π΄ππΎ + πΎπΏπΎ β πΆπππ = 0 , (4) dengan πΏ = π΅π β1π΅π . Selanjutnya, dengan mengasumsikan bahwa pasangan π΄, π΅ dapat distabilkan (stabilizable) dan pasangan πΆ, π΄ dapat dideteksi (detectable), maka terdapat solusi simetrik πΎπ π‘ yang definit negatif pada (4) sedemikian hingga matriks π΄ + πΏπΎπ π‘ adalah stabil. Dengan menggunakan hasil pada [2], dapat dijelaskan bahwa untuk π₯0 yang ditentukan akan diperoleh solusi optimal.
Karena terdapat solusi unik
π0 β πΏπ2 0, +β
yang memenuhi persamaan differensial berikut :
π = β π΄ + πΏπΎπ π‘ ππ β πΆπππ¦ (5)
Maka, secara eksplisit π0 dapat dinyatakan dalam persamaan :
π0 π‘ = expβ‘[0+β π΄ + πΏπΎπ π‘ ππ] πΆπππ¦ π‘ + π ππ. (6) Solusi optimal π₯, π’ pada persamaan (1)-(3) memiliki bentuk persamaan
π₯ = π΄ + πΏπΎπ π‘ π₯ + πΏπ0, dan π₯ 0 = π₯0 (7) π’ = π β1π΅π πΎπ π‘π₯ + π0 (8) Karena π0 tidak bergantung pada π₯0, maka untuk menyelesaikan permasalahan pada persamaan (1)-(3) dapat diselesaikan dengan menentukan nilai minimal dari fungsional (1) terhadap π₯0.
Teorema 1. Jika diberikan π₯, π’ sebagai solusi optimal persamaan (1)-(3) dengan π₯0 tetap yang diperoleh dari persamaan (5)-(8). Maka
π½ π₯, π’, π₯0 = βπ₯0ππΎπ π‘π₯0β 2π0 0 ππ₯0+ π¦ 0+β πππ¦ β π0ππΏπ0 ππ‘. (9)
Perhatikan bahwa π½ π₯, π’, π₯0 merupakan fungsi konveks dari π₯0, dan nilai minimum dari π½ π₯, π’, π₯0 yang dipenuhi oleh nilai
π₯0πππ‘ = βπΎπ π‘β1π0 0 (10)
Sehingga persamaan (5)-(8) memberikan solusi lengkap untuk persamaan awal (1)-(3).
Bukti. Misalkan π¦, π€ β ππ₯0+ π sebagai solusi fisibel untuk persamaan (1)-(3), dengan π₯0 ditentukan. Tetapkan persamaan berikut :
β π¦, π€ = π€ β π β1π΅π πΎπ π‘π¦ + π0 ]ππ π€ β π β1π΅π πΎπ π‘π¦ + π0 . yang bergantung pada waktu. Sementara itu β π₯, π’ = 0. Oleh karena itu
β π¦, π€ = β1+ β2+ β3 dengan
β1= π€ππ π€
β2= β2 πΎπ π‘π¦ + π0 ππ΅π€
β3= πΎπ π‘π¦ + π0 ππΏ πΎπ π‘π¦ + π0 Selanjutnya pilih π΅π€ = π¦ β π΄π¦. Akibatnya, diperoleh
β2= β2 π¦ππΎπ π‘+ π0π π¦ β π΄π¦
Sehingga diperoleh
β2= π¦π πΎπ π‘π΄ + π΄ππΎπ π‘ π¦ β 2π¦ππΎπ π‘π¦ β 2π0ππ¦ + 2πππ΄π¦, β3= π¦ππΎπ π‘πΏπΎπ π‘π¦ + π0ππΏπ0+ 2π0ππΏπΎπ π‘π¦
Akibatnya diperoleh
β π¦, π€ = π€ππ π€ + π0ππΏπ0 + π¦π πΎπ π‘πΏπΎπ π‘ + πΎπ π‘π΄ + π΄ππΎπ π‘ π¦ βππ‘π(π¦ππΎπ π‘π¦)
β 2ππ‘π(π0ππ¦) + 2π0ππ¦ + 2π0ππ¦ + 2π0ππΏπΎπ π‘π¦ + 2π0ππ΄π¦.
Dengan menggunakan persamaan (4) dan (5), diperoleh
β π¦, π€ = π€ππ π€ + π0ππΏπ0+ π¦ππΆπππΆπ¦ βππ‘π(π¦ππΎπ π‘π¦) β 2ππ‘π(π0ππ¦) β 2 πΆπππ¦ ππ¦
Jadi
β π¦, π€ = π€ππ π€ + π0ππΏπ0βππ‘π(π¦ππΎπ π‘π¦) β 2ππ‘π(π0ππ¦) β π¦ β πΆπ¦ ππ π¦ β πΆπ¦ β π¦ πππ¦ .
Sehingga, dengan mengambil nilai π0(π‘) β 0, kemudian π¦(π‘) β 0, dan π‘ β +β, akan diperoleh persamaan
β π¦, π€ ππ‘
+β
0
= [π€ππ π€ + π¦ β πΆπ¦ ππ π¦ β πΆπ¦ ] ππ‘
+β
0
+ π+β 0ππΏπ0 β π¦ πππ¦ ππ‘ + 2π0(0)ππ₯0+ π₯0πΎπ π‘
0
π₯0
Jadi diperoleh
β π¦, π€ ππ‘+β
0
= π½ π¦, π€, π₯0 + 2π0(0)ππ₯0+ π₯0πΎπ π‘π₯0+ π
dengan
π = π0ππΏπ0β π¦ πππ¦ ππ‘
+β
0
Akibatnya, β π¦, π€ β₯ 0 dan β π₯, π’ β‘ 0. Hal ini menunjukkan bahwa π₯, π’ merupakan solusi optimal pada persamaan (1)-(3), untuk nilai π₯0 ditentukan dan terbukti persamaan (9). β
Steady State Filter Kalman Deterministik
Perhatikan persamaan (10), dengan menggunakan proses
π§ π‘ = βπΎπ π‘β1π0 π‘ , dengan π‘ β [0, +β) (11) sebagai estimasi solusi optimal persamaan (1)-(3). Selanjutnya akan ditentukan persamaan differensial dari π§ π‘ .
Proposisi 1. Perhatikan bahwa persamaan differensial π§ π‘ dapat dinyatakan sebagai :
π§ = π΄π§ + πΎπ π‘β1πΆππ π¦ β πΆπ§ (12) Perhatikan bahwa πΎπ π‘β1 merupakan solusi untuk persamaan aljabar
πΏ β ππΆπππΆπ + π΄π + ππ΄π = 0. (13) Selanjutnya persamaan differensial (12) merupakan analog deterministik untuk persamaan differensial stokastik yang menjelaskan estimasi optimal sebagai keadaan yang steady (steady state) pada masalah filter Kalman.
Bukti. Dengan menggunakan persamaan (5) dan persamaan (11), diperoleh : π§ = πΎπ π‘β1 π΄ + πΏπΎπ π‘ ππ0+ πΎπ π‘β1πΆπππ¦
= β(πΎπ π‘β1π΄π + πΏ)(πΎπ π‘π§) + πΎπ π‘β1πΆπππ¦ Sehingga πΎπ π‘ merupakan solusi dari persamaan (4), akibatnya diperoleh
βπΎπ π‘β1π΄ππΎπ π‘ β πΏπΎπ π‘ = π΄ β πΎπ π‘β1πΆπππΆ ,
sehingga
π§ = π΄π§ β πΎπ π‘β1πΆπππΆπ§ + πΎπ π‘β1πΆπππ¦ .
Oleh sebab itu, terpenuhilah bahwa
π§ = π΄π§ + πΎπ π‘β1πΆππ π¦ β πΆπ§ β
4 Solusi Masalah Deterministik Diskrit
Perhatikan bahwa untuk kasus diskrit persamaan (1)-(3), dapat dinyatakan sebagai π½ π₯, π’, π₯0 = min12 βπ=1 π’πππ ππ’π+ (πΆπ₯ πβ π¦ π)ππ(πΆπ₯ πβ π¦ )π (14)
π₯π+1 = π΄π₯π+ π΅π’π , (15) π₯ 0 = π₯0 , (16)
Selanjutnya π₯ menyatakan barisan π₯π β π π untuk π = 0 β¦ β. Dapat diperoleh bahwa π₯ β πΌ2π(π) jika βπ=1 π₯π 2 < β. Dan π₯, π’ β.
Seperti pada kasus kontinu, diasumsikan bahwa pasangan π₯, π’ β ππ₯0+ π, dengan Z adalah subruang dari Ruang Hilbert πΌ2π π Γ πΌ2π π . Pandang hasil kali dalam pada H memenuhi persamaan
π₯, π¦ , π’, π£ π» = π₯π, π’π + π¦π, π£π
β
π=0
Sedangkan subruang Z, berbentuk :
π = π₯, π’ β π»: π₯π+1 = π΄π₯π + π΅π’π, π = 0,1, β¦ , π₯0 = 0
Pada persamaan (14)-(16) merupakan estimasi masalah dari bentuk : π₯π+1 = π΄π₯π+ π΅π’π
π¦ π = πΆπ₯π+ π·π£π, (17) Dengan tujuan dicari π₯ sedemikian hingga π¦ diperoleh melalui meminimumkan perturbasi u dan v, serta kondisi awal π₯0.
Selanjutnya dapat ditentukan bahwa cost function masalah kontrol linear kuadratik diskrit dengan pendekatan linier pada cost function dapat berbentuk
π½ π₯, π’, π₯0 = min1
2 π₯πππππ₯π+ π’πππ ππ’π +
β
π=1
π₯ππππ + π’ππβ π
Solusi dari persamaan tersebut dapat dijelaskan dengan pendekatan Persamaan Riccati, yaitu
πΎ = π΄ππΎπ΄ β π΄ππΎπ΅(π + π΅ππΎπ΅)β1(π΄ππΎπ΅)π + π
Asumsikan bahwa persamaan tersebut mempunyai solusi definit positif πΎπ π‘, maka dari persamaan
π½ π₯, π’, π₯0 = min1
2 π’πππ ππ’π+ (πΆπ₯ πβ π¦ π)ππ(πΆπ₯ πβ π¦ )π
β
π=1
Diperoleh bahwa ππ = βπΆπππ¦ π, dan β π = 0, dengan π = 0,1, β¦, oleh karena itu π = π π πΌ2π π
Sehingga
ππ = π΄π β (π΄ππΎπ π‘π΅)(π + π΅ππΎπ π‘π΅)β1π΅πππ+1+ πΆπππ¦ π Selanjutnya dengan menyatakan
π = (π + π΅ππΎπ π‘π΅) Dan πΏ = π΅π β1π΅π, sehingga diperoleh
ππ = π΄π β π΄ππΎπ π‘πΏ ππ+1 + πΆπππ¦ π Sedangkan
πΎ = π΄ππΎπ΄ β π΄ππΎπ΅ π β1 π΄ππΎπ΅ π + πΆπππΆ, atau
πΎ = π΄ππΎπ΄ β π΄ππΎπΏπΎπ΄ + πΆπππΆ.
Akibatnya solusi optimal pada persamaan (14)-(16) akan diperoleh, jika π₯π+1 = (π΄π β π΄ππΎπ π‘πΏ)ππ₯π+ πΏπ π +1
π’π = βπ β1π΅ππΎπ π‘π΄π₯π+ π β1π΅ππ π+1.
Kesimpulan
Persamaan differensial (12) merupakan salah satu estimasi dari π§ π‘ yang didasarkan pada pengamatan π¦ , sehingga diperoleh π§ 0 = π₯0πππ‘, dengan
π§ 0 = βπΎπ π‘β1 0+βexpβ‘[ π΄ + πΏπΎπ π‘ ππ] πΆπππ¦ π ππ .
Untuk kasus deterministik diskrit persamaan (14)-(16) akan memperoleh solusi optimal, jika
π₯π+1 = (π΄π β π΄ππΎπ π‘πΏ)ππ₯π+ πΏπ π +1 π’π = βπ β1π΅ππΎπ π‘π΄π₯π+ π β1π΅ππ π+1.
Daftar Pustaka
[1] M. H. A. Davis. 1997. Linear Estimation and Stochastic Control, Chapman and Hall, London.
[2] L. Faybusovich and T. Mouktonglang. 2003. Linear-Quadratic Control Problem with a Linear Term on Semi-infinite Interval: Theory and Applications, Technical Report, University of Notre Dame.
[3] L. Faybusovich, T. Mouktonglang and T. Tsuchiya (2006). Implementation of infinite dimensional interior point method for solving multi criteria linear-quadratic control problem, Optm. Methods Softw. 2(2): 315-341.
[4] E. D. Sontag, 1990. Mathematical Control Theory, Springer.
[5] W. M. Wonham, 1974. Linear Multivariable Control: A Geometric Approach, Springer.