MKO dengan Kendala pada Peubah Kontrol
Toni Bakhtiar
Departemen Matematika IPB
MKO berkendala
Kendala persamaan pada peubah kontrol Kendala pertaksamaan pada peubah kontrol Kontrol optimum linear
Kendala pada masalah kontrol optimum sudah dibahas pada bagian sebelumnya, yaitu berupa kendala di titik akhir x(T) =xT atau
x(T) b atau x(T)bebas.
Syarat terpenuhinya kendala tersebut dinyatakan dalam bentuk syarat transversalitas.
Di bagian berikut akan dibahas kendala pada MKO yang harus dipenuhi di sepanjang waktu, [0, T].
Karena MKO melibatkan peubah state dan peubah kontrol, maka MKO berkendala dibedakan atas:
1 MKO dengan kendala pada peubah kontrol: 1 kendala persamaan
2 kendala pertaksamaan 3 kendala isoperimetrik
4 kendala pertaksamaan integral
2 MKO dengan kendala pada peubah state.
Bentuk umum MKO dengan kendala persamaan pada peubah kontrol dan peubah state (mixed constraint) diberikan oleh:
max J = R0Tf(x, u1, u2, t)dt
s.t. ˙x = g(x, u1, u2, t)
h(x, u1, u2, t) = c.
Masalah di atas merupakan bentuk sederhana dari MKO dengan m peubah kontrol dan q kendala persamaan. Disyaratkan, q<m. Dalam kasus di atas, m =2 dan q=1.
Fungsi hamilton:
H =f(x, u1, u2, t) +p(t)g(x, u1, u2, t).
Prinsip maksimum memproses maksimisasi H untuk setiap t 2 [0, T]. Namun kali ini, proses tersebut diberi kendala h(x, u1, u2, t) =c,
Kendala Persamaan
Fungsi lagrange:
L = H+λ(t)(c h(x, u1, u2, t))
= f +pg+λ(c h) Syarat perlu optimalitas:
1 Lu
i =fui +pgui λhui =0, 8t 2 [0, T] (i =1, 2)
2 L
λ=c h=0,h(x, u1, u2, t) =c (kendala pada peubah kontrol)
3 ˙x=Lp , ˙x =Hp , ˙x=g(x, u1, u2, t) (kendala persamaan
diferensial)
4 ˙p= Lx , ˙p= Hx+λhx.
Example
Partai berkuasa yang mengontrol pemerintahan selalu berusaha mempertahankan kekuasaannya melalui penerapan kebijakan yang mendapat dukungan mayoritas dari masyarakat. Dalam model ini,
perhatian difokuskan hanya pada kebijakan ekonomi yang melibatkan dua indikator: tingkat pengangguran U dan tingkat in‡asi p. Reaksi
masyarakat terhadap kebijakan yang dipilih diasumsikan berbentuk
f =f(U, p), fU <0, fp <0,
dengan f dapat dipandang sebagai ukuran yang menggambarkan besarnya dukungan. Hubungan antara U dan p dinyatakan sebagai berikut:
p = φ(U) +aπ, φ0 <0, 0<a 1, ˙π = b(p π), b>0,
Kendala Persamaan
Example
dengan π menyatakan nilai harapan (expectation) dari tingkat in‡asi. Karena ˙π =b(p π) menggambarkan dinamika (equation of motion) dari π, maka π merupakan peubah state.
Karena U memengaruhi p dan kemudian memengaruhi π, maka U merupakan peubah kontrol.
Masalah kontrol optimum:
max J = R0Tf(U, p)ert dt, r <0, s.t. ˙π = b(p π)
p = φ(U) +aπ
π(0) = π0, π(T) free, π0, T given,
Asumsikan: f(U, p) = U2 hp, h >0, φ(U) = j kU, j, k >0. MKO: max J = R0T( U2 h(j kU+aπ))e qt dt, q = r , s.t. ˙π = b(j kU+ (a 1)π) π(0) = π0, π(T)free, π0, T given.
Fungsi hamilton dan CVH:
H = ( U2 h(j kU+aπ))e qt+λb(j kU+ (a 1)π)
Kendala Persamaan (Metode Substitusi)
Prinsip maksimum Pontryagin:
HU =0, 2U +hk mbk =0,U(t) = 12k(h m(t)b) ˙ m mq = Hπ ,m˙ mq =ha mb(a 1) ,m˙ +mQ =ha, dengan Q :=b(a 1) q, sehingga m(t) = ha Q +Ce Qt. STV: m(T) =0, haQ +Ce QT =0,C = haQeQT, sehingga m (t) = ha Q(1 e Q(T t) ) ,λ (t) = ha Qe qt(1 eQ(T t) ). U (t) = kh 2 habk 2Q (1 e Q(T t) ).
Diperoleh: dU dt = kb 2 dm dt = kbha 2 e Q(T t)<0 U (0) = kh 2 hab 2Q(1 e QT ) U (T) = kh 2 >0. dU
dt <0 menyatakan bahwa U merupakan fungsi turun terhadap t,
sehingga kebijakan ekonomi yang optimal ialah menetapkan tingkat pengangguran cukup tinggi segera setelah menang pemilu di awal periode (t =0) dan kemudian membiarkannya turun dalam periode
[0, T].
Kendala Persamaan (Metode Lagrange) MKO: max J = R0Tf(U, p)ert dt s.t. ˙π = b(p π) p = φ(U) +aπ π(0) = π0, π(T)free, π0, T given, Fungsi lagrange: L = f(U, p)ert+λb(p π) +θ(φ(U) +aπ p) = ( U2 hp)ert+λb(p π) +θ(j kU+aπ p). Peubah kontrol: U dan p.
Syarat perlu optimalitas: 1 LU =0, 2Uert θk=0 2 Lp =0, hert+λb θ=0,θ= hert+λb 3 L θ =0,j kU+aπ p=0,p=j kU+aπ 4 ˙π=L λ, ˙π=b(p π) 5 ˙λ= L π, ˙λ=λb θa. Syarat transversalitas.
Dari syarat (1) dan (2):
2Uert+hkert λbk=0, 2U+hk mbk =0. Dari syarat (3) dan (4):
Kendala Persamaan (Metode Lagrange)
Dari syarat (2) dan (5):
˙λ=λb+haert λba , ˙λe rt =λbe rt+ha λbae rt
, ˙λeqt =λbeqt+ha λbaeqt
, ˙λeqt +λqeqt =ha+eqtλ(b+q ab)
, m˙ =ha+m(b(1 a) +q) , m˙ =ha m(b(a 1) q) , m˙ +mQ =ha
Semua syarat yang diperoleh dengan menggunakan Metode Lagrange ekuivalen dengan syarat yang diperoleh dengan menggunakan Metode Substitusi, sehingga solusinya sama.
Pada MKO dengan kendala pertaksamaan, banyaknya peubah kontrol tidak harus melebihi banyaknya kendala pertaksamaan seperti pada kasus sebelumnya.
Kendala pertaksamaan memberikan lebih banyak keleluasaan daripada kendala persamaan.
Bentuk umum dengan r peubah kontrol dan q kendala pertaksamaan:
max J = R0Tf(x, u, t)dt s.t. ˙x = g(x, u, t)
h(x, u, t) 0,
dengan x 2Rn, u2 Rr, h2 Rq dan 1 q r n.
Kendala pertaksamaan dapat diubah menjadi kendala persamaan: h(x, u, t) ξ2 =0,
Kendala Pertaksamaan Theorem (Berkovitz, 1961) Untuk MKO: opt J = R0Tf(x, u, t) dt s.t. ˙x = g(x, u, t) h(x, u, t) 0, de…nisikan H = f +pg ¯ H = f +pg+λh=H+λh.
Theorem (Berkovitz, 1961)
Syarat perlu optimalitas bagi u sehingga mengoptimumkan ialah:
1 p 6=0 2 H¯u =0,Hu+λhu =0 3 ˙p= H¯x , ˙p= (Hx+λhx) 4 ˙x =Hp , ˙x =g 5 λ 0, h 0, λh=0 (maksimisasi), λ 0, h 0, λh=0 (minimisasi)
Kendala Pertaksamaan
Jika kendala peubah kontrol berbentuk m u M (seperti misalnya
juj 1), maka untuk masalah maksimisasi berlaku: Hu 8 < : 0 jika u =M =0 jika m<u <M 0 jika u =m. . Ingat kembali umin umax u H umin umax u H
Kendala peubah kontrol berbentuk m u M dapat ditulis menjadi
(m u) dan (u M), (u m 0) dan (M u 0), sehingga dapat dide…nisikan
h1 : =M u,
h2 : =u m.
Untuk kasus juj 1 dapat dide…nisikan h1 : =1 u,
Kendala Pertaksamaan
Example
Selesaikan MKO berikut:
min J = 12[10x2(10) x1(10)] + R10 0 1 2u 2 dt s.t. ˙x1 = x2 ˙x2 = u x1(0) = 0 x2(0) = 20 x1(10) free, x2(10)free.
Peubah kontrol u takberbatas,
Kasus 1 Peubah kontrol u tak berbatas De…nisikan fungsi hamilton
H = 12u2+p1x2 p2u.
Prinsip maksimum Pontryagin memberikan:
1 Hu =0,u p2=0,u =p2. 2 ˙p1= Hx 1 , ˙p1 =0,p1 =A. 3 ˙p2= Hx 2 , ˙p2 = p1 ,p2 = At+B. 4 Syarat transversalitas p(10) =S x(10) memberikan 1 p1(10) =Sx 1(10),A= 1 2 2 p2(10) =Sx 2(10),5+B =5,B=0.
Kendala Pertaksamaan
Diperoleh
p1(t) = 12, p2(t) = 12t, u (t) = 12t.
Selanjutnya dari kendala persamaan diferensial dan syarat batas diperoleh:
x2(t) = 14t2+20, x1(t) = 121t3+20t.
Kasus 2 Peubah kontrol u memenuhi 1 u 3. De…nisikan: h1 = 3 u, h2 = u 1, ¯ H = H+λh = 12u2+p1x2 p2u+λ1(3 u) +λ2(u 1).
Syarat kedua Teorema Berkovitz memberikan ¯
Hu =0 , u p2 λ1+λ2 =0
, u =p2+λ1 λ2.
Proses pengoptimuman dibagi menjadi dua kasus:
1 Interior optimization: 1<u <3
Kendala Pertaksamaan
Interior optimization Karena 1<u <3 maka
h1 = 3 u >0
h2 = u 1>0,
sehingga syarat kelima λ 0, h 0, λh=0 (minimisasi) memberikan λ1 =λ2 =0.
Akibatnya,
u =p2 ,1<p2<3.
Boundary optimization: u =umax,u =3 :
h1 = 3 u=0)λ1 0
Diperoleh
u =p2+λ1 λ2 , u =p2+λ1
, u p2 (karena λ1 0)
, 3 p2.
Boundary optimization: u =umin ,u=1 :
h1 = 3 u =2>0)λ1 =0 h2 = u 1=0)λ2 0. Diperoleh u =p2+λ1 λ2 , u =p2 λ2 , u p2 (karena λ2 0) , 1 p2.
Kendala Pertaksamaan Dengan demikian, u = 8 < : 1 ; p2 1 p2 ; 1<p2 <3 3 ; p2 3 ,
atau dengan menggunakan hasil Kasus 1, yaitu p2(t) = 12t, diperoleh
u (t) = 8 < : 1 ; 12t 1 1 2t ; 1< 1 2t<3 3 ; 12t 3 = 8 < : 1 ; 0 t 2 1 2t ; 2<t <6 3 ; 6 t 10 .
Kontrol optimum: 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3
t
u*
Kendala Pertaksamaan Pengganda lagrange: (1<u <3) ) λ1 =λ2 =0, (u =3) ) λ1 =u p2 =3 p2, λ2 =0, (u =1) ) λ1 =0, λ2 =p2 u =p2 1, atau λ1(t) = 8 < : 0 ; 0 t 2 0 ; 2<t <6 3 12t ; 6 t 10 , λ2(t) = 8 < : 1 2t 1 ; 0 t 2 0 ; 2<t <6 0 ; 6 t 10 .
Karena ˙x2 = u dan x2(0) =20 maka ˙x2 = 8 < : 1 ; 0 t 2 1 2t ; 2<t <6 3 ; 6 t 10 )x2= 8 < : t+20 ; 0 t 2 1 4t 2+B ; 2<t <6 3t+C ; 6 t 10 .
Karena ˙x1 =x2 dan x1(0) =0 maka
˙x1 = 8 < : t+20 ; 0 t 2 1 4t2+B ; 2<t <6 3t+C ; 6 t 10 x1 = 8 < : 1 2t2+20t ; 0 t 2 1 12t 3+Bt+D ; 2<t <6 3 2t 2+Ct+E ; 6 t 10 .
Kendala Pertaksamaan
Parameter B, C , D, E dipilih sedemikian sehingga x1 dan x2 kontinu
(B =19, C =28, D = 23, E = 523). Jadi, x1(t) = 8 < : 1 2t 2+20t ; 0 t 2 1 12t3+19t+ 2 3 ; 2<t<6 3 2t 2+28t 52 3 ; 6 t 10 , x2(t) = 8 < : t+20 ; 0 t 2 1 4t2+19 ; 2<t <6 3t+28 ; 6 t 10 .
1 2 3 4 5 6 7 8 9 10 -20 0 20 40 60 80 100 120
t
x
Solusi Numerik (Metode Runge-Kutta Orde-4)
Sistem persamaan diferensial:
˙x1 = x2, x1(0) =0
˙x2 = u, x2(0) =20
˙p1 = 0, p1(10) = 12
˙p2 = p1, p2(10) =5
u = p2, 1 u 3.
Baris terakhir dapat ditulis menjadi:
Problem
Selesaikan MKO berikut:
min J = R02(12u2 x) dt s.t. ˙x = u
x(0) = 1, x(2) free. Peubah kontrol u tak berbatas,
Kendala Pertaksamaan
Problem
Selesaikan MKO berikut:
min J = R02(12u2 x) dt s.t. ˙x = u+x
x(0) = 1, x(2) free. Peubah kontrol u tak berbatas,
Di beberapa kasus, fungsi hamilton memiliki bentuk linear terhadap peubah kontrol u, sehingga dapat dituliskan sebagai:
H=ψ(x, p, t) +σ(x, p, t)u.
Secara umum ekstremum dari MKO tidak ditemukan karena
Hu =0,σ(x, p, t) =0, sehingga u tidak dapat ditentukan.
Namun jika peubah kontrol u berbatas, misalnya m u M, maka H mencapai maksimum/minimum jika dan hanya jika
u = M ; σ>0
m ; σ<0 , u =
m ; σ>0 M ; σ<0 . u di atas disebut bang-bang control dan fungsi σ(x, p, t) disebut sebagai fungsi switching.
Misalkan: 1 u 3 -1 1 2 3 2 4 6
u
H
H =1+2u -1 1 2 3 -4 -2 2u
H
H =1 2uExample
Diberikan masalah kontrol optimum berikut:
min J = R0T dt s.t. ˙x = x+u
x(0) = 5, x(T) =11, T bebas, u 2 [ 1, 1]
Tentukan kontrol optimum u , trajektori optimum x , dan waktu T .
Solution
Diperoleh fungsi hamilton (linear terhadap u) berikut:
Solution
Karena H linear terhadap u dan u memenuhi 1 u 1 maka kontrol optimum untuk masalah minimisasi diberikan oleh bang-bang control berikut:
u (t) = 1 ; p(t) >0
1 ; p(t) <0 . Prinsip maksimum Pontryagin memberikan:
˙p= Hx , ˙p = p ,p(t) =Ae t.
Karena T bebas maka syarat transversalitas memberikan
Hjt=T =0 , 1+p(T)x(T) +p(T)u =0
, 1+11Ae T +u Ae T =0
Solution
Karena u =1 atau u = 1 maka 11+u >0, sehingga
A= 1
(11+u )e T =
eT 11+u <0.
Karena A<0 maka p(t) =Ae t <0, akibatnya u (t) =1.Selanjutnya dari kendala persamaan diferensial diperoleh
˙x =x+u , ˙x =x+1,x(t) =Bet 1. Dari syarat awal dan syarat batas:
x(0) =5 , B 1=5,B =6)x (t) =6et 1, x(T) =11 , 6eT 1=11,eT =2,T =ln 2.
Solution (Alternatif)
Solusi bang-bang di atas dapat juga ditunjukkan sebagai berikut. MKO dapat dipandang sebagai MKO dengan kendala pertaksamaan berikut:
min J = R0T dt s.t. ˙x = x+u
h1(u) 0
h2(u) 0
x(0) = 5, x(T) =11, T bebas,
dengan h1(u):=1 u dan h2(u) =1+u. De…nisikan fungsi lagrange
¯
Solution (Alternatif)
Diperoleh
¯
Hu =0,p λ1+λ2 =0,
sehingga kontrol optimum u tidak dapat ditentukan dari kondisi ini. Hal ini berarti interior optimization tidak memberikan solusi. Boundary optimization dengan u = 1 memberikan
h1(u) = 2>0
h2(u) = 0,
sehingga syarat (λ1 0, h1 0, λ1h1 =0) dan
(λ2 0, h2 0, λ2h2=0)memberikan λ1 =0 dan λ2 0. Akibatnya
Solution (Alternatif)
Jika u =1 maka
h1(u) = 0
h2(u) = 2>0,
sehingga syarat (λ1 0, h1 0, λ1h1 =0) dan
(λ2 0, h2 0, λ2h2=0)memberikan λ1 0 dan λ2 =0. Akibatnya
p λ1+λ2 =0,p λ1 =0)p = λ1 0.
Diperoleh kontrol optimum yang sama:
u (t) = 1 ; p(t) >0
Example
Selesaikan MKO berikut:
max J = R01(2x x2)dt s.t. ˙x = u
x(0) = 0, x(1) =0,
juj 1.
Solution
Diperoleh fungsi hamilton yang linear terhadap u:
H=2x x2+pu, dengan p merupakan fungsi switching.
Solution
Kontrol optimum diberikan oleh:
u (t) = 1 ; p(t) >0
1 ; p(t) <0 . Selanjutnya diperoleh syarat optimalitas berikut:
˙p= Hx , ˙p = 2+2x =2(x 1). Perhatikan bahwa: ˙x =u 1, dx dt 1,dx dt ,x t. Karena t 2 [0, 1]maka x 1,x 1 0,2(x 1) 0, ˙p 0.
Solution
Fakta ˙p 0 mengatakan bahwa p merupakan fungsi turun terhadap t. Akan ditinjau tiga kasus p(t)seperti diilustrasikan gambar berikut:
p(t) >0 p(t) <0 p(t)berubah tanda Kasus 1: Andaikan p(t) >0 untuk semua t 2 [0, 1]. Akibatnya,
u (t) =1) ˙x =1,x (t) =t+A.
Syarat awal x(0) =0 memberikan x (t) =t sehingga x(1) =1. Kontradiksi dengan syarat batas x(1) =0. Haruslah p(t) 0.
Solution
Kasus 2: Andaikan p(t) <0 untuk semua t 2 [0, 1]. Akibatnya, u (t) = 1) ˙x = 1,x (t) = t+B.
Syarat awal x(0) =0 memberikan x (t) = t dan x(1) = 1. Kontradiksi dengan syarat batas x(1) =0. Haruslah p(t) 0. Kasus 3: Dari dua pengandaian di atas, haruslah p(t)berubah tanda pada t 2 [0, 1], yaitu p(t) >0 pada t2 [0, t ) dan p(t) <0 pada t 2 (t , 1].
Solution
Pada [0, t )diketahui p(t) >0, sehingga
u (t) =1) ˙x =1,x (t) =t+A. Syarat awal x(0) =0 memberikan x (t) =t.
Pada (t , 1]diketahui p(t) <0, sehingga
u (t) = 1) ˙x = 1,x (t) = t+B. Syarat batas x(1) =0 memberikan x (t) = t+1. Agar x(t)kontinu di t =t haruslah
Solution Jadi, u (t) = 1 ; 0 t < 1 2 1 ; 12 <t 1 , x (t) = t ; 0 t 1 2 1 t ; 12 <t 1 .
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -1.0 -0.5 0.0 0.5 1.0
t
u,x
Solution Fungsi adjoin: ˙p= 2+2x = 2t 2 ; 0 t 1 2 2t ; 12 <t 1 . Jadi, p (t) = t 2 2t+A ; 0 t 1 2 t2+B ; 1 2 <t 1 .
Parameter A dan B ditentukan dari
t 2 2t +A= 0 = t 2+B 1 4 1+A= 0 = 1 4+B A= 34 dan B = 14.
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6
t
p
Problem
Diberikan masalah kontrol optimum berikut:
max J = R0104x dt s.t. ˙x = x+u
x(0) = 5, x(10)bebas, u 2 [0, 2]