Kontrol Optimum. MKO dengan Kendala pada Peubah Kontrol. Toni Bakhtiar. Departemen Matematika IPB. Februari 2017

(1)

MKO dengan Kendala pada Peubah Kontrol

Toni Bakhtiar

Departemen Matematika IPB

(2)

MKO berkendala

Kendala persamaan pada peubah kontrol Kendala pertaksamaan pada peubah kontrol Kontrol optimum linear

(3)

Kendala pada masalah kontrol optimum sudah dibahas pada bagian sebelumnya, yaitu berupa kendala di titik akhir x(T) =xT atau

x(T) b atau x(T)bebas.

Syarat terpenuhinya kendala tersebut dinyatakan dalam bentuk syarat transversalitas.

Di bagian berikut akan dibahas kendala pada MKO yang harus dipenuhi di sepanjang waktu, [0, T].

Karena MKO melibatkan peubah state dan peubah kontrol, maka MKO berkendala dibedakan atas:

1 MKO dengan kendala pada peubah kontrol: 1 _{kendala persamaan}

2 kendala pertaksamaan 3 kendala isoperimetrik

4 kendala pertaksamaan integral

2 _{MKO dengan kendala pada peubah state.}

(4)

Bentuk umum MKO dengan kendala persamaan pada peubah kontrol dan peubah state (mixed constraint) diberikan oleh:

max J = R₀Tf(x, u1, u2, t)dt

s.t. ˙x = g(x, u1, u2, t)

h(x, u1, u2, t) = c.

Masalah di atas merupakan bentuk sederhana dari MKO dengan m peubah kontrol dan q kendala persamaan. Disyaratkan, q<m. Dalam kasus di atas, m =2 dan q=1.

Fungsi hamilton:

H =f(x, u1, u2, t) +p(t)g(x, u1, u2, t).

Prinsip maksimum memproses maksimisasi H untuk setiap t _{2 [}0, T]. Namun kali ini, proses tersebut diberi kendala h(x, u1, u2, t) =c,

(5)

Kendala Persamaan

Fungsi lagrange:

L = H+λ(t)(c h(x, u1, u2, t))

= f +pg+λ(c h) Syarat perlu optimalitas:

1 _L_u

i =fui +pgui λhui =0, 8t 2 [0, T] (i =1, 2)

2 _L

λ=c h=0,h(x, u1, u2, t) =c (kendala pada peubah kontrol)

3 _˙x₌_L_p _, _˙x ₌_H_p _, _˙x₌_g₍_{x, u}₁_{, u}₂_{, t}₎ _{(kendala persamaan}

diferensial)

4 _˙p₌ _L_x _, _˙p₌ _H_x₊_λh_x_.

(6)

Example

Partai berkuasa yang mengontrol pemerintahan selalu berusaha mempertahankan kekuasaannya melalui penerapan kebijakan yang mendapat dukungan mayoritas dari masyarakat. Dalam model ini,

perhatian difokuskan hanya pada kebijakan ekonomi yang melibatkan dua indikator: tingkat pengangguran U dan tingkat in‡asi p. Reaksi

masyarakat terhadap kebijakan yang dipilih diasumsikan berbentuk

f =f(U, p), fU <0, fp <0,

dengan f dapat dipandang sebagai ukuran yang menggambarkan besarnya dukungan. Hubungan antara U dan p dinyatakan sebagai berikut:

p = φ(U) +aπ, φ0 <0, 0<a 1, ˙π = b(p π), b>0,

(7)

Kendala Persamaan

Example

dengan π menyatakan nilai harapan (expectation) dari tingkat in‡asi. Karena ˙π =b(p π) menggambarkan dinamika (equation of motion) dari π, maka π merupakan peubah state.

Karena U memengaruhi p dan kemudian memengaruhi π, maka U merupakan peubah kontrol.

Masalah kontrol optimum:

max J = R₀Tf(U, p)ert dt, r <0, s.t. ˙π = b(p π)

p = φ(U) +aπ

π(0) = π0, π(T) free, π0, T given,

(8)

Asumsikan: f(U, p) = U2 hp, h >0, φ(U) = j kU, j, k >0. MKO: max J = R₀T( U2 h(j kU+aπ))e qt dt, q = r , s.t. ˙π = b(j kU+ (a 1)π) π(0) = π0, π(T)free, π0, T given.

Fungsi hamilton dan CVH:

H = ( U2 h(j kU+aπ))e qt+λb(j kU+ (a 1)π)

(9)

Kendala Persamaan (Metode Substitusi)

Prinsip maksimum Pontryagin:

HU =0, 2U +hk mbk =0,U(t) = 1₂k(h m(t)b) ˙ m mq = _Hπ ,m˙ mq =ha mb(a 1) ,m˙ +mQ =ha, dengan Q :=b(a 1) q, sehingga m(t) = ha Q +Ce Qt_. STV: m(T) =0_, ha_Q +Ce QT =0_,C = ha_QeQT, sehingga m (t) = ha Q(1 e Q(T t) ) ,λ (t) = ha Qe qt₍₁ _eQ(T t) ). U (t) = kh 2 habk 2Q (1 e Q(T t) ).

(10)

Diperoleh: dU dt = kb 2 dm dt = kbha 2 e Q(T t)_<₀ U (0) = kh 2 hab 2Q(1 e QT ) U (T) = kh 2 >0. dU

dt <0 menyatakan bahwa U merupakan fungsi turun terhadap t,

sehingga kebijakan ekonomi yang optimal ialah menetapkan tingkat pengangguran cukup tinggi segera setelah menang pemilu di awal periode (t =0) dan kemudian membiarkannya turun dalam periode

[0, T].

(11)

Kendala Persamaan (Metode Lagrange) MKO: max J = R₀Tf(U, p)ert dt s.t. ˙π = b(p π) p = φ(U) +aπ π(0) = π0, π(T)free, π0, T given, Fungsi lagrange: L = f(U, p)ert+λb(p π) +θ(φ(U) +aπ p) = ( U2 hp)ert+λb(p π) +θ(j kU+aπ p). Peubah kontrol: U dan p.

(12)

Syarat perlu optimalitas: 1 _L_U ₌₀_, _2Uert _θk₌₀ 2 _L_p ₌₀_, _hert₊_λb _θ₌₀_,_θ₌ _hert₊_λb 3 _L θ =0,j kU+aπ p=0,p=j kU+aπ 4 ˙π=_L λ, ˙π=b(p π) 5 ˙λ= _L π, ˙λ=λb θa. Syarat transversalitas.

Dari syarat (1) dan (2):

2Uert+hkert λbk=0, 2U+hk mbk =0. Dari syarat (3) dan (4):

(13)

Kendala Persamaan (Metode Lagrange)

Dari syarat (2) dan (5):

˙λ=λb+haert λba , ˙λe rt =λbe rt+ha λbae rt

, ˙λeqt =λbeqt+ha λbaeqt

, ˙λeqt +λqeqt =ha+eqtλ(b+q ab)

, m˙ =ha+m(b(1 a) +q) , m˙ =ha m(b(a 1) q) , m˙ +mQ =ha

Semua syarat yang diperoleh dengan menggunakan Metode Lagrange ekuivalen dengan syarat yang diperoleh dengan menggunakan Metode Substitusi, sehingga solusinya sama.

(14)

Pada MKO dengan kendala pertaksamaan, banyaknya peubah kontrol tidak harus melebihi banyaknya kendala pertaksamaan seperti pada kasus sebelumnya.

Kendala pertaksamaan memberikan lebih banyak keleluasaan daripada kendala persamaan.

Bentuk umum dengan r peubah kontrol dan q kendala pertaksamaan:

max J = R₀Tf(x, u, t)dt s.t. ˙x = g(x, u, t)

h(x, u, t) 0,

dengan x ₂Rn, u₂ Rr, h₂ Rq dan 1 q r n.

Kendala pertaksamaan dapat diubah menjadi kendala persamaan: h(x, u, t) ξ2 =0,

(15)

Kendala Pertaksamaan Theorem (Berkovitz, 1961) Untuk MKO: opt J = R₀Tf(x, u, t) dt s.t. ˙x = g(x, u, t) h(x, u, t) 0, de…nisikan H = f +pg ¯ H = f +pg+λh=H+λh.

(16)

Theorem (Berkovitz, 1961)

Syarat perlu optimalitas bagi u sehingga mengoptimumkan ialah:

1 p 6=0 2 H¯_u =0,H_u+_λh_u =0 3 ˙p= H¯_x , ˙p= (H_x+_λh_x) 4 ˙x =H_p , ˙x =g 5 _λ _{0, h} _{0, λh}=_{0 (maksimisasi),} λ 0, h 0, λh=0 (minimisasi)

(17)

Kendala Pertaksamaan

Jika kendala peubah kontrol berbentuk m u M (seperti misalnya

ju_j 1), maka untuk masalah maksimisasi berlaku: Hu 8 < : 0 jika u =M =0 jika m<u <M 0 jika u =m. . Ingat kembali umin umax u H umin umax u H

(18)

Kendala peubah kontrol berbentuk m u M dapat ditulis menjadi

(m u) dan (u M)_{, (}u m 0) dan (M u 0), sehingga dapat dide…nisikan

h1 : =M u,

h2 : =u m.

Untuk kasus _ju_j 1 dapat dide…nisikan h1 : =1 u,

(19)

Example

Selesaikan MKO berikut:

min J = 1₂[10x2(10) x1(10)] + R10 0 1 2u 2 _dt s.t. ˙x1 = x2 ˙x2 = u x1(0) = 0 x2(0) = 20 x1(10) free, x2(10)free.

Peubah kontrol u takberbatas,

(20)

Kasus 1 Peubah kontrol u tak berbatas De…nisikan fungsi hamilton

H = 1₂u2+p1x2 p2u.

Prinsip maksimum Pontryagin memberikan:

1 H_u =0,u p₂=0,u =p₂. 2 ˙p₁= H_x 1 , ˙p1 =0,p1 =A. 3 ˙p₂= H_x 2 , ˙p2 = p1 ,p2 = At+B. 4 _{Syarat transversalitas p}(₁₀) =_S x(10) memberikan 1 p₁(10) =S_x 1(10),A= 1 2 2 p₂(10) =S_x 2(10),5+B =5,B=0.

(21)

Diperoleh

p₁(t) = 1₂, p₂(t) = 1₂t, u (t) = 1₂t.

Selanjutnya dari kendala persamaan diferensial dan syarat batas diperoleh:

x₂(t) = 1₄t2+20, x₁(t) = ₁₂1t3+20t.

(22)

Kasus 2 Peubah kontrol u memenuhi 1 u 3. De…nisikan: h1 = 3 u, h2 = u 1, ¯ H = H+λh = 1₂u2+p1x2 p2u+λ1(3 u) +λ2(u 1).

Syarat kedua Teorema Berkovitz memberikan ¯

Hu =0 , u p2 λ1+λ2 =0

, u =p2+λ1 λ2.

Proses pengoptimuman dibagi menjadi dua kasus:

1 Interior optimization: 1<u <3

(23)

Interior optimization Karena 1<u <3 maka

h1 = 3 u >0

h2 = u 1>0,

sehingga syarat kelima λ 0, h 0, λh=0 (minimisasi) memberikan λ1 =λ2 =0.

Akibatnya,

u =p2 ,1<p2<3.

Boundary optimization: u =umax,u =3 :

h1 = 3 u=0)λ1 0

(24)

Diperoleh

u =p2+λ1 λ2 , u =p2+λ1

, u p2 (karena λ1 0)

, 3 p2.

Boundary optimization: u =umin ,u=1 :

h1 = 3 u =2>0)λ1 =0 h2 = u 1=0)λ2 0. Diperoleh u =p2+λ1 λ2 , u =p2 λ2 , u p2 (karena λ2 0) , 1 p2.

(25)

Kendala Pertaksamaan Dengan demikian, u = 8 < : 1 ; p2 1 p2 ; 1<p2 <3 3 ; p2 3 ,

atau dengan menggunakan hasil Kasus 1, yaitu p2(t) = 1₂t, diperoleh

u (t) = 8 < : 1 ; 1₂t 1 1 2t ; 1< 1 2t<3 3 ; 1₂t 3 = 8 < : 1 ; 0 t 2 1 2t ; 2<t <6 3 ; 6 t 10 .

(26)

Kontrol optimum: 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3

t

u*

(27)

Kendala Pertaksamaan Pengganda lagrange: (1<u <3_{) )} λ1 =λ2 =0, (u =3_{) )} λ1 =u p2 =3 p2, λ2 =0, (u =1_{) )} λ1 =0, λ2 =p2 u =p2 1, atau λ1(t) = 8 < : 0 ; 0 t 2 0 ; 2<t <6 3 1₂t ; 6 t 10 , λ₂(t) = 8 < : 1 2t 1 ; 0 t 2 0 ; 2<t <6 0 ; 6 t 10 .

(28)

Karena ˙x2 = u dan x2(0) =20 maka ˙x2 = 8 < : 1 ; 0 t 2 1 2t ; 2<t <6 3 ; 6 t 10 )x2= 8 < : t+20 ; 0 t 2 1 4t 2₊_B _{; 2}_<_t _<₆ 3t+C ; 6 t 10 .

Karena ˙x1 =x2 dan x1(0) =0 maka

˙x1 = 8 < : t+20 ; 0 t 2 1 4t2+B ; 2<t <6 3t+C ; 6 t 10 x1 = 8 < : 1 2t2+20t ; 0 t 2 1 12t 3₊_Bt₊_D _{; 2}_<_t _<₆ 3 2t 2₊_Ct₊_E _{; 6} _t ₁₀ .

(29)

Parameter B, C , D, E dipilih sedemikian sehingga x1 dan x2 kontinu

(B =19, C =28, D = 2₃, E = 52₃). Jadi, x₁(t) = 8 < : 1 2t 2₊_20t _{; 0} _t ₂ 1 12t3+19t+ 2 3 ; 2<t<6 3 2t 2₊_28t 52 3 ; 6 t 10 , x₂(t) = 8 < : t+20 ; 0 t 2 1 4t2+19 ; 2<t <6 3t+28 ; 6 t 10 .

(30)

1 2 3 4 5 6 7 8 9 10 -20 0 20 40 60 80 100 120

t

x

(31)

Solusi Numerik (Metode Runge-Kutta Orde-4)

Sistem persamaan diferensial:

˙x1 = x2, x1(0) =0

˙x2 = u, x2(0) =20

˙p1 = 0, p1(10) = 1₂

˙p2 = p1, p2(10) =5

u = p2, 1 u 3.

Baris terakhir dapat ditulis menjadi:

(32)

(33)

(34)

Problem

min J = R₀2(1₂u2 x) dt s.t. ˙x = u

x(0) = 1, x(2) free. Peubah kontrol u tak berbatas,

(35)

Problem

min J = R₀2(1₂u2 x) dt s.t. ˙x = u+x

x(0) = 1, x(2) free. Peubah kontrol u tak berbatas,

(36)

Di beberapa kasus, fungsi hamilton memiliki bentuk linear terhadap peubah kontrol u, sehingga dapat dituliskan sebagai:

H=ψ(x, p, t) +σ(x, p, t)u.

Secara umum ekstremum dari MKO tidak ditemukan karena

Hu =0,σ(x, p, t) =0, sehingga u tidak dapat ditentukan.

Namun jika peubah kontrol u berbatas, misalnya m u M, maka H mencapai maksimum/minimum jika dan hanya jika

u = M ; σ>0

m ; σ<0 , u =

m ; σ>0 M ; σ<0 . u di atas disebut bang-bang control dan fungsi σ(x, p, t) disebut sebagai fungsi switching.

(37)

Misalkan: 1 u 3 -1 1 2 3 2 4 6

u

H

H =1+2u -1 1 2 3 -4 -2 2

u

H

H =1 2u

(38)

Example

Diberikan masalah kontrol optimum berikut:

min J = R₀T dt s.t. ˙x = x+u

x(0) = 5, x(T) =11, T bebas, u _{2 [} 1, 1]

Tentukan kontrol optimum u , trajektori optimum x , dan waktu T .

Solution

Diperoleh fungsi hamilton (linear terhadap u) berikut:

(39)

Solution

Karena H linear terhadap u dan u memenuhi 1 u 1 maka kontrol optimum untuk masalah minimisasi diberikan oleh bang-bang control berikut:

u (t) = 1 ; p(t) >0

1 ; p(t) <0 . Prinsip maksimum Pontryagin memberikan:

˙p= Hx , ˙p = p ,p(t) =Ae t.

Karena T bebas maka syarat transversalitas memberikan

H_jt=T =0 , 1+p(T)x(T) +p(T)u =0

, 1+11Ae T +u Ae T =0

(40)

Solution

Karena u =1 atau u = 1 maka 11+u >0, sehingga

A= 1

(11+u )e T =

eT 11+u <0.

Karena A<0 maka p(t) =Ae t <0, akibatnya u (t) =1.Selanjutnya dari kendala persamaan diferensial diperoleh

˙x =x+u _, ˙x =x+1_,x(t) =Bet 1. Dari syarat awal dan syarat batas:

x(0) =5 _, B 1=5_,B =6₎x (t) =6et 1, x(T) =11 _, 6eT 1=11_,eT =2_,T =ln 2.

(41)

Solution (Alternatif)

Solusi bang-bang di atas dapat juga ditunjukkan sebagai berikut. MKO dapat dipandang sebagai MKO dengan kendala pertaksamaan berikut:

min J = R₀T dt s.t. ˙x = x+u

h1(u) 0

h2(u) 0

x(0) = 5, x(T) =11, T bebas,

dengan h1(u):=1 u dan h2(u) =1+u. De…nisikan fungsi lagrange

¯

(42)

Diperoleh

¯

Hu =0,p λ1+λ2 =0,

sehingga kontrol optimum u tidak dapat ditentukan dari kondisi ini. Hal ini berarti interior optimization tidak memberikan solusi. Boundary optimization dengan u = 1 memberikan

h1(u) = 2>0

h2(u) = 0,

sehingga syarat (λ1 0, h1 0, λ1h1 =0) dan

(λ2 0, h2 0, λ2h2=0)memberikan λ1 =0 dan λ2 0. Akibatnya

(43)

Jika u =1 maka

h1(u) = 0

h2(u) = 2>0,

sehingga syarat (λ1 0, h1 0, λ1h1 =0) dan

(λ2 0, h2 0, λ2h2=0)memberikan λ1 0 dan λ2 =0. Akibatnya

p λ1+λ2 =0,p λ1 =0)p = λ1 0.

Diperoleh kontrol optimum yang sama:

u (t) = 1 ; p(t) >0

(44)

Example

max J = R₀1(2x x2)dt s.t. ˙x = u

x(0) = 0, x(1) =0,

ju_j 1.

Solution

Diperoleh fungsi hamilton yang linear terhadap u:

H=2x x2+pu, dengan p merupakan fungsi switching.

(45)

Solution

Kontrol optimum diberikan oleh:

u (t) = 1 ; p(t) >0

1 ; p(t) <0 . Selanjutnya diperoleh syarat optimalitas berikut:

˙p= Hx , ˙p = 2+2x =2(x 1). Perhatikan bahwa: ˙x =u 1_, dx dt 1,dx dt ,x t. Karena t _{2 [}0, 1]maka x 1_,x 1 0_,2(x 1) 0_, ˙p 0.

(46)

Solution

Fakta ˙p 0 mengatakan bahwa p merupakan fungsi turun terhadap t. Akan ditinjau tiga kasus p(t)seperti diilustrasikan gambar berikut:

p(t) >0 p(t) <0 p(t)berubah tanda Kasus 1: Andaikan p(t) >0 untuk semua t _{2 [}0, 1]. Akibatnya,

u (t) =1₎ ˙x =1_,x (t) =t+A.

Syarat awal x(0) =0 memberikan x (t) =t sehingga x(1) =1. Kontradiksi dengan syarat batas x(1) =0. Haruslah p(t) 0.

(47)

Solution

Kasus 2: Andaikan p(t) <0 untuk semua t _{2 [}0, 1]. Akibatnya, u (t) = 1₎ ˙x = 1_,x (t) = t+B.

Syarat awal x(0) =0 memberikan x (t) = t dan x(1) = 1. Kontradiksi dengan syarat batas x(1) =0. Haruslah p(t) 0. Kasus 3: Dari dua pengandaian di atas, haruslah p(t)berubah tanda pada t _{2 [}0, 1], yaitu p(t) >0 pada t_{2 [}0, t ) dan p(t) <0 pada t _{2 (}t , 1].

(48)

Solution

Pada [0, t )diketahui p(t) >0, sehingga

u (t) =1₎ ˙x =1_,x (t) =t+A. Syarat awal x(0) =0 memberikan x (t) =t.

Pada (t , 1]diketahui p(t) <0, sehingga

u (t) = 1₎ ˙x = 1_,x (t) = t+B. Syarat batas x(1) =0 memberikan x (t) = t+1. Agar x(t)kontinu di t =t haruslah

(49)

Solution Jadi, u (t) = 1 ; 0 t < 1 2 1 ; 1₂ <t 1 , x (t) = t ; 0 t 1 2 1 t ; 1₂ <t 1 .

(50)

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -1.0 -0.5 0.0 0.5 1.0

t

u,x

(51)

Solution Fungsi adjoin: ˙p= 2+2x = 2t 2 ; 0 t 1 2 2t ; 1₂ <t 1 . Jadi, p (t) = t 2 _2t₊_{A ; 0} _t 1 2 t2₊_B _; 1 2 <t 1 .

Parameter A dan B ditentukan dari

t 2 2t +A= 0 = t 2+B 1 4 1+A= 0 = 1 4+B A= 3₄ dan B = 1₄.

(52)

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6

t

p

(53)

Problem

Diberikan masalah kontrol optimum berikut:

max J = R₀104x dt s.t. ˙x = x+u

x(0) = 5, x(10)bebas, u _{2 [}0, 2]