Sistem Kendali pada Pendulum Terbalik Menggunakan Feedback Error Learning

(1)

A2-55

Sistem Kendali pada Pendulum Terbalik Menggunakan

Feedback Error Learning

Saida Ulfa

Jurusan Teknologi Pendidikan, Universitas Negeri Malang Jl. Surabaya 6 Malang 65145 Indonesia

Email: saida.ulfa@gmail.com

Abstrak Pendulum terbalik merupakan salah satu contoh kasus sistem nonlinear yang sering

digunakan untuk menguji kehandalan sebuah sistem kendali. Posisi kesetimbangan pendulum ini berada pada posisi tegak berlawanan arah grafitasi. Untuk menjaga pendulum berada pada posisi kesetimbangannya, diperlukan sebuah sinyal kendali. Dalam makalah ini penulis menggunakan teknik kendali feedback error learning (FEL). Konsep FEL ini mengadopsi sistem kendali pada otak manusia. Teknik ini menggabungkan conventional feedback controller atau kendali umpan balik konfensional dan feedforward controller atau kendali umpan maju. Umpan maju yang digunakan disini, menggunakan model artificial neural network atau jaringan syaraf tiruan yang digunakan untuk menghitung inverse model atau model balikan dari pendulum terbalik.

Kata Kunci: Feedback error learning, neural network, system nonlinear, pendulum terbalik

1. Pendahuluan

Pendulum terbalik adalah pendulum yang yang titik beratnya berada diatas titik tumpunya sehingga mempunyai kesetimbangan yang labil. Untuk menjaga pendulum tetap berada pada posisi kesetimbangannya, pada makalah ini digunakan sebuah teknik kendali yang disebut Feedback Error

Learning (FEL).

Teknik FEL yang dikemukakan oleh Kawato [1,2] adalah penggabungan pembelajaran dan efesiensi kendali. Sistem kendali ini adalah

two degree of freedom (TDOF) control atau kendali

adaptif dua derajat kebebasan neural network

feedforward controller (NNFC) atau pengendali

umpan maju jaringan syaraf dan sebuah

conventional feedback controller (CFC) atau

kendali umpan balik konfensional. NNFC digunakan untuk memperoleh inverse model atau nilai balikan dari plant atau objek yang dikendalikan sedangkan CFC digunakan untuk menjamin kestabilan global asymptotic dan sebagai sinyal error untuk NNFC [3,4]. Jika inverse model diperoleh secara tepat, keluaran dari plant akan menghitung sinyal referensi dengan menggunakan umpan maju.

Sebuah sistem kendali dikatakan bagus

jika telah dicoba dan dievaluasi oleh beberapa teknik kendali yang berbeda, pada tulisan ini, penulis membandingkan hasil kendali FEL dengan CFC.

Pengujian dilakukan dengan menggunakan graphical user interface (GUI) pada komputer yang didisain menggunakan software Borland C++ Builder.

Garis besar dari makalah ini adalah: Pada bab 2 dibahas pemodelan pendulum terbalik secara fisik dan matematika. Inti dari system kendali FEL yang digunakan akan dijelaskan pada bab 3. Hasil pengujian dengan menggunakan FEL ditampilkan pada bab 4 dan bab 5 merupakan kesimpulan dari makalah ini.

2. Pemodelan Pendulum Terbalik

Sebuah sistem dikatakan nonlinear ketika karakteristik dari sistem tersebut menggunakan pemodelan matematika secara nonlinear. Pemodelan secara nonlinear digunakan untuk menjelaskan sifat dan pola dari sistem yang di modelkan.

2.1. Pemodelan Fisik

Sistem kendali terdiri atas sebuah plant atau objek yang dikendali, controller atau pengendali dan

trainer atau pelatih yang saling berhubungan

sehingga membentuk sebuah loop umpan balik. pengendali mempunyai parameter yang adaptif seperti pembobotan yang terdapat pada NNFC. NNFC akan memantau performa plant yang nilainya ditentukan oleh nilai umpan balik system sehingga mampu mengoptimasi pengendali yang bertindak sebagai pengendali adaptif.

Seperti yang terlihat pada Gambar 1, servo motor AC akan menjalankan kereta, sinyal kendali pada servo motor AC ini harus diberikan secara tepat karena akan mempengaruhi pergerakan kereta yang turut mempengaruhi posisi sudut θ

pendulum.

Untuk mempertahankan pendulum pada posisi tegak diperlukan sebuah control force f atau gaya yang diberikan ke kereta untuk membawa pendulum tersebut. Pendulum dikatakan berhasil distabilkan ketika sudut θ_{pendulum kecil atau}

(2)

Pendulum dapat di kendalikan pada posisi tersebut dan membuat kereta berada pada posisi acuan (r = 0) dengan menggunakan kendali umpan balik untuk sistem linear. Akan tetapi, masalah akan timbul ketika muncul viscous friction force yang tidak diketahui antara rel dan kereta. Apalagi parameter

uncertain friction berubah bergantung pada arah

pergerakan kereta.

2.1 Pemodelan Matematika

Ketika parameter uncertain friction antara rel dan kereta diperhitungkan, diperoleh persamaan linear untuk pendulum terbalik sebagai berikut:

(M + m) + ml = f – friction term , (1) + = gθ ₍₂₎

dimana, r adalah kereta dari pusat rel, M dan m adalah massa kereta dan pendulum, 2l adalah panjang pendulum dan f adalah gaya yang diberikan kepada kereta yang berasal dari servo motor AC.

3. Disain Sistem Kendali FEL

Gambar 2 merupakan konsep dasar FEL yang terdiri atas: linear feedback controller K atas CFC,

plant P atau objek, adaptive nonlinear feedfarwad controller Q atau kendali umpan balik maju

nonlinear yang merupakan model balikan dari plant.

Feedback controller tidak hanya menjamin

kestabilan sistem tetapi yang terpenting adalah

fungsinya sebagai sebuah aproksimasi linear untuk inverse model dari plant. Fungsi dari

Feedfarward controller membuat nilai balikan dari plant dengan mengurangi feedback error. Pada

teori FEL ini, feedback error sebagai sebuah

teaching signal pada proses pembelajaran untuk

model balikan plant.

Tujuan dari pengendalian sistem secara umum adalah mengurangi nilai error e antara sinyal masukan r dan sinyal keluaran y.

3.1 Pembelajaran on-line pada FEL

Gambar 3 merupakan skema FEL yang menggunakan jaringan syaraf sebagai feedfarward controller. Plant dikendalikan oleh CFC dan NNFC.

Pole placement regulator yang di adopsi dari CFC,

adalah

, (3) Dimana, nilai K = [ K1 K2 K3 K4] dan

x = [θ_r _{]. Feedback gain K berasal dari}

persamaan (1) dengan mengabaikan istilah nonlinear dan persamaan (2). Parameter K diperoleh dengan menggunakan Matlab [6]:

K = [-5.6082 -5.3963 -0.8433 -2.4315]

(4)

Untuk memperbaiki kinerja CFC, NNFC bertindak sebagai adaptive controller. Neural

Network di update setiap satu kali putaran yang

bergantung pada waktu cuplik dari komputer. Setiap satu kali proses pembelajaran disebut

epoch. Waktu cuplik berkisar 20 ms yang

merupakan nilai standar untuk pengendalian pada pendulum terbalik.

Learning law berasal dari metode gradient descent dengan fungsi error [5] sebagai berikut:

(5) Dimana, = y merupakan nilai masukan untuk plant. Metode gradient descent

menghasilkan:

M

komput Servo amplifi

θ

r

V

f

r

θ

2l, m

AC servo motor I

Gambar 3: Skema sistem kendali FEL

(3)

(6) Hasil untuk tuning rule:

(7) atau

(8) merupakan keluaran dari neural network yang akan dijelaskan lebih detail pada bagian selanjutnya. merupakan keluaran dari CFC yang digunakan untuk sinyal error untuk neural

network. w(t) adalah bobot neural network yang

berisi parameter yang tidak diketahui yang akan di update secara on-line pada setiap epoch.

Scaling factor (s.f) yang diberikan pada masukan neural network, hal ini dikarenakan nilai masukan sangat kecil sehingga nilai masukan di tambah sampai mendekati . Nilai ini berhubungan dengan nilai maksimum fungsi bipolar sigmoid sehingga membantu dalam proses pembelajaran

3.1 Jaringan syaraf Tiruan

Pada makalah ini, penulis menggunakan model jaringan syaraf tiruan berlapis banyak dengan empat lapisan seperti pada Gambar 4. Pemilihan jumlah neuron pada lapisan tersembunyi sangat menentukan kemampuan dari sebuah jaringan sayaraf tiruan. Akan tetapi dalam sebuah eksperimen, penulis tidak menemukan perbedaan hasil yang mendasar antara 20 neuron dan 10

neuron pada lapisan tersebunyi. Oleh karena itu,

untuk lapisan masukan digunakan 4 neuron, 2 lapisan tersembunyi yang masing-masing menggunakan 10 neuron dan 2 lapisan keluaran menggunakan masing-masing 1 neuron.

∑∑

∑

= = = =





































−

=

L k m j k i n i si h s js k j

f

w

f

w

x

t

L

E

1 1 2 1 1 1 2

2

1

(9)

Perhitungan bobot keluaran untuk lapisan tersembunyi :

∑

=

−

=

∂

L k k r k q qr

z

L

W

E

1 2

1 δ

(10)

(

) ( )

k q k q k q k q

t

y

f

net

' 2 2

=

−

δ

(11)

Perhitungan lapisan masukan ke lapisan tersembunyi : 4 6 8 10 12 14 16 18 20 -6 -4 -2 0 2 4 6 8 A n g le [d e g ] Time[s]

∑

=

−

=

∂

L k k r k q qr

x

L

W

E

1 1

1 _δ

(12) dimana :

( )

∑

=

m j k j jq k q k q

f

net

w

1 2 ' ' 1 1

δ

(13)

Untuk menghitung nilai bobot pada layar tersembunyi, error pada lapisan keluaran di propagasi balik menggunakan metode

backpropagation. Hasil dari propagasi balik akan

dibandingkan dengan sinyal target untuk memperoleh nilai mean square error. Proses ini di ulang untuk setiap sampel pada training set.

Fungsi aktifasi yang digunakan adalah fungsi sigmoid untuk lapisan tersembunyi dan fungsi linear untuk lapisan keluaran seperti pada Gambar 5.

Untuk proses pembelajaran secara on-line, jaringan syaraf di latih sebagai persiapan awal

Gambar 4: Jaringan syaraf tiruan dengan

banyak lapisan

Gambar 5: Fungsi aktifasi

(4)

sehingga mempunyai fungsi yang sama dengan CFC. Data yang digunakan adalah seperti yang tampak pada Gambar 6 dibawah ini.

4. Hasil Pengujian

Hasil pengujian dengan menggunakan CFC seperti pada Gambar 7 dan 8, nilai sudut θ_mempunyai

nilai antara -5 sampai 5 derajat dan posisi kereta berada pada jarak -0.06 sampai -0.06 m. Berdasarkan kedua data yang diperoleh, pendulum akan berada pada posisi tegak akan tetapi mengalami vibrasi pada nilai tersebut.

Untuk memperbaiki performa dari sistem kendali dengan menggunakan CFC,

0 1000 2000 3000 4000 5000 6000 7000 8000 -0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15 0.2 P o s it io n [m ] P o s it io n [m ] P o s it io n [m ] P o s it io n [m ] It e r at i o n s It e r at i o n s It e r at i o n s It e r at i o n s P e n d u l u m 's P o s it i o n P e n d u l u m 's P o s it i o nP e n d u l u m 's P o s it i o n P e n d u l u m 's P o s it i o n 1000 2000 3000 4000 5000 6000 7000 8000 9000 -6 -4 -2 0 2 4 6 8 A n g le [d e g ] Iterations

FEL diterapkan untuk mencapai hasil yang maksimal seperti yang tampak pada Gambar Pada Gambar 9 dan 10 , tampak pada iterasi 8500 nilai sudut θ_{dan jarak kereta terhadap posisi acuan}

mencapai stabil. Berdasarkan data ini, pendulum akan stabil pada posisi tegak tanpa mengalami vibrasi. Akan tetapi pada iterasi diatas 8500, kereta dan pendulum akan mengalami vibrasi lagi kemudian akan stabil pada iterasi diatas 10.500. Hal ini diakibatkan adanya gaya gesek antara rel dan kereta.

5. Kesimpulan

Konsep feedback error learning (FEL) mengadaptasi cara kerja motorik pada otak manusia. Pada sistem kendali, teknik FEL diaplikasikan pada sistem nonlinear. Dengan hanya menggunakan CFC, pendulum dapat berada pada posisi tegak namun tidak stabil pada posisi tersebut. Pendulum mengalami vibrasi: kereta akan bergerak pada jarak -0.06 sampai 0.06 meter dan sudut θ_{pendulum bergerak pada kisaran -5}

sampai 5 derajat.

Nilai vibrasi kereta terhadap jarak acuan (r = 0) dan sudut θ_{pendulum dapat diperkecil hingga}

mendekati nol dengan cara menggunakan konsep FEL, teknik ini menggabungkan feedback

controller atau kendali umpan balik dan feedforward controller atau kendali umpan maju.

Pada umpan maju digunakan jaringan syaraf tiruan untuk menghitung nilai model balikan dari objek yang dikendalikan.

Daftar Pustaka

[1] Kawato M., Furakawa K., Suzuki R., :“A Hierarchial Neural Network Models and Learning Voluntary Movements”, Biol., Cybernet. 57, pp. 169-185, 1987.

[2] Kawato M.,: “Feedback Error Learning Neural Network for Supervised Motor Learning”, Advanced Neural Computers/ R. Eckmiller (Ed), Neural Network for Sensory and Motor Systems, North-Holland, pp. 365-372, 1990

[3] Gomi H., Kawato M.,: “Neural Network Control for a Clossed-Loop System Using Feedback Error Learning” Neural Networks Vol. 6, pp. 933-946, 1993.

Gambar 10: Keluaran FEL berupa sudut pendulum

Gambar 9: Keluaran FEL berupa posisi kereta

Gambar 8: Keluaran CFC berupa sudut pendulum

Gambar 7: Keluaran CFC berupa posisi kereta

(5)

[4] Areolino et,al: “Feedback Error Learning for Controlling a Flexible Link”, Proc. Of the Sixth Brazilian Symposium on Neural Networks, IEEE, 2000.

[5] Miyamura A., Kimura H.,:”Stability of Feedback Error Learning Scheme", Systems & Control Letters, 45, pp.303-316,2002.

[6] Jinnai K.,: “A study of Double Inverted Pendulum System”, Master Thesis of Saga University, Faculty of Culture and Education, Technology Education Department, 2002.