Penaksiran parameter model ARIMA
dengan menggunakan
Algoritma Genetika
Wiwin yuliani
1306 100 070
Dosen Pembimbing I
Dr. Irhamah, S.Si,M.Si
Dosen Pembimbing II
Pendahuluan
Manfaat
Permasalahan
Tujuan
Latar belakang
Tinjauan pustaka
ARIMA Box-Jenkins
Metodologi penelitian
Sumber data
Metode analisis data
Hasil analisis
Analisis dan pembahasan
Latar belakang
Time series ARIMA Penaksiranparameter AlgoritmaGenetika
Penelitian terdahulu
Ong, Huang, dan Tzeng (2005)
Rohman (2009) Qohar (2007
)
Algoritma Genetika dapat
mengatasi kelemahan
metode penaksiran
perameter lain dalam
mencari solusi yang global
Permasalahan
Bagaimana hasil penaksiran parameter dengan
Conditional Least Square?
Bagaimana hasil penaksiran parameter dengan mengunakan Algoritma Genetika?
Bagaimana perbandingkan hasil penaksiran parameter kedua metode ?
Tujuan
Mendapatkan penaksir parameter dengan
Conditional Least Square.
Mendapatkan penaksir parameter dengan menggunakan Algoritma Genetika.
Mengetahui perbandingan hasil panaksiran parameter kedua metode.
Manfaat
Dapat menerapkan dan mengembangkan
metode
Algoritma
Genetika
untuk
mendapatkan taksiran parameter model
ARIMA.
Batasan masalah
Data dua mingguan dari permintaan Arc Tubedaya listrik rendah yang pernah dipakai pada Rohman (2009).
Dalam iterasi Algoritma Genetika, fungsi
fitness hanya dihitung berdasarkan nilai SSE saja.
Program Algoritma Genetika dapat digunakan untuk model ARIMA(p,d,q) orde satu saja
Tinjauan pustaka
Konsep Dasar Time Series
Time series adalah suatu pengamatan yang disusun secara berurutan dalam waktu (Box, Jenkins, dan Reinsel, 1994). Time series dapat dianggap sebagai realisasi dari proses stokastik. proses stokastik adalah suatu kelompok data berdasarkan waktu yang tersusun oleh variabel random dimana ω adalah ruang sampel dan t
adalah indeks waktu. Fungsi distribusi dari variabel random adalah sebagai berikut.
Kestasioneran Data
Data time series dikatakan stasioner pada mean apabila data tersebut tidak ada perubahan mean dari waktu ke waktu dan data time series dikatakan stasioner pada varians apabila data tersebut tidak ada perubahan varians yang jelas dari waktu ke waktu (Makridakis dkk,1999).
Apabila terjadi ketidakstasioneran pada varians maka dilakukan transformasi pada data.
Apabila terjadi ketidakstasioneran pada mean maka dilakukan proses differencing
(pembedaan) pada data.
n 1 n 2 1 t t 1 t n t t ,z ,...,z p ω:z ω,t z ,...,z ω,t z z F
Tinjauan pustaka
Fungsi Autokorelasi (ACF)
Fungsi Autokorelasi Parsial (PACF)
Dan
j=1,2,...,k
n 1 t 2 t k n 1 t k t t k t t k t t k k k ) Z (Z ) Z )(Z Z (Z ) var(Z ) var(Z ) Z , cov(Z r 0 ˆ ˆ ˆ k 1 j j kj k 1 j j 1 k kj 1 k 1 1,k k ρ 1 ρ ρ ˆ ˆ ˆ ˆ ˆ ˆ j 1 k k, 1 k 1, k kj j 1, k ˆ ˆ ˆ ˆTinjauan pustaka
Model-Model Time Series Stasioner
1. Model Autoregressive atau AR(p)
Bentuk umum
2. Model Moving Average atau MA(q)
Bentuk umum
3. Model Autoregressive Moving Average atau ARMA(p,q)
Bentuk umum 4. Model ARIMA (p,d,q) Bentuk umum t p t p t t t Z Z Z a Z 1 1 2 2 . q t q t t t t a a a a Z 1 1 2 2 q t q t t p t p t t Z Z a a a Z 1 1 1 1 t q 0 t d p B 1 B Z θ B a
Tinjauan pustaka
Identifikasi Model ARIMA
Model ACF PACF
AR(p) turun cepat secara eksponensial /
sinusoidal terputus setelah lag p
MA(q) terputus setelah lag q turun cepat secara eksponensial / sinusoidal
AR(p) atau MA(q) terputus setelah lag q terputus setelah lag p
Tinjauan pustaka
Estimasi Parameter Model ARIMA
1. Metode
Moment
Menurut Wei (1990), metode momen adalah salah satu
metode estimasi yang paling mudah, tetapi juga yang paling
tidak efisien, untuk mendapatkan taksiran parameter pada
model ARIMA. Dimisalkan model AR(
p
) dengan
Bentuk umum dari model AR (
p
) adalah
Dan mendapatkan penaksir
moment
dengan
t p t p 2 t 2 1 t 1 t Z Z Z a Z .. p p a ˆ0 1 ˆ1 ˆ1 ˆ2 ˆ2 ... ˆ ˆ 2 2 a t t Z ZTinjauan pustaka
2. Metode
Least Square
/
Conditional Least Square
Dimisalkan model ARMA(
p
,
q
) dengan
Bentuk umum dari model ARMA (
p
,
q
) adalah
estimasi
Conditional Least Square
dengan
zinit, ainit
merupakan nilai inisialisasi awal dan
db
=
n
-(
p
+
q
-1).
merupakan suatu fungsi nonlinear dengan parameter yang
tidak diketahui sehingga diperlukan suatu iterasi nonlinear untuk
mendapatkan parameternya
t t Z Z q t q 2 t 2 1 t 1 t p t p 2 t 2 1 t 1 t Z Z Z a θ a θ a θ a Z .. .. ) , , , , , ( ) , , ( ~ ~ ~ ~ ~ 1 2 ~ ~ Z init a init Z a S n t t db S a ( , , ) / ˆ 2 ) , , ( ~ ~ S3. Metode
Maximum Likelihood
Menurut Cryer dan Chan (2008) untuk dapat menerapkan teknik
estimasi
maximum likelihood
(kemungkinan maksimum), harus dibuat
asumsi tentang bentuk fungsi probabilitas dari data yang teramati.
Fungsi kepadatan probabilitas suatu error adalah
taksiran
maximum likelihood
untuk
adalah
t a 2 2 2 / 1 2 2 2 exp ) 2 ( ) | ( a t a a t a a f 2 ˆa n S a ˆ , ˆ ˆ2Tinjauan pustaka
Algoritma genetika
Sejak Algortima Genetika pertama kali dirintis oleh John
Holland dari Universitas Michigan pada tahun 1960-an,
Algortima Genetika telah diaplikasikan secara luas pada
berbagai bidang. Algortima Genetika banyak digunakan
untuk memecahkan masalah optimasi, walaupun pada
kenyataannya juga memiliki kemampuan yang baik untuk
masalah-masalah selain optimasi.
Pengkodean kromosom
Pengkodean kromosom adalah suatu teknik untuk
menyatakan populasi awal sebagai kandidat solusi suatu
masalah ke dalam suatu kromosom.
Fungsi Fitness
Fitness individu dalam algoritma genetika adalah nilai
fungsi objektif untuk fenotipe. Untuk menghitung
fitness, kromosom harus terlebih dahulu
Seleksi
Roulette Wheel
Untuk menentukan probabilitas seleksi atau probabilitas
kelangsungan hidup pada setiap kromosom proporsional
dengan nilai
fitness
nya
Crossover
Beroperasi pada dua kromosom pada suatu waktu dan
membentuk
offspring
dengan mengkombinasikan dua
bentuk kromosom.
Mutasi
Elitism
Untuk menjaga agar individu bernilai
fitness tertinggi
tersebut tidak hilang selama evolusi, maka perlu dibuat
satu atau beberapa kopinya.
Metodologi penelitian
• data simulasi dan data dua mingguan dari permintaan Arc Tube daya listrik rendah yang pernah digunakan oleh Rohman (2009)
Metodologi penelitian
• Menaksir parameter dengan metode Conditional Least square
• Menaksir parameter dengan metode Algoritma Genetika
METODE
ANALYSIS
Letak penelitian
Identifikasi model ARIMA nonmusiman
Penaksiran parameter model ARIMA Identifikasi model ARIMA musiman Pemodelan ARIMA Box-Jenkins dengan Algoritma Genetika Identifikasi model ARIMA campuran Correlogram Correlogram Algoritma Genetika Algoritma Genetika Correlogram Algoritma Genetika Algoritma Genetika Conditional Least Square
Diagram alur penelitian
Mengidentifikasi model ARIMAMenaksir parameter dengan metode Conditional Least Square dan Algoritma Genetika
Membandingkan hasil dari kedua metode Mulai
Data
Parameter terbaik dengan kriteria minimun SSE
Diagram alur Algoritma Genetika
Mulai
Seleksi dengan Roulette Wheel Crossover dengan one-point
Mutasi
ya
tidak Set Input : Npop, Pc, Pm
Inisialisasi Populasi Generasi = 0
Evaluasi kromosom berdasarkan fitness
SSE konvergen?
Solusi optimal
Seleksi individu baru dan Elitism
Generasi = generasi + 1 Decoding dari bilangan biner menjadi
Analisis dan Pembahasan
140 126 112 98 84 70 56 42 28 14 1 200000 150000 100000 50000 0 Inde x d a taTime S e r ie s P lot of data
140 130 120 110 100 90 80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 La g A u to c o rr e la ti o n
Autocor r e lation F unction for data
(w ith 5% significa nce lim its for the autocorrela tions)
Gambar 1 Plot time series data permintaan
Arc Tube daya listrik rendah Gambar 2 Plot ACF data data permintaan Arc Tube daya listrik rendah
Analisis dan Pembahasan
Gambar 3 Box-Cox plot data permintaan Arc
Tube daya listrik rendah Gambar 4 Plot time series data yang sudahstasioner
5 4 3 2 1 0 -1 -2 160000 140000 120000 100000 80000 60000 40000 20000 La mbda S tD e v Lo w er C L U p p er C L Lim it E stimate 0.80 Lo w er C L 0.57 U p p er C L 1.06 Ro u n d ed V alu e 1.00 (u sin g 95.0% c o n fid en c e) Lamb d a
Box-C ox P lot of data
140 126 112 98 84 70 56 42 28 14 1 100000 50000 0 -50000 -100000 -150000 Inde x d if f
Analisis dan Pembahasan
Gambar 5 Plot ACF data yang sudah stasioner
Gambar 6 Plot PACF data yang sudah stasioner 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 La g A u to c o rr e la ti o n
Autocor r e lation F unction for diff
(w ith 5% significa nce lim its for the autocorrela tions)
35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 La g P a rt ia l A u to c o rr e la ti o n
P ar tial Autocor r e lation F unction for diff
(w ith 5% significance lim its for the partial autocorre lations)
dugaan model sementara adalah ARIMA (1,1,0), ARIMA (0,1,1), ARIMA (1,1,1), ARIMA (2,1,0), ARIMA (0,1,2) dan ARIMA (2,1,2).
Analisis dan Pembahasan
Lags MA 0 MA 1 MA 2 MA 3 MA 4 MA 5 AR 0 21.17851 20.92304 20.92788 20.93609 20.95433 20.95797 AR 1 20.84401 20.86949 20.8739 20.90799 20.94256 20.97193 AR 2 20.87204 20.90327 20.90879 20.94225 20.97707 21.0019 AR 3 20.87518 20.90972 20.94258 20.97724 21.00704 21.03705 AR 4 20.90894 20.94382 20.96678 21.00049 21.03532 21.05248 AR 5 20.94095 20.97366 20.99648 21.02786 21.05646 21.082Berdasarkan Tabel diatas diperoleh nilai BIC terkecil pada BIC(1,0)
sehingga dugaan model sementara yang terbaik berdasarkan MINIC
adalah ARIMA(1,1,0). Model ARIMA(1,1,0) juga merupakan salah satu
dugaan model sementara hasil identifikasi dengan
Correlogram
Analisis dan Pembahasan
3. Simulasi model AR(1), MA(1), ARMA(1,1)
sampel parameter simulasi rata rata sampel parameter simulasi rata rata
fitarima.m minitab fitarima.m minitab
100 AR(1) 0.8 0.7715 0.7895 200 ARMA (1,1) MSE 1 1.0966 1.0699 phi 0.7 0.6832 0.7254 100 MA(1) 0.6 0.5927 0.5728 theta 0.4 0.3741 0.4101 MSE 1 1.0673 1.0745 MSE 1 1.0301 1.0456 100 ARMA (1,1) 400 AR(1) 0.8 0.8058 0.8082 phi 0.7 0.7362 0.7941 MSE 1 1.0235 1.0244 theta 0.4 0.4136 0.4746 400 MA(1) 0.6 0.5929 0.5901 MSE 1 0.9021 0.9192 MSE 1 1.0387 1.0406 200 AR(1) 0.8 0.7657 0.784 400 ARMA (1,1) MSE 1 0.9182 0.9292 phi 0.7 0.689 0.7087 200 MA(1) 0.6 0.5948 0.5954 theta 0.4 0.3861 0.4043
Analisis dan Pembahasan
4. Penaksiran Parameter model ARIMA dengan
Conditional Least Square
Dari Tabel diatas dapat dilihat bahwa nilai parameter AR(1) sebesar -0.5505, nilai MSE sebesar 1156000000 dan nilai SSE sebesar 161840000000
Model Parameter Koefisien MSE SSE
ARIMA
Analisis dan Pembahasan
4.1 Pengujian Signifikansi Parameter
H0 : = 0 (parameter model tidak signifikan) H1 : ≠ 0 (parameter model signifikan)
t0.005;141 = 2,576
model parameter koefisien SE koefisien t-hitung
ARIMA
(1,1,0) AR 1 -0.5505 0.084517529 -6.513441712
Dari Tabel diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai
Analisis dan Pembahasan
4.2 Pengujian Asumsi Residual
H0 : Residual white noise
H1 : Residual tidak white noise
Tolak H0 jika nilai p-value < α
Tabel diatas menunjukkan bahwa model white-noise
karena nilai p_value > α dengan α sebesar 1%.
model Ljung - Box keterangan
ARIMA (1,1,0) lag 12 24 36 48 λ2 90.353 139.713 159.426 166.055 white-noise DF 11 23 35 47 P_Value 1.0000 1.0000 1.0000 1.0000
Analisis dan Pembahasan
H0 : Residual berdistribusi NormalH1 : Residual berdistribusi tidak Normal
Dari gambar diatas menunjukkan bahwa plot residual
100000 50000 0 -50000 -100000 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 C14 P e rc e n t M ean -87.00 S tD ev 33999 N 141 K S 0.073 P -Valu e 0.063
P r obability P lot of r e s idual
Analisis dan Pembahasan
Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik rendah. Modelnya adalah sebagai berikut
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t.
t 1 -t t t z - z a z 1 0.5505 t 1 -t t z a B)z -(1 1
Analisis dan Pembahasan
5. Algoritma Genetika
5.1
Simulasi model AR(1), MA(1), ARMA(1,1) untuk Algoritma Genetika
sampel parameter simulasi rata-rata sampel parameter simulasi rata-rata Algoritma
Genetika Algoritma Genetika 100 AR(1) 0.8 0.8168 200 ARMA (1,1) MSE 1 1.119952 phi 0.7 0.717752 100 MA(1) 0.6 0.6311 theta 0.4 0.396 MSE 1 1.072292 MSE 1 1.083684 100 ARMA (1,1) 400 AR(1) 0.8 0.8168 phi 0.7 0.7549 MSE 1 1.02749 theta 0.4 0.4455 400 MA(1) 0.6 0.6188 MSE 1 0.923886 MSE 1 1.04455 200 AR(1) 0.8 0.8291 400 ARMA (1,1) MSE 1 0.941478 phi 0.7 0.717752
Analisis dan Pembahasan
Kromosom jenis 1>>bilangan binerkromosom jenis 2>>bilangan real
Contohnya : model ARMA(2,1) direpresentasikan dengan (1 1 0 0 1 0 1 1 0 0) (0 1 0 0 1) atau
5.2
kromosom
1 1 0 0 1 0 1 1 0 0 0 1 0 0 1
sebagai kromosom jenis satu, kemudian dikonversikan
kedalam bilangan real sehingga kromosom berubah menjadi
0.5569 -0.2475 -0.4331
Analisis dan Pembahasan
Dari Tabel dapat dilihat bahwa nilai MSE, SSE dan parameter untuk semua jumlah kromosom mempunyai nilai yang sama. Nilai MSE tersebut merupakan nilai MSE terbaik dengan nilai sebesar 1156000000, nilai SSE sebesar 161840000000 serta nilai parameter sebesar
5.3 penaksiran parameter model ARIMA dengan Algoritma Genetika
kromosom generasi MSE db SSE parameter 10 4 1156000000 140 161840000000 phi -0.55688
20 4 1156000000 140 161840000000 phi -0.55688
40 4 1156000000 140 161840000000 phi -0.55688
Analisis dan Pembahasan
5.3.1 Pengujian Signifikansi Parameter
H0 : = 0 (parameter model tidak signifikan) H1 : ≠ 0 (parameter model signifikan)
t0.005;141 = 2,576
Dari Tabel diatas dapat dikatakan bahwa taksiran parameter signifikan karena nilai
|t-hitung| > t0.005;141
model parameter koefisien SE koefisien t-hitung keterangan
ARIMA
Analisis dan Pembahasan
5.3.2 Pengujian Asumsi Residual
H0 : Residual white noise
H1 : Residual tidak white noise
Tolak H0 jika nilai p-value < α
Tabel diatas menunjukkan bahwa model white-noise
model Ljung - Box keterangan
ARIMA (1,1,0) lag 12 24 36 48 λ2 90.8313 139.563 159.152 166.253 white-noise DF 11 23 35 47 P_Value 1.0000 1.0000 1.0000 1.0000
Analisis dan Pembahasan
H0 : Residual berdistribusi NormalH1 : Residual berdistribusi tidak Normal
Dari gambar diatas menunjukkan bahwa plot residual mendekati garis lurus dengan p_value > α dengan α sebesar 1% yaitu sebesar 0.048 sehingga residual berdistribusi tidak normal.
100000 50000 0 -50000 -100000 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 C12 P e rc e n t M ean -87.99 S tD ev 34000 N 141 K S 0.076 P -Valu e 0.048
P r obability P lot of r e s idual
Analisis dan Pembahasan
Model ARIMA(1,1,0) menjadi model terbaik untuk data permintaan Arc Tube daya listrik rendah. Modelnya adalah sebagai berikut
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t.
t 1 -t t z a B)z -(1 1 t 1 -t t t z - z a z 1 0.55688
Kesimpulan dan Saran
1. Hasil penaksiran parameter model ARIMA dengan mengunakan Conditional Least Square adalah :
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.5505 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar 1156000000 dan SSE sebesar 161840000000.
2. Hasil penaksiran parameter model ARIMA dengan mengunakan Algoritma Genetika adalah :
Model tersebut menjelaskan bahwa permintaan Arc Tube daya listrik rendah untuk daya listrik ke-t dipengaruhi oleh permintaan Arc Tube pada waktu t-1 dikurangi 0.55688 kali permintaan Arc Tube pada waktu t-1 ditambah kesalahan pada saat ke-t. Dengan MSE sebesar 1156000000 dan SSE sebesar 161840000000.
3. Dari hasil kedua metode penaksiran parameter model ARIMA tersebut dihasilkan nilai MSE dan SSE yang besarnya sama
kesimpulan
t 1 -t t t z - z a z 1 0.5505 t 1 -t t t z - z a z 1 0.55688Kesimpulan dan Saran
1. Pada penelitian ini penaksiran parameter model ARIMA
dengan Algoritma Genetika hanya berdasarkan kriteria SSE saja. Untuk selanjutnya diharapkan bisa dikembangkan
berdasarkan kriteria signifikansi parameter, dan asumsi white noise dan asumsi distribusi Normal.
2. Pada penelitian ini hanya digunakan data ARIMA non
musiman. Untuk selanjutnya diharapkan bisa dikembangkan untuk model ARIMA yang musiman.
Daftar pustaka
Box, G.E.P., dan Jenkins, G.M., 1976. Time Series Analysis Forecasting and Control, edisi revisi. California : Holden-Day
Box, G.E.P., Jenkins, G.M., dan Reissel, G.C., 1994. Time Series Analysis Forecasting and Control, edisi ketiga. Englewood Cliffs : Prentice Hall.
Budiman, A., 2003. Optimisasi Daya Reaktif Menggunakan Algoritma Genetik Pseudo-Paralel. Jurnal teknik elektro dan komputer emitor Vol. 3, No. 1, Maret 2003
Ciptayani, P. I., Mahmudy, W. F., dan Widodo, A. W., 2009. Menerapkan Algoritma Genetika untuk kompresi citra fraktal.
Cryer, J.D., dan Chan, K.S, 2008. Time Series Analysis With Applications in R.edisi kedua. New York : Springer.
Fariza, A., 2003. Hybrid Algoritma Genetika Simulated Annealing untuk Peramalan Data time Series. Tugas akhir yang dipublikasikan.
Gen, M., dan Cheng, R., 2000. Genetic Algorithms and Engineering Optimization.
Canada : John Wiley & Son Inc.
Makridakis, S., Wheelwright, S.C., dan McGee, V.E., 1999. Jilid 1 Edisi Kedua, Terjemahan Ir. Hari Suminto. Metode dan Aplikasi Peramalan. Jakarta : Bina Rupa Aksara.
Daftar pustaka
Michalewicz, Z., 1996. Genetic Algorithms + Data Structures = Evolution Programs. Verlag, Heidelberg : Springer.
Mitchell, M., 1999. An Introduction to Genetic Algorithms. London : Cambridge.
Ong, C.S., Huang, J.J., dan Tzeng G.H., 2005. Model identification of ARIMA family using genetic algorithms. Journal Applied Mathematics and Computation, 164, 885-912
Rohman, M.N., 2009. Identifikasi Model Arima Box-Jenkins Mengunakan Algoritma Genetika. Tugas Akhir S1 Statistika ITS Surabaya (tidak dipublikasikan). Sanjoyo. 2006. Aplikasi Algoritma Genetika.
Sivanandam, S.N.,dan Deepa, S.N., 2008. Introduction to Genetic Algorithms. Berlin Heidelberg New York : Springer.
Suyanto. 2005. Algoritma Ganetika dalam MATLAB. Yogyakarta : ANDI offset. Wei, W.W.S., 1990. Time Series Univariate and Multivariate Methods. Canada:
Addison Wesley Publishing Company, Inc.
Yaffee, M., dan McGee, M., 1999. Introduction to Time Series Analysis and