2010 Mathematics Subject Classification: 62M10, 62P25. 27
PENAKSIRAN PARAMETER MODEL
VECTOR AUTOREGRESSIVE
INTEGRATED
(VARI) DENGAN METODE MLE DAN PENERAPANNYA
PADA DATA INDEKS HARGA KONSUMEN
Dinda Ariska Wulandari1, Nurul Gusriani2, Budi Nurani Ruchjana3
Jurusan Matematika FMIPA Universitas Padjadjaran Jl. Raya Bandung Sumedang KM 21 Jatinangor Sumedang 45363 Email: [email protected], [email protected], [email protected]
Abstract
Vector Autoregressive Integrated (VARI) models is time series multivariate models affected by the variable itself and the other variables in previous period with data not stationary. Stages in VARI models includes differencing, identification, stationary, parameter estimation, diagnostic testing, and forecasting.
In this research, assuming normally distributed error, estimation parameters VARI model can be done by the Maximum Likelihood Estimation (MLE) method by maximizing ln likelihood function. The data used are the Consumer Price Index (CPI) in Bandung, Bekasi, and Depok in period July 2008 - June 2013.
From the results of analysis, the obtained model is VARI(1,1), which means VAR model order one and experience first difference. The application of VARI(1,1) model with MLE method on CPI Bandung, Bekasi, and Depok, shows that each location is correlated to each other and produce a small enough value of MAPE. CPI forecasting results for Bandung, Bekasi, and Depok for the next two months has increased with minimum error in CPI Bandung.
Keywords : time series, VARI, MLE, CPI, MAPE, forecasting.
Abstrak
Model Vector Autoregressive Integrated (VARI) adalah model deret waktu multivariat yang dipengaruhi oleh variabel itu sendiri dan variabel lain pada periode sebelumnya dengan data tidak stasioner. Tahapan dalam model VARI meliputi differencing, identifikasi, stasioneritas, estimasi parameter, uji diagnostik, dan peramalan.
Pada penelitian ini, dengan asumsi galat berdistribusi normal, estimasi parameter model VARI dapat menggunakan metode Maximum Likelihood Estimation (MLE) dengan memaksimumkan fungsi ln likelihood. Data yang digunakan adalah Indeks Harga Konsumen (IHK) di Kota Bandung, Bekasi, dan Depok pada periode Juli 2008 – Juni 2013.
Dari hasil analisis data diperoleh model VARI(1,1), artinya model VAR orde satu dan proses differencing pertama. Penerapan model VARI(1,1) dengan metode MLE pada data IHK Kota Bandung, Bekasi, dan Depok, menunjukkan setiap lokasi saling berkorelasi dan menghasilkan nilai MAPE yang cukup kecil. Hasil peramalan IHK
Kota Bandung, Bekasi, dan Depok untuk dua bulan mendatang mengalami peningkatan dengan galat minimum pada IHK Kota Bandung.
Kata kunci : deret waktu, VARI, MLE, IHK, MAPE, peramalan.
1. Pendahuluan
Salah satu sektor ekonomi yang dianggap penting untuk mewujudkan pembangunan dalam bidang ekonomi yang bertujuan meningkatkan pendapatan masyarakat adalah Indeks Harga Konsumen (IHK). IHK adalah angka indeks yang menggambarkan perubahan harga barang dan jasa yang dikonsumsi oleh masyarakat pada suatu periode waktu yang telah ditetapkan [3]. Data IHK bersifat fluktuatif artinya data mengandung trend sehingga membentuk model deret waktu. Salah satu model yang digunakan dalam deret waktu univariat yaitu model Autoregressive (AR). Model AR adalah suatu model deret waktu yang menggambarkan pengamatan suatu variabel yang dipengaruhi variabel itu sendiri pada periode sebelumnya pada data stasioner.
Untuk data yang tidak stasioner atau mengikuti pola trend dilakukan differencing, yaitu mengurangi nilai data pada suatu periode dengan nilai data periode sebelumnya. Untuk memodelkan data deret waktu univariat berupa data differencing digunakan model Autoregressive Integrated (ARI). Untuk data deret waktu multivariat digunakan model Vector Autoregressive Integrated (VARI).
Model VARI merupakan suatu sistem persamaan yang saling berhubungan dengan variabel-variabel sebelumnya untuk mengukur data tidak stasioner. Penaksiran parameter VARI yang sudah dilakukan adalah dengan metode Ordinary Least Squares (OLS). Berdasarkan asumsi galat pada model VARI berdistribusi normal, estimasi parameter dapat dilakukan dengan metode Maximum Likelihood Estimation (MLE). Yang menarik bagi peneliti yaitu, bagaimana menaksir parameter VARI dengan metode MLE dan penerapannya pada data IHK yang berpola trend tersebut.
Pada penelitian ini dilakukan penaksiran estimasi model VARI dengan metode MLE, serta penerapannya dalam peramalan IHK di Kota Bandung, Bekasi, dan Depok. Ketiga kota tersebut merupakan kota dengan populasi terbesar di Provinsi Jawa Barat.
2. Metode
2.1 Data Deret Waktu (Time Series)
Data deret waktu merupakan proses stokastik yaitu rangkaian data yang berupa nilai pengamatan selama kurun waktu tertentu. Proses stokastik adalah barisan variabel acak yang diberi urutan atau indeks
Zt| t0, 1, 2, 3,
, dengan Zt adalah variabel acak untuk setiapwaktu
t
dant
merupakan tahun, bulan, minggu, hari, atau waktu lainnya tergantung situasi [1]. Menurut Makridakis (1991), langkah penting dalam memilih suatu metode deret waktu (time series) yang tepat adalah dengan mempertimbangkan jenis pola data sehingga metodeyang paling tepat dengan pola data tersebut dapat diuji. Pola data dapat dibedakan menjadi empat, yaitu Pola Horisontal, Pola Musiman, Pola Siklis, dan Pola Trend [2].
2.2 Differencing
Salah satu cara untuk menstasionerkan data adalah dengan differencing. Metode ini dilakukan dengan cara mengurangi nilai data pada suatu periode dengan nilai data periode sebelumnya. Differencing pertama (first difference) dari suatu data deret waktu
Z
t dapat didefinisikan dengan persamaan berikut [1]:
Z
t'
1
B Z
t
Z
t
Z
t1 (1) 2.3 Fungsi Autokovarian, Fungsi Autokorelasi (ACF), dan Fungsi Autokorelasi Parsial(PACF)
Proses stasioner
Zt dengan E Zt
t danVar
Zt E
Ztt
2t2konstan serta
Cov Z Zt, t k fungsi pada waktu t
tk
, maka fungsi autokovarianZ
tdanZ
t k adalah k E
Ztt
Zt k t k
(2) dan fungsi autokorelasi antaraZ
tdanZ
t k ,
Cov , Var Var t t k k t t k Z Z Z Z . (3) Jika
Zt adalah deret waktu yang berdistribusi normal, maka fungsi autokorelasi parsial (PACF) antaraZ
tdanZ
t k yaitu [4]:
ˆ ˆ Cov ), ( Var ˆ Var ˆ Zt Zt Zt k Zt k Pk Zt Zt Zt k Zt k . (4)2.4 Penaksiran Model Autoregressive (ARI) dengan Metode MLE
Jika data deret waktu mengandung trend, maka salah satu cara menstasionerkannya adalah dengan differencing. Data yang merupakan model AR orde 1 dan mengalami proses differencing pertama untuk menghasilkan data yang stasioner, akan menjadi model ARI(1,1), yaitu:
Y
t
1Y
t1
a
t (5) dengan, ~
0, 2
iid t
a N
danY
t
Z
tZ
t1 , sehingga persamaan (5) dapat ditulis sebagai berikut:
2
1 1 1 2 , ~ 0, iid t t t t t t Z Z
Z Z a a N
.Model dikatakan stasioner jika akar-akar polinom
( )
B
(1
B
)
0
terletak di luar lingkaran satuan atau dinyatakan dengan
1
[4]. Dengan asumsi galat berdistribusi normal,maka parameter model ARI(1,1) dapat diestimasi dengan menggunakan metode MLE dengan cara memaksimukan fungsi ln likelihood, sehingga dihasilkan penaksiran metode MLE untuk model ARI(1,1), yaitu:
2 1 1 2 1 2 ˆ T t T t t t t Y Y Y
. (6)2.5 Model Vector Autoregressive Integrated (VARI)
Model Vector Autoregressive Integrated (VARI) merupakan pengembangan dari model Autoregressive Integrated (ARI) yang dipengaruhi oleh variabel itu sendiri dan variabel lain pada periode sebelumnya dengan data tidak stasioner. Jika data mengalami proses differencing pertama untuk menghasilkan data yang stasioner, maka bentuk model VAR(1) menjadi model VARI(1,1) dengan persamaan sebagai berikut:
Φ 1 , ~
0, 2
iid t t t t Y Y a a N
(7) atau, N T11Φ
N N 1N T 11 N T 11 t t tY
Y
a
dengan,Y
t
Z
t
Z
t1.2.6 Mean Absolute Percentage Error (MAPE)
Mean Absolute Percentage Error (MAPE) merupakan persentase dari rata-rata mutlak galat pada tiap periode dibagi dengan nilai aktual pada periode tersebut. MAPE mengindikasi seberapa besar persentase galat untuk mengetahui ketepatan dugaan model. MAPE dapat dihitung dengan rumus sebagai berikut [2]:
1
ˆ
1
MAPE
100%
n t t t tZ
Z
n
Z
(8) denganZ
ˆ
tmerupakan data ramalan pada periodet
dann
periode waktu.2.7 Tahapan Penaksiran Parameter Model VARI dengan Metode MLE Tahapan-tahapan dalam menaksir parameter VARI sebagai berikut: 1. Mengubah model VARI ke dalam bentuk model linier.
2. Mencari fungsi likelihood model VARI dari fungsi kepadatan peluang gabungan galat. 3. Mentransformasikan fungsi likelihood ke dalam fungsi ln likelihood.
4. Mencari turunan pertama dari fungsi ln likelihood terhadap parameter .
2.8 Data Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data Indeks Harga Konsumen (IHK) di Kota Bandung, Bekasi, dan Depok secara bulanan yang bersumber dari website Badan Pusat Statistik. Untuk menentukan model, digunakan data pada periode Juli 2008 – Juni 2013, sedangkan untuk peramalan, digunakan data periode Juli – Agustus 2013.
2.9 Variabel Penelitian
Variabel-variabel yang digunakan dalam penelitian ini yaitu:
1,t
Z
= IHK Kota Bandung2,t
Z
= IHK Kota Bekasi3,t
Z
= IHK Kota Depok1,t
Y
= Data Differencing IHK Kota Bandung2,t
Y
= Data Differencing IHK Kota Bekasi3,t
Y
= Data Differencing IHK Kota Depok.2.10 Tahapan Analisis Data
1. Data Tiga Lokasi, data yang digunakan adalah data IHK di Kota Bandung, Bekasi, dan Depok periode Juli 2008 – Juni 2013 yang sudah dipusatkan, selanjutnya, membuat analisis statistik deskriptif dan grafik untuk masing-masing data yang telah dipusatkan.
2. Kestasioneran Data, data dikatakan tidak stasioner jika data mengandung trend serta pada plot ACF dan PACF meluruh sangat perlahan. Jika data tidak stasioner perlu dilakukan proses differencing.
3. Identifikasi Model ARI(1,1), dikatakan model ARI(1,1) jika pada plot ACF menurun secara eksponensial menuju nol dan plot PACF terpotong pada lag 1.
4. Kestasioneran Model ARI(1,1), model dikatakan stasioner apabila
1
atau
1
1
. 5. Estimasi Model VARI(1,1), jika untuk ketiga lokasi diidentifikasi model AR1(1,1) danmodel tersebut sudah stasioner, maka dapat dibentuk model VARI(1,1).
6. Penaksiran Parameter Model VARI(1,1), dengan asumsi galat berdistribusi normal, taksiran parameter model VARI(1,1) diperoleh menggunakan metode MLE.
7. Perhitungan MAPE, untuk mengetahui apakah model VARI(1,1) dengan metode MLE sudah baik dan cocok untuk digunakan pada data IHK Kota Bandung, Bekasi, dan Depok, ditunjukkan pada perhitungan Mean Absolute Percentage Error (MAPE) yang minimum. 8. Peramalan, setelah didapat model yang sesuai, maka tahapan selanjutnya adalah peramalan
jangka pendek pada data IHK Kota Bandung, Bekasi, dan Depok periode Juli – Agustus 2013.
3 Hasil dan Pembahasan
3.1 Penaksiran Parameter Model VARI dengan Metode MLE
Asumsi galat pada model VARI(1,1) berdistribusi normal, sehingga parameter model VARI(1,1) dapat diestimasi menggunakan metode MLE dengan cara memaksimukan fungsi ln likelihood. Misal, untuk lokasi N 3dan waktu T3, maka model VARI(1,1) menjadi:
3 2 1
Φ
3 3 3 3 1 3 2 1 3 2 1t t t
Y
Y
a
dapat ditulis dalam bentuk:1, 2 1,1 2 ,1 3,1 2 , 2 1,1 2 ,1 3,1 3, 2 1, 2 2 , 2 3, 2 1,3 1, 2 2 , 2 3, 2 2 ,3 3,3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y 22 23 31 32 11 12 1, 2 13 2 , 2 21 1,1 2 ,1 3,1 3, 2 1,3 2 ,3 1, 2 2 , 2 3, 3 2 3,3 3 0 0 0 0 0 0 0 a a Y Y Y a a a Y Y Y a y X .
Persamaan di atas disederhanakan dengan persamaan linier, yaitu:
y
X
(9) sehingga fungsi likelihoodnya yaitu:
' 2 1 2 2 2 2 1 , 2 n L e y X y X . (10) Fungsi ln likelihood menjadi,
2
2
'
2 1 ln , ln 2 2 2 n L yX yX . (11)Persamaan (11) diturunkan terhadap ,
2 ' 2 ln L , 1 y X X . (12) Memaksimumkan fungsi likelihood pada persamaan (12), maka:
1 ' 0 2 yX X ' ' '0
y X
X X
'y X'
X'X 1. (13) Dengan menghilangkan transpose pada
', persamaan (13) menjadi:
ˆ
X X
' 1X y
' . (14)Maka taksiran MLE untuk model VARI(1,1) pada, N 3dan T 3 menjadi:
9 1 3 3 3 2 3 2 3 3 3 3 3 2 3 2 1 1 ' ' 1 1 1 1
ˆΦ
Y
t Y
t Y
t Y
t
.Taksiran MLE untuk model VARI(1,1) pada N lokasi dan waktu T secara umum, yaitu:
1 1 1 1 1 1 1 ' ' 1 1 1 1
Φˆ
N N N T N T N N N N N T N T N N t t t tY
Y
Y
Y
(15) denganY
t
Z
t
Z
t1.3.2 Data Tiga Lokasi
Tabel 1. Statistik Deskriptif Data IHK Kota Bandung, Bekasi, dan Depok
Lokasi Mean Standar Deviasi N
Bandung -5,021322 x 10-14 6,285707 60
Bekasi -9,471446 x 10-15 8,213524 60
Depok 1,633950 x 10-14 8,292139 60
Penyebaran data terhadap pusat data (rata-rata) untuk nilai IHK Kota Bandung adalah 6,285707 sedangkan untuk IHK Kota Bekasi sebesar 8,213524 dan IHK Kota Depok adalah 8,292139.
Berdasarkan grafik data IHK Kota Bandung, Bekasi, dan Depok diperoleh bahwa data mengandung trend serta fungsi ACF dan PACF yang meluruh sangat perlahan, maka dapat dikatakan bahwa data IHK Kota Bandung, Bekasi, dan Depok belum stasioner sehingga dilakukan differencing.
3.3 Proses Differencing
Tabel 2. Statistik Deskriptif Data IHK Kota Bandung, Bekasi, dan DepokDifferencing Pertama
Lokasi Mean Standar Deviasi N
Bandung 0,3742373 0,5007174 59
Bekasi 0,4766102 0,7162898 59
Depok 0,4830508 0,7243505 59
Berdasarkan Tabel 2, penyebaran data terhadap pusat data (rata-rata) untuk nilai IHK differencing pertama Kota Bandung adalah 0,5007174, Kota Bekasi sebesar 0,7162898 dan Kota Depok adalah 0,7243505. Data hasil differencing lebih baik, yang ditunjukkan oleh nilai standar deviasi yang lebih kecil.
Gambar 1. Grafik IHK Kota Bandung Differencing Pertama
Gambar 2. Grafik IHK Kota Bekasi Differencing Pertama
Gambar 3. Grafik IHK Kota Depok Differencing Pertama
Setelah di differencing, dihasilkan grafik data IHK di Kota Bandung, Bekasi, dan Depok menggunakan bantuan software R 2.11.1. Pada Gambar 1, Gambar 2, dan Gambar 3, dapat dilihat bahwa data sudah cukup stabil. Oleh karena itu data hasil differencing pertama untuk IHK Kota Bandung, Bekasi, dan Depok sudah stasioner sehingga data differencing pertama bisa digunakan pada model ARI.
3.4 Identifikasi Model ARI(1,1)
Data yang digunakan diidentifikasi menggunakan grafik ACF dan PACF dengan bantuan software R 2.11.1, yang ditunjukkan pada gambar di bawah ini.
Gambar 4. Grafik ACF dan PACF IHK Kota Bandung Differencing Pertama
Time Series Plot of Data
Time IHK $B an du ng .Di ff1 La g1 0 10 20 30 40 50 60 -0 .5 0. 5 1. 5 0 5 10 15 20 25 -0 .2 0. 4 1. 0 Lag A CF Series IHK$Bandung.Diff1Lag1 5 10 15 20 25 -0 .3 0. 0 0. 3 Lag P ar tia l A CF Series IHK$Bandung.Diff1Lag1
Time Series Plot of Data
Time IHK $B ek as i.Di ff1 La g1 0 10 20 30 40 50 60 -1 0 1 2 0 5 10 15 20 25 -0 .2 0. 4 1. 0 Lag ACF Series IHK$Bekasi.Diff1Lag1 5 10 15 20 25 -0 .3 0. 0 0. 3 Lag Pa rti al A CF Series IHK$Bekasi.Diff1Lag1 Time Series Plot of Data
Time IHK $De po k. Di ff1 La g1 0 10 20 30 40 50 60 -1 .0 0. 5 2. 0 0 5 10 15 20 25 -0 .2 0. 4 1. 0 Lag ACF Series IHK$Depok.Diff1Lag1 5 10 15 20 25 -0 .2 0. 1 Lag Pa rti al A CF Series IHK$Depok.Diff1Lag1
Gambar 5. Grafik ACF dan PACF IHK Kota Bekasi Differencing Pertama
Gambar 6. Grafik ACF dan PACF IHK Kota Depok Differencing Pertama
Pada Gambar 4, Gambar 5, dan Gambar 6, terlihat bahwa pada grafik ACF dari lag ke-1 hingga seterusnya menurun secara eksponensial dan pada grafik PACF terlihat bahwa lag ke-1 keluar dari garis bartlett sehingga dapat dikatakan bahwa data signifikan pada lag ke-1. Artinya data untuk data IHK Kota Bandung, Bekasi, dan Depok differencing pertama dapat dimodelkan dengan menggunakan model ARI(1,1).
3.5 Kestasioneran Model ARI(1,1)
Hasil estimasi model ARI(1,1) dengan metode MLE data IHK, untuk Kota Bandung didapat nilai parameter ˆ10, 5951. Nilai parameter untuk Kota Bekasi yaitu ˆ10, 5409. Nilai parameter untuk Kota Depok yaitu ˆ10, 6157. Dari ketiga variabel, parameter
ˆ1 memenuhi syarat ˆ1 1, dapat dikatakan bahwa model ARI(1,1) untuk ketiga variabel sudah stasioner.3.6 Estimasi Parameter Model VARI(1,1) dengan Metode MLE
Menggunakan bantun Microsoft Office Excel 2013, diperoleh nilai parameter untuk masing-masing lokasi,
ˆ110, 23822,
ˆ120,40291,
ˆ13 0, 06023,
ˆ210, 02338,22 0, 99
ˆ 124
,
ˆ230,48064,
ˆ310,31719,
ˆ320,18163 dan
ˆ330,28067. Hasil yang diperoleh untuk model VARI(1,1) dengan metode MLE sebagai berikut: Yˆ1,t 0, 23822 Y1,t1 0, 40291 Y2,t10, 06023 Y3,t1 (16) Yˆ2,t 0, 02338 Y1,t1 0,12499 Y2,t1 0, 48064 Y3,t1 (17)Yˆ3,t 0, 31719 Y1,t1 0,18163 Y2,t1 0, 28067 Y3,t1. (18) Hasil persamaan (16), (17), dan (18), menyatakan bahwa model VARI(1,1) dengan metode MLE untuk data IHK Kota Bandung, Bekasi, dan Depok membentuk model VAR(2). 3.7 Peramalan
Selanjutnya dilakukan perhitungan Mean Absolute Percentage Error pada masing-masing lokasi untuk mengetahui model yang sudah distimasi sudah layak atau belum untuk digunakan.
Tabel 3. Mean Absolute Percentage Error
Lokasi MAPE (%)
Bandung 6,17028
Bekasi 8,05083
Depok 7,81827
Dapat dilihat nilai galat untuk lokasi Bandung sebesar 6,17028% dari nilai aktual, Bekasi sebesar 8,05083%, dan 7,81827%, sehingga model VARI(1,1) dengan metode MLE sudah layak digunakan untuk peramalan, karena memberikan nilai MAPE yang cukup kecil.
Tabel 4. Hasil Peramalan IHK Kota Bandung, Bekasi, dan Depok Tahun 2013
Lokasi Bulan Juli 2013 Bulan Agustus 2013
Aktual Taksiran Galat Aktual Taksiran Galat Bandung 137,56 134,49 3,07 139,46 135,25 4,21
Bekasi 144,44 140,29 4,15 146,94 141,26 5,68
Depok 146,27 141,47 4,8 147,81 142,53 5,28
Berdasarkan Tabel 4 terlihat hasil peramalan IHK Kota Bandung, Bekasi, dan Depok untuk dua bulan kedepan pada periode Juli – Agustus 2013 mengalami peningkatan, namun mengalami penurunan dari data aktualnya, dengan nilai galat terkecil pada IHK Kota Bandung
4. Simpulan
Berdasarkan uraian dan analisis data yang telah dilakukan, maka disimpulkan bahwa: 1. Data deret waktu univariat berupa data differencing menggunakan model ARI. Jika model
ARI pada tiga lokasi digabungkan, maka menjadi model VARI. Dengan asumsi galat berdistribusi normal, penaksiran parameter model VARI dapat dilakukan menggunakan metode MLE yaitu memaksimumkan turunan fungsi ln likelihood.
2. Data IHK Kota Bandung, Bekasi, dan Depok mengandung trend, sehingga model yang sesuai yaitu VARI(1,1) karena setiap data melalui proses differencing pertamadan merupakan model ARI(1,1). Model VARI(1,1) yang diperoleh dapat dinyatakan sebagai model VAR(2). Model VARI(1,1) dengan metode MLE pada data IHK Kota Bandung, Bekasi, dan Depok menghasilkan nilai MAPE yang cukup kecil, dengan hasil peramalan untuk dua bulan mendatang periode Juli – Agustus 2013 mengalami peningkatan dan nilai galat terkecil terdapat pada data IHK Kota Bandung.
Daftar Pustaka
[1] Cryer, J.D. dan Chan, K. 2008. Time Series Analysis; With Applications in R. New York: Springer.
[2] Makridakis, S., Wheelwright, S.C., dan McGee, V.E. 1991. Metode dan Aplikasi Peramalan. Jakarta: Erlangga.
[3] Mankiw, N.G. 2007. Makroekonomi. Jakarta: Erlangga.
[4] Wei, W.W.S. 2006. Time Series Analysis; Univariate and Multivariate Methods. Department of Statistics Temple University: Addison-Wesley Publishing Company. [5] http://www.bps.go.id. (diakses pada tanggal 20 September 2013)