Permodelan Data Jumlah Penumpang Pesawat
Surabaya – Jakarta dengan Model ARFIMA dan SETAR
Senja Budhi Kusuma
~ Senjakusuma@gmail.com ~
Pembimbing : Slamet Mulyono -- Co Pembimbing : Jerry D.T.P S.Si, M.Si
Surabaya, 31 januari 2011
~ Latar Belakang
Jakarta
41%
BPN
13%
UPG
8%
AMI
8%
BDJ
8%
DPS
7%
Lainnya
15%
FAKTA
4662 per hari
7 maskapai
42 penerbangan/hari
~ Latar Belakang
Long Memory
Plot ACF hiperbolik
Estimasi 0<d <0,5
Nonlinear
UjiTerasvirta
UjiWhite
Year Month 2009 2008 2007 2006 Oct Jul Apr Jan Oct Jul Apr Jan Oct Jul Apr Jan Oct Jul Apr Jan 8000 7000 6000 5000 4000 3000 2000 1000 J u m la h P e n u m p a n gMODEL ALTERNATIF
Pendahuluan
1. Bagaimana implementasi model ARFIMA dan SETAR pada
data jumlah penumpang keberangkatan Surabaya menuju
Jakarta ?
2. Bagaimana perbandingan model ARFIMA dan SETAR
terhadap data tersebut?
P
e
rm
as
al
ah
an
T
uj
ua
n
1. Menerapkan model ARFIMA dan SETAR pada data
jumlah penumpang keberangkatan Surabaya menuju
Jakarta.
2. Membandingkan model ARFIMA dan SETAR terhadap
data tersebut.
Pendahuluan
Diperoleh model dan ramalan mengenai jumlah penumpang
keberangkatan Bandar Udara Juanda Surabaya menuju Jakarta sehingga
dapat dijadikan informasi bagi pihak yang terkait. Informasi ini dapat
menjadi pertimbangan dalam menentukan sebuah kebijakan khususnya
yang berkaitan langsung pada bisnis jasa penerbangan.
Man
faat
B
at
as
an
Data jumlah penumpang keberangkatan dari Bandar Udara
Internasional Juanda Surabaya menuju Bandar Udara
Internasional Soekarno-Hatta Jakarta dari bulan Januari 2006
sampai dengan Desember 2009.
~ Tinjauan Pustaka
LONG MEMORY
Proses yang memperlihatkan adanya keterkaitan secara jangka
panjang.
ACF yang turun lambat secara hiperbolik
Atau :
Tinjauan Pustaka
Pengujian LONG MEMORY
Untuk mengidentifikasi adanya sifat long memory
dapat dilakukan dengan pengujian :
• Uji Geweke dan Porter-Hudak (GPH) dengan
• Uji rescaled range statistics (R/S)
• EML
• MPL
dengan hipotesis nol adalah d=0 dan daerah
penilaian adalah 0,5<d<0,5
MODEL ARFIMA
Untuk d nilai real berkisar antara -0,5 < d < 0,5 dengan asumsi sebagai berikut :
Dengan koefisien binomial sebagai berikut :
Self Exciting Treshold Autoregressive
Sumber Data
Data jumlah penumpang keberangkatan dari
Bandar
Udara Internasional Juanda Surabaya
menuju
Bandara
Soekarno-Hatta, Jakarta.
Berupa data harian mulai dari tanggal 1 Januari 2006
sampai dengan tanggal 30 Okt 2009.
1 Januari 2006 sampai dengan 30 September 2009
sebagai data
in sample
dan 1 Nov 2009 sampai
~ AUTOREGRESSIVE FRACTIONALY INTEGRATED MOVING AVERAGE
Pengujian stasioner terhadap varian
dan mean.
Pengujian long memory
Identifikasi model
Penaksiran Parameter
Diagnostic Check dan Pemilihan Model
~ SELF EXCITED THRESHOLD AUTOREGRESSIVE
Uji Nonlinieritas Terasvirta
Menentukan parameter delay dan
treshold dengan kriteria AIC
Menguji signifikansi parameter model.
Memeriksa sampel ACF
Menguji Normalitas dari sisa melalui Uji
Kolmogorov-Smirnov
~ STASIONERITAS VARIAN DAN MEAN
5.0 2.5 0.0 -2.5 -5.0 1200 1100 1000 900 800 700 600 500 400 300 Lambda St De v Lower CL Upper CL Limit Estimate 0.99 Lower CL 0.74 Upper CL 1.22 Rounded Value 1.00 (using 95.0% confidence) LambdaBox-Cox Plot of Sub-Cgk
Uji statistik
p-value
Kesimpulan
Augmented Dikey
Fuller (ADF)
0,01
Tolak H
0; data stasioner
Phillips-Perron (PP)
0,01
Tolak H
0; data stasioner
Keterangan : * α = 0,05
• BOX COX PLOT
Permodelan ARFIMA
80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 LagAut
oco
rrel
atio
n
Autocorrelation Function for Sub
(with 5% significance limits for the autocorrelations)
Metode Estimasi
Estimasi
EML(Exact Maximum Likelihood
0,492732
MPL (Modified profile likelihood)
0,492724
GPH (Geweke Porter Hundak)
0,4997562
~ ACF dan PACF
80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag A u to co rr e la ti o nAutocorrelation Function for d = 0.484458
(with 5% significance limits for the autocorrelations)
80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag P a rt ia l A u to co rr e la ti o n
Partial Autocorrelation Function for d = 0.484458
(with 5% significance limits for the partial autocorrelations)
80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag A u to co rr e la ti o n
Autocorrelation Function for diff_d
(with 5% significance limits for the autocorrelations)
80 70 60 50 40 30 20 10 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag P a rt ia l A u to co rr e la ti o n
Partial Autocorrelation Function for diff_d
(with 5% significance limits for the partial autocorrelations)
Gambar 4.6 ACF Plot d
Gambar 4.8 ACF Plot d diff 7 Gambar 4.9 PACF Plot d diff 7
~ MODEL ARFIMA
Model 1 Model 2 Model 3
Coeff t-prob Coeff t-prob Coeff t-prob
AR-1 0.188616 0 0.142763 0 0.149686 0 AR-2 -0.11228 0 -0.10973 0 -0.1121 0 AR-5 0.046577 0.076 0.055693 0.02 0.05654 0.023 AR-7 0.072411 0.009 -0.38535 0 -0.3364 0.016 AR-14 0.033614 0.219 AR-21 -0.05132 0.057 AR-28 0.021078 0.434 AR-35 -0.0656 0.015 -0.08685 0 MA-6 -0.02636 0.001 MA-7 -0.94285 0 MA-7 -0.54211 0 -0.45554 0 -0.51059 0 MA-14 -0.37343 0 -0.32367 0.008 MA-21 -0.06496 0.027 -0.07357 0.011
White noise Ya Ya Tidak
Normal Tidak Tidak Tidak
PENGUJIAN LINEARITAS
Uji statistik
p-value
Kesimpulan
Terasvirta
0,0173
Tolak H
0
; data tidak linear
Nilai AIC model SETAR dengan kombinasi d dan p
Delay
Parameter
1
2
1
17505,95
17959,64
2
17466,13
17812,02
3
17412,16
17766,56
4
17387,72
17754,01
5
17378,26
17738,8
6
17361,62
17739,91
7
17298,87
17716,76
8
17267,89
17715,27
9
17242,2*
17709,93
10
17244,92
17710,85
11
17246,77
17710,18
12
17246,4
17709,17
Estimasi model SETAR dengan AIC minimum
Estimate Pr(>|t|) Estimate Pr(>|t|)
const L 429,5768626 0,000127 const L 443,6219 7,02E-05 phiL,1 0,5522653 < 2,2e-16 phiL.1 0,534582 < 2,2e-16
phiL.2 -0,0528427 0,1190726 - -
-phiL.3 0,0954641 0,0034918 phiL.3 0,074996 0,011024
phiL.4 0,0848183 0,0092309 phiL.4 0,110823 0,000176
phiL.5 0,056572 0,085718 - -
-phiL.6 -0,0096299 0,7758459 - -
-phiL.7 0,2826677 < 2,2e-16 phiL.7 0,282953 < 2,2e-16
phiL.8 -0,2055486 8,90E-10 phiL.8 -0,19704 2,97E-09
phiL.9 0,1015586 0,0005045 phiL.9 0,095862 0,000626
const H 488,854953 0,2991734 const H 496,0324 0,292501 phiH.1 0,7303242 < 2,2e-16 phiH.1 0,715679 < 2,2e-16
phiH.2 -0,046734 0,4985348
phiH.3 0,1761667 0,0092826 phiH.3 0,154347 0,002379
phiH.4 -0,0442301 0,5206103 - -
-phiH.5 0,1082791 0,1001989 - -
-phiH.6 -0,3104647 2,04E-07 phiH.6 -0,27411 5,31E-07
phiH.7 0,3983411 3,30E-09 phiH.7 0,402222 1,59E-09
phiH.8 -0,3801681 3,74E-07 phiH.8 -0,36055 3,70E-07
~ PERBANDINGAN ARFIMA DAN SETAR
Model
Insample
Outsample
AIC
MSE
MAPE
ARFIMA
15.0973594
726313.3
12.85768
SETAR
17239
849957.4
89.2945992
Kriteria kebaikan model
Year Month Day 2009 Dec Nov 26 21 16 11 6 1 26 21 16 11 6 1 7000 6500 6000 5500 5000 4500 4000 3500 Da ta AKTUAL SETAR ARFIMA Variable
~ KESIMPULAN
Model ARFIMA terbaik adalah model ARFIMA ([1,2,5,7,35], d,
[7,14,21]), model ARFIMA ini tidak memenuhi asumsi kenormalan
terhadap data namun sudah white noise. Kondisi ketidak normalan
diakibatkan adanya outlier yang terjadi karena adanya hari libur nasional
dan hari besar keagamaan.
Model
SETAR
terbaik
adalah
model
SETAR
(1,(1,3,4,7,8,9)
,(1,3,5,6,7,8,9)). Asumsi residual normal belum terpenuhi diakibatkan hal
yang sama pada model ARFIMA. Model SETAR terbaik memiliki threshold
sebesar 5445 dengan 2 regime yang masing-masing proporsinya adalah
83,68 % untuk regime bawah dan 16,32 untuk regime atas.
Perbandingan kedua metode menghasilkan kesimpulan bahwa model
ARFIMA lebih baik dari kriteria insample maupun outsample.
~ SARAN
Saran untuk penelitian selanjutnya yang sejenis adalah
mencoba melakukan pembobotan pada titik-titik ekstrem yang
menyebabkan outlier akibat adanya hari libur nasional dan
hari raya keagamaan yang menjadikan residual tidak normal.
Pembobotan akan membuat model lebih sensitif terhadap
adanya hari-hari dengan penumpang ekstrem. Alternatif lain
adalah dengan melakukan permodelan yang tidak ketat
asumsi dan lebih robust terhadap outlier seperti Neural
Network.
Daftar Pustaka
Amendola, A. Niglio, M. 2000. Non-Linear Dynamics and Evaluation of forecast using High-Frequency Time
Series. Quaderni di Statistica, Vol. 2, 2000
Bhardwaj, G. Swanson, N,R. 2003. An Empirical Investigation of the Usefulness of ARFIMA Models for
Predicting Macroeconomic and Financial Time Series. Rutgers University
Breidht, F.J. Hsu, N.J. 2002. A Class of nearly long memory time series models, International of forecasting,
18, 265-281.
Box, G.E.P., Jenkins, G.M., and Reissel, G.C., 1994. Time Series Analysis Forecasting and Control, 3rd
edition. Englewood Cliffs : Prentice Hall.
Chan, W.S. Wong,A.C.S. Tong, H. Some Nonlinear Threshold Autoregressive Time Series Models For
Actuarial Use.North American Actuarial Journal, Vol. 8, No. 4
Choi, K., Hammoudeh, S. 2009. Long Memory in Oil and Refined Product Markets. The Energy Journal
;2009;30;2;ABI/INFORM Global pg 97
Cowpertwait, P.S.P., Metcalve, A.V., 2009. Introductory Time Series with R. New York : Springer.
Cryer, J.D., Chan, K. 2008. Time Series Analysis with Applications in R. New York : Springer.
Doornik, J. A., dan Ooms, M.1999. Inference and Forecasting for Fractional Autoregressive Integrated
Moving Average Models, with An Application to US and UK Inflation, Econometric Institute Report
9947/A, Erasmus University, Rotterdam, The Netherlands.
Doornik, J. A., dan Ooms, M. 2001. A Package for Estimating, Forecasting, and Simulating Arfima Models:
Arfima Package 1.01 for Ox, Nuffield College, Rotterdam.
Galbraith, J.W., Zinde-Walsh, V. 2001. Autoregression-Based Estimator for ARFIMA Models. Scientific
Series. ISSN 1198-8177.
Gourieoux, C. Jasiax, J. 2001. Memory and infrequent breaks, Economics Letter, 70, 29-41
Granger, C.W.J., Hyung, N. 2004. Occasional structural breaks and long memory, Journal of Empirical
Finance, 11, 399-421.
Daftar Pustaka
Irhamah. 2001. Perbandingan Metode-metode Pendugaan Parameter Model ARFIMA. Tesis, Institut Teknologi Sepuluh Nopember, Surabaya.
Karlaftis, M.G., Vlahogianni, V.I., 2009. Memory Properties and Fractional Integration In Transportation Time-Series.
Transportation Research Part C 17 (2009) hal 444–453.
Kirchgässner, G., Wolters, J., 2007. Introduction to Modern Time Series Analysis. New York :Springer.
Kuswanto, H. Sibbertsen, P. 2008. A Study on "Spurious Long Memory in Nonlinear Time Series Models". Apllied Mathematical sciences, Vol. 2, 2008, no. 55, 2713-2734
Koul, H.L. Stute, W. Li, F. 2005. Model Diagnosis for SETAR Time Series. Statica Sinics 15(2005), 795-817
Lahiania, A. Scaillet, O,. 2009. Testing for threshold effect in ARFIMA models: Application to US unemployment rate data. Rennes School of Business and EconomiX, University of Paris 10 Nanterre, France
Lobato, I.N. Savin, N.E. 1998.Real and Spurious Long-Memory Propoerties of Stock-Market Data.Journal of Business & Economic Statistics, Vol. 16, No. 3. (Jul., 1998), pp. 261-268.
Nuryana, F. 2001. Perbandingan Pendekatan ARIMA dan ARFIMA (Studi Kasus Permodelan Kecepatan Angin di Kabupaten
Sumenep). Tugas Akhir S1 Statistika ITS Surabaya.
Ozun, A. Cifter, A. 2008. Modeling Long-Term Memory Effect In Stock Price. Study In Economic And Finance Vol.25 No.1,
2008 hal 38-48
Prafitia, H.A., 2010. Long Memory Pada Data Nilai Tukar Rupiah Terhadap Dollar Amerika Serikat (USD). Tugas Akhir S1 Statistika ITS Surabaya.
Schmidt, C.S., Tschernig, R., 1994. The Identification of Fractional ARIMA Models. Suhartono, 2008. Analisis Data Statistik dengan R. Surabaya : Jurusan Statistika, ITS.
Subanar. Suhartono. 2000. Uji Linearitas Tipe Lagrange Multiplier dengan Ekspansi Taylor untuk Deteksi Hubungan Nonlinear Pada Data Time Series. J. Indones. Math. Soc. (MIHMMI)
Tong, H.1983. Threshold Models in Non-Linear Time Series Analysis. Springer, New York.
Wei, W.W.S., 2006. Time Series Analysis Univariate and Multivariate Methods. United States : Pearson Education, Inc. Qu, Zhongjun. 2008. A Test Against Spurious Long Memory. Boston University.