PEMODELAN DATA RUNTUN WAKTU
PADA 102 NILAI BERTURUT-TURUT UNTUK DEVIASI (DALAM 0.0000025 UNIT INCI) DARI NILAI TARGET YANG DITENTUKAN
Anna Juliana Mose, Syarifatul Muflikhah dan Yefta Rizky Dwi Efendi PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN MATEMATIKA UNIVERSTAS KRISTEN SATYA WACANA
Abstrak
Pada masa mendatang persaingan dan ketidakpastian sangat mengkhawatirkan, maka dituntut untuk dapat mengambil keputusan yang tepat. Peramalan diperlukan untuk memprediksi apa yang akan terjadi dimasa yang akan datang. Makalah ini akan membahas tentang data runtun waktu pada data “deere2” dengan model ARIMA. Data yang didapatkan sudah stasioner maka dicari ACF dan PACF agar dapat diidentifikasi model runtun waktunya. Model yang sesuai ialah model AR(1). Model tersebut, didiagnosis untuk menguji apakah model benar-benar layak dan memenuhi asumsi, kemudian diprediksi nilai target 10 unit inci berikutnya.
Kata kunci - data runtun waktu, pemodelan, diagnosis, prediksi PENDAHULUAN
Pada masa mendatang persaingan dan ketidakpastian sangat mengkhawatirkan, maka dituntut untuk dapat mengambil keputusan yang tepat agar dapat mengatasi masa yang akan datang. Ramalan berdasarkan data-data statistik, diperlukan untuk memprediksi apa yang akan terjadi dimasa yang akan datang. Mungkin masa depan akan berubah-ubah dan akan sedikit berbeda dengan ramalan yang dilakukan, namun setidaknya dapat mengambil tindakan yang tepat terhadap situasi yang akan terjadi. Dalam peramalan digunakan data runtun waktu dengan jangka tertentu seperti harian, mingguan, dll. Dalam makalah ini akan membahas tentang data runtun waktu pada data “deere2”.
Dalam melakukan peramalan, salah satu model yang akan digunakan adalah ARIMA (Autoregressive Integrated Moving Average) atau model autoregresif rata-rata bergerak terpadu yang sering disebut metode Box-Jenkins. Model tersebut dapat digunakan dalam peramalam namun pola data harus stasioner.
DASAR TEORI
Data Stasioner dan Non Stasioner
Data stasioner adalah data yang tidak mengalami kenaikan dan penurunan yang ektrem. Suatu data dapat dikatakan stasioner apabila pola data tersebut berada pada kesetimbangan sekitar nilai rata yang konstan dan variansi masih disekitar rata-rata tersebut konstan selama waktu tertentu (Makridakis, 1999:61). Data yang tidak stasioner memiliki rata-rata dan variansi yang tidak konstan sepanjang waktu. Analisis stasioner berkaitan dengan data runtun waktu (Time Series). Tujuan analisis data runtun waktu adalah mempelajari struktur temporal (dinamik) data. Untuk data yang stasioner bila digambarkan data tersebut terhadap waktu maka akan sering melewati sumbu horizontal, dan autokorelasinya akan menurun dengan teratur untuk lag yang cukup besar.
ACF (Fungsi Autokorelasi Sampel)
Fungsi autokorelasi merupakan salah satu langkah untuk memeriksa hubungan antara suatu data runtun waktu. Jika diberikan data Y1,Y2, … ,Yn . Diasumsikan data stasioner, maka akan diestimasi fungsi autokorelasinya dalam berbagai lag k = 1, 2,…,n. Ternyata cara untuk menghitung fungsi korelasi antara pasangan unit k terlepas dari waktunya adalah :
Y
∑
t=k+1 n(
Yt− ´Y)
(¿¿t−k− ´Y)∑
t=1 n(
Yt− ´Y)
2 rk=¿ PACF (Fungsi Autokorelasi Sampel Parsial)
Koefisien autokorelasi parsial biasanya di simbolkan dengan ∅kk . ∅kk merupakan korelasi antara dua peubah acak Yt dan Yt−k dengan syarat
Yt−1, Yt−2, … ,Yt−k+1 . Untuk mendapat Koefisien autokorelasi parsial, dapat menggunakan rumus:
∅kk= ρk−
∑
j−1 k−1 ∅k−1ρk−j 1−∑
j−1 k−1 ∅k−1ρj dengan ∅kj=∅k−1,j−∅kk∅k−1,k−j untuk j=1,2,… , k−1Berdasarkan ACF dan PACF maka akan mampu diidentifikasi model data runtun waktunya. Model fitting dapat digunakan untuk menentukan estimasi yang bisa dikatakan terbaik dari parameter yang belum diketahui dalam model yang diberikan sehingga data runtun waktu perlu dimodelkan.
MODEL ARIMA (Autoregressive Integrated Moving Average)
Model ARIMA dibentuk oleh unsur-unsur, yaitu : model AR, model MA, dan model ARMA.
Autoregressive Model (AR)
Bentuk umum model autoregresif berorde p atau AR(p) dinyatakan sebagai berikut: Yt=ϕ1Yt−1+ϕ2Yt−2+…+ϕpYt−p+et
dengan Yt = nilai data pada periode t t = waktu
∅i = parameter, i=1, 2,… , p
et = peubah acak yang diasumsikan 0,σ 2
e et N¿ ) Moving Average Model (MA)
Bentuk umum model autoregresif berorde p atau AR(p) dinyatakan sebagai berikut: Yt=et−θ1et−1−θ2et−2…+θqet−q
dengan Yt = nilai data pada periode t t = waktu
et = peubah acak yang diasumsikan 0,σ 2
e
et N¿ ) dan parameter θ1, … ,θq bisa positif atau negative.
Autoregressive Moving Average Model (ARMA)
Bentuk model campuran antara AR dan MA, yang disebut model ARMA(p,q) sebagai berikut :
Yt=∅1Yt−1+…+∅pYt−p+et−θ1et−1−…−θqet−q
untuk meramal suatu runtun waktu , tentu kita akan menemukan data runtun waktu yang tidak stasioner. Data runtun waktu yang tidak stasioner dapat dijadikan stasioner dengan melakukan differensial. Suatu model dikatakan berorde d apabila proses runtun waktu memerlukan differensial sebanyak d kali hingga menjadi stasioner. Bentuk umum model ARIMA(p,d,q) sebagai berikut :
wt=∅1wt−1+∅2wt−2+…+∅pwt−p+et−θ1et−1−et−θ2et−2−…−θqet−q
Ada kemungkinan untuk wt hanya mengandung AR(p) atau MA(q) saja. Apabila wt memuat AR(p) maka runtun waktu Yt disebut sebagai ARI(p,d), sedangkan apabila wt hanya memuat MA(q) maka Yt disebut sebagai IMA(d,q).
METODE PENELITIAN
Data
Gambar.1. Data “deere2” HASIL DAN PEMBAHASAN
Akan dibahas peramalan runtun waktu yang akan datang dengan model ARIMA. Data yang digunakan adalah data “deere2” yang mempunyai 102 nilai dari suatu jumlah deviasi untuk nilai target yang ditentukan dalam proses pemesinan industri di Deere. Langkah awal kita menganalisa data “deere2” stasioner atau tidak stasioner. Analisa stasioner atau tidak stasioner ditunjukan pada Gambar 2, diketahui bahwa data “deere2” stasioner. karena stasioner, maka tidak perlu kita melakukan differensial untuk menjadi stasioner.
G ambar 2. Data “deere2” Stasioner
Pada Gambar 2 pola datanya berada disekitar rata-rata atau tidak mengalami kenaikan maupun penurunan yang ekstrem, dibuktikan juga menggunakan perintah adf.test pada Gambar 3, maka dapat disimpulkan bahwa data “deere2” stasioner.
Gambar 3. Data Stasioner
ACF dan PACF yang diperoleh dari data “deere2” ditunjukkan pada Gambar 4 dan Gambar 5. Dimana data “deere2” mempunyai panjang n = 102 sehingga batas UCL (garis putus-putus) bernilai :
1.96
√
n =1.96
√
102≈0.2ACF pada data “deere2” menunjukkan nilai signifikan mulai lag 1 dan semakin mendekati garis 0, sehingga ACF pada data “deere2” merupakan tails off. Sedangkan PACF data “deere2” signifikan pada lag 1 dan lag 5, tetapi pada lag 2 sampai lag 4 tidak signifikan, maka PACF data “deere2” dapat dikatakan cut off.
G ambar 4. ACF
Gambar 5. PACF
Gambar 4 dan Gambar 5 menunjukkan bahwa ACF tails off dan PACF cut off, maka dapat diramalkan data runtun waktu untuk data “deere2”. Model yang sesuai adalah AR(1), dapat disebut juga ARI(1,0) atau juga ARIMA(1,0,0). Dengan memilih model AR(1), kemudian dilakukan estimasi parameter dari model AR(1) yaitu :
Model AR(1) : Yt=ϕYt−1+et
Menggunakan program pada R diperoleh ϕ = 0.6806 dengan standard error estimasi 0,0733 maka diperoleh estimasi parameter seperti berikut :
Yt=0.6806Yt−1+0.0733
Model yang sudah didapatkan, dilakukan diagnosis dari residunya. Hasil residu standar dari model tersebut dinyatakan dalam Gambar 6 (atas). Dari gambar terlihat bahwa nilai residu standar berkisar antara -3 sampai 2 dapat disimpulkan berdistribusi normal. Untuk menguji kenormalan residu standar pada data deere2, dilakukan uji kenormalan menggunakan perintah Kolmogorov-Smirnov. Hasil pengujian menggunakan uji tersebut diperoleh nilai-p sebesar 0,8103 dimana lebih besar dari 5% sehingga tidak menolak bahwa nilai residu standar tersebut normal. Grafik fungsi autokorelasi residu pada Gambar 6 (tengah) menunjukkan bahwa semua nilai atau korelasi residu sampai lag 20 berada didalam batas garis, artinya tidak ada yang signifikan. Maka dapat dinyatakan tidak berkorelasi atau memenuhi syarat saling bebas. Pada Gambar 6
(bawah) nilai-p dari statistik Ljung-Box tidak ada yang lebih kecil dari tingkat signifikansi 5%, sehingga memenuhi asumsi tersebut.
Gambar 6. Grafik Hasil Diagnosis Residu
Setelah dilakukan diagnosis dengan model AR(1) selanjutnya model tersebut digunakan untuk memprediksi nilai target 10 inci berikutnya. Sehingga diperoleh prediksi beserta nilai standar errornya yang tertera pada Tabel 1. Hasil peramalan juga dinyatakan dalam bentuk grafik pada Gambar 7, dengan tingkat kepercayaan 95%. Hasil prediksi menunjukkan bahwa semakin jauh dari data asli, maka makin lebar batas prediksinya.
Tabel. 1. Hasil Prediksi Data “deere2”
1 2 3 4 5 6 7 8 9 10 prediks i 6.805 8 4.631 9 3.1524 2.1455 1.4602 0.9938 0.6763 0.4603 0.3133 0.2132 SE 7.984 8 9.658 7 10.342 6 10.644 5 10.781 5 10.844 3 10.873 3 10.886 7 10.892 9 10.8958
Gambar 7. Nilai target dan prediksi 10 inci kedepan
Kesimpulan
Makalah ini menjelaskan dan membahas model data runtun waktu, pemodelan yang digunakan terbatas dengan model ARIMA. Dari data “deere2”, model estimasi parameter yang sesuai adalah model AR(1). Hasil diagnosis terbukti data berdistribusi normal dan hasil prediksi menunjukkan nilai yang didapatkan tidak berbeda jauh dari data asli.
DAFTAR PUSTAKA
1. Cryer, J. D. dan Kung-Sik Chan, 2008, Time Series Analysis with application in R, Springer, New York.
2. Wynanti, E. E., 2002, Penggunaan Metode Boostrap Parametrik Pada Model ARIMA Dalam Peramalan Runtun Waktu Yang Akan Datang, Skripsi, Salatiga. 3. Setiawan, Adi., Pemodelan Data Runtun Waktu: Kasus Data Tingkat Pengangguran
Lampiran :
a. Memanggil data deere2.
> library(TSA)
Attaching package: ‘TSA’
acf, arima
The following object is masked from ‘package:utils’: tar > data(deere2) > deere2 Time Series: Start = 1 End = 102 Frequency = 1 [1] -18 -24 -17 -27 -37 -34 -8 14 18 7 4 17 10 13 -1 3 -4 -3 [19] -3 -5 -8 0 -9 -4 -3 4 7 14 9 -2 0 2 7 5 -18 8 [37] 3 1 -10 4 5 11 3 11 5 6 6 -8 -8 -9 -7 0 -6 15 [55] 10 15 -14 -3 -5 -13 -14 -3 0 7 10 4 -5 5 6 15 6 -5 [73] -3 -8 -9 -16 -10 -10 -6 -4 -6 -7 0 -5 2 5 6 2 8 17 [91] 11 21 9 11 9 9 7 4 14 12 12 10 > plot(deere2)
b. Pembuktian data “deere2” stasioner > adf.test(deere2)
Augmented Dickey-Fuller Test data: deere2
Dickey-Fuller = -4.9934, Lag order = 4, p-value = 0.01 alternative hypothesis: stationary
Warning message:
b. Grafik ACF dan PACF “deere2”.
> acf(deere2) > pacf(deere2)
c. Pengujian Model AR(1).
> ar1=arima(deere2, order=c(1,0,0), include.mean=FALSE) > ar1
Call:
arima(x = deere2, order = c(1, 0, 0), include.mean = FALSE) Coefficients:
ar1 0.6806 s.e. 0.0733
sigma^2 estimated as 63.76: log likelihood = -356.95, aic = 715.9 d. Analisis residu > tsdiag(ar1) > r=resid(ar1) > r Time Series: Start = 1 End = 102 Frequency = 1 [1] -13.18804279 -11.74946828 -0.66595771 -15.43005338 -18.62420242 [6] -8.81835147 15.13989325 19.44468076 8.47180866 -5.25053172 [11] -0.76409567 14.27765962 -1.56994662 6.19414905 -9.84760624 [16] 3.68058510 -6.04175529 -0.27765962 -0.95824471 -2.95824471 [21] -4.59707452 5.44468076 -9.00000000 2.12526586 -0.27765962 [26] 6.04175529 4.27765962 9.23590433 -0.52819134 -8.12526586 [31] 1.36117019 2.00000000 5.63882981 0.23590433 -21.40292548 [36] 20.25053172 -2.44468076 -1.04175529 -10.68058510 10.80585095 [41] 2.27765962 7.59707452 -4.48643605 8.95824471 -2.48643605 [46] 2.59707452 1.91648943 -12.08351057 -2.55531924 -3.55531924 [51] -0.87473414 4.76409567 -6.00000000 19.08351057 -0.20877643 [56] 8.19414905 -24.20877643 6.52819134 -2.95824471 -9.59707452 [61] -5.15239376 6.52819134 2.04175529 7.00000000 5.23590433 [66] -2.80585095 -7.72234038 8.40292548 2.59707452 10.91648943 [71] -4.20877643 -9.08351057 0.40292548 -5.95824471 -3.55531924 [76] -9.87473414 0.88936153 -3.19414905 0.80585095 0.08351057 [81] -3.27765962 -2.91648943 4.76409567 -5.00000000 5.40292548 [86] 3.63882981 2.59707452 -2.08351057 6.63882981 11.55531924 [91] -0.56994662 13.51356395 -5.29228700 4.87473414 1.51356395 [96] 2.87473414 0.87473414 -0.76409567 11.27765962 2.47180866 [101] 3.83297885 1.83297885 > qqnorm(r)
> ks.test(r, "pnorm", mean(r), sd(r))
One-sample Kolmogorov-Smirnov test data: r
D = 0.063174, p-value = 0.8103 alternative hypothesis: two-sided Warning message:
In ks.test(r, "pnorm", mean(r), sd(r)) :
ties should not be present for the Kolmogorov-Smirnov test
e. Prediksi 10 inci berikutnya > has = predict(ar1, n.ahead=10) > has $pred Time Series: Start = 103 End = 112 Frequency = 1 [1] 6.8058510 4.6319607 3.1524434 2.1455060 1.4601994 0.9937900 0.6763586 [8] 0.4603196 0.3132867 0.2132182 $se Time Series: Start = 103 End = 112 Frequency = 1 [1] 7.984847 9.658682 10.342601 10.644510 10.781488 10.844349 10.873343 [8] 10.886747 10.892950 10.895822 > BB= has$pred-1.96*has$se > BA= has$pred+1.96*has$se > bb=min(deere2, BB)-1 > ba=max(deere2, BA)+1 > par(mfrow=c(1,1)) > plot(1:112,c(deere2,has$pred),type="b",ylim=c(bb,ba)) > lines(103:112, BA, lty=3)