Metode Peramalan
Autoregressive Integrated Moving Average
(ARIMA) terhadap Data Simulasi dan Data Penjualan Produk PT.
XXX (Januari 2010 – Juni 2014)
Dessy Ariani (1207015029), Muhammad Septyadhi (1207015019) dan Pratama Yuly N. (1207015003) Jurusan Statistika Fakultas MIPA
Universitas Mulawarman Samarinda
ABSTRAK
Paper ini membahas penggunaan metode peramalan Autoregressive Integrated Moving Average (ARIMA) terhadap nilai peramalan untuk dua data, yakni Data Simulasi dan Data Penjualan Produk PT. XXX periode Januari 2010 – Juni 2014. Metode ini digunakan untuk mencari model yang terbaik dalam menentukan nilai peramalan. Berdasarkan hasil yang diperoleh analisis baik secara global maupun lokal diperoleh bahwa model terbaik bagi Data Simulasi adalah ARIMA (1,2,1) dan model terbaik bagi Data Penjualan Produk PT. XXX adalah ARIMA (0,2,1)
Kata Kunci:
1. Pendahuluan
2. Kajian Teori
2.1 Regresi Parametrik
3. Metodologi
3.1 Sumber Data
Data yang dianalisis adalah data penjualan produk PT. XXX periode Januari 2010 – Juni 2014 dan data kedua adalah data simulasi. Kali ini kita akan meramalkan nilai hasil penjualan selama 5 bulan kedepan dan juga meramalkan nilai simulasi selama 5 periode tertentu kedepan.
3.2 Tahap Analisis
Tahapan analisis yang dilakukan adalah 1. Mengecek kestasioneran data
Dalam variansi
Dalam hal ini digunakan uji Box-Cox untuk mengecek apakah data sudah stasioner dalam variansi atau belum.
Dalam rata-rata
2. Mencari nilai ACF dan PACF guna memodelkan peramalan menggunakan metode ARIMA
3. Mencari model terbaik dari beberapa model sementara yang didapat dengan asumsi yang harus memenuhi
Setiap parameter model harus signifikan
Uji White Noise atau uji kecocokan model
Residual data berdistribusi normal
4. Hasil dan Pembahasan
Analisis dilakukan untuk tujuan explanation dan prediksi menggunakan data penjualan produk PT. XXX, selain itu juga akan dilakukan analisis data simulasi.
4.1 Explanation
4.1.1 Data Penjualan Produk PT. XXX 4.1.1.1 Uji Kestasioneran Data
Berikut adalah time series plot pada data penjualan produk PT. XXX periode Januari 2010 – Juni 2014
50
Time Series Plot of Data
5.0
Lower CL Upper CL
Limit
Estimate 0.53 Lower CL -0.53 Upper CL 1.52 Rounded Value 0.50 (using 95.0% confidence)
Lambda
Box-Cox Plot of Data
Gambar 1. Time Series Plot data Penjualan dan Plot Box-Cox
Dari gambar plot diatas dapat dilihat bahwa data belum stasioner dalam variansi maupun rata-rata. Maka dari itu dilakukan transformasi sebanyak 1 kali dengan memangkatkan data dengan nilai estimate yaitu 0,53 dan differencing 2 kali sehingga
time series plot menjadi
50
Time Series Plot of Diff_ 2
Gambar 2. Time Series Plot setelah transformasi dan differencing
Karena data sudah stasioner dalam variansi dan rata-rata maka dilanjutkan untuk mencari nilai ACF dan PACF
13
Autocorrelation Function for Diff_ 2
(with 5% significance limits for the autocorrelations)
13
Partial Autocorrelation Function for Diff_ 2
(with 5% significance limits for the partial autocorrelations)
Gambar 3. ACF dan PACF data Penjualan
Dari gambar diatas diketahui bahwa ACF cut off di lag 1 dan PACF cut off di lag 5. Nilai ACF menunjukkan parameter untuk Moving Average (MA) dan PACF merupakan parameter untuk Autoregressive (AR). Sedangkan Integrated menunjukkan berapa kali data di differencing. Karena data di differencing 2 kali, maka model peramalan sementara untuk data penjualan adalah ARIMA (5,2,1). Sehingga kombinasi model ARIMA adalah sebagai berikut
ARIMA (0,2,1) ARIMA (2,2,1) ARIMA (4,2,1) ARIMA (1,2,0) ARIMA (3,2,0) ARIMA (5,2,0) ARIMA (1,2,1) ARIMA (3,2,1) ARIMA (5,2,1) ARIMA (2,2,0) ARIMA (4,2,0)
4.1.1.3 Mencari Model Terbaik
Semua model sementara diatas diuji kesesuaian modelnya, apakah model ARIMA tersebut layak digunakan dalam peramalan apa tidak. Asumsi yang harus dipenuhi adalah Setiap parameter model harus signifikan, uji White Noise atau uji kecocokan model, dan residual data harus berdistribusi normal. Dari semua model tersebut, yang memenuhi semua kriteria asumsi diatas adalah model peramalan ARIMA (0,2,1). Berikut adalah hasil dari analisis yang dilakukan
ARIMA (0,2,1)
Uji Parsial (Signifikansi Parameter)
ARIMA Model Parameter P-value Kesimpulan
(0,2,1) MA(1) θ=0,9670 0,000 Signifikan
(1,2,0) AR(1) ϕ=−0,4647 0,000 Signifikan
MA(1) ϕ=−0,5049
θ=−0,5252
0,202 Tidak Signifikan
(4,2,0) AR(1)
Gambar 4. Tabel Uji Parsial
Dari tabel diatas diketahui model ARIMA yang signifikan adalah ARIMA (0,2,1), ARIMA (1,2,0) dan ARIMA (2,2,0) sehingga hanya ketiga model tersebut yang dilakukan pengujian White Noise
Uji White Noise (Kecocokan Model)
ARIMA Lag P-value Kesimpulan
(0,2,1) 12
Gambar 5. Tabel Uji White Noise
Dari ketiga model tersebut, yang signifikan hanyalah model ARIMA (0,2,1) dan selanjutnya dilakukan uji kenormalan residual pada model tersebut.
40 30 20 10 0 -10 -20 -30
99
95 90 80 70 60 50 40 30 20 10 5
1
RESI1
P
e
rc
e
n
t
Mean 1.088 StDev 10.68 N 52 KS 0.109 P-Value 0.122
Probability Plot of RESI1
Normal
Gambar 6. Plot Residual
Dari plot diatas diketahui nilai p-value adalah 0,122 > α = 0,05 maka residual berdistribusi normal
Hipotesis
Uji Parsial (Signifikansi Parameter)
Hipotesis untuk MA (1) H0 : θ1=0
(Nilai parameter model MA (1) tidak signifikan berbeda dengan nol) H1 : θ1≠0
(Nilai parameter model MA (1) signifikan berbeda dengan nol) Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Keputusan dan Kesimpulan
Karena nilai p-value = 0,000 < α=0,05 maka diputuskan H0 ditolak pada taraf
kepercayaan 95%. Maka dapat disimpulkan bahwa nilai parameter model MA (1) signifikan berbeda dengan nol
Uji Kecocokan Model (White Noise)
Hipotesis
H0 : ρ1=ρ2=…=ρk=0
(Residual memenuhi syarat White Noise)
H1 : ∃ρi≠0;i=1,2,… , k
(Residual tidak memenuhi syarat White Noise) Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Karena nilai p-value pada lag 12, 24, 36 dan 48 berturut-turut adalah 0,077 ; 0,333 ; 0,333 ; 0,100 > α=0,05 maka diputuskan H0 gagal ditolak pada taraf
kepercayaan 95%. Maka dapat disimpulkan bahwa residual memenuhi syarat White Noise
Uji Kenormalan Residual
Hipotesis
H0 : Residual data berdistribusi normal
H1 : Residual data tidak berdistribusi normal
Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Keputusan dan Kesimpulan
Karena nilai p-value = 0,122 > α=0,05 maka diputuskan H0 gagal ditolak pada
taraf kepercayaan 95%. Maka dapat disimpulkan bahwa residual data berdistribusi normal
Penurunan Model
Model ARIMA secara umum
ϕp(B) (1−B)dZt=θq(B)at
ARIMA (0,2,1) dengan transformasi satu kali
ϕ0(B) (1−B)2Zt¿
=θ1(B)at¿
(1−B)2Zt
¿
=θ1(B)at
¿
(
1−2B+B2)
Zt
¿
=[1−θ1(B)]at¿
Zt¿−2Zt¿(B)+Zt¿
(
B2)
=at¿−θ1at¿(B)Zt
¿
−2Zt−1
¿
+Zt−2
¿
=at
¿
−θ1at−1
¿
Zt¿
=2Zt¿−1
−Zt¿−2
−θ1at¿−1
+at¿
Zt¿
=2Zt¿−1
−Zt¿−2
−0,9760at¿−1
+at¿
4.1.1.4 Hasil Peramalan
perlu dikembalikan ke data awal dimana data berada disekitar data awal atau data asli. Cara mengembalikan data peramalan transformasi ke data peramalan data asli adalah dengan cara data transformasi dipangkatkan satu berbanding nilai lambda atau nilai
estimate pada plot box-cox. Hasil peramalan atau forecast dari data penjualan selama 5
bulan kedepan adalah sebagai berikut:
Bulan Forecas
Gambar 7. Tabel Hasil Forecast Data Penjualan
4.1.2 Data Simulasi
4.1.2.1 Uji Kestasioneran Data
Berikut adalah time series plot pada data simulasi
44
Time Series Plot of Data
5.0
Lower CL Upper CL
Limit
Estimate -0.85 Lower CL -2.04 Upper CL 0.14 Rounded Value -1.00 (using 95.0% confidence)
Lambda
Box-Cox Plot of Data
Gambar 8. Time Series Plot data Simulasi dan Plot Box-Cox
Dari gambar plot diatas dapat dilihat bahwa data belum stasioner dalam variansi maupun rata-rata. Maka dari itu dilakukan transformasi sebanyak 1 kali dengan memangkatkan data dengan nilai estimate yaitu 0,53 dan differencing 2 kali sehingga
time series plot menjadi
50
Time Series Plot of Diff_ 2
Karena data sudah stasioner dalam variansi dan rata-rata maka dilanjutkan untuk mencari nilai ACF dan PACF
4.1.1.2 Mencari Nilai ACF dan PACF
11
Autocorrelation Function for Diff_ 2
(with 5% significance limits for the autocorrelations)
11
Partial Autocorrelation Function for Diff_ 2
(with 5% significance limits for the partial autocorrelations)
Gambar 10. ACF dan PACF data Simulasi
Dari gambar diatas diketahui bahwa ACF cut off di lag 1 dan PACF cut off di lag 5. Nilai ACF menunjukkan parameter untuk Moving Average (MA) dan PACF merupakan parameter untuk Autoregressive (AR). Sedangkan Integrated menunjukkan berapa kali data di differencing. Karena data di differencing 2 kali, maka model peramalan sementara untuk data penjualan adalah ARIMA (5,2,1). Sehingga kombinasi model ARIMA adalah sebagai berikut
ARIMA (0,2,1) ARIMA (2,2,1) ARIMA (4,2,1) ARIMA (1,2,0) ARIMA (3,2,0) ARIMA (5,2,0) ARIMA (1,2,1) ARIMA (3,2,1) ARIMA (5,2,1) ARIMA (2,2,0) ARIMA (4,2,0)
4.1.1.3 Mencari Model Terbaik
Semua model sementara diatas diuji kesesuaian modelnya, apakah model ARIMA tersebut layak digunakan dalam peramalan apa tidak. Asumsi yang harus dipenuhi adalah Setiap parameter model harus signifikan, uji White Noise atau uji kecocokan model, dan residual data harus berdistribusi normal. Dari semua model tersebut, yang memenuhi semua kriteria asumsi diatas adalah model peramalan ARIMA (0,2,1), ARIMA (1,2,1), ARIMA (2,2,0), ARIMA (3,2,0) dan ARIMA (5,20). Karena terdapat lebih dari satu model sementara yang memenuhi asumsi, maka dilihat nilai SSE yang paling kecil. Dari kelima model sementara tersebut, nilai SSE terkecil ada pada model ARIMA (1,2,1), maka ARIMA (1,2,1) merupakan model terbaik yang kita dapat. Berikut adalah hasil dari analisis yang dilakukan
Uji Parsial (Signifikansi Parameter)
ARIMA Model Parameter P-value Kesimpulan
(0,2,1) MA(1) θ=0,9921 0,000 Signifikan
(1,2,0) AR(1) ϕ=−0,6672 0,000 Signifikan
(2,2,1) AR(1)
Gambar 11. Tabel Uji Parsial
Dari tabel diatas diketahui model ARIMA yang signifikan adalah ARIMA (0,2,1), ARIMA (1,2,0), ARIMA (1,2,1), ARIMA (2,2,0), ARIMA (3,2,0), dan ARIMA (5,2,0) sehingga hanya keenam model tersebut yang dilakukan pengujian White Noise.
Uji White Noise (Kecocokan Model)
ARIMA Lag P-value Kesimpulan
(5,2,0) 12 24 36
0,633 0,636 0,278
Signifikan Signifikan Signifikan
Gambar 12. Tabel Uji White Noise
Dari keenam model tersebut yang signifikan adalah model ARIMA (0,2,1), ARIMA (1,2,1), ARIMA (2,2,0), ARIMA (3,2,0) dan ARIMA (5,2,0). Maka pada kelima model tersebut dilakukan pengujian kenormalan residual.
Uji Kenormalan Residual
ARIMA P-value Kesimpulan
(0,2,1) 0,150 Berdistribusi normal
(1,2,1) 0,150 Berdistribusi normal
(2,2,0) 0,150 Berdistribusi normal
(3,2,0) 0,150 Berdistribusi normal
(5,2,0) 0,150 Berdistribusi normal
Gambar 13. Tabel Uji Kenormalan Residual
Karena kelima model ARIMA tersebut berdistribusi normal, maka untuk menentukan model terbaiknya lihat SSE yang paling kecil. Berikut adalah SSE kelima model ARIMA tersebut:
ARIMA (0,2,1) = 0,719515 ARIMA (1,2,1) = 0,632027 ARIMA (2,2,0) = 0,954601 ARIMA (3,2,0) = 0,814106 ARIMA (5,2,0) = 0,665066
Nilai SSE terkecil terdapat pada model ARIMA (1,2,1) dengan nilai 0,632027 jadi model terbaik untuk peramalan data simulasi adalah ARIMA (1,2,1)
0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3
99
95 90 80 70 60 50 40 30 20 10 5
1
RESI3
P
e
rc
e
n
t
Mean 0.01265 StDev 0.1220 N 43 KS 0.098 P-Value >0.150
Probability Plot of RESI3 Normal
Gambar 14. Plot Residual
Hipotesis
Uji Parsial (Signifikansi Parameter)
H0 : ϕ1=0
(Nilai parameter model AR (1) tidak signifikan berbeda dengan nol) H1 : ϕ1≠0
(Nilai parameter model AR (1) signifikan berbeda dengan nol) Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Keputusan dan Kesimpulan
Karena nilai p-value = 0,024 < α=0,05 maka diputuskan H0 ditolak pada taraf
kepercayaan 95%. Maka dapat disimpulkan bahwa nilai parameter model AR (1) signifikan berbeda dengan nol
Hipotesis untuk MA (1) H0 : θ1=0
(Nilai parameter model MA (1) tidak signifikan berbeda dengan nol) H1 : θ1≠0
(Nilai parameter model MA (1) signifikan berbeda dengan nol) Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Keputusan dan Kesimpulan
Karena nilai p-value = 0,000 < α=0,05 maka diputuskan H0 ditolak pada taraf
kepercayaan 95%. Maka dapat disimpulkan bahwa nilai parameter model MA (1) signifikan berbeda dengan nol
Uji Kecocokan Model (White Noise)
Hipotesis
H0 : ρ1=ρ2=…=ρk=0
(Residual memenuhi syarat White Noise)
H1 : ∃ρi≠0;i=1,2,… , k
(Residual tidak memenuhi syarat White Noise) Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Karena nilai p-value pada lag 12, 24, dan 36 berturut-turut adalah 0,632 ; 0,859 ; 0,409 > α=0,05 maka diputuskan H0 gagal ditolak pada taraf kepercayaan 95%.
Maka dapat disimpulkan bahwa residual memenuhi syarat White Noise
Uji Kenormalan Residual
Hipotesis
H0 : Residual data berdistribusi normal
H1 : Residual data tidak berdistribusi normal
Taraf Signifikansi
α=5
Daerah Kritis
Menolak H0 jika p-value < α
Keputusan dan Kesimpulan
Karena nilai p-value = 0,150 > α=0,05 maka diputuskan H0 gagal ditolak pada
taraf kepercayaan 95%. Maka dapat disimpulkan bahwa residual data berdistribusi normal
Penurunan Model
Model ARIMA secara umum
ϕp(B) (1−B)dZt=θq(B)at
ARIMA (1,2,1) dengan transformasi satu kali
ϕ1(B) (1−B)2Zt¿
=θ1(B)at¿
[1−ϕ1(B)]
(
1−2B+B2)
Zt¿=[1−θ1(B)]at¿Zt
¿−ϕ
1Zt
¿(
B)−2Zt
¿(
B)+2ϕ1Zt
¿
(
B2
)
+Zt¿
(
B2
)
−ϕ1Zt¿
(
B3
)
=at¿
−θ1at
¿
(B)
Zt¿−
(
ϕ1+2)
Zt¿(B)+(
2ϕ1+1)
Zt¿(
B2)
−ϕ1Zt¿(
B3)
=at¿−θ1at¿(B)Zt¿
−
(
ϕ1+2)
Zt−1¿
+
(
2ϕ1+1)
Zt−2¿ −ϕ
1Zt−3
¿
=at¿
−θ1at¿−1 Zt¿
=
(
ϕ1+2)
Zt−1¿
−
(
2ϕ1+1)
Zt−2¿
+ϕ1Zt−3
¿
−θ1at¿−1 +at¿
Zt¿
=(−0,3474+2)Zt¿−1
−
(
2(−0,3474)+1)
Zt¿−2+(−0,3473)Zt¿−3
−0,9875at¿−1
+at¿
Zt¿
=1,6526Zt¿−1
−0,3052Zt¿−2
−0,3474Zt¿−3
−0,9875at¿−1
+at¿
4.1.1.5 Hasil Peramalan
estimate pada plot box-cox. Hasil peramalan atau forecast dari data penjualan selama 5 periode waktu kedepan adalah sebagai berikut:
t Forecast
46 1.98026 47 2.0233 48 2.06385 49 2.10755 50 2.1525
Gambar 15. Tabel Hasil Forecast Data Simulasi
5. Kesimpulan
Dari hasil analisis yang telah dilakukan dalam hal explanation dapat disimpulkan:
Model peramalan ARIMA yang terbaik untuk data penjualan PT. XXX adalah ARIMA (0,2,1)
Model peramalan ARIMA yang terbaik untuk data simulasi adalah ARIMA (1,21)