C. Metode Box-Jenkins (ARIMA)
3.2 Metode Pengolahan dan Analisis Data
Pengolahan data dilakukan menggunakan software Minitab version 14
untuk meramalkan data produksi dan konsumsi gula nasional. Model peramalan
yang digunakan adalah ARIMA. Dari model tersebut didapat hasil peramalan
produksi dan konsumsi gula nasional hingga tahun 2014. Selain itu digunakan
pula software Eviews version 6 dalam melakukan analisis regresi untuk
mendapatkan persamaan regresi yang tepat sehingga mampu menjelaskan dampak
fluktuasi produksi dan konsumsi gula nasional terhadap pencapaian swasembada
gula nasional tahun 2014.
3.2.1 Metode Box-Jenkins (ARIMA)
Metode peramalan Box-Jenkins adalah suatu metode yang sangat tepat
lainnya (Assauri, 1984). Kerumitan itu terjadi karena terdapat variasi pada pola
data yang ada. Dalam metode Box-Jenkins tidak dibutuhkan adanya asumsi
tentang suatu pola yang tetap, yang menjadikan metode ini berbeda dengan
metode-metode lainnya..
Model Box-Jenkins atau ARIMA memfokuskan pada prinsip-prinsip
regresi dan metode pemulusan (smoothing). Model ARIMA merupakan gabungan
dari model Autoregressive (AR) dan Moving Average (MA). ARIMA sangat
bermanfaat dalam peramalan jangka pendek.
Syarat penting agar suatu data dapat dimodelkan pada metode deret waktu
ARIMA adalah kestasioneran data. Kestasioneran diperlukan untuk
mempermudah dalam identifikasi dan penarikan kesimpulan. Data deret waktu
dikatakan stasioner jika data menunjukkan pola yang konstan dari waktu ke
waktu. Data yang tidak stasioner pada nilai tengah dapat diatasi dengan
melakukan pembedaan atau diferensiasi derajat (d) pertama atau kedua. Sesuai
dengan diferensiasi derajat berapa data tersebut mencapai kestasioneran.
Sedangkan data yang tidak stasioner pada varian diatasi dengan melakukan
transformasi.
Pendekatan Box-Jenkins ini memberikan informasi secara eksplisit untuk
memungkinkan memikirkan atau memutuskan apakah pola yang diasumsikan
tersebut adalah tepat atau benar untuk keadaan atau situasi yang telah terjadi.
Proses yang dilakukan berulang memungkinkan kita untuk sampai pada suatu
model peramalan yang memberikan keoptimisan dalam ukuran pola dasar dan
Dalam peramalannya, ARIMA menggunakan informasi dari variabelnya
sendiri karena tidak mengikutsertakan variabel bebas dalam pembentukan
modelnya. Peramalan model Autoregressive (AR) didasarkan pada fungsi dari
nilai pengamatan masa lalu dalam jumlah terbatas. Sedangkan peramalan model
rata-rata bergerak (MA) berdasarkan kombinasi linear galat masa lalu dalam
jumlah terbatas pula.
Gabungan dari Autoregressive (p) dan Moving Average (q) akan
membentuk model ARIMA (p,d,q) dimana p adalah ordo dari AR, d merupakan
ordo dari integrasi dan q adalah ordo dari MA. Bentuk dasar dari model ARIMA
adalah (Hanke, 2005):
Model Autoregressive (AR):
(3.1)
Model Moving Average (MA):
(3.2)
Model ARMA (p, q) :
(3.3)
Dimana:
: variabel dependen pada waktu ke-t
, , ... , : variabel time lag
, , ,...., : koefisien yang diestimasi : error term pada periode ke-t
: konstanta
, ,..., : koefisien yang diestimasi
Model ARIMA dibentuk melalui rangkaian tahapan sebagai berikut:
1. Identifikasi model
Dilakukan dengan menentukan kestasioneran data. Deret waktu
nonstasioner terindikasi apabila deret muncul dengan pertumbuhan atau
penurunan sepanjang waktu dan autokorelasi sampel tidak dapat menghilang
dengan cepat. Deret nonstasioner dapat diubah menjadi deret stasioner melalui
proses differencing yaitu dengan mengganti deret asli menjadi deret selisih.
Kestasioneran data dapat dilihat dari uji Augmented Dicky Fuller (ADF) melalui
pengamatan pola ACF dan PACF.
Tabel 3.1 Pola ACF dan PACF pada Model ARIMA
Model ACF PACF
MA (q) Terpotong (cut off) setelah lag q (q=1 atau q=2)
Perlahan-lahan
menghilang (dies down) AR (p) Perlahan-lahan menghilang (dies
down)
Terpotong (cut off) setelh lag q (q=1 atau 2) ARMA (p,q) Perlahan-lahan menghilang (dies
down)
Perlahan-lahan
menghilang (dies down) Sumber: Hanke (2005)
Apabila data yang menjadi input model tidak stasioner, perlu dilakukan
modifikasi untuk menghasilkan data yang stasioner. Salah satu metode yang
digunakan adalah metode differencing. Second order difference dilakukan apabila
pada first order difference data belum juga stasioner (Firdaus, 2006).
First order difference : (3.4) Second order difference :
2. Estimasi Parameter Model
Setelah melalui proses identifikasi model melalui uji ADF, dilakukan
estimasi parameter model dengan menentukan terlebih dahulu ordo maksimum
dari AR dan MA dengan melihat ACF untuk ordo MA (q) dan PACF untuk ordo
AR (p). Ordo dari integrasi (d) juga harus ditentukan. Ada dua cara mendasar
yang dapat digunakan untuk melakukan estimasi terhadap parameter-parameter
tersebut, yaitu:
a. Dengan cara mencoba-coba (trial and error)
Melakukan pengujian terhadap beberapa nilai yang berbeda dan
memilih diantaranya yang memiliki jumlah kuadrat nilai sisa (galat)
yang minimum (sum of squared residuals).
b. Perbaikan secara iteratif (pengulangan)
Cara ini dilakukan dengan memilih nilai taksiran awal dan membiarkan
program komputer untuk memperhalus penaksiran dengan cara iteratif
(berulang). Metode ini lebih banyak dilakukan dan telah tersedia
algoritma (proses komputer) yang kuat dan dapat digunakan.
3. Pengujian Parameter Model
Sebelum menggunakan model untuk peramalan, model hendaknya
diperiksa terlebih dahulu kecukupannya. Pengujian dilakukan dengan
menggunakan model-model yang telah diestimasi pada tahap sebelumnya, sesuai
dengan kombinasi model ARIMA.
Pengujian parameter model terdiri dari:
b. Pengujian model secara keseluruhan
4. Pemilihan model terbaik
Model harus memenuhi beberapa kriteria untuk dapat menjadi model yang
terbaik, yaitu (Firdaus, 2006):
a) Residual bersifat acak dan tersebar normal
Model yang sesuai dengan data dapat diindikasikan oleh error yang
bersifat acak yang ditunjukkan dengan ACF dan PACF dari residual
secara statistik harus sama dengan nol. Untuk menguji autokorelasi
residual dapat menggunakan uji statistik Ljung Box (Q).
Hipotesis: H0: 1 = 2 = ... = m = 0 H1: 12...m 0 Statistik uji: Q = (3.6) Dimana: n = jumlah observasi k = selang waktu
m = jumlah selang waktu diuji
rk = fungsi autokorelasi sampel dari residual berselang k
kesimpulan:
bila Q>2α(m-p-q) (disimpulkan tolak H0). Atau apabila nilai p (p-value) terkait dengan statistik Q kecil (misalkan : P < 0,05), maka tolak H0
b) Berlaku prinsip parsimonious
Model yang dipilih merupakan model yang paling sederhana, yang
memiliki jumlah parameter terkecil.
c) Semua parameter estimasi harus berbeda nyata dari nol
Dengan menggunakan t-ratio.
Hipotesis:
H0 : tidak terdapat autokorelasi pada deret waktu (H0 : k = 0) H1 : terdapat autokorelasi yang nyata pada selang ke-k (H1: 1 0) Statistik uji:
t =
, atau sama dengan t = (3.7)
dimana:
k= lag atau selang
n= jumlah observasi
kriteria uji:
Statistik H0 menyebar dengan derajat bebas (n-1). Untuk α tertentu dari tabel Tα/2 (n-1) atau pada tingkat signifikan 0,05. Berdasarkan
pengalaman dapat menggunakan t-table = 2 sebagai nilai kritis untuk
menguji k Kesimpulan:
Bila t hitung > Tα/2 (n-1) (disimpulkan tolak H0) atau jika nilai absolut
d) Harus memenuhi kondisi invertibilitas dan stasioneritas
Zt adalah fungsi linier dari data stasioner yang lampau (Zt-1, Zt-2, ....).
dengan mengaplikasikan analisis regresi pada nilai lag deret stasioner,
maka dapat diperoleh autoregresi karena komponen trend sudah
dihilangkan. Data stasioner Zt saat ini adalah fungsi linear dari galat
masa kini dan masa lampau.
(3.8)
Jumlah koefisien MA harus kurang dari 1
Θ1+ Θ2+...+ Θq < 1 (kondisi invertibiliti) (3.9) Zt= + Θ1 Zt-1–Θ2 Zt-2+..+ t (3.10) Jumlah koefisien AR harus selalu kurang dari 1
1 + 2 +....+ p < 1 (kondisi stasioner) (3.11) e) Proses iterasi harus konvergen
Prosesnya harus terhenti ketika telah menghasilkan nilai parameter
dengan SSE terkecil. Jika telah memenuhi syarat tersebut maka pada
session akan terdapat pernyataan relative change in each estimate less
than 0,0010.
f) Nilai MSE model harus kecil
MSE = (3.12)
Semakin kecil nilai MSE, menunjukkan model secara keseluruhan
lebih baik.
Suatu model dikatakan baik apabila model tersebut memenuhi kriteria-
mampu menggambarkan hubungan antar variabelnya baik variabel dependen
dengan variabel independen maupun hubungan antar variabel independen.
5. Peramalan
Proses peramalan dilakukan dengan menggunakan model terbaik yang
memenuhi kriteria pada poin 4 untuk menjadi model terbaik. Peramalan dilakukan
untuk mengetahui nilai pada masa yang akan datang sehingga membantu memberi
gambaran keadaan pada masa yang akan datang yang berguna dalam
merencanakan suatu kebijakan atau perencanaan.
3.2.2 Metode Regresi Berganda
Metode ini merupakan suatu teknik dengan menggunakan analisis
hubungan antara variabel yang dicari atau yang diramalakan dengan satu atau
lebih variabel bebas yang memengaruhinya. Metode regresi berganda dapat
melihat faktor-faktor apa saja yang memiliki pengaruh nyata dan tidak nyata pada
produksi dan konsumsi gula. Metode ini digunakan untuk menganalisis
pencapaian swasembada gula.
Dalam metode regresi berganda, yang digunakan sebagai variabel
dependen adalah produksi dan variabel independennya adalah luas areal,
produktivitas dan rendemen. Pencapaian swasembada gula dapat diketahui dengan
memasukkan hasil dari ramalan konsumsi gula sebagai pengganti nilai produksi
pada persamaan regresi. Hal tersebut dilakukan dengan tujuan minimal
mencukupi 90 persen dari kebutuhan gula baik gula konsumsi langsung (GKP)
maupun gula rafinasi (GKR).
Ramalan didasarkan pada penggunaan analisis hubungan sebab akibat
yang bersifat konstan antara variabel yang akan diramal dengan satu atau
beberapa variabel lain yang memengaruhinya. Metode regresi bertujuan untuk
menemukan bentuk hubungan tersebut dan menggunakannya untuk meramalkan
nilai mendatang dari variabel tak bebas.
Persamaan umum untuk metode regresi linear berganda produksi gula
adalah:
(3.13) Dimana:
Y : Produksi Gula (ton)
: Intersep
X1 : Luas Areal (ha)
X2 : Produktivitas (ton/ha)
X3 : Rendemen (%)
1, 2, 3 : koefisien variabel bebas
Model yang baik merupakan model yang memenuhi asumsi klasik yaitu
tidak ada multikolinearitas, homoskedastisitas, tidak ada autokorelasi dan error
term menyebar normal. Pengujian untuk memastikan model tersebut memenuhi
1. Uji Multikolinearitas
Menurut Gujarati (2003) masalah multikolinearitas dapat terlihat dari
correlation matrix dengan uji akar unit sesama variabel bebas dimana batas tidak
terjadi korelasi sesama variabel yaitu tidak lebih dari . Melalui correlation matrix ini dapat pula digunakan uji Klein dalam mendeteksi multikolinearitas.
Apabila terdapat nilai korelasi yang lebih dari , maka menurut uji Klein multikolinearitas dapat diabaikan selama nilai korelasi tersebut tidak melebihi
nilai R-squared (adj) atau R-squared-nya. Multikolinearitas juga dapat dideteksi
dengan melihat nilai VIF (variance inflation factor) antar variabel bebasnya.
2. Uji Heteroskedastisitas
Pengujian heteroskedastisitas salah satunya dapat dilakukan dengan
menggunakan White Heteroscedasticity Test. Penentuannya dilakukan dengan
cara melihat probabilitas Obs*R-squared-nya.
Hipotesis:
H0: =0 H1: 0 Kriteria uji:
Probability Obs*R-squared< taraf nyata (α), maka terima H0 Probability Obs*R-squared> taraf nyata (α), maka tolak H0
Jika hasil menunjukkan tolak H0 maka persamaan tersebut tidak mengalami gejala
heteroskedastisitas. Sedangkan jika hasil menunjukkan terima H0 maka persamaan
3. Uji Autokorelasi
Masalah autokorelasi dapat diidentifikasi dengan menggunakan Breusch-
Godfrey Serial Correlation Test. Autokorelasi menyebabkan regresi semu yang
dapat mengakibatkan kesalahan dalam interpretasi hasil regresi.
Hipotesis:
H0: 0 H1: 0 Kriteria uji:
Probability Obs*R-squared < taraf nyata (α), maka terima H0 Probability Obs*R-squared> taraf nyata (α), maka tolak H0
Apabila nilai probabilitas Obs*R-squared-nya lebih besar dari taraf nyata
tertentu (tolak H0), maka persamaan tersebut tidak mengalami autokorelasi. Bila
nilai Obs*R-squared-nya lebih kecil dari taraf nyata tertentu (terima H0) maka
persamaan tersebut mengalami autokorelasi.
4. Uji Normalitas
Uji normalitas digunakan untuk melihat distribusi dari error term.
Hipotesis:
H0: error term terdistribusi normal
H1: error term tidak terdistribusi normal
Kriteria uji:
Probability (P-value)< taraf nyata (α) maka tolak H0. Probability (P-value)> taraf nyata (α) maka terima H0.
Jika terima H0 maka persamaan tersebut memiliki error term yang terdistribusi
normal, sedangkan jika tolak H0 maka persamaan tersebut memiliki error term
yang tidak terdistribusi normal.
Untuk mengetahui bagaimana pencapaian swasembada gula dilakukan
analisis kombinasi skenario kebijakan yang dapat diterapkan guna membantu
pencapaian swasembada gula nasional. Terdapat dua skenario yang akan dibahas
yaitu: (1) tanpa penambahan pabrik gula, dan (2) dengan penambahan pabrik gula.
Dari kedua skenario tersebut, akan dianalisis hasil peramalan terhadap upaya
pencapaian swasembada gula nasional dengan melihat kemungkinan luas areal,
produkktivita tebu, rendemen dan penambahan pabrik gula yang dapat dilakukan
guna mencapai tingkat produksi dan konsumsi yang tepat.
Dalam menyatakan keakuratan hasil ramalan pencapaian swasembada gula
digunakan dua kriteria yaitu nilai koefisisen determinasi (R-squared) dan nilai
MSE terkecil. Koefisien determinasi adalah proporsi ragam pada variabel
dependen yang dapat diterangkan oleh variabel independen. Semakin besar nilai
R-squared berarti model semakin akurat dalam meramalkan dan semakin baik