Metode Pengolahan dan Analisis Data - Metode Box-Jenkins (ARIMA)

C. Metode Box-Jenkins (ARIMA)

3.2 Metode Pengolahan dan Analisis Data

Pengolahan data dilakukan menggunakan software Minitab version 14

untuk meramalkan data produksi dan konsumsi gula nasional. Model peramalan

yang digunakan adalah ARIMA. Dari model tersebut didapat hasil peramalan

produksi dan konsumsi gula nasional hingga tahun 2014. Selain itu digunakan

pula software Eviews version 6 dalam melakukan analisis regresi untuk

mendapatkan persamaan regresi yang tepat sehingga mampu menjelaskan dampak

fluktuasi produksi dan konsumsi gula nasional terhadap pencapaian swasembada

gula nasional tahun 2014.

3.2.1 Metode Box-Jenkins (ARIMA)

Metode peramalan Box-Jenkins adalah suatu metode yang sangat tepat

lainnya (Assauri, 1984). Kerumitan itu terjadi karena terdapat variasi pada pola

data yang ada. Dalam metode Box-Jenkins tidak dibutuhkan adanya asumsi

tentang suatu pola yang tetap, yang menjadikan metode ini berbeda dengan

metode-metode lainnya..

Model Box-Jenkins atau ARIMA memfokuskan pada prinsip-prinsip

regresi dan metode pemulusan (smoothing). Model ARIMA merupakan gabungan

dari model Autoregressive (AR) dan Moving Average (MA). ARIMA sangat

bermanfaat dalam peramalan jangka pendek.

Syarat penting agar suatu data dapat dimodelkan pada metode deret waktu

ARIMA adalah kestasioneran data. Kestasioneran diperlukan untuk

mempermudah dalam identifikasi dan penarikan kesimpulan. Data deret waktu

dikatakan stasioner jika data menunjukkan pola yang konstan dari waktu ke

waktu. Data yang tidak stasioner pada nilai tengah dapat diatasi dengan

melakukan pembedaan atau diferensiasi derajat (d) pertama atau kedua. Sesuai

dengan diferensiasi derajat berapa data tersebut mencapai kestasioneran.

Sedangkan data yang tidak stasioner pada varian diatasi dengan melakukan

transformasi.

Pendekatan Box-Jenkins ini memberikan informasi secara eksplisit untuk

memungkinkan memikirkan atau memutuskan apakah pola yang diasumsikan

tersebut adalah tepat atau benar untuk keadaan atau situasi yang telah terjadi.

Proses yang dilakukan berulang memungkinkan kita untuk sampai pada suatu

model peramalan yang memberikan keoptimisan dalam ukuran pola dasar dan

Dalam peramalannya, ARIMA menggunakan informasi dari variabelnya

sendiri karena tidak mengikutsertakan variabel bebas dalam pembentukan

modelnya. Peramalan model Autoregressive (AR) didasarkan pada fungsi dari

nilai pengamatan masa lalu dalam jumlah terbatas. Sedangkan peramalan model

rata-rata bergerak (MA) berdasarkan kombinasi linear galat masa lalu dalam

jumlah terbatas pula.

Gabungan dari Autoregressive (p) dan Moving Average (q) akan

membentuk model ARIMA (p,d,q) dimana p adalah ordo dari AR, d merupakan

ordo dari integrasi dan q adalah ordo dari MA. Bentuk dasar dari model ARIMA

adalah (Hanke, 2005):

Model Autoregressive (AR):

(3.1)

Model Moving Average (MA):

(3.2)

Model ARMA (p, q) :

(3.3)

Dimana:

: variabel dependen pada waktu ke-t

, , ... , : variabel time lag

, , ,...., : koefisien yang diestimasi : error term pada periode ke-t

: konstanta

, ,..., : koefisien yang diestimasi

Model ARIMA dibentuk melalui rangkaian tahapan sebagai berikut:

1. Identifikasi model

Dilakukan dengan menentukan kestasioneran data. Deret waktu

nonstasioner terindikasi apabila deret muncul dengan pertumbuhan atau

penurunan sepanjang waktu dan autokorelasi sampel tidak dapat menghilang

dengan cepat. Deret nonstasioner dapat diubah menjadi deret stasioner melalui

proses differencing yaitu dengan mengganti deret asli menjadi deret selisih.

Kestasioneran data dapat dilihat dari uji Augmented Dicky Fuller (ADF) melalui

pengamatan pola ACF dan PACF.

Tabel 3.1 Pola ACF dan PACF pada Model ARIMA

Model ACF PACF

MA (q) Terpotong (cut off) setelah lag q (q=1 atau q=2)

Perlahan-lahan

menghilang (dies down) AR (p) Perlahan-lahan menghilang (dies

down)

Terpotong (cut off) setelh lag q (q=1 atau 2) ARMA (p,q) Perlahan-lahan menghilang (dies

down)

Perlahan-lahan

menghilang (dies down) Sumber: Hanke (2005)

Apabila data yang menjadi input model tidak stasioner, perlu dilakukan

modifikasi untuk menghasilkan data yang stasioner. Salah satu metode yang

digunakan adalah metode differencing. Second order difference dilakukan apabila

pada first order difference data belum juga stasioner (Firdaus, 2006).

First order difference : (3.4) Second order difference :

2. Estimasi Parameter Model

Setelah melalui proses identifikasi model melalui uji ADF, dilakukan

estimasi parameter model dengan menentukan terlebih dahulu ordo maksimum

dari AR dan MA dengan melihat ACF untuk ordo MA (q) dan PACF untuk ordo

AR (p). Ordo dari integrasi (d) juga harus ditentukan. Ada dua cara mendasar

yang dapat digunakan untuk melakukan estimasi terhadap parameter-parameter

tersebut, yaitu:

a. Dengan cara mencoba-coba (trial and error)

Melakukan pengujian terhadap beberapa nilai yang berbeda dan

memilih diantaranya yang memiliki jumlah kuadrat nilai sisa (galat)

yang minimum (sum of squared residuals).

b. Perbaikan secara iteratif (pengulangan)

Cara ini dilakukan dengan memilih nilai taksiran awal dan membiarkan

program komputer untuk memperhalus penaksiran dengan cara iteratif

(berulang). Metode ini lebih banyak dilakukan dan telah tersedia

algoritma (proses komputer) yang kuat dan dapat digunakan.

3. Pengujian Parameter Model

Sebelum menggunakan model untuk peramalan, model hendaknya

diperiksa terlebih dahulu kecukupannya. Pengujian dilakukan dengan

menggunakan model-model yang telah diestimasi pada tahap sebelumnya, sesuai

dengan kombinasi model ARIMA.

Pengujian parameter model terdiri dari:

b. Pengujian model secara keseluruhan

4. Pemilihan model terbaik

Model harus memenuhi beberapa kriteria untuk dapat menjadi model yang

terbaik, yaitu (Firdaus, 2006):

a) Residual bersifat acak dan tersebar normal

Model yang sesuai dengan data dapat diindikasikan oleh error yang

bersifat acak yang ditunjukkan dengan ACF dan PACF dari residual

secara statistik harus sama dengan nol. Untuk menguji autokorelasi

residual dapat menggunakan uji statistik Ljung Box (Q).

Hipotesis: H0: 1 = 2 = ... = m = 0 H1: 12...m 0 Statistik uji: Q = (3.6) Dimana: n = jumlah observasi k = selang waktu

m = jumlah selang waktu diuji

rk = fungsi autokorelasi sampel dari residual berselang k

kesimpulan:

bila Q>2_α(m-p-q) (disimpulkan tolak H0). Atau apabila nilai p (p-value) terkait dengan statistik Q kecil (misalkan : P < 0,05), maka tolak H0

b) Berlaku prinsip parsimonious

Model yang dipilih merupakan model yang paling sederhana, yang

memiliki jumlah parameter terkecil.

c) Semua parameter estimasi harus berbeda nyata dari nol

Dengan menggunakan t-ratio.

Hipotesis:

H0 : tidak terdapat autokorelasi pada deret waktu (H0 : k = 0) H1 : terdapat autokorelasi yang nyata pada selang ke-k (H1: 1 0) Statistik uji:

t = 

, atau sama dengan t = (3.7)

dimana:

k= lag atau selang

n= jumlah observasi

kriteria uji:

Statistik H0 menyebar dengan derajat bebas (n-1). Untuk α tertentu dari tabel T_{α/2 (n}-1) atau pada tingkat signifikan 0,05. Berdasarkan

pengalaman dapat menggunakan t-table = 2 sebagai nilai kritis untuk

menguji k Kesimpulan:

Bila t hitung > Tα/2 (n-1) (disimpulkan tolak H0) atau jika nilai absolut

d) Harus memenuhi kondisi invertibilitas dan stasioneritas

Zt adalah fungsi linier dari data stasioner yang lampau (Zt-1, Zt-2, ....).

dengan mengaplikasikan analisis regresi pada nilai lag deret stasioner,

maka dapat diperoleh autoregresi karena komponen trend sudah

dihilangkan. Data stasioner Zt saat ini adalah fungsi linear dari galat

masa kini dan masa lampau.

(3.8)

Jumlah koefisien MA harus kurang dari 1

Θ1+ Θ2+...+ Θq < 1 (kondisi invertibiliti) (3.9) Zt= + Θ1 Zt-1–Θ2 Zt-2+..+ t (3.10) Jumlah koefisien AR harus selalu kurang dari 1

1 + 2 +....+ p < 1 (kondisi stasioner) (3.11) e) Proses iterasi harus konvergen

Prosesnya harus terhenti ketika telah menghasilkan nilai parameter

dengan SSE terkecil. Jika telah memenuhi syarat tersebut maka pada

session akan terdapat pernyataan relative change in each estimate less

than 0,0010.

f) Nilai MSE model harus kecil

MSE = (3.12)

Semakin kecil nilai MSE, menunjukkan model secara keseluruhan

lebih baik.

Suatu model dikatakan baik apabila model tersebut memenuhi kriteria-

mampu menggambarkan hubungan antar variabelnya baik variabel dependen

dengan variabel independen maupun hubungan antar variabel independen.

5. Peramalan

Proses peramalan dilakukan dengan menggunakan model terbaik yang

memenuhi kriteria pada poin 4 untuk menjadi model terbaik. Peramalan dilakukan

untuk mengetahui nilai pada masa yang akan datang sehingga membantu memberi

gambaran keadaan pada masa yang akan datang yang berguna dalam

merencanakan suatu kebijakan atau perencanaan.

3.2.2 Metode Regresi Berganda

Metode ini merupakan suatu teknik dengan menggunakan analisis

hubungan antara variabel yang dicari atau yang diramalakan dengan satu atau

lebih variabel bebas yang memengaruhinya. Metode regresi berganda dapat

melihat faktor-faktor apa saja yang memiliki pengaruh nyata dan tidak nyata pada

produksi dan konsumsi gula. Metode ini digunakan untuk menganalisis

pencapaian swasembada gula.

Dalam metode regresi berganda, yang digunakan sebagai variabel

dependen adalah produksi dan variabel independennya adalah luas areal,

produktivitas dan rendemen. Pencapaian swasembada gula dapat diketahui dengan

memasukkan hasil dari ramalan konsumsi gula sebagai pengganti nilai produksi

pada persamaan regresi. Hal tersebut dilakukan dengan tujuan minimal

mencukupi 90 persen dari kebutuhan gula baik gula konsumsi langsung (GKP)

maupun gula rafinasi (GKR).

Ramalan didasarkan pada penggunaan analisis hubungan sebab akibat

yang bersifat konstan antara variabel yang akan diramal dengan satu atau

beberapa variabel lain yang memengaruhinya. Metode regresi bertujuan untuk

menemukan bentuk hubungan tersebut dan menggunakannya untuk meramalkan

nilai mendatang dari variabel tak bebas.

Persamaan umum untuk metode regresi linear berganda produksi gula

adalah:

(3.13) Dimana:

Y : Produksi Gula (ton)

: Intersep

X1 : Luas Areal (ha)

X2 : Produktivitas (ton/ha)

X3 : Rendemen (%)

1, 2, 3 : koefisien variabel bebas

Model yang baik merupakan model yang memenuhi asumsi klasik yaitu

tidak ada multikolinearitas, homoskedastisitas, tidak ada autokorelasi dan error

term menyebar normal. Pengujian untuk memastikan model tersebut memenuhi

1. Uji Multikolinearitas

Menurut Gujarati (2003) masalah multikolinearitas dapat terlihat dari

correlation matrix dengan uji akar unit sesama variabel bebas dimana batas tidak

terjadi korelasi sesama variabel yaitu tidak lebih dari . Melalui correlation matrix ini dapat pula digunakan uji Klein dalam mendeteksi multikolinearitas.

Apabila terdapat nilai korelasi yang lebih dari , maka menurut uji Klein multikolinearitas dapat diabaikan selama nilai korelasi tersebut tidak melebihi

nilai R-squared (adj) atau R-squared-nya. Multikolinearitas juga dapat dideteksi

dengan melihat nilai VIF (variance inflation factor) antar variabel bebasnya.

2. Uji Heteroskedastisitas

Pengujian heteroskedastisitas salah satunya dapat dilakukan dengan

menggunakan White Heteroscedasticity Test. Penentuannya dilakukan dengan

cara melihat probabilitas Obs*R-squared-nya.

Hipotesis:

H0: =0 H1: 0 Kriteria uji:

Probability Obs*R-squared< taraf nyata (α), maka terima H0 Probability Obs*R-squared> taraf nyata (α), maka tolak H0

Jika hasil menunjukkan tolak H0 maka persamaan tersebut tidak mengalami gejala

heteroskedastisitas. Sedangkan jika hasil menunjukkan terima H0 maka persamaan

3. Uji Autokorelasi

Masalah autokorelasi dapat diidentifikasi dengan menggunakan Breusch-

Godfrey Serial Correlation Test. Autokorelasi menyebabkan regresi semu yang

dapat mengakibatkan kesalahan dalam interpretasi hasil regresi.

Hipotesis:

H0: 0 H1: 0 Kriteria uji:

Probability Obs*R-squared < taraf nyata (α), maka terima H0 Probability Obs*R-squared> taraf nyata (α), maka tolak H0

Apabila nilai probabilitas Obs*R-squared-nya lebih besar dari taraf nyata

tertentu (tolak H0), maka persamaan tersebut tidak mengalami autokorelasi. Bila

nilai Obs*R-squared-nya lebih kecil dari taraf nyata tertentu (terima H0) maka

persamaan tersebut mengalami autokorelasi.

4. Uji Normalitas

Uji normalitas digunakan untuk melihat distribusi dari error term.

Hipotesis:

H0: error term terdistribusi normal

H1: error term tidak terdistribusi normal

Kriteria uji:

Probability (P-value)< taraf nyata (α) maka tolak H0. Probability (P-value)> taraf nyata (α) maka terima H0.

Jika terima H0 maka persamaan tersebut memiliki error term yang terdistribusi

normal, sedangkan jika tolak H0 maka persamaan tersebut memiliki error term

yang tidak terdistribusi normal.

Untuk mengetahui bagaimana pencapaian swasembada gula dilakukan

analisis kombinasi skenario kebijakan yang dapat diterapkan guna membantu

pencapaian swasembada gula nasional. Terdapat dua skenario yang akan dibahas

yaitu: (1) tanpa penambahan pabrik gula, dan (2) dengan penambahan pabrik gula.

Dari kedua skenario tersebut, akan dianalisis hasil peramalan terhadap upaya

pencapaian swasembada gula nasional dengan melihat kemungkinan luas areal,

produkktivita tebu, rendemen dan penambahan pabrik gula yang dapat dilakukan

guna mencapai tingkat produksi dan konsumsi yang tepat.

Dalam menyatakan keakuratan hasil ramalan pencapaian swasembada gula

digunakan dua kriteria yaitu nilai koefisisen determinasi (R-squared) dan nilai

MSE terkecil. Koefisien determinasi adalah proporsi ragam pada variabel

dependen yang dapat diterangkan oleh variabel independen. Semakin besar nilai

R-squared berarti model semakin akurat dalam meramalkan dan semakin baik

Dalam dokumen Analisis Peramalan Tingkat Produksi dan Konsumsi Gula Indonesia dalam Mencapai Swasembada Gula Nasional (Halaman 52-65)