ABSTRAK
Metode peramalan yang baik adalah metode yang mempunyai galat terkecil dalam peramalan. Metode yang digunakan pada skripsi ini adalah metode Dekomposisi Klasik dan metode ARIMA. Metode ARIMA mendasarkan ramalannya pada proses Autoregressive (AR) dan Moving Average (MA). Konsep-konsep yang digunakan dalam membangun model adalah Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF).
Data yang digunakan untuk membandingkan metode Dekomposisi Klasik dan metode ARIMA adalah data jumlah penumpang kereta api tahun 2006-2015. Data mempunyai komponen musiman dan tren. Tujuan penelitian ini adalah membandingkan metode Dekomposisi Klasik dan metode ARIMA untuk mendapatkan metode yang terbaik dalam peramalan dengan menggunakan Mean Square Error (MSE) sebagai kriteria evaluasi.
ABSTRACT
A good forecasting method is a method which has the minimum error in forecasting. This thesis discusses about Classical Decomposition method and ARIMA method. ARIMA forecasting method is based on the Autoregressive (AR) and Moving Average (MA) processes. Concepts which are used to build the model is Autocorrelation Function (ACF) and Partial Autocorrelation Function (PACF).
The data which are used to compare Classical Decomposition method and ARIMA method are the number of train passengers in 2006-2015. The data have seasonal and trend components. The purpose of this thesis is to compare the Classical Decomposition method and ARIMA method for getting the best method on forecasting by using Mean Square Error (MSE) as evaluating criteria.
i
PERBANDINGAN METODE DEKOMPOSISI KLASIK DAN
METODE ARIMA UNTUK PENDUGAAN PARAMETER
DATA RUNTUN WAKTU
(Studi Kasus: Jumlah Penumpang Kereta Api)
SkripsiDiajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Program Studi Matematika
Oleh: Noni Riani NIM: 123114020
PROGRAM STUDI MATEMATIKA/JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKARTA
ii
THE COMPARISON OF CLASSICAL DECOMPOSITION
METHOD AND ARIMA METHOD TO ESTIMATE THE
PARAMETER OF TIME SERIES DATA
(Case Study: The Number of Train Passengers)
Thesis
Presented as a Partial Fulfillment of the Requirement to Obtain the Sarjana Sains Degree
in Mathematics
By: Noni Riani
Student Number: 123114020
MATHEMATICS STUDY PROGRAM/DEPARTMENT OF MATHEMATICS FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY YOGYAKARTA
vi
HALAMAN PERSEMBAHAN
Karya ini saya persembahkan untuk:
Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga skripsi ini dapat diselesaikan tepat pada waktunya.
Bapak dan Ibu yang telah membesarkan, mendidik, mendoakan dan memberikan dukungan saya dalam segala hal. Terima kasih atas perhatian, kasih sayang dan dukungan yang telah diberikan, sehingga skripsi ini dapat selesai.
vii
ABSTRAK
Metode peramalan yang baik adalah metode yang mempunyai galat terkecil dalam peramalan. Metode yang digunakan pada skripsi ini adalah metode Dekomposisi Klasik dan metode ARIMA. Metode ARIMA mendasarkan ramalannya pada proses Autoregressive (AR) dan Moving Average (MA). Konsep-konsep yang digunakan dalam membangun model adalah Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF).
Data yang digunakan untuk membandingkan metode Dekomposisi Klasik dan metode ARIMA adalah data jumlah penumpang kereta api tahun 2006-2015. Data mempunyai komponen musiman dan tren. Tujuan penelitian ini adalah membandingkan metode Dekomposisi Klasik dan metode ARIMA untuk mendapatkan metode yang terbaik dalam peramalan dengan menggunakan Mean Square Error (MSE) sebagai kriteria evaluasi.
viii
ABSTRACT
A good forecasting method is a method which has the minimum error in forecasting. This thesis discusses about Classical Decomposition method and ARIMA method. ARIMA forecasting method is based on the Autoregressive (AR) and Moving Average (MA) processes. Concepts which are used to build the model is Autocorrelation Function (ACF) and Partial Autocorrelation Function (PACF).
The data which are used to compare Classical Decomposition method and ARIMA method are the number of train passengers in 2006-2015. The data have seasonal and trend components. The purpose of this thesis is to compare the Classical Decomposition method and ARIMA method for getting the best method on forecasting by using Mean Square Error (MSE) as evaluating criteria.
ix
KATA PENGANTAR
Puji dan Syukur penulis panjatkan kepada Tuhan Yang Maha Esa yang telah memberikan rahmat, taufik, dan hidayah-Nya sehingga penulis dapat menyelesaikan penulisan skripsi dalam rangka memperoleh gelar Sarjana Sains di Universitas Sanata Dharma.
Penulis menyadari bahwa penyusunan skripsi ini dapat diselesaikan karena dukungan dan bantuan dari berbagai pihak, baik perorangan ataupun lembaga. Untuk itu, dengan segala kerendahan hati penulis ingin menyampaikan terima kasih kepada:
1. Ir. Ig. Aris Dwiatmoko, M.Sc., selaku dosen pembimbing skripsi yang telah meluangkan waktu, tenaga, dan pikiran serta ilmu yang telah diberikan sehingga terselesaikannya skripsi ini.
2. YG. Hartono, S.Si., M.Sc., Ph.D, selaku Ketua Program Studi Matematika sekaligus Dosen Pembimbing Akademik.
3. Bapak Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku dekan Fakultas Sains dan Teknologi.
x
5. Kedua orang tua ku tercinta, kakak ku Lusiana, Ganda, Nawa dan Dewita yang selalu memberikan dukungan, doa, dan semangat sehingga terselesaikannya skripsi ini.
6. Teman-teman Matematika 2012: Lia, Ajeng, Putri, Sila, Anggun, Manda, Happy, Arum, Dewi, Rian, Budi, Ega, Boby, Tika, Ferny, Juli, Ilga, Oxi, dan Risma yang telah membantu dalam penulisan skripsi ini, dan memberikan kecerian serta dukungan selama kuliah.
7. Semua pihak yang telah membantu penulis dalam menyelesaikan skripsi ini.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran yang dapat membangun serta menyempurnakan skripsi ini. Penulis berharap semoga skripsi ini dapat memberikan wawasan dan pengetahuan bagi pembaca.
Yogyakarta, 22 Juni 2016 Penulis,
xii DAFTAR ISI
Halaman
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN PEMBIMBING ... iii
HALAMAN PENGESAHAN ... iv
HALAMAN KEASLIAN KARYA ... v
HALAMAN PERSEMBAHAN ... vi
ABSTRAK ... vii
ABSTRACT ... viii
KATA PENGANTAR ... ix
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI ... xi
DAFTAR ISI ... xii
BAB I PENDAHULUAN ... 1
A. Latar Belakang Masalah ... 1
B. Rumusan Masalah ... 6
C. Batasan Masalah ... 7
D. Tujuan Penulisan ... 7
E. Metode Penulisan... 8
xiii
G. Sistematika Penulisan ... 8
BAB II LANDASAN TEORI ... 11
A. Data Runtun Waktu dan Proses Stokastik ... 11
B. Stasioneritas ... 13
C. Pembedaan (Differencing) ... 15
D. Variabel Acak yang Saling Bebas ... 17
E. P-value (Nilai Signifikan)... 22
F. Fungsi Otokorelasi/ Autocorrelation Function (ACF) ... 23
G. Fungsi Otokorelasi Parsial/ Partial Autocorrelation Function (PACF) . 29 H. Proses White Noise ... 34
I. Uji Normalitas Galat ... 34
J. Moving Average (rata-rata bergerak) ... 37
K. Metode Dekomposisi Aditif ... 40
L. Metode Autoregressive Integrated Moving Average (ARIMA) ... 45
M. Pengujian White Noise ... 49
N. Evaluasi Model ... 51
BAB III METODE DEKOMPOSISI KLASIK DAN METODE ARIMA ... 53
A. Pendahuluan ... 53
B. Metode Dekomposisi Klasik... 54
xiv
D. Contoh 3.4 Runtun Waktu ... 70
BAB IV PERBANDINGAN METODE DEKOMPOSISI KLASIK DAN METODE ARIMA ... 81
A. Pengolahan Data Menggunakan Metode Dekomposisi Klasik ... 81
B. Pengolahan Data Menggunakan Metode ARIMA ... 86
C. Evaluasi Model ... 98
BAB V PENUTUP ... 100
A. Kesimpulan ... 100
B. Saran ... 100
DAFTAR PUSTAKA ... 102
1 BAB I PENDAHULUAN
A.Latar Belakang Masalah
Ramalan adalah dugaan mengenai kejadian atau peristiwa yang akan datang sedangkan peramalan adalah tindakan dalam membuat dugaan (Bowerman,1993). Peramalan adalah suatu teknik untuk memperkirakan suatu nilai pada masa yang akan datang dengan memperhatikan data masa lalu maupun data saat ini (Aswi dan Sukarna, 2006). Untuk melakukan peramalan tersebut diperlukan data yang akurat pada masa lampau sehingga dapat melihat kondisi yang akan datang. Peramalan adalah salah satu unsur yang sangat penting dalam pengambilan keputusan, sebab efektif atau tidaknya suatu keputusan umumnya tergantung pada faktor yang tidak terlihat pada waktu keputusan tersebut diambil (Soejoeti,1987). Berbagai bidang pengetahuan baik itu ekonomi, manajemen, keuangan, dan berbagai bidang riset selalu membutuhkan peramalan. Peramalan sangat diperlukan untuk mengetahui nilai dari suatu peristiwa berdasarkan waktu yang akan terjadi, sehingga tindakan yang tepat dapat dilakukan.
Ada beberapa metode yang dapat digunakan dalam peramalan, yang menurut jenisnya dibagi menjadi dua yaitu:
1. Metode peramalan kuantitatif (bersifat obyektif)
a. Metode univariat runtun waktu (time series) yaitu metode yang dapat digunakan untuk menganalisis serangkaian data yang merupakan fungsi dari waktu. Model univariat menganalisis pola data yang diasumsikan kontinu di waktu yang akan datang. Pola tersebut diekstrapolasi untuk menghasilkan suatu model peramalan. Metode ini dipengaruhi oleh 4 komponen, yaitu:
1) Kecenderungan/Trend (T) merupakan pergerakan data untuk naik atau turun pada suatu runtun waktu dalam periode yang cukup panjang.
2) Siklus/Cycle (C) merupakan pergerakan tren yang meningkat ataupun menurun dalam jangka yang relatif lama atau untuk waktu yang lebih dari satu tahun.
3) Pola Musiman/ Seasonal (S) merupakan fluktuasi dari data yang terjadi secara periodik dalam kurun waktu satu tahun, misalnya fluktuasi per triwulanan, kuartalan, bulanan, mingguan, atau harian.
4) Variasi Acak/Random (I) dapat terjadi karena adanya faktor-faktor, seperti bencana alam, bangkrutnya perusahaan pesaing, promosi khusus, dan kejadian-kejadian lainnya yang tidak mempunyai pola tertentu.
Metode-metode yang termasuk kelompok model univariat adalah Simple Moving Average, Exponential Smoothing, Double Moving Average, Holt’s Two
Parameter Trend Model, Weight Moving Average, dan lain-lain.
kausal di antaranya metode ekonometri, regresi berganda dari suatu runtun waktu, dan lain-lain.
2. Metode peramalan kualitatif (bersifat subyektif)
Peramalan kualitatif menggunakan pendapat dari para ahli untuk mem-perkirakan kejadian yang akan datang. Hasil peramalan kualitatif yang diperoleh bergantung pada orang yang menyusunnya atau berdasarkan pendapat para ahli.
Beberapa metode yang termasuk dalam metode peramalan kualitatif: metode Delphi, analogi historis (historical analogy), dan lain-lain.
a. Metode Delphi adalah suatu metode yang proses pengambilan keputusan me-libatkan beberapa pakar. Adapun para pakar tersebut tidak dipertemukan secara langsung (tatap muka), dan identitas dari masing-masing pakar disembunyikan sehingga setiap pakar tidak mengetahui identitas pakar yang lain. Hal ini ber-tujuan untuk menghindari adanya dominasi pakar lain dan dapat meminimal-kan pendapat yang bias. Metode Delphi pertama kali digunameminimal-kan oleh Air Force-funded RAND pada tahun 1950.
Pada dasarnya metode kualitatif ditujukan untuk peramalan terhadap produk baru, pasar baru, proses baru, perubahan sosial masyarakat, perubahan teknologi, atau penyesuaian terhadap ramalan-ramalan berdasarkan metode kuantitatif.
Metode yang akan digunakan pada skripsi ini adalah metode peramalan kuantitatif yaitu univariat runtun waktu (time series). Data runtun waktu yakni jenis data yang dikumpulkan menurut urutan waktu dalam suatu rentang waktu tertentu. Model yang menggunakan data runtun waktu ada 2 yaitu model stasioner dan model non-stasioner.
Model stasioner yaitu model yang sedemikian hingga semua sifat statistiknya tidak berubah dengan pergeseran waktu. Dalam aplikasi, sifat statistika yang sering menjadi perhatian adalah rata-rata, variansi, serta ukuran keeratan yakni fungsi kovariansi. Pada model stasioner, sifat-sifat statistiknya di masa yang akan datang dapat diramalkan berdasarkan data historis yang telah terjadi di masa lalu. Beberapa model runtun waktu stasioner yakni Autoregressive (AR), Moving Average (MA), Autoregressive Moving Average (ARMA). Jika deret waktu tidak stasioner, maka data harus dibuat stasioner melalui proses pembedaan (differencing). Model AR, MA, dan ARMA dengan data yang stasioner melalui proses pembedaan ini disebut dengan model Autoregressive Integrated Moving Average (ARIMA). Model non-stasioner adalah model yang tidak memenuhi sifat model stasioner.
Model ARIMA atau dikenal juga dengan model Box-Jenkins dapat ditulis dalam bentuk
p, d, dan q berturut-turut adalah orde untuk Autoregressive (AR), integrated (I), dan Moving Average (MA).
Selain peramalan dengan metode ARIMA, ada juga yang menggunakan peramalan dengan metode dekomposisi. Metode dekomposisi lebih praktis dibandingkan metode ARIMA dan lebih umum digunakan karena penerapannya yang mudah dipahami.
Dekomposisi adalah suatu pendekatan analisis data runtun waktu untuk mengidentifikasi faktor-faktor komponen yang mempengaruhi masing-masing nilai dari data. Setiap komponen diidentifikasi secara terpisah. Proyeksi dari masing-masing komponen kemudian dapat dikombinasikan untuk menghasilkan ramalan nilai masa depan dari data runtun waktu (Hanke dan Wichern, 2009). Beberapa dekomposisi yang telah dikembangkan dan digunakan:
1. Dekomposisi Aditif
Dekomposisi Aditif mendekomposisi data runtun waktu pada komponen-komponen tren, musiman, siklus dan galat (error). Metode ini mengidentifikasi ramalan masa depan dan menjumlahkan proyeksi hasil peramalan. Model diasumsikan bersifat aditif (semua komponen ditambahkan untuk mendapatkan hasil peramalan).
Persamaan model ini adalah:
2. Dekomposisi Multiplikatif
Dekomposisi multiplikatif mendekomposisi data runtun waktu pada komponen-komponen tren, musiman, siklus dan galat kemudian memprediksi nilai masa depan. Model diasumsikan bersifat multiplikatif (semua komponen dikalikan satu sama lain untuk mendapatkan model peramalan).
Persamaan model ini adalah:
adalah data runtun waktu, Tt adalah komponen tren (trend), Ct adalah komponen siklus (cycle), St adalah komponen musiman (seasonal), dan adalah komponen tak beraturan.
Komponen musiman dan komponen tren merupakan komponen yang biasanya terdapat pada data. Dengan adanya komponen musiman dapat juga dilihat komponen siklusnya. Komponen tak beraturan hanya untuk melihat galat yang ada pada data. Sehingga dalam perumusan masalah penulis hanya membahas mengenai komponen musiman dan komponen tren.
B. Rumusan Masalah
Berdasarkan latar belakang di atas, maka rumusan masalah tugas akhir adalah sebagai berikut:
2. Bagaimana perbandingan metode ARIMA dan metode dekomposisi klasik yang memuat tren dan musiman?
C. Batasan Masalah
Dalam tugas akhir ini penulis membatasi permasalahan, yaitu
1. Membahas peramalan kuantitatif khususnya dekomposisi secara aditif yang hanya memuat data tren dan musiman.
2. Pendugaan parameter AR dan MA dengan menggunakan program R. 3. Landasan teori yang dibahas hanya yang berkaitan langsung dengan pokok
perkara skripsi.
4. Skripsi ini hanya mencari metode yang terbaik tanpa meramalkan data untuk waktu kedepannya.
5. Data yang digunakan adalah data jumlah penumpang kereta api Jawa dan Sumatera dari tahun 2006-2015.
D. Tujuan Penulisan
Tujuan yang akan dicapai dalam penulisan ini adalah:
1. Mengetahui landasan matematis peramalan metode ARIMA dan metode dekomposisi klasik yang memuat tren dan musiman.
E. Metode Penulisan
Metode penulisan yang digunakan adalah metode studi pustaka, yaitu dengan membaca referensi buku-buku pendukung dan jurnal yang mengenai ARIMA dan dekomposisi klasik. Jenis-jenis sumber pustaka yang digunakan dicantumkan dalam daftar pustaka.
F. Manfaat Penulisan
Manfaat yang diperoleh dari skripsi ini adalah:
1. Bagi penulis: lebih memahami mengenai metode peramalan seperti metode dekomposisi klasik dan metode ARIMA.
2. Bagi pembaca: memberi pengetahuan baru mengenai metode peramalan yang dapat digunakan serta memberikan informasi bagi pihak yang membutuhkan.
G. Sistematika Penulisan BAB I: PENDAHULUAN
Bab II : LANDASAN TEORI
A. Data Runtun Waktu dan Proses Stokastik B. Stasioneritas
C. Pembedaan (Differencing)
D. Variabel Acak yang Saling Bebas E. P-value (Nilai Signifikan)
F. Fungsi Otokorelasi/ Autocorrelation Function (ACF)
G. Fungsi Otokorelasi Parsial/ Partial Autocorrelation Function (PACF) H. Proses White Noise
I. Uji Normalitas Galat
J. Moving Average (rata-rata bergerak) K. Metode Dekomposisi Aditif
L. Model Autoregressive Integrated Moving Average (ARIMA) M. Pengujian White Noise
N. Evaluasi Model
BAB III: METODE DEKOMPOSISI KLASIK DAN METODE ARIMA A. Pendahuluan
B. Metode Dekomposisi Klasik
BAB IV: PERBANDINGAN METODE DEKOMPOSISI KLASIK DAN METODE ARIMA
Bab ini menjelaskan tentang perbandingan metode dekomposisi klasik dan metode ARIMA untuk pendugaan data runtun waktu.
11 BAB II
LANDASAN TEORI
A. Data Runtun Waktu dan Proses Stokastik Definisi 2.1 Runtun waktu (time series)
Runtun waktu adalah himpunan pengamatan pada waktu . Runtun waktu diskrit adalah himpunan pengamatan dengan . Runtun waktu kontinu adalah himpunan pengamatan dengan atau t pada interval tertentu.
Contoh 2.1 Permainan bisbol tahun 1933-1995
Gambar 2.1 menunjukkan hasil permainan bisbol dengan memplot , dengan
{
ini adalah pertunjukan dengan hanya dua nilai kemungkinan yaitu . Ada beberapa nilai yang tidak ada yaitu pada tahun 1945 dan tahun 1959-1962 karena pertandingan tidak dimainkan.
Pada skripsi ini akan dibahas mengenai data runtun waktu diskrit. Data runtun waktu diamati sebagai n variabel acak di sebarang waktu bilangan bulat
, untuk setiap n bilangan bulat positif, disediakan oleh fungsi distribusi bersama, dievaluasi sebagai probabilitas bahwa nilai-nilai dari data yang bersama-sama kurang dari n konstanta, yaitu
(2.1)
Pengamatan variabel yang tersedia dari waktu ke waktu disebut data runtun waktu (Hanke & Winchern, 2009). Tujuan utama dari analisis runtun waktu adalah untuk mengembangkan model matematika yang menyediakan deskripsi yang masuk akal untuk data sampel. Agar dapat memberikan analisis statistik untuk menggambarkan karakter data yang berfluktuasi secara acak dari waktu ke waktu, diasumsikan runtun waktu dapat didefinisikan sebagai kumpulan dari variabel acak diindeks berdasarkan urutan yang diperoleh dalam waktu. Sebagai contoh, perhatikan data runtun waktu sebagai urutan variabel acak,
dengan variabel acak menunjukkan nilai yang diambil oleh deret pada saat pertama, variabel menunjukkan nilai untuk periode waktu yang kedua, variabel menunjukkan nilai untuk periode ketiga, dan seterusnya (Shumway dan Stoffer, 2011:11).
tetapi kemunculannya dapat mempengaruhi fluktuasi data runtun waktu. Pola horisontal terjadi ketika nilai berfluktuasi di sekitar nilai rata-rata yang konstan artinya data tidak mengalami kenaikan atau penurunan secara signifikan. Pola tren adalah kecenderungan data untuk naik atau turun pada suatu runtun waktu dalam periode yang cukup panjang. Pola musiman merupakan fluktuasi dari data yang terjadi secara periodik dalam kurun waktu satu tahun, misalnya fluktuasi per triwulanan, kuartalan, bulanan, mingguan, atau harian. Sedangkan pola siklus merupakan fluktuasi dari data untuk waktu yang lebih dari satu tahun. Model runtun waktu adalah model yang dapat digunakan untuk menganalisis serangkaian data yang merupakan fungsi dari waktu.
B. Stasioneritas
Gambar 2.2 Plot data stasioner dalam rata-rata dan variansi
Gambar 2.3 Plot data stasioner dalam variansi dan tidak stasioner dalam rata-rata
Gambar 2.5 Plot data tidak stasioner dalam rata-rata dan variansi
Apabila data tidak stasioner dalam rata-rata, maka untuk menghilangkan ketidakstasioneran dapat dilakukan dengan pembedaan yang akan dibahas pada subbab C. Apabila data tidak stasioner dalam variansi maka dapat dilakukan transformasi Box dan Cox (Wei, 2006), dengan fungsi transformasi sebagai berikut:
Perhitungan dengan menggunakan program R dengan perintah: >Lambda= BoxCox,lambda(Xt), dengan adalah data asli.
C. Pembedaan (Differencing)
dibuat mendekati stasioner dengan melakukan pembedaan orde pertama dari data runtun waktu. Rumus pembedaan orde pertama adalah
(2.2)
Dengan menggunakan operator langkah mundur, persamaan (2.2) dapat ditulis menjadi
(2.3)
Dengan = nilai variabel pada waktu setelah pembedaan. Pembedaan orde pertama dinyatakan oleh (1-B).
Apabila stasioneritas tidak dicapai, dapat dilakukan pembedaan orde kedua yaitu:
(2.4)
Dengan operator langkah mundur, persamaan (2.4) dapat ditulis
Tujuan melakukan pembedaan adalah untuk mencapai stasioneritas, dan secara umum apabila terdapat pembedaan orde ke-d dapat ditulis:
D. Variabel Acak yang Saling Bebas Definisi 2.2
Misalkan mempunyai fungsi distribusi , mempunyai fungsi distribusi
dan , mempunyai fungsi distribusi bersama . Maka dan dikatakan saling bebas jika dan hanya jika
Untuk setiap pasangan bilangan real .
Jika dan variabel acak diskrit dengan fungsi probabilitas bersama
dan fungsi probabilitas marginal dan , maka dan saling bebas jika dan hanya jika
Untuk semua pasangan bilangan real .
Jika dan variabel acak kontinu dengan fungsi densitas bersama
dan fungsi densitas marginal dan , maka dan saling bebas jika dan hanya jika
Definisi 2.3
Misalkan adalah konstan, maka
Bukti
Menurut definisi 2.3 untuk distribusi probabilitas diskrit, diperoleh
∑ ∑
Dari teorema ∑
Menurut definisi 2.3 untuk distribusi probabilitas kontinu, diperoleh
[ ] [ ]
[ ]
Teorema 2.4
Misalkan dan adalah variabel acak yang saling bebas, maka
[ ] [ ] [ ]
Bukti
Menurut definisi 2.3 dan 2.2 untuk diskrit, diperoleh
[ ] ∑ ∑
∑ ∑
∑ ∑
∑ [ ]
[ ] ∑
[ ] [ ]
Menurut definisi 2.3 dan 2.2 untuk kontinu, diperoleh
[ ] ∫ ∫
∫ ∫
∫ [ ∫
P-value (nilai signifikan) adalah nilai kesalahan yang didapat dari hasil
perhitungan statistik atau sebagai ukuran untuk menerima atau menolak (hipotesis nol). Sebelum menghitung nilai p-value, harus ditetapkan terlebih dahulu nilai alpha ( ) sebagai patokan seberapa besar kesalahan tersebut dapat diterima. Alpha adalah batas kesalahan maksimal yang dijadikan patokan oleh peneliti. Nilai alpha yang sering digunakan adalah sebesar , nilai alpha yang kecil menunjukkan semakin ketatnya aturan dalam suatu penelitian. Nilai alpha menunjukkan seberapa ekstrim suatu data (data ideal), sehingga dapat menunjukkan adanya perbedaan dengan data lainnya (tolak H0). Selanjutnya
peneliti menolak hipotesis nol. Jika nilai p-value , maka peneliti gagal menolak hipotesis nol (menerima hipotesis nol).
F. Fungsi Otokorelasi/ Autocorrelation Function (ACF)
Sebelum membahas ACF sebaiknya perhatikan penjelasan tentang fungsi otokovariansi. Dalam asumsi stasioner, proses stokastik { } mempunyai rata-rata
dan variansi yang konstan dan
kovariansi , yang fungsinya merupakan selisih waktu | |. Maka dari itu, hasil tersebut dapat ditulis sebagai kovariansi antara dan dari proses stokastik { } sebagai berikut:
[ ] (2.6)
Fungsi otokorelasi merupakan hubungan antara suatu himpunan observasi dengan himpunan observasi itu sendiri tetapi dalam waktu yang berbeda. Koefisien otokorelasi menunjukkan keeratan hubungan antara nilai variabel yang sama tetapi pada waktu yang berbeda. Koefisien ini juga mengukur tingkat keeratan hubungan antara dengan . Sedangkan pengaruh time lag 1,2,3,... dan seterusnya sampai k-1 konstan. Koefisien otokorelasi untuk lag-k dari data runtun waktu dapat ditulis sebagai berikut (Wei, 2006):
= otokorelasi pada lag-k
Koefisien dari otokovariansi dapat diduga dengan
̂
Menurut (Makridakis, 1999:339) koefisien fungsi otokorelasi dapat diduga dengan koefisien otokorelasi sampel, yaitu
∑ ̅ ̅ ∑ ̅
(2.9)
̅ = rata-rata pengamatan pada = pengamatan pada waktu ke-t
= pengamatan pada waktu ke , dengan
Contoh 2.2
Diberikan contoh cara menghitung secara numerik fungsi otokorelasi pada tabel 2.1
Tabel 2.1 data runtun waktu
t 1 2 3 4 5 6 7 8 9 10 13 8 15 4 4 12 11 7 14 12
Otokorelasi sampel untuk data dapat dihitung menggunakan pendugaan sampel
, dan seterusnya dapat dihitung seperti contoh di atas. Berikut adalah plot ACF contoh 2.1 untuk lag 0 sampai lag 10.
Gambar 2.6 Plot ACF
Dalam perhitungan fungsi otokorelasi untuk lag 0 selalu bernilai 1.
dan seterusnya, untuk lag selanjutnya dapat dilihat pada gambar di atas.
2. Pengujian Fungsi Otokorelasi (ACF) Langkah-langkah pengujian:
1. (koefisien otokorelasi tidak signifikan) 2. (koefisien otokorelasi signifikan) 3. Menentukan
4. Statistik uji:
dengan
√
5. wilayah kritis:
ditolak (koefisien otokorelasi signifikan) jika | | .
6. Membuat kesimpulan
merupakan fungsi atas k, maka hubungan koefisien korelasi dengan lag nya disebut fungsi otokorelasi. Pengujian dilakukan untuk mengetahui apakah koefisien fungsi otokorelasi signifikan atau tidak.
Selain menggunakan pengujian tersebut, dapat juga menggunakan batas signifikansi. Untuk memeriksa apakah koefisien signifikan, dapat digunakan rumus kesalahan standar dari yakni
√ . Sehingga seluruh nilai korelasi
yang tidak signifikan akan berada pada batas
√ √ pada
selang kepercayaan , untuk nilainya mendekati nilai .
Gambar 2.7 Plot ACF galat
Dari gambar 2.7 terlihat bahwa galat bersifat acak karena untuk setiap lag berada pada batas signifikan.
Selanjutnya perhatikan contoh 2.2, dari contoh dapat dihitung batas signifikan untuk dan sehingga diperoleh batas signifikan
(
√ ) (√ )
(
√ ) (√ )
(
√ ) (√ )
G. Fungsi Otokorelasi Parsial/ Partial Autocorrelation Function (PACF) Otokorelasi parsial digunakan untuk mengukur tingkat keeratan antara dan , apabila pengaruh dari time lag dianggap terpisah (Makridakis, 1995).
Otokorelasi parsial dapat diturunkan dari model regresi linear, dengan variabel dependent yang merupakan proses stasioner dengan rata-rata nol
Selanjutnya menghitung nilai harapannya (expected value)
Mengacu pada teorema 2.4 dan persamaan (2.6), diperoleh
1. Pendugaan Fungsi Otokorelasi Parsial (PACF)
Menurut (Wei, 2006) fungsi otokorelasi parsial persamaan (2.11) dapat diduga dengan koefisien otokorelasi parsial sampel secara rekursif. Metode rekursif dimulai dengan ̂ ̂ . Untuk perhitungan ̂ diberikan oleh Durbin
̂ ̂ ̂ ̂ ̂ ̂ ̂ ̂ ̂ ̂
Untuk ̂ selainnya dapat dihitung menggunakan cara yang sama seperti contoh di atas. Berikut adalah gambar PACF contoh 2.3
Gambar 2.8 Plot PACF contoh 2.3
2. Pengujian Fungsi Otokorelasi Parsial (PACF)
Langkah-langkah pengujian hipotesis koefisien otokorelasi parsial: 1. (koefisien otokorelasi parsial tidak signifikan) 2. (koefisien otokorelasi parsial signifikan) 3. Menentukan
̂
H. Proses White Noise
Definisi 2.4 Proses White Noise
Suatu proses stokastik { } disebut proses white noise jika barisan variabel acak yang berdistribusi normal tidak berkorelasi di setiap waktu, dengan rata-rata
dan variansi konstan Var = .
Berdasarkan definisi 2.4 di atas, proses white noise { } adalah stasioer dengan fungsi otokovariansi (Wei, 2006).
{
fungsi otokorelasi
{
dan fungsi otokorelasi parsial
{
I. Uji Normalitas Galat
Uji normalitas galat digunakan untuk mengetahui apakah galat berdistribusi normal atau tidak. Untuk menguji normalitas dari galat menggunakan uji normalitas Kolmogorov-Smirnov dengan langkah-langkah sebagai berikut (Daniel, 1989):
1. galat berdistribusi normal
2. galat tidak berdistribusi normal
4. Dengan statistik uji:
| |
Dengan fungsi distribusi kumulatif berdasarkan data sampel
fungsi distribusi kumulatif di bawah
nilai Z diperoleh dari ̅
̅ adalah rata-rata sampel dan adalah standard deviasi sampel. 5. kriteria pengujian:
diterima (galat berdistribusi normal) jika atau
, dengan n adalah ukuran sampel. 6. Menentukan kesimpulan
Pengujian juga dapat dilakukan dengan melihat grafik normalitas. Jika galat berdistribusi normal, maka galat akan berada di sekitar garis diagonal. Untuk galat yang tidak berdistribusi normal, maka galat akan menyebar dan menjauhi garis diagonal.
Contoh 2.4 uji data normalitas Diberikan 14 data pada tabel 2.2
Tabel 2.2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 73.9 74.2 74.6 74.7 75.4 76 76 76 76.5 76.6 76.9 77.3 77.4 77.7
Uji apakah data tersebut berdistribusi normal dengan menggunakan uji Kolmogorov-Smirnov.
Perhitungan statistik uji Kolmogorov-Smirnov diberikan pada tabel di bawah Frek
̅̅ = | |
74.6 1 3 0.2143 -1.00 0.1587 0.0556
beberapa keacakan pada data. Agar lebih memahami tentang konsep rata-rata bergerak, perhatikan tabel rata-rata bergerak dibawah:
Waktu Rata-rata bergerak
Kuantitas p+f+1 adalah order dari rata-rata bergerak
Contoh 2.5
Dengan perhitungan Excel diperoleh nilai sebagai berikut:
7 0.0068 22 -0.0227 37 0.0232 52 0.0250 8 0.0013 23 0.0237 38 -0.0619 53 -0.0308 9 -0.0176 24 -0.0215 39 0.0765 54 0.0770 10 -0.0136 25 0.0240 40 -0.0846 55 -0.0959 11 0.0090 26 -0.0221 41 0.0608 56 0.0148 12 -0.0276 27 0.0313 42 -0.0580 57 0.0265 13 0.0028 28 -0.0266 43 0.0068 58 -0.0580 14 -0.0012 29 0.0250 44 -0.0087 59 0.0368 15 -0.0138 30 -0.0308 45 0.0188 60 0.0022
Gambar 2.10 plot dan
Dari gambar 2.10 terlihat bahwa nilai data asli dan rata-rat bergerak tidak berbeda secara signifikan.
K. Metode Dekomposisi Aditif
nilai dari data. Setiap komponen diidentifikasi secara terpisah. Proyeksi dari masing-masing komponen kemudian dapat dikombinasikan untuk menghasilkan ramalan nilai masa depan dari data runtun waktu (Hanke dan Wichern, 2009).
Metode dekomposisi memisahkan pola dasar menjadi tiga komponen terpisah yang cenderung mencirikan runtun data ekonomi dan bisnis. Komponen tersebut adalah tren, siklus, dan musiman. Dekomposisi mempunyai asumsi bahwa data itu tersusun sebagai berikut:
Data = pola + galat
= f (tren, siklus, musiman) + galat
Jadi, di samping komponen pola, terdapat pula unsur galat atau kerandoman. Data merupakan fungsi dari tren-siklus, musiman dan galat. Galat ini dianggap merupakan perbedaan antara pengaruh gabungan dari tiga sub-pola runtun tersebut dengan data yang sebenarnya.
Penulisan matematis umum dari pendekatan dekomposisi aditif adalah:
adalah nilai runtun waktu (data yang aktual) pada periode t adalah komponen tren pada periode t
adalah komponen siklus pada periode t adalah komponen musiman pada periode t
adalah komponen Ireguler/ tidak teratur pada periode t
1. Tren ( )
Tren adalah pergerakan naik turun suatu keadaan dalam jangka panjang. Tren merupakan gerakan yang lamban, panjang, dan menuju ke satu arah. Pergerakan tren dapat naik, turun bahkan konstan. Data runtun waktu menunjukkan adanya kecenderungan untuk naik atau turun dalam jangka waktu yang cukup panjang. Pola ini diidentifikasi sebagai tren, interpretasi lain dari tren adalah pola yang mendasari data yang berlangsung selama bertahun-tahun.
Gambar 2.11 pola tren
Garis tren seperti yang ditunjukkan pada gambar 2.10 dapat dijelaskan dengan dua parameter dan dalam bentuk
Dengan
∑ ∑ ∑ ∑
∑
∑ ∑
2. Musiman ( )
Variasi musiman merupakan pergerakan suatu keadaan yang berlangsung secara periodik/ berulang dalam jangka waktu satu tahun, yang disebut pula dengan tren musiman dan akan berulang dalam setiap tahunnya. Contoh nyata gejala variasi musim adalah adanya kecenderungan meningkatnya permintaan yang diikuti oleh peningkatan harga beberapa komoditas tertentu, seperti telur, daging, dan sayuran setiap kali mendekati perayaan hari raya keagamaan yang akan berulang secara periodik setiap tahunnya. Besarnya nilai variasi musiman ini dinamakan sebagai indeks musiman.
Gambar 2.12 pola musiman
Salah satu contoh yang memuat komponen musiman adalah gelombang sinus, secara matematis dapat ditulus sebagai:
[( ) ]
Dengan adalah amplitudo
adalah jumlah periode yang diamati adalah sudut fase (dalam radian)
3. Siklus ( )
Variasi siklus merupakan pergerakan tren yang meningkat ataupun menurun dalam jangka yang relatif panjang dari pada variasi musiman. Pola siklus biasanya terjadi dalam kurun waktu lebih dari satu tahun. Sehingga pola siklus tidak perlu dimasukkan dalam ramalan jangka pendek. Pola ini amat berguna untuk peramalan jangka menengah dan jangka panjang. Seperti siklus bisnis, aktivitas sosial-ekonomi secara bergantian berkembang.
Gambar 2.13 pola siklus
4. Tak beraturan / irregular ( )
dalam rangka menentukan persediaan pengaman untuk mengantisipasi kekurangan persediaan bila terjadi lonjakan permintaan.
Gambar 2.14 pola tak beraturan
L. Model Autoregressive Integrated Moving Average (ARIMA)
ARIMA telah banyak dikembangkan lebih lanjut dan ditetapkan untuk peramalan. Pendekatan yang digunakan di dalam menetapkan pola runtun waktu yang demikian, beserta metodologi yang digunakan untuk mengekstrapolasi pola-pola tersebut untuk masa yang akan datang lebih didasarkan pada teori statistika yang telah dikembangkan dengan baik. Model ARIMA adalah gabungan dari model AR dan MA nonstasioner yang telah di differencing sehingga menjadi model yang stasioner.
1. Model Autoregressive (AR)
(2.15)
Dengan
= data runtun waktu ke-t
= koefisien autoregressive, i : 1,2,3,…….,p
= nilai galat pada waktu ke-t p = orde AR
Persamaan (2.15) dapat ditulis dengan menggunakan operator B (langkah mundur):
Orde AR yang sering digunakan dalam analisis runtun waktu adalah orde 1 dan orde 2. Bentuk umum model AR(1) adalah , dengan operator langkah mundur dapat ditulis . Bentuk umum model AR(2) adalah , dengan operator langkah mundur dapat ditulis .
2. Model Moving Average (MA)
Model Moving Average orde q, dinotasikan dengan MA(q) atau ARIMA(0,0,q). Bentuk umum mode MA(q) adalah:
(2.16)
dengan
= parameter Moving Average (MA), i q q = orde MA
= nilai galat pada waktu ke-t
= nilai galat pada waktu
Persamaan (2.16) dapat ditulis dengan menggunakan operator langkah mundur:
Dalam praktiknya, dua kasus yang kemungkinan besar akan dihadapi adalah apabila q=1 dan q=2. Bentuk umum model MA(1) adalah , dengan operator langkah mundur dapat ditulis . Bentuk umum model MA(2) adalah , dengan operator langkah mundur dapat ditulis .
3. Model Autoregressive Moving Average (ARMA)
Model Autoregressive Moving Average (ARMA) merupakan gabungan model AR(p) dan MA(q). Bentuk umum ARMA(p,q) adalah:
= nilai galat pada waktu ke-t
4. Model Autoregressive Integrated Moving Average (ARIMA)
Model Autoregressive Integrated Moving Average (ARIMA) merupakan gabungan model AR(p), proses pembedaan dan MA(q). Dengan kata lain, apabila nonstasioneritas ditambahkan pada campuran proses ARMA maka model umum
terpenuhi. Bentuk umum dapat ditulis
menggunakan bentuk operator langkah mundur yaitu:
(2.18)
dengan
adalah operator langkah mundur untuk
AR (Autoregressive)
adalah operator langkah mundur untuk
MA (Moving Average)
adalah proses pembedaan orde ke-d
5. Model ARIMA dengan Komponen Musiman
Kerumitan yang dapat ditambahkan pada model ARIMA adalah komponen musiman. Notasi ARIMA dapat diperluas untuk menangani komponen musiman, notasi umumnya adalah
= bagian yang musiman dari model
untuk SMA (Seasonal Moving Average)
adalah proses pembedaan orde ke-d non musiman
adalah proses pembedaan orde ke-D musiman
M. Pengujian White-Noise
Keacakan galat dari suatu model dapat diuji menggunakan uji statistik Q Box-Pierce dengan hipotesis (Wei, 2006) sebagai berikut:
1. (galat acak yang memenuhi proses white noise)
2. dengan (galat tidak acak yang tidak memenuhi proses white noise)
4. Statistik uji
∑
5. Wilayah kritis:
diterima (galat acak yang memenuhi white noise) jika nilai
atau . Dengan m adalah jumlah lag, p adalah
orde AR dan q adalah orde MA. adalah derajat bebas. 6. Membuat kesimpulan
Selain menggunakn pengujian Q Box-Pierce, keacakan galat dapat dilihat dari plot ACF galat. Apabila pada plot ACF tidak ada lag yang melebihi garis signifikansi maka galat bersifat acak, seperti yang telah dijelaskan pada subbab D. Galat memenuhi proses white noise jika galat bersifat acak dan berdistribusi normal.
N. Evaluasi Model
Dalam banyak situasi peramalan, ketepatan dipandang sebagai kriteria penolakan untuk memilih suatu metode peramalan. Ketepatan merujuk kearah kebaikan model, yang pada akhirnya menunjukkan seberapa jauh model peramalan tersebut mampu memproduksi data yang telah diketahui. Untuk mengukur ketepatan model menggunakan Mean Square Error (MSE) sebagai berikut:
∑ ̂
dengan
n= banyaknya pengamatan
= nilai pengamatan pada waktu ke-t
̂ = nilai peramalan pada waktu ke-t
Model yang baik akan memiliki nilai MSE yang paling kecil.
Berikut akan dijelaskan cara memperoleh nilai dan dari persamaan
yang akan digunakan untuk pendugaan garis tren pada Bab III. Dengan asumsi terdapat data, persamaan regresi ̂ dapat diduga sedemikian sehingga meminimumkan jumlah kuadrat deviasi .
Dengan mendefinisikan
̂ , maka
53 BAB III
METODE DEKOMPOSISi KLASIK DAN METODE ARIMA
A. Pendahuluan
Metode dekomposisi termasuk pendekatan yang tertua. Metode ini digunakan pada awal abad ini oleh ahli ekonomi untuk mengenali dan mengendalikan siklus bisnis. Dasar dari metode dekomposisi muncul pada tahun 1920-an ketika konsep rasio-tren diperkenalkan. Sejak saat itu pendekatan dekomposisi telah digunakan secara luas baik oleh para ahli ekonomi ataupun para pengusaha.
B. Metode Dekomposisi Klasik
Langkah-langkah dekomposisi aditif untuk data runtun waktu adalah sebagai berikut:
1. Pada deret data yang sebenarnya ( ) hitung rata-rata bergerak yang panjangnya (N). Maksud dari rata-rata bergerak ini adalah menghilangkan unsur musiman dan kerandoman. Dengan cara merata-ratakan sejumlah periode yang sama dengan panjang pola musiman (misalnya 12 bulan, 4 bulan, atau 7 hari). Rata-rata bergerak merupakan penjumlahan dari , tetapi dalam sebagian besar prosedur dekomposisi menjadikan tren dan siklus sebagai komponen tunggal (sebut saja ).
2. Mengurangkan data asli ( ) dengan rata-rata bergerak untuk menghasilkan komponen musiman dan komponen acak/ tak beraturan.
3. Berdasarkan komponen data yang diperoleh dari , selanjutnya dicari rata-rata medialnya, yaitu nilai rata-rata untuk setiap bulan setelah dikeluarkan nilai terbesar dan terkecil.
4. Indeks musiman dapat diperoleh dari rata-rata medial, dengan menjumlahkan setiap rata-rata medial dengan faktor koreksi sehingga rata-rata musiman menjadi nol.
5. Mengurangkan data asli ( ) dengan indeks musiman ( ) untuk memperoleh garis tren. Garis tren dapat ditentukan berdasarkan model
∑ ∑ ∑ ∑ ∑
∑ ∑
Dengan = data asli yang telah dikurang indeks musiman = periode
= banyaknya data
6. Setelah diperoleh model, maka dapat dilakukan peramalan untuk periode selanjutnya menggunakan faktor-faktor yang telah diduga sebelumnya yaitu, faktor tren dan musiman.
C. Metode Autoregressive Integrated Moving Average (ARIMA)
Tahap-tahap dalam menentukan model ARIMA adalah: 1. Identifikasi Model
digunakan sudah stasioner atau belum. Cara mengetahui data sudah stasioner atau belum yaitu dengan membuat plot data runtun waktu atau dengan melihat plot ACF. Data dikatakan stasioner bila plot data runtun waktu berada di sekitar nilai rata-rata, variansi konstan, tidak terjadi kenaikan/ penurunan data dan plot ACF akan turun dengan cepat mendekati nol. Apabila data telah stasioner berarti
, tetapi jika data stasioner setelah pembedaan pertama maka d=1 dan seterusnya. Apabila data telah stasioner, langkah selanjutnya adalah menentukan orde dari AR dan MA. Cara yang dapat dilakukan adalah dengan melihat plot PACF dan plot ACF. Plot PACF akan menetukan orde dari AR sedangkan plot ACF akan menentukan orde dari MA. Secara ringkas ditampilkan dalam tabel.
Tipe Model Pola Tipikal ACF Pola Tipikal PACF AR(p) Menurun secara lambat menuju
nol
Terpotong setelah lag p MA(q) Terpotong setelah lag q Menurun secara lambat
menuju nol ARMA(p,q) Menurun secara lambat menuju
nol
Menurun secara lambat menuju nol
Pola tipikal ACF dan PACF ditampilkan dalam gambar berikut
Gambar 3.2 Pola PACF terpotong setelah lag 2
Gambar 3.3 Pola ACF terpotong setelah lag 1
Gambar 3.4 Pola PACF menurun secara lambat menuju nol
2. Pendugaan Parameter
Setelah menetapkan model sementara dari hasil identifikasi, yaitu menentukan nilai p, d, dan q, langkah berikutnya adalah melakukan pendugaan paramater Autoregressive (AR) dan moving average (MA) yang tercakup dalam model.
dan diasumsikan terdapat stasioneritas. sehingga persamaan (3.2) dapat ditulis
[ ] [ ] [ ] [ ] (3.3)
Mengacu pada teorema 2.4 dan persamaan (2.6) diperoleh
(3.4)
(3.5)
yang merupakan fungsi otokorelasi pada lag k dari proses AR (p).
Untuk dan dengan menggunakan syarat , dari fungsi otokorelasi maka persamaan (3.5) menjadi persamaan Yule-Walker yaitu
̂
Langkah pertama yang harus dilakukan adalah mencari penduga dan yaitu
b. Pendugaan Parameter model MA
Semua suku yang lain pada persamaan (3.7) hilang, karena adanya definisi
{ n
Jadi, persamaan (3.8) menjadi
(3.9)
Bila faktor dipisahkan, maka persamaan (3.9) menjadi
(3.10)
Persamaan (3.10) adalah variansi dari proses MA(q).
Secara umum untuk sebarang nilai , persamaan (3.7) menjadi
(3.11)
Bila persamaan (3.11) dibagi (3.10), akan menghasilkan
(3.12)
untuk semua nilai , maka fungsi otokorelasi pada lag dari proses MA(q) adalah
14 0 33 -0.03
Menghitung pendugaan dan bukanlah pekerjaan yang mudah, karena harus menggunakan algoritma Marquardt. Maka dari itu penulis menggunakan program dalam perhitungannya. Dengan menggunakan program R diperoleh nilai pendugaan yaitu ̂ dan ̂ . Dengan perintah program R
c. Pendugaan Parameter Model ARMA
Pendugaan parameter mode ARMA berkaitan dengan fungsi otokorelasi. Fungsi otokorelasi dari proses ARMA(p,q) dapat diperoleh dengan mengalikan model ARMA( ):
Mengacu pada teorema 2.4 dan persamaan (2.6), diperoleh
[ ] [ ]
[ ]
(3.15)
Karena [ ] untuk , sehingga
(3.16)
Jika kedua ruas dibagi , menurut definisi fungsi otokorelasi diperoleh
(3.17)
Agar lebih memahami pendugaan ARMA(p,q), perhatikan proses ARMA(1,1) berikut:
Model ARMA(1,1): , dengan mengalikan model ARMA(1,1) dengan dan dihitung nilai harapannya diperoleh
[ ] [ ] [ ] [ ]
Dengan menggunakan teorema 2.4 dan persamaan (2.6) diperoleh
Untuk
Substitusi pada persamaan (3.18), diperoleh
Substitusi yang telah diperoleh ke persasamaan (3.19)
Dengan menggunakan sifat otokorelasi untuk lag 1 untuk menduga ̂ yaitu
Jika kedua ruas dibagi , menurut definisi fungsi otokorelasi diperoleh
3 62 22 12
Dengan menggunakan perhitungan program R, diperoleh nilai pendugaan
AIC=323.08 AICc=325.88 BIC=332.74
3. Pemeriksaan Diagnostik
Setelah berhasil menduga nilai-nilai parameter dari model ARIMA yang ditetapkan sementara, selanjutnya perlu dilakukan pemeriksaan dignostik untuk membuktikan bahwa model tersebut cukup memadai (Makridakis, 1999). Pemeriksaan diagnostik dapat dilakukan dengan mengamati apakah galat dari model ARIMA yang telah diduga memenuhi proses white noise. Model dikatakan memadai jika galat memenuhi proses white noise yaitu galat bersifat acak dan berdistribusi normal. Pengujian yang digunakan dalam pemeriksaan diagnostik adalah:
a. Setelah pendugaan dilakukan, maka nilai galat dapat ditentukan. Jika nilai-nilai koefisien otokorelasi galat untuk berbagai time lag tidak berbeda secara signifikan (tidak signifikan) dari nol, maka galat bersifat acak sehingga memenuhi proses white noise.
b. Menggunakan statistik Q Box-Pierce, yang dihitung dengan rumus:
∑
Jika atau maka galat bersifat acak yang memenuhi proses white noise.
Jika galat tidak white noise maka model tidak memadai, ulangi lagi mulai langkah identifikasi model sampai akhirnya diperoleh model yang memadai. Pengujian ini digunakan untuk melihat apakah galat memenuhi proses white noise.
4. Peramalan
Tujuan dalam analisis runtun waktu adalah untuk meramalkan nilai masa depan. Tujuan peramalan adalah untuk menghasilkan ramalan optimum yang tidak memiliki galat atau sebisa mungkin galat yang kecil.
D.
Contoh 3.4 Runtun WaktuDiberikan 82 data pengamatan runtun waktu pada tabel 3.1 data asli di lampiran. Data akan diolah menggunakan metode dekomposisi klasik dan metode ARIMA. Selanjutnya akan dilihat keakuratan metode, sehingga model yang terbaik dapat ditentukan.
1. Pengolahan data menggunakan metode Dekomposisi
a. Data yang digunakan untuk dekomposisi adalah data yang berdistribusi normal. Data asli (lihat tabel 3.1 pada lampiran) tidak berdistribusi normal,
sehingga perlu dilakukan transformasi . Dengan adalah data asli dan . Cara mencari dengan menggunakan program R dengan perintah: >lambda= BoxCox.lambda(Xt). Berikut adalah
Tabel 3.1 data transformasi
Setelah data ditransformasi langkah selanjutnya adalah menghitung rata-rata bergerak 12 bulanan, yaitu dengan merata-ratakan data dari bulan Januari-Desember. Data yang telah dirata-rata, diletakkan pada bulan Juli atau pusat dari 12 bulanan.
b. Setelah rata-rata bergerak diperoleh, selanjutnya mengurangkan data asli
1992 0.53 0.35 -0.08 -0.05 -0.07 -0.20
c. Setelah komponen musiman dan kerandoman diperoleh, lalu mencari rerata medial dan indeks musiman.
Tabel 3.4 Rerata medial dan indeks musiman
garis tren. Garis tren dapat dihitung dengan rumus
diperoleh
Berikut adalah gambar data transformasi dan peramalan data transformasi.
Gambar 3.5 plot data transformasi dan data ramalan transformasi 2. Pengolahan data menggunakan metode ARIMA
Langkah-langkah yang digunakan adalah identifikasi model untuk menyelidiki apakah data telah stasioner, pendugaan parameter, dan uji kecocokan model. Langkah-langkah metode ARIMA dengan menggunakan program R dapat dilihat pada lampiran program metode ARIMA contoh 3.4.
a. Identifikasi Model
Stasioneritas dapat dilihat dari gambar 3.6 plot data asli.
Gambar 3.7 plot ACF
Dari gambar 3.6 terlihat data belum stasioner dalam variansi karena data ke-37 dan 49 sangat menonjol, sehingga data perlu ditransformasi. Transformasi
yang digunakan adalah transformasi , selanjutnya dicari nilai , dengan program R dengan perintah: >lambda= BoxCox.lambda(Xt), diperoleh
. Dilihat dari plot ACF pada gambar 3.7 menunjukkan adanya faktor musiman. Faktor musimannya adalah 12 bulanan, karena pola ACF selalu berulang setiap lag 12. Untuk ACF pola musiman turun secara lambat menuju nol.
Gambar 3.9 Plot PACF data transformasi
Gambar 3.10 Plot ACF data transformasi
memperhatikan plot PACF dan ACF data transformasi (gambar 3.9 dan gambar 3.10). Dari plot PACF non musiman data terpotong pada lag 1, plot PACF musiman data terpotong pada lag 1, plot ACF non musiman data terpotong pada lag 1, dan plot ACF musiman data terpotong pada lag 3.
Ada beberapa kemungkinan model
d) Model ARIMA
SAR 1 konstan Koefisien 0.6745 4.3636 SE koefisien 0.0837 0.0727
c. Uji Kecocokan Model
Langkah selanjutnya adalah uji white noise yaitu dengan menguji keacakan galat dan uji normalitas galat. Uji keacakan galat dengan melihat plot ACF galat dan uji normalitas dengan uji Kolmogorov-Smirnov dengan .
Secara ringkas, uji kecocokan model disajikan dalam tabel 3.6
Tabel 3.6 Rangkuman uji kecocokan model
Model Galat
Arima(0,0,0)(1,0,0)12 Tidak Tidak 0.050
Substitusikan parameter ̂ ̂ pada persamaan ( ̂ ) ( ̂ ) , diperoleh:
Berikut adalah gambar data transformasi dan peramalan data transformasi
Gambar 3.11 Plot data transformasi dan data ramalan transformasi
3. Evaluasi Model
Pada tahap ini akan dicari model yang lebih baik, yaitu dengan mempehatikan nilai dari MSE metode dekomposisi klasik dan MSE metode ARIMA.
Model MSE
Nilai MSE diperoleh dari ∑ ̂
, dengan adalah data
transformasi, ̂ adalah data ramalan transformasi dan banyaknya data.
̂ untuk metode dekomposisi diperoleh dengan menjumlahkan indeks musiman dan tren. Sedangkan untuk metode ARIMA ,
̂ adalah galat yang diperoleh menggunakan program R dengan perintah: >estimasi=Arima(dataTransformasi,order=c(0,0,1),seasonal=list(order=c(1,0,0), period=12))
>galat= residuals(estimasi)
81 BAB IV
PERBANDINGAN METODE DEKOMPOSISI KLASIK DAN METODE ARIMA
Pada bab ini akan dibahas perbandingan metode dekomposisi klasik dan metode ARIMA dengan studi kasus data jumlah total penumpang kereta api Jawa dan Sumatera. Data berasal dari Biro Pusat Statistik dilihat di http://www.bps.go.id/linkTabelStatis/view/id/1417#.
A Pengolahan Data Menggunakan Metode Dekomposisi Klasik
2012 -58.92 -115.25 -74.67 -105.33 -62.17 -138.17 2013 442.75 516.00 450.33 584.17 492.33 572.92 2014 404.83 298.67 232.67 369.25 388.08 410.17 2015 296.33
2. Mengurangkan data asli ( ) dengan rata-rata bergerak untuk menghasilkan komponen musiman dan kerandoman/ tak beraturan
Tabel 4.3 Pengurangan data asli ( ) dengan rata-rata bergerak
3. Berdasarkan komponen data yang diperoleh dari , selanjutnya dicari rata-rata medialnya. Rata-rata medial adalah nilai rata-rata untuk setiap bulan setelah dikeluarkan nilai terbesar dan terkecil.
Tabel 4.4 Rerata medial dan indeks musiman Rerata garis tren. Garis tren dapat dihitung dengan rumus
Sehingga diperoleh garis tren
Berikut adalah plot data dengan peramalan
Gambar 4.1 plot data dan data peramalan
B Pengolahan Data Menggunakan Metode ARIMA
Ada beberapa tahap yang dilakukan pada bagian ini, dimulai dari identifikasi model untuk pemerikasaan stasioneritas, pendugaan parameter, uji kecocokan model dan peramalan. Langkah-langkah metode ARIMA dengan menggunakan program R dapat dilihat pada lampiran program metode ARIMA jumlah penumpang kereta api.
1. Identifikasi Model
Gambar 4.2 Plot data asli jumlah penumpang Kereta Api
Gambar 4.4 Plot data hasil pembedaan pertama
Berdasarkan gambar 4.4 terlihat bahwa data telah stasioner terhadap rata-rata dan variansi, karena data berfluktuasi disekitar nilai rata-rata-rata-rata dan varianisi konstan. Setelah diperoleh data yang stasioner, langkah selanjutnya yang dilakukan adalah identifikasi model dengan cara melihat plot PACF dan ACF data yang telah dilakukan pembedaan.
Gambar 4.6 Plot ACF pembedaan pertama
Dilihat dari plot ACF gambar 4.6 data memuat faktor musiman yang turun secara lambat mendekati nol. Faktor musiman adalah musiman 12 bulanan, karena pola selalu berulang setiap lag 12. Dari plot PACF non musiman data terpotong setelah lag 1 ditulis AR(p=1), plot PACF musiman data terpotong setelah lag 1 ditulis SAR(P=1), plot ACF non musiman data terpotong pada lag 1 ditulis MA(q=1), dan plot ACF musiman data menurun secara lambat menuju nol ditulis SMA(Q=0) dan pembedaan orde pertama yaitu d=1. Dari plot PACF dan plot ACF diperoleh beberapa kemungkinan model.
Model
ARIMA(1,1,1)(1,0,0)12
ARIMA(1,1,0)(1,0,0)12
ARIMA(0,1,1)(1,0,0)12
2. Pendugaan Parameter
Setelah diperoleh beberapa kemungkinan model, langkah selanjutnya adalah menduga parameter.
a) Model ARIMA
AR 1 MA 1 SAR 1 Koefisien -0.3304 -1.0000 0.5973 SE koefisien 0.0895 0.0246 0.0770
b) Model ARIMA
AR 1 SAR 1 Koefisien -0.6305 0.6393 SE koefisien 0.0719 0.0726
c) Model ARIMA
MA 1 SAR 1 Koefisien -1.0000 0.6431 SE koefisien 0.0188 0.0725
d) Model ARIMA
SAR 1 Koefisien 0.6886 SE koefisien 0.0682
3. Uji Kecocokan Model
a. Model ARIMA
Gambar 4.7 Plot ACF galat model ARIMA
Berdasarkan plot ACF gambar 4.7, tidak ada lag yang melebihi garis putus-putus (garis signifikan). Hal ini menunjukkan bahwa galat bersifat acak. Untuk lebih tepatnya dapat menggunakan uji Box-Pierce. Lihat tabel dibawah
Tabel 4.6 Nilai Box-Pierce ARIMA
Lag 12 24 36 48
P-Value 0.8583 0.9346 0.9949 0.997
Berdasarkan Tabel 4.6 dan gambar 4.8 terlihat bahwa p-value untuk setiap lag yang diuji lebih besar dari sehingga diterima (galat bersifat acak). Selanjutnya dilihat apakah galat berdistribusi normal.
Gambar 4.9 plot normalitas galat
Dari plot normalitas galat, data berada disekitar garis dan menggunakan program spss diperoleh , yang berarti sehingga galat berdistribusi normal.
b. Model ARIMA
Berdasarkan plot ACF gambar 4.10, ada lag yang melebihi garis putus-putus (garis signifikan). Hal ini menunjukkan bahwa galat tidak bersifat acak. Untuk lebih tepatnya dapat menggunakan uji Box-Pierce. Lihat tabel dibawah
Tabel 4.7 Nilai Box-Pierce ARIMA
Lag 1 2 3 12
P-Value 0.005708 0,0003443 0,0007.331 0.005431
Gambar 4.11 plot Box-Pierce
Berdasarkan tabel 4.7 dan gambar 4.11 terlihat bahwa p-value untuk setiap lag yang diuji lebih kecil dari sehingga ditolak (galat tidak bersifat acak). Selanjutnya dilihat apakah galat berdistribusi normal.
Dari plot normalitas, data berada disekitar garis dan menggunakan program spss diperoleh , yang berarti sehingga galat berdistribusi normal.
c. Model ARIMA
Gambar 4.13 Plot ACF galat model ARIMA
Berdasarkan plot ACF gambar 4.13 ada lag melebihi garis putus-putus (garis signifikan). Hal ini menunjukkan bahwa galat tidak bersifat acak. Untuk lebih tepatnya dapat menggunakan uji Box-Pierce lihat tabel dibawah
Tabel 4.8 Nilai Box-Pierce ARIMA
Lag 1 2 3 4
Gambar 4.14 plot Box-Pierce
Berdasarkan tabel 4.8 dan gambar 4.13 terlihat bahwa untuk lag yang diuji
sehingga ditolak (galat tidak bersifat acak). Selanjutnya dilihat apakah galat berdistribusi normal
Gambar 4.15 plot normalitas galat
d. Model ARIMA
Gambar 4.16 Plot ACF galat model ARIMA
Berdasarkan plot ACF gambar 4.16, ada lag yang melebihi garis putus-putus (garis signifikan). Hal ini menunjukkan bahwa galat tidak bersifat acak. Untuk lebih tepatnya dapat menggunakan uji Box-Pierce. Lihat tabel dibawah
Tabel 4.9 Nilai Box-Pierce ARIMA
Lag 1 2 12 24
P-Value
Gambar 4.17 plot Box-Pierce
Selanjutnya dilihat apakah galat berdistribusi normal.
Gambar 4.18 plot normalitas galat
Dari plot normalitas, data berada disekitar garis dan menggunakan program diperoleh , yang berarti sehingga galat berdistribusi normal.
Secara ringkas, uji kecocokan model disajikan dalam tabel 4.10 Tabel 4.10 Rangkuman uji kecocokan model
Model Galat
Acak Normal ARIMA Ya Ya ARIMA Tidak Ya ARIMA Tidak Ya ARIMA Tidak Ya
Dari tabel ringkasan, dapat dilihat bahwa model yang dipilih adalah model yang memenuhi asumsi white noise yaitu galat bersifat acak dan berdistribusi normal. Sehingga model ARIMA adalah model yang dipilih untuk evaluasi model.
( ̂ )( ̂ ) ( ̂ )
Pendugaan parameter , yakni, ̂ ,
̂ dan ̂ . Substitusi parameter ke dalam persamaan,
sehingga diperoleh
Gambar 4.19 plot data dan data peramalan
C. Evaluasi Model
Model MSE ARIMA (1,1,1)(1,0,0)12 822631.997
Dekomposisi klasik 627481.728
Dilihat dari nilai MSE, metode dekomposisi memiliki nilai MSE lebih kecil dibandingkan dengan metode ARIMA (1,1,1)(1,0,0)12. Sehingga metode yang