• Tidak ada hasil yang ditemukan

Achmad Mauludiyanto (1) , Gamantyo Hendrantoro (1) , Mauridhi Hery P (1) , Suhartono (2)

Dalam dokumen Prosiding.Seminar.Radar.Nasional.2009 (Halaman 71-76)

(1)

Jurusan Teknik Elektro, FTI

(2)

Jurusan Statistik, FMIPA

Institut Teknologi Sepuluh Nopember Surabaya Email : {maulud,gamantyo}@ee.its.ac.id

ABSTRAK

Tujuan dari makalah ini adalah untuk memberikan hasil kajian optimasi pemodelan ARIMA dengan efek deteksi outlier pada data curah hujan di Surabaya. Proses pemodelan dilakukan dengan menggunakan program SAS. Tahap awal dari pemodelan ARIMA adalah identifikasi stasioneritas data, baik dalam mean dan varians, dan identifikasi bentuk ACF dan PACF dari data yang sudah stasioner untuk menentukan orde model ARIMA dugaan. Tahapan selanjutnya adalah estimasi parameter dengan metode MLE (Maximum Likehood Estimation) dan evaluasi signifikansi parameter melalui uji statistik t. Jika hasil uji t pada suatu parameter menunjukkan nilai p-value yang lebih kecil dari 0,05 (level signifikansi pengujian) maka parameter tersebut adalah signifikan dan perlu dipertahankan dalam model ARIMA. Sebaliknya, jika hasil uji t menunjukkan bahwa parameter tidak signifikan maka dilakukan eliminasi parameter atau orde dari model ARIMA dugaan.Tahap terakhir adalah cek diagnosa untuk mengetahui kesesuaian model dan deteksi outlier. Hasil lengkap tentang proses deteksi outlier dan jenis outlier menunjukkan bahwa terdapat 4 outlier pada data yang sangat mempengaruhi akurasi prediksi. Secara umum hasil kajian menunjukkan proses deteksi outlier secara iteratif dan otomatis pada suatu model ARIMA menghasilkan nilai MSE (Mean Square Error) yang lebih kecil dibanding dengan metode yang tidak coba-coba, yaitu penurunan nilai MSE sebesar 44%. Sebagai rekomendasi dari pemodelan ARIMA pada data curah hujan atau pada data time series lainnya sebaiknya digunakan metode deteksi outlier secara otomatis agar mendapatkan MSE yang maksimal.

Kata kunci : model ARIMA, deteksi outlier, MLE, MSE.

1. PEDAHULUAN

Curah hujan merupakan faktor utama yang mempengaruhi redaman hujan pada gelombang milimeter. Gelombang milimeter adalah gelombang radio yang bekerja diatas frekuensi 10 GHz. Nilai redaman hujan adalah sebanding dengan redaman spesifik dikalikan panjang link, sedangkan redaman spesifik sebanding dengan curah hujan. Jika diasumsikan panjang link 1 km maka besar redaman hujan akan bergantung pada curah hujan untuk frekuensi tertentu. Karena itu perlu ditinjau bagaimana model curah hujan yang terjadi setiap saat. Dengan mengetahui model curah hujan, maka dapat ditentukan model redaman hujan.

Pemodelan curah hujan sudah banyak dilakukan dalam beberapa penelitian, antara lain dengan model AR(Autorgressive) [1], model ARMA

(Autoregressive Moving Average) [2,3] dan model

ARIMA (Autoregressive Integrated Moving

Average) [4]. Keluarga model ARMA hanya

berlaku khusus pada data stasioner dan tidak berlaku pada data non-stasioner. Sedangkan model

ARIMA adalah model yang dapat digunakan untuk

data yang tidak stasioner dalam mean.

Pada model AR pada [1] sudah cukup baik dibandingkan dengan data di Barcelona seperti

ditunjukkan dengan kurva CCDF (Compliment Cummulative Distribution Function) dari ditribusi lognormal, dan kurva dari fungsi autokorelasi ternormalisasi. Namun model AR ini hanya baik untuk rainrate kurang dari 20 mm/h, seperti ditunjukkan oleh kurva CCDF durasi curah hujan melampaui threshold kurang dari 40 mm/h. Sedangkan untuk threshold melebihi 40 mm/h model AR sangat jauh dari data ukur di Barcelona.

Model ARMA [2,3] hanya dapat digunakan untuk data deret waktu yang stasioner, sehingga tidak dapat memodelkan data curah hujan yang tidak stasioner. Karena itu maka diperlukan suatu langkah sehingga data tak stasioner menjadi stasioner yang terdapat pada model ARIMA yaitu proses differencing data.

Model ARIMA [4] sudak dapat memodelkan data tak stasioner, namun model ini belum menunjukkan uji statistik yang diperlukan untuk melihat suatu model sudah signifikan. Oleh karenanya pada makalah ini akan ditunjukkan langkah-langkah yang diperlukan untuk model ARIMA dari data curah hujan 1 even, sekaligus akan ditunjukkan uji statistik yang diperlukan.

Prosedur Box-Jenkins yang terdiri dari tahap identifikasi, estimasi parameter, dan cek diagnosa merupakan prosedur standar yang banyak

63

digunakan dalam pemodelan ARIMA. Tahap identifikasi berkaitan dengan evaluasi stasioneritas data dan identifikasi bentuk ACF (Autocorrelation

Function) dan PACF (Partial Autocorrelation

Function) dari data yang sudah stasioner. Inferensi transformasi Box-Cox adalah salah satu uji yang dapat digunakan untuk mengevaluasi stasioneritas data dalam varians. Nilai λ=1 pada hasil transformasi Box-Cox menunjukkan data sudah stasioner dalam varians. Bentuk ACF dan PACF dari data yang sudah stasioner digunakan untuk mendapatkan dugaan orde model ARIMA.

Tahap selanjutnya adalah estimasi parameter model ARIMA dugaan. Pada tahap ini dilakukan evaluasi signifikansi parameter yang telah diestimasi melalui uji statistik t. Parameter model adalah signifikan jika p-value dari uji t kurang dari level signifikansi pengujian (misal 0,05). Tahap cek diagnosa dilakukan untuk mengetahui kesesuaian model ARIMA yang telah diperoleh. Beberapa uji yang digunakan pada tahap ini adalah uji Ljung- Box untuk evaluasi apakah residual sudah memenuhi syarat white noise dan uji Kolmogorov- Smirnov untuk mengetahui normalitas data [5].

Penelitian ini akan menggunakan software SAS dalam pemodelan ARIMA dan deteksi outlier [6]. Pemodelan ARIMA mencakup tiga tahapan utama, yaitu identifikasi, estimasi, dan cek diagnosa. Tahapan selanjutnya yang diuraikan dalam makalah ini adalah cara mendeteksi outlier dan implikasinya terhadap akurasi ketepatan model. Secara umum, tujuan penulisan makalah ini adalah mendapatkan suatu model curah hujan yang tepat dan handal. Ukuran ketepatan model ditunjukkan dengan kriteria atau besaran statistik yang biasa digunakan dalam analisa statistik terhadap persoalan pengukuran di lapangan, seperti hasil ukur curah hujan.

2. METODOLOGI

Sumber data yang digunakan untuk pemodelan mengacu pada makalah [7]. Untuk pemodelan digunakan data curah hujan yang terjadi pada 1 Maret 2007.

Model yang akan digunakan seperti flowchart pada makalah [8]. Pada metode ini langkah-langkah perbaikan sistem dilakukan dengan manual (satu persatu memasukkan efek outlier dengan coba- coba) sehingga MSE menurun.

Seperti pada [8], pada tahap awal dilakukan transformasi log-natural pada data asli untuk memenuhi stasioner data dalam varians. Selanjutnya dilakukan differencing pada data transformasi agar memenuhi data yang stasioner dalam mean. Identifikasi ACF dan PACF dari data yang sudah stasioner dalam mean dan varians digunakan untuk mendapatkan orde model ARIMA dugaan.

Tahap selanjutnya adalah identifikasi, estimasi dan cek diagnosa model ARIMA, serta deteksi outlier. Pada tahap identifikasi menunjukkan data hasil transformasi log-natural belum stasioner dalam mean, sehingga perlu dilakukan differencing. Hasil differencing d=1 menunjukkan bahwa data telah stasioner. Model dugaan yang diperoleh pada tahap ini adalah AR(2), sehingga secara lengkap model yang diduga adalah ARIMA(2,1,0).

Gambar 1: Alur model dengan efek outlier

Model lain yang disampaikan pada makalah ini seperti pada diagram pada gambar 1 disebut dengan metode B. Metode ini memberikan fasilitas pemodelan ARIMA dan deteksi outlier secara otomatis dengan jumlah outlier yang ditentukan terlebih dahulu. Penggunaan fasilitas pemodelan ini dapat menghindari terjadinya ‘spurious outlier’, dan meminimalisasi terjadinya outlier yang terdeteksi berulang-ulang.

3. HASIL ANALISA

Pada bagian ini studi kasus penelitian diambil satu contoh data, yaitu akan diberikan hasil pemodelan dan analisis data. Sebagai data curah hujan yang terjadi pada 1 Maret 2007. Bentuk grafik curah hujan pada 1 Maret 2007 seperti pada [8]. Berikut adalah hasil setiap tahapan pemodelan ARIMA dan deteksi outlier.

a) Output model ARIMA(2,1,0) dan deteksi 4 outlier

Ada tiga output utama sebagai hasil dari pemodelan ARIMA dan deteksi outlier. Bagian pertama adalah output tentang hasil estimasi

MLE(Maximum Likehood Estimation) model

ARIMA dugaan, kedua adalah hasil cek diagnosa, dan ketiga adalah hasil deteksi outlier.

Output menunjukkan bahwa parameter model ARIMA(2,1,0) dugaan adalah signifikan, yang berarti sudah memenuhi syarat kebaikan model. Hasil cek diagnosa melalui uji Ljung-Box menunjukkan bahwa model ARIMA(2,1,0) telah memenuhi syarat white noise, yang berarti bahwa model sudah sesuai.

Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t = 237, 153, 76, dan 192. Jenis outlier yang teridentifikasi ada dua macam, yaitu outlier additive pada data t = 237, dan 192, dan outlier level shift pada pengamatan t = 153, dan 76. Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek satu per satu dari keempat outlier yang terdeteksi tersebut.

b) Model ARIMA(2,1,0) dengan memasukkan

efek outlier additive di t = 237, dan deteksi 3 outlier lain

Berikut ini adalah hasil estimasi parameter model dengan memasukkan efek outlier di t = 237, khususnya nilai MSE dan deteksi 3 outlier yang lain. Output menunjukkan bahwa MSE model mengalami penurunan yang signifikan dibanding model ARIMA sebelumnya, yaitu dari 0,307514 menjadi 0,153795.

Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t = 153, 91, dan 76. Jenis outlier yang teridentifikasi ada dua macam, yaitu outlier additive pada data t = 91 dan outlier level shift pada pengamatan t = 153, dan 76. Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek satu per satu dari 3 outlier yang terdeteksi tersebut.

c) Model ARIMA(2,1,0) dengan memasukkan

efek 2 outlier pertama, dan deteksi 2 outlier yang lain

Hasil estimasi parameter model ARIMA(2,1,0) dengan memasukkan 2 efek outlier di t = 237, dan 153, khususnya nilai MSE serta deteksi 2 outlier yang lain. Output menunjukkan bahwa ada penurunan nilai MSE dibanding model sebelumnya, yaitu dari 0,153795 menjadi 0,143494.

Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t = 76, dan 194. Jenis outlier yang teridentifikasi ada satu macam, yaitu outlier shift pada pengamatan t = 76, dan 194. Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek satu per satu dari 2 outlier yang terdeteksi tersebut.

d) Model ARIMA(2,1,0) dengan memasukkan

efek 3 outlier pertama, dan deteksi 1 outlier yang lain

Seperti pada bagian sebelumnya, berikut ini adalah hasil estimasi parameter model dengan memasukkan efek 3 outlier di t = 237, 153 dan 76, khususnya nilai MSE(Mean square error) dan deteksi 1 outlier yang lain. Dari output MLE dapat dijelaskan bahwa ada penurunan nilai MSE dibanding model sebelumnya, yaitu dari 0,143494 menjadi 0,137983.

Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t = 194. Jenis outlier yang teridentifikasi ada satu macam, yaitu outlier shift pada pengamatan t = 194. Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek satu per satu dari 1 outlier yang terdeteksi tersebut.

e) Model ARIMA(2,1,0) dengan memasukkan

efek 4 outlier

Hasil estimasi parameter model ARIMA(2,1,0) dengan memasukkan efek 4 outlier di t = 237, 153, 76, dan 194, khususnya nilai estimasi dan hasil pengujian signifikansi parameter tersebut.

Hasil ouput ini menunjukkan bahwa nilai estimasi ML (Maximum Likehood) untuk AR-2 adalah tidak signifikan, karena Pr.⎜t⎜>0,05. Model ini juga menunjukkan adanya penurunan nilai MSE, yaitu dari 0,137983 menjadi 0,132305. Langkah selanjutnya adalah mengeliminasi koefisien AR-2, karena koefisien tersebut tidak signifikan.

f) Model ARIMA(1,1,0) dan ARIMA(0,1,1)

dengan memasukkan efek 4 outlier.

Hasil estimasi parameter model ARIMA(1,1,0) dengan memasukkan efek 4 outlier di t = 237, 153, 76, dan 194, adalah sebagai berikut. Hasil menunjukkan bahwa model ARIMA(1,1,0) dengan efek 4 outlier memberikan nilai estimasi parameter yang semuanya signifikan. Perbandingan nilai MSE menunjukkan bahwa MSE model ini (0,132828) lebih besar dibanding model sebelumnya (0,132305).

Pada bagian selanjutnya akan dicobakan model ARIMA yang lain, yaitu model ARIMA(0,1,1),

65

dengan memasukkan efek dari keempat outlier sebelumnya. Berikut ini adalah hasil estimasi dan uji signifikansi parameter model.

Hasil pada output MLE menunjukkan bahwa model ARIMA(0,1,1) dengan efek 4 outlier memberikan nilai estimasi parameter model yang semuanya signifikan. Perbandingan nilai MSE menunjukkan bahwa MSE model ini (0,134258) lebih besar dibanding model sebelumnya (0,132305)

Perbandingan lengkap berkaitan dengan akurasi prediksi yang ditunjukkan oleh nilai MSE dari model-model yang telah dicobakan secara lengkap dapat dilihat pada tabel 1. Dari tabel 1 dapat dijelaskan bahwa model ARIMA(2,1,0) menghasilkan nilai MSE yang paling kecil. Namun karena ada parameter model yang tidak signifikan pada level pengujian 0,05, maka model ini tidak dipilih sebagai model terbaik untuk prediksi data curah hujan. Dengan demikian, model yang dipilih sebagai model terbaik untuk prediksi data curah hujan adalah model ARIMA (1,1,0) dengan memasukkan efek 4 outlier yang telah teridentifikasi, dengan MSE sebesar 0,132828. Pemilihan model ARIMA(1,1,0) ini juga didukung oleh besaran SBC (Schwarz Bayesian Criterion), yang menunjukkan bahwa SBC terkecil pada model ARIMA(1,1,0).

Nilai MSE pada ARIMA(1,1,0) adalah sebesar 0,132828, sedangkan MSE pada ARIMA(0,1,1) sebesar 0,134258. Jadi model ARIMA(1,1,0) lebih baik jika dibandingkan model ARIMA(0,1,1), dengan perbaikan penurunan MSE sebesar 1,1%. Hasil perbandingan di atas juga menunjukkan bahwa MSE pada model ARIMA(1,1,0) dengan SAS jika dibandingkan dengan nilai MSE dari model ARIMA(2,1,0) dengan metode A mengalami perbaikan penurunan MSE, yaitu sebesar 44%.

Pada tabel 1 ditunjukkan hasil estimasi parameter dari beberapa model yang diperoleh. Terlihat pada tabel 1 model dengan MSE paling kecil terjadi pada model 7. Dengan demikian, model terbaik yang diperoleh pada data curah hujan ini adalah model ARIMA(1,1,0) dengan deteksi 4 outlier, yang secara matematis dapat ditulis dalam bentuk :

LnY(t) = –0,3942 LnY(t–1) – 5,10536 X1(t) + 1,61283 X2(t) +

1,09859 X3(t) + 1,06430 X4(t).

4. KESIMPULAN

Berdasar hasil analisis dan pembahasan pada bagian sebelumnya, ada beberapa kesimpulan yang dapat diperoleh dari penelitian ini, antara lain :

Model terbaik diperoleh dengan metode deteksi outlier secara otomatis menghasilkan nilai MSE yang signifikan lebih kecil dibandingkan dengan hasil pemodelan dengan metode deteksi outlier

secara coba-coba (trial and error). Hal ini disebabkan karena metode deteksi outlier secara otomatis lebih fleksibel untuk deteksi outlier, yaitu dapat digunakan pada model ARIMA(p,d,q) secara umum, sedangkan metode coba-coba (trial and error) hanya dapat dipakai untuk deteksi outlier hanya pada model ARIMA(p,d,0).

Model yang sesuai untuk data studi kasus, yaitu data curah hujan adalah model ARIMA(1,1,0) dengan memasukkan efek 4 outlier yang terdeteksi. Perbandingan akurasi prediksi model menunjukkan bahwa model ARIMA(1,1,0) dengan efek 4 outlier tersebut berhasil menurunkan nilai MSE sampai 44% jika dibandingkan dengan hasil metode coba- coba (trial and error).

Sebagai rekomendasi dari pemodelan ARIMA pada data curah hujan atau pada data time series lainnya sebaiknya digunakan metode deteksi outlier secara otomatis agar mendapatkan MSE yang minimal. Dengan MSE yang minimal maka residu data akan menunjukkan white noise distribution(residu dengan distribusi normal).

DAFTAR REFERENSI

[1.] Hendrantoro,G., Mauludiyanto,A., Handayani,P., An Autoregressive Model For

Simulation Of Time-Varying Rain Rate,

ANTEM 2004/URSI, July 20-23, Ottawa, Canada.

[2.] Yadnya, M.S., Mauludiyanto, A., Hendrantoro, G., “ARMA Modelling from rain rate Measurement to Simulation Communication Channel Modelling for Millimeter Wave in

Surabaya”, The 6th Kumamoto University

Forum, November 5-6, 2008, Surabaya, Indonesia

[3.] Yadnya, M.S., Mauludiyanto, A., Hendrantoro,

G., “Pemodelan ARMA untuk Curah Hujan di

Surabaya”, Prosiding SITIA, Mei 2008,

Jurusan Teknik Elektro, ITS.

[4.] Mauludiyanto, A., Hendrantoro, G., Kalfarosi, D., “Pemodelan Curah dan Redaman Hujan dengan Model ARIMA Sebagai Evaluasi Sistem

Radio Gelombang Milimeter”, submit ke

Jurnal Penelitian dan Pengembangan Telekomunikasi, PPLMI, Institut Teknologi Telkom, Oktober 2008.

[5.] Iriawan, N., Astuti, S.P., “Mengolah Data Statistik dengan Mudah Menggunakan Minitab 14”, Andi Yogyakarta, 2006.

[6.] Brocklebank, J.C., Dickey,D.A., “SAS for Forecasting Time Series”, SAS Institute and Wiley, 2003.

[7.]Mauludiyanto,A,, Muriani, Markis,L., Hendrantoro,G., Matsushima,A., “Preliminary Results from the Study of Raindrop Size Distribution and Rainfall Rate in Indonesia for

the Development of Millimetre-Wave Systems

in Tropical Regions”, ISAP2007, August 20-

24, 2007 Niigata, Japan.

[8.] Mauludiyanto,A., Hendrantoro,G., Purnomo, M.H., Suhartono, “Pemodelan ARIMA dan

Deteksi Outlier Data Curah Hujan Sebagai Evaluasi Sistem Radio Gelombang Milimeter”,

submit ke JUTI (Jurnal Teknologi Informasi), FTI ITS Surabaya, Desember 2008.

Tabel 1: Perbandingan model ARIMA

Parameter AR Parameter outlier Model ARIMA (p,d,q) Jumlah Efek outlier MSE φ(p) X1 X2 X3 X4 Keterangan -0,50989 1 ARIMA (2,1,0) No outlier 0,307514 -0,21467 - - - - - 0.842 2 ARIMA

(2,1,0) 4 outlier 0,2358 - 0.335 - 5.69 1.80 1.70 - 0.369 Metode A pada [8]

-0,27073 3 ARIMA (2,1,0) 1 outlier 0,153795 -0,05976 -5,13394 - - - Outlier additive t= 237 -0,35469 4 ARIMA (2,1,0) 2 0utlier 0,143494 -0,09095 -5,10007 1,58436 - - Outlier additive t= 237, outlier shift t=153 -0,37228 5 ARIMA (2,1,0) 3 outlier 0,137983 -0,10854 -5,09044 1,60572 1,12548 - Outlier additive t= 237, outlier shift t=153, 76 -0,43174 6 ARIMA (2,1,0) 4 outlier 0,132305 -0,09097 -5,07242 1,66605 1,11896 1,06137 Outlier additive t= 237, outlier shift t=153, 76, 194 7 ARIMA (1,1,0) 4 outlier 0,132828 -0,39342 -5,10536 1,61283 1,09859 1,06430 Outlier additive t= 237, outlier shift t=153, 76, 194 8 ARIMA (0,1,1) 4 outlier 0,134258 0,35128 -5,110226 1,59036 1,13619 0,85941 Outlier additive t= 237, outlier shift t=153, 76, 194

Catatan : Model 2 mengacu pada metode A [8] Model 1,3-8 mengacu pada metode B

Desain dan Simulasi Transceiver Stepped Frequency Continuous

Dalam dokumen Prosiding.Seminar.Radar.Nasional.2009 (Halaman 71-76)