Analisis Sistem - ANALISIS DAN PERANCANGAN SISTEM

ANALISIS DAN PERANCANGAN SISTEM

3.2. Analisis Sistem

Analisis sistem dilakukan dengan beberapa tahap, yaitu pengumpulan data (data collection), persiapan data (preprocessing), proses pembentukan model peramalan (forecasting modeling) dengan ARIMA dan pemeriksaan ketepatan model peramalan (error determination), serta menampilkan data hasil peramalan (data visualization) berbasis website. Beberapa tahap tersebut dapat dilihat pada Gambar 3.1.

Gambar 3.1. Arsitektur Umum

Berdasarkan pada Gambar 3.1, maka Peramalan Produksi Telur Puyuh Dengan Menggunakan ARIMA (Autoregressive Integrated Moving Average) meliputi:

3.2.1. Tahap input

Data deret waktu bulanan produksi telur puyuh 6 tahun dari Januari 2015 sampai Desember 2020 yang tersimpan melalui website pada tabel pendataan di dalam database MySQL. Kemudian, diproses dengan menggunakan bahasa pemrograman Python (Lampiran 6). Setelah melalui tahap preprocessing data dibagi menjadi bagian, yaitu 4 tahun untuk data training dan 2 tahun untuk data testing.

3.2.2. Tahap preprocessing 1. Data Selection

Terdapat 6 variabel data pada tabel pendataan yang diolah untuk mencari nilai peramalan, yaitu id, tanggal, jumlah burung puyuh, jumlah telur puyuh bercorak, jumlah telur puyuh tidak bercorak dan total produksi telur puyuh. Masing-masing variabel diolah satu per satu untuk mencari nilai peramalan dengan tanggal menjadi index.

Tabel 3.2. Dataset Pendataan Sebelum Seleksi (3 Baris Teratas) Id Tanggal Jumlah

Tabel 3.3. Dataset Pendataan Sesudah Seleksi (3 Baris Teratas) Tanggal Jumlah

Tabel 3.4 merupakan data sampel untuk memperjelas bagaimana proses peramalan ARIMA modeling dengan mengambil 5 baris data total produksi telur puyuh dari tabel pendataan (Lampiran 2).

Tabel 3.4. Data Sampel Total Produksi Telur Puyuh Tanggal Total Produksi Telur

Puyuh

Data tanggal 01/06/2015 adalah data yang akan digunakan dalam pencarian peramalan dan validasi model sampel.

2. Data Cleaning

Dataset yang sudah diseleksi harus melalui proses EDA (Exploratory Data Analysis) supaya data sesuai untuk diolah. Prosesnya terdiri dari pemeriksaan dan pembersihan nilai kosong (missing value), apabila terdapat data kosong yang tidak terlalu banyak, maka diatasi dengan memperhitungkan nilai pengganti dengan mean (rata-rata), begitu juga apabila terdapat nilai nol (0) pada beberapa baris data yang disebabkan oleh kesalahan dalam pengisian data. Kemudian, penyesuaian tipe data yang digunakan.

Pada proses analisis peramalan, tipe data yang semula bertipe integer diubah menjadi float sebagaimana terlihat pada Tabel 3.5.

Tabel 3.5. Penyesuaian Tipe Data

Column Data Type

After Before

Tanggal datetime datetime

Jumlah burung puyuh integer float

Jumlah Telur puyuh Bercorak integer float

Jumlah Telur Puyuh Tidak Bercorak integer float

Total Produksi Telur Puyuh integer float

Berikut merupakan contoh penggantian nilai nol pada data sampel sebagaimana terlihat pada Tabel 3.4 dengan mean menggunakan persamaan 2.1 dan hasilnya dapat dilihat pada Tabel 3.6.

𝑋̅ = ^{∑ 𝑋}

𝑛

𝑋̅ = 83760 + 106020 + 100980 + 0 + 115200

5 = ⁴⁰⁵⁹⁶⁰

5 = 81192

Tabel 3.6. Data Sampel Sesudah Cleaning Tanggal Total Produksi Telur

Puyuh

3.2.3. Tahap ARIMA modeling

Dalam melakukan peramalan data deret waktu dengan ARIMA dibutuhkan beberapa tahap. Variabel jumlah burung puyuh, jumlah telur puyuh bercorak, jumlah telur puyuh tidak bercorak dan total produksi telur puyuh melalui tahap ARIMA modeling masing-masing untuk mencari nilai peramalan 2 tahun ke depan.

Berikut merupakan tahap-tahap peramalan dengan ARIMA modeling (Hyndman &

Athanasopoulos, 2021):

1. Model Identification

Model identification merupakan proses mengidentifikasi jenis data time series berdasarkan pola grafik data yang diolah apakah data constant, trend, seasonal atau cyclic dengan berdasarkan pada Gambar 2.4 di bab 2. Maka, dilihat pola grafik data actual keempat variabel data.

Gambar 3.2. Grafik Data Sampel

Sebagai contoh, pada Gambar 3.2 merupakan grafik data sampel yang mempunyai pola trend dilihat dari kenaikan atau penurunan data dalam suatu waktu.

Selanjutnya, mengetahui kestasioneran data yang dilihat dengan tiga cara (Juanda &

Junaidi. 2012). Pertama, data stasioner atau tidak stasioner dapat diketahui dari melihat pola grafik data aktual (data history) yang sebelumnya sudah dilakukan dan terlihat pada Gambar 3.2 menampilkan pola data trend yang berarti data tidak stasioner.

Kedua, melihat correlogram ACF (Autocorrelation Function) yang dapat memperkirakan data stasioner atau tidak stasioner. Ciri-ciri dari tampilan grafik data tidak stasioner adalah apabila pola grafik autokorelasi turun dengan linear atau lamban mendekati titik nol untuk beberapa waktu waktu (lag) sebagaimana terlihat pada Gambar 2.7 di Bab 2. Sebagai contoh, Gambar 3.3 merupakan tampilan correlogram ACF data sampel yang menunjukkan tampilan grafik data tidak stasioner.

Gambar 3.3. Correlogram ACF Data Sampel

Ketiga, Adfuller Test untuk lebih memastikan apakah benar bahwa data tidak stasioner. Dengan kriteria uji hipotesis 𝐻0 ditolak apabila nilai statistik uji Adfuller Test mempunyai nilai kurang dari nilai daerah kritik (tingkat signifikansi) atau 𝜌 − 𝑣𝑎𝑙𝑢𝑒 <

α (5% atau 0.05). Jika ditolak maka data time series dikatakan stasioner atau tidak mempunyai akar unit. Sebagai contoh, Gambar 3.4 merupakan hasil uji Adfuller Test data sampel.

Gambar 3.4. Hasil Uji Adfuller Test Data Sampel

Berdasarkan pada Gambar 3.4 terlihat bahwa nilai p-value data sampel yaitu 0.9986 dan nilai statistik uji ADF yaitu 1.9774. Dengan demikian, gagal menolak hipotesis nol (H0), karena nilai statistik uji ADF mempunyai nilai lebih dari nilai daerah kritik (titik signifikansi = 5%) atau p-value > 0.05, maka data mempunyai akar unit dan tidak stasioner.

2. Model Estimation

Model estimation merupakan proses untuk mencari model tentative (kandidat model terbaik sementara) pada data yang akan diramalkan. Pada proses sebelumnya yaitu model identification data sudah diketahui bahwa tidak stasioner. Oleh karena itu, dilakukan proses Differencing. Banyaknya proses Differencing sama dengan nilai orde d. Misalnya, terjadi sekali proses Differencing supaya data menjadi stasioner, berarti orde d = 1. Selesai dilakukan proses Differencing, dilakukan Adfuller Test lagi untuk memastikan data sudah benar stasioner.

Sebagai contoh, data sampel menjadi stasioner dalam sekali proses Differencing. Pada Tabel 3.7 ditampilkan proses Differencing pada data sampel berdasarkan pada persamaan 2.4.

Tabel 3.7. Proses Differencing Data Sampel Sesudah Cleaning Tanggal Total Produksi Telur

Puyuh Differencing

01/01/2015 83760 -

01/02/2015 106020 (106020 - 83760) = 22260

01/03/2015 100980 (100980 - 106020) = -5040

01/04/2015 81192 (81192 - 100980) = -19788

01/05/2015 115200 (115200 - 81192 ) = 34008

Proses mencari estimasi nilai orde p dan q dengan menggunakan korelogram PACF dan ACF dari data yang sudah stasioner. Sebagai contoh, misalnya pada Gambar 3.5 terlihat korelogram PACF dan ACF dari data sampel yang sudah stasioner untuk melihat cut off dan dying down. Berdasarkan pada Gambar 3.5 terlihat bahwa terjadi cut off dan dying down pada lag ke-0 dan ke-3. Dengan demikian, nilai orde p dan q = 0 atau 3 atau AR(0) atau AR(3) dan MA(0) atau MA(3). Sehingga, model tentative (model terbaik sementara) data sampel adalah ARIMA(0,1,0) ; ARIMA(0,1,3) ; ARIMA(3,1,0)

; ARIMA(3,1,3).

Gambar 3.5. Correlogram PACF dan ACF Data Sampel Sesudah Differencing

3. Model Evaluation

Pada proses sebelumnya yaitu model estimation sudah diketahui model tentative dari dataset yang akan diramalkan. Kemudian, pada tahap model evaluation dilakukan uji diagnostik model yang terbaik dengan indikator nilai Standard Error (SE) dan nilai Aikake’s Information Criterion (AIC) yang terkecil untuk dipilih melakukan peramalan.

Perhitungan dilakukan dengan bantuan fungsi auto.arima dalam Python (Lampiran 4).

Sebagai contoh, sudah diketahui model terbaik data sampel adalah ARIMA(3,1,0) yang nilai parameter-parameter model yang terlihat pada Tabel 3.8.

Tabel 3.8. Nilai Parameter-Parameter Model Data Sampel (Permisalan)

Parameter Koefisien e AIC

Proses sebelumnya yaitu model evaluation sudah diketahui model terbaik untuk keempat variabel data. Pada penelitian ini, data actual 2 tahun (Januari 2019 sampai Desember 2020) digunakan sebagai data validasi untuk melihat perbandingan data actual dengan data peramalan dan perhitungan nilai kesalahan peramalan dengan MAPE pada persamaan 2.17 yang kemudian diketahui apakah model yang terpilih mempunyai ketepatan kesalahan peramalan yang sesuai atau tidak. Jika hasil kesalahan peramalan tidak sesuai, maka dapat memilih model tentative yang lain hingga hasil

kesalahan peramalan sesuai. Apabila model sudah sesuai, selanjutnya dilakukan perhitungan peramalan data masa mendatang dan pada penelitian ini dilakukan perhitungan peramalan data mendatang sebanyak 2 tahun (Januari 2021 sampai Desember 2022) karena ARIMA sesuai untuk meramalkan data masa mendatang dalam jangka pendek (kurang dari 2 tahun) untuk keempat variabel data, yaitu peramalan jumlah burung puyuh, peramalan jumlah telur puyuh bercorak, peramalan jumlah telur puyuh tidak bercorak dan peramalan total produksi telur puyuh.

Untuk memperjelas bagaimana proses peramalan ARIMA, berikut merupakan contoh proses perhitungan peramalan untuk bulan selanjutnya, yaitu Juni 2015 dari data sampel secara manual dengan menggunakan persamaan 2.7.

Dimana:

= 0.343 (34008) + 0.263 (-19788) - 0.446 (-5040) + 1056.183

Sudah dilakukan perhitungan peramalan untuk bulan selanjutnya, yaitu Juni 2015 dan diperoleh hasil peramalan adalah 8708. Sebelumnya sudah diketahui data sampel bulan Juni 2015 adalah 118080 sebagaimana terlihat pada Tabel 3.4. Maka, perhitungan kesalahan peramalan menggunakan MAPE adalah sebagai berikut:

Dimana:

Dengan demikian, model ARIMA(3,1,0) pada data sampel mempunyai ketepatan kesalahan peramalan MAPE = 4,04% yang mana range MAPE 10 – 20%, maka kemampuan model peramalan baik. Maka, model dapat digunakan untuk perhitungan peramalan data masa mendatang.

3.2.4. Tahap sent data after modeling to web server

Sesudah memperoleh hasil peramalan data ke depan sesuai yang diinginkan, selanjutnya adalah menyimpan peramalan data masa mendatang ke dalam database dan data tersebut ditampilkan pada website yang sudah dibangun (Lampiran 6).

3.2.5. Tahap output

Data peramalan produksi telur puyuh 2 tahun ke depan (Januari 2021 sampai Desember 2022) yang divisualisasikan dalam bentuk tabel dan grafik (Data Visualization).

Dalam dokumen PERAMALAN PRODUKSI TELUR PUYUH BERDASARKAN DATA DERET WAKTU MENGGUNAKAN AUTOREGRESSIVE INTEGRATED MOVING AVERAGE SKRIPSI (Halaman 36-47)