1 PERAMALAN TINGKAT KEMATIAN INDONESIA AKIBAT COVID-19
MENGGUNAKAN MODEL ARIMA
Arman Haqqi Anna Zili, Selly Anastassia Amellia Kharis, dan Dian Lestari Fakultas MIPA, Universitas Indonesia, Depok, Jawa Barat, Indonesia Email: [email protected]; [email protected]; [email protected]
Artikel info Artikel history:
Diterima 29 Desember 2020
Diterima dalam bentuk revisi 09 Januari 2021 Diterima dalam bentuk revisi 18 Januari 2021
Keywords: death rate;
covid-19; corona virus;
indonesia; forecasting;
arima
Kata kunci: tingkat kematian; covid-19; virus corona; indonesia;
peramalan; arima
Abstract: This study aims to obtain important information in planning for a pandemic response, one of which is information related to deaths from this virus. This study tries to predict the death rate from the corona virus in Indonesia. This study uses data on Indonesia's deaths due to the corona virus from March 2020 to December 2020 to form the ARIMA model. Then use the ARIMA model to predict the death rate from the corona virus until January 2021. Use MAE to evaluate the accuracy of the prediction results, and the prediction result of MAE is 0.0007. It is hoped that the results of this prediction can be used by the government to formulate a corona virus pandemic plan.
Abstrak: Penelitian ini bertujuan untuk mendapatkan informasi penting dalam merencanakan penanggulangan pandemi, salah satunya adalah informasi terkait kematian akibat virus ini. Studi ini mencoba memprediksi angka kematian akibat virus corona di Indonesia. Studi ini menggunakan data kematian Indonesia akibat virus corona dari Maret 2020 hingga Desember 2020 untuk membentuk model ARIMA. Kemudian menggunakan model ARIMA untuk memprediksi angka kematian akibat virus corona hingga Januari 2021. Gunakan MAE untuk mengevaluasi keakuratan hasil prediksi, dan hasil prediksi MAE adalah 0,0007. Diharapkan hasil prediksi ini dapat digunakan pemerintah untuk merumuskan rencana pandemi virus corona.
Coresponden author:
Email: [email protected] artikel dengan akses terbuka dibawah lisensi CC BY Vol. 2 No. 1 Januari 2020
P-ISSN: 2723 - 6692 dan E-ISSN: 2723 - 6595
2 Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 Pendahuluan
Pada 31 Desember 2019, WHO mengetahui adanya sekelompok pasien pneumonia di Wuhan, Provinsi Hubei, China. Seminggu kemudian, pada 7 Januari 2020, pihak berwenang China mengonfirmasi bahwa mereka telah menetapkan bahwa virus corona baru adalah penyebab pneumonia. Nama sementara virus tersebut adalah 2019-nCoV. Sejak melaporkan kasus pertama infeksi, WHO dan mitranya telah bekerja dengan otoritas China dan pakar global untuk mempelajari lebih lanjut tentang virus tersebut, termasuk cara penularan, populasi berisiko tinggi, ruang lingkup penyakit klinis, serta deteksi dan pencegahan. Metode komunikasi interpersonal (COVID, 19 C.E.).
Sejak pertama kali ditemukan, virus telah menyebar dengan cepat, dan keadaan terkini menunjukkan bahwa kasus virus telah ditemukan hampir di semua negara. Organisasi Kesehatan Dunia telah mengidentifikasi bencana virus yang akhirnya dikenal sebagai Covid- 19 atau virus korona yang dikenal sebagai pandemi. Hingga 28 Desember 2020, dunia telah mencatat virus corona telah merenggut sekitar 1,58 juta nyawa. Sementara di Indonesia, kasus pertama infeksi virus corona terdeteksi pada Maret 2020. Sejak deteksi pertama infeksi ini, Indonesia telah kehilangan 21.452 kematian hingga 28 Desember 2020 (World Health Organization, 2020).
Para ahli sedang melakukan tindakan sigap di bidangnya masing-masing untuk menangani pandemi virus corona ini. Pakar kesehatan bergerak cepat untuk mencoba mengidentifikasi, menyembuhkan, dan mengembangkan vaksin untuk mencegah penyebaran virus (Booth & Tickle, 2008). Ilmuwan di bidang matematika, aktuaria, dan ilmu data mencoba memodelkan dan memprediksi penyebaran atau kematian virus. Ada Vasilis Papaste Vanopoulos dan sebagainya. Ah dari Universitas Patras (Harlianto et al., 2020), Yunani, yang mencoba meramalkan jumlah kasus aktif infeksi virus corona berdasarkan data corona dari beberapa negara dengan menggunakan beberapa model peramalan runtun waktu (time series) seperti TBAT dan ARIMA. Ada juga Navid Mashinci dari University of Denver, Amerika Serikat, yang mencoba meramalkan tingkat kematian (Mortality Rate) akibat virus corona berdasarkan data corona Amerika Serikat menggunakan model ARIMA (Auto Regressive Integrated Moving Average) (Wijianto et al., 2020).
Dalam studi ini, kami memperkirakan angka kematian orang Indonesia akibat virus corona berdasarkan data korona Indonesia yang diperoleh dari kawalcovid19 di situs Sinta.
ristekbrin.go.id/covid menggunakan model ARIMA. Kemudian menguji keakuratan model untuk memprediksi mortalitas dari beberapa data dengan nilai aktual yang diketahui (Salgotra et al., 2020). Gunakan MAE (Mean Absolute Error) antara nilai prediksi dan nilai sebenarnya dari data untuk mengevaluasi akurasi prediksi model. Kami berharap ke depan, hasil prediksi angka kematian akibat virus corona dapat digunakan pemerintah untuk merumuskan kebijakan terkait penanganan virus corona di Indonesia (Papastefanopoulos et al., 2020).
Metode Penelitian
Penelitian ini menggunakan data dari kawalcovid19
https://docs.google.com/spreadsheets/d/1ma1T9hWbec1pXlwZ89WakRkOfVUQZsOCFl4F wZxzVw/edit#gid=335196895) yang terlampir di situs http://sinta.ristekbrin.go.id/covid/.
Tampilan data tersebut dalam format microsoft excel ditunjukkan pada Gambar 1 berikut ini.
Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 3 Gambar 1. Data Corona Indonesia
Data yang digunakan dalam penelitian ini adalah data angka kematian semua kasus.
Di situs ini bisa disediakan data terkait virus corona di Indonesia mulai 2 Maret 2020 hingga 28 Desember 2020 atau ada 301 data per hari. Data tersebut ditunjukkan pada Gambar 2.
Gambar 2. Grafik Tingkat Kematian Indonesia Akibat Virus Corona Selama 301 hari
Namun sejak ditemukan kasus kematian pertama pada 12 Maret 2020, penelitian ini menggunakan data dari tanggal tersebut hingga 28 Desember 2020, atau terdapat 292 data per hari (12 Maret 2020). Sampai 28 Desember 2020). Penelitian ini menggunakan data time series yang dibaca setiap minggu atau setiap 7 hari, sehingga dari 292 data harian yang digunakan hanya 287 data harian (12 Maret 2020 hingga 23 Desember 2020 atau 41). Week) untuk membentuk model ARIMA atau sebagai data latih, dan sisanya sebagai data latih. Sisa 5 data harian (dari 24 Desember 2020 hingga 28 Desember 2020) akan digunakan sebagai data atau data uji untuk menguji akurasi prediksi model ARIMA.
Dari pembahasan di atas dapat dijelaskan bahwa data angka kematian orang Indonesia akibat virus corona yang digunakan dalam penelitian ini adalah setinggi 287 hari atau 41 minggu. Gunakan software R untuk mengolah data tersebut sebagai data deret waktu dari minggu ke-1 sampai dengan minggu ke-41. Agar lebih mudah dalam prosesnya, gunakan skala logaritmik untuk mengubah data deret waktu, yaitu mengonversi data dari x ke lnx
4 Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 menjadi Misalkan data mortalitas menjadi 12 Maret 2020, yaitu ln0.1176 = -2.14, yaitu 11.76% atau 0.1176. Gambar 3 menunjukkan hasil konversi data kematian di Indonesia.
Gambar 3. Grafik Tingkat Kematian Indonesia AkibatVirus Corona Selama 41 Pekan Setelah Ditransformasi Menggunakan Logarithmic Scale
Untuk memahami model ARIMA, pertama-tama kami akan menjelaskan model ARMA. Kombinasi model autoregressive (AR) dan moving average (MA) akan membentuk model baru yaitu model ARMA (autoregressive moving average) atau model ARIMA (p, 0, q) selanjutnya. Bentuk umum persamaan ARMA merupakan gabungan dari persamaan AR dan MA yang dinyatakan sebagai berikut:
.
Z_t adalah data time series yang digunakan, R_i adalah parameter autoregressive, M_i adalah parameter moving average, μ adalah nilai data rata-rata, dan e_t adalah error / residual pada waktu t. Pemodelan ARMA memiliki teori dasar tentang relevansi dan stasioneritas.
Artinya ketika time series sudah membentuk fixed chart atau tidak ada pola trend, ARMA bisa digunakan. Namun, jika data deret waktu tidak tetap, maka harus dibedakan untuk mengubah data menjadi data tetap sebelum dapat diproses oleh model ARMA. Kemudian menggunakan model ARMA (disebut model ARIMA) untuk mengolah data yang dibedakan, model tersebut mempunyai parameter ARIMA (p, d, q), nilai parameter d mewakili banyaknya perbedaan proses yang dilakukan, sehingga data menjadi stabil.
Model ARIMA (Autoregressive Integrated Moving Average) merupakan metode peramalan berdasarkan data time series. Model ARIMA (p, d, q) dapat digunakan untuk memprediksi pergerakan nilai variabel. Parameter p dalam model menunjukkan derajat autoregresi, parameter d menunjukkan berapa kali pemrosesan diferensial dilakukan, dan q menunjukkan derajat rata-rata bergerak. Diagram ACF dan PACF dapat digunakan untuk menentukan parameter p dan q pada model ARIMA. Fungsi autokorelasi (ACF) adalah korelasi antara urutan pengamatan deret waktu, dan urutan pengamatan deret waktu disusun pada grafik masing-masing lag. Latensi adalah interval yang memisahkan data dan nilai tetap.
Misalnya, dalam data Z_t, Z_ (t + 3), Z_ (t + 6), Z_ (t + 9), Anda dapat melihat bahwa data lag adalah 3, dan untuk Z_t, Z_ (t + 1), Z_ (t + 2) Data), Z_ (t + 3), terlihat bahwa data lag adalah 1. Partial autocorrelation function (PACF) adalah korelasi antara rangkaian pengamatan dengan lag pengamatan, digunakan untuk mengukur kedekatan hubungan antara pengamatan dengan data deret waktu (Montgomery et al., 2015).
Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 5 Berdasarkan pembahasan di atas, salah satu asumsi dalam model ARIMA adalah data tetap. Untuk memeriksa apakah asumsi tersebut terpenuhi, maka dilakukan pengujian KPSS berikut pada H_0: data tetap dan H_1: data tidak tetap. Hasil pengujian menggunakan software R ditunjukkan pada Gambar 4 berikut.
Gambar 4. Hasil Uji KPSS Pada Data
Dari hasil pengujian di atas diketahui bahwa karena nilai p hitung lebih kecil dari nilai p yang dicetak maka datanya tidak stabil, sehingga H_0 ditolak. Untuk menjaga agar data tidak berubah, proses konversi data diferensial dilakukan. Konversi data selisih merupakan proses mengubah data menggunakan rumus x_t = y_t-y_ (t-1). Gambar di bawah ini merupakan diagram data setelah pengolahan selisih yang ditunjukkan pada Gambar 5 berikut.
Gambar 5. Grafik Data 41 pekan Yang Telah Di Differencing
Dapat dilihat dengan jelas dari Gambar 5 bahwa grafik data sudah tetap jika dilihat dari pola pada grafik. Namun, untuk memastikan data yang dikonversi stabil, dilakukan uji KPSS pada data hasil diferensial, dan hasilnya ditunjukkan pada Gambar 6 berikut.
Gambar 6. Hasil Uji KPSS Pada Data Yang Telah Di Differencing
Hasil diatas menunjukkan bahwa data telah stasioner karena p-value hasil perhitungan
6 Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 lebih besar daripada p-value tercetak sehingga tidak cukup alasan menolak .Setelah asumsi-asumsi pada data untuk membentuk model ARIMA telah diperiksa, langkah selanjutnya adalah membentuk model tersebut. Dengan menggunakan fungsi Auto.Arima pada software R yang diaplikasikan pada data, diperolah hasil yang ditampilkan pada gambar 7 berikut ini.
Gambar 7. Pembentukan Model ARIMA
Fungsi Auto.Arima pada perangkat lunak R akan menampilkan model ARIMA terbaik dalam percobaan yang memungkinkan. Model ARIMA (5,0,3) atau ARIMA (2,0,1) merupakan model yang paling baik untuk memprediksi data kematian akibat virus corona di Indonesia. Rumus perhitungannya adalah MAE = ∑_ (i = 1) ^ n▒ (| x_i-x |) / n MAE untuk menunjukkan tingkat kesalahan prediksi. Seperti yang dapat dilihat dari Gambar 7 di atas, nilai MAE (mean absolute error) model menunjukkan tingkat kesalahan yang sangat kecil yaitu 2%.
Hasil dan Pembahasan
Setelah model ARIMA terbentuk, model tersebut dapat digunakan untuk memprediksi angka kematian akibat virus corona di Indonesia dari 24 Desember 2020 hingga 28 Desember 2020, dan diketahui nilai sebenarnya. Menggunakan hasil prediksi model ARIMA, nilai aktual data dan MAE-nya ditunjukkan pada Tabel 1 berikut.
Tabel 1. Perbandingan Nilai peramalan dan Nilai Aktual
Tanggal Hasil Peramalan Tingkat kematian Aktual Absolute Error
24 Desember 2020 0,0297 0,0297 0
25 Desember 2020 0,0294 0,0298 0,0004
26 Desember 2020 0,0291 0,0297 0,0006
27 Desember 2020 0,0287 0,0298 0,0011
28 Desember 2020 0,0284 0,0298 0,0014
MAE (Mean Absolute Error) 0,0007
Seperti terlihat pada Tabel 1, saat prediksi kematian aktual lima hari MAE sangat
Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 7 kecil, hanya 0,0007, maka hasilnya cukup baik. Selain itu, model ARIMA yang dinilai cukup baik dapat digunakan untuk memprediksi angka kematian akibat virus corona di Indonesia pada hari-hari dimana nilai sebenarnya belum diketahui. Tabel 2 di bawah ini menunjukkan hasil prediksi angka kematian akibat virus corona di Indonesia dari tanggal 29 Desember 2020 hingga 4 Januari 2021.
Tabel 2. Hasil Peramalan Menggunakan Model ARIMA Tanggal Tingkat Kematian (Hasil Peramalan)
29 Desember 2020 0,028226
30 Desember 2020 0,028284
31 Desember 2020 0,028313
1 Januari 2021 0,028487
2 Januari 2021 0,028491
3 Januari 2021 0,028452
4 Januari 2021 0,028192
Hasil peramalan dari model ARIMA diatas beserta data aslinya juga digambarkan dalam grafik pada Gambar 8 berikut ini.
Gambar 8. Grafik Hasil Peramalan Menggunakan Model ARIMA
Kesimpulan
Angka kematian akibat virus Corona Indonesia dapat dijadikan sebagai data time series untuk kemudian dimodelkan dengan menggunakan model ARIMA. Model tersebut kemudian dapat digunakan untuk memprediksi kematian di masa depan. Tingkat kesalahan / kesalahan prediksi yang dihitung dalam penelitian ini menggunakan MAE (Mean Absolute Error). MAE yang diperoleh dengan menggunakan model ARIMA (5.0, 3) atau ARIMA (2, 0, 1) untuk peramalan adalah 0,0007.
8 Jurnal Indonesia Sosial Sains: Vol. 2, No. 1 Januari 2021 Bibliografi
Booth, H., & Tickle, L. (2008). Mortality modelling and forecasting: A review of methods.
Annals of Actuarial Science, 3(1–2), 3–43.
COVID, W. H. O. (19 C.E.). Strategy Update. Geneva: WHO; 2020.
Harlianto, D., Mardiyati, S., Lestari, D., Zili, A. H., & Devila, S. (2020). Indonesia tuberculosis morbidity rate forecasting using recurrent neural network. AIP Conference Proceedings, 2242(1), 30006.
Montgomery, D. C., Jennings, C. L., & Kulahci, M. (2015). Introduction to time series analysis and forecasting. John Wiley & Sons.
Papastefanopoulos, V., Linardatos, P., & Kotsiantis, S. (2020). COVID-19: A Comparison of Time Series Methods to Forecast Percentage of Active Cases per Population. Applied Sciences, 10(11), 3880.
Salgotra, R., Gandomi, M., & Gandomi, A. H. (2020). Time Series Analysis and Forecast of the COVID-19 Pandemic in India using Genetic Programming. Chaos, Solitons &
Fractals, 109945.
Wijianto, W., Cahyono, D., & Qomariah, N. (2020). How To Improve Employee Performance at The Forest Service. International Journal Of Scientific & Technology Research, 9.
World Health Organization. (2020). WHO Timeline COVID-19. World Health Organization .