5
BAB II
KAJIAN PUSTAKA
Dalam riset ini, kajian pustaka yang digunakan merupakan teori-teori yang menjadi landasan dalam penelitian, tidak hanya itu kajian pustaka ini juga meninjau buku serta jurnal penelitian nasional maupun internasional.
2.1. Time Series
Time series atau yang biasa dikenal sebagai deret waktu merupakan rangkaian informasi yang berbentuk nilai pengamatan yang diukur sepanjang kurun waktu tertentu, bersumber pada waktu dengan interval uniform yang sama [9]. Sebagian Contoh informasi deret waktu yakni harga penutupan suatu saham di pasar modal perharinya dalam kurun waktu satu bulan, dan temperatur cuaca per jam.
Time series bias diartikan sebagai desain yang melibatkan pengamatan berulang yang serupa pada suatu objek atau unit diikuti oleh interveresi. Interveresi tersebut kemudian menjadi manipulasi eksperimental. Demi menentukan keberhasilan penentuan apakah interveresi memiliki efek, hendaknya dilakukan beberapa preprocessing data untuk menghapus efek dependensi.
Secara matematis, time series didefinisikan sebagai 𝑌1, 𝑌2, … dari suatu varibel dependent atau sebagai contoh yakni harga penutupan saham, suhu udara, dan sebagainya, kemudian untuk titik waktu atau variabel independent yaitu 𝑡1, 𝑡2, …. Seperti yang tertulis dalam Persamaan 1.
𝑌 = 𝐹(𝑡) (1)
Dalam time series sendiri terdapat sebutan time series forecasting ataupun yang biasa diucap sebagai peramalan deret waktu yang berarti suatu zona pada machine learning yang berfokus pada atribut waktunya. Bidang tersebut berfokus pada analisis data yang sekuensial pada waktu, setelah itu memprediksi data yang akan datang bersumber pada informasi data yang telah ada.
Peramalan time series memerlukan kecermatan terhadap jenis ataupun pola informasi. Secara umum terdapat 4 ragam pola informasi time series, yakni horizontal, musiman, trend serta siklis [10]. Hosrizontal menggambarkan peristiwa yang tidak
6
dapat ditebak serta bersifat acak, namun keberadaanya bisa mempengaruhi adanya fluktuasi informasi pada time series. Trend ialah informasi dalam jangka panjang, bisa berbentuk peningkatan ataupun penyusutan. Musiman ialah data yang terjadi secara terjadwal atau tertulis seperti triwulan, kuartal, bulanan, mingguan serta harian yang terjadi dalam waktu satu tahun. Sedangkan untuk pola siklis perubahan yang terjadi dalam kurun waktu yang lebih dari setahun. Contoh dari metode peramalan untuk time series yakni Polynomial Regression, Facebook Prophet, SEIR, ARIMA, Linear Regression, SVM, dan lain sebagainya.
2.2. Polynomial Regression
Pada dasarnya metode polynomial berasal dari metode Thorndike yang dikembangkan oleh Mollenkopf, Mollenkopf menggunakan teknik regresi untuk mencari besarnya varians kesalahan [11]. Model regresi adalah set statistik proses yang digunakan untuk memperkirakan atau memprediksi target atau variabel dependen berdasarkan variabel dependen. Model regresi memiliki banyak varian seperti regresi linier, regresi ridge, regresi bertahap, regresi polinomial dll. Penulis menggunakan model polynomial regression seperti pada kasus di India sebagaimana peneliti juga menggunakan model yang sama, Penulis menggunakan model yang sama dikarenakan pertambahan yang sama-sama meningkat antara India dan Indonesia. Hingga 25 Maret jumlah kasus yang terinfeksi di India meningkat dengan cepat dengan rata-rata kasus yang terinfeksi per hari meningkat dari 10 menjadi 73, dari kasus pertama menjadi kasus ke-300 [8]. Model regresi polinomial berguna ketika ada hubungan antara dua variabel yang curvalinear. Hal ini juga menjadi alasan mengapa metode ini digunakan karena mencangkup hubungan meningkatnya jumlah pasien positive COVID-19 perharinya di Indonesia.
Regresi linier adalah model sederhana yang digunakan untuk menemukan hubungan antara kedua variable yakni dependen dan independen [12]. Menggunakan nilai intersep dan slope untuk memprediksi variabel output. Persamaan 2 menunjukkan hubungan antara variable yang independen dan dependen dalam regresi linier. Dalam Persamaan 2, β_0 dan β_1 adalah dua variabel independen yang masing-masing
7
mewakili intersep dan kemiringan dan ϵ adalah tingkat kesalahan. Ini menciptakan garis lurus dan sebagian besar digunakan untuk analisis prediksi. Untuk membuat algoritma regresi linier lebih akurat, penulis mencoba meminimalkan jumlah residualkuadrat antara nilai yang telah diprediksi dengan nilai yang real (sebenarnya).
𝑌 = 𝛽0+ 𝛽1𝑥 + 𝜖 (2)
Regresi polinomial adalah jenis regresi khusus yang bekerja pada hubungan curvilinear antara nilai dependen dan nilai independen [13]. Persamaan 3 menunjukkan hubungan antara variable yang independen dan dependen dalam suatu regresi polynomial. Dalam Persamaan 3, x adalah variabel independen dan θ_0 adalah bias juga intersep dan θ_0, θ_1, ……, θ_n adalah bobot atau koefisien parsial yang ditetapkan untuk prediktor dan n adalah degree polinomial.
𝑌 = 𝜃0+ 𝜃1𝑥 + 𝜃2𝑥2+ 𝜃
3𝑥3+ 𝜃𝑛𝑥𝑛 (3)
Regresi polinomial yang digunakan dalam penelitian ini mencakup transformasi data menjadi polinomial dan menerapkan regresi linier agar sesuai dengan parameter. Model regresi polinomial juga berguna ketika terdapat hubungan antara dua variabel yang curvalinear. Hal ini juga menjadi alasan mengapa metode ini digunakan karena mencangkup hubungan meningkatnya jumlah pasien positive COVID-19 perharinya di Indonesia.
Adapun dalam penelitian ini digunakan parameter default untuk polynomial regression yaitu degree, degree adalah jumlah dari eksponen dari variabel yang muncul di dalamnya dengan bentuk non-negatif dan merupakan bilangan bulat. Memilih nilai degree merupakan hal yang penting. Jika nilai degree polinomial bernominal lebih kecil dari nilai yang seharusnya, maka tidak akan dapat cocok dengan model dan jika nilai degree polinomial lebih besar dari nilai yang sebenarnya, maka akan melebihi training data atau bisa disebut overfit.
2.3. Facebook Prophet (FBProphet)
FBProphet model merupakan sebuah alat peramalan yang dibangun oleh tim Core Data Science Facebook sebagai open sourcing prophet yang tersedia dalam python dan R[14]. FBProphet model ini sendiri dapat memprediksi suatu prakiraan
8
dengan kualitas yang tinggi sehingga tak jarang banyak peneliti sebelumnya yang menggunakan model ini sebagai pengambilan keputusan dan bahkan dalam fitur produk. Model FBProphet ini menggunakan parameter yang mudah diinterpretasikan. Model FBProphet menghasilkan prediksi yang masuk akal dan akurat serta dapat disesuaikan dengan cara intuitif bagi non-ahli.
FBProphet model merupakan analisis forecasting time series yang diambil berdasarkan simple linear equation yang sesuai dengan non-linear trens dengan menambahkan musiman harian, mingguan, dan tahunan dengan mempertimbangkan efek liburan [15].
FBProphet menggunakan tiga model komponen decomposable time series model yaitu trend, seasonal, dan irregular components yang dapat dirumuskan sebagai berikut:
𝑘(𝑡) = 𝑡𝑟(𝑡) + 𝑠𝑒(𝑡) + ℎ𝑜(𝑡) + 𝑖𝑑(𝑡) (4)
Dengan keterangan tr(t) merupakan tren yang dapat didefinisikan perubahan non-periodik dalam hal pertumbuhan, se(t) merupakan musiman yang dapat didefinisikan perubahan berkala yang dapat diukur dalam bentuk mingguan, bulanan atau tahunan, ho(t) merupakan Liburan mendefinisikan efek hari libur (mungkin jadwal yang tidak dapat diprediksi ≥ 1 hari, dan id(t) merupakan Individu menentukan perubahan individu yang tidak disesuaikan oleh model.
FBProphet model menggunakan waktu sebagai acuan untuk menyesuaikan persamaan deret waktu linear dan non linear sebagai komponen fungsi waktu tersebut [16]. FBropet model secara tegas dapat membingkai permasalahan prediksi sebagai kurva yang tepat pada saat ketergantungan berbasis setiap observasi dalam seri waktu. FBProphet yang digunakan dalam penelitian ini mencangkup objek Prophet() yang ditentukan dan dikonfigurasi, kemudian dimasukkan ke dalam dataset dengan memanggil fungsi fit() dan meneruskannya pada data. Prophet() objek mengambil argumen untuk mengkonfigurasi jenis model yang diinginkan. Fungsi fit() mengambil DataFrame dari data deret waktu. DataFrame harus memiliki format tertentu. Kolom pertama harus memiliki nama ' ds ' yang berisi tanggal
(HH-BB-9
TTTT). Kolom kedua harus memiliki nama 'y' yang berisi nilai observasi atau dalam penelitian ini merupakan nilai banyaknya pasien yang positif covid19 di Indonesia.
Adapun dalam penelitian ini digunakan parameter berupa seasonality yakni karakteristik data deret waktu ketika mengalami pergerakan teratur dan dapat diprediksi setelah periode waktu tertentu. Parameter seasonality dapat memungkinkan untuk menyesuaikan seberapa cocok pengukurannya dengan siklus yang terjadi pada waktu yang lampau, serta dapat menghaluskan tren yang memungkinkan untuk penyesuaian perubahan tren. Apabila dalam penentuan parameter yang digunakan tidak sesuai, maka akan terjadi overfit pada hasilnya.