• Tidak ada hasil yang ditemukan

PREDIKSI JUMLAH KASUS COVID-19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION (STUDI KASUS: KABUPATEN KARAWANG) SKRIPSI

N/A
N/A
Protected

Academic year: 2022

Membagikan "PREDIKSI JUMLAH KASUS COVID-19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION (STUDI KASUS: KABUPATEN KARAWANG) SKRIPSI"

Copied!
14
0
0

Teks penuh

(1)

PREDIKSI JUMLAH KASUS COVID-19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION

(STUDI KASUS: KABUPATEN KARAWANG)

SKRIPSI

Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer (S.Kom.)

Aldo Gabriel Yoseph Stephanno 00000020534

PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2021

(2)

ii

LEMBAR PENGESAHAN

JUDUL: PREDIKSI JUMLAH KASUS COVID-19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION

(STUDI KASUS: KABUPATEN KARAWANG)

Oleh

Nama : Aldo Gabriel Yoseph Stephanno NIM : 00000020534

Program Studi : Informatika

Fakultas : Teknik dan Informatika

Tangerang, 21 Juni 2021

Ketua Sidang Dosen Penguji

Seng Hansun, S.Si., M.Cs. Farica Perdana Putri, S.Kom., M.Sc.

Dosen Pembimbing

Marlinda Vasty Overbeek, S.Kom., M.Kom.

Mengetahui,

Ketua Program Studi Informatika

Marlinda Vasty Overbeek, S.Kom., M.Kom.

(3)

iii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT

Dengan ini saya:

Nama : Aldo Gabriel Yoseph Stephanno

NIM : 00000020534

Program Studi : Informatika

Fakultas : Teknik dan Informatika

menyatakan bahwa Skripsi yang berjudul “PREDIKSI JUMLAH KASUS COVID- 19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION (STUDI KASUS: KABUPATEN KARAWANG)” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam Skripsi ini telah disebutkan sumber kutipannya serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan/ penyimpangan, baik dalam pelaksanaan Skripsi maupun dalam penulisan laporan Skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah Skripsi yang telah saya tempuh.

Tangerang, 28 Maret 2021

Aldo Gabriel Yoseph Stephanno

(4)

iv

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Sebagai sivitas akademik Universitas Multimedia Nusantara, saya yang bertanda tangan di bawah ini:

Nama : Aldo Gabriel Yoseph Stephanno

NIM : 00000020534

Program Studi : Informatika

Fakultas : Teknik dan Informatika Jenis Karya : Skripsi

Demi pengembangan ilmu pengetahuan, menyetujui dan memberikan izin kepada Universitas Multimedia Nusantara hak Bebas Royalti Non-eksklusif (Non- exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul:

Prediksi Jumlah Kasus Covid-19 Menggunakan Metode K-Nearest Neighbors Regression (Studi Kasus: Kabupaten Karawang) beserta perangkat yang diperlukan.

Dengan Hak Bebas Royalti Non-eksklusif ini, pihak Universitas Multimedia Nusantara berhak menyimpan, mengalihmedia atau format-kan, mengelola dalam bentuk pangkalan data (database), merawat, dan mendistribusi dan menampilkan atau mempublikasikan karya ilmiah saya di internet atau media lain untuk kepentingan akademis, tanpa perlu meminta izin dari saya maupun memberikan royalti kepada saya, selama tetap mencantumkan nama saya sebagai penulis karya ilmiah tersebut.

Demikian pernyataan ini saya buat dengan sebenarnya untuk dipergunakan sebagaimana mestinya.

Tangerang, 28 Maret 2021

Aldo Gabriel Yoseph Stephanno

(5)

v

HALAMAN PERSEMBAHAN

Karya ini kupersembahkan untuk kedua Orang Tua tercinta, kakak dan adik yang selalu memberi dukungan dan motivasi

“Sebab Aku ini mengetahui rancangan-rancangan apa yang ada pada-Ku mengenai kamu, demikianlah firman TUHAN, yaitu rancangan damai sejahtera dan bukan rancangan kecelakaan, untuk memberikan kepadamu hari depan yang penuh harapan”

Yeremia 29 : 11

(6)

vi

KATA PENGANTAR

Puji syukur kepada Tuhan Yang Maha Esa atas segala karunia dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul “Prediksi Jumlah Kasus Covid-19 Menggunakan Metode K-Nearest Neighbors Regression (Studi Kasus: Kabupaten Karawang)” dengan baik dan tepat waktu. Skripsi ini disusun dan diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana.

Tentu dalam menyusun skripsi ini, banyak pihak yang telah membantu baik berupa moril maupun spiritual. Maka dalam kesempatan ini, penulis ingin mengucapkan terima kasih kepada :

1. Dr. Ninok Leksono, Rektor Universitas Multimedia Nusantara, yang memberi inspirasi bagi penulis untuk berprestasi,

2. Dr. Eng. Niki Prastomo, S.T., M.Sc., Dekan Fakultas Teknik dan Informatika Universitas Multimedia Nusantara,

3. Ibu Marlinda Vasty Overbeek, S.Kom., M.Kom., Ketua Program Studi Informatika Universitas Multimedia Nusantara yang mendukung selama pengerjaan skripsi dan selaku dosen pembimbing yang membimbing serta memberikan masukan dalam pengerjaan skripsi ini,

4. Bapak dan Ibu Dosen Program Studi Informatika Universitas Multimedia Nusantara yang telah semangat dalam mendidik penulis selama menjalani masa perkuliahan,

5. Kedua orang tua, kakak, dan adik yang telah memberikan motivasi dan dukungan baik moril maupun spiritual,

(7)

vii

6. Teman-teman dan sahabat yang telah bersama sejak pertama kali kuliah hingga sekarang serta sama-sama berjuang menyelesaikan studi tingkat sarjana,

7. Teman-teman satu bimbingan yang telah memberikan banyak masukan serta motivasi dalam pembuatan program dan laporan skripsi.

8. Semua pihak yang tidak dapat disebutkan satu per satu yang telah dengan tulus dan ikhlas memberikan doa dan dukungan kepada penulis hingga akhirnya pengerjaan skripsi ini dapat terselesaikan dengan baik.

Penulis menyadari bahwa dalam penulisan laporan ini masih jauh dari sempurna. Oleh karena itu, segala bentuk kritik dan saran yang sifatnya membangun akan sangat membantu dalam menyempurnakan penulisan laporan Skripsi ini. Penulis berharap Skripsi ini dapat bermanfaat, baik sebagai sumber informasi maupun sumber inspirasi bagi para pembaca.

Tangerang, 28 Maret 2021

Aldo Gabriel Yoseph Stephanno

(8)

viii

PREDIKSI JUMLAH KASUS COVID-19 MENGGUNAKAN METODE K-NEAREST NEIGHBORS REGRESSION

(STUDI KASUS: KABUPATEN KARAWANG)

ABSTRAK

Covid-19 merupakan suatu penyakit menular yang disebabkan oleh virus SARS-CoV-2. Virus ini pertama kali muncul di Kota Wuhan, China pada Desember 2019. Sejak kemunculan kasus pertama ini, sekitar 25 negara mengonfirmasi kemunculan kasus serupa di negaranya. Pada 2 Maret 2020, pemerintah Indonesia mengumumkan kemunculan kasus Covid-19 pertama. Sejak itu, perkembangan kasus Covid-19 di Indonesia terus meningkat hari demi hari dan telah menyebar ke seluruh Provinsi di Indonesia. Kabupaten Karawang merupakan salah satu wilayah padat penduduk di Jawa Barat dan merupakan salah satu kota industri terbesar di Indonesia. Penelitian ini akan membahas bagaimana memprediksi jumlah kasus Covid-19 di Kabupaten Karawang dengan menggunakan metode K-Nearest Neighbors Regression. Metode ini dipilih karena performanya yang dinilai sangat baik dan dapat menganalisis nilai prediksi berdasarkan hubungan antar variabel yang ada, walaupun membutuhkan data yang cukup besar. Bahasa pemrograman yang digunakan dalam penelitian ini adalah Python, dengan Jupyter Notebook untuk visualisasi hasil prediksi. Model prediksi yang dibuat telah dievaluasi menggunakan beberapa perhitungan error rate dan menghasilkan nilai akurasi tertinggi sebesar 96,98%.

Kata kunci : Analisis Regresi, Covid-19, Kabupaten Karawang, K-Nearest Neighbors Regression, Prediksi, Python, Visualisasi Data

(9)

ix

PREDICTION OF THE NUMBER OF COVID-19 CASES USING K-NEAREST NEIGHBORS REGRESSION METHOD

(CASE STUDY: KARAWANG DISTRICT)

ABSTRACT

Covid-19 is an infectious disease caused by the SARS-CoV-2 virus. This virus first appeared in the city of Wuhan, China in December 2019. Since the appearance of this first case, around 25 countries have confirmed the emergence of similar cases in their countries. On March 2, 2020, the Indonesian government announced the emergence of the first Covid-19 case. Since then, the growth of the Covid-19 case in Indonesia has continued to increase day by day and has spread to all provinces in Indonesia. Karawang District is one of the densely populated areas in West Java and is one of the largest industrial cities in Indonesia. This study will discuss how to predict the number of Covid-19 cases in Karawang District using the K-Nearest Neighbors Regression method. This method was chosen because its performance is considered very good and can analyze the predicted value based on the relationship between the existing variables, although it requires a large enough data. The programming language used in this research is Python, with Jupyter Notebook to visualize the prediction results. The prediction model made has been evaluated using several error rate calculations and produces the highest accuracy value of 96.98%.

Keywords : Covid-19, Data Visualization, Karawang District, K-Nearest Neighbors Regression, Prediction, Python, Regression Analysis

(10)

x

DAFTAR ISI

LEMBAR PENGESAHAN ... ii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT ... iii

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ... iv

ILMIAH UNTUK KEPENTINGAN AKADEMIS ... iv

HALAMAN PERSEMBAHAN ... v

KATA PENGANTAR ... vi

ABSTRAK ... viii

ABSTRACT ... ix

DAFTAR ISI ... x

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiii

DAFTAR RUMUS ... xiv

BAB 1 PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 3

1.3. Batasan Masalah ... 3

1.4. Tujuan Penelitian ... 4

1.5. Manfaat Penelitian ... 4

1.5.1 Bagi Pemerintah Kabupaten Karawang ... 4

1.5.2 Bagi Masyarakat Kabupaten Karawang ... 4

1.6. Sistematika Penulisan ... 4

BAB 2 LANDASAN TEORI ... 6

2.1. Virus Corona (nCoV-2019) ... 6

2.2. Analisis Regresi ... 7

2.3. K-Nearest Neighbors ... 8

2.4. K-Nearest Neighbors Regression ... 9

2.5. Perhitungan Akurasi dan Error Rate... 11

2.5.1. Mean Absolute Error (MAE) ... 11

2.5.2. Mean Squared Error (MSE) ... 11

2.5.3. Percentage Prediction Error (PE) ... 12

2.5.4. Mean Absolute Percentage Error (MAPE) ... 12

2.5.5. R2 Metrics ... 12

2.6. Min-Max Scaling ... 13

BAB 3 METODOLOGI PENELITIAN... 14

3.1. Metodologi Penelitian ... 14

3.2. Perancangan Sistem ... 16

3.2.1. Pembuatan Dataset ... 16

3.2.2. Flowchart Preprocessing ... 18

3.2.3. Flowchart Proses Regresi ... 20

(11)

xi

3.2.4. Tampilan Hasil Penelitian ... 25

BAB 4 HASIL DAN DISKUSI ... 27

4.1. Spesifikasi Sistem ... 27

4.2. Implementasi Metode ... 28

4.2.1 Potongan Kode ... 28

4.2.2 Tampilan Hasil Prediksi ... 32

4.3. Uji Coba ... 34

4.3.1 Skenario Proses Pengujian ... 34

4.3.2 Evaluasi Hasil Pengujian... 35

BAB 5 SIMPULAN DAN SARAN ... 44

5.1 Simpulan ... 44

5.2 Saran ... 44

DAFTAR PUSTAKA ... 46

DAFTAR LAMPIRAN ... 48

(12)

xii

DAFTAR GAMBAR

Gambar 2.1. Alur Waktu Kejadian Virus Corona (Handayani et al., 2020) ... 6

Gambar 2.2. Alur Kerja KNN Regression (Xiao, Ma and Ding, 2018) ... 10

Gambar 3.1. Flowchart Metodologi Penelitian ... 14

Gambar 3.2. Web Covid-19 Kabupaten Karawang ... 17

Gambar 3.3. Pemrosesan Data Kosong pada Dataset ... 18

Gambar 3.4. Transformasi Data untuk Pemodelan ... 19

Gambar 3.5. Alur Proses Pemodelan ... 21

Gambar 3.6. Alur Fitting Data dengan Regresi Polynomial ... 22

Gambar 3.7. Alur Kerja K-Nearest Neighbors Regression ... 23

Gambar 3.8. Proses Pemodelan dengan Library KNeighborsRegressor ... 24

Gambar 3.9. Alur Evaluasi untuk Model ... 25

Gambar 3.10. Rancangan Tampilan Hasil Penelitian (Grafik) ... 26

Gambar 3.11. Rancangan Tampilan Hasil Penelitian (Tabel) ... 26

Gambar 4.1. Potongan Kode Missing Value ... 28

Gambar 4.2. Potongan Kode Scalling dan Pembuatan Dataframe Baru ... 29

Gambar 4.3. Potongan Kode Transformasi Data untuk Pemodelan ... 29

Gambar 4.4. Potongan Kode Pemodelan dengan KNN Regresi ... 30

Gambar 4.5. Potongan Kode Tuning Parameter untuk KNN Regresi ... 31

Gambar 4.6. Potongan Kode function Evaluasi Model dan Visualisasi Data ... 32

Gambar 4.7. Grafik Visualisasi Dataset ... 32

Gambar 4.8. Tampilan Perbandingan Nilai Prediksi Model dan Nilai Aktual ... 33

Gambar 4.9. Tampilan Prediksi Jumlah Kasus Covid-19 di Karawang ... 33

Gambar 4.10. Tampilan Hasil Evaluasi Model ... 34

(13)

xiii

DAFTAR TABEL

Tabel 3.1. Rancangan Dataset Covid-19 Kabupaten Karawang... 17 Tabel 4.1. Hasil Pengujian dengan Perbandingan Data Train dan Test 70:30 ... 36 Tabel 4.2. Hasil Pengujian dengan Perbandingan Data Train dan Test 80:20 ... 37 Tabel 4.2. Hasil Pengujian dengan Perbandingan Data Train dan Test 80:20 (lanjutan) ... 38 Tabel 4.3. Hasil Pengujian Penambahan Data dengan Perbandingan Data Train dan Test 70:30 ... 38 Tabel 4.3. Hasil Pengujian Penambahan Data dengan Perbandingan Data Train dan Test 70:30 (lanjutan) ... 39 Tabel 4.4. Hasil Pengujian Penambahan Data dengan Perbandingan Data Train dan Test 80:20 ... 40 Tabel 4.5. Hasil Pengujian Tuning Parameter dengan Perbandingan Data Train dan Test 70:30 ... 41 Tabel 4.6. Hasil Pengujian Tuning Parameter dengan Perbandingan Data Train dan Test 80:20 ... 41 Tabel 4.6. Hasil Pengujian Tuning Parameter dengan Perbandingan Data Train dan Test 80:20 (lanjutan) ... 42

(14)

xiv

DAFTAR RUMUS

Rumus 2.1. Rumus Regresi Linear ... 7

Rumus 2.2. Rumus Regresi Polynomial ... 8

Rumus 2.3. Rumus Euclidean Distance ... 9

Rumus 2.4. Rumus Mean Method ... 10

Rumus 2.5. Rumus Mean Absolute Error (MAE) ... 11

Rumus 2.6. Rumus Mean Squared Error (MSE) ... 11

Rumus 2.7. Rumus Percentage Error (PE) ... 12

Rumus 2.8. Rumus Mean Absolute Percentage Error (MAPE) ... 12

Rumus 2.9. Rumus Koefisien Determinasi (r2) ... 12

Rumus 2.10. Rumus Min-Max Scaling ... 13

Referensi

Dokumen terkait

Mendeskripsikan data apa yg disimpan pada database dan relasi apa yang terjadi antar data tersebut.. Level tertinggi, yang mendeskripsikan hanya sebagian dari seluruh database,

Hasil analisis pemodelan Geographicaly Weighted Poisson Regression (GWPR) menghasilkan variabel prediktor yang berpengaruh secara signifi kan terhadap jumlah kasus baru kusta

4 Namum dalam masyarakat Indonesia terkhusus Provinsi Aceh, pencatatan peristiwa hukum kematian (akta kematian) belum sepenuhnya diterapkan dan dilaksanakan, dengan

KLASIFIKASI AYAT AL-QURAN TERJEMAHAN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DAN K-NEAREST NEIGHBORS.. AAN SAPUTRA

Pada metode Hybrid Multiple Linear Regression dengan Artificial Neural Network ini, pertama dilakukan prediksi terhadap variabel

Selain itu penurunan jumlah kasus aktif COVID-19 di Indonesia juga menjadi sentimen positif.. Kemarin, jumlah kasus aktif COVID-19 di Indonesia bertambah menjadi

Pada persiapan lahan tanpa olah tanah bentuk struktur tanah pada lapisan olah adalah lempeng dan pori mikro (50 -1 OOum) saling berhubungan sepanjang profil. Ukuran agregat tanah

Pada percobaan menggunakan metode Modified K-Nearest Neighbors yang dilakukan tanpa menerapkan proses normalisasi min-max terhadap data PSG namun tetap menggunakan variasi