• Tidak ada hasil yang ditemukan

Peramalan dan Visualisasi Data Jumlah Penumpang Kereta Api Indonesia di Pulau Jawa dengan Metode Triple Exponential Smoothing

N/A
N/A
Protected

Academic year: 2022

Membagikan "Peramalan dan Visualisasi Data Jumlah Penumpang Kereta Api Indonesia di Pulau Jawa dengan Metode Triple Exponential Smoothing"

Copied!
21
0
0

Teks penuh

(1)Peramalan dan Visualisasi Data Jumlah Penumpang Kereta Api Indonesia di Pulau Jawa dengan Metode Triple Exponential Smoothing. Artikel Ilmiah Diajukan kepada Fakultas Teknologi Informasi untuk memperoleh Gelar Sarjana Komputer. Peneliti: Lingga Alfius Krisworo (672016270) Pratyaksa Ocsa Nugraha Saian, S.Kom., M.T.. Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga Oktober 2020.

(2) 1.

(3) 2.

(4) 3.

(5) 4.

(6) 5.

(7) 1.. Pendahuluan Transportasi merupakan pengangkutan barang oleh berbagai jenis kendaraan sesuai dengan perkembanagan teknologi, serta merupakan sektor yang penting dalam kehidupan bermasyarakat sebagai penggerak ekonomi [1]. Salah satu moda transportasi darat yang banyak digunakan masyarakat adalah kereta api, moda ini telah mengalami perkembangan dan peningkatan jumlah penumpang setiap tahunnya. Badan Pusat Statistik menyebutkan bahwa jumlah penumpang kereta api secara nasional mengalami peningkatan dari tahun 2017 sebanyak 393 juta penumpang menjadi 422 juta penumpang pada tahun 2018 [2]. Transportasi darat berperan penting dalam kehidupan masyarakat dan rutinitas sehari-harinya, tak terkecuali dengan kereta api. Moda ini semakin diminati karena adanya perbaikan yang terus dilakukan oleh PT. Kereta Api Indonesia (KAI). Selain untuk rutinitas sehari-hari, moda ini juga menjadi pilihan ketika musim libur nasional, misalnya saat libur Idul Fitri maupun libur Natal dan tahun baru. Jumlah penumpang kereta api memiliki kecenderungan mengalami kenaikan dari tahun ke tahun secara rata-rata, dan mengalami lonjakan pada musimmusim tertentu seperti musim liburan. Oleh karena itu, penting untuk dilakukan peramalan jumlah penumpang kereta api untuk mengantisipasi lonjakan yang berlebih dan kekurangan kapasitas pengangkutan penumpang [3][4]. Penulis melakukan peramalan jumlah penumpang kereta api dengan analisis Time Series dengan metode Triple Exponential Smoothing. Pada dasaranya, Time Series digunakan untuk memperoleh ramalan berdasarkan data-data yang ada sebelumnya dan metode Triple Exponential Smoothing digunakan karena data yang ada memiliki pola trend dan season tertentu. Perhitungan ini akan dilakukan dengan bahasa Python, dan hasilnya akan divisualisasikan dalam bentuk web dan grafik menggunakan tambahan library Streamlit. Penelitian ini bermanfaat untuk meramalkan jumlah penumpang kereta api di masa mendatang, sehingga dapat memberi gambaran jumlah penumpang dan dapat digunakan untuk mengantisipasi lonjakan penumpang. Data yang digunakan adalah data jumlah penumpang kereta api di pulau Jawa periode tahun 2006 s/d 2019 [2]. 2.. Tinjauan Pustaka Peramalan merupakan perkiraan mengenai sesuatu yang belum terjadi dimana biasanya menggunakan metode-metode tertentu dan bertujuan untuk mengurangi dampak ketidakpastian data dari masa depan. Terdapat dua metode peramalan, yaitu permalan menggunakan pendekatan kualitatif dan pendekatan kuantitatif. Peramalan kualitatif merupakan peramalan yang menggabungkan unsur subyektif seperti faktor-faktor pengalaman, pendapat, dan intuisi pengambilan keputusan. Sedangkan, peramalan kuantitatif merupakan peramalan dengan model matematis dan variabel sebab akibat untuk meramalkan data, atau merupakan peramalan yang menggunakan analisis statistik dari data-data masa lalu, peramalan kuantitatif terbagi ke dalam model deret waktu (time series) dan model kausal [5][6][7]. Penelitian terdahulu yang berkaitan dengan peramalan data time series yang pertama berjudul “Implementation of Exponential Smoothing for Forecasting Time. 6.

(8) Series Data” membahas mengenai penerapan Exponential Smoothing untuk mempredikasi data turis pada Himachal Pradesh menggunakan data historis. Data turis Himachal Pradesh yang dikumpulkan dari tahun 2008 hingga 2017 diolah untuk memprediksi jumlah wisatawan pada tahun 2018. Terdapat tiga langkah yang digunakan untuk mendapatkan keakuratan hasil yaitu MAD, MSD dan MAPE (Mean Absolute Percentage Error) [8]. Penelitian terdahulu yang membahas tentang peramalan jumlah penumpang kereta api berjudul “Peramalan Jumlah Penumpang Kereta Api Menggunakan Metode Moving Average dan Holt Winter” memberi kesimpulan bahwa metode Holt Winter (Triple Exponential Smoothing) merupakan yang paling cocok untuk meramalkan jumlah penumpang kereta api dibandingkan dengan metode Moving Average. Holt Winter memiliki hasil MAPE sebesar 4 dan MAD sebesar 1382, sedangkan Moving Average memiliki MAPE sebesar 5 dan MAD sebesar 2090 [3]. Penelitian selanjutnya yang berjudul “Perbandingan Peramalan Jumlah Penumpang Keberangkatan Kereta Api di DKI Jakarta Menggunakan Metode Double Exponential Smoothing (DES) dan Triple Exponential Smoothing (TES)” membahas hal yang cukup memiliki kemiripan yaitu tentang kereta api, namun dengan tujuan untuk membandingkan kedua metode ini, manakah yang tepat digunakan untuk peramalan. DES memiliki keunggulan untuk peramalan satu periode ke depan dengan nilai MAPE 4,839%, sedangkan TES memiliki keunggulan untuk meramalkan satu bulan ke depan dengan akurasi MAPE 3.213% [4]. Penelitian yang berjudul “Forecasting Model Exponential Smoothing Time Series Rata-rata Mechanical Availability Unit Off Highway Truck Cat 777D Caterpillar” dilakukan dengan pendekatan kuantitatif yang menerapkan metode Triple Exponential Smoothing dalam peramalan availability pada peralatan berat yang dioperasikan pada sektor pertambangan agar dapat dijadikan rujukan sebagai sebuah model regresi mechanial availability truk tambang. Dari hasil yang telah diperoleh maka dapat disimpulkan bahwa model yang telah dibangun layak digunakan untuk meramalkan nilai mechanical availability dari OHT 777 dengan tingkat akurasi rata-rata model dalam memprediksi nilai mechanical availability pada OHT 777D yaitu sebesar 81.564% [5]. Penelitian selanjutnya yang berjudul “Analisis Forecasting untuk Data Penjualan Menggunakan Metode Simple Moving Average dan Single Exponential Smoothing: Studi Kasus PT Guna Kemas Indah” menyimpulkan bahwa analisis peramalan disertai dengan visualisasi data yang interaktif dapat memberi kemudahan bagi pihak terkait untuk melihat dan memahami hasil yang diberikan, serta mempermudah pengambil keputusan untuk mengambil keputusan yang berdasarkan hasil visualisasi peramalan [6]. Penelitian tentang visualisasi data diperoleh dari desertasi “Interactive System for Scalable Visualization and Analysis” yang menyatakan bahwa visualisasi untuk dataset merupakan penting untuk dilakukan dan perlu terus dilakukan pengembangan. Sistem visualisasi data yang baru harus dapat melakukan penggantian poros (putar) dan perubahan warna skala [9]. Berdasarkan berbagai penelitian terdahulu yang penulis gunakan sebagai bahan acuan, tidak terdapat penelitian dikerjakan dengan bahasa pemrograman. 7.

(9) Python mulai dari pengolahan data hingga visualisasi datanya. Selain itu, penelitian dengan topik analisis data seringkali hanya menampilkan hasil akhir yang statis. Dalam penelitian ini penulis akan menggunakan bahasa pemrograman Python mulai dari pengolahan data, analisis data, hingga visualisasi data yang dinamis sesuai dengan keinginan user, sehingga hasil analisis time series bukan merupakan hasil statis, melainkan user dapat menentukan sendiri durasi peramalan yang diinginkan. Python merupakan bahasa pemrograman berorientasi objek dinamis yang dikembangkan dengan tujuan untuk membuat proses penulisan dan pembacaan source code lebih mudah. Python memiliki library yang banyak khususnya untuk proses numerik dan machine learning, sehingga memungkinkan programmer untuk dapat menulis code yang lebih sederhana [10]. Streamlit merupakan open-source Python library yang dapat digunakan untuk membangun aplikasi visualisasi data berbasis machine learning. Visualisasi data dapat dilakukan secara langsung tanpa perlu membuat tampilan front-end tersendiri. Streamlit bekerja berdasarkan tiap data yang sudah disimpan dan siap untuk dijalankan dari atas sesuai urutan [11]. Terdapat dua konsep visualisasi, yaitu visualisasi scientific dan visualisasi informasi. Visualisasi data merupakan cara untuk menyajikan data secara visual sehingga pengguna dapat melihat representasi data dan berinteraksi langsung. Pengguna dapat melakukan eksplorasi dan memperoleh informasi sesuai kebutuhan dengan adanya visualisasi data tersebut. Visualisasi scientific didasarkan pada pengukuran dan simulasi data sesuai dunia nyata, sedangkan visualisasi informasi menyatakan konsep yang tidak selalu berkaitan dengan dunia nyata [12]. Supervised Learning merupakan salah satu jenis dari Machine Learning yang bekerja dengan melakukan pendekatan dimana sebelumnya telah memiliki training data dan terdapat variabel yang dibuat untuk meletakkan target untuk mengelompokkan suatu data ke data yang sudah ada sebelumnya. Tujuannya adalah untuk memperkirakan fungsi pemetaan dan menemukan pola baru dalam data dengan dengan pola yang sudah ada, sehingga ketika memilki input baru maka dapat dilakukan prediksi output untuk input tersebut [13]. Time Series merupakan serangkaian nilai variabel yang disusun secara runtut berdasarkan waktu. Data time series dikumpulkan dengan melakukan pengamatan sepanjang waktu dengan berurutan dan umunya pengamatan dilakukan dapat berbentuk dalam jam, hari, minggu, bulan atau tahun. Analisis time series dilakukan untuk menentukan pola variasi masa lalu dari data yang akan digunakan untuk melakukan peramalan data pada masa yang akan datang. Banyak penelitian yang menggunakan analisis time series sebagai metode peramalan cuaca, harga saham, peramalan bencana dan lain sebagainya [8]. Exponential Smoothing merupakan penghalusan data rata-rata dari deret waktu masa lalu yang dilakukan terus menerus dengan cara menurun atau eksponensial, dan kemudian dapat digunakan untuk meramalkan data masa depan [14]. Triple Exponential Smoothing atau sering disebut Holt-Winter Exponential Smoothing merupakan metode time series yang digunakan untuk peramalan suatu nilai yang memiliki unsur trend dan season, HoltWinter terbagi dalam dua pendekatan metode untuk melakukan perhitungan, yaitu Additive Seasonal Method yang digunakan untuk variasi data musiman yang cenderung konstan, dan Multiplicative Seasonal Method yang digunakan untuk. 8.

(10) variasi data musiman yang bersifat fluktuatif. Metode Triple Exponential Smoothing adalah metode yang tepat untuk meramalkan data dengan pola tren dan musiman. Dalam metode Triple Exponential Smoothing ini menggunakan tiga konstanta pemulusan, yaitu konstanta pemulusan standar (𝛼), konstanta pemulusan trend linier (𝛽) dan konstanta pemulusan musim (𝛾), hal ini dikarenakan data yang dipakai memiliki arah tren tertentu dan pada periode atau waktu tertentu data mengalami pembalikan arah atau disebut musiman. Pemulusan standar (𝛼) merupakan konstanta yang digunakan pada Single Exponential Smoothing dengan karakteristik data yang cenderung berfluktuasi namun tidak banyak selisih antar datanya. Sedangkan, pemulusan trend linier (𝛽) digunakan pada Double Exponential Smoothing yang memiliki kecenderungan tren arah data, baik meningkat maupun menurun. Berikut adalah persamaan untuk Triple Exponential Smoothing [4][8][14]:. Gambar 1. Formula Triple Exponential Smoothing [4]. Keterangan: 𝑆𝑡 = 𝑇𝑡 = 𝑆𝑡−1 = 𝑇𝑡−1 = 𝐼𝑡 = 𝐹𝑡+𝑚 = 𝑋𝑡 = 𝛼 = 𝛽 = 𝛾 = 𝐿 = 𝑚 =. pemulusan standar periode ke-t pemulusan trend periode ke-t pemulusan standar periode ke t-1 pemulusan trend periode ke t-1 faktor penyesuaian musim peramalan untuk periode ke t+m data aktual periode ke t konstanta pemulusan standar konstanta pemulusan trend linier konstanta pemulusan musim jumlah periode dalam satu siklus musim bulan yang akan diramal dalam 1 periode. Mean Absolute Percentage Error (MAPE) merupakan salah satu metode yang biasa digunakan untuk mengevaluasi hasil peramalan dalam bentuk persentase. MAPE dipilih karena memberikan nilai yang relatif lebih akurat. Berikut adalah persamaan MAPE [4]. Gambar 2. Formula MAPE [4]. 9.

(11) Berikut adalah tabel persentase penilaian MAPE yang digunakan untuk evaluasi hasil peramalan [4] Tabel 1. Kriteria MAPE [4]. MAPE. Signifikasi. < 10%. Sangat baik. 10% - 20%. Baik. 20% - 50%. Cukup. >50%. Buruk. 3.. Metode Penelitian Penelitian ini dilakukan dengan peramalan menggunakan pendekatan bersifat kuantitatif dimana peramalan ini menggunakan analisis statistik dari data-data masa lalu. Pendekatan bersifat kuantitatif fokus terhadap pengamatan pola data secara kronologis atau urutan waktu. Metode peramalan kuantitatif yang digunakan adalah Triple Exponential Smoothing karena metode tersebut cocok diterapkan pada data yang memiliki pola trend dan seasonal, bukan data yang secara konstan meningkat atau menurun [3][5][15]. Data yang digunakan merupakan data sekunder yang bersumber dari Badan Pusat Statistik (BPS), yaitu data jumlah penumpang kereta PT Kereta Api Indonesia dengan cakupan wilayah pulau Jawa (Jabodetabek dan non-Jabodetabek) terhitung sejak Januari 2006 s/d Desember 2019 [2]. Data awal yang diunduh dari situs web BPS berisi data jumlah penumpang kereta berdasarkan wilayah besar operasi, yaitu di Jabodetabek, Non-Jabodetabek, Jawa atau gabungan Jabodetabek dan NonJabodetabek, pulau Sumatera, dan jumlah penumpang secara keseluruhan pada bagian barisnya. Sedangkan, pada bagian kolom berisi data tahun dan bulan. Keseluruhan data disajikan dalam ribuan, sehingga apabila terdapat data jumlah sebesar 11.504, maka dalam pembacaannya menjadi 11.504.000. Potongan data asli dari situs web BPS dapat dilihat pada Gambar 3 di bawah ini.. Gambar 3. Data Awal BPS. Penelitian ini dilakukan dengan melalui beberapa tahap, yaitu Identifikasi Masalah, Studi Pustaka, Pengumpulan Data, Analisis dan Pemodelan, serta terakhir adalah Penulisan Laporan, dengan penjelasan sebagai berikut [16][17]: a. Identifikasi Masalah, merupakan tahap untuk melakukan identifikasi permasalahan dalam penelitian ini, mencari data-data pendukung yang berkaitan dengan transportasi, khususnya Kereta Api.. 10.

(12) b.. c.. d.. e.. Studi Pustaka, merupakan tahap pengumpulan informasi atau studi literatur untuk membantu penelitian ini. Studi literatur diambil dari berbagai jurnal nasional dan jurnal internasional yang berkaitan dengan metode yang digunakan untuk melakukan peramalan jumlah penumpang. Pengumpulan Data, merupakan tahapan untuk mengunpulkan data-data dan informasi pendukung, seperti data tahunan jumlah penumpang kereta api, dengan rincian data jumlah penumpang per bulan selama tahun 2006 s/d 2019, secara khusus di wilayah pulau Jawa. Analisis dan Pemodelan, tahap ini merupakan proses pengolahan data dan penghitungan menggunakan metode Triple Exponential Smoothing. Data yang sudah diperoleh dari data sebelumnya perlu disunting terlebih dahulu agar dapat sesuai dengan kebutuhan dan dapat dibaca oleh program dengan baik, data awal yang diperoleh merupakan data jumlah penumpang kereta api di Indonesia, sedangkan yang diperlukan adalah jumlah penumpang kereta api pulau Jawa saja, data yang digunakan merupakan angka dalam ribuan. Data yang sudah sesuai kebutuhan selanjutnya dianalisis dengan metode Triple Exponential Smoothing sehingga kemudian dapat divisualisasikan dalam bentuk grafik. Penulisan Laporan, merupakan tahap terakhir untuk keperluan pendokumentasian penelitian yang telah dikerjakan, bagian hasil dan pembahasan merupakan bagian utama penelitian yeng berisi tentang pemrosesan data asli untuk kemudian diperoleh hasil peramalan dan visualisasi datanya, serta hasil perhitungan rata-rata tingkat kesalahan dari metode yang digunakan.. Gambar 4. Tahapan Penelitian. Berdasarkan tujuan dan tahapan penelitian yang sudah dijelaskan sebelumnya, rancangan diagram alir (flowchart) untuk perhitungan data jumlah penumpang kereta api dengan metode Triple Exponential Smoothing meliputi pembacaan data awal, menampilkan dalam bentuk tabel dan grafik, kemudian pengguna dapat menentukan jumlah peramalan yang diinginkan, perhitungan MAPE, dan terakhir adalah tabel dan grafik hasil peramalan. Diagram alir ditunjukkan pada Gambar 5 di bawah.. 11.

(13) Gambar 5. Diagram alir. Pseudocode dapat dilihat pada keterangan di bawah ini: Kode Program 1. Pseudocode 1. 2. 3. 4. 5. 6. 7.. Start Read data .csv Show data tabel & grafik Select range peramalan Perhitungan Holt-Winter Show hasil peramalan End. 4.. Pembahasan Bagian ini berisi tentang analisis dan pembahasan hasil peramalan dengan metode Triple Exponential Smoothing pada data jumlah penumpang kereta api di pulau Jawa periode tahun 2006 s/d 2019, dengan rentang peramalan variatif sesuai yang diinginkan pengguna. Data merupakan file berekstensi .csv yang diunduh dari situs web BPS.. 12.

(14) Gambar 6. Tampilan Secara Keseluruhan. Gambar 6 merupakan tampilan secara keseluruhan dari hasil penelitian ini. Terdapat beberapa hasil tampilan seperti tulisan atau keterangan, tabel yang berisi data awal, grafik yang merupakan visualisasi data awal, lalu terdapat slider untuk menentukan range peramalan yang diinginkan, terdapat tabel hasil peramalan, dan terakhir terdapat grafik sebagai visualisasi data yang telah berhasil dilakukan peramalan. Interaksi pengguna dengan sistem hanya berupa masukan (input) range peramalan, selain itu, user hanya dapat melihat dan mengamati konten pada tampilan tersebut. Grafik yang ada dapat ditampilkan sebagai image dengan perbesaran yang cukup jelas. Fitur tersebut merupakan bawaan library Streamlit yang digunakan. Penjelasan lebih lanjut masing-masing tampilan akan dijelaskan pada bagian berikutnya.. Gambar 7. Pembacaan Data BPS KAI. Gambar 7 menampilkan potongan data dari urutan baris paling atas, tengah, dan bawah dalam ribuan. Data berjumlah 168 baris ini yang kemudian akan diolah sehingga dapat menghasilkan peramalan data masa depan. Sebelumnya, file. 13.

(15) tersebut berisi data jumlah penumpang kereta api dengan tiga pembagian utama yaitu Sumatera, Jabodetabek, dan Jawa non-Jabodetabek. Namun, dalam penelitian ini hanya diperlukan data jumlah penumpang kereta api di pulau Jawa saja, sehingga penulis membuang data jumlah penumpang pulau Sumatera, dan hanya menggunakan data jumlah penumpang Jawa (Jabodetabek dan non-Jabodetabek). Kemudian penulis mengganti penamaan bulan menjadi kode angka, misalnya bulan Januari menjadi 01, bulan Februari menjadi 02, bulan Maret menjadi 03, dst. Penyuntingan data tersebut dilakukan menggunakan aplikasi Microsoft Office Excel. Namun ketika dibaca menggunakan Python Pandas terdapat penambahan tanggal yang secara otomatis tertampil tanggal 1 dan kode bulan kembali menjadi nama bulan dengan singkatan, seperti Jan (Januari), Feb (Februari), Mar (Maret), dst. Bagian ini tidak mempengaruhi penghitungan sama sekali karena bukan terletak pada kolom jumlah penumpang (Count).. Gambar 8. Grafik data awal. Gambar 8 adalah visualisasi data awal atau data asli. Pengelompokan berdasarkan tahun terjadi secara otomatis oleh library Streamlit. Pada grafik tersebut terlihat bahwa pada tahun 2006 s/d 2012 jumlah penumpang cenderung sideway atau cenderung datar dengan gerak yang tidak terlalu fluktuatif dengan jumlah penumpang yang berkisar antara 10 juta hingga hampir 18 juta penumpang setiap bulannya. Kemudian pada periode 2013 s/d 2019 terjadi trend naik yang cukup signifikan ditandai dengen line chart yang naik sebanyak lima grid secara keseluruhan. Jumlah penumpang mengalami kenaikan dari kisaran 10 juta penumpang di tahun 2013 menjadi hampir 40 juta penumpang di tahun 2019. Melalui grafik tersebut dapat dilihat bahwa trend keseluruhan adalah naik, artinya semakin banyak jumlah penumpang kereta api setiap tahunnya, dan jumlah ratarata penumpang setiap bulan hampir 22 juta penumpang.. Gambar 9. Range Slider peramalan. 14.

(16) Setelah mengetahui visualisasi data awal dan pengguna dapat melihat sekilas trend datanya seperti apa, pengguna dapat memilih periode peramalan. Gambar 9 menunjukkan fungsi yang dapat dilakukan oleh pengguna yaitu menentukan sendiri periode waktu (bulan) yang diinginkan untuk meramalkan datanya. Pada penelitian ini, data training mengambil sekitar 90% dari jumlah baris data awal yaitu sebanyak 150 data, dan sisanya digunakan untuk data training, yaitu sebanyak 18 data, oleh karena itu angka pertama bukan 0 namun 18. Angka 18 menunjukkan jumlah data testing yang memerlukan 18 data, sehingga ketika pengguna mengatur posisi slider pada angka 18, tidak ada angka peramalan untuk bulan atau tahun berikutnya, melainkan tetap terjadi pengolahan data peramalan untuk data ke-0 s/d ke-167 atau sesuai dengan banyaknya data asli. Jika pengguna mengiginkan peramalan data selama setahun ke depan, maka slider dapat diposisikan pada angka 30 (18 + 12 bulan). Pada potongan gambar di atas slider secara default berada pada angka 78, hal ini menunjukkan periode peramalan selama 60 bulan atau 5 tahun. Periode maksimal yang dapat dipilih adalah 120 bulan (138 – 18) atau selama 10 tahun. Ketika pengguna menggeser posisi slider untuk menentukan periode peramalan maka halaman akan melakukan reload atau refresh dan kemudian data hasil peramalan akan ditampilkan dalam tabel dan grafik.. Gambar 10. Tabel data hasil peramalan. Gambar 10 menunjukkan tabel hasil peramalan data jumlah penumpang kereta api di pulau Jawa disertai dengan keterangan nilai MAPE sebesar 1,24% yang masuk kategori sangat baik (< 10%). Tabel tersebut tidak menunjukkan data berdasarkan nama bulan namun hanya berdasarkan urutan, dimulai dari data ke-0 sampai data ke-227, dalam kasus peramalan selama 60 bulan (slider posisi 70). Data ke-0 sampai data ke-167 menunjukkan bulan Januari 2006 sampai Desember 2019,. 15.

(17) sehingga data berikutnya yaitu data ke-186 menunjukkan peramalan untuk bulan Januari 2020, dan seterusya sampai data ke-227 yang berarti bulan Desember 2024.. Gambar 11. Grafik visualisasi data hasil peramalan. Gambar 11 merupakan visualisasi data hasil peramalan dalam bentuk grafik. Pada grafik tersebut, garis kuning menunjukkan data asli, dan garis biru merupakan data peramalan mulai dari data ke-0 sampai data ke-227. Dari grafik tersebut dapat dilihat bahwa trend naik akan terus terjadi sekalipun ada saat dimana jumlah penumpang menurun, atau saat-saat seasonal. Peramalan ini menunjukkan bahwa jumlah penumpang kereta api di pulau Jawa pada akhir tahun 2024 mendekati 45 juta penumpang. Perbandingan data asli dan data hasil peramalan dapat dilihat pada Tabel 2. Tabel di bawah ini menunjukkan 12 baris pertama data asli dan 12 baris pertama data peramalan, serta 12 baris terakhir data asli dan 12 baris terakhir data peramalan, data dalam ribuan. Dari data-data berikut, terjadi rentang error paling besar sekitar 8,6% yaitu pada data ke-1 dan akurasi 100% pada data ke-0. Namun, secara rata-rata keseluruhan hasil peramalan, memperoleh nilai Mean Absolute Percentage Error (MAPE) sebesar 1,24%, seperti yang telah disebutkan di bagian sebelumnya. Tabel 2. Perbandingan Data Asli dan Peramalan (dalam ribuan). Data ke0 1 2 3 4 5 6 7 8 9 10 11. Bulan Januari ‘06 Februari ‘06 Maret ‘06 April ‘06 Mei ‘06 Juni ‘06 Juli ‘06 Agustus ‘06 September ‘06 Oktober ‘06 November ‘06 Desember ‘06. Data Asli 11504 11705 13066 12657 13312 12929 14087 12991 13183 13949 13369 13344. 16. Peramalan 11504 10698 12310 12134 12863 12745 13774 13050 13240 13886 13499 13495. Persentase 100% 91,4% 94,2% 95,8% 96,6% 98,6% 97,8% 99,5% 99,6% 99,5% 99% 98,9%.

(18) 156 157 158 159 160 161 162 163 164 165 166 167. Januari ‘19 Februari ‘19 Maret ‘19 April ‘19 Mei ‘19 Juni ‘19 Juli ‘19 Agustus ‘19 September ‘19 Oktober ‘19 November ‘19 Desember ‘19. ... 34435 31282 35068 35106 34514 34261 38303 34542 34615 35814 35228 36710. 34807 31664 35929 35420 36026 33847 36881 35817 35121 36910 35991 38069. 98,9% 98,8% 97,5% 99% 95,8% 98% 96,3% 96,4% 98,5% 97% 97,8% 96,4%. Selain tabel perbandingan data jumlah penumpang yang asli dan hasil peramalan di atas, perlu tabel yang menunjukkan hasil peramalan selama 60 bulan berikutnya, yaitu data ke-168 s/d data ke-227 yang akan ditampilkan pada Tabel 3 berikut, sehingga dapat diketaui dengan lebih jelas angka pastinya, tidak sekadar dengan melihat grafik. Tabel 3. Data Hasil Peramalan (dalam ribuan). Data ke168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191. Jumlah 36126 32983 37247 36739 37345 35166 38200 37135 36440 38229 37311 39388 37445 34301 38566 38057 38664 36485 39519 38454 37759 39548 38630 40706. Data ke192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215. Jumlah 38764 35620 39885 39376 39983 37804 40837 39773 39077 40866 39948 42025 40082 35939 41204 40695 41301 39122 42156 41092 40396 42185 41267 43344. 17. Data ke216 217 218 219 220 221 222 223 224 225 226 227. Jumlah 41401 38258 42522 42014 42620 40441 43475 42410 41715 43504 42586 44663.

(19) Data dan hasil di atas diproses menggunakan beberapa fungsi yang dapat dilihat pada daftar kode program berikut. Kode Program 2. Membaca data .csv dan plotting awal 1. dataKAI = pd.read_csv('bps_KAI.csv', parse_dates=[ time_col], index_col=time_col) 2. st.dataframe(dataKAI) 3. st.line_chart(dataKAI). Kode Program di atas merupakan proses awal untuk membaca data berupa file .csv yang sudah disunting sebelumnya dan berada dalam satu folder yang sama dengan file sourcecode. Program membaca file setiap kali terjadi running program dan tidak menyimpan dalam database. Library Streamlit memiliki fungsi bawaan bernama dataframe untuk menampilkan data dalam bentuk tabel dan fungsi line_chart untuk membuat visualisasi data dalam bentuk grafik garis. Kode Program 3. Range slider dan test size 1. rnge = st.slider('Prediksi selama (bulan):', 18, 138, (78)) 2. def __init__(self, season_len=12, alpha=0.59, beta=0.21, gamma=0.46): self.alpha = alpha self.beta = beta self.gamma = gamma self.season_len = season_len ... 3. test_size = 18 4. data = series.values[:-test_size] 5. opt = minimize(tripleExponentialSmoothing_score, x0=x, args=(data, mean_squared_log_error), method='TNC'). Kode Program 3 merupakan bagian yang mengatur fungsi range peramalan, dengan memanggil fungsi “st.slider” bawaan Streamlit. Selanjutnya perlu ditentukan juga besaran alpha, beta, dan gamma sebagai konstanta pemulusan untuk proses perhitungan Holt-Winter (Triple Exponential Smoothing). Lalu pada bagian berikutnya ditentukan ukuran test_size sebesar 18 sesuai dengan yang dijelaskan pada bagian sebelumnya yaitu sekitar 10% dari keseluruhan data asli. Kode Program 4. Menampilkan hasil Peramalan 1. predict = pd.DataFrame(predictions, columns=['Count']).astype('int32') 2. st.write('Tabel Prediksi (dalam ribuan)') 3. st.dataframe(predict). 4. def mape(y_true, y_pred): return np.mean(np.abs((y_true - y_pred) / y_true)) * 100 5. data = series.values 6. error = mape(data, predictions[:len(series)]) 7. st.write('MAPE: {0: .2f}%'.format(error)). 18.

(20) Setelah proses perhitungan berjalan lancar, maka selanjutnya adalah menampilkannya dalam bentuk tabel dan grafik. Sebelum ditampilkan dengan library Streamlit, perlu dijadikan bentuk dataframe Pandas (pd) terlebih dahulu, kemudian dapat ditampilkan dalam format tabel Streamlit. Setelahnya, perlu diketahui nilai MAPE untuk mengetahui konfigurasi besaran test size, alpha, beta, dan gamma sudah optimal atau belum. Perhitungan dan cara menampilkan MAPE seperti tertera pada Kode Program 4. Kode Program 5. Menampilkan visualisasi akhir 1. 2. 3. 4. 5. 6. 7.. plt.figure(figsize=(15, 5)) plt.plot(predictions, label='Prediction') plt.plot(data, label='Actual') plt.axvspan(len(series) - test_size, len(predictions), color='lightgrey') plt.grid(True) plt.legend(loc='best') st.pyplot(). Kode Program 5 merupakan bagian terakhir, yaitu untuk menampilkan visualisasi hasil peramalan. Data yang sudah diproses tidak dapat ditampilkan secara langsung, melainkan harus diubah menjadi plotting (plt) terlebih dahulu, dan setelahnya dapat ditampilkan dengan Streamlit melalui perintah “st.pyplot()” menjadi seperti pada Gambar 11. 5.. Kesimpulan Peramalan jumlah penumpang kereta api di pulau Jawa dapat dilakukan dengan metode Triple Exponential Smoothing (Holt-Winter) dan menghasilkan akurasi yang baik dengan tingkat error seminimal mungkin. Dengan dibuatnya peramalan yang dinamis seperti ini, memungkinkan pengguna untuk melakukan peramalan sesuai kebutuhan, serta dapat berguna bagi pihak terkait untuk mengantisipasi lonjakan penumpang dan dapat menyediakan jumlah perjalanan dengan kapasitas yang mencukupi. Penelitian ini dapat dikembangkan lebih lanjut dengan penambahan fitur untuk mengetahui daerah-daerah yang memiliki jadwal perjalanan yang padat dan yang memiliki jadwal perjalanan yang cukup lengang. Visualisasi juga dapat diperbaiki agar lebih intuitif dan variatif, seiring semakin berkembangnya library Streamlit. 6. Daftar Pustaka [1] A. R. Muslikh, H. A. Santoso, A. Marjuni, P. Teknik, I. Universitas, and D. Nuswantoro, “Klasifikasi Data Time Series Arus Lalu Lintas Jangka Pendek Menggunakan Algoritma Adaboost dengan Random Forest,” vol. 14, pp. 24– 38, 2018. [2] Badan Pusat Statistik, “Jumlah Penumpang Kereta Api Indonesia tahun 2006-2019,” Badan Pusat Statistik, Jakarta, 2019. [3] F. D. Leni and D. Yamin, “Peramalan Jumlah Penumpang Kereta Api Menggunakan Metode Moving Average dan Holt Winter,” vol. 1, pp. 375– 379, 2018. [4] I. Nurvianti, B. D. Setiawan, and F. A. Bachtiar, “Perbandingan Peramalan. 19.

(21) [5]. [6]. [7]. [8]. [9] [10] [11] [12]. [13]. [14]. [15]. [16] [17]. Jumlah Penumpang Keberangkatan Kereta Api di DKI Jakarta Menggunakan Metode Double Exponential Smoothing dan Triple Exponential Smoothing,” vol. 3, no. 6, pp. 5257–5263, 2019. Raihan, M. S. Eff, and A. Hendrawan, “Forecasting Model Eksponensial Smoothing Time Series Rata Rata Mechanical Availability Unit Off Highway Truck Cat 777D Caterpillar,” Poros Tek., vol. 8, no. 1, pp. 1–9, 2016. V. R. Sutrisno, “Analisis Forecasting untuk Data Penjualan Menggunakan Metode Simple Moving Average dan Single Exponential Smoothing : Studi Kasus PT Guna Kemas Indah,” pp. 17–18, 2013. F. T. Informasi, “Artificial Neural Network Power Bi Dashboard Visualization And Forecasting Number Of Dengue Hemorrhagic Fever Cases In Malang Regency Using Artificial Neural Network.” K. Singh, S. Shastri, and A. S. Bhadwal, “Implementation of Exponential Smoothing for Forecasting Time Series Data,” Int. J. Sci. Res. Comput. Sci. Appl. Manag. Stud., no. February, 2019. D. Moritz, “Interactive Systems for Scalable Visualization and Analysis,” Univ. Washingt., pp. 10–12, 2019. Python Org., “Python,” 2019. [Online]. Available: https://www.python.org/about/. [Accessed: 02-Dec-2019]. Streamlit Open-Source Org., “Streamlit,” 2019. [Online]. Available: https://streamlit.io/docs/. [Accessed: 02-Dec-2019]. S. Mulyana, E. Winarko, P. Studi, I. Komputer, and U. G. Mada, “Teknik Visualisasi Dalam Data Mining,” vol. 2009, no. semnasIF, pp. 100–106, 2009. M. W. Pertiwi, M. F. Adiwisastra, and D. Supriadi, “Analisa Komparasi Menggunakan 5 Metode Data Mining dalam Klasifikasi Persentase Wanita Sudah menikah di Usia 15-49 yang Memakai Alat KB (Keluarga Berencana),” J. Khatulistiwa Inform., vol. 7, no. 1, pp. 37–42, 2019. V. W. Sukma, “Pemodelan Prediksi Curah Hujan Menggunakan Metode Holt-Winters sebagai Faktor Dominan dalam Penentuan Pola Cocok Tanam (Studi Kasus : Kabupaten Boyolali),” 2015. F. Pangestu, A. W. Widodo, and B. Rahayudi, “Prediksi Jumlah Kendaraan Bermotor di Indonesia Menggunakan Metode Average-Based Fuzzy Time Series Models,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 9, pp. 2923–2929, 2018. N. Ayunda, “Time Series Dengan Jaringan Syaraf Tiruan RBF DAN FRBF,” J. Mat. dan Pendidik. Mat., vol. II, no. 2, p. 72, 2017. E. G. Permata and N. F. Yani, “Analisa Perbandingan Metode Exponensial Smoothing dan Metode Trend Analysis Terhadap Parameter Tingkat Error Pada Peramalan Permintaan Produk Ready Mix Concrete ( Studi Kasus : Pt . Iga Bina Mix Pekanbaru ),” no. November, p. 509, 2015.. 20.

(22)

Referensi

Dokumen terkait

Kesalahan prosedur yang dingkapkan oleh majelis hakim dalam pertimbangan terhadap tuntutan Jaksa Penuntut Umum perihal KEPMENDAGRI Nomor 32 Tahun 1999 juga

• Jika kita sudah memiliki weblog, maka sampaikan alamat weblog tersebut pada teman, relasi, kolega, mahasiswa supaya mereka dapat meng-akses weblog kita. • Kita juga dapat

   Program Mapping berguna sebagai persiapan imlementasi e-learning apakah menggunakan LMS, authoring tools, atau pemrogranman

- Menimbang, bahwa mengenai dakwaan alternatif Kesatu melanggar Pasal 114 ayat (2) Undang Undang Nomor 35 Tahun 2009 tentang Narkotika dan dakwaan alternatif Kedua

[r]

Tetapi pada pemodelan breaking ini, seperti pada model sebelumnya, proses breaking masih belum otomatis, yaitu digunakan kriteria breaking dimana pada saat γ pada Persamaan

Penelitian – penelitian mengenai strategi bisnis, keterlibatan karyawan dan kinerja perusahaan, membuat peneliti ingin lebih melengkapi evaluasi kinerja menggunakan

Dengan menganalisis media melalui bentuk penyajian dan cara penyajiannya, kita mendapatkan suatu format klasifikasi yang meliputi tujuh kelompok media penyaji, yaitu (a)