PREDIKSI PEMBATALAN PEMESANAN HOTEL
MENGGUNAKAN OPTIMALISASI HIPERPARAMETER
PADA ALGORITMA RANDOM FOREST
Laporan Tugas Akhir
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Informatika Universitas Muhammadiyah Malang
Moch. Chamdani Mustaqim (201710370311285)
Bidang Minat
(Data Science)
PROGRAM STUDI INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2021
LEMBAR PERSETUJUAN
PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN
OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM
FOREST
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui, Malang, 15 Januari 2021
Pembimbing I
Yufis Azhar, S.Kom, M.Kom NIDN. 0728088701
Pembimbing II
Agus Eko Minarno, S.Kom, M.Kom NIDN. 0729118203
3
LEMBAR PENGESAHAN
PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN
OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM
FOREST
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh :
Moch. Chamdani Mustaqim NIM. 201710370311285
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal
Menyetujui, Penguji I
Gita Indah Marthasari, S.T, M.Kom NIDN. 0720038101
Penguji II
Mahar Faiqurahman, S.Kom, M.T NIDN. 0719118302
Mengetahui,
4
Gita Indah Marthasari, S.T, M.Kom NIDN. 0720038101
LEMBAR PERNYATAAN
Yang bertanda tangan dibawah ini :
NAMA : MOCH. CHAMDANI MUSTAQIM
NIM : 201710370311285
FAK./JUR. : TEKNIK/INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul
“PREDIKSI
PEMBATALAN
PEMESANAN
HOTEL
MENGGUNAKAN
OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM
FOREST”
beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui,
Dosen Pembimbing
Malang, 15 Januari 2021 Yang Membuat Pernyataan
5
6
ABSTRAK
Pembatalan pemesanan hotel oleh pelanggan sangat mempengaruhi pengambilan keputusan manajerial hotel. Guna meminimalkan kerugian akibat masalah ini, pihak pengelola hotel membuat kebijakan yang cukup kaku yang dapat merusak reputasi dan kinerja bisnis. Oleh karena itu, penelitian ini berfokus pada penyelesaian masalah tersebut menggunakan algoritma pembelajaran mesin. Untuk mendapatkan performa model terbaik, optimalisasi hiperparameter diterapkan pada algoritma random forest. Hal tersebut bertujuan untuk mendapatkan kombinasi parameter model yang terbaik dalam memprediksi pembatalan pemesanan hotel. Model yang diusulkan terbukti memiliki kinerja terbaik dengan hasil akurasi tertinggi 87%. Hasil dari penelitian ini dapat digunakan sebagai komponen model dalam sistem pengambilan keputusan manajerial hotel terkait pembatalan pemesanan di masa mendatang.
7
ABSTRACT
Cancellation of hotel bookings by customers greatly influences hotel managerial decision making. In order to minimize losses due to this problem, the hotel management made a fairly rigid policy that could damage the reputation and business performance. Therefore, this study focuses on solving these problems using machine learning algorithms. To get the best model performance, hyperparameter optimization is applied to the random forest algorithm. It aims to obtain the best combination of model parameters in predicting hotel booking cancellations. The proposed model is proven to have the best performance with the highest accuracy results of 87%. The results of this study can be used as a model component in hotel managerial decision-making system related to the cancellation of future bookings.
8
LEMBAR PERSEMBAHAN
Puji syukur kepada Allah SWT atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada :
1. Ibu sebagai orang tua yang telah mendidik, mendoakan, membesarkan, serta selalu memberikan yang terbaik kepada penulis.
2. Ika Setyawati sebagai keluarga yang telah memberikan support dalam banyak hal dan telah memotivasi penulis untuk selalu belajar dan berkembang menjadi pribadi yang baik dan berguna bagi banyak orang.
3. Bapak Agus Eko Minarno, S.Kom, M.Kom dan bapak Yufis Azhar, S.Kom, M.Kom. selaku mentor yang telah bersedia meluangkan waktu untuk membantu dan membimbing penulis dalam hal terkait tugas akhir.
4. Bapak Dekan Fakultas Teknik Universitas Muhammadiyah Malang.
5. Ibu Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Malang.
6. Seluruh Bapak dan Ibu Dosen Pengajar yang telah memberikan ilmunya dan Staff TU jurusan Teknik Informatika.
7. Seluruh rekan asisten yang telah memberikan motivasi untuk terus belajar dan berkembang. 8. Seluruh sahabat saya di Informatika UMM yang mana tidak bisa saya sebutkan satu per satu.
Malang, 15 Januari 2021
9
KATA PENGANTAR
Dengan memanjatkan puji syukur kehadirat Allah SWT. Atas limpahan rahmat dan hidayah-NYA sehingga peneliti dapat menyelesaikan tugas akhir yang berjudul :
“PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN
OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM
FOREST”
Di dalam tulisan ini disajikan pokok – pokok bahasan yang meliputi latar belakang, metode penelitian, dan hasil dan pembahasan yang telah didapat dari penelitian ini dan telah disimpulkan berdasarkan hasil yang telah didapat oleh peneliti. Peneliti menyadari sepenuhnya bahwa dalam penulisan tugas akhir ini masih banyak kekurangan dan keterbatasan. Oleh karena itu peneliti mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu pengetahuan.
Malang, 15 Januari 2021
14
DAFTAR PUSTAKA
[1] S. Kitamori, H. Sakai, and H. Sakaji, “Extraction of sentences concerning business performance forecast and economic forecast from summaries of financial statements by deep learning,” 2018, doi: 10.1109/SSCI.2017.8285335.
[2] N. Antonio, A. De Almeida, and L. Nunes, “Predicting hotel bookings cancellation with a machine learning classification model,” Proc. - 16th IEEE Int. Conf. Mach. Learn.
Appl. ICMLA 2017, vol. 2017-Decem, pp. 1049–1054, 2017, doi:
10.1109/ICMLA.2017.00-11.
[3] N. Antonio, A. de Almeida, and L. Nunes, “Predicting hotel booking cancellations to decrease uncertainty and increase revenue,” Tour. Manag. Stud., vol. 13, no. 2, pp. 25– 39, 2017, doi: 10.18089/tms.2017.13203.
[4] L. Rokach, “Decision forest: Twenty years of research,” Inf. Fusion, vol. 27, pp. 111– 125, 2016, doi: 10.1016/j.inffus.2015.06.005.
[5] P. Fernandez-Gonzalez, C. Bielza, and P. Larranaga, “Random Forests for Regression as a Weighted Sum of k-Potential Nearest Neighbors,” IEEE Access, vol. 7, pp. 25660– 25672, 2019.
[6] M. C. M. Oo and T. Thein, “Hyperparameters optimization in scalable random forest for big data analytics,” 2019, doi: 10.1109/CCOMS.2019.8821752.
[7] B. H. Shekar and G. Dagnew, “Grid search-based hyperparameter tuning and classification of microarray cancer data,” 2019, doi: 10.1109/ICACCP.2019.8882943. [8] T. Wang et al., “Random Forest-Bayesian Optimization for Product Quality Prediction
with Large-Scale Dimensions in Process Industrial Cyber-Physical Systems,” IEEE Internet Things J., 2020, doi: 10.1109/JIOT.2020.2992811.
[9] E. Hazan, A. Klivans, and Y. Yuan, “Hyperparameter optimization: A spectral approach,” arXiv. 2017.
[10] J. Bergstra and Y. Bengio, “Random search for hyper-parameter optimization,” J. Mach. Learn. Res., 2012.
15
[11] J. Li, S. Ma, T. Le, L. Liu, and J. Liu, “Causal Decision Trees,” IEEE Trans. Knowl. Data Eng., vol. 29, no. 2, pp. 257–271, 2017, doi: 10.1109/TKDE.2016.2619350.
[12] J. S. Lee, “AUC4.5: AUC-Based C4.5 Decision Tree Algorithm for Imbalanced Data Classification,” IEEE Access, 2019, doi: 10.1109/ACCESS.2019.2931865.
[13] T. Chen and C. Guestrin, “XGBoost: A scalable tree boosting system,” 2016, doi: 10.1145/2939672.2939785.
[14] M. Chen, Q. Liu, S. Chen, Y. Liu, C. H. Zhang, and R. Liu, “XGBoost-Based Algorithm Interpretation and Application on Post-Fault Transient Stability Status Prediction of Power System,” IEEE Access, 2019, doi: 10.1109/ACCESS.2019.2893448.
[15] N. Li, B. Li, and L. Gao, “Transient Stability Assessment of Power System Based on XGBoost and Factorization Machine,” IEEE Access, 2020, doi: 10.1109/ACCESS.2020.2969446.
[16] S. Georganos, T. Grippa, S. Vanhuysse, M. Lennert, M. Shimoni, and E. Wolff, “Very High Resolution Object-Based Land Use-Land Cover Urban Classification Using Extreme Gradient Boosting,” IEEE Geosci. Remote Sens. Lett., vol. 15, no. 4, pp. 607– 611, 2018, doi: 10.1109/LGRS.2018.2803259.
[17] D. Zhang, L. Qian, B. Mao, C. Huang, B. Huang, and Y. Si, “A Data-Driven Design for Fault Detection of Wind Turbines Using Random Forests and XGboost,” IEEE Access, vol. 6, no. c, pp. 21020–21031, 2018, doi: 10.1109/ACCESS.2018.2818678.
[18] L. Breiman, “Random forests,” Mach. Learn., vol. 45, no. 1, pp. 5–32, 2001, doi: 10.1023/A:1010933404324.
[19] Y. Dong, B. Du, and L. Zhang, “Target detection based on random forest metric learning,” IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens., vol. 8, no. 4, pp. 1830– 1838, 2015, doi: 10.1109/JSTARS.2015.2416255.
[20] A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indones. J. Artif. Intell. Data Min., vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.
16
[21] D. Marinov and D. Karapetyan, “Hyperparameter optimisation with early termination of poor performers,” 2019 11th Comput. Sci. Electron. Eng. Conf. CEEC 2019 - Proc., pp. 160–163, 2019, doi: 10.1109/CEEC47804.2019.8974317.
[22] B. Nakisa, M. N. Rastgoo, A. Rakotonirainy, F. Maire, and V. Chandran, “Long short term memory hyperparameter optimization for a neural network based emotion recognition framework,” IEEE Access, vol. 6, pp. 49325–49338, 2018, doi: 10.1109/ACCESS.2018.2868361.
[23] M. Feurer and F. Hutter, Hyperparameter Optimization. 2019.
[24] N. Antonio, A. de Almeida, and L. Nunes, “Hotel booking demand datasets,” Data Br., vol. 22, pp. 41–49, 2019, doi: 10.1016/j.dib.2018.11.126.
[25] C. Seger, “An investigation of categorical variable encoding techniques in machine learning: binary versus one-hot and feature hashing,” Degree Proj. Technol., p. 41, 2018.