• Tidak ada hasil yang ditemukan

PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM FOREST. Laporan Tugas Akhir

N/A
N/A
Protected

Academic year: 2021

Membagikan "PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM FOREST. Laporan Tugas Akhir"

Copied!
17
0
0

Teks penuh

(1)

PREDIKSI PEMBATALAN PEMESANAN HOTEL

MENGGUNAKAN OPTIMALISASI HIPERPARAMETER

PADA ALGORITMA RANDOM FOREST

Laporan Tugas Akhir

Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Informatika Universitas Muhammadiyah Malang

Moch. Chamdani Mustaqim (201710370311285)

Bidang Minat

(Data Science)

PROGRAM STUDI INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2021

(2)

LEMBAR PERSETUJUAN

PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN

OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM

FOREST

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Menyetujui, Malang, 15 Januari 2021

Pembimbing I

Yufis Azhar, S.Kom, M.Kom NIDN. 0728088701

Pembimbing II

Agus Eko Minarno, S.Kom, M.Kom NIDN. 0729118203

(3)

3

LEMBAR PENGESAHAN

PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN

OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM

FOREST

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Disusun Oleh :

Moch. Chamdani Mustaqim NIM. 201710370311285

Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal

Menyetujui, Penguji I

Gita Indah Marthasari, S.T, M.Kom NIDN. 0720038101

Penguji II

Mahar Faiqurahman, S.Kom, M.T NIDN. 0719118302

Mengetahui,

(4)

4

Gita Indah Marthasari, S.T, M.Kom NIDN. 0720038101

LEMBAR PERNYATAAN

Yang bertanda tangan dibawah ini :

NAMA : MOCH. CHAMDANI MUSTAQIM

NIM : 201710370311285

FAK./JUR. : TEKNIK/INFORMATIKA

Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul

“PREDIKSI

PEMBATALAN

PEMESANAN

HOTEL

MENGGUNAKAN

OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM

FOREST”

beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.

Mengetahui,

Dosen Pembimbing

Malang, 15 Januari 2021 Yang Membuat Pernyataan

(5)

5

(6)

6

ABSTRAK

Pembatalan pemesanan hotel oleh pelanggan sangat mempengaruhi pengambilan keputusan manajerial hotel. Guna meminimalkan kerugian akibat masalah ini, pihak pengelola hotel membuat kebijakan yang cukup kaku yang dapat merusak reputasi dan kinerja bisnis. Oleh karena itu, penelitian ini berfokus pada penyelesaian masalah tersebut menggunakan algoritma pembelajaran mesin. Untuk mendapatkan performa model terbaik, optimalisasi hiperparameter diterapkan pada algoritma random forest. Hal tersebut bertujuan untuk mendapatkan kombinasi parameter model yang terbaik dalam memprediksi pembatalan pemesanan hotel. Model yang diusulkan terbukti memiliki kinerja terbaik dengan hasil akurasi tertinggi 87%. Hasil dari penelitian ini dapat digunakan sebagai komponen model dalam sistem pengambilan keputusan manajerial hotel terkait pembatalan pemesanan di masa mendatang.

(7)

7

ABSTRACT

Cancellation of hotel bookings by customers greatly influences hotel managerial decision making. In order to minimize losses due to this problem, the hotel management made a fairly rigid policy that could damage the reputation and business performance. Therefore, this study focuses on solving these problems using machine learning algorithms. To get the best model performance, hyperparameter optimization is applied to the random forest algorithm. It aims to obtain the best combination of model parameters in predicting hotel booking cancellations. The proposed model is proven to have the best performance with the highest accuracy results of 87%. The results of this study can be used as a model component in hotel managerial decision-making system related to the cancellation of future bookings.

(8)

8

LEMBAR PERSEMBAHAN

Puji syukur kepada Allah SWT atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada :

1. Ibu sebagai orang tua yang telah mendidik, mendoakan, membesarkan, serta selalu memberikan yang terbaik kepada penulis.

2. Ika Setyawati sebagai keluarga yang telah memberikan support dalam banyak hal dan telah memotivasi penulis untuk selalu belajar dan berkembang menjadi pribadi yang baik dan berguna bagi banyak orang.

3. Bapak Agus Eko Minarno, S.Kom, M.Kom dan bapak Yufis Azhar, S.Kom, M.Kom. selaku mentor yang telah bersedia meluangkan waktu untuk membantu dan membimbing penulis dalam hal terkait tugas akhir.

4. Bapak Dekan Fakultas Teknik Universitas Muhammadiyah Malang.

5. Ibu Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Malang.

6. Seluruh Bapak dan Ibu Dosen Pengajar yang telah memberikan ilmunya dan Staff TU jurusan Teknik Informatika.

7. Seluruh rekan asisten yang telah memberikan motivasi untuk terus belajar dan berkembang. 8. Seluruh sahabat saya di Informatika UMM yang mana tidak bisa saya sebutkan satu per satu.

Malang, 15 Januari 2021

(9)

9

KATA PENGANTAR

Dengan memanjatkan puji syukur kehadirat Allah SWT. Atas limpahan rahmat dan hidayah-NYA sehingga peneliti dapat menyelesaikan tugas akhir yang berjudul :

“PREDIKSI PEMBATALAN PEMESANAN HOTEL MENGGUNAKAN

OPTIMALISASI HIPERPARAMETER PADA ALGORITMA RANDOM

FOREST”

Di dalam tulisan ini disajikan pokok – pokok bahasan yang meliputi latar belakang, metode penelitian, dan hasil dan pembahasan yang telah didapat dari penelitian ini dan telah disimpulkan berdasarkan hasil yang telah didapat oleh peneliti. Peneliti menyadari sepenuhnya bahwa dalam penulisan tugas akhir ini masih banyak kekurangan dan keterbatasan. Oleh karena itu peneliti mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu pengetahuan.

Malang, 15 Januari 2021

(10)
(11)
(12)
(13)
(14)

14

DAFTAR PUSTAKA

[1] S. Kitamori, H. Sakai, and H. Sakaji, “Extraction of sentences concerning business performance forecast and economic forecast from summaries of financial statements by deep learning,” 2018, doi: 10.1109/SSCI.2017.8285335.

[2] N. Antonio, A. De Almeida, and L. Nunes, “Predicting hotel bookings cancellation with a machine learning classification model,” Proc. - 16th IEEE Int. Conf. Mach. Learn.

Appl. ICMLA 2017, vol. 2017-Decem, pp. 1049–1054, 2017, doi:

10.1109/ICMLA.2017.00-11.

[3] N. Antonio, A. de Almeida, and L. Nunes, “Predicting hotel booking cancellations to decrease uncertainty and increase revenue,” Tour. Manag. Stud., vol. 13, no. 2, pp. 25– 39, 2017, doi: 10.18089/tms.2017.13203.

[4] L. Rokach, “Decision forest: Twenty years of research,” Inf. Fusion, vol. 27, pp. 111– 125, 2016, doi: 10.1016/j.inffus.2015.06.005.

[5] P. Fernandez-Gonzalez, C. Bielza, and P. Larranaga, “Random Forests for Regression as a Weighted Sum of k-Potential Nearest Neighbors,” IEEE Access, vol. 7, pp. 25660– 25672, 2019.

[6] M. C. M. Oo and T. Thein, “Hyperparameters optimization in scalable random forest for big data analytics,” 2019, doi: 10.1109/CCOMS.2019.8821752.

[7] B. H. Shekar and G. Dagnew, “Grid search-based hyperparameter tuning and classification of microarray cancer data,” 2019, doi: 10.1109/ICACCP.2019.8882943. [8] T. Wang et al., “Random Forest-Bayesian Optimization for Product Quality Prediction

with Large-Scale Dimensions in Process Industrial Cyber-Physical Systems,” IEEE Internet Things J., 2020, doi: 10.1109/JIOT.2020.2992811.

[9] E. Hazan, A. Klivans, and Y. Yuan, “Hyperparameter optimization: A spectral approach,” arXiv. 2017.

[10] J. Bergstra and Y. Bengio, “Random search for hyper-parameter optimization,” J. Mach. Learn. Res., 2012.

(15)

15

[11] J. Li, S. Ma, T. Le, L. Liu, and J. Liu, “Causal Decision Trees,” IEEE Trans. Knowl. Data Eng., vol. 29, no. 2, pp. 257–271, 2017, doi: 10.1109/TKDE.2016.2619350.

[12] J. S. Lee, “AUC4.5: AUC-Based C4.5 Decision Tree Algorithm for Imbalanced Data Classification,” IEEE Access, 2019, doi: 10.1109/ACCESS.2019.2931865.

[13] T. Chen and C. Guestrin, “XGBoost: A scalable tree boosting system,” 2016, doi: 10.1145/2939672.2939785.

[14] M. Chen, Q. Liu, S. Chen, Y. Liu, C. H. Zhang, and R. Liu, “XGBoost-Based Algorithm Interpretation and Application on Post-Fault Transient Stability Status Prediction of Power System,” IEEE Access, 2019, doi: 10.1109/ACCESS.2019.2893448.

[15] N. Li, B. Li, and L. Gao, “Transient Stability Assessment of Power System Based on XGBoost and Factorization Machine,” IEEE Access, 2020, doi: 10.1109/ACCESS.2020.2969446.

[16] S. Georganos, T. Grippa, S. Vanhuysse, M. Lennert, M. Shimoni, and E. Wolff, “Very High Resolution Object-Based Land Use-Land Cover Urban Classification Using Extreme Gradient Boosting,” IEEE Geosci. Remote Sens. Lett., vol. 15, no. 4, pp. 607– 611, 2018, doi: 10.1109/LGRS.2018.2803259.

[17] D. Zhang, L. Qian, B. Mao, C. Huang, B. Huang, and Y. Si, “A Data-Driven Design for Fault Detection of Wind Turbines Using Random Forests and XGboost,” IEEE Access, vol. 6, no. c, pp. 21020–21031, 2018, doi: 10.1109/ACCESS.2018.2818678.

[18] L. Breiman, “Random forests,” Mach. Learn., vol. 45, no. 1, pp. 5–32, 2001, doi: 10.1023/A:1010933404324.

[19] Y. Dong, B. Du, and L. Zhang, “Target detection based on random forest metric learning,” IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens., vol. 8, no. 4, pp. 1830– 1838, 2015, doi: 10.1109/JSTARS.2015.2416255.

[20] A. Primajaya and B. N. Sari, “Random Forest Algorithm for Prediction of Precipitation,” Indones. J. Artif. Intell. Data Min., vol. 1, no. 1, p. 27, 2018, doi: 10.24014/ijaidm.v1i1.4903.

(16)

16

[21] D. Marinov and D. Karapetyan, “Hyperparameter optimisation with early termination of poor performers,” 2019 11th Comput. Sci. Electron. Eng. Conf. CEEC 2019 - Proc., pp. 160–163, 2019, doi: 10.1109/CEEC47804.2019.8974317.

[22] B. Nakisa, M. N. Rastgoo, A. Rakotonirainy, F. Maire, and V. Chandran, “Long short term memory hyperparameter optimization for a neural network based emotion recognition framework,” IEEE Access, vol. 6, pp. 49325–49338, 2018, doi: 10.1109/ACCESS.2018.2868361.

[23] M. Feurer and F. Hutter, Hyperparameter Optimization. 2019.

[24] N. Antonio, A. de Almeida, and L. Nunes, “Hotel booking demand datasets,” Data Br., vol. 22, pp. 41–49, 2019, doi: 10.1016/j.dib.2018.11.126.

[25] C. Seger, “An investigation of categorical variable encoding techniques in machine learning: binary versus one-hot and feature hashing,” Degree Proj. Technol., p. 41, 2018.

(17)

Referensi

Dokumen terkait

Berdasarkan analisis terhadap hasil pengujian yang telah dilakukan terhadap klasifikasi random forest dan klasifikasi random forest yang dioptimalkan dengan

Dengan ini menyatakan bahwa Tugas Akhir dengan judul “Diagnosa Penyakit Jantung Menggunakan Algoritma SVM dengan Optimasi Grid Search” beserta seluruh isinya

Penulis menggunakan algoritma random forest untuk mengklasifikasikan opini pengguna marketplace Indonesia dari tweet di media sosial Twitter menjadi tiga kelas sentimen,

Pada proses perancangan model algoritma Random Forest, model algoritma Random Forest yang dibangun dengan menggunakan ‘n’ pohon Decision Tree dengan mencari nilai

Sistem dibangun menggunakan algoritma find contour dan dilanjutkan proses klasifikasi menggunakan metode random forest dengan penambahan nilai untuk parameter

Confusion Matrix Random Forest dengan AdaBoost Setelah dilakukkan pengujian dari algoritma Random Forest menggunakan teknik boosting kemudian hasil yang didapatkan untuk menentukan ke

Perbandingan Algoritma Random…, Victor Angkawijaya Sudirgo, Universitas Multimedia vi Nusantara PERBANDINGAN ALGORITMA RANDOM FOREST, GRADIENT BOOSTING DAN ADABOOST DALAM

Pada hasil dari Algoritma K-means ini menghasilkan data baru tinggi air yang sudah terklusterisasi dan diberikan kode tinggi air [7] untuk dapat diproses pada algoritma Random Forest