• Tidak ada hasil yang ditemukan

Implementasi Machine Learning Dalam Menentukan Harga Sewa Apartemen di DKI Jakarta: Studi Pendahuluan

N/A
N/A
Protected

Academic year: 2023

Membagikan "Implementasi Machine Learning Dalam Menentukan Harga Sewa Apartemen di DKI Jakarta: Studi Pendahuluan"

Copied!
9
0
0

Teks penuh

(1)

Implementasi Machine Learning Dalam Menentukan Harga Sewa Apartemen di DKI Jakarta: Studi

Pendahuluan

David Noorcahya1, Agus Darmawan2

1,2 Departemen Teknik Mesin dan Industri, Universitas Gadjah Mada, Yogyakarta, Indonesia

1[email protected], 2[email protected]

Abstrak Salah satu properti yang marak dijadikan investasi adalah apartemen, selain sifatnya yang merupakan hunian modern, apartemen dinilai cukup efektif karena bentuk bangunannya yang cenderung vertikal. Hal ini sangat membantu optimalisasi daya tampung hunian pada lahan terbatas seperti pada kota Jakarta. Secara tradisional, perkiraan harga properti sering ditentukan oleh penilai profesional, dan orang tersebut harus melakukan kerja lapangan, untuk memeriksa lokasi dimana apartemen tersebut berada, dan mempertimbangkan fasilitas fasilitas yang terdapat pada apartemen tersebut untuk kemudian informasi informasi tersebut dikombinasikan untuk menentukan harga sewa dari sebuah property dan hal itu sangat memakan waktu dan tidak efisien secara biaya.

Menanggapi permasalahan ini penulis membuat suatu penelitian yang dapat membantu para pengusaha maupun investor properti khususnya apartemen untuk mempermudah proses penentuan harga sewa apartemen dengan menggunakan algoritma machine learning agar lebih efisien secara waktu, biaya, dan sesuai dengan kriteria apartemen di Jakarta. Hasil dari penelitian ini adalah 1)Model terpilih untuk melakukan prediksi terhadap harga sewa apartemen dalam penelitian ini adalah Random Forest Regressor karena memiliki nilai Rsquare tertinggi yaitu 0.47, nilai MAPE yang tergolong rendah diantara model lainnya yaitu 0.70 dan nilai MSE terendah yaitu 1.28. 2) Terdapat 3 fitur yang berkorelasi paling kuat dengan target atau price yaitu rooms yang berkorelasi sebesar 0.39, bedroom yang berkorelasi sebesar 0.33, dan bathroom yang berkorelasi sebesar 0.29 yang berarti semakin luas ruangan apartemen, semakin banyak jumlah kamar tidur dan semakin banyak jumlah kamar mandi, maka harga sewa apartemen semakin tinggi.

Kata Kunci Machine Learning, Regression, Price Prediction, Sewa Apartemen.

I. PENDAHULUAN

Masyarakat Indonesia memiliki ketertarikan cukup besar untuk datang dan tinggal di ibu kota negara, yaitu Jakarta. Hal ini disebabkan bahwa kota Jakarta menjadi pusat kegiatan ekonomi utama baik dalam lingkup daerah, nasional bahkan internasional.

Terlihat dari kemajuan pembangunan di Indonesia, mayoritas uang nasional beredar di kota ini. Selain itu, Jakarta memiliki angka kepadatan penduduk yang tinggi. Jumlah pendatang yang tinggi di Jakarta dan angka kepadatan penduduk yang tinggi dapat memiliki pengaruh terhadap peningkatan kebutuhan ruang pemukiman di Jakarta. Menurut data Badan Pusat Statistik, Jakarta hanya memiliki luas wilayah sebesar 0,03% apabila dibandingkan dengan luas wilayah Indonesia, namun berkebalikan dengan angka kepadatan penduduk yang lebih tinggi dibanding wilayah lain yaitu sekitar 15.000 jiwa/KM2.

Di sisi lain, properti di Indonesia saat ini bukan hanya merupakan kebutuhan pokok, namun juga menjadi bentuk investasi yang cukup menjanjikan karena harganya yang cenderung terus naik dari waktu ke waktu. Investasi berperan secara signifikan terhadap pertumbuhan ekonomi karena investasi dapat meningkatkan tingkat pendapatan. Para investor maupun pengusaha pun banyak yang menjadikan properti sebagai suatu aset investasi jangka panjang. Salah satu properti yang marak dijadikan investasi adalah apartemen, selain sifatnya yang merupakan hunian modern, apartemen dinilai cukup efektif karena bentuk bangunannya yang cenderung vertikal. Hal ini sangat membantu optimalisasi daya tampung hunian pada lahan terbatas seperti pada kota Jakarta.

Menurut Deputi Bidang Pembiayaan Kementerian Perumahan Rakyat, pembangunan apartemen dapat menghemat lahan sekitar 436%, jika dihitung secara matematis apabila untuk membangun perumahan di perkotaan membutuhkan 170.000 hektar, jika dibuatkan menjadi apartemen yang memiliki 24 lantai maka hanya membutuhkan lahan sekitar 39.000 hektar saja.

Secara tradisional, perkiraan harga properti sering ditentukan oleh penilai profesional, dan orang tersebut harus melakukan kerja lapangan, untuk memeriksa harga properti dan itu sangat merepotkan dan tidak efisien bagi perusahaan dan orang tersebut untuk menyelidiki berbagai daerah yang sesuai dengan ketentuan yang diharapkan [1]. Properti dengan dekorasi indah, yang terletak di distrik dan kawasan dengan lingkungan estetika visual yang indah, dimana dekat dengan fasilitas kesehatan, dan fasilitas umum lainnya mungkin memiliki tingkat apresiasi yang lebih tinggi. Namun, karena kurangnya pengukuran kuantitatif maka penentuan nilainya hanya menggunakan intuisi. Munculnya big data, high-performance computing, dan advanced machine learning memberikan peluang yang belum pernah terjadi sebelumnya untuk dapat meningkatkan efisiensi dan estimasi tingkat apresiasi harga properti. Machine learning adalah salah satu teknik mutakhir yang dapat digunakan untuk mengidentifikasi,

(2)

menafsirkan, dan menganalisis struktur dan pola data yang sangat rumit. Hal ini memungkinkan pembelajaran konsekuensial dan meningkatkan prediksi model dengan masukan sistematis dari data yang lebih baru [2].

Secara umum, metode machine learning saat ini adalah salah satu metode yang paling banyak digunakan untuk model penilaian yang efisien dan otomatis, model machine learning menarik untuk mengevaluasi, mengelola, atau memperdagangkan aset properti. Investor dapat menggunakannya untuk mengevaluasi kemungkinan investasi dengan lebih akurat [3]. Selain untuk memprediksi harga, sistem prediksi harga secara otomatis dapat berguna untuk menemukan properti yang berada dibawah atau diatas harga pasaran saat ini. Hal Ini dapat berguna untuk pelaku bisnis properti terutama dengan pengalaman yang relatif sedikit [4].

Kemudian akan dipertimbangkan juga factor socio economic dalam penentuan harga sewa apartemen. Anak anak atau remaja masa kini menghadapi tuntutan dan harapan, bahaya dan godaan yang lebih kompleks dibandingkan yang dihadapi oleh anak anak pada masa lalu [5]. Remaja pada jaman sekarang ini dihadapkan pada lingkungan yang tidak stabil, tingginya tingkat perceraian dan bertambahnya mobilitas keluarga menyebabkan kurangnya stabilitas dalam kehidupan remaja [5]. Oleh karena itu sangat penting untuk mempertimbangkan faktor socio economic dalam pemilihan lokasi tempat tinggal, pada penelitian ini terdapat beberapa faktor yang berkaitan dengan socio economic yang akan dipertimbangkan, yaitu jumlah populasi, rata rata pendapatan, tingkat pengangguran, tingkat perceraian, kecelakaan lalu lintas dan daerah rawan banjir.

Selain faktor socio economic, tingkat kejahatan juga sangat penting untuk dipertimbangkan dalam pemilihan lokasi tempat tinggal demi keamanan dan kenyamanan keluarga. Seperti yang pernah terjadi disebuah unit apartemen kawasan Rasuna Said, Setiabudi, Jakarta Selatan pada 15 juni 2021 lalu, polisi menangkap dua orang pencuri perabotan yang menyamar menjadi petugas renovasi unit di apartemen tersebut, kerugian yang diakibatkan oleh kejadian ini sebesar 250 juta rupiah. Untuk itu pada penelitian ini akan mempertimbangkan faktor tingkat kejahatan atau crime rates pada wilayah apartemen berada sebagai salah satu faktor penentuan harga sewa apartemen.

Dikutip dari lamudi.co.id salah satu cara untuk menentukan harga sewa sebuah properti adalah dengan cara melihat harga pasaran pada suatu lokasi dimana apartemen tersebut berada, dan mempertimbangkan fasilitas fasilitas yang terdapat pada apartemen tersebut untuk kemudian informasi informasi tersebut dikombinasikan untuk menentukan harga sewa dari sebuah properti. Penelitian ini bertujuan untuk mempermudah proses penentuan harga sewa apartemen dengan menggunakan algoritma machine learning agar lebih efisien secara waktu dan biaya.

Menanggapi permasalahan ini penulis membuat suatu penelitian yang dapat membantu para pengusaha maupun investor properti khususnya apartemen untuk mempermudah proses penentuan harga sewa apartemen dengan menggunakan algoritma machine learning agar lebih efisien secara waktu, biaya, dan sesuai dengan kriteria apartemen di Jakarta. Penelitian ini dilakukan agar pengusaha dan investor apartemen yang membeli apartemen untuk disewakan kembali dapat memprediksi dan menentukan harga sewa yang sesuai dengan kriteria unit apartemen yang dimilikinya secara mudah, otomatis, dan hemat biaya karena dengan menggunakan machine learning ini seseorang yang bukan ahli dalam hal properti pun dapat melakukan prediksi harga sewa sendiri, sehingga dapat memangkas biaya operasional khususnya pricing.

Kemudian data apartemen yang akan digunakan adalah data dari lamudi.co.id yang merupakan salah satu website jual beli dan sewa properti terpercaya di Indonesia dan manca negara seperti meksiko dan filipina. Sedangkan untuk data socio economic dan crime rates diambil dari website badan pusat statistik.

II. METODEPENELITIAN

Pada penelitian ini dilakukan menggunakna algoritma machine learning untuk melakukan prediksi terhadap harga sewa apartemen di Jakarta. Penggunaan machine learning ini memiliki tujuan untuk 1) Mengidentifikasi algoritma machine learning apa yang paling tepat digunakan untuk melakukan prediksi terhadap harga sewa sebuah apartemen. 2) Mengidentifikasi mengenai faktor faktor apa yang paling mempengaruhi untuk melakukan prediksi terhadap harga sewa dari sebuah apartemen. 3) Memperbaiki proses penentuan harga sewa dari yang awalnya dilakukan secara manual menjadi otomatis sehingga lebih efisien.

Terdapat beberapa model machine learning yang digunakan dalam penelitian ini, yaitu: linear regression, support vector regression, ridge regression, lasso regression, decision tree regression, random forest regression, neural network, dan stochastic gradient descent. Terdapat 2 penelitian yang mirip dengan penelitian yang dilakukan, yaitu penelitian yang dilakukan oleh owusu- manu et. al pada 2019 dan penelitian yang dilakukan oleh kang, et al. pada tahun 2020. Namun adapun perbedaan antara penelitian yang diakukan dengan penelitian terdahulunya adalah pada penelitian terdahulu menggunakan harga properti rumah sebagai obyek penelitian, dan belum terdapat variabel tingkat kejahatan atau crime rates, sedangkan pada penelitian yang dilakukan menggunakan harga sewa apartemen sebagai obyek penelitian dan menggunakan socio economic serta tingkat kejahatan dilingkungan sekitar apartemen sebagai salah satu variabel yang akan berpengaruh pada penentuan harga sewa apartemen di Jakarta.

Kemudian data apartemen yang digunakan pada penelitian ini yang didapatkan dari salah satu website jual beli properti yaitu lamudi.co.id didapatkan melalui proses web scraping dengan bahasa pemrograman python dan menggunakan salah satu library

(3)

yaitu beautifulsoup dan selenium. Sedangkan data data terkait socio economic dan tingkat kejahatan disekitar apartemen didapatkan dari website badan pusat statistik yaitu bps.go.id.

2.1 Machine Learning

Machine learning adalah suatu rangkaian yang memiliki fungsi dalam penanganan dan prediksi data-data besar dimana sistem ini akan mempresentasikan data melalui algoritma machine learning [6]. Machine learning adalah metode analisis yang membantu menangani data besar dengan cara mengembangkan algoritma komputer. Konsep machine learning yaitu mampu meningkatkan kecerdasan yang meliputi kemampuan dari suatu individu untuk belajar. Dan mesin tersebut akan berbeda dengan mesin lain, karena mempunyai kemampuan yang tidak dimiliki oleh mesin lain. Secara fundamental cara kerja machine learning adalah belajar seperti manusia dengan menggunakan contoh contoh dan setelah itu barulah dapat menjawab suatu pertanyaan terkait [7]. Proses belajar ini menggunakan data yang disebut train dataset, dari data tersebut, komputer akan melakukan proses belajar (training) untuk menghasilkan suatu model. Proses belajar ini menggunakan algoritma machine learning sebagai penerapan statistika. Model inilah yang menghasilkan informasi, kemudian dapat dijadikan pengetahuan untuk memecahkan suatu permasalahan sebagai proses input- output [8].

Teknik dalam machine learning dapat dibagi menjadi beberapa, namun machine learning secara umum dapat dibagi menjadi dua teknik yaitu supervised serta unsupervised:

a) Supervised Learning

Teknik supervised learning yaitu suatu teknik yang dapat menyerap informasi yang sudah eksis di dalam data dengan adanya suatu label. Dengan demikian, teknik ini dapat memberi target pada output dengan cara perbandingan pengalaman belajar pada masa lampau atau sebelumnya.

b) Unsupervised Learning

Teknik ini adalah teknik yang dapat diterapkan dalam machine learning dengan data tanpa informasi yang dapat langsung diterapkan. Melalui teknik ini, struktur maupun pola yang tersembunyi dalam data tanpa label dapat ditemukan. Perbedaan dengan teknik supervised learning, dalam teknik ini tidak ada data yang menjadi acuan sebelumnya.

analisis regresi memiliki beberapa manfaat, antara lain [9]:

(1) Berperan dalam pengukuran kekuatan hubungan variabel respon serta variabel prediktor.

(2) Berpengaruh terhadap satu atau beberapa variabel prediktor terhadap variabel respon.

(3) Berperan dalam prediksi pengaruh satu atau beberapa variabel prediktor terhadap variabel respon.

2.2 Model Evaluation

Business Intelligence: Data Mining and Optimization for Decision

Making hap evaluasi model digunakan untuk

mengidentifikasi model prediksi yang paling akurat, masing-masing model dianggap diterapkan pada data masa lalu, dan model dengan total error minimum dipilih. Kedua, perlu untuk secara berkala menilai keakuratan, untuk mendeteksi kelainan dan kekurangan dalam model yang mungkin timbul di lain waktu [10]. Ukuran yang digunakan untuk mengevaluasi hasil prediksi dari model adalah ukuran R squared, Mean Absolute Percent Error (MAPE) dan Mean Square Error (MSE).

The coefficient of determination atau biasa disebut R-squared dapat diartikan sebagai proporsi varians dalam variabel dependen yang dapat diprediksi dari variabel independen. Nilai R-Squared dapat dirumuskan sebagai berikut [11]:

(1) (worst value = - ; best value = +1)

Kemudian MAPE (Mean absolute percentage error) adalah metrik kinerja lain untuk model regresi, memiliki interpretasi yang sangat intuitif dalam hal kesalahan relative, penggunaannya direkomendasikan dalam tugas-tugas di mana lebih penting sensitif terhadap variasi relatif daripada absolut variasi. Nilai MAPE dapat dirumuskan sebagai berikut [11]:

(4)

MAPE =

(best value = 0; worst value = + )

Sedangkan pada MSE (Mean square error) jika model pada akhirnya menghasilkan satu prediksi yang sangat buruk, bagian kuadrat dari fungsi akan memperbesar kesalahan. Nilai MSE dapat dirumuskan sebagai berikut [11]:

MSE =

(best value = 0; worst value = + Dimana:

n : banyak data, yi : data aktual, : data prediksi, 2.3 Alur Penelitian

Sebelum melakukan penelitian, terlebih dahulu menyusun langkah-langkah penelitian untuk memudahkan proses penelitian, sebagai berikut:

2.3.1 Studi Literatur

Studi literatur dilakukan untuk mencari konsep dan landasan teori sebagai kerangka berpikir yang dapat digunakan untuk menyelesaikan masalah dalam penelitian ini. Selain itu, langkah ini sebagai pendukung dalam langkah selanjutnya yaitu perumusan masalah. Studi literatur dilakukan dengan membaca dan memahami jurnal ilmiah dan penelitian-penelitian terdahulu yang terkait dengan machine learning yang digunakan untuk memprediksi harga properti.

2.3.2 Menentukan Masalah

Tahap ini dilakukan setelah menggali informasi pada tahap studi literatur. Dalam penentuan permasalahan peneliti akan menentukan permasalahan apa yang menyebabkan tim pricing pada perusahaan properti atau pengusaha properti kesulitan dalam menentukan harga sewa apartemen yang tepat.

2.3.3 Pengumpulan Data Apartemen

Pada tahap ini dilakukan pengumpulan data apartemen dari website lamudi.com dengan menggunakan software jupyter notebook dan bahasa pemrograman python, adapun packages maupun metode yang digunakan adalah beautifulsoup dan selenium. Data apartemen yang diambil adalah title, location, description, price, bedroom, bathroom, area, dan owner.

2.3.4 Pengumpulan Data Socioeconomic dan crime rates

Pada tahap ini dilakukan pengumpulan data terkait dengan socioeconomic dan data terkait crime rates daerah daerah di DKI Jakarta. Data socioeconomic yang dikumpulkan adalah jumlah populasi, rata rata pendapatan, tingkat pengangguran, dan daerah rawan banjir. Data data tersebut dikumpulkan dari website badan pusat statistik yaitu https://www.bps.go.id/.

2.3.5 Data understanding

Pada tahap ini dilakukan untuk mengetahui struktur dan karakteristik seperti kolom dan komponen penyusun data yang akan digunakan untuk dilanjutkan pada proses berikutnya.

2.3.6 Data Preprocessing

Pada tahap ini dilakukan preprocessing data seperti proses cleaning dataset karena data yang didapatkan dari website lamudi.com masih berupa raw data yang masih membutuhkan proses cleaning untuk dapat digunakan. Kemudian pada proses selanjutnya adalah noise handling yaitu bertujuan untuk mengidentifikasi adanya data data yang tidak valid. Selanjutnya terdapat proses missing value handling yaitu sebuah proses yang bertujuan untuk mengidentifikasi dan memberikan treatment terhadap data data yang hilang atau kosong. Selanjutnya pada proses categorical data handling yaitu proses mengidentifikasi dan memberikan treatment terhadap data data yang berbentuk string dan bersifat categorical agar dapat diubah kedalam bentuk numerik sehingga dapat digunakan pada proses pembuatan model machine learning. Dan yang terakhir pada proses data preprocessing adalah feature engineering yaitu proses dimana peneliti menerapkan pengetahuan yang dimiliki untuk mendapatkan informasi yang lebih dari dataset yang tersedia untuk penelitian pembuatan model machine learning.

2.3.7 Exploratory Data Analysis

(5)

Pada tahap ini akan dilakukan eksplorasi pada data yang bertujuan untuk mencari informasi dan insight tersembunyi yang terdapat pada dataset yang digunakan. Selain itu exploratory data analysis juga berguna untuk mengetahui lebih dalam tentang data yang akan digunakan seperti distribusi data dan korelasi antar variabel pada data yang digunakan terhadap variable targetnya.

2.3.8 Modeling Machine Learning

Pada tahap ini akan dilakukan pemodelan machine learning untuk dapat memprediksi harga sewa apartemen, model model yang akan digunakan adalah linear regression, support vector regression, ridge regression, lasso regression, decision tree regression, random forest regression, neural network, dan stochastic gradient descent.

2.3.9 Model Evaluation

Pada tahap ini akan dilakukan evaluasi terhadap model model yang telah dibuat pada tahap sebelumnya, evaluasi ini bertujuan untuk mengetahui akurasi dari model yang sudah dibuat untuk selanjutnya dilakukan pemilihan pada model terbaik untuk dapat memprediksi harga sewa apartemen. Evaluasi dilakukan dengan cara melihat nilai r2 score atau fungsi skor regresi, Mean Absolute Percentage Error (MAPE), dan Mean Squared Error (MSE).

2.3.10 Penarikan Kesimpulan

Pada tahap akhir dalam penelitian ini adalah tahap penarikan kesimpulan. Tahap ini berisi kesimpulan dari keseluruhan hasil penelitian yang telah dilakukan oleh peneliti.

III. HASILDANPEMBAHASAN

Setelah dilakukan proses pengumpulan data menggunakan web scraping dan telah dilakukan data preprocessing pada data yang akan digunakan untuk membuat algoritma machine learning prediksi harga sewa properti, maka didapatkan hasil analisa dataset sebagai berikut:

Gambar1. Correlation Matrix

Kemudian pada gambar diatas dapat diketahui matriks korelasi yang dapat menunjukkan informasi informasi tingkat korelasi antar fitur fitur pada data yang nantinya akan mempengaruhi hasil algoritma machine learning. Dari matriks korelasi diatas didapatkan beberapa insight yaitu: 1) Terdapat 3 fitur yang berkorelasi paling kuat dengan target atau price yaitu rooms yang berkorelasi sebesar 0.39, bedroom yang berkorelasi sebesar 0.33, dan bathroom yang berkorelasi sebesar 0.29 yang berarti semakin luas ruangan apartemen, semakin banyak jumlah kamar tidur dan semakin banyak jumlah kamar mandi, maka harga sewa apartemen semakin tinggi. 2) Kemudian insight kedua adalah terdapat beberapa fitur dari data yang saling berkorelasi kuat sehingga dapat menyebabkan multikolinieritas, fitur fitur tersebut adalah %banjir dengan %pengangguran yang berkorelasi sebesar 0.95, perceraian dan %pengangguran yang berkorelasi sebesar 0.89, perceraian dan %banjir yang berkorelasi sebesar 0.95, kecelakaan lalu lintas dan Jakarta timur yang berkorelasi sebesar 0.95, dan crime dengan Jakarta utara yang berkorelasi sebesar 1. Maka terdapat fitur fitur yang harus dihapus atau didrop dari dataset untuk menghindari terjadinya multikolinieritas, fitur fitur tersebut adalah

%pengangguran, %banjir, kecelakaan lalu lintas, dan crime.3) Kemudian insight ketiga adalah Jakarta selatan berkorelasi cukup kuat dengan rooms sebesar 0.43 yang berarti apartemen yang berada di Jakarta selatan cenderung memiliki luas ruangan yang lebih besar daripada apartemen yang berada di daerah lain. 4) rooms berkorelasi kuat dengan bedroom sebesar 0.65 dan bathroom sebesar 0.76 yang berarti semakin luas ruangan suatu apartemen, biasanya jumlah bedroom dan bathroom nya juga semakin banyak. 5) kolam renang berkorelasi kuat dengan gym sebesar 0.55, AC sebesar 0.52, dan jogging track sebesar 0.62 yang berarti apartemen

(6)

yang memiliki fasilitas kolam renang biasanya juga memiliki fasilitas gym, AC, dan jogging track. 6) Pendidikan berkorelasi kuat dengan rumah sakit sebesar 0.61, akses transportasi sebesar 0.59, dan perbelanjaan sebesar 0.54 yang berarti apartemen yang dekat dengan pusat Pendidikan seperti sekolah dan kampus biasanya dekat juga dengan pusat perbelanjaan dan akses transportasi seperti gerbang tol. 7) Perceraian berkorelasi kuat dengan %pengangguran sebesar 0.89, kecelakaan lalu lintas sebesar 0.79, dan %banjir sebesar 0.95 maka perceraian seringkali disebabkan oleh pengangguran dan biasanya tinggal didaerah rawan banjir dan rawan kecelakaan.

Selain itu analisis data juga dilakukan terhadap persentase jumlah apartemen, rata rata jumlah kamar, rata rata jumlah kamar mandi, dan rata rata luas ruangan apartemen pada setiap daerah, sebagai berikut:

Gambar 2. Persentase jumlah apartemen Gambar 3. Rata rata kamar tidur

Gambar 4. Rata rata jumlah kamar mandi Gambar 5. Rata rata luas ruangan

Dari gambar gambar diatas dapat diketahui bahwa sebanyak 31.7% apartemen yang berada di Jakarta berada di Jakarta selatan, sebanyak 28% berada di Jakarta barat, dan sisanya berada di Jakarta pusat, Jakarta utara dan yang paling sedikit berada di Jakarta timur sebanyak 8.4%. Kemudian untuk apartemen dengan rata rata jumlah kamar tidur terbanyak berada di Jakarta selatan sebanyak 2,2 dan yang paling sedikit berada di Jakarta timur sebanyak 1.77. Pada rata rata jumlah kamar mandi apartemen dengan rata rata jumlah kamar mandi terbanyak berada di Jakarta selatan dengan rata rata 1.82 dan yang paling sedikit berada di Jakarta timur dengan rata rata 1 kamar mandi. Kemudian yang terakhir pada rata rata luas ruangan, apartemen dengan rata rata luas ruangan terbesar berada di Jakarta selatan dengan luas 111.90 m2 dan yang paling kecil berada di Jakarta timur dengan rata rata luas sebesar 32.90 m2.

Selanjutnya pada modeling machine learning terdapat beberapa tahapan yang dilakukan. Pertama pada tahap training dan testing dataset, terdapat 2 variabel x dan y dimana y merupakan variabel target yaitu price dan x merupakan variabel prediktornya yaitu kolom pada dataset yg telah bersih dengan drop kolom price. pada tahap testing test_size yg digunakan adalah 20% sedangkan random_statenya adalah 0 (default). Kedua, dilakukan modeling pada beberapa model machine learning yaitu linear regression, support vector regression, ridge regression, lasso regression, decision tree regression, random forest regression, neural network, dan stochastic gradient descent. Pada model ridge regression, lasso regression, random forest regression dan stochastic gradient descent dilakukan analisis best hyperparameter terlebih dahulu untuk mengetahui parameter terbaik yg dapat digunakan agar model bekerja dengan maksimal. Kemudian pada tahap ketiga yaitu model evaluation, akan dilakukan beberapa evaluasi untuk mengetahui performa dari beberapa model machine learning yg telah diterapkan, pada tahap ini analisis yg dihasilkan adalah scatterplot untuk mengetahui pola prediksi, r-squared, mape, dan mse. Maka didapatkan hasil sebagai berikut:

(7)

Gambar 6. Nilai R-square

Gambar 7. Nilai MAPE

Gambar 8. Nilai MSE

Gambar 9. Scatterplot LR

Gambar 10. Scatterplot SVR

Gambar 11. Scatterplot Ridge

(8)

Gambar 12. Scatterplot Lasso

Gambar 13. Scatterplot Decision Tree

Gambar 14. Scatterplot Random Forest

Gambar 15. Scatterplot Neural Network

Gambar 16. Scatterplot SGD

(9)

TABEL I. REKAP NILAI RSQUARE, MAPE, DAN MSE.

Dari nilai nilai diatas maka model terpilih untuk melakukan prediksi terhadap harga sewa apartemen dalam penelitian ini adalah Random Forest Regressor karena memiliki nilai Rsquare tertinggi yaitu 0.47, nilai MAPE yang tergolong rendah diantara model lainnya yaitu 0.70 dan nilai MSE terendah yaitu 1.28.

IV. KESIMPULAN Berdasarkan analisis hasil penelitian dapat diambil kesimpulan sebagai berikut.

1. Model terpilih untuk melakukan prediksi terhadap harga sewa apartemen dalam penelitian ini adalah Random Forest Regressor karena memiliki nilai Rsquare tertinggi yaitu 0.47, nilai MAPE yang tergolong rendah diantara model lainnya yaitu 0.70 dan nilai MSE terendah yaitu 1.28.

2. Terdapat 3 fitur yang berkorelasi paling kuat dengan target atau price yaitu rooms yang berkorelasi sebesar 0.39, bedroom yang berkorelasi sebesar 0.33, dan bathroom yang berkorelasi sebesar 0.29 yang berarti semakin luas ruangan apartemen, semakin banyak jumlah kamar tidur dan semakin banyak jumlah kamar mandi, maka harga sewa apartemen semakin tinggi.

V. UCAPAN TERIMA KASIH

Terima kasih dan rasa hormat penulis ucapkan kepada seluruh pihak pihak yang telah membantu penelitian ini baik secara material maupun non-material.

DAFTAR PUSTAKA

[1] Ho, W., Tang, B. and Wong, S., 2020. Predicting property prices with machine learning algorithms. Journal of Property Research, 38(1), pp.48-70.

[2] Kang, Y., Zhang, F., Peng, W., Gao, S., Rao, J., Duarte, F. and Ratti, C., 2020. Understanding house price appreciation using multi-source big geo-data and machine learning. Land Use Policy, p.104919.

[3] Santrock, J.W. (2003). Life- Span Development. Perkembangan Masa Hidup. Edisi Kelima. Jilid 2. Alih Bahasa: Damanik, J., dan Chusairi, A. Jakarta:

Erlangga.

[4] Danukusumo, Kefin Pudi (2017) Implementasi Deep Learning Menggunakan Convolutional Neural Network Untuk Klasifikasi Citra Candi Berbasis Gpu. S1 thesis, UAJY.

[5] Tchuente, D. and Nyawa, S., 2021. Real estate price estimation in French cities using geocoding and machine learning. Annals of Operations Research,.

[6] Modi, M., Sharma, A. and Madhavan, P. 2020. Applied Research On House Price Prediction Using Diverse Machine Learning Techniques. INTERNATIONAL JOURNAL OF SCIENTIFIC & TECHNOLOGY RESEARCH, 5(04).

[7] Borde, S., Ra.ne, A., Shende, G. and Shetty, S. 2017. Real Estate Investment Advising Using Machine Learning. International Research Journal of Engineering and Technology (IRJET), 4(3).

[8] Iriawan N & Astuti S P. (2006). Mengolah Data Statistik dengan menggunakan Minitab 14. Yogyakarta: Andi.

[9] D. Simajuntak, A. S. RM. Sinaga, "Sistem Pakar Deteksi Gizi Buruk Balita dengan Metode Naive Bayes Classifier", Jurnal Inkofar *Volume 1 No.2 Desember 2019, hl:54-60.

[10] Vercellis, C. (2009). Business Intelligence: Data Mining and Optimization for Decision Making. In Business Intelligence: Data Mining and Optimization for Decision Making. https://doi.org/10.1002/9780470753866

[11] Montano Moreno, J. J., Palmer Pol, A., Sese Abad, A., & Cajal Blasco, B. (2013). Using the R-MAPE index as a resistant measure of forecast accuracy.

Psicothema. https://doi.org/10.7334/psicothema2013.23

Referensi

Dokumen terkait