Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
290
ANALISIS PREDIKSI GENRE FILM PADA INTERNET MOVIE DATABASE INDONESIA MENGGUNAKAN METODE LONG SHORT TERM MEMORY
Dwi Novi Marito Tampubolon1, Valentina Vincensia Hulu 2, Ryan Oktavianus Sipahutar3, Oloan Sihombing4
1234 Fakultas Sains dan Teknologi, Universitas Prima Indonesia email: [email protected], [email protected],
[email protected], [email protected],
Abstract
Currently, films and series have become the main attraction as a means of entertainment for various groups of society. Film production involves a producer who has an important role in managing the management and administrative aspects of film production. The challenge producers face is managing the business side of production to avoid losses, especially related to lack of audiences. Knowledge of the film genres that audiences are interested in is crucial to optimizing the success of the production. This research uses the Long Short-Term Memory (LSTM) algorithm to predict film genres that will be in demand on the Indonesian Internet Movie Database (IMDb) platform in the next few years. Using this method can help with efficient production planning and provide guidance to producers. The dataset used is from 2010 to 2022 taken from Kaggle.com. The research results show that the LSTM model can predict film genres with good accuracy, with Root Mean Square Error (RMSE) values below 2.50 on training and testing data. The results of this research can help producers in planning production, choosing locations, actors, creative teams, and production resources that suit the genres of interest to the audience, so as to increase efficiency and control production costs
.
Keywords: Prediction, Genre, Movie, IMDb, Long Short Term Memory 1. PENDAHULUAN
Pada masa sekarang ini, perfilman, series atau lainnya menjadi pemikat untuk banyak orang sebagai sarana hiburan. Film merupakan suatu bentuk hiburan yang menarik perhatian berbagai kalangan termasuk anak-anak, remaja, orang dewasa bahkan orangtua [1]. Dalam suatu pembuatan film, pastinya ada seorang produser dibaliknya. Produser film adalah orang yang memprakarsai, mengoordinasi, mengawasi, dan mengelola segala aspek manajemen dan administratif pada produksi sebuah film. Salah satu tugas produser film adalah mengelola sisi bisnis dari proses produksi. Sering sekali terjadi kerugian dalam pembuatan film dikarenakan banyak aspek, salah satunya adalah sedikitnya penonton. Melalui hal ini, produser haruslah mengetahui genre film apa yang paling diminati para penikmat film agar tidak terjadinya kerugian pada pembuatan film. Genre film adalah bentuk, kategori atau klasifikasi tertentu dari beberapa
film yang memiliki kesamaan bentuk, latar, tema, suasana dan lainnya [2]. Genre film memainkan peran penting dalam strategi pemasaran dan distribusi. Produser dan distributor film dapat menggunakan genre sebagai alat untuk mengidentifikasi target audiens dan merancang pemasaran yang tepat.
Internet Movie Database (IMDb) adalah database online didedikasikan untuk semua jenis informasi tentang berbagai konten film seperti film, TV dan acara streaming online, serial, dan lain-lain [3]. IMDb telah menjadi referensi utama bagi penikmat film dalam memilih film yang akan ditonton. Pada IMDb menyediakan informasi yang luas tentang film, masih sulit untuk memprediksi genre film yang diminati oleh penonton. Genre film sangat penting untuk memudahkan seseorang dalam mencari referensi dan menambah wawasan tentang film. Selain itu, genre juga berfungsi sebagai sarana antisipasi dari penonton terhadap film yang akan ditonton.
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
291
Berdasarkan banyaknya penonton peminat film pada suatu genre dapat membantu para produser untuk mengetahui genre film yang paling banyak disukai para penonton. Prediksi atau peramalan adalah kombinasi keterampilan dan pengetahuan ilmiah yang digunakan untuk meramalkan peristiwa yang akan terjadi di masa depan [4], [5], Fungsi dari peramalan adalah penunjang dalam pengambilan keputusan. Keputusan yang baik didasarkan atas pertimbangan terhadap sesuatu yang terjadi pada saat keputusan itu diambil.
Salah satu metode yang banyak digunakan dalam peramalan adalah long short-term memory (LSTM) [6]. Long Short-Term Memory (LSTM) merupakan algoritma Deep Learning yang popular untuk melakukan prediksi dan klasifikasi yang berkorelasi dengan waktu. Penggunaan metode algoritma ini dapat menyimpan data informasi dalam jangka waktu yang panjang, selain itu juga dapat digunakan untuk mengolah, meramalkan, dan mengklasifikasikan informasi berdasarkan deret waktu [7]. LSTM dapat mempertimbangkan hubungan waktu dan merujuk pada penelitian terdahulu dan menghasilkan penurunan yang signifikan rata- rata kesalahan prediksi dalam model yang lain [8]. Berdasarkan latar belakang di atas peneliti mengusulkan penelitian tentang penerapan algoritma Long Short-Term Memory (LSTM) untuk memprediksi genre film yang akan dibuat untuk beberapa tahun mendatang pada platform IMDb. Penelitian menggunakan metode Long Short Term Memory untuk mendapatkan hasil akurasi prediksi genre film pada Internet Movie Database (IMDb) Indonesia, serta menggunakan dataset yang bersumber dari Kaggle.com dari tahun 2010 hingga tahun 2022. Hasil penelitian ini diharapkan diharapkan dapat membantu perencanaan produksi yang efisien dan membantu produser. Dengan mengetahui genre film, produser dapat memilih lokasi, pemeran, tim kreatif, dan sumber daya produksi yang sesuai dengan genre tersebut. Hal ini membantu mengoptimalkan penggunaan sumber daya dan mengurangi pemborosan, sehingga meningkatkan efisiensi dan mengontrol biaya produksi.
2. METODE PENELITIAN
Pada penelitian ini, peneliti melakukan prediksi menggunakan metode Long Short Term Memory (LSTM). LSTM dapat digunakan dalam konteks prediksi [9]. Metode ini digunakan untuk memprediksi dan klasifikasi yang berhubungan dengan waktu. Algoritma ini dapat menyimpan informasi dalam jangka waktu yang lama.
Kegiatan penelitian ini dilakukan dengan diagram alur penelitian sebagai berikut:
Gambar 1. Diagram Alur Penelitian 2.1. Studi Literatur
Studi literatur adalah metode yang digunakan untuk mendapatkan informasi serta referensi yang berhubungan dengan topik yang diteliti [10]. Adapun studi literatur yang dilakukan adalah dengan mencari referensi jurnal, skripsi dan artikel yang berhubungan dengan penelitian terkait dengan analisis penelitian prediksi yang menggunakan metode Long Short-Term Memory yang didapat melalui jurnal nasional maupun internasional guna mendapatkan metode yang baru.
2.2. Data Acquasition
Data Acquisition bertujuan untuk berbagi dan mencari dataset yang baru untuk menambah kumpulan data [11]. Adapun data yang diperoleh diambil melalui website Kaggle.com. Dataset yang digunakan adalah dataset dari tahun 2010 hingga tahun 2022. Adapun keterangan yang tersedia pada data tersebut yaitu : Title, year, description, genre, rating, users rating votes, languages, directors, actors dan runtime. Contoh dataset dapat dilihat pada gambar di bawah ini.
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
292
Gambar 2. Dataset 2.3. Seleksi dan Transformasi Data
Seleksi data adalah pemilihan data yang akan digunakan dalam proses penelitian sedangkan transformasi data adalah proses pengubahan data kedalam bentuk yang sesuai [12]. Seleksi dan transformasi data merupakan proses lanjutan setelah proses data acquisition dalam pengembangan model prediksi genre film pada IMDb Indonesia menggunakan metode LSTM. Proses ini dilakukan untuk memastikan bahwa data yang digunakan dalam pengembangan model memiliki kualitas yang baik, bersih, dan relevan untuk tujuan analisis dan prediksi genre film.
2.4. Visualisasi Data
Visualisasi data adalah proses membuat grafik atau diagram dari data yang diolah, sehingga depot membantu pengguna untuk memahami data dengan lebih baik [13]. Dalam konteks penelitian prediksi genre film pada IMDb Indonesia menggunakan metode LSTM, visualisasi data dapat membantu dalam memahami karakteristik data film yang digunakan untuk pengembangan model. Pada penelitian ini, peneliti menggunakan metode Exploratory Data Analyst (EDA) dalam memvisualisasikan data. Dalam EDA, pengumpulan data tidak diikuti langsung oleh penerapan model namun memiliki cara yang terpisah dengan algoritma yang digunakan [14].
2.5. Metode Long Short-Term Memory (LSTM)
Long Short-Term Memory (LSTM) merupakan algoritma Deep Learning yang popular dan sesuai untuk melakukan prediksi dan klasifikasi yang berhubungan dengan waktu.
Algoritma ini mampu menyimpan informasi
untuk jangka waktu. yang lama. Hal ini kemudian dapat digunakan untuk memproses, memprediksi, dan mengklasifikasikan informasi berdasarkan deret waktu [15]. Pendekatan pertama adalah membangun jaringan LSTM yang pada umumnya dapat memproses data deret waktu dan mengenali pola unik untuk setiap kelas dari waktu ke waktu [16].
3. HASIL DAN PEMBAHASAN
Dalam penelitian ini, terdapat beberapa langkah yang diterapkan dan dibuat menjadi suatu Unified Modeling Language (UML). UML merupakan salah satu cara untuk menggambarkan arsitektur dan struktur model LSTM untuk prediksi genre film. Melalui visualisasi ini dapat dipahami bagaimana aliran informasi di dalam jaringan LSTM dan bagaimana data film dapat diproses untuk melakukan prediksi genre.
Gambar 3. Aliran Informasi Dalam Jaringan LSTM
3.1. Data Acquasition
Data acquisition adalah suatu proses pengumpulan data yang berasal dari berbagai sumber untuk menganalisis dan memproses suatu data [17]. Data yang diambil dalam penelitian ini bersumber dari film IMDb Indonesia yang disediakan oleh website Kaggle yang disediakan dalam Microsoft Excel (.xls). Adapun tujuan dari pengambilan dataset ini adalah untuk menganalisa jumlah genre film pada Internet Movie Database (IMDb) Indonesia dalam beberapa tahun.
3.2. Pre-processing
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
293
Tujuan dari pre-processing data adalah untuk mempersiapkan data agar siap digunakan dalam proses analisis data. Pada tahapan berikut, peneliti membahas tentang beberapa tahapan yang dimulai dari Data Cleaning, Data Transformation (Reshaping), Data Splitting, dan Data Normalization.
3.2.1. Data Cleaning
Data cleaning adalah salah satu tahapan dari pre-processing data yang dilakukan untuk memperbaiki, membersihkan dan menghapus ketidaksesuaian pada data. Pada tahap ini, dataset yang tersedia akan dilakukan proses cleaning dengan menghapus dan mengurangi data yang tidak diperlukan. Melalui hal ini, peneliti mengurangi jumlah data menjadi 1676 data.
3.2.2. Data Transformation
Data transformation adalah proses pengubahan atau pengolahan data dari satu bentuk ke bentuk yang lain. Tujuan dari data transformation untuk menghadirkan data yang lebih sesuai dengan kebutuhan analisis ataupun pemodelan yang akan diproses. Pada tahap ini, peneliti mengubah bentuk dataset dari format xls ke dalam format csv.
Gambar 4. Data Transformation a. Reshaping
Reshaping dalam analisis data adalah proses untuk mengubah tata letak atau struktur data dari satu bentuk menjadi bentuk yang berbeda.
Reshaping sering dilakukan pada data tabular (tabel) dengan kolom dan baris, seperti data spreadsheet atau dataframe dalam bahasa pemrograman Python.
Adapun rumus dari reshaping adalah
M × N
Ket: M: Jumlah Baris
N: Jumlah Kolom
Setelah dilakukan reshaping, maka dihasilkan 156 baris dan 9 kolom yang tersedia pada data.
3.2.3. Data Splitting
Pada tahapan ini dilakukan proses data splitting untuk membagi dataset menjadi dua subset yang digunakan dalam berbagai tahap analisis atau pemodelan data, yaitu subset pelatihan (training set) dan subset pengujian (testing set). Subset pelatihan digunakan untuk melatih model, sementara subset pengujian digunakan untuk menguji kemampuan model pada data yang belum pernah ditemui sebelumnya. Pada umumnya, tahap data splitting akan membagi data dengan skala 70:30 80:20, dan 90:10.
Tabel 1. Komposisi Dataset
No Data Train Data Test
1 70 % 30%
2 80% 20%
3 90% 10%
Dalam hal ini, data train harus memiliki skala yang lebih tinggi dibandingkan data test agar proses prediksi menjadi lebih akurat [18]. Pada tahap ini, peneliti membagi dataset dengan skala 70:30, dimana data train 70% dan data test 30%.
Hasil yang dikeluarkan melalui penerapan dengan aplikasi Python adalah 109 untuk data train dan 49 untuk data test.
3.2.4. Data Normalization
Data normalization adalah langkah untuk mengubah nilai-nilai data dalam dataset menjadi bentuk yang lebih terstandarisasi atau normal.
Tujuannya adalah untuk menghilangkan perbedaan skala dan satuan pengukuran yang tidak seimbang antara variabel dalam dataset.
Adapun rumus dari data normalization menggunakan Min-Max Scaler adalah
𝑿𝒏𝒐𝒓𝒎= 𝑿−𝑿𝒎𝒊𝒏 𝑿𝒎𝒂𝒙−𝑿𝒎𝒊𝒏
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
294
Pada penelitian ini, data normalization diterapkan dengan python menggunakan Min- Max Scaler yang memiliki rentang [0, 1].
3.3. Visualisasi Data
Visualisasi data merupakan proses penggambaran informasi atau data dalam bentuk visual seperti diagram, grafik, dan lain-lain.
Visualisasi data memiliki tujuan untuk membantu memahami pola dalam data dengan lebih cepat dan mudah. EDA (Exploratory Data Analysis) merupakan aspek penting dari visualisasi data karena dapat membantu menyampaikan hasil analisis data dengan cepat dan efektif [19]. Pada penelitian ini, peneliti menggunakan diagram lingkaran agar mudah dalam menampilkan jumlah genre yang paling banyak diminati.
Gambar 5. Visualisasi Data
Berdasarkan dari diagram diatas bahwa genre drama memiliki jumlah persentase yang lebih banyak yaitu 30.8% dan genre adventure memiliki jumlah persentase yang lebih kecil yaitu 6.9%.
3.4. Metode Long Short-Term Memory Metode Long Short-Term Memory (LSTM) adalah teknik dalam machine learning yang digunakan untuk memproses data yang berurutan dengan mempertahankan dan menggunakan informasi jangka panjang serta dirancang untuk membuat prediksi yang akurat [17]. Adapun rumus dari LSTM yang diterapkan adalah
1. Input Gate (𝑖
𝑡)𝑖𝑡 = 𝜎(𝑊𝑖𝑆𝑡−1 + 𝑊𝑖𝑋𝑡)
𝑊𝑖 = Bobot dari Input Gate. 𝑆𝑡−1 = State
sebelumnya atau state pada waktu t-1.
𝑋𝑡 = Input pada waktu t. 𝜎 = Fungsi
aktivasi sigmoid.
2. Forget Gate (𝑓𝑡)
𝑓𝑡 = 𝜎(𝑊𝑓𝑆𝑡−1 + 𝑊𝑓𝑋𝑡)
𝑊𝑓 = Bobot dari forget gate. 𝑆𝑡−1 =
State sebelumnya atau state pada waktu t - 1. 𝑋𝑡 = Input pada waktu t. 𝜎 = Fungsi aktivasi sigmoid.
3. Output Gate (𝑜𝑡)
𝑜𝑡 = 𝜎(𝑊𝑜𝑆𝑡−1 + 𝑊𝑜𝑋𝑡)
ℎ𝑡 = 𝑜𝑡 ∗ 𝑡𝑎𝑛ℎ(𝑐𝑡)
𝑊𝑜 = Bobot dari output gate. 𝑆𝑡−1 =
State sebelumnya atau state pada waktu t - 1.
𝑋𝑡 = Input pada waktu t.𝜎 = Fungsi aktivasi sigmoid.
3.4.1 Pembangunan Model (Model Building) Dalam tahap ini dilakukan pembangunan model LSTM menggunakan arsitektur Sequential untuk mendapatkan gambaran cara kerja model dan lapisan layer keras menggunakan Application Programming Interface (API).
Arsitektur LSTM terdiri dari serangkaian lapisan LSTM yang dihubungkan secara berurutan.
Berdasarkan proses pembangunan model yang telah diimplementasikan ke bahasa program Python, maka diperoleh hasil yang terdapat pada tabel dibawah ini:
Layer (Type) Output
Shape Parameter
LSTM 10 480
DropOut 10 0
Dense 1 11
Total Parameters
491 491 Trainable 0
Parameters Non-Trainabel Parameters
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
295
3.4.2. Pelatihan dan Pengujian Model (Training & Testing)
Tahap ini akan memperhitungkan keakurasian prediksi dengan proses pelatihan dan pengujian. Dalam metode LSTM keakuratan suatu prediksi diperhitungkan dengan RMSE (Root Mean Square Error). RMSE adalah metrik yang digunakan untuk mengukur sejauh mana perbedaan antara nilai prediksi dan nilai aktual dalam pemodelan atau prediksi [18]. Semakin rendah nilai RMSEnya, maka semakin akurat nilai prediksi tersebut. Adapun rumus dari RMSE adalah :
𝑅𝑴𝑺𝑬 = √𝟏
𝒏 ∑ = (𝒚𝟏− 𝒚𝟐)𝟐
𝒏 𝒊=𝟏
Ket : 𝑦1 adalah data yang disajikan 𝑦2 adalah data yang diprediksi n adalah ukuran sampel
Pada tabel dibawah ini, tertera nilai RMSE pada setiap genre yang diprediksi.
Tabel 2. Hasil Train Score dan Test Score
Genre Train
Score
Test Score
Drama 2.32
RMSE
2.08 RMSE
Comedy 1.42
RMSE
1.17 RMSE
Action 0.81
RMSE
0.65 RMSE
Horror 1.46
RMSE
1.23 RMSE
Romance 0.96
RMSE
0.77 RMSE Documentary 0.64
RMSE
0.49 RMSE Thriller 0.70
RMSE
0.55 RMSE Adventure 0.47
RMSE
0.47 RMSE
Tabel di atas menunjukkan bahwa nilai RMSE yang dihasilkan oleh model LSTM yang telah dibuat cenderung memiliki nilai di bawah 3.00 dimana model LSTM yang dibuat telah berhasil
menghasilkan nilai akurasi yang baik karena menunjukkan bahwa model LSTM memiliki kesalahan prediksi yang lebih kecil atau lebih dekat dengan nilai sebenarnya.
3.4.3. Hasil Prediksi
Hasil prediksi yang diperoleh dari model LSTM menunjukkan kemampuan model dalam memprediksi genre film pada IMDb Movies Indonesia cukup baik Grafik di bawah ini memberikan gambaran visual salah satu genre dari delapan genre tentang sejauh mana model LSTM dapat mengikuti tren dan pola data aktual.
Hal ini akan memperhitungkan prediksi selama 12 tahun yaitu dari tahun 2023 hingga tahun 2035. Visualisasi ini menggunakan skala yang sesuai untuk sumbu genre dan waktu (bulan) agar grafik mudah dipahami. Data aktual ditampilkan sebagai garis biru, sedangkan data prediksi pada saat pelatihan ditampilkan sebagai garis merah dan data prediksi pada saat pengujian ditampilkan sebagai garis hijau.
3.4.2 Pelatihan dan Pengujian Model (Training & Testing)
Tahap ini akan memperhitungkan keakurasian prediksi dengan proses pelatihan dan pengujian. Dalam metode LSTM keakuratan suatu prediksi diperhitungkan dengan RMSE (Root Mean Square Error). RMSE adalah metrik yang digunakan untuk mengukur sejauh mana perbedaan antara nilai prediksi dan nilai aktual dalam pemodelan atau prediksi [19]. Semakin rendah nilai RMSEnya, maka semakin akurat nilai prediksi tersebut. Adapun rumus dari RMSE adalah :
𝑅𝑴𝑺𝑬 = √𝟏
𝒏 ∑ = (𝒚𝟏− 𝒚𝟐)𝟐
𝒏 𝒊=𝟏
Ket : 𝑦1 adalah data yang disajikan 𝑦2 adalah data yang diprediksi n adalah ukuran sampel
Pada tabel dibawah ini, tertera nilai RMSE pada setiap genre yang diprediksi.
Tabel 3. Hasil Train Score dan Test Score
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
296
Genre Train Score Test Score Drama 2.32 RMSE 2.08 RMSE Comedy 1.42 RMSE 1.17 RMSE Action 0.81 RMSE 0.65 RMSE Horror 1.46 RMSE 1.23 RMSE Romance 0.96 RMSE 0.77 RMSE Documentar
y 0.64 RMSE 0.49 RMSE
Thriller 0.70 RMSE 0.55 RMSE Adventure 0.47 RMSE 0.47 RMSE
Tabel di atas menunjukkan bahwa nilai RMSE yang dihasilkan oleh model LSTM yang telah dibuat cenderung memiliki nilai di bawah 3.00 dimana model LSTM yang dibuat telah berhasil menghasilkan nilai akurasi yang baik karena menunjukkan bahwa model LSTM memiliki kesalahan prediksi yang lebih kecil atau lebih dekat dengan nilai sebenarnya.
3.4.3 Hasil Prediksi
Hasil prediksi yang diperoleh dari model LSTM menunjukkan kemampuan model dalam memprediksi genre film pada IMDb Movies Indonesia cukup baik Grafik di bawah ini memberikan gambaran visual salah satu genre dari delapan genre tentang sejauh mana model LSTM dapat mengikuti tren dan pola data aktual [20]. Hal ini akan memperhitungkan prediksi selama 12 tahun yaitu dari tahun 2023 hingga tahun 2035. Visualisasi ini menggunakan skala yang
sesuai untuk sumbu genre dan waktu (bulan) agar grafik mudah dipahami. Data aktual ditampilkan sebagai garis biru, sedangkan data prediksi pada saat pelatihan ditampilkan sebagai garis merah dan data prediksi pada saat pengujian ditampilkan sebagai garis hijau.
Gambar 6. Grafik Hasil Prediksi
Berikut adalah tabel grafik hasil rata-rata jumlah prediksi dari semua genre pada IMDb Movies Indonesia.
Tabel. 4. Hasil Rata-Rata Nilai Prediksi
Drama
Prediksi rata-rata film dengan genre drama yang akan keluar setiap bulannya adalah 5 sampai 7.
Hal ini dikarenakan Drama adalah genre yang paling diminati banyak penonton.
Comedy
Prediksi rata-rata film dengan genre comedy yang akan keluar setiap bulannya adalah 2 sampai 4.
Hal ini dikarenakan genre comedy juga diminati banyak penonton
Action
Prediksi rata-rata film dengan genre action yang akan keluar setiap bulannya adalah 1 sampai 2.
Hal ini dikarenakan genre action memiliki peminat yang konsisten setiap bulannya.
Horror
Prediksi rata-rata genre horror yang akan keluar setiap bulannya adalah 2 sampai 4. Genre ini juga memiliki peminat yang lumayan dan genre horror juga menjadi salah satu genre yang diminati dunia perfilman Indonesia.
Romance
Prediksi rata-rata genre romance yang akan keluar setiap bulannya adalah 2 atau mungkin 3. Genre ini memiliki peminat yang tidak konsisten setiap bulannya.
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
297
Documentary
Prediksi rata-rata genre documentary yang keluar setiap bulannya adalah 1 atau bahkan mencapai 2. Hal ini dikarenakan genre documentary memiliki jumlah peminat yang sedikit dalam perfilman Indonesia.
Thriller
Prediksi rata-rata genre thriller yang akan keluar setiap bulannya adalah 1 bahkan dapat mencapai 2.
Hal ini dikarenakan adanya konsistensi genre thriller yang keluar setiap bulannya.
Adventure
Prediksi rata-rata genre adventure yang akan keluar setiap bulannya adalah 1 atau hampir mencapai 2.
Genre adventure memang memiliki peminat yang sedikit pada dunia perfilman di Indonesia.
4. KESIMPULAN
Berdasarkan hasil analisis dan penelitian yang telah dilakukan tentang Prediksi Genre Film Pada Internet Movie Database Indonesia Menggunakan Metode Long Short-Term Memory telah ditarik beberapa kesimpulan, yaitu dalam data training, model LSTM dapat menghasilkan prediksi yang akurat dengan rata- rata nilai RMSE dibawah 2.50. Data testing, model LSTM juga dapat menghasilkan prediksi yang akurat dengan rata-rata nilai RMSE dibawah 2.50. Grafik hasil prediksi menunjukkan bahwa model LSTM mampu menangkap pola dan tren dari data genre IMDb Movies Indonesia.
Genre Drama memiliki nilai prediksi yang lebih tinggi untuk dikeluarkan beberapa tahun kedepan.
5. REFERENSI
[1] M. MAWARDIANTI, “Analisis naratif film dengan berita Arie Hanggara : Studi komparasi teori Tzvetan Todorov,” UIN Sunan Gunung Djati, 2019.
[2] W. M. D. R. Ruwantha, K. Banujan, and K. Btgs, “LSTM and Ensemble Based Approach for Predicting the Success of Movies Using Metadata and Social
Media,” in 2021 International Conference on Innovation and Intelligence for Informatics, Computing, and Technologies (3ICT), Sep. 2021, pp. 626–
630. doi:
10.1109/3ICT53449.2021.9581601.
[3] P. A. Qori, D. S. Oktafani, and I.
Kharisudin, “Analisis Peramalan dengan Long Short Term Memory pada Data Kasus Covid-19 di Provinsi Jawa Tengah,” Prism. Pros. Semin. Nas. Mat., vol. 5, pp. 752–758, 2022.
[4] S. Zahara, Sugianto, and M. Bahril Ilmiddafiq, “Prediksi Indeks Harga Konsumen Menggunakan Metode Long Short Term Memory (LSTM) Berbasis Cloud Computing,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 3, no. 3, pp. 357–363, 2019, doi:
10.29207/resti.v3i3.1086.
[5] S. L. Hasibuan and Y. Novialdi,
“Prediction of Bulk and Packaged Cooking Oil Prices Using the Long Short- Term Memory (LSTM) Algorithm,” J.
Ilmu Komput. dan Agri-Informatika 9(2)149-157, vol. 9, 2022.
[6] M. T. Tombeng and Z. Ardian, “Prediksi Penjualan Supermarket Menggunakan Pendekatan Deep Learning,” CogITo Smart J., vol. 7, no. 1, pp. 160–169, Jun.
2021, doi: 10.31154/cogito.v7i1.306.160- 169.
[7] T. Jaelani, “Machine Learning untuk Prediksi Produksi Gula Nasional,” JMPM (Jurnal Mater. dan Proses Manufaktur), vol. 6, no. 1, Aug. 2022, doi:
10.18196/jmpm.v6i1.14897.
[8] B. A. Habsy, “Seni Memehami Penelitian Kuliatatif Dalam Bimbingan Dan Konseling : Studi Literatur,” JURKAM J.
Konseling Andi Matappa, vol. 1, no. 2, p.
90, Sep. 2017, doi:
10.31100/jurkam.v1i2.56.
[9] B. BİLEN and F. HORASAN, “LSTM Network based Sentiment Analysis for Customer Reviews,” Politek. Derg., vol.
25, no. 3, pp. 959–966, Oct. 2022, doi:
10.2339/politeknik.844019.
[10] A. Y. Setiawan, I. G. M. Darmawiguna, and G. A. Pradnyana, “Sentiment Summarization Evaluasi Pembelajaran
Copyright: ©2023 by authors. https://jurnal.murnisadar.ac.id/index.php/Tekinkom/
298
Menggunakan Algoritma LSTM (long short term memory),” Kumpul. Artik.
Mhs. Pendidik. Tek. Inform., vol. 11, no.
2, pp. 183–191, 2022.
[11] M. Radhi, A. Amalia, D. R. H. Sitompul, S. H. Sinurat, and E. Indra, “ANALISIS BIG DATA DENGAN METODE EXPLORATORY DATA ANALYSIS (EDA) DAN METODE VISUALISASI
MENGGUNAKAN JUPYTER
NOTEBOOK,” J. Sist. Inf. dan Ilmu Komput. Prima(JUSIKOM PRIMA), vol.
4, no. 2, pp. 23–27, Feb. 2022, doi:
10.34012/jurnalsisteminformasidanilmuk omputer.v4i2.2475.
[12] J. Peng et al., “DataPrep.EDA: Task- Centric Exploratory Data Analysis for Statistical Modeling in Python,” in Proceedings of the 2021 International Conference on Management of Data, Jun.
2021, pp. 2271–2280. doi:
10.1145/3448016.3457330.
[13] L. Wiranda and M. Sadikin, “Penerapan Long Short Term Memory Pada Data Time Series Untuk Memprediksi Penjualan Produk Pt. Metiska Farma,” J.
Nas. Pendidik. Tek. Inform., vol. 8, no. 3, pp. 184–196, 2019.
[14] S.-S. Baek, J. Pyo, and J. A. Chun,
“Prediction of Water Level and Water Quality Using a CNN-LSTM Combined Deep Learning Approach,” Water, vol.
12, no. 12, p. 3399, Dec. 2020, doi:
10.3390/w12123399.
[15] Z. Olaofe, “Assessment of LSTM, Conv2D and ConvLSTM2D Prediction Models for Long-Term Wind Speed and Direction Regression Analysis,” 2021.
[16] H. Liu, H. Zhang, and C. Mertz,
“DeepDA: LSTM-based Deep Data Association Network for Multi-Targets Tracking in Clutter,” in 2019 22th International Conference on Information Fusion (FUSION), Jul. 2019, pp. 1–8. doi:
10.23919/FUSION43075.2019.9011217.
[17] I. Nurhaida et al., “Implementation of Deep Learning Predictor (LSTM) Algorithm for Human Mobility Prediction,” Int. J. Interact. Mob.
Technol., vol. 14, no. 18, p. 132, Nov.
2020, doi: 10.3991/ijim.v14i18.16867.
[18] P. Mishra, S. Dey, S. S. Ghosh, D. B. Seal, and S. Goswami, “Human Activity Recognition using Deep Neural Network,” in 2019 International Conference on Data Science and Engineering (ICDSE), Sep. 2019, pp. 77–
83. doi:
10.1109/ICDSE47409.2019.8971476.
[19] K. S. Witanto, N. A. Sanjaya ER, A. E.
Karyawati, I. G. A. G. A. Kadyanan, I. K.
G. Suhartana, and L. G. Astuti,
“Implementasi LSTM Pada Analisis Sentimen Review Film Menggunakan Adam Dan RMSprop Optimizer,”
JELIKU (Jurnal Elektron. Ilmu Komput.
Udayana), vol. 10, no. 4, p. 351, Jun.
2022, doi:
10.24843/JLK.2022.v10.i04.p05.
[20] R. B. Mangolin et al., “A multimodal approach for multi-label movie genre classification,” Multimed. Tools Appl., vol. 81, no. 14, pp. 19071–19096, Jun.
2022, doi: 10.1007/s11042-020-10086-2.