• Tidak ada hasil yang ditemukan

View of Clustering Film Populer pada Aplikasi Netflix dengan Menggunakan Algoritma K-Means dan Metode CRISP-DM

N/A
N/A
Protected

Academic year: 2023

Membagikan "View of Clustering Film Populer pada Aplikasi Netflix dengan Menggunakan Algoritma K-Means dan Metode CRISP-DM"

Copied!
11
0
0

Teks penuh

(1)

301

Clustering Film Populer Pada Aplikasi Netflix Dengan Menggunakan Algoritma K-Means Dan Metode CRISP-

DM

Clustering Popular Movies on Netflix App Using K-Means Algorithm and CRISP-DM Method

Ika Fitrianti1, Apriade Voutama2, Yuyun Umaidah3

1,2,3

Sistem Informasi, Fakultas Ilmu Komputer Universitas Singaperbangsa Karawang Jl. H.S.

Ronggowaluyo, Telukjambe Timur, Karawang 41361

E-mail: 12010631250053@student.unsika.ac.id , 2apriade.voutama@staff.unsika.ac.id

3yuyun.umaidah@staff.unsika.ac.id

Abstrak

Netflix adalah platform video streaming yang paling banyak digunakan diseluruh dunia dan mulai mengadopsi teknologi analisis data dan machine learning untuk meningkatkan layanan pengguna. Netflix menggunakan data analisis untuk memahami perilaku pengguna sehingga pengguna dapat memberikan rekomendasi yang relevan. Pada penelitian ini dilakukan analisis cluster pada dataset yang berjumlah 7.680 data film Netflix yang sudah difilter menggunakan operator RapidMiner dan metode clustering. Pada penelitian ini menggunakan metode CRISP-DM dan algoritma K-Means dalam proses eksekusi di RapidMiner. Dataset yang telah berhasil difilter terdapat 3 atribut yang digunakan dari 9 atribut dataset yang telah dikumpulkan yaitu durasi, rating, dan votes. Dari hasil pemodelan clustering, menunjukkan 3 cluster yang memiliki nilai rata-rata centroid yang berbeda. Dari ketiga kluster tersebut, cluster 1 menjadi cluster yang ciri-ciri ideal dalam mengelompokkan film popular di Netflix yaitu dengan nilai rata-rata pada atribut rating sebesar 8.571, atribut durasi sebesar 166.036, dan atribut votes sebesar 1.157.600,464. Dari hasil penelitian tersebut diharapkan dapat membantu pengguna dalam menemukan film-film yang sesuai dengan minat dan preferensi pengguna.

Kata kunci: Netflix, Clustering, K-Means, RapidMiner

Abstract

Netflix is the most widely used video streaming platform wordlwide and is adopting data analytics and machine learning technologies to improve user service. Netflix uses analytics data to understand user behavior so users can provide relevant recommendations. In this study, a cluster analysis was carried out on a dataset of 7,637 Netflix movie data that had been filtered using the RapidMiner operator and clustering method. This study uses the CRISP-DM method algorithm in the execution process at RapidMiner. The dataset that has been succesfully filtered has 3 atributes used from 9 dataset attributes that have been collected, namely duration, rating, and votes. From the results of clustering modeling, it shows 3 clusters that have different centroid average values. Of three clusters, cluster 1 is a alcuster with ideal characteristics in grouping popular films on Netflix, namely with an average value on the rating attribute of 8,571, the duration attribute of 166.036 and the votes attribute of 1.157.600,464. From the results of the research, it is excepted to help users find film that suit user interests and preferences.

Keywords: Netflix, Clustering, K-Means, RapidMiner

(2)

302

1. PENDAHULUAN

Netflix merupakan salah satu platform video streaming terbesar di dunia, yang didirikan di Amerika Serikat pada tahun 1997. Pada awalnya, platform ini hanya berfokus pada penyewaan DVD melalui media pos. Namun, sejak tahun 2007, Netflix sudah mudah berkembang dan memperluas bisnissnya ke layanan streaming video online. Netflix adalah layanan online berbasis langganan yang memungkinkan para member yang ada menonton acara TV dan film tanpa iklan di perangkat yang terhubung ke Internet atau dengan kata lain adalah adalah layanan yang memungkinkan pengguna atau penononton, menonton tayangan kesukaan mereka di mana pun, kapan pun, bisa menggunakan smartphone, smartTV, tablet, PC, dan laptop[1]

Netflix menawarkan berbagai banyak fitur terbaru salah satunya yaitu jenis paket langganan. Fitur ini menawarkan paket dasar, standar, dan premium dengan harga yang berbeda-beda tergantung pada kualitas video dan jumlah perangkat yang dapat digunakan untuk streaming. Selain itu, Netflix juga mampu mengembangkan berbagai jenis konten eksklusif, seperti film dan serial yang diproduksikan oleh pihak Netflix sendiri. Netflix juga telah mengubah cara bercerita dengan menerapkan strategi produksi yang berbeda dalam serial.

Dalam beberapa tahun terakhir, Netflix dan platform video streaming lainnya semakin mengadopsi teknologi analisis data dan machine learning untuk meningkatkan pengalaman pengguna. Netflix menggunakan data analisis untuk memahami perilaku pengguna dan preferensi pengguna, sehingga pengguna dapat memberikan rekomendasi konten yang lebih relevan dan personal. Salah satu teknik analisis data yang digunakan oleh Netflix adalah clustering atau pengelompokan. Clustering dapat digunakan untuk mengelompokkan pengguna berdasarkan preferensi tontonan pengguna, sehingga Netflix dapat memberikan rekomendasi konten yang lebih spesifik dan relevan. Selain itu, clustering juga dapat digunakan untuk mengelompokkan konten berdasarkan karakteristik dan genre, sehingga pengguna dapat lebih mudah menemukan konten yang sesuai dengan preferensi pengguna. RapidMiner memanfaatkan Teknik deskriptif dan prediktif sebagai solusi dalam menganalisis data yang bertujuan untuk dapat memberikan informasi kepada pengguna, sehingga mampu membantu mereka dalam mengambil keputisan yang tepat. [2]

Dengan adanya platform tersebut, perusahaan dapat mengambil keputusan berdasarkan hasil analisis data sehingga mampu mendorong kinerja perusahaan agar berjalan lebih efektif dan efisien. [3] Dengan adanya pertimbangan tersebut, maka perlu diadakan pengelompokkan konten di Netflix berdasarkan atribut yang tersedia agar pengguna dapat mencari dan menemukan konten yang terdapat di dalam Netflix sesuai dengan genre dan penilaian dari pengguna lainnya serta untuk mengetahui apakah keberhasilan konten-konten trending berkaitan dengan beberapa atribut konten tersebut.

1.1. Referensi

1.1.1. Aplikasi Netflix

Netflix merupakan suatu layanan streaming video yang memberikan kemampuan bagi pengguna untuk menyaksikan film, serial televisi, dan berbagai program lainnya secara online melalui internet. Selain itu, Netflix juga memanfaatkan teknologi streaming agar pengguna dapat menonton video secara langsung tanpa harus menunggu sampai proses pengunduhan selesai.

Secara finansial, Netflix merupakan salah satu perusahaan teknologi terbesar didunia dan memiliki jutaan pelanggan di seluruh dunia. Netflix telah berkembang menjadi salah satu platform yang streaming terbesar di dunia dengan jangkauan global dan keanggotaan yang meliputi jutaan orang diberbagai negara. Perusahaan ini juga terus berinvestasi dalam produksi secara eksklusif untuk netflix. Oleh karena itu, Netflix akan terus mengoptimalkan dan

(3)

303

meningkatkan kualitas produk dan layanan mereka yang dapat diakses dengan mudah dan fleksibel ke berbagai jenis konten melalui platform yang inovatif dan populer di seluruh dunia

1.1.2. Clustering

Clustering merupakan Teknik analisis data dalam data mining yang digunakan untuk mengelompokkan objek atau data yang serupa menjadi kelompokkelompok yang ebih kecil atau lebih terorganisir[4]. Tujuan dari clustering ini adalah untuk menemukan struktur dalam data yang sebelumnya tidak diketahui[5]. Banyak peneliti yang telah melakukan banyak pengembangan dalam bidang penelitian pengelompokkan data. Dalam clustering, objek yang memiliki kesamaan dalam beberapa atribut akan dikelompokkan dalam satu kelompok, sedangkan objek yang berbeda akan dikelompokkan dalam kelompok yang berbeda [6].

Clustering adalah salah satu tugas umum dari data mining, Pada tahap ini dilakukan pengelompokan data menggunakan kombinasi dua algoritma clustering, yaitu hierarchical clustering dan metode K-means. Dari algoritma hierarchical clustering ini digunakan untuk menentukan pusat cluster. Selanjutnya, pusat cluster yang diperoleh hierarchical clustering tersebut digunakan untuk proses pengelompokan data dengan menggunakan metode K-means.

1.1.3.

K-Means

Algoritma K-Means adalah suatu metode yang digunakan untuk mengelompokkan data dengan mencari pusat cluster secara iteratif.[7] Metode ini mengidentifikasi letak pusat cluster dengan jarak minimum dari setiap data[7]. Pengelompokkan data menggunakan K-means biasanya dilakukan dengan menggunakan algoritma dasar sebagai berikut:

a. Tentukan jumlah cluster b. Tetapkan data secara ke cluster

c. Menghitung centroid atau rata-rata dari nilai data yang ada di setiap cluster d. Menargetlan semua data ke centroid

e. Kembali ke langkah 3, jika masih ada data centroid yang berubah [8]

1.1.4. RapidMiner

RapidMiner adalah alat perangkat lunak pembelajaran mesin yang menyediakan pendekatan berbeda untuk pemodelan otomatis pembelajaran mesin[10]. Ini digunakan untuk menganalisis dan memprediksi sebagai fenomena seperti produksi energi fotovoltaik, klasifikasi data firewall internet, dan prediksi indeks efisiensi untuk rencana beda radio streotaktik[11]

RapidMiner menyediakan antarmuka yang dapat memungkinkan pengguna untuk membuat alur kerja dengan cara diseret (drag) dan dilepaskan (down) dari elemen-elemen antarmuka. Dengan alur kerja yang seperti itu juga, pengguna dapat memproses dan menganalisis data dengan baik.

RapidMiner mendukung berbagai jenis sumber data termasuk file data, basis data, dan platfrom big data seperti apache Cassandra, dan AWS (Amazon Web Service). Perangkat lunak ini juga dilengkapi dengan berbagai operator bawaan yang dapat digunakan sebagai blok bangunan dalam alur kerja. Operator-operator ini mencakup seluruh tahapan yang terdapat di data mining[5]

2. METODE PENELITIAN

Dalam penelitian, terdapat langkah-langkah kerja dalam proses penelitian guna mengentahui hubungan antar data dan atribut pada dataset film apllikasi Netflix. Metode penelitian yang digunakan adalah CRISP-DM (Cross Industry Standard Process for Data Mining). Metode ini menerapkan 6 tahapan dalam mengolah suatu masalah mengenai data mining, yaitu (1) Business Understanding; (2) Pemahaman Data; (3) Persiapan Data; (4) Pemodelan; (5) Evaluasi; (6) Penerapan [12][13].

(4)

304

Gambar 1. Alur Kerja Metode CRISP-DM

Pada Gambar 1 merupakan bagan alur kerja dari keseluruhan tahapan metode CRISP-DM dalam menganalisis data dari film-film yang popular pada aplikasi Netflix dengan tujuan untuk dapat mengetahui permasalahan bisnis yang terjadi pada aplikasi Netflix tersebut dan dapat mengoptimalkan produk dan layanan dari aplikasi Netflix terhadap pengguna khusus Netflix sehingga hasil pengolahan dan pengomptimalan data dapat dijadikan sebagai bentuk rekomendasi dari model analisis bisnis ini.[14]

1. Business Understanding

Tahap ini dimulai dengan memahami masalah bisnis yang ingin diselesaikan atau tujuan yang ingin dicapai dengan proyek data mining.

2. Data Understanding

Pada tahap ini, data yang tersedia dieksplorasi dan dipahami secara mendalam. Hal ini mencakup pemeriksaan dan pemahaman data yang tersedia, struktur data, kualitas data, serta kemungkinan masalah.

3. Data Preparation

Pada tahap ini, data disiapkan untuk digunakan dalam proses data mining. Hal ini meliputi pemilihan atribut yang relevan, transformasi data, dan eliminasi data yang tidak relevan atau tidak valid.

4. Modeling

Tahap ini mencakup pemilihan model data mining yang sesuai untuk menyelesaikan masalah bisnis yang telah diidentifikasi.

5. Evaluation

Tahap ini mengevaluasi semua tahapan yang telah dilakukan berdasarkan tujuan semula 6. Deployment

Pada tahap ini, model data mining yang telah dikembangkan diimplementasikan ke dalam lingkungan produksi untuk digunakan dalam proses bisnis.

3. HASIL DAN PEMBAHASAN

Dengan menggunakan metode CRISP-DM, terdapat beberapa proses yang dilakukan oleh peneliti, diantaranya yaitu:

3.1. Business Understanding

Pada tahap ini, tujuan dari penelitian ini dilakukan setelah ditemukannya permasalahan dari proses bisnis pada Netflix adalah untuk dapat mengidentifikasi film-film popular pada

(5)

305

Netflix menjadi beberapa kelompok berdasarkan genre, rating, durasi, votes, atau tahun publikasi. Dengan melakukan clustering, diharapkan dapat memberikan wawasan yang lebih dalam tentang preferensi dan perilaku penonton pada aplikasi Netflix.

3.2. Data Understanding

Data yang digunakan berasal dari website Kaggle yang dapat dilihat di link berikut Netflix popular movies dataset | Kaggle, Dataset Netflix ini memiliki 9.901 data film dengan jumlah kolom atribut yang dimiliki ada 9 atribut yaitu title, year, certificate, duration, genre, rating, description, stars, dan votes. Ditahap ini juga, peneliti memahami dan mengecek data yang digunakan apakah terdapat missing value atau data yang tidak konsisten. Untuk penelitian ini, atribut yang akan digunakan pada model k-means ada 3 atribut yaitu duration , rating, dan votes.

3.3. Data Preparation

Dari 9.901 jumlah dataset, banyak data yang tidak konsisten dan memiliki missing value.

Data yang missing value tersebut dibersihkan dari dataset, kemudian data yang sudah dibersihkan akan diproses menggunakan metode K-Means Clustering Dataset juga dilakukan normalisasi[15]. Untuk penelitian ini, atribut yang akan digunakan pada model k-means ada 3 atribut yaitu duration, rating, dan votes. Berikut tampilan gambar dataset yang sudah dibersihkan dari missing value dengan cara menghapus baris nilai yang kosong dari setiap atribut, sehingga data yang akan digunakan sebanyak 7.680 data yang ditunjukkan pada Gambar 2.

Gambar 2. Data yang Sudah Diolah

(6)

306

Salah satu visualisasi data film netflix berdasarkan rating yang diperoleh yang dapat diperlihatkan pada Gambar 3. Pada Gambar 3 ini terlihat jumlah pengguna paling banyak memberikan rating 7,2-7,3 dengan total penggunanya sekitar 272 pengguna.

Gambar 3. Visualisasi Data Film Netflix Berdasarkan Rating

3.4. Modeling

Pada tahap ini, kita akan mengeksekusi data dengan menggunakan algoritma clustering K-Means dengan bantuan software RapidMiner. Hal pertama yang dilakukan dalam algoritma K-means adalah menentukan jumlah cluster (K Cluster). Lalu, menentukan centroid secara acak disesuaikan dengan jumlah K cluster yang sudah ditentukan. Pada penelitian ini, nilai K cluster yang digunakan sebanyak 3 K cluster sehingga nantinya akan dikelompokkan sebanyak 3 cluster. Berikut pemodelan algoritma K-Means dengan menggunakan software RapidMiner ditujukan pada Gambar 4.

Gambar 4. Pemodelan Clustering Menggunakan RapidMiner

Langkah-langkah dalam tahapan modelling pada Gambar 4 adalah sebagai berikut:

a) Memasukkan dataset dengan format CSV pada operator Read CSV

b) Dataset akan difilter pada operator filter examples berdasarkan kondisi seperti menghapus atau membersihkan data yang tidak diinginkan dari dataset.

c) Menambahkan operator clustering k-means sebagai algoritma pemodelan yang digunakan.

Jumlah cluster yang digunakan pada pemodelan adalah 3, 4, 5, 6, dan 7

d) Menambahkan operator performance untuk dapat melihat nilai DBI sebagai bahan evaluasi Dari proses pemodelan clustering seperti pada Gambar 4, akan menghasilkan 3 visualisasi data dalam bentuk scatter plot pada Gambar 5, Gambar 6, dan Gambar 7 berikut.

(7)

307

Gambar 5. Cluster pada Atribut Rating

Bentuk grafik scatter plot yang ditujukan pada gambar 5 ini merupakan bentuk visualisasi dari hasil pemodelan cluster pada atribut Rating. Dari pengujian diatas dapat disimpulkan bahwa cluster 0 memiliki jumlah rata-rata sebanyak 6.727 yang dilambangkan dengan warna hijau, cluster 1 berjumlah 8.571 yang dilambangkan dengan warna orange, lalu yang terakhir cluster 2 berjumlah 7.571 yang dilambangkan dengan warna biru.

Gambar 6. Cluster pada Atribut Duration

Pada gambar 6 merupakan hasil visualisasi dari pengelompokkan data clustering pada atribut durasi. Dari pengujian yang telah dilakukan menggunakan software RapidMiner , dapat disimpulkan bahwa cluster 0 memiliki jumlah rata-rata sebanyak 73.876 yang dilambangkan

(8)

308

dengan warna hijau, cluster 1 berjumlah 166.036 yang dilambangkan dengan warna orange, lalu yang terakhir cluster 2 berjumlah 93.120 yang dilambangkan dengan warna biru

Gambar 7. Cluster pada Atribut Votes

Pada gambar 7 merupakan hasil visualisasi dari pengelompokkan data clustering pada atribut Votes. Dari pengujian yang telah dilakukan diatas, dapat disimpulkan bahwa cluster 0 memiliki jumlah rata-rata sebanyak 9.114,897 yang dilambangkan dengan warna hijau, cluster 1 berjumlah 1.157.600,464 yang dilambangkan dengan warna orange, lalu yang terakhir cluster 2 berjumlah 302.932,288 yang dilambangkan dengan warna biru.

3.5. Evaluasi

Teori evaluasi yang digunakan dalam penelitian ini adalah nilai DBI. Dalam tabel 1, terdapat jumlah cluster yang telah dimodelkan dan nilai DBI yang terkait.

Tabel 1. Nilai DBI Setiap Jumlah Cluster Jumlah Cluster Nilai DBI

3 -0.441

4 -0.494

5 -0.443

6 -0.447

7 -0.450

Mengacu pada prinsip DBI, nilai yang dianggap baik dalam data mining adalah semakin kecil atau mendekati nol. Dari data dalam Tabel 1, terdapat 5 kategori jumlah cluster yang memiliki nilai DBI dan jumlah cluster dengan nilai DBI yang paling baik adalah cluster 3, dengan nilai DBI yang mendekati nol yaitu -0.441. Oleh karena itu, pengelompokkan dilakukan dengan menggunakan 3 cluster. Jumlah anggota dalam masing-masing cluster dapat dilihat pada Gambar 8 di bawah ini.

(9)

309

Gambar 8. Hasil Jumlah Item dari Pemodelan 3 Clustering

Pada Gambar 8, salah satu cluster terlihat memiliki jumlah data yang lebih besar jika dibandingkan dengan cluster lainnya. Agar dapat lebih memahaminya dari setiap atribut dan cluster, kita analisis nilai rata-rata centroid pada setiap cluster dari setiap atribut yang telah ditentukan. Berikut hasil dari nilai rata-rata atribut dapat dilihat dari tabel 2 dibawah ini

Tabel 2. Hasil Nilai Rata-rata Centroid dari Setiap Cluster

Atribut Cluster 0 Cluster 1 Cluster 2

Duration 73.867 166.036 93.120

Rating 6.727 8.571 7.571

Votes 9114.876 1157600.464 302932.2884

Dari data dan tabel di atas dapat disimpulkan bahwa setiap cluster dalam kategori film berdasarkan jumlah rating, durasi, dan vote dapat dibedakan menjadi:

1) Cluster 0 : film Netflix dengan jumlah rating, durasi, dan vote terendah 2) Cluster 1 : film Netflix dengan jumlah rating, durasi, dan vote tertinggi 3) Cluster 2 : film Netflix dengan jumlah rating, durasi, dan vote sedang

4. KESIMPULAN DAN SARAN

Dari analisis data yang telah dilakukan, diperoleh hasil dan kesimpulan bahwa penggunaan metode K-Means dalam pemodelan dan evaluasi menggunakan nilai DBI dapat mengoptimalkan jumlah cluster. Clustering ini menghasilkan pengelompokan film yang berdasarkan jumlah durasi, rating, dan votes dengan kategori rendah, sedang, dan tinggi. Dari hasil ketiga cluster tersebut yang sudah dibedakan menjadi 3 kategori dapat dikatakan bahwa cluster 1 merupakan cluster yang memiliki ciri-ciri ideal untuk mengelompokkan film-film popular berdasarkan rincian atribut tersebut. Dapat dilihat dari rating pada cluster 1 memiliki nilai rata-rata sebesar 8.571 yang artinya film-film di cluster ini memiliki nilai rata-rata yang tinggi, yang menunjukkan film-film mendapatkan penerimaan positif dari pengguna. Durasi, dalam cluster 1 memiliki rata-rata durasi 166.036 menit yang mengindikasikan bahwa film-film pada cluster ini memiliki durasi yang Panjang, untuk memberikan lebih banyak konten dan pengembangan karakter. Votes, memiliki jumlah rata-rata suara sebesar 1.157.600,464, yang menunjukkan film-fim memiliki tingkat popularitas yang tinggi. Hasil penelitian ini, peneliti mengharapkan dapat digunakan pada penelitian-penelitian selanjutnya, dan dengan pembagian data menggunakan clustering ini diharapkan dapat membantu pengguna dalam menemukan film-film yang sesuai dengan minat dan preferensi mereka. Dikarenakan keterbatasan waktu dan energi, peneliti menyadari bahwa hasil penelitian ini masih jauh dari kesempurnaan. Oleh karena itu, dalam penelitian selanjutnya, dapat dilakukan perbandingan dengan metode clustering yang berbeda.

(10)

310

DAFTAR PUSTAKA

[1] B. G. Sudarsono, M. I. Leo, A. Santoso, and F. Hendrawan, “Analisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner,” JBASE - J. Bus. Audit Inf. Syst., Vol. 4, No.

1, pp. 13–21, 2021, doi: 10.30813/jbase.v4i1.2729.

[2] S. Chris, Edy, and D. Susilawati, “Analisis Perancangan Sistem Untuk Kepuasan Pelanggan pada UD. Shinta Elektronic Dengan Menggunakan Metode Algoritma C4.5,”

Algor, Vol. 1, No. 2, pp. 52–58, 2020, [Online]. Available:

https://jurnal.buddhidharma.ac.id/index.php/algor/article/view/335

[3] E. S. Anista Yulia Ratnawati, Edy Susena, “Analisis dan Pengembangan Sistem Informasi Manajemen Sragen,” J. Sainstech Politek. Indonusa Surakarta, Vol. 6, pp. 1–8, 2019.

[4] J. Mantik and N. Ayu Privandhani, “2022) 1542-1550 Accredited,” J. Mantik, Vol. 6, No. 2, pp. 1542–1550, 2022.

[5] M. R. Nahjan, N. Heryana, and A. Voutama, “Implementasi Rapidminer Dengan Metode Clustering K-Means Untuk Analisa Penjualan pada Toko Oj Cell,” J. Mhs. Tek. Inform., Vol. 7, No. 1, pp. 1–4, 2023.

[6] R. K. Dinata, S. Safwandi, N. Hasdyna, and N. Azizah, “Analisis K-Means Clustering pada Data Sepeda Motor,” INFORMAL Informatics J., Vol. 5, No. 1, p. 10, 2020, doi:

10.19184/isj.v5i1.17071.

[7] E. Satria et al., “Prosiding Seminar Nasional Riset Information Science (SENARIS) Penerapan Clustering Dalam Mengelompokkan Jumlah Kunjungan Wisatawan Mancanegara Dengan Metode K-Means,” No. September, p. 462, 2019, [Online].

Available: https://www.bps.go.id/dynamictable/2018/07/30/1548/jumlah-kunjungan-

[8] S. W. Hadi, M. F. Julianto, S. Rahmatullah, and W. Gata, “Analisa Cluster Aplikasi pada App Store Dengan Menggunakan Metode K-Means,” Bianglala Inform., Vol. 8, No. 2, pp. 86–90, 2020, doi: 10.31294/bi.v8i2.8191.

[9] Abdussalam Amrullah, Intam Purnamasari, Betha Nurina Sari, Garno, and Apriade Voutama, “Analisis Cluster Faktor Penunjang Pendidikan Menggunakan Algoritma K- Means (Studi Kasus: Kabupaten Karawang),” J. Inform. dan Rekayasa Elektron., Vol. 5, No. 2, pp. 244–252, 2022, doi: 10.36595/jire.v5i2.701.

[10] N. Baharun, N. F. M. Razi, S. Masrom, N. A. M. Yusri, and A. S. A. Rahman, “Auto Modellingfor Machine Learning: A Comparison Implementation Between Rapid Miner and Python,” Int. J. Emerg. Technol. Adv. Eng., Vol. 12, No. 5, pp. 15–27, 2022, doi:

10.46338/ijetae0522_03.

[11] H. Donya, S. Othman, and A. Dimitriadis, “Evaluating and Predicting The Efficiency Index for Stereotactic Radiosurgery Plans Using RapidMiner GO(JAVA) Based Artificial Intelligence Algorithms,” 2022, [Online]. Available: http://arxiv.org/abs/2201.07718 [12] Y. V Ermanto, Y. Wahyuningsih, and ..., “Analisis Kemenangan Pemain pada

Permainan Player Unknown Battle Grounds (PUBG) Menggunakan Metode CRISP-

(11)

311

DM,” Semin. Nas. Ilmu …, Vol. 2, pp. 1–16, 2022, [Online]. Available:

https://ojs.widyakartika.ac.id/index.php/sniter/article/view/515%0Ahttps://ojs.widyakarti ka.ac.id/index.php/sniter/article/download/515/461

[13] Y. Suhanda, I. Kurniati, and S. Norma, “Penerapan Metode Crisp-DM Dengan Algoritma K-Means Clustering Untuk Segmentasi Mahasiswa Berdasarkan Kualitas Akademik,” J. Teknol. Inform. dan Komput., Vol. 6, No. 2, pp. 12–20, 2020, doi:

10.37012/jtik.v6i2.299.

[14] Y. A. Singgalen, “Analisis Perilaku Wisatawan Berdasarkan Data Ulasan di Website Tripadvisor Menggunakan CRISP-DM : Wisata Minat Khusus Pendakian Gunung Rinjani dan Gunung Bromo,” J. Comput. Syst. Informatics, Vol. 4, No. 2, pp. 326–338, 2023, doi: 10.47065/josyc.v4i2.3042.

[15] T. Hardiani, “Analisis Clustering Kasus Covid 19 di Indonesia Menggunakan Algoritma K-Means,” J. Nas. Pendidik. Tek. Inform., Vol. 11, No. 2, pp. 156–165, 2022, doi:

10.23887/janapati.v11i2.45376.

Referensi

Dokumen terkait

12123 - Motherland and Polytechnic Institute ,Thakurgaon 2 7 It is to be notified all concerned that roll numbers who have failed in three or less subjects in the 7th semester