• Tidak ada hasil yang ditemukan

Automasi Penentuan Tren Topik Skripsi Menggunakan Algoritma K-Means Clustering

N/A
N/A
Protected

Academic year: 2024

Membagikan "Automasi Penentuan Tren Topik Skripsi Menggunakan Algoritma K-Means Clustering"

Copied!
6
0
0

Teks penuh

(1)

Automasi Penentuan Tren Topik Skripsi Menggunakan Algoritma K-Means Clustering

Wahyu Fuadi1*, Ar Razi2, Dedi Fariadi3

1,2Program Studi Teknik Informatika, Universitas Malikussaleh, Aceh Utara

3Jurusan Teknik Elektro Universitas Malikussaleh, Aceh Utara

*Koresponden email: [email protected]

Diterima: 4 Maret 2022 Disetujui: 4 April 2022

Abstrak

Thesis is a compulsory subject that must be completed by students to obtain undergraduate status (S1).

Students' need for thesis information is increasing, so labeling topic trends is expected to help students find out which topics are trending in the previous year without having to read the entire thesis in the library. In this study, thesis data collection was based on data from the previous 5 years, namely 2015 - 2020 at the Department of Informatics, Universitas Malikussaleh (Unimal). Thesis topic trends are classified into 5 categories, namely Data Mining, Artificial Intelligence, Image Processing, DSS, and GIS. Classification of thesis topics based on title and abstract. The programming language used is PHP and MySQL database.

The methods used in the automation of thesis topic trend determination are text mining and the K-Means Clustering algorithm. The priority of this research is to produce an application that can overcome student obstacles in determining thesis topics. This application is expected to make it easier for students to find out trends in thesis topics in the previous year. In this study, the percentage accuracy of the thesis topic trend using the K-means clustering algorithm is 84% of the 70 test data..

Keywords: K-means clustering, thesis, text mining, topic trends, Informatics Engineering Unimal

Abstrak

Skripsi merupakan salah satu mata kuliah wajib yang harus diselesaikan oleh setiap mahasiswa untuk mendapatkan status sarjana (S1). Kebutuhan mahasiswa terhadap informasi dalam bentuk skripsi semakin meningkat, sehingga pemberian label tren topik diharapkan dapat membantu mahasiswa dalam mengetahui topik apa yang sedang tren ditahun sebelumnya tanpa harus membaca secara keseluruhan skripsi yang ada di perpustakaan. Pada penelitian ini, pengambilan data skripsi berdasarkan data 5 tahun sebelumnya yaitu tahun 2015 - 2020 pada Jurusan Teknik Informatika Universitas Malikussaleh (Unimal). Tren topik skripsi digolongkan ke dalam 5 kategori, yaitu Data Mining, Kecerdasan Buatan, Pengolahan Citra, SPK, dan GIS. Klasifikasi topik skripsi berdasarkan judul dan abstrak. Bahasa pemrograman yang digunakan yaitu PHP dan database MySQL. Adapun metode yang digunakan dalam automasi penentuan tren topik skripsi adalah text mining dan algoritma K-Means clustering. Adapun keutamaan dari penelitian ini adalah untuk menghasilkan sebuah aplikasi yang dapat mengatasi kendala mahasiswa yaitu kesulitan dalam menentukan topik judul skripsi sehingga lama dalam proses pembuatan proposal skripsi. Dengan adanya aplikasi ini diharapkan dapat mengatasi kendala tersebut, sehingga mempermudah mahasiswa dalam mengetahui tren topik skripsi di tahun sebelumnya dan memudahkan dalam menentukan topik judul proposal skripsi. Pada penelitian ini persentase keakurasian tren topik skripsi dengan menggunakan algoritma K-means clustering adalah 84 % dari 70 data uji.

Kata kunci :K-means clustering, skripsi, text mining, tren topik, Teknik Informatika Unimal

1. Pendahuluan

Skripsi atau Tugas Akhir merupakan salah satu mata kuliah wajib yang harus diselesaikan oleh setiap mahasiswa. Skripsi merupakan persyaratan yang harus ditempuh untuk mendapatkan status sarjana (S1) di setiap Perguruan Tinggi Negeri (PTN) maupun Perguruan Tinggi Swasta (PTS) yang ada di Indonesia [1]. Setiap tahunnya jumlah skripsi yang ada di jurusan Teknik Informatika Universitas Malikussaleh semakin bertambah. Banyaknya skripsi yang ada di perpustakaan membuat para mahasiswa kesulitan dalam mencari referensi mengenai skripsi, salah satunya yaitu bagaimana cara mudah dan praktis dalam mengetahui tren topik skripsi di tahun sebelumnya tanpa harus melihat satu persatu skripsi yang ada di perpustakaan. Kebutuhan mahasiswa terhadap informasi dalam bentuk skripsi semakin meningkat, sehingga pengelompokan atau pengkategorian skripsi dibutuhkan untuk mempermudah pencarian informasi. Informasi penting dari skripsi berupa tren topik yang menggambarkan pokok pembahasan secara

(2)

umum. Pemberian label tren topik diharapkan dapat membantu mahasiswa dalam mengetahui topik apa yang sedang tren di tahun sebelumnya tanpa harus membaca secara keseluruhan skripsi yang ada [2].

Beberapa publikasi ilmiah yang berkaitan dengan topik penelitian ini, diantaranya: penelitian dengan judul “Analisa Clustering Menggunakan Metode K-means dan Hierarchical Clustering (Studi Kasus:

Dokumen Skripsi Jurusan Kimia, FMIPA, Universitas Sebelas Maret”). Penelitian ini mengelompokkan dokumen skripsi Jurusan Kimia. Metode clustering yang digunakan pada penelitian ini adalah kombinasi antara metode hierarchical clustering dan K-means clustering. Bagian dari dokumen yang diolah adalah bagian abstrak. Hasil cluster dianalisa keterkaitan antar dokumennya dan diperkirakan tema dari tiap cluster. Hasil cluster dilihat pula keterkaitannya dengan dosen yang mengajar di Jurusan Kimia [3].

Artikel dengan judul “Implementasi Metode Text Mining dan K-Means Clustering untuk Mengelompokkan Dokumen Skripsi (Studi Kasus: Universitas Brawijaya)”. Pada penelitian ini dokumen skripsi dikelompokkan dengan mengambil bagian-bagian terpenting seperti, abstrak, kata kunci, dan daftar isi sebagai intisari dokumen. Dari hasil analisis dengan memasukkan nilai cluster yang bervariasi telah di dapatkan nilai optimal dengan memasukkan jumlah k=4 dengan nilai silhouette yang dihasilkan 0,483695522 [4].

Artikel dengan judul “Implementasi Text Mining Pengelompokan Dokumen Skripsi Menggunakan Metode K-Means Clustering”. Tujuan dari penelitian ini adalah untuk menentukan jumlah optimal kelompok yang terbentuk dari dokumen tesis dan tentukan hasil kelompok-kelompok yang terbentuk.

Penelitian ini menggunakan euclidean distance untuk menghitung jarak dokumen, dan silhouette coefficient untuk menguji validitas cluster. Tesis yang digunakan sebanyak 119 dokumen dari tahun 2016-2018.

Berdasarkan hasil analisis, jumlah optimal grup yang terbentuk adalah dua cluster. Cluster pertama didominasi oleh studi dengan data mining khususnya klasifikasi, waktu analisis seri, analisis regresi, analisis kelangsungan hidup, analisis spasial dan penelitian operasional, dan klaster kedua didominasi oleh studi dengan analisis multivariat, kontrol kualitas, dan asuransi matematika [5].

Penelitian dengan judul“Algoritma K-Means untuk Pengelompokan Topik Skripsi Mahasiswa”.

Metode pengelompokan mahasiswa yang digunakan yaitu metode clustering dan algoritma K-means, dengan membagi mahasiswa ke dalam cluster berdasarkan nilai yang diperoleh dari semester 1 - 7. Hasil dari penelitian ini adalah pengelompokan mahasiswa sesuai dengan keahliannya, yang didapat berdasarkan cluster yang memiliki nilai yang paling tinggi dan didominasi pada mata kuliah yang paling banyak sesuai dengan mata kuliah yang sudah dikelompokkan masing-masing keahlian. Sehingga hasil cluster ini yang menjadi acuan sebagai rekomendasi mahasiswa dalam mengambil topik judul skripsi [6][7].

Berdasarkan literatur review diatas, maka pada penelitian ini akan dikembangkan suatu prototipe aplikasi automasi penentuan tren topik skripsi dengan menggunakan text mining dan algoritma dan K- means clustering, yang diharapkan dapat mengatasi kendala mahasiswa dalam tugas akhir, salah satunya yaitu sulit dalam menentukan topik judul skripsi sehingga lama dalam proses pembuatan proposal skripsi.

2. Metode Penelitian

Metode penelitian yang dilakukan terdiri atas beberapa tahap, yaitu mengumpulkan data judul dan abstrak skripsi mahasiswa Teknik Informatika Unimal. Pada penelitian ini tren topik skripsi ditentukan berdasarkan dari data judul dan abstrak skripsi selama lima tahun dari tahun yaitu 2015 - 2020. Selanjutnya dilakukan pengelompokan tema skripsi berdasarkan lima tema, yaitu data mining, kecerdasan buatan, pengolahan citra, sistem pendukung keputusan (SPK), dan sistem informasi geografis (GIS) [8].

Input dari aplikasi yang dibangun yaitu berupa judul dan abstrak skripsi, lalu input tersebut akan diproses mengunakan text mining dan selanjutnya dilakukan proses klasifikasi menggunakan algoritma k- means clustering. Data training digunakan untuk melatih algoritma. Data training yang digunakan merupakan data judul dan abstrak yang sudah melalui proses text preprocessing. Jumlah data yang digunakan dalam pelatihan algoritma K-means clustering yaitu sebanyak 100 data judul dan 100 data abstrak. Dari proses klasifikasi tersebut maka akan menghasilkan output persentase tren topik skripsi serta grafik.

Proses pembuatan model menggunakan algortima K-mean clustering [9][10] melalui beberapa tahap, yaitu preprocessing, term weighting, clustering, dan validasi hasil. Proses pengolahan data dimulai dengan preprocessing. Input pada tahap preprocessing adalah bagian judul dan abstrak pada skripsi yang berupa paragraf. Pada tahap preprocessing terdapat empat proses yaitu: lexical analysis/ tokenisasi yaitu memisahkan kata pada setiap judul dan abstrak dengan menghilangkan angka, tanda baca dan karakter.

Selanjutnya dilakukan proses case folding. Proses stop word removal/filtering, yaitu pemilihan kata-kata penting dari hasil token dengan pendekatan bag-of-word. Proses stemming yaitu proses pengubahan bentuk kata menjadi kata dasar atau tahap mencari root kata dari tiap kata hasil filtering.

(3)

Proses dilanjutkan dengan menghitung nilai bobot setiap kata dengan TF-IDF [11]. Hasil dari proses ini adalah term-weight-matrix atau matriks yang berisi bobot-bobot kata pada dokumen. Tahap clustering, K-mean mengolah term-weight-matrix dengan mengelompokkan data berupa dokumen judul dan abstrak skripsi ke dalam cluster tren topik skripsi. Hasil dari K-means clustering adalah daftar cluster dari data- data yang diolah. Tahap analisa dan validasi melakukan analisa serta validasi hasil clustering dengan mengamati hasil dari cluster-cluster yang terbentuk[12].

Hasil clustering dibandingkan terhadap variabel data dan dibandingkan dengan jumlah dokumen pada tiap cluster. Setiap dokumen dilihat keterkaitannya dengan dokumen lain dalam satu cluster [13][14]

dan tema pada tiap cluster ditentukan termasuk salah satu dari lima tema skripsi yang ada, untuk menghasilkan tren topik skripsi.

Adapun alur penelitian automasi penentuan tren topik skripsi menggunakan algoritma K-means clustering adalah sebagai berikut:

Gambar 1. Diagram alir penelitian Sumber: Data peneliti (2021)

3. Hasil dan Pembahasan

Pada penelitian ini proses testing dilakukan dengan menginput judul skripsi. Kemudian sistem akan melakukan proses text preprocessing, TF-IDF dan perhitungan K-means [15]. Berikut merupakan contoh kasus dari permasalahan diatas. Diketahui 9 data (d1, d2, d3, d4, d5, d6, d7, d8, dan d9) yang digunakan sebagai data training. Data (d10) digunakan sebagai data testing yaitu judul skripsi “Perbandingan euclidean distance dengan manhattan distance pada metode k-nn untuk klasifikasi transportasi Lhokseumawe-Medan berdasarkan kebutuhan penumpang”.

Langkah pertama proses text preprocessing, yaitu preprocessing terhadap semua data yang terlibat, yaitu d1, d2, d3, d4, d5, d6, d7, d8, d9, dan d10. Selanjutnya dilakukan proses tokenizing, stemming, dan stopword. Langkah ke dua adalah proses perhitungan TF-IDF. Menghitung bobot setiap kata dari 10 data tersebut. Langkah ke tiga: menghitung TF-IDF kata pada kesepuluh data (d1 sampai d10), yaitu mengitung term frequency(tf) atau frekuensi kemunculan kata di setiap data. Selanjutnya menghitung documen frekuency (df) atau jumlah data yang mengandung kata yang dimaksud dan menghitung IDF. Kemudian mencari nilai TF-IDF data tersebut. Langkah dua diulangi untuk mendapatkan nilai TF-IDF setiap kata.

Hasil pembobotan dapat dilihat pada Tabel 1 dan Tabel 2.

(4)

Tabel 1. Nilai TF-ID

TF IDF

Term D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 df n/df Log(n/df)

Euclidean 0 5 0 0 0 0 0 0 0 1 2 5 0,698970004

Distance 0 9 0 0 0 0 0 0 0 2 2 5 0,698970004

Manhattan 0 5 0 0 0 0 0 0 0 1 2 5 0,698970004

Metode 1 5 1 3 1 0 1 0 1 1 8 1,25 0,096910013

Knn 0 4 0 0 0 0 0 0 0 1 2 5 0,698970004

Klasifikasi 2 3 0 0 0 0 0 0 0 1 3 3,33333333 0,522878745 Sumber: Hasil pengolahan data (2021)

Tabel 2. Nilai bobot documen frekuency(Wtd) Wtd =tf*idf

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

0,69897 3,49485 0 0 0 0 0 0 0 0

1,39794 6,29073 0 0 0 0 0 0 0 0

0,69897 3,49485 0 0 0 0 0 0 0 0

0,09691 0,48455 0,09691001 3

0,29073 0,09691 0 0,09691 0 0,09691 0,09691

0,69897 2,79588 0 0 0 0 0 0 0 0

0,52287 9

1,56863 6

0 0 0 0 0 0 0 1,04575

Sumber: Hasil pengolahan data (2021) 7

Langkah ke-4 menghitung K-means iterasi 1, untuk menentukan klaster (iterasi 1). Setelah dilakukan perhitungan ke seluruh data maka akan mendapatkan jarak terdekat dan kelompok klasternya pada tiap data, seperti pada Tabel 3.

Tabel 3. Jarak terdekat dan kelompok klaster pada tiap data

Data C1 C2 C3 C4 C5 Kedekatan Cluster

1. 0 11,1773331 11,848675 16,892894 121,3781 0 1

2. 101,7048299 132,449489 133,12083 138,16505 238,1464 101,70483 1

3. 11,8486753 7,26209347 0 12,977654 118,4605 0 3

4. 81,19568676 79,9738631 62,507185 81,464239 186,9014 62,507185 3

5. 16,89289403 12,1250741 12,977654 0 123,3235 0 4

6. 202,5086981 197,423301 198,64145 186,64146 306,168 186,64146 4 7. 13,12053248 8,35271253 7,6813703 13,751561 119,5512 7,6813703 3 8. 195,9559523 192,346489 185,13016 191,26799 294,9385 185,13016 3

9. 11,17733311 0 7,2620935 12,125074 94,35445 0 2

10. 119,378144 92,3544517 118,46053 123,32352 0 0 5

Sumber: Hasil pengolahan data (2021)

Langkah selanjutnya memperbaharui nilai centroid dengan menjumlahkan semua nilai data pada setiap klaster yang sama dan membagikannya dengan jumlah data yang ada pada klaster tersebut. Dari nilai centroid diatas pengujian berhenti pada iterasi 4, karena centroid baru pada iterasi 3 dan iterasi 4 sama. Hasil dari iterasi terakhir akan menjadi parameter pengklasteran. Berikut ini adalah jarak terdekat dan kelompok klaster pada iterasi terakhir yang menjadi acuan untuk hasil perhitungan dapat dilihat pada Tabel 4.

Tabel 4. Jarak terdekat dan kelompok klaster iterasi terakhir

Data C1 C2 C3 C4 C5 Kedekatan Cluster

1. 101,7048299 6,12306224 71,532372 202,7821 126,2132 6,1230622 2

2 . 0 123,263031 190,58283 323,94815 242,9814 0 1

3. 133,120831 3,46913396 62,126492 198,91485 123,2956 3,469134 2 4. 202,1363395 70,4089955 61,69218 259,98453 191,7364 61,69218 3

(5)

Data C1 C2 C3 C4 C5 Kedekatan Cluster 5. 138,1650497 6,66461195 74,673933 186,91486 128,1586 6,6646119 2 6. 327,6747481 196,059171 260,16679 2,1818872 304,5455 2,1818872 4 7. 133,2990795 4,09641052 64,922372 199,86999 124,3862 4,0964105 2 8. 302,4136879 180,954473 61,69218 376,28021 299,7735 61,69218 3 9. 132,4494888 3,2986179 69,116728 197,6967 99,18951 3,2986179 2 10. 236,1463698 108,928735 177,22774 304,44143 6,835055 6,8350546 5

Sumber: Hasil pengolahan data (2021)

Berdasarkan Tabel 4, data yang diuji berada pada cluster 5 yaitu data mining. Hal ini menunjukkan bahwa proses klasifikasi yang dilakukan terlah tepat. Pengujian akurasi dilakukan dengan melakukan beberapa pengujian dengan menggunakan data uji dengan jumlah yang berbeda. Perhitungan akurasi dilakukan dengan cara membagi total hasil true dengan total data uji dan dikali dengan 100%. Hasil pengujian dapat dilihat pada Tabel 5.

Tabel 5. Pengujian akurasi

Pengujian Data Training Data Uji Jumlah Sentimen Persentase (%) Judul dan Abstrak Judul dan Abstrak True False

1. 100 15 14 1 93

2. 100 35 32 3 91

3. 100 55 49 6 89

4. 100 70 59 11 84

Sumber: Hasil pengolahan data (2021)

Berdasarkan hasil pengujian yang telah dilakukan pada Tabel 5, didapat persentase keakurasian sebesar 84% dari 70 data uji.

Gambar 1. Diagram Tren Kategori Sumber: hasil pengolahan data (2021)

Dari data pada Gambar 1 dapat dilihat bahwasanya tren topik yang paling banyak adalah data mining sebanyak 48 kategori skripsi, kemudian pengolahan citra dengan jumlah 43 kategori. SPK menempati urutan ketiga dengan jumlah 32 kategori. Kecerdasan buatan dan GIS berada pada urutan ke empat dan lima dengan jumlah 20 dan 14 kategori. Jadi dapat disimpulkan bahwa tren kategori skripsi yang paling banyak diambil oleh mahasiswa Prodi Teknik Informatika Unimal adalah data mining.

4. Kesimpulan

Adapun kesimpulan yang diperolah dari penelitian ini adalah sebagai berikut aplikasi yang dirancang dapat berjalan dengan baik dengan tingkat akurasi sebesar 84% dari 70 data uji. Metode K- Means clustering terbukti efektif digunakan dalam mengklasifikasikan tren topik skripsi. Aplikasi yang dirancang diharapkan dapat mempermudah mahasiswa dalam mengetahui tren topik skripsi di tahun

(6)

6. Daftar Pustaka

sebelumnya dan memudahkan dalam menentukan topik judul proposal skripsi. Pada penelitian ini, kategori skripsi yang paling banyak yaitu data mining, yang menjadi tren topik di Prodi Teknik Informatika Unimal pada tahun 2021.

5. Ucapan Terima Kasih

Terima kasih kepada Lembaga Penelitian dan Pengabdian Masyarakat Universitas Malikussaleh yang telah mendanai penelitian ini melalui Sumber Dana PNBP Tahun Anggaran 2021, dengan Berdasarkan Surat Keputusan Nomor 530/UN45/KPT/2021 tanggal 12 Juli 2021 dan Perjanjian/Kontrak Nomor 23/PPK-2/SPK-JL/2021.

[1] N. Nurdin and A. Munthoha, “Sistem Pendeteksian Kemiripan Judul Skripsi Menggunakan Algoritma Winnowing,” InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan), vol. 2, no. 1, pp. 90–97, 2017, doi: 10.30743/infotekjar.v2i1.165.

[2] S. Sulartopo, “Pengkategorian Topik Skripsi Dengan Metode NBC,” E-Bisnis, vol. 8, no. 1, pp. 49–

53, 2015.

[3] L. Rahmawati, S. W. Sihwi, and E. Suryani, “Analisa Clustering Menggunakan Metode K-Means dan Hierarchical Clustering (Studi Kasus: Dokumen Skripsi Jurusan Kimia, Fmipa, Universitas Sebelas Maret),” ITSMART: J. Teknologi dan Informasi, vol. 3, no. 2, 2014.

[4] M. S. Hudin, M. A. Fauzi, and S. Adinugroho, “Implementasi Metode Text Mining dan K-Means Clustering untuk Pengelompokan Dokumen Skripsi (Studi Kasus: Universitas Brawijaya),” J.

Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 11, 2018.

[5] D. A. C. Rachman, R. Goejantoro, and F. D. T. Amijaya, “Implementasi Text Mining Pengelompokkan Dokumen Skripsi Menggunakan Metode K-Means Clustering,” J. Eksponensial, vol. 11, no. 2, pp. 167–174, 2021.

[6] M. R. Muttaqin and M. Defriani, “Algoritma K-Means untuk Pengelompokan Topik Skripsi Mahasiswa,” ILKOM Jurnal Ilmiah, vol. 12, no. 2, pp. 121–129, 2020, doi:

10.33096/ilkom.v12i2.542.121-129.

[7] E. Yulian, “Text Mining dengan K-Means Clustering pada Tema LGBT dalam Arsip Tweet Masyarakat Kota Bandung,” J. Matematika “MANTIK,” vol. 4, no. 1, pp. 53–58, 2018, doi:

10.15642/mantik.2018.4.1.53-58.

[8] Sholehhudin, M., Fauzi Ali, M., & Adinugroho, “Implementasi Metode Text Mining dan K-Means Clustering untuk Pengelompokan Dokumen Skripsi (Studi Kasus : Universitas Brawijaya),” 2(11), 5518–5524. 2018.

[9] Abdullah, A., & Sucipto,"Sistem Pendukung Keputusan Untuk Rekomendasi Topik Skripsi Dengan Metode Fuzzy AHP," Jurnal Transformatika, 18(2), 231. (2021).

https://doi.org/10.26623/transformatika.v18i2.2708

[10] Kalra, M., Lal, N., & Qamar, S,"K-Mean Clustering Algorithm Approach for Data Mining of Heterogeneous Data,"Lecture Notes in Networks and Systems, 10, 61–70. 2018.

https://doi.org/10.1007/978-981-10-3920-1_7

[11] Sadli, M., Fajriana, F., Fuadi, W., Ermatita, E., & Pahendra, I,"Penerapan Model K-Nearest Neighbors Dalam Klasifikasi Kebutuhan Daya Listrik Untuk Masing-Masing Daerah Di Kota Lhokseumawe," Jurnal ECOTIPE, 5(2), 11–18. 2018. https://doi.org/10.33019/ecotipe.v5i2.646 [12] M. Sadli, W. Fuadi, F. Abdurrahman, N. Islami, and M. Ihsan, “Fuzzy clustering means algorithm

analysis for power demand prediction at PT PLN Lhokseumawe,”TELKOMNIKA

(Telecommunication Computing Electronics and Control), vol. 19, no. 4, p. 1145, 2021, doi:

10.12928/telkomnika.v19i4.14941.

[13] Sadli, M., Fajriana, Fuadi, W., Ermatita, & Pahendra,”Machine Learning Approach for Electrical Load Forecasting Using Support Vector Regression,”Journal of Physics: Conference Series, 1361(1). 2019. https://doi.org/10.1088/1742-6596/1361/1/012065

[14] Sadli, M., Fajriana, Fuadi, W., Ermatita, & Pahendra,” Electrical peak load forecasting using long short term memory and support vector machine,”IOP Conference Series: Materials Science and Engineering, 725(1). 2020. https://doi.org/10.1088/1757-899X/725/1/012060

[15] Abualigah, L. M., Khader, A. T., Al-Betar, M. A., & Alomari, O. A,”Text feature selection with a robust weight scheme and dynamic dimension reduction to text document clustering,”Expert Systems with Applications, 84, 24-36. 2017.

Referensi

Dokumen terkait

clustering keilmuan dalam data mining adalah pengelompokan sejumlah data atau objek ke dalam cluster ( group ) sehingga setiap dalam cluster tersebut akan berisi data

belanja online dilakukan berdasarkan faktor usia, jenis kelamin dan media sosial yang diminati dengan penerapan Data Mining metode Clustering K-Means dapat

Penentuan jurusan merupakan proses yang terjadi pada saat siswa kelas-X akan naik ke kelas- IX, ini dikarenakan proses penjurusan ini dilakukan harus berdasarkan minat

Penentuan jurusan merupakan proses yang terjadi pada saat siswa kelas-X akan naik ke kelas- IX, ini dikarenakan proses penjurusan ini dilakukan harus berdasarkan minat

Tugas Akhir yang berjudu l “ Penentuan Tren Arah Pergerakan Harga Saham dengan Menggunakan Moving Average Convergence Divergence (Studi Kasus Harga Saham pada 6 Anggota

Data mining dengan algoritma K-Means dapat diterapkan pada SMA Tamora untuk menganalisis permasalahan yang ada yang berkenaan dengan pengelompokkan data nilai

Metode K-Means clustering dapat digunakan untuk proses pengolahan data menggunakan konsep data mining dalam mengelompokkan data sesuai atribut.. Kata kunci:

Penggunaan data mining akan lebih mudah mengenali pola-pola tertentu pada seluruh data yang diolah [1], dengan begitu setelah hasil segmentasi pelanggan terbentuk menjadi beberapa