Implementasi Metode Ekstraksi Textrank Dan Agglomerative Hierarchical Clustering Untuk Pengelompokkan Jurnal
Berdasarkan Abstrak Berbasis Website
Riki Alfariz
Fakultas Teknik dan Komputer, Teknik Informatika, Universitas Harapan, Medan, Indonesia Email: [email protected]
Abstrak− Perpustakaan digital merupakan perpustakaan yang menggunakan teknologi informasi dan koleksinya dalam bentuk digital, dapat diakses kapan saja dan dimana saja serta penyebaran informasinya sangat cepat, tepat, dan akurat. Dalam perpustakaan digital, terdapat berbagai jenis karya tulis ilmiah (jurnal). Untuk mempermudah proses pencarian dari user, maka jurnal tersebut perlu dikelompokkan menurut kriteria tertentu. Untuk menyelesaikan permasalahan tersebut, maka dapat diterapkan metode klasifikasi. Dalam prosesnya, klasifikasi dapat dilakukan secara manual ataupun dengan bantuan teknologi. Secara manual, klasifikasi dilakukan oleh manusia tanpa adanya bantuan dari algortima cerdas komputer. Namun, proses manual ini menghabiskan waktu dan tidak efisien. Klasifikasi dapat dilakukan dengan bantuan teknologi, salah satunya dengan menggunakan algoritma Agglomerative Hierarchical Clustering. Untuk mempermudah proses klasifikasi, maka perlu meringkas sekumpulan teks dalam dokumen menjadi beberapa kalimat penting saja. Pada penelitian ini, akan digunakan metode TextRank. Salah satu kelebihan dari algoritma ini, tidak diperlukannya pelatihan menggunakan data training pada algoritma yang digunakan. Cara kerja TextRank adalah dengan mencari kalimat yang paling mirip dengan seluruh kalimat yang ada di text. Kalimat yang paling mirip dengan semua kalimat itulah yang akan menjadi kalimat terpenting di teks tersebut. Hasil dari penelitian ini adalah sebuah website yang dapat digunakan untuk melakukan pengelompokkan jurnal. Dari hasil pengujian yang dilakukan, website mampu melakukan proses klasifikasi jurnal dengan tingkat keberhasilan sebesar 93.33%.
Kata Kunci: Website;Jurnal;Klasifikasi;Agglomerative Hierarchical Clustering;TextRank
Abstract− A digital library is a library that uses information technology and its collections in digital form, can be accessed anytime and anywhere and the dissemination of information is very fast, precise, and accurate. In digital libraries, there are various types of scientific writings (journals). To facilitate the search process from the user, the journals need to be grouped according to certain criteria. To solve these problems, a classification method can be applied. In the process, classification can be done manually or with the help of technology. Manually, classification is done by humans without any help from computer intelligent algorithms . However, this manual process is time consuming and inefficient. Classification can be done with the help of technolog y, one of which is by using the Agglomerative Hierarchical Clustering algorithm. To simplify the classification process, it is necessary to summarize the set of texts in the document into a few important sentences. In this study, the TextRank method will be used. One of the advantages of this algorithm is that there is no need for training using training data on the algorithm used. The way Tex tRank works is to find the sentence that is most similar to all the sentences in the text. The sentence that is most similar to all the sentences will be the most important sentence in the text. The result of this research is a website that can be used to group journals.
From the results of the tests carried out, the website is able to carry out the journal classification process with a success rate of 93.33%.
Keywords: Website;Journal;Classification;Agglomerative Hierarchical Clustering;TextRank
1. PENDAHULUAN
Perpustakaan digital merupakan perpustakaan yang menggunakan teknologi informasi dan koleksinya dalam bentuk digital, dapat diakses kapan saja dan dimana saja serta penyebaran informasinya sangat cepat, tepat, dan akurat[1].
Dalam perpustakaan digital, terdapat berbagai jenis karya tulis ilmiah (jurnal)[2]. Untuk mempermudah proses pencarian dari user, maka jurnal tersebut perlu dikelompokkan menurut kriteria tertentu. Proses pencarian ini ditujukan untuk mengecek kemiripan teks antara dokumen abstrak yang dimasukkan dengan dokumen abstrak dari jurnal-jurnal sebelumnya. Untuk menyelesaikan permasalahan tersebut, maka dapat diterapkan metode klasifikasi.
Klasifikasi adalah suatu kegiatan mengelompokkan, dimana klasifikasi sangat dibutuhkan dalam perpustakaan, karena klasifikasi bertujuan untuk mengelompokkan satu koleksi yang sejenis, yang pengelompokkannya berdasarkan judul, pengarang, dan lain sebagainya[3].
Beberapa penelitian sejenis yang pernah dilakukan sebelumnya seperti Model Klasifikasi Abstrak Skripsi Menggunakan Text Mining untuk Pengkategorian Skripsi Sesuai Bidang Kajian, dimana dari hasil pengujian 9 siklus menghasilkan pengetahuan bahwa siklus ke 1 merupakan siklus terbaik dengan akurasi 82,76%[4]. Penelitian lainnya yaitu Klasifikasi Abstrak Jurnal Komputasi Menggunakan Metode Text Mining dan Algoritma Support Vector Machine, dimana berdasarkan penelitian yang telah dilakukan yaitu akurasi testing tertinggi dari klasifikasi abstrak Jurnal Komputasi diperoleh pada penggunaan kernel Linear dengan nilai akurasi sebesar 58,3%[5]. Untuk meningkatkan akurasi dari hasil klasifikasi, maka dapat dikombinasikan metode clustering dengan metode text mining. Salah satu metode clustering yang dapat digunakan adalah metode Agglomerative Hierarchical Clustering, sedangkan untuk metode text mining dapat digunakan metode TextRank.
Hierarchical clustering adalah salah satu algoritma clustering dengan karakteristik setiap data harus termasuk dalam cluster tertentu, dan data yang termasuk dalam cluster tertentu tidak dapat berpindah ke cluster lain.
Hierarchical clustering ada dua, yaitu divisive (top to down) dan agglomerative (down to top)[6]. Cluster itu sendiri adalah sekelompok atau sekumpulan objek data yang memiliki kemiripan satu sama lain dalam kelompok yang
sama[7]. Metode Agglomerative Hierarchical Clustering dipilih karena hasil akhir pengelompokkan Agglomerative Hierarchical Clustering lebih baik dibandingkan dengan metode K-Means yang sering digunakan[8].
Untuk mempermudah proses klasifikasi, maka perlu meringkas sekumpulan teks dalam dokumen menjadi beberapa kalimat penting saja. Pada penelitian ini, akan digunakan metode TextRank. TextRank adalah algoritma peringkat berbasis grafik untuk memproses teks. TextRank menghasilkan ekstraksi kalimat sebagai ringkasan. Salah satu kelebihan dari algoritma ini, tidak diperlukannya pelatihan menggunakan data training pada algoritma yang digunakan[9]. Cara kerja TextRank adalah dengan mencari kalimat yang paling mirip dengan seluruh kalimat yang ada di text. Kalimat yang paling mirip dengan semua kalimat itulah yang akan menjadi kalimat terpenting di teks tersebut[10]. Berdasarkan pertimbangan tersebut di atas, maka penelitian ini akan membahas mengenai penerapan algoritma TextRank dan Agglomerative Hierarchical Clustering dalam sistem klasifikasi jurnal berdasarkan abstrak, sehingga dapat membantu pencarian dokumen teks dengan mendeteksi kemiripan teks berdasarkan abstrak.
2. METODOLOGI PENELITIAN
2.1 Kerangka Kerja
Kerangka kerja adalah suatu struktur konseptual dasar yang digunakan untuk memecahkan atau menangani suatu masalah kompleks. Istilah ini sering digunakan antara lain dalam bidang perangkat lunak untuk menggambarkan suatu desain sistem perangkat lunak yang dapat digunakan kembali. Kerangka kerja berisikan urutan dari pelaksanaan kerja dan identifikasi masalah dalam penyelesaikan skripsi ini. Adapun bentuk kerangka kerja yang dipakai oleh peneliti diperlihatkan pada Gambar 2.
Pengumpulan Data
Analisa Sistem
Perancangan Sistem
Pembangunan Sistem
Uji Coba Sistem
Gambar 2. Kerangka Kerja Langkah-langkah dari penelitian ini dapat dijabarkan sebagai berikut:
1. Pengumpulan Data.
Metode pengumpulan data yang digunakan dalam penelitian ini adalah metode studi kepustakaan.
2. Analisis, terdiri dari:
Analisis Kebutuhan Sistem, yaitu mendeskripsikan kebutuhan fungsional dan nonfungsional sistem. Tools yang digunakan untuk memodelkan analisis kebutuhan sistem adalah Use Case Diagram.
Analisis Proses, yaitu mendeskripsikan proses kerja dari website klasifikasi jurnal.
3. Perancangan Sistem, yaitu merancang interface sistem, tampilan / menu-menu dan merancang website pengelompokan jurnal dengan menerapkan algoritma Textrank dan Agglomerative Hierarchical Clustering.
4. Pembangunan Sistem, yaitu membangun perangkat lunak dengan menggunakan bahasa script PHP, Javascript dan HTML.
5. Ujicoba Sistem, yaitu pengujian terhadap algoritma Textrank dan Agglomerative Hierarchical Clustering dilakukan dengan berbagai skenario yang berbeda. Pengujian terhadap algoritma akan menggunakan metode pengujian Confusion Matrix.
6. Menarik kesimpulan dari pengujian.
7. Menyusun laporan tugas akhir.
2.1 Metode TextRank
TextRank merupakan graph-based ranking algorithm (graf dengan model pemeringkatan) untuk pemrosesan teks.
TextRank yang digunakan pada sistem ini adalah metode yang menghasilkan ekstraksi berupa kalimat (TextRank for Sentence Extraction). TextRank sangatlah fleksibel karena dapat digunakan pada berbagai bahasa tanpa mengubah algoritmanya. Hal ini dikarenakan TextRank tidak memerlukan data training untuk proses pengelolahan dokumen [9].
Dalam melakukan proses peringkasan, algoritma TextRank terdiri dari beberapa tahap yaitu tahap preprocessing, tahap representasi graf dengan melakukan perhitungan nilai content overlap similarity dan nilai TextRank, serta tahap
pemeringkatan kalimat. Skema mengenai tahapan yang dilakukan dalam perancangan sistem peringkas otomatis ini dapat dilihat pada Gambar 1.
Gambar 1. Skema Algoritma TextRank
Pada Gambar 1, pertama-tama, dokumen akan dimasukkan ke dalam sistem. Dokumen yang dimasukkan merupakan single-document. Kemudian di dalam sistem, dokumen tersebut dipecah menjadi kalimat-kalimat tunggal yang berdiri sendiri. Setiap kalimat akan direpresentasikan sebagai vertex dan kumpulan vertex inilah yang membangun sebuah graf. Vertex di dalam graf tersebut akan terhubung oleh edges. Edges ini didapatkan dari perhitungan nilai similarity antarkalimat. Selanjutnya akan dicari nilai dari semua vertex dengan menggunakan algoritma TextRank. Setelah didapatkan nilai dari semua vertex, maka diurutkanlah nilai tersebut dari nilai yang tertinggi ke nilai yang terendah untuk menghasilkan daftar kalimat top-rank. Kalimat yang berada di daftar urutan teratas akan dipilih menjadi ringkasan ekstraktif untuk dokumen tersebut. Banyaknya kalimat yang akan menjadi hasil ringkasan tergantung dari persentase nilai kompresi yang ditentukan oleh user. Dalam penelitian ini, akan dihasilkan ringkasan yang masih mengandung setengah kalimat yang ada dalam dokumen dan tiga perempat kalimat dari dokumen. Informasi dokumen semakin banyak yang hilang apabila hasil ringkasan hanya berisi seperempat kalimat dari seluruh dokumen. Sehingga user dapat memilih nilai kompresi 50% atau 75%[11].
Langkah-langkah untuk melakukan peringkasan dalam TextRank:
1. Lakukan ektraksi kalimat dengan menjadikan seluruh kalimat sebagai vertex dalam graf.
2. Identifikasi hubungan antarkalimat dengan membuat edges antara vertex-vertex. Dapat digunakan content overlap similarity untuk mengidentasikannya.
3. Beri skor awal vertex untuk menentukan iterasi.
4. Lakukan iterasi algoritma TextRank sampai error rate tiap vertex konvergen di bawah threshold. Error Rate disini adalah perbedaan antar dua skor vertex yang dihitung pada iterasi yang berurutan dengan rumus:
𝑆𝑘+1(𝑉𝑖) − 𝑆𝑘(𝑉𝑖) Keterangan :
Vi = Vertex yang dihitung skornya K = pada iterasi ke-k
5. Setelah graf terbentuk, kemudia vertex diurutkan berdasarkan skor akhirnya. Lalu diambil top-rank sebagai hasil ekstraksi ringkasannya.
2.2 Metode Agglomerative Hierarchical Clustering
Pengelompokkan hierarki (hierarchical clustering) adalah metode analisis cluster dengan cara membangun sebuah hierarki kelompok. Strategi untuk pengelompokkan hierarki pada umumnya dibagi menjadi dua jenis yaitu agglomerative (pemusatan) dan divisive (penyebaran). Metode agglomerative (pemusatan) merupakan metode pengelompokkan hierarki dengan pendekatan bawah-atas (bottom up). Metode agglomerative (pemusatan) biasanya dipergunakan pada bidang ekonomi dan sosial masyarakat [12].
3. HASIL DAN PEMBAHASAN
3.1 Implementasi Metode TextRank dan Agglomerative Hierarchical Clustering
Proses kerja dari website klasifikasi jurnal ini terdiri dari dua tahapan yaitu tahapan training yaitu proses untuk memberikan pengetahuan kepada sistem dan tahapan testing yaitu proses untuk melakukan proses klasifikasi terhadap jurnal input. Pada tahapan training, proses dimulai dari penginputan abstrak jurnal dan jenis jurnal. Kemudian, proses dilanjutkan dengan proses stemming terhadap kata-kata dalam jurnal. Kemudian, proses dilanjutkan dengan menghitung nilai dari jurnal dengan menggunakan metode TextRank. Terakhir, akan dihasilkan nilai dari jurnal tersebut. Secara garis besar, tahapan testing hampir sama dengan tahapan training. Akhir dari tahapan testing adalah proses klasifikasi jurnal dengan menggunakan metode Agglomerative Hierarchical Clustering. Proses kerja dari
metode TextRank untuk memberikan nilai kepada jurnal dapat digambarkan dalam bentuk flowchart seperti terlihat pada gambar berikut:
Gambar 3. Flowchart dari Metode TextRank
Proses kerja dari metode TextRank akan dimulai dari pembacaan isi abstrak jurnal. Kemudian, proses dilanjutkan dengan proses segmentasi dan tokenisasi. Setelah itu, proses dilanjutkan dengan proses content overlap dengan menghitung nilai similarity dari kalimat yang terdapat di dalam jurnal. Proses dilanjutkan lagi dengan menghitung nilai weight sentence (WS). Terakhir, akan diperoleh nilai dari jurnal. Sementara itu, proses kerja dari metode Agglomerative Hierarchical Clustering dalam melakukan pengelompokkan jurnal dapat digambarkan dalam bentuk flowchart seperti terlihat pada gambar berikut:
Gambar 4. Flowchart dari Metode Agglomerative Hierarchical Clustering
Proses kerja dari metode Agglomerative Hierarchical Clustering dimulai dari pembacaan nilai jurnal. Kemudian, proses dilanjutkan dengan menghitung jarak antara jurnal uji dengan setiap jurnal dalam dataset. Terakhir, jurnal akan digabungkan dengan kelompok jurnal yang memiliki nilai terdekat, sehingga akan diperoleh hasil klasifikasi jurnal.
3.2 Hasil
Tampilan dari website klasifikasi jurnal berdasarkan abstrak dengan metode Textrank dan Agglomerative Hierarchical Clustering ini terbagi menjadi dua bagian yaitu bagian admin dan bagian user.
3.3.1 Tampilan Admin
Pada saat menjalankan bagian admin dari website klasifikasi jurnal berdasarkan abstrak dengan metode Textrank dan Agglomerative Hierarchical Clustering, maka akan muncul tampilan login seperti terlihat pada gambar berikut:
Gambar 5. Halaman Login Admin
User admin harus memasukkan data user id dan kata sandi admin yang valid agar dapat menggunakan sistem.
Apabila proses login berhasil, maka sistem akan menampilkan halaman Home Admin seperti terlihat pada gambar berikut:
Gambar 6. Halaman Home Admin Pada halaman Home Admin ini, terdapat beberapa menu yang dapat diakses, seperti:
1. Menu Beranda, berfungsi untuk menampilkan halaman Home Admin.
2. Menu Jenis Jurnal, berfungsi untuk menampilkan halaman Jenis Jurnal.
3. Menu Training, berfungsi untuk menampilkan halaman Training.
4. Menu Pengelompokkan Jurnal, berfungsi untuk menampilkan halaman Pengelompokkan Jurnal.
5. Menu Log Out, berfungsi untuk menutup sistem bagian admin dan kembali ke halaman Login.
3.3.2 Tampilan User
Pada saat menjalankan bagian user dari website klasifikasi jurnal berdasarkan abstrak dengan metode Textrank dan Agglomerative Hierarchical Clustering, maka akan muncul tampilan login seperti terlihat pada gambar berikut:
Gambar 7. Halaman Login User
Apabila user belum terdaftar, maka user dapat mengklik menu Registrasi User untuk melakukan proses pendaftaran user baru ke dalam sistem, sehingga sistem akan menampilkan halaman Registrasi User seperti terlihat pada gambar berikut:
Gambar 8. Halaman Registrasi User
User dapat memasukkan data user baru dengan benar dan mengklik tombol Simpan untuk menyimpan data user ke dalam database. Setelah itu, maka user dapat melakukan proses login ke dalam sistem. Apabila user berhasil melakukan proses login ke dalam sistem, maka sistem akan menampilkan halaman Home User seperti terlihat pada gambar berikut:
Gambar 9. Halaman Home User
1. Menu Beranda, berfungsi untuk menampilkan halaman Home User.
2. Menu Daftar Jurnal, berfungsi untuk menampilkan halaman Daftar Jurnal.
3. Menu Pencarian, berfungsi untuk menampilkan halaman Pencarian.
4. Menu Logout, berfungsi untuk menutup sistem bagian user dan kembali ke halaman Login.
3.3 Hasil
Untuk melakukan proses pengujian dari klasifikasi jurnal akan dimasukkan 3 jenis jurnal, yaitu kriptografi, data mining dan pengolahan citra. Jumlah jurnal yang dimasukkan pada proses training adalah sebanyak 10 buah per jenis jurnal. Proses pengujian akan dilakukan terhadap 5 buah jurnal per jenis jurnal. Hasil pengujian akan terdiri dari 4 kondisi berikut:
1. True Positive (TP), yaitu keadaan dimana hasil klasifikasi adalah sama dengan jenis jurnal riil.
2. False Positive (FP), yaitu keadaan dimana hasil klasifikasi yang diperoleh dimasukkan ke jenis jurnal yang berbeda dengan jenis jurnal riil.
3. True Negative (TN), yaitu keadaan dimana hasil klasifikasi tidak terdeteksi jenis jurnalnya dan keadaan riil memang jurnal tersebut tidak termasuk ke dalam semua jenis jurnal yang terdaftar dalam sistem.
4. False Negative (FN), yaitu keadaan dimana hasil klasifikasi tidak terdeteksi jenis jurnalnya, namun keadaan riil jurnal tersebut termasuk ke dalam salah satu jenis jurnal yang terdaftar dalam sistem.
Beberapa contoh hasil pengujian yang diperoleh adalah sebagai berikut:
Nama Pengarang (Tahun)
Nama Jurnal Hasil Klasifikasi Agglomerative
Hierarchical Clustering
Jenis Jurnal
Riil
Keterangan
Muhammad Iqbal Zulfikar, Gunawan Abdillah, Agus Komarudin (2019)
Kriptografi untuk Keamanan Pengiriman Email Menggunakan Blowfish dan Rivest Shamir Adleman (RSA)
Kriptografi Kriptografi Berhasil (True Positive/TP) Fifit Alfiah, Rio
Sudarji, Dzakwan Taqiyyuddin Al Fatah (2020)
Aplikasi Kriptografi Dengan Menggunakan
Algoritma Elgamal Berbasis Java Desktop
Pada Pt. Wahana Indo Trada Nissan Jatake
Kriptografi Kriptografi Berhasil (True Positive/TP)
Nanang Muzaqqi, Yeni Dwi Rahayu (2016)
Implementasi Kriptografi Algoritma Exclusive Or Kombinasi Algoritma RC4 sebagai Pengamanan Dokumen dengan Memanfaatkan QR-Code
Kriptografi Kriptografi Berhasil (True Positive/TP) Diky Firdaus (2017) Penggunaan Data Mining dalam
Kegiatan
Sistem Pembelajaran Berbantuan Komputer
Data Mining Data Mining
Berhasil (True Positive/TP) Yuli Mardi (2014) Data Mining : Klasifikasi
Menggunakan Algoritma C4.5
Data Mining Data Mining
Berhasil (True Positive/TP) IWA. Suputra, IM.
Candiasa, IPP.
Suryawan (2021)
Klasterisasi Hasil Ujian Nasional SMA/MA dengan Algoritma KMeans
Data Mining Data Mining
Berhasil (True Positive/TP) Asti Riani Putri
(2016)
Pengolahan Citra dengan Menggunakan Web Cam
pada Kendaraan Bergerak Di Jalan Raya
Pengolahan Citra Pengolahan Citra
Berhasil (True Positive/TP) Nama Pengarang
(Tahun)
Nama Jurnal Hasil Klasifikasi Agglomerative
Hierarchical Clustering
Jenis Jurnal
Riil
Keterangan
Juju Jumadi, Yupianti, Devi Sartika (2021)
Pengolahan Citra Digital Untuk Identifikasi Objek Menggunakan Metode Hierarchical
Agglomerative Clustering
Pengolahan Citra Pengolahan Citra
Berhasil (True Positive/TP) Ahmad Mustafid,
Shofwatul 'Uyun2 (2018)
Sistem Pengolahan Citra Digital Untuk Menentukan Bobot Sapi Menggunakan Metode Titik Berat
Pengolahan Citra Pengolahan Citra
Berhasil (True Positive/TP)
TP = 14 TN = 0 FP = 1 FN = 0
Accuracy = (14+0)/(14+0+1+0) * 100% = 14/15* 100% = 93.33%.
Error Rate = (0+1)/(14+0+1+0) * 100% = 1/15 * 100% = 6.67%.
Precision = 14/(14+1) * 100% = 14/15 * 100% = 93.33%.
Recall = 14/(14+0) * 100% = 14/14 * 100% = 100%.
Kelebihan dari website klasifikasi jurnal berdasarkan abstrak dengan metode Textrank dan Agglomerative Hierarchical Clustering yang dibuat adalah sebagai berikut:
1. Website mendukung penambahan jenis jurnal, sehingga user dapat menambah jenis jurnal baru ke dalam sistem.
2. Website juga mendukung penambahan data training jurnal, sehingga user dapat menambah data training jurnal baru ke dalam sistem, agar dapat meningkatkan akurasi dari hasil pengelompokkan jurnal.
3. Website mampu melakukan pengelompokkan jurnal berdasarkan data training jurnal yang dimasukkan oleh user.
4. Berdasarkan hasil pengujian, website mampu melakukan proses klasifikasi jurnal dengan tingkat keberhasilan sebesar 93.33%.
Kekurangan dari website klasifikasi jurnal berdasarkan abstrak dengan metode Textrank dan Agglomerative Hierarchical Clustering yang dibuat adalah sebagai berikut:
1. Tampilan website masih kurang maksimal, sehingga tampilan website terkesan monoton.
2. Perlu ditambahkan data training jurnal yang banyak agar proses pengelompokkan jurnal menjadi lebih akurat.
4. KESIMPULAN
Setelah menyelesaikan penelitian ini, penulis menarik kesimpulan bahwa website mendukung penambahan jenis jurnal, sehingga user dapat menambah jenis jurnal baru ke dalam system, Website juga mendukung penambahan data training jurnal, sehingga user dapat menambah data training jurnal baru ke dalam sistem, agar dapat meningkatkan akurasi dari hasil pengelompokkan jurnal, Website mampu melakukan pengelompokkan jurnal berdasarkan data training jurnal yang dimasukkan oleh user, Website mampu melakukan proses klasifikasi jurnal dengan tingkat keberhasilan sebesar 93.33%.
REFERENCES
[1] Prayitno, D. E., 2019. Perpustakaan Digital Sebagai Information Life Cycle dalam Kehidupan Masyakarat Informasi.
Tibanndaru: Jurnal Ilmu Perpustakaan dan Informasi, 3(2), pp. 23-29.
[2] Nirwana & Ruspa, A. R., 2020. Kemampuan Menulis Karya Tulis Ilmiah Mahasiswa Prodi Informatika Universitas Cokroaminoto Palopo. Jurnal Onoma: Pendidikan, Bahasa dan Sastra, 6(1), pp. 557-566.
[3] Lestari, I. D., 2016. Klasifikasi online dan google. Jurnal Iqra, 10(02), pp. 83-94.
[4] Pradikdo, A. C. & Ristyawan, A., 2018. MODEL KLASIFIKASI ABSTRAK SKRIPSI MENGGUNAKAN TEXT MINING UNTUK PENGKATEGORIAN SKRIPSI SESUAI BIDANG KAJIAN. Jurnal SIMETRIS, pp. 1091-1098.
[5] Prayitno, A. & Safitri, Y., 2015. Pemanfaatan Sistem Informasi Perpustakaan Digital Berbasis Website Untuk Para Penulis.
IJSE – Indonesian Journal on Software Engineering, 1(1).
[6] Abdurrahman, G., 2019. Clustering Data Kredit Bank Menggunakan Algoritma Agglomerative Hierarchical Clustering Average Linkage. JUSTINDO (Jurnal Sistem & Teknologi Informasi Indonesia), 4(1), pp. 13-20.
[7] Dani, A. T. R., Wahyuningsih, S. & Rizki, N. A., 2019. Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu. Jambura Journal of Mathematics, 1(2), pp. 64-78.
[8] widyawati, Saptomo, W. L. Y. & Utami, Y. R. W., 2020. Penerapan Agglomerative Hierarchical Clustering Untuk Segmentasi Pelanggan. Jurnal Ilmiah Sinus (JIS), 18(1), pp. 75-87.
[9] Eris, Christanti M, V. & Pragantha, J., 2017. PENERAPAN ALGORITMA TEXTRANK UNTUK AUTOMATIC SUMMARIZATION PADA DOKUMEN BERBAHASA INDONESIA. Jurnal Ilmu Teknik dan Komputer, 1(1), pp. 71-78.
[10] Khontoro, C., Andjarwirawan, J. & Yulia, 2021. Penerapan Algoritma TextRank dan Dice Similarity Untuk Verifikasi Berita Hoax. Jurnal Infra, 9(1), pp. 1-5.
[11] RUSPINI, Enrique H. Pendekatan baru untuk pengelompokan. Informasi dan kontrol, 1969, 15.1: 22-32.
[12] GAERTLER, Marco. Clustering. Analisis jaringan: Landasan metodologis, 2005, 178-215.