View of Implementasi Algoritma TF-IDF untuk Pencarian Pedoman Akademik dan Penentuan Sanksi Pada Jurusan Teknik Informatika UIN Sunan Gunung Djati Bandung

(1)

61

Implementasi Algoritma TF-IDF untuk

Pencarian Pedoman Akademik dan

Penentuan Sanksi Pada Jurusan

Teknik Informatika UIN

Sunan Gunung Djati

Bandung

Firman Abdurrahman

1

_{, Mohamad Irfan}

2

_{, Rian Andrian}

3

Teknik Informatika, Fakultas Sains dan Teknologi UIN SGD Bandung

Jl. A.H. Nasution No. 105, Kota Bandung 40614

1

Abstract- Implementation System Searching Academic Guidance and Sanction Determination At Department of Informatics UIN Sunan Gunung Djati Bandung is designed to obtain information about academic guidelines for students and lecturers efficiently and can determine recommendations for sanctions against violators of the prevailing rules. The algorithm for this system is using the Frequency-Inverse Document Frequency (TF-IDF) algorithm which is the calculation of the value of a document that is very useful in the process of searching and giving sanction recommendation.

System built using PHP web programming framework and implementation of Term Frequency-Inverse Document Frequency (TF-IDF) Algorithm. Documents used as test data have a good accuracy, so the tfidf algorithm is perfect for searching a term.

Keywords- Web Framework, Term Frequency Inverse Document Frequency (TF-IDF).

Abstrak- Sistem Implementasi Pencarian Panduan Akademik dan Penentuan Sanksi Pada Jurusan Teknik Informatika UIN Sunan Gunung Djati Bandung didesain untuk mendapatkan informasi tentang pedoman akademik bagi mahasiswa maupun dosen secara efisien dan dapat menentukan rekomendasi sanksi terhadap pelanggar tata tertib yang berlaku. Algoritma untuk sistem ini adalah menggunakan algoritma Frequency-Inverse Document Frequency(TF-IDF) yaitu perhitungan nilai suatu dokumen yang sangat berguna dalam proses hasil pencarian dan pemberian rekomendasi sanksi. Sistem yang dibangun dengan menggunakan framework web bahasa pemrograman PHP dan implementasi Algoritma Term Frequency-Inverse Document Frequency (TF-IDF). Dokumen yang digunakan sebagai data uji memiliki tingkat akurasi yang baik, sehingga algoritma tfidf sangat tepat untuk pencarian suatu term.

Kata kunci- Framework Web, Term Frequency Inverse Document Frequency(TF-IDF).

I. PENDAHULUAN

Saat ini Teknologi Informasi berkembang dan menyebar hampir di setiap sendi kehidupan, sehingga membuat teknologi pada saat ini menjadi bagian yang penting di dalam kehidupan manusia. Hal tersebut didasarkan pada perkembangan zaman menuju arah yang lebih modern dan dinamis [1][2]. Dengan adanya internet, informasi dapat dengan mudah disebarluaskan dan diakses oleh banyak orang. Banyaknya informasi yang beredar tentu membuat kebutuhan akan informasi semakin meningkat.[3]

Dengan membaca buku-buku panduan akademik dan tata tertib, mahasiswa maupun dosen bisa mendapatkan informasi tentang panduan-panduan akademik yang telah ditetapkan oleh jurusan. Namun masih banyak mahasiswa maupun dosen yang tidak mendapatkan informasi tentang

tata tertib itu sendiri, maka dengan perkembangan teknologi yang semakin canggih saat ini dan ketergantungan kebanyakan orang terhadap teknologi akan lebih baik penyebaran informasi tentang tata tertib disebarkan melalui jaringan internet [4], [5].

Pada saat ini, untuk mendapatkan informasi tentang pedoman akademik, mahasiswa maupun dosen bisa mencarinya secara manual dengan cara membaca buku-buku pedoman akademik, akan tetapi hal itu sangat tidak efisien terhadap waktu. Mahasiswa terkadang malas untuk membaca, bahkan umumnya mahasiswa maupun dosen tidak memiliki buku pedoman akademik tersebut.

(2)

Implementasi Algoritma TF-IDF untuk Pencarian Pedoman Akademik dan

Penentuan Sanksi Pada Jurusan Teknik Informatika UIN Sunan Gunung Djati Bandung (Firman Abdurrahman, Mohamad Irfan, Rian Andrian)

62 menggunakan pembobotan term. Metode pembobotan

term yang diterapkan pada aplikasi panduan akademik ini melakukan pencarian data dengan cara mencocokan seluruh kata/ term yang terdapat pada dokumen kemudian menampilkan kata yang dicari. Dengan metode tf-idf pencarian suatu kata (term) akan lebih mudah, efisien dan memiliki hasil yang akurat [6], [7].

A. Text Mining

Text Mining adalah sebuah penerapan yang berasal dari information retrieval (IR) dan natural language processing (NLP)[8]. Definisi text mining secara sempit hanya berupa metode yang dapat menemukan informasi baru yang tidak jelas atau mudah diketahui dari sebuah kumpulan dokumen [9][10]. Sedangkan secara lebih luas, text mining mencakup teknik text-processing yang lebih umum, seperti pencarian, pengambilan intisari, dan pengkategorian.[11]

Permasalahan yang dihadapi pada text mining adalah jumlah data yang besar, dimensi yang tinggi, data dan struktur yang terus berubah, serta data noise. Sehingga sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki bentuk yang tidak terstruktur atau setidaknya semi terstruktur [12]. Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen dalam bentuk teks.[11]

Tahapan-tahapan yang dilakukan dalam proses text mining antara lain:

a. Tokenizing

Tahap tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.

b. Filtering

Tahap filtering adalah tahap mengambil kata - kata penting dari hasil tokenizing. Proses filtering dapat menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpan kata penting). Stoplist / stopword adalah kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stopword adalah “yang”, “dan”, “di”,

“dari” dan lain – lain.[13]

c. Stemming

Stemming merupakan suatu proses yang terdapat dalam sistem IR yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu.[4] Stemming kebanyakan digunakan pada teks berbahasa inggris dikarenakan teks berbahasa inggris memiliki struktur imbuhan yang tetap dan mudah untuk diolah sementara stemming untuk proses bahasa Indonesia memiliki struktur imbuhan yang rumit / kompleks sehingga agak lebih susah untuk diolah.[13]

d. Tagging

Tahap tagging adalah tahap mencari bentuk awal atau root dari tiap kata lampau atau kata hasil stemming. e. Analyzing

Tahap analyzing merupakan tahap penentuan seberapa jauh keterhubungan antar kata-kata dan dokumen yang ada.

B. Pembobotan Kata (TF-IDF)

Term vector dari suatu dokumen adalah tuple bobot semua term pada dokumen. Nilai bobot suatu term menyatakan kepentingan term tersebut dalam merepresentasikan dokumen. Metode pembobotan term ada tiga jenis yaitu Binary weighting, TF dan TF-IDF [5].

a. Binary weighting

Pembobotan dengan metode ini hanya terdiri dari 2 nilai yaitu 0 jika term i tidak berada pada dokumen dan 1 jika sebaliknya. Binary weighting dapat dilihat pada Persamaan 1 di bawah ini:

0 : term i does not occur in document j aij =

1 : term i occurs in the document j

b. TF (Term Frequency)

Pembobotan dengan metode ini berdasarkan freskuensi term i muncul dalam dokumen. TF dapat dilihat pada persamaan 2 di bawah ini:

Tf(t,d) = frekuensi kemunculan t pada dokumen d

c. TF-IDF (Term Frequency – Invers Document Frequency)

Invers Document Frequency (IDF) adalah jumlah dokumen yang mengandung sebuah term didasarkan pada seluruh dokumen yang ada pada dataset. IDF dapat dilihat pada Persamaan 3 di bawah ini:

𝑖𝑑𝑓 = 𝐿𝑜𝑔 (

_{𝑑𝑓𝑖)}

𝑁

Keterangan :

• N adalah jumlah dokumen yang terdapat pada kumpulan dokumen yang diamati.

• dfi adalah jumlah dokumen yang mengandung term i.

Pembobotan tf-idf untuk sebuah term i untuk dokumen n didapatkan dari hasil perkalian nilai tf dan idf. Metode TF-IDF ini merupakan pengintegrasian antar TF dan IDF (Invers Document Frequency).

II. METODE PENELITIAN

Metode penelitian ini direncanakan ke dalam tahap langkah-langkah secara sistematis. Penelitian dilakukan dengan beberapa tahap :

A. Tahap Pengumpulan Data

(3)

63 a. Studi literatur

1. Panduan Kode Etik dan Tata Tertib Mahasiswa Fakultas Sains dan Teknologi (UIN) Sunan Gunung Djati Bandung 2015.

2. Panduan Pelaksanaan Pembinaan, Pelatihan dan Ujian Tahfidz Al-Quran UIN Sunan Gunung Djati Bandung

3. Pedoman Akademik FST 2016 Rev 4.

4. Pedoman Organisasi Kemahasiswaan Intra Universitas

5. Pedoman Orientasi Pengenalan Akademik (OPAK) 6. Pedoman Umum Panitia Kegiatan Kemahasiswaan 7. Peraturan Menteri Agama Tentang Ijazah, Transkrip Akademik, dan Surat Keterangan Pendamping Ijazab Perguruan Tinggi Keagamaan 8. Standar Mutu Universitas Islam Negeri Sunan

Gunung Djati Bandung

9. Standar Operasi dan Prosedur Kegiatan Kemahasiswaan

10.Standar Operasi dan Prosedur Pengelolaan Beasiswa

11.Buku Himpunan Peraturan Tentang Perguruan Tinggi Di Indonesia

12.Pedoman Akademik UIN Sunan Gunung Djati Bandung 2015

13.Administrasi Surat Keterangan 14.Buku Kurikulum Pendidikan Tinggi

15.Pedoman Penghitungan dan Beban Kerja Dosen UIN SGD Bandung

b. Metode Observasi

Teknik pengumpulan data dengan mengadakan pengamatan atau kegiatan yang sistematis terhadap objek yang dituju secara langsung.

c. Metode Wawancara

Adalah suatu metode penelitian dengan mengadakan tanya jawab dengan Anggota SENAT UIN Bandung Bapak Mohammad Irfan, Bapak Cecep Hidayat dan Bapak Nanang Ismail.

B. Tahap Pendekatan Sistem

Untuk menggambarkan sistem yang akan dibangun, maka perlu menggunakan alat bantu pemodelan sistem, berupa Use Case Diagram, Class Diagram, Sequence Diagram dan Activity Diagram [14].

C. Tahap Pengembangan Sistem

Dalam pembangunan aplikasi web ini mengikuti tahapan-tahapan berdasarkan metode Throwaway Prototype.

Throwaway Prototyping adalah suatu metode yang sama persis dengan metode prototyping dimana throwaway prototype merupakan hasil perkembangan dari prototype, tetapi throwaway prototype lebih mengarah pada hasil persentasi saja, yang dimana bertujuan untuk memvisualisasikan sebuah system yang sedang dibangun dan bedasarkan komentar pengguna, prototipe berikutnya terus dibangun sampai dapat memvisualisasikan sistem kerja nyata.

Gambar 1 Kriteria metode pengembangan.[15]

Pembangunan aplikasi ini menggunakan metode throwaway prototype karena menurut gambar 1 di atas, throwaway prototype memiliki nilai terbaik dari metode yang lain dalam memenuhi kriteria yang sama seperti aplikasi yang akan dibangun ini.

Gambar 2Throwaway Prototyping[15]

Model ini digunakan karena mempunyai phase analisis yang cukup relative yang digunakan sebagai informasi dan pengembangan ide untuk konsep sebuah sistem. Sehingga lebih mudah dan cepat untuk memberikan sebuah feedback.

Berikut adalah tahapan dalam metode prototype : 1. Komunikasi dan pengumpulan data awal, yaitu

analisis terhadap kebutuhan pengguna.

2. Quick design (desain cepat), yaitu pembuatan desain secara umum untuk selanjutnya dikembangkan kembali.

3. Pembentukan prototype, yaitu pembuatan perangkat prototype termasuk pengujian dan penyempurnaan.

4. Evaluasi terhadap prototype, yaitu mengevaluasi prototype dan memperhalus analisis terhadap kebutuhan pengguna.

5. Perbaikan prototype, yaitu pembuatan tipe yang sebenarnya berdasarkan hasil dari evaluasi prototype.

6. Produksi akhir, yaitu memproduksi perangkat secara benar sehingga dapat digunakan oleh pengguna.

III.HASIL DAN PEMBAHASAN

A. Analisis Algoritma TFIDF

Terdapat kalimat :

(4)

64 Langkah awal sebelum melakukan perhitungan tf-idf

sistem terlebih dahulu melakukan proses text mining yaitu tokenizing, filtering, dan stemming. Proses selanjutnya yaitu menghitung tf kemudian df dan idf, dan terakhir tf.idf.

a. Tokenizing

Tahap tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.[13]

Tabel 1 Proses Tokenizing

Kalimat Hasil Tokenizing

Melakukan

Tahap filtering adalah tahap mengambil kata - kata penting dari hasil tokenizing. Kata-kata yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stopwordadalah “yang”, “dan”, “di”,

“dari” dan lain – lain.[13]

Tabel 2 Proses Filtering

Hasil Tokenizing Hasil Filtering

Kata diambil melakukan ilmiah kegiatan stempel kegiatan orang sikap ijazah

yang lain nilai surat

bertentangan mempalsukan nilai surat dengan nilai kejujuran berharga

sikap tanda ilmiah administr

asi

dan tangan tindakan akademi

k

nilai cap plagiat

nilai stempel karya

kejujuran ijazah ilmiah

Hasil Tokenizing Hasil Filtering

Kata diambil

ilmiah dan dibuatka

n

seperti atau orang

tindakan surat karya

plagiat surat membuat

kan karya berharga karya ilmiah lainnya ilmiah

dibuatkan yang orang

oleh terkait mempals

ukan

orang dengan nilai

lain administrasi tanda membuatkan akademik tangan

karya cap

c. Stemming

Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering.[13]

Tabel 3 Proses Stemming Hasil Filtering Hasil Stemming kegiatan kegiatan

(5)

65

Kemudian menghitung dokumen frekuensi (df)

Tabel 5 Data Frekuensi

Setelah mendapatkan df kemudian menghitung Invers dokumen frekuensi (IDF)

Di database memiliki 36 data jadi N=36, Maka dengan rumus idf

𝑖𝑑𝑓 = 𝐿𝑜𝑔 (

_{𝑑𝑓𝑖)}

𝑁

Mendapatkan hasil idf pada tabel berikut :

Tabel 6 Invers dokumen frekuensi

Term

Df

N

IDF

administrasi

1

36 log(36/1)=1,556

akademik

1

36 log(36/1)=1,556

Ini hasil akhir dari perhitungan tf.idf

Tabel 7TF.IDF

IDF

Tf

Tf.idf

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/3)=0,518

3 0,518x3=1,554

log(36/1)=1,556

1 1,556x1=1,556

log(36/3)=0,518

3 0,518x3=1,554

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/3)=0,518

3 0,518x3=1,554

log(36/2)=0,778

2 0,778x2=1,556

log(36/2)=0,778

2 0,778x2=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=0,778

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

Keterangan:

Term

= kata yg ada

Df = Data

frekuensi

Keterangan:

(6)

66

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/2)=0,778

2 0,778x2=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

log(36/1)=1,556

1 1,556x1=1,556

Untuk pencarian kata dengan menginputkan keyword

“Plagiat”

Tabel 8 Pencarian dengan tf-idf

Kata Pencarian Plagiat

Perhitungan :

Term : Plagiat

TF (Term Frequency) = 1

IDF (Inverse Document Frequency) = log (N / Df) = log (36/1) = 1.556

Tabel 1 sampai Tabel 7 menjelaskan proses tf-idf dari mulai pemecahan kata sampai pemberian nilai terhadap kata sehingga menghasilkan nilai df dan idf.

B. Perancangan Sistem

• Arsitektur Sistem

Arsitektur sistem digunakan untuk menyatakan sebagaimana mendefinisikan komponen-komponen yang spesifikasi secara arsitektur seperti pada Gambar 2

Gambar 2 Arsitektur Sistem

• Use Case Diagram

Use case diagram digunakan untuk memodelkan dan menyatakan unit fungsi/layanan yang disediakan oleh sistem (or bagian sistem: subsistem atau class) ke pemakai.

Gambar 3Use Case Diagram

• Class Diagram

Class diagram ini akan menjelaskan bagaimana memodelkan data dalam bentuk class diagram yang menunjukan sekumpulan class object, class diagram yang terdapat dalam perangkat lunak ini.

Gambar 4Class Diagram

• ERD (Entity Relationship Diagram)

Entity Relationship Diagram (ERD) adalah gambaran pada sistem dimana di dalam terdapat hubungan antar entity beserta relasinya.

Gambar 5Entity Relationship Diagram

C. Perancangan User Interface

• Halaman User

a. Halaman Search Pedoman Akademik

Halaman search pedoman akademik merupakan halaman yang pertama kali muncul ketika menggunakan sistem pedoman akademik, menu ini menu yang akan digunakan oleh user. Tampilan halaman search seperti Gambar 6.

Gambar 6 Halaman Search Pedoman Akademik

(7)

67 Halaman ini merupakan halaman yang berfungsi

untuk menampilkan pedoman akademik yang dicari oleh user. Seperti pada Gambar 7

Gambar 7 Halaman Hasil Search Pedoman

c. Halaman Tampilan Detail Pedoman Akademik Halaman tampilan detail merupakan halaman yang berfungsi untuk menampilkan pedoman akademik yang dipilih oleh user. Seperti pada Gambar 8

Gambar 8 Halaman Detail Pedoman

• Halaman Dosen

a. Halaman Search Pelanggaran Akademik

Halaman search pelanggaran akademik merupakan halaman yang pertama kali muncul ketika dosen masuk login ke menu pelanggaran, menu ini menu yang akan digunakan oleh dosen. Tampilan halaman search seperti Gambar 9.

Gambar 9 Halaman Search Pelanggaran

b. Halaman Hasil Search Pelanggaran Akademik

Halaman ini merupakan halaman yang berfungsi untuk menampilkan pelanggaran akademik yang dicari oleh dosen. Seperti pada Gambar 10.

Gambar 10 Halaman Hasil Search Pelanggaran.

c. Halaman Tampilan Detail Pelanggaaran Halaman tampilan detail merupakan halaman yang berfungsi untuk menampilkan pelanggarn akademik yang dipilih oleh dosen. Seperti pada Gambar 11.

Gambar 11 Halaman Detail Pelanggaran

• Halaman Admin 1. Halaman Login

Halaman ini merupakan halaman login dari sistem. Halaman ini digunakan untuk admin masuk ke dalam sistem. Adapun tampilan halaman login seperti pada Gambar 12.

Gambar 12 Halaman Login

2. Halaman Home Pengolahan Data

(8)

68 Gambar 13 Halaman Home Pengolahan Data

IV.PENUTUP Kesimpulan

Setelah melalui tahapan-tahapan yang sesuai dengan model pengembangan prototype dalam membangun sistem implementasi, dapat disimpulkan beberapa hal sebagai berikut :

1. Algoritma tf-idf memiliki tingkat akurasi yang baik, sehingga algoritma tfidf sangat tepat untuk pencarian suatu term.

2. Dari hasil penelitian yang telah dilakukan, pencarian pedoman akademik dengan menggunakan algoritma tf-idf pada Jurusan Informatika UIN Sunan Gunung Djati Bandung berfungsi dengan cukup baik sesuai dengan yang diharapkan dan pelanggaran akademik dengan menggunakan algoritma tfidf berfungsi dengan sangat baik sesuai dengan yang diharapkan. Saran

Setelah mengevaluasi terhadap proses dan hasil dari sistem, maka terdapat beberapa saran untuk pengembangan sistemnya antara lain :

1. Sistem ini mengharuskan update data terbaru pedoman akademik, sehingga data yang ada di dalam sistem merupakan data peraturan terkini. 2. Kedepannya dalam menampilkan data yang dicari

dengan cara mengetikan keyword sistem harus lebih mengutamakan padanan kata yang lebih banyak kecocokan katanya tampil pada bagian teratas.

3. Sistem dapat dikembangkan dengan menggunakan bahasa pemograman lain. .

V. REFERENSI

[1] Mms. Fauziah, S.Kom, Pengantar Teknologi Informasi. Bandung: Muara Indah, 2010.

[2] Y. A. Gerhana, W. B. Zulfikar, A. H. Ramdani, and M.

A. Ramdhani, “Implementation of Nearest Neighbor using HSV to Identify Skin Disease,” IOP Conf. Ser. Mater. Sci. Eng., vol. 288, no. 1, p. 012153

1234567890 Implementation, 2018.

[3] M. Herliani, “Aplikasi Pencarian Buku Dengan

Menggunakan Metode tf-idf dan Vector Space Berbasis Web Pada Perpustakaan Sekolah Menengah Atas

Negeri 2 Pangkal Pinang,” p. 8.

[4] I. Septiana, M. Irfan, and A. R. Atmadja, “Sistem Pendukung Keputusan Penentu Dosen Penguji Dan Pembimbing Tugas Akhir Menggunakan Fuzzy Multiple Attribute Decision Makingdengan Simple Additive Weighting (Studi Kasus: Jurusan Teknik

Informatika Uin Sgd Bandung),” J. Online Inform., vol. 1, no. 1, pp. 43–50, 2016.

[5] M. Irfan, Jumadi, W. B. Zulfikar, and Erik,

“Implementation of Fuzzy C-Means algorithm and

TF-IDF on English journal summary,” 2017 Second Int. Conf. Informatics Comput., pp. 1–5, 2017.

[6] R. M. Puspita, Arini, and S. U. Masrurah,

“Pengembangan Aplikasi Penjadwalan Kegiatan Pelatihan Teknologi Informasi Dan Komunikasi

Dengan Algoritma Genetika,” J. Online Inform., vol. 1, no. 2, pp. 76–81, 2016.

[7] M. Irfan, I. Z. Mutaqin, and R. G. Utomo,

“Implementation of Dynamic Time Warping Algorithm

on an Android Based Application to Write and

Pronounce Hijaiyah Letters,” IEEE CITSM, 2016. [8] D. S. A. Maylawati, M. A. Ramdhani, A. Rahman, and

W. Darmalaksana, “Incremental technique with set of

frequent word item sets for mining large Indonesian

text data,” 2017 5th Int. Conf. Cyber IT Serv. Manag. CITSM 2017, pp. 1–6, 2017.

[9] D. S. Maylawati, A. Rahman, M. I. N. Saputra, W.

Darmalaksana, and M. A. Ramdhani, “Model of

Citation Network Analysis using Sequence of Words as

Structured Text Representation,” IOP Conf. Ser. Mater. Sci. Eng., vol. 288, no. 1, p. 12048, 2018.

[10] C. Slamet, A. R. Atmadja, D. S. Maylawati, R. S. Lestari, W. Darmalaksana, and M. A. Ramdhani,

“Automated Text Summarization for Indonesian Article Using Vector Space Model,” IOP Conf. Ser. Mater. Sci. Eng., vol. 288, no. 1, p. 12037, 2018.

[11] L. Agusta, “Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming

Dokumen Teks Bahasa Indonesia,” Konf. Nas. Sist. dan Inform. 2009, no. KNS&I09-036, pp. 196–201, 2009.

[12] D. Setiawati, I. Taufik, Jumadi, and W. Z. Budiawan,

“Klasifikasi Terjemahan Ayat Al-Quran Tentang Ilmu Sains Menggunakan Algoritma Decision Tree Berbasis

Mobile,” J. Online Inform., vol. 1, no. 1, pp. 24–27, 2016.

[13] C. Triawati, M. A. Bijaksana, and Z. A. Baizal,

“Metode Pembobotan Statistical Concept Based untuk

Klastering dan Kategorisasi Dokumen Berbahasa

Indonesia,” 2009.

[14] M. A. Ramdhani, Metodologi Penelitian untuk Riset Teknologi Informasi. Bandung: UIN Sunan Gunung Djati Bandung, 2013.

View of Implementasi Algoritma TF-IDF untuk Pencarian Pedoman Akademik dan Penentuan Sanksi Pada Jurusan Teknik Informatika UIN Sunan Gunung Djati Bandung

Implementasi Algoritma TF-IDF untuk

Pencarian Pedoman Akademik dan

Penentuan Sanksi Pada Jurusan

Teknik Informatika UIN

Sunan Gunung Djati

Bandung

Firman Abdurrahman

, Mohamad Irfan

, Rian Andrian

Teknik Informatika, Fakultas Sains dan Teknologi UIN SGD Bandung

Jl. A.H. Nasution No. 105, Kota Bandung 40614

[email protected],

[email protected],

[email protected]

𝑖𝑑𝑓 = 𝐿𝑜𝑔 (

𝑑𝑓𝑖)

𝑁

𝑖𝑑𝑓 = 𝐿𝑜𝑔 (

𝑑𝑓𝑖)

𝑁

Term

Df

N

IDF

administrasi

1

36

log(36/1)=1,556

akademik

1

36

log(36/1)=1,556

IDF

Tf

Tf.idf

log(36/1)=1,556

1

1,556x1=1,556

log(36/1)=1,556

1

1,556x1=1,556

log(36/3)=0,518

3

0,518x3=1,554

log(36/1)=1,556

1

1,556x1=1,556

log(36/3)=0,518

3

0,518x3=1,554

log(36/1)=1,556

1

1,556x1=1,556

log(36/1)=1,556

1

1,556x1=1,556

log(36/3)=0,518

3

0,518x3=1,554

log(36/2)=0,778

2

0,778x2=1,556

log(36/2)=0,778

2

0,778x2=1,556

log(36/1)=1,556

1

1,556x1=1,556

log(36/1)=0,778

1

1,556x1=1,556

log(36/1)=1,556

1

1,556x1=1,556

log(36/1)=1,556

1

1,556x1=1,556

Keterangan:

Term

_{, Mohamad Irfan}

_{, Rian Andrian}

_{[email protected],}

_{[email protected],}

_{[email protected]}

_{𝑑𝑓𝑖)}

_{𝑑𝑓𝑖)}