SISTEM PENCARIAN JUDUL SKRIPSI MENGGUNAKAN METODE VECTOR SPACE MODEL BERBASIS WEB

(1)

1 SISTEM PENCARIAN JUDUL SKRIPSI MENGGUNAKAN METODE

VECTOR SPACE MODEL BERBASIS WEB

Dadang Karyana, Fatayat

Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia [email protected], [email protected]

ABSTRACT

Every year, student thesis research is increasing and with the addition of these documents, users will search for thesis titles with appropriate keywords. To make it easier for users to search for thesis titles, the author makes a system, namely a Vector Space Model-based thesis title search system which aims to make it easier for users to find thesis titles recommended by the system by knowing how accurate the search is.

The vector space model method is used to measure the similarity between a document and a query. The basic concept of the method is to calculate the distance between documents and then sort them based on the level of proximity.The work principle starts with case folding, data cleaning, indexing, filtering, stemming, and tokenization, namely the cutting stage of the input string based on each word that compiles it and splitting the document into a word frequency table. All words in the document are formed into one, which is called a term. Each document is displayed as a vector which will be compared with the terms that have been formed. Lastly, Similarity Analysis to measure the similarity of documents is done by calculating the Cosine distance between the documents. The final results of the search for the title of the thesis using the vector space model method obtained the Cosine Similarity value where D3 has the highest value with a value of 0.09096, which means that D3 has the highest level of similarity with the query value. So that the documents that are expected to appear with a high degree of accuracy can be found precisely and the resulting documents are few.

Keywords : Cosine Similarity, Document, Thesis Title, Query, Vector Space Model.

ABSTRAK

Setiap tahun penelitian skripsi mahasiwa semakin bertambah dan dengan bertambahnya dokumen tersebut pengguna akan mencari judul skripsi dengan kata kunci yang sesuai.

Untuk mempermudah pengguna mencari judul skripsi penulis membuat sistem yaitu sistem pencarian judul skripsi berbasis Vector Space Model yang bertujuan untuk memudahkan pengguna dalam mencari judul skripsi yang direkomendasikan sistem dengan mengetahui seberapa akurat pencarian. Metode vector space model digunakan

(2)

2 untuk mengukur kemiripan antara suatu dokumen dengan suatu query. Konsep dasar dari Vector Space Model adalah menghitung jarak antar dokumen kemudian mengurutkan berdasarkan tingkat kedekatannya. Cara kerja Vector Space Model dimulai dengan case folding, cleaning data, indexing, filtering, stemming, dan tokenisasi yaitu tahap pemotongan string input berdasarkan tiap kata yang meyusunnya dan memecah dokumen ke dalam tabel frekuensi kata. Seluruh kata dalam dokumen dibentuk menjadi satu yang disebut sebagai term. Tiap dokumen ditampilkan sebagai vektor yang akan dibandingkan dengan term yang telah dibentuk dan menggunakan Similarity Analysis untuk mengukur kemiripan dokumen dilakukan dengan menghitung jarak Cosinus antara dokumen tersebut. Hasil akhir pencarian judul skripsi dengan menggunakan metode vector space model diperoleh nilai Cosine Similarity dimana D3 memiliki nilai tertinggi dengan nilai 0,09096 yang berarti D3 memiliki tingkat kesamaan paling tinggi dengan nilai query. Sehingga dokumen yang diharapkan muncul dengan tingkat akurasi tinggi dapat ditemukan dengan tepat dan dokumen yang dihasilkan sedikit.

Kata Kunci : Cosine Similarity, Dokumen, Judul Skripsi, Query, Vector Space Model PENDAHULUAN

Mesin pencari atau yang lebih dikenal dengan search engine adalah perangkat yang digunakan untuk mencari informasi dalam koleksi dokumen sistem. Pengguna hanya tinggal memasukkan kata-kata kunci dari informasi yang dicari, dan dalam waktu yang relatif singkat sistem akan menampilkan daftar dokumen yang sesuai dengan kebutuhan informasi pengguna (Mandala, 2006).

Begitu pula jika pengguna ingin mencari judul skripsi biasanya pengguna memasukkan kata pencarian berupa nama atau judul skripsi yang akan dibuat sehingga mesin pencari akan menampilkan dokumen atau judul yang sesuai berdasrkan query judul skripsi yang dimasukan pengguna. Namun permasalahan timbul jika pengguna ingin melakukan pencarian judul skripsi bukan hanya dari judulnya saja tapi berupa kalimat yang di masukkan oleh si pengguna, atau beberapa kriteria seperti jenis judul yang akan dibuat, hal itu tentu tidak hanya membutuhkan mesin pencari tapi suatu sistem pencarian yang mampu merekomendasikan judul skripsi yang relevan yang diinginkan oleh pengguna. Oleh karna itu dibuat sistem yang akan digunakan untuk menemukan dokumen atau judul skripsi yang relevan yang tersedia dari query pengguna sehingga akan mempermudah pengguna mencari rekomendasi judul skripsi dan juga sistem yang akan dibangun berbasis Web.

Penelitian ini akan membangun sebuah sistem dengan menerapkan metode Vector Space Model karena memiliki hasil pencarian yang akurat sesuai dengan kata kunci dan dapat merekomendasikan judul skripsi yang di inginkan.

METODE PENELITIAN

a. Pengumpulan Data

(3)

3 Adapun peneliti memproleh data yang secara langsung dari objek penelitian dengan cara observasi, wawancara dan data langsung dari tempat penelitian yaitu Perpustakaan Universitas Riau. Data-data tersebut selanjutnya akan diseleksi sesuai dengan kebutuhan penelitian. Data yang diperoleh secara tidak langsung atau data yang diperoleh selain dari objek penelitian, yang didapat dari buku-buku, jurnal, internet maupun literatur dan diktat yang masih berhubungan erat dengan topik skripsi. Pengumpulan data dari penelitian-penelitian yang berkaitan sebelumnya bertujuan agar penelitian ini dapat berguna sebagai pelengkap dan penyempurna dari penelitian-penelitian yang sudah dilakukan sebelumnya.

b. Metode Vector Space Model

Cara kerja Vector Space Model dimulai dengan case folding, filtering, stemming, dan tokenisasi yaitu tahap pemotongan string input berdasarkan tiap kata yang meyusunnya dan memecah dokumen ke dalam tabel frekuensi kata. Seluruh kata dalam dokumen dibentuk menjadi satu yang disebut sebagai term. Tiap dokumen ditampilkan sebagai vektor yang akan dibandingkan dengan term yang telah dibentuk. Similarity Analysis untuk mengukur kemiripan dokumen dilakukan dengan menghitung cosinus jarak antara dokumen tersebu (Leman & Andesa, 2015).

Langkah-langkah dalam penyelesain metode vector space model yaitu:

1. Proses perhitungan Vector space model melalui tahapan perhitungan term frequency (tf) menggunakan persamaan.

tf = ………(1)

Dimana :

tf : Banyaknya kata yang dicari dalam dokumen : Banyaknya kemunculan kata dalam dokumen

Term frequency (tf) dihitung dengan menghitung banyaknya kemunculan term ti dalam dokumen .

2. Perhitungan Inverse Document Frequency (idf), menggunakan persamaan.

= log

………...(2) Dimana :

N : Jumlah dokumen yang terambil oleh sistem

: Banyaknya dokumen dalam koleksi dimana term ti muncul di dalamnya

: Banyaknya term yang dicari ( ) yang muncul dalam dokumen lain yang ada pada database.

3. Perhitungan term frequency Inverse Document Frequency (tfidf), menggunakan persamaan.

= . log

…………..……….………(3)

(4)

4 Dimana :

: Bobot term j terhadap dokumen ke i

N : Jumlah dokumen yang terambil oleh sistem, : Banyaknya kemunculan term ti pada dokumen ,

: Banyaknya dokumen dalam koleksi dimana term ti muncul di dalamnya.

Bobot dokumen ( ) dihitung untuk didapatkannya suatu bobot hasil perkalian atau kombinasi antara term frequency ( ) dan Inverse Document Frequency ( ).

4. Perhitungan Jarak query, menggunakan persamaan.

|q|=√∑ ………..(4)

Dimana :

|q| : Jarak query

: Bobot query q terhadap dokumen ke i

Jarak query (|q|) dihitung untuk didapatkan jarak query dari bobot query dokumen ( ) yang terambil oleh sistem. Jarak query bisa dihitung dengan persamaan akar jumlah kuadrat dari query.

5. Perhitungan Jarak Dokumen, menggunakan persamaan.

| |=√∑ ………..(5)

Dimana :

| | : Jarak dokumen

Jarak dokumen (| |) dihitung untuk didapatkan jarak dokumen dari bobot dokumen ( ) yang terambil oleh sistem. Jarak dokumen bisa dihitung dengan persamaan akar jumlah kuadrat dari dokumen.

6. Menghitung index terms dari dokumen dan query (q, ). menggunakan persamaan.

q,dj =

^∑ ……….(6)

Dimana :

q : Kata kunci (query) dj : Dokumen

: Bobot query q terhadap dokumen ke i

(5)

5 7. Pengukuran Cosine Similarity menghitung nilai kosinus sudut antara dua vector

menggunakan persamaan.

Sim(q.dj)=

| | | | ………..(7)

Dimana :

q : Jumlah bobot query dj : Jumlah bobot dokumen

|q| : Akar jumlah kuadrat q

|dj| : Akar jumlah kuadrat dj

c. Term Frequency - Inverse Document Frequency (TF - IDF)

Basis pembobotan TF-IDF adalah jenis pembobotan yang sering digunakan dalam IR dan text mining. Pembobotan ini adalah suatu pengukuran statistik untuk mengukur seberapa penting sebuah kata dalam kumpulan dokumen (Brata & Hetami, 2015).

TF-IDF dapat dirumuskan sebagai berikut :

TF-IDF ( )= TF ( )*IDF ( ) ……….(8) Dimana :

TF : Jumlah frekuensi term IDF : Bobot Setiap term

: Term ke-i : Dokumen ke-j d. Text Mining

Text mining dapat didefinisikan sebagai suatu proses menggali informasi dimana seorang user berinteraksi dengan sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-komponen dalam data mining yang salah satunya adalah kategorisasi.(Leman & Andesa, 2015).

e. Perpustakaan Universitas Riau

Perpustakaan Universitas Riau didirikan pada tahun 1962 bersamaan dengan berdirinya Universitas Riau yang masih di bawah naungan Yayasan Universitas Riau dan hanya menempati ruang seluas 100 meter persegi. Pada tahun 1980 Perpustakaan Universitas Riau hanya memiliki gedung seluas 500 meter persegi yang terletak di lokasi kampus lama jalan Pattimura No. 9 Pekanbaru. Sejak tahun 1992 Perpustakaan Universitas Riau dipindahkan ke kampus baru yakni Kampus Bina Widya Panam Jalan HR Soebrantas KM 12,5 Simpang Baru, Pekanbaru sejalan dengan dipindahkannya kantor Rektorat dan beberapa fakultas.

HASIL DAN PEMBAHASAN

(6)

6 a. Analisa Kebutuhan Sistem

Analisa kebutuhan sistem dilakukan untuk memperoleh data dan informasi, data- data yang digunakan untuk membangun sistem pencarian.

Adapun hasil analisa kebutuhan yang digunakan dalam perancangan sistem ini adalah:

1. Tujuan dalam melakukan pencarian judul skripsi ini adalah untuk mengetahui judul skripsi yang direkomendasikan oleh sistem, dimana hasil pencarian memberikan rekomendasi judul skripsi bagi pengguna berdasarkan kriteria yang di masukkan oleh pengguna.

2. Data yang digunakan adalah data skripsi mahasiswa jurusan Ilmu Komputer untuk tahun kelulusan 2018 sampai 2019 di Perpustakaan Universitas Riau.

3. Dalam perancangan sistem pencarian ini dibutuhkan proses pengolahan data secara manual dengan metode Vector Space Model yang akan diimplementasikan kedalam sistem.

Dari hasil Pengumpulan data diperoleh data skripsi pada Jurusan Ilmu Komputer di Perpustakaan Universitas Riau sebanyak 166 data. Tabel 1 hanya menunjukan beberapa data judul skripsi dari hasil pengumpulan data.

Tabel 1 Contoh Data Skripsi Mahasiswa Jurusan Ilmu Komputer

No Nama/NIM Judul Skripsi

1 Ade Irawan / 1403123705

Sistem Pakar Diagnosa Kerusakan Hardware Komputer Berbasis Web Menggunakan Metode Forward Chaining

2

Ahmad Arif / 1403111124

Evaluasi Tingkat Kepuasan Pengguna Layanan Sistem Informasi Akademik Menggunakan Metode End-User Computing Satisfaction (EUCS) (Studi Kasus: Universitas Riau)

3

Ahmad Reza Fahlawi / 1403114868

Klasifikasi Kematangan Tandan Buah Segar (TBS) Kelapa Sawit Dengan Bio-Speckle Imaging Menggunakan Metode K-Means Clustering

…. …. ….

166 Zammi Arif / 1603023204

Sistem Informasi Bantuan Bencana Berbasis Web Pada Organisasi Front Pembela Islam (FPI) Perawang Kec. Tualang.

Pada Tabel 1 diatas hanya sebagai contoh sampel yang akan menjadi acuan dalam proses text mining dan perhitungan vector sapce model sehingga agar lebih mudah untuk memecah dan membandingkan kata per kata dalam proses perhitungan, karna semakin banyak data yang diproses maka akan semakin banyak kata yang.

b. Langkah-Langkah Text Mining

Sebelum melakukan perhitungan dengan menggunakan metode vector space model, terlebih dahulu dilakukan langkah-langkah text mining untuk setiap query dan dokumen. Proses text mining hingga proses perhitungan menggunakan VSM (Vector Space Model) akan digunakan sampel untuk menggambarkan bagaimana proses dari sistem pencarian yang dibangun.

(7)

7 Tabel 2 Contoh Data Sampel Judul Skripsi

No Judul Skripsi Keterangan

1 Sistem Menggunakan Algoritma Promethee Query

2 Analisis Pola Pembelian Produk Perlengkapan Bayi Menggunakan

Algoritma Fp-Growth Dokumen 1

3 Aplikasi Pelaporan Tindak Kejahatan Kriminalitas Berbasis Android Di

Kota Pekanbaru Dokumen 2

4 Sistem Pendukung Keputusan Pemilihan Mahasiswa Berprestasi

Menggunakan Metode Promethee Dokumen 3

Dapat dilihat Tabel 2 adalah contoh data sampel judul skripsi yang akan digunakan pada proses selanjutnya yaitu case folding. Terdapat keterangan query sebagai perintah atau kata kunci pengguna dan 3 dokumen judul skripsi yang digunakan hanya sebagai sampel pada tabel. Tahap awal case folding dapat dilihat pada Tabel 3.

a. Case folding

Proses ini akan mengubah semua kata dari query dan dokumen ke huruf kecil..

Hanya huruf “a” sampai “z” yang diterima. Karakter selain huruf dihilangkan dan dianggap delimeter. Berikut proses case folding pada tabel 3.

Tabel 3 Proses Case Folding

1 sistem menggunakan algoritma promethee Query

2 analisis pola pembelian produk perlengkapan bayi menggunakan

algoritma fp-growth Dokumen 1

3 aplikasi pelaporan tindak kejahatan kriminalitas berbasis android di kota

pekanbaru Dokumen 2

4 sistem pendukung keputusan pemilihan mahasiswa berprestasi

menggunakan metode promethee Dokumen 3

Dari Tabel 3 dapat dilihat setelah dilakukan case folding, semua huruf dalam data diubah kedalam case yang sama menjadi huruf kecil, dan juga dilakukan pembersihan karakter selain huruf yaitu angka dan karakter spesial, kecuali karakter spesial strip (-), karena ada beberapa kata istilah yang mengharuskan karakter strip (-), seperti fp- growth, end-user, k-means dan sebagainya. Kata yang merupakan kata istilah tersebut akan dibiarkan menjadi satu kesatuan kata. Selanjutnya yaitu tahap filtering yang dapat dilihat pada tabel 4.

b. Filtering

Ditahap ini akan dilakukan proses cleaning semua kata dari query dan dokumen dari semua karakter tanda baca, sehingga hasil dari proses cleaning adalah query dan dokumen yang hanya mengandung karakter huruf alphabet.

Tabel 4 Proses Filtering

1 sistem menggunakan algoritma promethee Query

(8)

8 2 analisis pola pembelian produk perlengkapan bayi menggunakan

algoritma fp-growth Dokumen 1

3 aplikasi pelaporan tindak kejahatan kriminalitas berbasis android kota

pekanbaru Dokumen 2

4 sistem pendukung keputusan pemilihan mahasiswa berprestasi

menggunakan metode promethee Dokumen 3

Dari Tabel 4 dapat dilihat setelah dilakukan stopword removal kata-kata yang dianggap tidak deskriptif akan dibuang. Dari data di atas tidak ada yang dihilangkan karna tidak ada kata penghubung dalam sampel. Setelah tahap filtering tahap selanjutnya yaitu tahap stemming yang dapat dilihat pada Tabel 5.

c. Stemming

Proses stemming merubah setiap kata dari queri dan dokumen kebentuk kata dasar seperti (menggunakan = guna, pendukung = dukung, dan lain-lain). Sehingga setelah dilakukan proses stemming, data sampel akan berubah menjadi seperti berikut :

Tabel 5 Proses Stemming

1 sistem guna algoritma promethee Query

2 analisis pola beli produk lengkap bayi guna algoritma fp-growth Dokumen 1 3 aplikasi lapor tindak jahat kriminal basis android kota pekanbaru Dokumen 2 4 sistem dukung putus pilih mahasiswa prestasi guna metode promethee Dokumen 3

Dari tabel 5 dapat dilihat setelah dilakukan stemming kata-kata yang mempunyai kata dasar akan dikembalikan dan diubah menjadi kata dasar itu sendiri.

d. Tokenizing

Proses terakhir melakukan pemisahan setiap kalimat dari query dan dokumen menjadi perkata, untuk setiap kata yang sama hanya akan di ambil satu atau tidak boleh ada kata yang sama

Tabel 6 Proses Tokenizing

1 sistem, guna, algoritma, promethee Query

2 analisis, pola, beli, produk, lengkap, bayi, guna, algoritma, fp-growth Dokumen 1 3 aplikasi, lapor,tindak, jahat, kriminal, basis, android, kota, pekanbaru Dokumen 2 4 sistem, dukung, putus, pilih, mahasiswa, prestasi, guna, metode,

promethee Dokumen 3

Dari Tabel 6 dapat dilihat setelah dilakukan Tokenizing semua kalimat dipotong berdasarkan tiap kata yang menyusunnya. Setelah semua tahap dilakukan pada 3 sample dokumen judul skripsi didapati 26 jumlah terms yang mewakili tiap kata yg berbeda dapat dilihat pada tabel 7.

Tabel 7 Terms Hasil Tokenizing

No Terms No Terms

(9)

9

1 sistem (query) 14 tindak

2 guna (query) 15 jahat

3 algoritma (query) 16 kriminal

4 promethee (query) 17 basis

5 analisis 18 android

6 pola 19 kota

7 beli 20 pekanbaru

8 produk 21 dukung

9 lengkap 22 putus

10 Bayi 23 pilih

11 fp-growth 24 mahasiswa

12 aplikasi 25 prestasi

13 pelapor 26 metode

Dari Tabel 7 dapat dilihat hasil tokenizing di pecah menjadi 26 kata dan tahap selanjutnya yaitu mencari bobot setiap terms yang akan digunakan dalam proses vector space model. Sebelum masuk kedalam perhitungan vector space model terlebih dahulu mencari nilai frekuesi dari setiap kata dalam query dan dokumen dengan terlebih dahulu mencari nilai TF dan DF.

c. Langkah-Langkah Vector Space Model

Setelah diperoleh data hasil tokenizing, maka data sampel tersebut selanjutnya akan di proses menggunakan algoritma vector space model sebagai berikut :

1. Menentukan Nilai TF Dan DF

Nilai TF (term frekuency) adalah penentuan kemunculan term dalam suatu dokumen. Dimana diberikan nilai 1 untuk term yang muncul dan nilai 0 untuk term yang tidak muncul. Sedangkan DF (document frekuensy) adalah jumlah dari kemunculan term untuk masing-masing dokumen. Kata yang di hitung adalah 26 kata atau terms, yang telah di dapatkan terhadap 3 sampel data dokumen judul skripsi dari data hasil tokenizing menggunakan Persamaan (2).

Tabel 8 Proses TF(term frequency) dan DF(documen frequency)

Term/Kata Term Frequency(TF)

Query Dokumen 1 Dokumen 2 Dokumen 3 DF

sistem (q) 1 0 0 1 1

guna (q) 1 1 0 1 2

algoritma (q) 1 1 0 0 1

promethee (q) 1 0 0 1 1

Analisis 0 1 0 0 1

Pola 0 1 0 0 1

Beli 0 1 0 0 1

Produk 0 1 0 0 1

…. …. …. …. …. ….

Metode 0 0 0 1 1

Untuk perhitungan IDF adalah hasil log dari jumlah seluruh data dibagi jumlah

(10)

10 DF(t) yang mengacu pada Tabel 8, log yang digunakan adalah log basis 10, IDF dihitung menggunakan Persamaan (4).

2. Menghitung Nilai IDF (Inverse Document Frequency)

Pada tahap ini akan dilakukan perhitungan dimana terlebih dahulu menghitung Jumlah dokumen dibagi dengan nilai DF. Selanjutnya di hitung nilai IDF menggunakan persamaan (4).

Tabel 9 Nilai IDF(Inverse Document Frequency)

Term/Kata D/df Idf= log(D/df)

sistem (q) 3 0,4771 guna (q) 1,5 0,1760 algoritma (q) 3 0,4771 promethee (q) 3 0,4771

Analisis 3 0,4771

… …. ….

Metode 3 0,4771

Untuk perhitungan nilai bobot digunakan perhitungan kombinasi TF-IDF yaitu hasil perkalian dari TF dan IDF yang mengacu pada Tabel 8 dan Tabel 9.

3. Menghitung Nilai Bobot Dokumen (W)

Bobot dokumen (W) dihitung untuk didapatkannya suatu bobot hasil perkalian atau kombinasi antara Term Frequency (tf) dan Inverse Document Frequency (idf).

Meggunakan persamaan (3).

Tabel 10 Perhitungan Bobot Dokumen (W)

Term Bobot (W)

Query Dokumen 1 Ddokumen 2 Dokumen 3

sistem (q) 0,4771 0 0 0,4771

guna (q) 0,1760 0,1760 0 0,1760

algoritma (q) 0,4771 0,4771 0 0

promethee (q) 0,4771 0 0 0,4771

analisis 0 0,4771 0 0

pola 0 0,4771 0 0

beli 0 0,4771 0 0

produk 0 0,4771 0 0

…. …. …. …. ….

metode 0 0 0 0,4771

Dari Tabel 10 dapat dilihat hasil TF-IDF dari 3 sampel data judul skripsi menghasilkan 26 kata berupa bobot kemunculan tiap kata yang mewakili tingkat kepentingan kata terhadap suatu dokumen. Tahap selanjutnya yaitu menghitung nilai jarak query dan nilai jarak dokumen yang mengacu pada Tabel 10.

4. Menghitung Nilai Jarak Query dan Nilai Jarak Dokumen

Terlebih dahulu dihitung nilai quadrat dari setiap query dan dokumen menggunakan persamaan (4) dan (5).

(11)

11 Tabel 11 Perhitungan Jarak Query dan Dokumen

Terms/Kata Nilai Jarak Queri Dan Dokumen

Query Dokumen 1 Dokumen 2 Dokumen 3

sistem (q) 0,2276 0 0 0,2276

guna (q) 0,0310 0,0310 0 0,0310

algoritma (q) 0,2276 0,2276 0 0

promethee (q) 0,2276 0 0 0,2276

Analisis 0 0,2276 0 0

Pola 0 0,2276 0 0

Beli 0 0,2276 0 0

Produk 0 0,2276 0 0

…. …. …. …. ….

Metode 0 0 0 0,2276

TOTAL 0,7139 2,0798 2,0488 1,8521

Dari Tabel 11 di atas di peroleh nilai kuadrat dari setiap queri dan dokumen, tahap selanjutnya menghitung index term query dan dokumen.

5. Menghitung Index Terms Dari Query Dan Dokumen

Pada tahap ini dilakukan perhitungan menggunakan persamaan (6).

Tabel 12 Perhitungan Index Terms

Terms/Kata Index Terms

Dokumen 1 Dokumen 2 Dokumen 3

sistem (q) 0 0 0,0518

guna (q) 0,0009 0 0,0009

algoritma (q) 0,0518 0 0

promethee (q) 0 0 0,0518

Analisis 0 0 0

Pola 0 0 0

Beli 0 0 0

Produk 0 0 0

…. …. …. ….

Metode

TOTAL 0,0527 0 0,1045

Setelah mendapat hasil dari nilai index term pada tabel 12 selanjutnya tahap terahir yaitu menghitung nilai cosine similarity.

6. Menghitung Nilai Cosine Similarity

Similaritas antara query dan dokumen berbanding lurus terhadap jumlah bobot query (q) dikali bobot dokumen (dj) dan berbanding terbalik terhadap akar jumlah kuadrat q (|q|) dikali akar jumlah kuadrat dokumen (|dj|). Perhitungan similaritas menghasilkan bobot dokumen yang mendekati nilai 1 atau menghasilkan bobot dokumen yang lebih besar dibandingkan dengan nilai yang dihasilkan dari perhitungan inner product. Dengan menggunakan persamaan (7).

Tabel 13 Hasil Cosine Similarity Query : Sistem Menggunakan Algoritma Promethee

# Cosine

Similarity Dokumen

(12)

12 D3 0,09096 Sistem Pendukung Keputusan Pemilihan Mahasiswa Berprestasi

Menggunakan Metode Promethee

D1 0.04331 Analisis Pola Pembelian Produk Perlengkapan Bayi Menggunakan Algoritma Fp-Growth

D2 0 Aplikasi Pelaporan Tindak Kejahatan Kriminalitas Berbasis Android Di Kota Pekanbaru

Pada Tabel 13 dapat dilihat hasil cosine similasrity bahwa pencarian query dengan kata kunci “Sistem Menggunakan Algoritma Promethee” menampilkan dokumen ke-3 atau D3 yang menjadi urutan pertama pada hasil pencarian dengan nilai cosine similarity 0,09096 dan dokumen k-1 atau D1 berada diurutan kedua dengan nilai 0,04331 selanjutnya dokumen ke-2 ada di urutan ke tiga dengan nilai 0.

b. Desain Pengembangan Sistem 1. Use Case Diagram

Use case diagram merupakan suatu aktivitas yang menggambarkan urutan interaksi antar satu atau lebih aktor dan sistem. Use case yang akan dirancang yaitu use case diagram untuk pengaksesan melalui web.

Gambar 1 Use Case Diagram

2. Class Diagram

Class diagram menggambarkan struktur dan deskripsi class, package, dan object yang saling terhubung. Class diagram yang dijelaskan pada analisa ini adalah class diagram sistem yang telah dibuat.

(13)

13 Gambar 2 Class Diagram

c. Hasil Tampilan Sistem

Tampilan sistem merupakan bentuk hasil program yang telah dibuat dan dijalankan berbasis web.

Gambar 3 Tampilan Login

Gambar 4 Tampilan Dashboard

Gambar 5 Tampilan Data Stoplist

(14)

14 Gambar 6 Tampilan Data Term – Stem

Gambar 7 Tampilan Dat Dokumen

Gambar 8 Tampilan Halaman Pencarian

Gambar 9 Tampilan Hasil Pencarian

KESIMPULAN

Setelah menyelesaikan serangkaian tahapan dalam merancang dan membangun sistem pencarian judul skripsi menggunakan metode Vector Space Model berbasis Web.

(15)

15 Maka dapat diambil beberapa kesimpulan diantaranya sebagai berikut:

1. Sistem pencarian judul skripsi menggunakan metode vector space model dapat digunakan dalam melakuan pencarian dokumen dan menghasilkan hasil pencarian yang akurat sesuai dengan kata kunci.

2. Hasil pencarian dokumen ditentukan berdasarkan perhitungan bobot dari TF(Term Frequency) dan IDF(Invers Dokument Frequency).

3. Menggunakan proses tokenizing akan menghasilkan data yang sangat banyak tentunya juga menghasilkan proses hitung yang sangat banyak, sehingga sedikit memerlukan waktu dalam proses generate hasil pencarian.

4. Pencarian dengan menggunakan metode vector space model dari sampel diperoleh nilai Cosine Similarity dimana D3 memiliki nilai tertinggi dengan nilai 0,09096 yang berarti D3 memiliki tingkat kesamaan paling tinggi dengan nilai query. Sehingga dokumen yang diharapkan muncul dengan tingkat akurasi tinggi dapat ditemukan dengan tepat dan dokumen yang dihasilkan sedikit.

SARAN

Berdasarkan kesimpulan diatas, maka penulis merekomendasikan beberapa hal berupa saran-saran sebagai berikut:

1. Menerapkan metode pencarian lainnya yang lebih bagus untuk mengetahui tingkat akurasi dari hasil pencarian yang lebih akurat dan relevan.

2. Pada pengembangan aplikasi pencarian selanjutnya diharapkan dapat dioperasikan tidak hanya berbasis web saja, melainkan juga bisa dioperasikan pada platform yang lain.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada ibu Fatayat,S.Kom,. M.Kom. yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

DAFTAR PUSTAKA

Brata, D. W., & Hetami, A. (2015). Perancangan Information Retrieval (IR) Untuk Pencarian Ide Pokok Teks Artikel Berbahasa Inggris Dengan Pembobotan Vector Space Model. Jurnal Ilmiah Teknologi Informasi Asia, 9(1), 53–59.

Leman, D., & Andesa, K. (2015). Implementasi Vector Space Model Untuk Meningkatkan Kualitas Pada Sistem Pencarian Buku Perpustakaan. Seminar Nasional Informatika 2015, Vol 1, 8–15.

Mandala, R. (2006). Evaluasi Efektifitas Metode Machine Learning Pada Search Engine. Keahlian Informatika, Sekolah Teknik Elektro Dan Informatika, 2006(Snati), 11–15.