OPTIMASI MODEL QUERY PADA SISTEM FAQ DI SUARA WARGA UNIVERSITAS NEGERI SEMARANG

(1)

i

OPTIMASI MODEL QUERY PADA SISTEM FAQ

DI SUARA WARGA UNIVERSITAS NEGERI

SEMARANG

Skripsi

diajukan sebagai salah satu persyaratan untuk memperoleh gelar Sarjana

Pendidikan Studi Pendidikan Teknik Informatika dan Komputer

Oleh

Ganang Ardiy Tama NIM.5302411232

JURUSAN TEKNIK ELEKTRO

FAKULTAS TEKNIK

UNIVERSITAS NEGERI SEMARANG

(2)

(3)

(4)

(5)

v

MOTTO

MOTTO

The only way to do great work is to love what you do

(6)

vi

PERSEMBAHAN

PERSEMBAHAN

Skripsi ini penulis persembahkan untuk :

(7)

vii

ABSTRAK

Tama, Ganang Ardiy. 2015. Optimasi Model Query pada Sistem FAQ di Suara

Warga Universitas Negeri Semarang. Skripsi, Pendidikan Teknik Informatika dan Komputer-Jurusan Teknik Elektro, Universitas Negeri Semarang. Feddy Setio Pribadi, S.Pd., M.T.

Suara Warga UNNES di Universitas Negeri Semarang (UNNES) adalah program pengaduan online permasalahan-permasalahan didalam kampus. Besarnya jumlah dan banyak terulangnya data membuat banyak pengaduan tidak ditanggapi karena pengguna lain merasa topik tersebut sudah pernah diunggah dan ditanggapi sebelumnya. Penelitian ini bertujuan untuk mengimplementasikan dan

mengetahui model query dengan kinerja terbaik pada sistem FAQ di Suara Warga

UNNES.

Sistem FAQ yang dikembangkan menggunakan metode pengembangan

perangkat lunak Waterfall model. Diujikan sebanyak 3 model query yaitu isi, isi

dengan feature selection, dan judul dengan metode perhitungan sistem tersebut

adalah pembobotan dengan Term Frequency-Inverse Document Frequency

selanjutnya dievaluasi dengan metode recall, precision, dan f-measure.

Pada penelitian ini diujikan sebanyak 25 data Suara Warga UNNES dan 45 data dari inputan 9 responden mahasiswa UNNES pada 5 topik bahasan dengan 3

model query. Hasil pengujian yang dilakukan nilai recall 0.92, precision 0.41,

f-measure 0.56dengan model query isi, nilai recall 0.86, precision 0.59, f-measure

0.70dengan model query isi dengan feature selection, nilai recall 0.88, precision

0.78, f-measure 0.82 dengan model query judul. Dari hasil tersebut model query

dari judul inputan memiliki nilai paling tinggi dari ke-3 pengujian tersebut. Saran

untuk penelitian selanjutnya adalah menerapkan feature selection pada setiap

pengujian model query dan disarankan untuk menambahkan metode untuk

mengatasi persamaan makna.

(8)

viii

KATA PENGANTAR

Alhamdulillahirabbil’alamin berkat ridho Allah SWT, semangat dan kerja

keras, serta dukungan dari orang tua, adik dan teman-teman akhirnya penulis

dapat menyelesaikan skripsi yang berjudul “Optimasi Model Query Pada Sistem Faq Di Suara Warga Universitas Negeri Semarang" ,ini dapat diselesaikan dan di ajukan untuk memenuhi syarat akhir guna persyaratan memperoleh gelar Sarjana Pendidikan pada Universitas Negeri Semarang.Untuk itu pada kesempatan ini peneliti ingin mengucapkan terima kasih kepada Yth:

1. Drs. M. Harlanu, M.Pd. selaku Dekan Fakultas Teknik Universitas Negeri

Semarang.

2. Drs. Suryono, M.T selaku Ketua Jurusan Teknik Elektro Fakultas Teknik

Universitas Negeri Semarang.

3. Feddy Setio Pribadi ,S.T,M.T, selaku Kaprodi Pendidikan Teknik

Informatika dan Komputer Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Semarang dan selaku Dosen Pembimbing yang telah meluangkan waktu, tenaga dan pikiran dalam memberikan bimbingan.

4. Bapak, Ibu, dan keluarga yang memberikan kasih sayang dan doa sehingga

skripsi ini dapat diselesaikan dengan baik.

5. Teman-teman Teknik Elektro khususnya Prodi PTIK yang telah

memberikan dukungan dalam penyusunan skripsi.

6. Pihak-pihak terkait yang telah membantu terlaksana dan tersusunnya skripsi

ini.

Akhir kata, peneliti berharap semoga penelitian ini dapat bermanfaat bagi peneliti sendiri dan pembaca. Amin.

Semarang, 1 Juni 2015

(9)

ix

DAFTAR ISI

Halaman

Halaman Judul ... i

Pernyataan Keaslian ... Error! Bookmark not defined. Pengesahan ... Error! Bookmark not defined. Motto ... v

1.8 Sistematika Penulisan ... 7

BAB II TINJAUAN PUSTAKA ... 9

(10)

x

2.1.1 Konsep Dasar Optimasi... 9

2.1.2 Konsep Dasar Sistem FAQ ... 10

2.1.2.1 Konsep Dasar Temu-kembali Informasi (Information Retrieval) 12 2.1.2.3 Konsep Dasar Pencarian dengan pembobotan TF-IDF ... 16

2.1.2.4 Pencarian Pada MYSQL Full-Text Search ... 19

2.1.3 Model Query ... 22

2.1.3.1 Feature Selection (Seleksi Fitur) Chi-Square ... 23

2.1.4 Optimasi Model Query pada Sistem FAQ ... 24

2.2 Penelitian Terdahulu ... 25

2.3 Kerangka Berfikir ... 28

BAB III METODE PENELITIAN... 29

3.1 Metodologi Pengembangan Perangkat Lunak ... 29

3.1.1 Analisis Kebutuhan Sistem ... 30

3.1.2 Desain ... 31

3.1.3 Pengkodean ... 31

3.1.4 Pengujian ... 31

3.2 Metode Pengumpulan Data ... 33

3.3 Data Penelitian ... 34

BAB IV HASIL DAN PEMBAHASAN ... 35

4.1 Hasil Penelitian ... 35

4.1.1 Analisis Sistem ... 35

4.1.1.1 Analisis Sistem yang Berjalan ... 35

4.1.1.2 Identifikasi Masalah ... 36

(11)

xi

4.1.2.1 Perancangan Alur Sistem FAQ ... 36

4.1.2.2 Perancangan Interface ... 37

4.1.3 Pengkodean ... 39

4.1.4 Pengujian ... 42

4.1.4.1 Dokumen Pengujian ... 43

4.1.4.2 Skenario Uji Coba ... 51

4.1.4.3 Hasil Uji Coba ... 51

4.2 Pembahasan ... 58

4.2.1 Perbandingan Hasil Uji Coba ... 58

4.2.2 Analisis Hasil Uji Coba ... 61

BAB V PENUTUP ... 71

5.1 Simpulan ... 71

5.2 Saran ... 72

(12)

xii

DAFTAR TABEL

Halaman

Tabel 2.1 Penghitungan TF-IDF ... 15

Tabel 2.2 Penghitungan TF-IDF Dokumen (doc n) terhadap dokumen Query .... 17

Tabel 2.3 Perankingan ... 18

Tabel 2. 4 Perhitungan MySQL Full-Text Search TF-IDF ... 20

Tabel 2.5 Perangkingan MySQL Full-Text Search TF-IDF ... 21

Tabel 2.6 Pembandingan Antara Classic Formula TF-IDF dan TF-IDF pada MySQL Full-Text Search ... 22

Tabel 4.1 Sample data Suara Warga UNNES dengan 5 topik bahasan ... 47

Tabel 4.2 Data Suara Warga UNNES Hasil Inputan Responden... 50

Tabel 4.3 Nilai Kemunculan data relevan pada setiap dokumen inputan responden ... 55

Tabel 4.4 Nilai Evaluasi Recall, Precision, dan F-measure ... 55

Tabel 4.6 Nilai Evaluasi Recall, Precisiom, dan F-mesure ... 56

Tabel 4.8 Nilai Evaluasi Recall, Precisiom, dan F-mesure ... 57

Tabel 4.9 Perbandingan nilai kemunculan data relevan ... 58

(13)

xiii

(14)

xiv

DAFTAR GAMBAR

Gambar 2.1 Kerangka Berfikir ... 28

Gambar 3.1 Tahapan model sekuensial linier ... 29

Gambar 3.2 Analisis dan kesenjangan antara rekayasa sistem dan desain perangkat lunak ... 30

Gambar 4.1 Perancangan Alur Sistem Pencarian ... 36

Gambar 4.2 Halaman Input ... 38

Gambar 4.3 Halaman Hasil FAQ ... 38

Gambar 4.4 Halaman Baca ... 39

Gambar 4.5 Perbandingan Nilai Recall ... 62

Gambar 4.6 Perbandingan Nilai Precision ... 64

(15)

xv

DAFTAR LAMPIRAN

Lampiran 1. Nilai Pembobotan TF-IDF pada Mysql Fulltext Search ... 75

Lampiran 2. Sreenshot Sistem ... 84

Lampiran 3. SK Pembimbing ... 86

(16)

1

PENDAHULUAN

1.1 Latar Belakang

Suara Warga Universitas Negeri Semarang atau sering disebut dengan

Suara Warga UNNES adalah salah satu bagian dari Sistem Akademik

Terpadu. Suara Warga UNNES digunakan sebagai media pengaduan semua

permasalahan yang berkaitan dengan kegiatan di lingkungan Universitas

Negeri Semarang. Suara Warga UNNES juga digunakan sebagai sarana bagi

civitas academica untuk berpartisipasi secara proaktif dalam mengawal program dan pelayanan yang di selengarakan oleh Universitas Negeri

Semarang. Layanan ini dapat diakses oleh seluruh civitas academica yang

terdiri dari pimpinan Universitas, pejabat Universitas, dosen, mahasiswa, dan

karyawan. Didalam Suara Warga UNNES pengguna bebas mengunggah

tulisan yang berhubungan dengan permasalahan di kampus. Fitur utama dalam

Suara Warga UNNES adalah fitur tanya-jawab. Fitur tersebut akan

mempermudah pihak terkait untuk memberikan tanggapan secara langsung

kepada pengirim terhadap tulisan yang diunggahnya.

Dewasa ini banyak sistem yang mengembangkan fitur tanya-jawab di

dalam sistem-nya seperti fitur diatas. Diantara fitur-fitur yang dikembangkan

banyak diantaranya menggunakan menggunakan fitur pencarian. Sampai saat

ini sudah banyak penelitian yang mengembangkan teknik pencarian secara

(17)

computer-based dengan berbagai pendekatan diawali sejak tahun 1940-an dimana pada saat itu sistem pencarian berbasis computer pertama dibuat. Jauh sebelum itu

pada tahun 1891-an sudah berkembang suatu ilmu yang diberi nama

temu-kembali informasi (information retrieval) yang merupakan konsep dasar dari

pencarian dokumen atau informasi. (Mark Sanderson, 2012).

FAQ (Frequently Asked Questions) menjadi salah satu bagian dari

sebuah website yang digunakan pengguna sebagai referensi awal terhadap

persoalan yang ingin pengguna ketahui sebelum menanyakan langsung ke

pihak penyedia layanan. Data dalam FAQ pada website adalah data statis yang

telah disediakan oleh penyedia layanan, pengguna tidak dapat menambahkan

data secara langsung dalam FAQ. Dengan jumlah data yang terbatas dan statis

menyebabkan pada beberapa kasus pertanyaan dan jawaban yang diinginkan

pengguna tidak tersedia pada daftar FAQ.

Terdapat lebih dari 16.000 tulisan yang telah diunggah di Suara Warga

UNNES. Banyak diantara tulisan-tulisan tersebut lambat atau bahkan tidak

ditanggapi oleh pihak terkait. Hal itu dimungkinkan karena topik bahasan dari

tulisan tersebut sudah pernah diunggah oleh pengguna lain dan sudah pernah

ditanggapi sebelumnya. Pengguna lain yang menanggapi atau membaca

tanggapan dari tulisan terdahulu merasa topik bahasan dari tulisan tersebut

sudah pernah ditanggapi sehingga tidak ditanggapi lagi. Selain itu dengan

besarnya jumlah tulisan yang diunggah dan tidak adanya FAQ membuat

pengguna lebih memilih mengungah tulisannya secara langsung tanpa

(18)

untuk mempermudah dan mempercepat pengguna mendapatkan informasi

tanggapan dengan memunculkan daftar tulisan yang sebelumnya pernah

diunggah.

Berdasarkan uraian-uraian di atas, maka peneliti tertarik untuk

melakukan penelitian terhadap sistem pencarian pada SuaraWarga UNNES

penelitian dengan judul : “OPTIMASI MODEL QUERY PADA SISTEM

FAQ DI SUARA WARGA UNIVERSITAS NEGERI SEMARANG”.

1.2 Identifikasi Masalah

Berdasarkan latar belakang yang telah dikemukakan, maka muncul

beberapa permasalahan sebagai berikut :

(1) Besarnya jumlah data dan banyak terulangnya data yang diinputkan pada

Suara Warga UNNES membuat banyak pengaduan tidak ditanggapi karena

pengguna lain merasa topik tersebut sudah pernah tanggapi sebelumnya.

(2) Tidak adanya fitur perncarian dan sistem FAQ pada Suara Warga UNNES

membuat pengguna lebih memilih mengunggah secara langsung

pengaduan tanpa mengecek terlebih dahulu apakah pengaduan dengan

topik tersebut sudah diunggah sebelumnya.

1.3 Rumusan Masalah

Berdasarkan latar belakang dan identifikasi masalah yang telah

dikemukakan, maka dirumuskan beberapa permasalahan sebagai berikut :

(19)

(2) Bagaimana kinerja sistem FAQ pada Suara Warga UNNES dengan

optimasi model query?

1.4 Tujuan Penelitian

Berdasarkan permasalahan yang telah diungkapkan di atas, maka dapat

dirumuskan tujuan dari penelitian yang akan dilakukan. Tujuan dari penelitian

ini adalah sebagai berikut :

(1) Untuk mengimplementasikan sistem FAQ pada Suara Warga UNNES.

(2) Untuk mengetahui model query dengan kinerja terbaik pada sistem FAQ di

Suara Warga UNNES.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah ikut berkontribusi dalam

perkembangan teknologi khususnya memberikan informasi model query yang

digunakan dalam pencarian data, sehingga perkembangan teknologi pencarian

data dapat lebih baik dengan menghasilkan hasil pencarian dengan data yang

relevan.

1.6 Batasan Masalah

Pada perencanaan optimasi model query untuk sistem FAQ pada

Suara Warga Universitas Negeri Semarang sangat kompleks, sehingga

dibutuhkan batasan masalah pada penelitian yang dilakukan yaitu;

a) Memfokuskan pada proses optimasi model query untuk sistem FAQ pada

(20)

b) Posting inputan berupa text

c) Asumsi dokumen yang diposting memiliki pola bahasa yang mengacu

pada Ejaan Yang Disempurnakan (EYD)

d) Singkatan dianggap satu kata

e) Tidak menangani kesalahan penulisan kata

f) Tidak menangani kesamaan makna pada term

1.7 Penegasan Istilah

Berikut ini dijelaskan beberapa istilah yang berkaitan dengan judul

penelitian ini. Beberapa istilah yang perlu dijelaskan adalah:

a) Optimasi

Secara umum optimasi berarti pencarian nilai terbaik (minimum atau

maksimum) dari beberapa fungsi yang diberikan pada suatu konteks.

Optimasi juga dapat berarti upaya untuk meningkatkan kinerja sehingga

mempunyai kualitas yang baik dan hasil kerja yang tinggi .

b) Model Query

Model Query merupakan model penggunaan data dari sebuah struktur

dokumen yang akan digunakan sebagai query dalam sebuah pencarian

dokumen. Data yang dimaksud adalah bagian dari keseluruhan dokumen

yang ada pada data inputan. Pada Suara Warga UNNES data inputan

dibagi menjadi 2 yaitu data inputan judul dan data inputan isi. Dari kedua

(21)

c) Sistem FAQ

FAQ (Frequent Ask Question) adalah daftar pertanyaan dan jawaban yang

sudah pernah dan atau sering ditanyakan dalam beberapa konteks, dan

berkaitan dengan topik tertentu. Sedangkan sistem FAQ yang dimaksud

adalah sistem yang mampu membuat daftar pertanyaan yang sudah pernah

atau sering ditanyakan dan diajukan secara otomatis dengan cara mencari

dokumen yang relevan dengan data inputan yang di ajukan oleh user.

d) Suara Warga Univeristas Negeri Semarang

Suara Warga Universitas Negeri Semarang atau sering disebut dengan

Suara Warga UNNES adalah salah satu bagian dari Sistem Akademik

Terpadu Universitas Negeri Semarang yang digunakan untuk sebagai

media pengaduan semua permasalahan yang berkaitan dengan seluruh

kegiatan di lingkungan Universitas Negeri Semarang. Layanan ini dapat

diakses oleh seluruh civitas academica yang terdiri dari pimpinan

Universitas, pejabat Universitas, dosen, mahasiswa, dan karyawan. Di

dalam sistem Suara Warga UNNES pengguna bebas memposting apa saja

yang berhubungan dengan apa yang ada di dalam kampus namun tetap

memperhatikan aspek sopan santun dalam penyampaian laporan.

e) Data Suara Warga

Data inputan yang telah diposting pengguna ke sistem Suara Warga

(22)

1.8 Sistematika Penulisan

Secara garis besar sistematika penulisan skripsi ini terbagi menjadi

tiga bagian, yaitu: bagian awal, bagian isi, dan bagian akhir.

(1) Bagian pendahuluan, berisi Halaman Judul, Pernyataan, Pengesahan,

Motto dan Persembahan, Kata Pengantar, Abstrak, Daftar isi, Daftar Tabel,

Daftar Gambar, Daftar Lampiran.

(2) Bagian isi, terdiri dari lima bab, yaitu:

BAB I : PENDAHULUAN; pada bagian ini merupakan pengantar

terhadap perancangan optimasi model query pada sistem

FAQ di Suara Warga UNNES seperti Latar Belakang,

Rumusan Masalah, Tujuan Penelitian, Manfaat Penelitian,

Batasan Masalah, Penegasan Istilah, Metode Pengumpulan

Data dan Sistematika Penulisan.

BAB II : TINJAUAN PUSTAKA; dalam bab ini dijelaskan mengenai

Landasan Teori, menguraikan teori-teori yang mendukung

judul dan mendasari pembahasan secara detail yang terkait

dengan penelitian ini, yaitu pengertian dan konsep pencarian

dokumen menggunakan metode TF-IDF dan penelitian

terdahulu.

BAB III : METODOLOGI PENELITIAN; dalam bab ini dijelaskan

(23)

BAB IV : HASIL DAN PEMBAHASAN ; bab ini dijelaskan hasil dari

tahapan penelitian, dan hasil pengujian sistem FAQ di Suara

Warga Universitas Negeri Semarang dari data pengujian oleh

responden dengan beberapa model query.

BAB V : PENUTUP, berisi Simpulan dan Saran dari penelitian yang

berjudul Optimasi Model Query pada sistem FAQ di Suara

Warga di Suara Warga Universitas Negeri Semarang.

(24)

9

TINJAUAN PUSTAKA

Pada pembahasan ini akan dijelaskan teori-teori yang akan dipakai dalam

penelitian. Penelitian ini menggunakan konsep temu-kembali informasi (information retrieval) sebagai konsep dasar dari sistem FAQ yang dibuat. Metode perhitungan dalam sistem FAQ pada penelitian ini menggunakan metode pembobotan TF-IDF

pada Mysql Fulltext Search. Teori pengujian sistem menggunakan recall,precision,

dan f-measure yang merupakan metode evaluasi yang digunakan pada sistem temu-kembali informasi. Selain itu juga dijelaskan metode feature selection dengan chi-square yang digunakan pada salah satu model query.

2.1 Landasan Teori

2.1.1 Konsep Dasar Optimasi

Menurut Hannawati (2002) optimasi adalah pencarian nilai-nilai

variabel yang dianggap optimal, efektif dan juga efisien untuk mencapai

hasil yang diinginkan. Masalah optimasi ini beraneka ragam tergantung

dari bidangnya.

Fachrurrazi (2013) mengemukakan bahwa optimasi adalah salah

satu disiplin ilmu dalam Matematika yang fokus untuk mendapatkan nilai

minimum atau maksimum secara sistematis dari suatu fungsi, peluang,

maupun pencarian nilai lainnya dalam berbagai kasus. Optimasi sangat

(25)

efektif efisien untuk mencapai target hasil yang ingin dicapai. Tentunya

hal ini akan sangat sesuai dengan prinsip ekonomi

yang berorientasikan untuk senantiasa menekan pengeluaran untuk

menghasilkan outputan yang maksimal. Optimasi ini juga penting karena

persaingan saat ini sudah benar benar sangat ketat.

Pada bidang temu-kembali informasi terdapat beberapa hal yang

mempengaruhi hasil dari sistem yang dibuat, diantaranya adalah metode

perhitungan yang digunakan dan data yang menjadi objek perhitungan.

Bentuk optimasi pada metode perhitungan diantaranya adalah dengan

melakukan modifikasi terhadap metode perhitungan agar hasilnya lebih

optimal. Pada optimasi objek perhitungan dapat dilakukan dengan

memodifikasi data yang ada sehingga diharapkan hasil perhitungan lebih

optimal. Beberapa bentuk optimasi objek data perhitungan yang sering

digunakan dalam sistem temu kembali adalah penggunaan stopword,

stemming, dan penggunaan feature selection.

2.1.2 Konsep Dasar Sistem FAQ

Faq.org (2015), FAQ atau Frequently Asked Questions adalah

daftar pertanyaan yang sering diajukan. FAQ sendiri digunakan untuk

membantu pengguna menemukan jawaban dari pertayaan yang akan

diajukan. Pada awalnya FAQ digunakan dalam newsgroup yang pada saat

(26)

digunakan sebagai rujukan awal dan filter pengguna sebelum menggunggah pertanyaan baru.

Menurut Wikipedia (2015) Frequently asked questions (FAQ) atau

Questions and Answers (Q&A) adalah daftar pertanyaan dan jawaban yang sering diajukan dan berkaitan dengan topik tertetu. Fitur ini

digunakan pada mailinglist dan forum online yang dimana pertanyaan

umum tertentu cenderung sering diajukan kembali.

Jogiyanto (1999) didalam Muhammad Dwiky (2012) menjelaskan

bahwa suatu sistem adalah jaringan kerja prosedur-prosedur yang

saling berhubungan, berkumpul bersama-sama untuk melakukan suatu

kegiatan ataun menyelesaikan suatu sasaran tertentu.

FAQ pada sebuah website adalah berupa data statis yang dibuat

oleh penyedia layanan. Dengan jumlah data yang terbatas dan statis

menyebabkan pada beberapa kasus pertanyaan dan jawaban yang

diinginkan pengguna tidak tersedia pada daftar FAQ.

Sistem FAQ yang dimaksud adalah sistem yang mampu membuat

daftar pertanyaan yang sudah pernah atau sering ditanyakan dan diajukan

secara otomatis dengan cara mencari dokumen yang relevan dengan data

inputan yang di ajukan oleh user sehingga dapat memberikan saran

(27)

2.1.2.1 Konsep Dasar Temu-kembali Informasi (Information Retrieval)

Menurut Goker (2009) secara sederhana temu-kembali

informasi adalah tentang menemukan informasi. Lebih spesifik,

temu-kembali informasi adalah proses menyamakan query yang cocok

dengan objek informasi yang telah terindex. Sebuah indes adalah

struktur data yang telah dioptimasi yang dibuat diatas objek informasi,

sehingga memungkinkan untuk akses cepat pada proses pencarian.

Penguraian tersebut diantaranya menghapus kata dengan nilai semantic

yang kecil (stopword) dan menjadikannya sebagai kata dasar

(stemming).

Menurut Rijsbergen (1979) di dalam Nadirman (2006) “Sebuah

sistem temu-kembali informasi tidak memberitahu (yakni tidak

mengubah pengetahuan) pengguna mengenai masalah yang

ditanyakannya. Sistem tersebut hanya memberitahukan keberadaan

(atau ketidakberadaan) dan keterangan dokumendokumen yang

(28)

2.1.2.2 Konsep Dasar Term Frequency-Inverse Document Frequency (TF-IDF)

TF-IDF atau Term Frequency-Inverse Document Frequency

adalah angka statistic yang mendefinisikan betapa pentingnya sebuah

kata dalam kumpulan dokumen atau corpus. (Rajaraman , 2011)

Menurut Robertson (2005) metode Tf-Idf merupakan suatu cara

untuk memberikan bobot hubungan suatu kata (term) terhadap

dokumen. Metode ini menggabungkan dua konsep untuk perhitungan

bobot yaitu, frekuensi kemunculan sebuah kata didalam sebuah

dokumen tertentu dan inverse frekuensi dokumen yang mengandung

kata tersebut. Algoritma TF-IDF merupakan salah satu skema

pembobotan istilah/term dalam pencarian dokumen. Berikut tahapan

pada proses pembobotan TF-IDF, yaitu:

a) Pembobotan Lokal Term Frequency (TF).

Menurut Manning,dkk (2008) TF (Term Frequency) adalah

nilai frekuensi kemunculan sebuah term dalam sebuah dokumen.

Keakuratan sebuah pencarian sangat tergantung dengan perhitungan

TF. Dalam sebuah dokumen terdapat kata-kata yang sangat sering

muncul pada sebuah dokumen dan banyak dokumen lainnya namun

tidak penting untuk menjelaskan karakteristik atau isi dokumen. Dalam

(29)

dianggap tidak penting dalam sebuah dokumen, hal ini dimaksudkan

agar pada saat perhitungan term yang dinilai tidak penting tersebut

tidak mengganggu proses pembobotan pada dokumen. Dalam

implementasinya penghilangan term ini dapat berupa kata sambung

atau kata penghubung. Istilah untuk term yang dihilangkan ini adalah

stopword.

b) Document Frequency (DF)

Document Frequency atau Frekuensi dokumen adalah jumlah dokumen yang berisi term pada seluruh dokumen. Dengan kata lain

Document Frequency ini adalah nilai berapa banyak dokumen yang

mengandung term pada kumpulan dokumen. (Joho , 2007)

c) Pembobotan Global Invers Document Frequency (IDF)

Inverse Document Frequency (IDF) adalah bobot yang dugunakan untuk menyatakan seberapa penting sebuah term didalam

kumpulan dokumen (Ounis,2009). Nilai ini diperoleh dengan formula

berikut:

Inverse Document Frequency = log10 ( N/dft )

Keterangan:

N : jumlah dokumen

dft : jumlah dokumen yang mengandung term t

idf : log dari umlah dokumen dibagi jumlah dokumen

(30)

d) Perhitungan TF-IDF

Berikut rumus perhitungan TF-IDF:

TF-IDF = Term Frequency x Inverse Document Frequency

Atau

Query : bagaimana prosedur lupa membayar uang spp.

D1 : bagaimana cara membayar spp yang lupa.

D2 : bagaimana prosedur membayar ukt.

D3 : bagaimana prosedur mengajukan beasiswa.

vocab/doc

(31)

Dari tabel 2.1 dapat di lihat nilai tf-idf dari term “bagaimana”

yang muncul disemua dokumen memiliki nilai 0 atau dianggap tidak

berbobot, sedangkan nilai tf-idf dari term “uang” yang hanya muncul di

1 dokumen memiliki nilai 0.60206.

Dari tabel dan perbandingan nilai tf-idf diatas dapat disimpulkan

semakin tinggi kemunculan sebuah term di semua dokumen akan

mengurangi nilai bobot dari term tersebut, dan sebaliknya semakin

sedikit atau rendah kemunculan sebuah term di semua dokumen nilai

bobot dari term tersebut akan tinggi. Hal ini sesuai konsep dari

pembobotan dengan tf-idf dari penelitian-penilitian sebelumnya.

2.1.2.3 Konsep Dasar Pencarian dengan pembobotan TF-IDF

Dalam kumpulan dokumen yang memiliki jumlah dokumen sangat

besar, akan dibutuhkan sebuah metode yang digunakan untuk

membantu untuk menemukan sebuah informasi dari

dokumen-dokumen tersebut. Ada banyak metode yang digunakan dalam

pencarian tersebut, diantaranya mengukur bobot dokumen terhadap

query dari informasi yang dicari dan atau mengukur kesamaan (similiarity) sebuah dokumen dengan query dari

informasi yang dicari.

Tahap awal yang dilakukan dalam pencarian dengan

(32)

query pencarian dalam kumpulan dokumen. Dari pembobotan terhadap

query pencarian tersebut akan dilakukan pengurutan terhadap nilai bobot. Hasil pencarian yang ditampilkan adalah urutan ranking bobot

dari semua dokumen terhadap query pencarian.

Contoh matriks:

Query : bagaimana prosedur lupa membayar uang spp.

D1 : bagaimana cara membayar spp yang lupa.

D2 : bagaimana prosedur membayar ukt.

D3 : bagaimana prosedur mengajukan beasiswa.

Tabel 2.2 Penghitungan TF-IDF Dokumen (doc n) terhadap dokumen Query

Keterangan :

Angka 1 : Menandakan bahwa kata tersebut terdapat didalam dokumen Angka 0 : Menandakan bahwa kata tersebut tidak terdapat didalam dokumen

vocab

(33)

Dari tabel 2.2 , dapat dilihat perhitungan bobot total dokumen

terhadap dokumen query. Bobot total sebuah dokumen adalah jumlah

total bobot term yang ada di dokumen dan yang hanya ada dalam

Query. Bagian area abu-abu dari tabel adalah bagain dari term dokumen

yang tidak termasuk dalam query, bobot term yang tidak ada pada

Query tidak dihitung untuk bobot total. Bobot inilah yang nantinya akan

diranking.

Tabel 2.3 Perankingan

Dari tabel 2.3 diatas didapatkan hasil perankingan dari

bobot total dokumen terhadap Query. Dari perankingan tersebut dapat

dapat diambil urutan untuk hasil dari pencarian. Dokumen dengan

bobot tertinggi adalah dokumen yang paling relevan menurut

perhitungan dengan TF-IDF.

Dokumen Nilai Bobot Ranking

Doc1 1.0280 1

Doc2 0.2498 2

(34)

2.1.2.4 Pencarian Pada MYSQL Full-Text Search

MySQL adalah sebuah implementasi dari sistem manajemen

basisdata relasional (RDBMS) yang didistribusikan secara gratis

dibawah lisensi GPL (General Public License). Setiap pengguna dapat

secara bebas menggunakan MySQL, namun dengan batasan perangkat

lunak tersebut tidak boleh dijadikan produk turunan yang bersifat

komersial. MySQL sebenarnya merupakan turunan salah satu konsep

utama dalam basisdata yang telah ada sebelumnya; SQL (Structured

Query Language). SQL adalah sebuah konsep pengoperasian

basisdata, terutama untuk pemilihan atau seleksi dan pemasukan data,

yang memungkinkan pengoperasian data dikerjakan dengan mudah

secara otomatis. (Wikipedia,2015)

MySQL Full-Text Search adalah salah satu fungsi dalam

pencarian yang ada dalam MySQL. Di MySQL Full-Text Search

metode yang digunakan dalam pencariannya adalah perangkingan

bobot TF-IDF. MySQL Full-Text Search menggunakan modifikasi dari

formula pembobotan “term frequency-inverse document

frequency” (TF-IDF) untuk merangking tingkat relevansi dokumen

dari query yang diberikan. Pembobotan TF-IDF dihitung dari seberapa

banyak frekuensi term muncul dalam sebuah dokumen dan seberapa

(35)

yang digunakan dalam MySQL Full-Text Search adalah sebagai berikut,

TF-IDF = Term Frequency x Inverse Document Frequency

Atau

DF : Jumlah kemunculan kata dalam kalimat (df) IDF : Bobot Inverse Document Frequency

N : Jumlah Total Semua Dokumen.

Wt,d : bobot dokumen d terhadap term t

Berikut adalah contoh perbandingan Classic Formulas TF-IDF

dan MySQL Full-Text Search TF-IDF,

vocab/doc

(36)

Dari tabel 2.4 , dapat dilihat perhitungan bobot total dokumen

terhadap dokumen query dengan TF-IDF pada MySQL Full-Text

Search. Bobot total sebuah dokumen adalah jumlah total bobot term yang ada di dokumen dan yang hanya ada dalam Query. Bagian area

abu-abu dari tabel adalah bagain dari term dokumen yang tidak

termasuk dalam query, bobot term yang tidak ada pada Query tidak

dihitung untuk bobot total. Bobot inilah yang nantinya akan

diranking.

Dokumen Nilai Bobot Ranking

Doc1 0.46870 1

Doc2 0.03121 2

Doc 3 0.0156 3

Tabel 2.5 Perangkingan MySQL Full-Text Search TF-IDF

Dari tabel 2.5 diatas adalah hasil perankingan dari bobot total

dokumen terhadap Query dengan TF-IDF pada MySQL Full-Text

Search . Dari perankingan tersebut dapat dapat diambil urutan untuk hasil dari pencarian. Dokumen dengan bobot tertinggi adalah dokumen

yang paling relevan menurut perhitungan dengan TF-IDF.

Dari perhitungan diatas, untuk melihat perbedaan Classic

Formula TF-IDF dan TF-IDF pada MySQL Full-Text Search maka dilakukanlah pembandingan. Pembandingan dapat dilihat pada table

(37)

Tabel 2.6 Pembandingan Antara Classic Formula TF-IDF dan TF-IDF pada MySQL

Full-Text Search

Tabel 2.6 diatas adalah hasil pembandingan antara Classic

Formula TF-IDF dan TF-IDF pada MySQL Full-Text Search . Dari pembadingan tersebut dapat disimpulkan bahwa modifikasi yang

dilakukan oleh MySQL Full-Text Search pada formula TF-IDF tidak

mengubah nilai urutan/ranking dokumen. Perubahan terjadi pada nilai

bobot dokumen. Secara konsep perankingan modifikasi yang

dilakukan MySQL Full-Text Search tidak menggubah nilai

urutan/ranking.

2.1.3 Model Query

Menurut Hasugian (2006) query adalah format bahasa perintah.

Format Bahasa tersebut di input (dimasukan) oleh pengguna kedalam

Sistem temu kembali informasi. Dalam interface (antar muka) Sistem

temu kembali informasi selalu disediakan kolom/ruas sebagai tempat bagi

pengguna untuk mengetikkan (menuliskan) query nya. Dalam

perpustakaan OPAC (Online Public Acces Catalog) disebut “Search

expression”. Pada kolom itulah pengguna mengetik/ menuliskan bahasa

Pembanding Doc1 Doc2 Doc3

Bobot Dengan Classic Formula TF-IDF 1.0280 0.2498 0.1249

Bobot Dengan MySQL Full-Text Search TF-IDF 0.46870 0.03121 0.0156

Ranking Dengan Classic Formula TF-IDF 1 2 3

(38)

permintaanya (query), dan setelah query itu dimasukkan selanjutnya mesin akan melakukan proses pemanggilan terhadap dokumen yang diinginkan

dari database.

Model query merupakan bentuk query yang diambil dari sebuah

struktur dokumen. Bentuk query yang diambil dari bagian dari struktur

dokumen dapat berupa sebuah term atan terdiri dari banyak term. Ogilvie

(2013) membuat contoh aturan bahwa permodelan dokumen terstruktur

terdiri dari tittle, abstract, dan body. Ketiga bagian tersebut merupakan

bagian utama dari struktur dokumen. Penggunaan model query dalam

sistem temu kembali dimaksudkan untuk mengefektifkan penggunaan

query yang sesuai dengan sistem yang dibuat.

2.1.3.1 Feature Selection (Seleksi Fitur) Chi-Square

Menurut C.Sun (2009) didalam Supriyanto (2011) seleksi fitur

adalah proses menghilangkan beberapa fitur atau term yang kurang

relevan untuk penentuan topik suatu dokumen. Chi-square adalah salah

satu seleksi fitur yang mampu mengilangkan banyak fitur tanpa

mengurangi tingkat akurasi.

Keterangan:

(39)

2.1.4 Optimasi Model Query pada Sistem FAQ

Data yang dihasilkan oleh sistem FAQ yang mengimplementasikan

sistem temu-kembali informasi menjadi tolakukur dalam menentukan

efektifitas sebuah sistem FAQ itu sendiri. Tidak hanya menampilkan

jumlah data yang relevan sebanyak-banyaknya, dalam sistem

temu-kembali juga diharapkan mampu menangani jumlah tidak relevan dari data

yang berhasil ditampilkan sistem. Hal tersebutlah yang mendasari untuk

dilakukan optimasi dalam sebuah sistem FAQ.

Perbedaan pola data yang ada dilapangan menyebabkan perbedaan

bentuk optimasi dari tiap-tiap kasus sistem temu-kembali. Bentuk optimasi

dari sebuah sistem temu-kembali diantaranya adalah memodifikasi

objek-objek yang berpengaruh dalam sistem temu-kembali itu sendiri untuk

menghasilkan hasil yang akurat. Pada bidang temu-kembali informasi

terdapat beberapa hal yang mempengaruhi hasil dari sistem yang dibuat,

diantaranya adalah metode perhitungan yang digunakan dan data yang

menjadi objek perhitungan.

Bentuk optimasi pada metode perhitungan diantaranya adalah

dengan melakukan modifikasi terhadap metode perhitungan agar hasilnya

lebih optimal. Bentuk optimasi ini bisa dilakukan dengan mencari metode

perhitungan terbaik dengan cara mengujikan beberapa metode perhitungan

(40)

Pada optimasi objek perhitungan dapat dilakukan dengan

memodifikasi data yang ada sehingga diharapkan hasil perhitungan lebih

optimal. Beberapa bentuk modifikasi objek data perhitungan yang sering

digunakan dalam sistem temu kembali adalah penggunaan stopword,

stemming, dan penggunaan feature selection. Hasil dari modifikasi data

perhitungan tersebut akan dijadikan sebuah query yang nanti akan dihitung

pada sistem temu-kembali yang telah dibuat. Bentuk optimasi yang dapat

dilakukan adalah dengan mengujikan model-model query yang ada untuk

diambil model query terbaik yang memiliki nilai akurasi yang tertinggi.

2.2 Penelitian Terdahulu

Penelitian terdahulu yang berkaitan dengan pencarian dokumen sangat

diperlukan sebagai bahan acuan dalam penulisan. Adapun beberapa penelitian

terdahulu mengenai pencarian dokumen teks, antara lain dilakukan oleh

Harjanto (2012) dari Universitas Diponegoro yang berjudul "Sistem Temu

Kembali Informasi pada Dokumen Teks Menggunakan Metode Term

Frequency Inverse Document Frequency (TF-IDF)." hasil penelitiannya

menyatakan bahwa metode pembobotan dokumen TF-IDF dapat me-retrieve

dokumen sesuai dengan query pengguna. Hasil recall rata-rata dari 20

dokumen dan 5 query memberikan nilai 97,2%. Penelitian serupa dilakukan

oleh Fitri (2013) dari Universitas Tanjungpura dalam penelitiannya yang

berudul “Perancangan Sistem Temu Balik Informasi Dengan Metode

(41)

Indonesia”, menyatakan bahwa dengan kombinasi TF-IDF dapat menyajikan

data relevan pada pencariannya. Nilai presisi dan recall menunjukan dari hasil

pengujuan yang dilakukan pada 5 kata kunci menghasilkan nilai recall 1 yang

menunjukan bahwa semua dokumen yang relevan dapat ditemu-kembalikan

oleh sistem, dan nilai precision antara 0.1316 dan 1 yang menunjukan terdapat

dokumen lain selain dokumen relevan yang ditemu-kembalikan oleh sistem.

Pada kedua penelitian diatas membahas sistem-temu kembali dengan

metode pembobotan TF-IDF. Pembobotan dilakukan dengan menghitung

bobot tiap term yang ada pada query dengan dokumen yang ada. Query yang

digunakan diambil dari satu field atau dengan satu model query. Penelitian

lain yang membahas sistem-temu kembali dengan mempergunakan lebih dari

satu field atau lebih dengan satu model antara lain dilakukan oleh Saptari

(2006) dari Universitas Gajah Mada dengan penelitiannya yang berjudul

“Temu Kembali Informasi Bibliografi Dengan Bahasaalami Pada field Judul

dan Sufjek (Studi Efektivitas Katalog Induk Terpasang Perpustakaan UGM)”.

Dalam penelitiannya dibahas sistem temu kembali dengan penggunaan lebih

dari satu field atau lebih dari satu model query. Dari penggunaan lebih dari

satu model query tersebut dilakukan pembandingan. Hasil penelitian tersebut

didapatkan nilai efektifitas 66.66% dengan penggunaan query dari field judul

dan nilai efektifitas 58.3% dengan penggunaan query dari field subjek.

Penelitian serupa dilakukan oleh Kusumawardani (2013) dari

Universitas Airlangga dengan judul penelitiannya “Temu Kembali Informasi

(42)

dengan controlled vocabulary pada field judul, subyek, dan pengarang di

Perpustakaan Universitas Airlangga)”. Pada penelitian tersebut dibahas sistem

temu kembali dengan 3 field atau model query yang masing-masing dari field

tersebut dibandingkan hasilnya. Dari hasil pengujian terhadap 100 judul

dokumen didapatkan sebanyak 98 dokumen berhasil ter-retrive dengan

penggunaan query judul. Pengujian yang sama dilakukan terhadap 119 nama

pengarang dari dokumen didapatkan sebanyak 100 dokumen berhasil

ter-retrive dengan query yang diambil dari field pengarang. Sedangkan pengujian

dengan dengan query yang diambil dari subjek didapatkan hanya sebesar 19

(43)

2.3 Kerangka Berfikir

(44)

29

METODE PENELITIAN

3.1 Metodologi Pengembangan Perangkat Lunak

Metode pengembangan perangkat lunak yang digunakan yaitu linier

sequential model atau yang biasa disebut dengan waterfall model. Linier sequential model merupakan metode pengembangan perangkat lunak yang diawali dari proses analisis, kemudian desain, koding dan testing (Fowler, 2005).

Berikut merupakan ilustrasi dari proses tersebut.

Gambar 3.1 Tahapan model sekuensial linier (Fowler, 2005)

Menurut Pressman (2002) Sequential linier model atau metode waterfall

merupakan sebuah pendekatan perangkat lunak yang dimulai pada proses analisis

perangkat lunak, dilanjutkan desain perangkat lunak kemudian kode/ pembuatan

perangkat lunak dan diakhiri dengan pengujian perangkat lunak.

Kelebihan dan kekurangan model Waterfall adalah, beberapa prinsip utama

yaitu project dibagi-bagi dalam beberapa fase yang saling berurutan, penekanan

(45)

keseluruhan sistem sekaligus, sekaligus kontrol yang ketat dalam siklus

hidup project dengan menggunakan bantuan dokumentasi tertulis. Kelebihan dari

metode waterfall mempunyai kemudahan untuk dimengerti, mudah digunakan,

requirement dari sistem bersifat stabil, baik dalam manajemen kontrol, serta

bekerja dengan baik ketika kualitas lebih diutamakan dibandingkan dengan

biaya dan jadwal atau deadline.

3.1.1 Analisis Kebutuhan Sistem

Analisis kebutuhan adalah tugas rekayasa perangkat lunak yang

menjembatani jurang antara alokasi perangkat lunak tingkat sistem dan

perancangan perangkat lunak. Analisis kebutuhan sistem akan memberikan

model-model yang akan diterjemahkan kedalam data, arsitektur, interface,

dan desain prosedural kepada perancang perangkat lunak (Pressman,

2002).

Gambar 2.2 Analisis dan kesenjangan antara rekayasa sistem dan desain perangkat lunak

(46)

3.1.2 Desain

Pada tahap ini alur dari sistem dibuat. Alur tersebut adalah skenario

bagaimana sistem itu berjalan, Selain itu pada tahap ini dilakukan

perancangan terhadap tampilan antar-muka atau interface dari sister yang

akan dibuat. Pada penelitian ini kedua tahap tersebut akan mengacu pada

sistem Suara Warga UNNES yang sudah berjalan, pada perancangan hanya

ditambahkan alur bagaimana proses sistem FAQ berjalan dan pada bagian

antar-muka ditambahkan halaman ditampilkannya hasil FAQ pada sistem

yang dijadikan simulasi Suara Warga UNNES yang akan dibuat.

3.1.3 Pengkodean

Setelah tahap analisis dan desain selanjutnya adalah tahap

pengkodean atau koding. Pada tahap ini mengimplementasikan apa yang

sudah dianalisis dan dirancang kedalam bahasa pemrograman website

seperti PHP, HTML, CSS dan lain-lain sehingga semua fungsi dapat

dijalankan dengan baik oleh pengguna. Proses pengkodean dalam penelitian

ini menggunakan framework PHP yaitu Codeigniter.

3.1.4 Pengujian

Pengujian adalah sebuah proses terhadap aplikasi atau program

untuk menemukan segala kesalahan dan segala kemungkinan yang akan

menimbulkan kesalahan sesuai spesifikasi perangkat lunak yang telah

(47)

yang diuji adalah efektifitas penggunaan model query terhadap sistem pencarian atau sistem temu-kembali di Sistem FAQ.

Untuk mengevaluasi kinerja sebuah sistem pencarian atau sistem

temu kembali dibutuhkan sebuah metode yang dapat mengukur

keefektifan dan keakuratan sebuah algoritma dari sebuah sistem temu

kembali. Recall dan Precision adalah langkah dasar yang digunakan dalam

mengevaluasi model pencarian (Hardi, 2006).

Recall adalah rasio dari jumlah dokumen relevan yang berhasil diambil atau ditemukembalikan dari seluruh dokumen relevan yang ada

pada sistem (Nadirman , 2006). Berikut persamaan dari Recall :

Dari formula diatas diketahui bahwa jumlah data relevan

yang ter-retrive adalah jumlah data yang berhasil ditemu-kembalikan oleh

sistem dan relevan dengan query pencarian, sedangkan jumlah

keseluruhan data relevan adalah jumlah keseluruhan data yang relevan

yang ada didalam sistem. Hasil recall adalah hasil pembagian dari kedua

variabel tersebut.

Precission adalah rasio dokumen relevan yang rasio dari jumlah dokumen relevan yang berhasil diambil atau ditemukembalikan dari

seluruh dokumen yang berhasil diambil atau ditemukembalikan

(48)

Dari formula diatas diketahui bahwa jumlah data relevan yang

ter-retrive adalah jumlah data yang berhasil ditemu-kembalikan oleh sistem

dan relevan dengan query pencarian, sedangkan jumlah keseluruhan data

yang teretrive adalah jumlah keseluruhan data berhasil ditemu-kembalikan

oleh sistem baik data relevan maupun data yang tidakv relevan. Hasil

precision adalah hasil pembagian dari kedua variabel tersebut.

F-measure merupakan nilai hubungan yang mengkombinasikan

antara hasil perhitungan recall dan precision yang mempresentasikan

akurasi sistem (Zhang , 2009) . Persamaan F-measure seperti berikut :

3.2 Metode Pengumpulan Data

Metode pengumpulan data yang diterapkan dalam memperoleh data yang

dibutuhkan yaitu observasi. Observasi atau pengamatan dilakukan pada Suara

Warga UNNES yang diakses pada Sistem Akademik Terpadu (SIKADU) melalui

http://akademik.unnes.ac.id. Berdasarkan pengamatan yang dilakukan di Suara

Warga UNNES diperoleh bahwasannya, masih terjadi banyak perulangan

pertanyaan yang sama yang telah diajukan, walaupun pertanyaan dengan topik

yang sama sudah pernah ditanggapi sebelumnya oleh pengguna lain. Tidak

(49)

secara langsung pertanyaan tanpa mengecek terlebih dahulu apakah pertanyaan

tersebut sudah pernah diajukan.

3.3 Data Penelitian

Data penelitian diperoleh dengan menggunakan 25 data unggahan pengguna

Suara Warga UNNES yang diambil secara acak dan dikelompokan menjadi 5

topik bahasan, sehingga setiap topik bahasan memiliki 5 data unggahan pengguna

dari Suara Warga UNNES. Data tersebut dimasukan pada database simulasi

sistem FAQ Suara Warga UNNES yang telah dibuat.

Data dari Suara Warga UNNES memiliki 2 field inputan yaitu judul dan isi.

Karakteristik dari data tersebut adalah singkat dan pada kasus tertentu banyak

terjadi kesalahan pengetikan. Selain itu struktur kalimat pada sebagian besar data

mempergunakan salam pembuka sehingga pada tahap preprocessing dilakukan

penghilangan stopword.

Sebagai data penguji dilakukan pengambilan data dari 9 responden yang

terdiri dari mahasiswa Universitas Negeri Semarang secara acak yang

masing-masing responden mengisi form simulasi Suara Warga UNNES sesuai skenario

yang telah dibuat. Skenario tersebut mewakili permasalahan yang ada pada data 5

topik bahasan yang sebelumnya telah diambil dari sistem Suara Warga UNNES.

Dari 9 responden dan 5 topik bahasan diperoleh 45 data yang digunakan sebagai

(50)

71

BAB V

PENUTUP

5.1 Simpulan

Sistem FAQ di Suara Warga UNNES sudah diimplementasikan

dan dilakukan uji coba untuk selanjutnya dilakukan optimasi. Optimasi

model query dilakukan dengan pengujian beberapa model query untuk

mengetahui model query apa yang terbaik untuk sistem FAQ di Suara

Warga Universitas Negeri Semarang .

Hasil pengujian dari sebanyak 25 data Suara Warga dan 45 data

pengujian dari 9 responden didapatkan nilai F-measure yang mewakili

kinerja dari ketiga model query tersebut yaitu uji coba 1 dengan model

query data isi sebesar 0.56, uji coba 2 dengan model query data isi dengan

feature selection sebesar 0.70, dan uji coba 3 dengan model query data

judul sebesar 0.82. Dari hasil pengujian tersebut didapatkan model query

dari data judul adalah model query yang memiliki nilai tertinggi pada kasus

(51)

Saran untuk penelitian optimasi model query untuk sistem FAQ

adalah menambahkan feature selection pada semua model query sehingga

dapat menangani term-term yang dianggap mengganggu dari proses

pencarian. Disarankan juga untuk menambahkan motode untuk mengatasi

persamaan makna pada masing-masing term yang dipakai pada sehingga

(52)

73

DAFTAR PUSTAKA

Fachrurrazi, S. 2013. “Penerapan Algoritma Genetika Dalam Optimasi

Pendistribusian Pupuk Di PT Pupuk Iskandar Muda Aceh Utara” . Aceh :

Universitas Malikussaleh Reuleut.

Faq.Org. 1997. “FAQs about FAQs”. http://www.faqs.org/faqs/faqs/about-faqs/.

(24 Juni 2015).

Fitri, Meisya. 2013. Perancangan Sistem Temu Balik Informasi Dengan Metode Pembobotan Kombinasi Tf-Idf Untuk Pencarian Dokumen Berbahasa Indonesia. Universitas Tanjungpura : Semarang

Fowler, Martin. 2004. “UML distilled: a brief guide to the standard object

modeling language”. Addison-Wesley Professional,.

Goker, Ayse, and John Davies, eds. 2009. “Information retrieval: Searching in the

21st century”. John Wiley & Sons,.

Harjanto, dkk. 2012. Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF).. Universitas Diponegoro : Semarang

Hasugian, Jonner. "Penelusuran informasi ilmiah secara online: perlakuan terhadap seorang pencari informasi sebagai real user." Pustaha 2.1 (2006): 1-13.

Hannawati, Anies. Thiang, Eleaza.r. 2002.“Pencarian Rute Optimum

Menggunakan Algoritma Genetika”. Universitas Kristen Petra :

Surabaya.

Hardi, Wisnu . 2006 . “Mengukur Kinerja Search Engine: Sebuah Eksperimentasi

Penilaian Precision And Recall Untuk Informasi Ilmiah Bidang Ilmu

Perpustakaan Dan Informasi”. UNSYIAH : ACEH.

Joho, H. and Sanderson, M. 2007 . “Document frequency and term specificity “.

In:Proceedings of the Recherche d'Information Assistée par Ordinateur

Conference (RIAO). RIAO 2007 - 8th Conference, 30th May - 1st June

2007, Pittsburgh, PA

Manning, Christopher D., Prabhakar Raghavan, and Hinrich Schütze. 2008.

“Introduction to information retrieval. Vol. 1”. Cambridge: Cambridge

(53)

Muhammad Dwiky, Khalifardhi. 2012. “Sistem Informasi Evaluasi Nilai Hasil Belajar Siswa Menggunakan Visual Basic 6.0 dan Microsoft Access di

Sma Negeri 1 Gamping”. Yogyakarta: Universitas Negeri Yogyakarta.

Nadirman, Firnas . 2006 . “Sistem Temu-Kembali Informasi Dengan Metode

Vector Space Model Pada Pencarian File Dokumen Berbasis Teks

“.Yogjakarta: UGM.

Ogilvie, P., & Callan, J. 2003. “Language models and structured document

retrieval”. Fuhr et al.[126], 18-23.

Ounis , Iadh . 2009. “Inverse Document Frequency”. Springer US : Springer US.

Sanderson, Mark, and W. Bruce Croft. "The history of information retrieval research." Proceedings of the IEEE 100.Special Centennial Issue (2012): 1444-1451.

Rajaraman, A., & Ullman, J. D. 2012. “Mining of massive datasets (Vol. 77)”. Cambridge: Cambridge University Press.

Robertson, S., 2004. “Understanding Inverse Document Frequency: On theoretical

arguments for IDF”, Journal of Documentation, Vol.60, no.5, pp. 503

-520

Pressman, R. S. (2002). “Rekayasa Perangkat Lunak Pendekatan Praktisi (buku

satu)”. Yogyakarta : Andi Yogyakarta.

Saptari, Janu. 2006. “Temu Kembali Informasi Bibliografi Dengan Bahasaalami

Padafield Judul Dan Sufjek (Studi Efektivitas Katalog Induk Terpasang

Perpustakaan Ugm)”. Universitas Gajah Mada : Yogyakarta

Supriyanto, C., & Affandy, A. A. (2011).”Kombinasi Teknik Chi Square Dan

Singular Value Decomposition Untuk Reduksi Fitur Pada

Pengelompokan Dokumen”. Semantik, 1(2011).