BAB IV ANALISA DAN PENERAPAN
ANALISA DAN PERANCANGAN
4.3.3 Perancangan dan pembuatan sistem indexing dan searching dengan fuzzy relation
4.3.3.3 Kombinasi kata dan perhitungan jumlah ditemukannya kata (number of occurance)
Isi kata dokumen 1
Jurusan teknik informatika dan elektro mempunyai kesamaan visi dan atau misi
Stop Word Dan Atau
tabel p_indexing
kata dokumen kata_kanan posisi
Jurusan 1 teknik 0 teknik 1 informatika 1
informatika 1 elektro 2 Elektro 1 mempunyai 3 mempunyai 1 kesamaan 4 kesamaan 1 visi 5
Visi 1 misi 6
Misi 1 7
Gambar 4-6 proses pemasukan data pada tabel p_indexing
71 Kombinasi kata dilakukan bila kata bukan merupakan sebuah kesatuan (word bukan phrase).
Contoh keyword D5 yang berisi kata pengenalan suara akan mempunyai kombinasi : pengenalan
pengenalan suara suara
Namun bila kata inputan adalah “pengenalan suara” (sebuah phrase) maka kombinasinya hanya ada satu yaitu pengenalan suara.
Perhitungan jumlah keluaran kata (number of word occurance) adalah proses pencarian jumlah ditemukannya kombinasi kata pada dokumen. Hasil dari langkah ini akan menjadi acuan dalam pemberian nilai fuzzy.
Contoh : inputan pengenalan suara
Dibawah ini akan diuraikan menghitung jumlah kata pada paper 3 : Perhitungan jumlah ditemukannya kata pada paper 3
Jml_keluar = …a) 54 * 1/2 = 27 …b) 6 * 2/2 = 6
…c) 13 * 1/2 = 6.5
39.5
Sesuai kesepakatan bahwa dokumen dikatakan mendapat nilai 1 (tertinggi) bila kata atau kombinasi kata yang ada pada sebuah dokumen berjumlah sama dengan atau lebih dari (<=) 20 yang dijelaskan pada rumus 3.1 subbab 4.3.3.4 maka nilai fuzzy dokumen adalah 1 terhadap kata pencarian pengenalan suara (word bukan phrase).
+
72 Perlu dijelaskan bahwa nilai 20 yang dikatakan merupakan sebuah kesepakatan adalah nilai yang bersifat subjektif dan sama sekali tidak melalui perhitungan ilmiah. Nilai 20 dipilih oleh penulis karena jumlah occurance sebanyak 20 kali dalam sebuah dokumen menurut penulis (subjektif) dapat dijadikan sebuah acuan bahwa dokumen mengacu pada keyword yang dicari. Perhitungan lebih lanjut mengenai nilai ini dijelaskan pada subbab 4.3.3.4.
4.3.3.4 Perhitungan nilai batas fuzzy (α - cut)
Perhitungan fuzzy perlu sebuah penanda / batas yang menyatakan bahwa hingga jumlah tertentu maka sebuah objek dikatakan mempunyai nilai fuzzy sebesar 1 (paling tinggi). Untuk menentukan nilai batas tersebut tugas akhir ini memberi sebuah batasan bahwa jika sebuah kata muncul lebih atau sama dengan 20 kali pada sebuah paper maka nilai kata terhadap paper tersebut adalah satu. Namun bila kurang maka nilai dari kata terhadap paper tersebut adalah n / 20. dimana n adalah jumlah kata yang ditemukan pada paper. Nilai sebesar 20 ini merupakan sebuah nilai yang sepenuhnya subjektif dari penulis tidak ada sebuah penelitian yang dilakukan untuk mendapatkan nilai tersebut.
Secara matematis perhitungan dirumuskan sebagai berikut : nilai_keyword_terhadap_paper = min
n : jumlah kata ditemukan pada suatu paper (number of occurance).
Dari data yang telah didapat pada subbab 4.3.3.3, dimana inputan adalah pengenalan suara, maka nilai keyword terhadap paper 3 adalah min
73 4.3.3.5 Relasi Fuzzy
Proses perhitungan ini dilakukan dengan melakukan pencarian terhadap semua nilai yang ada pada library, untuk mendapatkan nilai fuzzy keyword to paper terhadap dokumen yang baru saja di-index ini. Kemudian proses perhitungan dilakukan dengan melakukan perhitungan relasi fuzzy yang lain. Selengkapnya mengenai metode perhitungan telah dijelaskan pada subbab 4.2.4 dengan rumus 2.1, 2.2 dan 2.3
4.3.3.6 Ranking Fuzzy
Sistem rangking sangat dibutuhkan untuk keperluan menampilkan hasil pada search engine. Satu hal yang menjadi kendala adalah bila ada dua buah hasil yang memiliki nilai yang persis sama namun harus ditampilkan dengan urutan yang mau tidak mau harus ada yang lebih tinggi. dengan menggunakan nilai yang didapatkan dari perhitungan fuzzy keyword to paper. Selengkapnya mengenai rangking fuzzy telah dijelaskan pada subbab 4.2.6.
4.3.3.7 Keyword attach to paper
Perhitungan keyword attach to paper digunakan untuk memberikan nilai 1 (tertinggi) terhadap dokumen yang mempunyai keyword sama dengan kata pencarian.
Kebijakan ini diberikan karena bagaimanapun juga hasil karya dan relasi ilmu sebuah dokumen hanya diketahui oleh penulis. Sehingga walau sebuah kata hanya muncul satu kali pada sebuah dokumen namun kata tersebut adalah keyword attach to paper maka otomatis nilai dokumen itu menjadi 1 terhadap kata pencarian.
4.3.3.8 Extended fuzzy
74 Perhitungan fuzzy extended dimaksudkan untuk memunculkan hasil pencarian dimana hasil pencarian tersebut tidak memiliki kata pencarian namun memiliki kata lain yang berhubungan dengna kata pencarian. Kejadian seperti ini sama dengan proses mencari kata “tiger” namun hasil pencarian juga memunculkan kata “apple” (subbab 2.2).
Contoh :
Kata pencarian adalah K4 dan K4 mempunyai hubungan dengan kata yang lain.
Hubungannya dijabarkan sebagai berikut : K4={ 0.16/K1,1/K3,1/K4 }
Maka pencarian juga akan melibatkan kedua keyword diatas sehingga pencarian akan mencari K1,K3,K4.
Kemudian dari hasil pencarian masing – masing keyword akan didapatkan 3 hasil fuzzy set yang masing – masing mempunyai nilai sendiri – sendiri.
Mis : P1=(1/K1)
P2=(0.025/K1, 0.525/K3, 0.15/K4) P3=(1/K3)
P4=(0.025/K1, 0.025/K3) P6=(0.125/K3)
Hubungan antara ketiga fuzzy sets diatas akan di bentuk dengan mengalikan nilai (Dot Product) relasi keyword dengan nilai element pada hasil , berikut adalah bentuk perhitungannya :
75
K1 dengan P1 0.16 * 1 = 0.16
K1 dengan P2 0.16 * 0.025 = 0.004
K1 dengan P4 0.16 * 0.025 = 0.004
K3 dengan P2 1 * 0.525 = 0.525
K3 dengan P3 1 * 1 = 1
K3 dengan P4 1 * 0.025 = 0.025
K3 dengan P6 1 * 0.125 = 0.125
K4 dengan P2 1 * 0.15 = 0.15
Secara umum maka hasil pencarian dapat juga dituliskan menjadi sebagai berikut:
{0.16/P1, 0.004/P2, 0.004/P4, 0.525/P2, 1/P3, 0.025/P4, 0.125/P6, 0.15/P2 }
bila terdapat kesamaan hasil (mis P2 mempunyai nilai 0.00125, 0.084 dan 0.15) maka nilai tertinggi yang akan diambil, bila terjadi kesamaan nilai maka diambil salah satu, Sehingga hasil pencarian adalah
{0.16/P1, 0.525/P2, 0.025/P4, 1/P3, 0.125/P6 }.
Jika dicari dengan cara biasa (ordinary) maka hasil pencarian adalah {0.525/P2}
Nilai fuzzy K4 terhadap P2 bernilai 1 karena K4 merupakan keyword attach to paper, sehingga hasil pencarian dengan extended fuzzy adalah {0.16/P1, 1/P2, 0.025/P4, 1/P3, 0.125/P6}, sedangkan hasil pencarian dengan cara biasa (ordinary) adalah {1/P2}.
76 4.3.3.9 Flowchart
a. Proses Indexing
Start
Ambil / daftar file pdf yang belum di-index
Ambil dan masukkan daftar keyword to paper untuk file / dokumen (paper) yang akan
di-index
Baca file teks dan hapus semua new line dan tanda
baca
Isi file terletak / berbentuk satu baris string panjang
Stop word Baca kata per kata
Deteksi kata kanan
Stop word Simpan ke database
selesai tidak
tidak Ya Ya
Hitung Relasi Fuzzy dengan semua nilai yang
ada pada library
Gambar 4-7 flowchart proses indexing
77 b. Proses Searching
Start
Gambar 4-8 flowchart proses searching
78 4.4 Perancangan Antarmuka (Interface)
4.4.1 Desain Halaman Home
Halaman home ditunjukkan pada gambar 4-9 dibawah ini
4.4.2
4.4.2 Desain Halaman Login
Halaman login ditunjukkan pada gambar 4-10 dibawah ini
Logo
Home SAMBUTAN
Isi UNIVERSITAS ISLAM NEGERI
Teknik Informatika Syarif Hidayatullah Jakarta Anton Umar @2011
Admin Search Engine About Us
Gambar 4-9 Desain halaman Home
Home Administrator Page
Aplikasi Search Engine Pusat Penelitian
Universias Islam Negeri Jakarta Jakarta Selatan
Login Password
UNIVERSITAS ISLAM NEGERI
Teknik Informatika Syarif Hidayatullah Jakarta Anton Umar @2011
Universitas Budi Luhur @ 2007
Admin
Search Engine
About Us
Gambar 4-10 Desain halaman Login Admin
Logo
79 4.4.3 Desain Halaman Admin
Halaman admin ditunjukkan pada gambar 4-11 dibawah ini
Logout Setting Hasil Tampilan dan Keakuratan Fuzzy
Jumlah Tampilan hasil pencarian halaman (default) : Tingkat keakuratan fuzzy (0.0 – 1.0) :
Batal Set Nilai
Stop Word Stop Word :
Dok Upload
Add Stop Word
Title : Author : Keyword1 : Keyword2 : Jurusan : Volume : Nomor : Dokumen :
Browse Antri Dokumen Index Sekarang Juga
Sync Data
Sinkronisasi
Data Hard Drive dengan Database Synchronize Data Search
Engine Karya Ilmiah
Home Admin Search Engine About Us
Copyright 2011 Anton Umar 101091123315
Gambar 4-11 Desain Halaman Admin
80 4.4.4 Desain Halaman Search
Halaman search ditunjukkan pada gambar 4-12 dibawah ini
4.4.5 Desain Halaman About us
Halaman profile penulis ditunjukkan pada gambar 4-13 dibawah ini
PAPER SEARCH ENGINE
| Home | Admin | About Us |
PCU RESEARCH CENTER
search Search it
Result For Searched in Document(s) Second(s)
Related Work Found in Document(s)
Hasil Pencarian Gambar
Logo
Home ABOUT US
Isi
UNIVERSITAS ISLAM NEGERI
Teknik Informatika Syarif Hidayatullah Jakarta Anton Umar @2011
Admin Search Engine About Us
81 4.5 State Transition Diagram
Di bawah ini merupakan penggambaran State Transition Diagram dari rancangan interface search engine.
4.5.1 State Transition Diagram Home
4.5.2 State Transition Diagram Admin
4.5.3 State Transition Diagram Searching
4.5.4 State Transition Diagram About Us