APLIKASI SEARCH ENGINE PAPER/KARYA ILMIAH BERBASIS WEB MENGGUNAKAN METODE FUZZY RELATION
Teks penuh
(2) APLIKASI SEARCH ENGINE PAPER/KARYA ILMIAH BERBASIS WEB MENGGUNAKAN METODE FUZZY RELATION. Oleh : Anton Umar Sudarmo 101091023315. Skripsi Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer Pada Fakultas Sains Dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta. PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2013 M / 1434 H.
(3)
(4)
(5) PERNYATAAN. DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENARBENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.. Jakarta, Agustus 2013. Anton Umar 101091023315. v.
(6) ABSTRAKSI Anton Umar Sudarmo. Aplikasi Search Engine Paper/Karya Ilmiah Berbasis Web Menggunakan Metode Fuzzy Relation. (Dibawah bimbingan Bapak Victor Amrizal, ST, M.Kom dan Ibu Fitri Mintarsih, M.Kom) Banyaknya jumlah paper yang dikoleksi sebuah lembaga pendidikan setiap tahun akan bertambah. Seiring dengan pertambahan jumlah paper tersebut maka diperlukan sebuah metode untuk mencari paper agar bila membutuhkan referensi maka paper yang diperlukan dapat dengan mudah ditemukan, Sejauh yang ada saat ini, kebanyakan mesin pencari masih mengandalkan pencarian dengan menggunakan keyword matching/string matching sehingga mengakibatkan hasil pencarian hanya akan menampilkan paper-paper yang mempunyai keyword/kata kunci yang dicari. Penelitan ini membahas sebuah sistem pencarian dengan menggunakan metode fuzzy relation, dimana dengan fuzzy relation didapatkan hubungan antara keyword dan paper. Dengan metode fuzzy relation maka sebuah pencarian mempunyai kemungkinan menampilkan hasil berupa paper yang tidak mengandung keyword yang dicari. Karena kata yang mengakibatkan paper (yang tidak mengandung keyword muncul) mempunyai hubungan dengan keyword yang dimasukkan. Hasil pencarian juga akan menghasilkan ranking fuzzy untuk mengurutkan/memberikan ranking pada dua paper atau lebih yang mempunyai nilai fuzzy yang sama. Dengan adanya ranking fuzzy maka bila terjadi kesamaan nilai, pengurutan/ranking akan melihat hubungan antara keyword dan paper. Paper yang di anggap lebih berhubungan atau mempunyai hubungan lebih spesifik akan di tampilkan terlebih dahulu. Kata kunci : fuzzy relation, search engine. vi.
(7) KATA PENGANTAR. Puji, ruku’ dan sujud kepada Allah yang Maha Besar. Karena atas berkat, rahmat dan izin-Nya skripsi ini dapat diselesaikan dengan baik. Shalawat serta salam kepada Muhammad bin Abdullah, beserta para keluarga, sahabat serta para pengikutnya hingga akhir zaman. Alhamdulillahi rabbil ‘alaimin penulis dapat menyelesaikan skripsi ini sebagai salah satu tugas wajib mahasiswa sebagai persyaratan untuk mengambil gelar Strata 1 (S1) pada Program Studi Teknik Informatika Universitas Islam Negeri Syarif Hidayatullah Jakarta. Penulis mengucapkan terima kasih kepada pihak-pihak yang memberikan bimbingan, bantuan dan dukungan selama penyusunan dan pembuatan skripsi ini berlangsung. Secara khusus saya ucapkan terima kasih kepada: 1.. Allah the Almighty, Lord of the universe, the Creator, the Sustainer, and He is the one who has power over all .. 2.. Nabi Muhammad (Peace be upon him / SAW), His messenger, Our Prophet, the Perfect Man ever.. 3.. Bapak Dr. Syopiansyah Jaya Putra, M.Sis, Selaku Dekan Fakultas Sains dan Teknologi. 4.. Yusuf Durrachman, MIT, selaku Ketua Program Studi Teknik Informatika. 5.. Bapak Victor Amrizal, ST, M.Kom, selaku dosen pembimbing I dan bersama-sama dengan. Ibu. Fitri Mintarsih, M.Kom. selaku dosen. pembimbing II yang telah memberikan bimbingan dan saran-saran dalam penyusunan skripsi penulis.. vii.
(8) 6.. Kedua Orang Tua Tercinta Bapak Darmo dan Ibu Umayah yang sangat penulis cintai dan sayangi serta Adikku Andrian Muhammad Shodik, S.Kom. 7.. Seluruh dosen program studi Teknik Informatika yang tidak dapat penulis sebutkan namanya satu-satunya yang telah memberikan ilmu kepada penulis dalam proses perkuliahan.. 8.. Teman-teman TI angkatan 2001 khususnya kelas B yang tak bisa penulis sebutkan satu persatu. Terima kasih telah banyak memberikan kenangan manis bagi penulis. Juga pada kesempatan ini penulis ingin memohon maaf yang sebesar-. besarnya kepada semua pihak yang ketika skripsi ini diproses ada hal-hal yang kurang berkenan. Pengalaman adalah guru yang paling bijak, sebagaimana kesalahan adalah awal dari kesempurnaan, diiringi keteguhan, keyakinan dan ketabahan untuk terus memperjuangkan apa yang kita impikan. Itulah gambaran keseluruhan dari apa yang penulis dapatkan dalam penyusunan skripsi ini. Skripsi yang jauh dari sempurna ini telah memberikan begitu banyak manfaat dan hikmah yang bisa saya petik. Dan hal itu juga yang penulis harapkan akan diperoleh dari siapapun yang membacanya. Amin. Wallahu almuwaffiq ila aqwam atthariq. Jakarta, Agustus 2013. Penulis. viii.
(9) DAFTAR ISI Halaman Halaman Sampul ............................................................................................. i. Halaman Judul………………………………………………………………. ii. Halaman Persetujuan Pembimbing………………………………………….. iii. Halaman Pengesahan………………………………………………………... iv Halaman Pernyataan……………………………………………………….... v. Abtraksi ........................................................................................................... vi. Kata Pengantar………………………………………………………………. vii. Daftar Isi.......................................................................................................... ix. Daftar Gambar ................................................................................................. xv. Daftar Tabel .................................................................................................... xvii. BAB I PENDAHULUAN .............................................................................. 1. 1.1. Latar Belakang................................................................................ 1. 1.2. Perumusan Masalah ........................................................................ 4. 1.3. Batasan Masalah ............................................................................. 4. 1.4. Tujuan dan Manfaat Penulisan ....................................................... 5. 1.4.1. Tujuan Penulisan……………………………………….. .... 5. 1.4.2. Manfaat Penulisan…………………………………… ........ 5. 1.5. Metodologi Penelitian .................................................................... 6. 1. Studi Pustaka .............................................................................. 6. 2. Metode Pengembangan Sistem .................................................. 6. 1.6. Sistematika Penulisan ..................................................................... 7. ix.
(10) BAB II LANDASAN TEORI ....................................................................... 9. 2.1. Search Engine ................................................................................. 9. 2.2. Fuzzy Relation ................................................................................ 9. 2.3. Database.......................................................................................... 15. 2.4. MYSQL .......................................................................................... 16. 2.5. Entity Relationship Diagram (ERD)............................................... 18. 2.6. Diagram Alir (Flowchart) ............................................................... 20. 2.7. HTML ............................................................................................. 21. 2.7.1. Bagian halaman HTML........................................................ 24. 2.7.2. Bagian Versi ......................................................................... 24. 2.7.3. Bagian Head ......................................................................... 25. 2.7.4. Bagian Body ......................................................................... 25. 2.8. Apache Web Server ........................................................................ 30. 2.9. PHP ................................................................................................. 31. 2.10. Tools Pdftohtml .............................................................................. 32. 2.11. Tools Pdftotext ............................................................................... 33. 2.12. STD (State Transition Diagram) .................................................... 34. a. Keadaan Sistem .......................................................................... 34. b. Perubahan Sistem ....................................................................... 35. c. Kondisi dan Aksi ........................................................................ 35. 2.13. Studi Literatur Sejenis……………………………………………. 36. x.
(11) BAB III METODE PENELITIAN ............................................................. 3.1.. 3.2.. 37. Metodologi Penelitian ................................................................... 37. 3.1.1. Teknik Pengumpulan Data ............................................... 37. 3.1.2. Model-Model Metode Pengembangan Sistem ................. 38. Pemilihan Metodologi ................................................................... 38. 3.2.1. Metode Pengumpulan Data .............................................. 38. 3.2.1.1. Metode Interview ............................................. 38. 3.2.1.2. Studi Pustaka.................................................... 38. 3.2.2. Metode Pengembangan Sistem ........................................ 39. BAB IV ANALISA DAN PERANCANGAN .............................................. 43. 4.1.. 4.2.. Identifikasi..................................................................................... 43. 4.1.1. Sistem yang berjalan ......................................................... 43. 4.1.1.1. Metode............................................................. 43. 4.1.1.2. Cara Kerja ....................................................... 43. 4.1.2. Identifikasi Masalah .......................................................... 45. 4.1.3. Analisa Kebutuhan ............................................................ 46. 4.1.4. Pemecahan Masalah .......................................................... 46. Analisa........................................................................................... 47. 4.2.1. Koleksi Masukan............................................................... 51. 4.2.2. Prosedur Pembentukan Sistem Search Engine .................. 51. 4.2.3. Indexing............................................................................. 51. 4.2.3.1. Parsing Dokumen ............................................... 51. 4.2.3.2. Stop Word .......................................................... 52. xi.
(12) 4.3.. 4.2.4. Relasi Fuzzy ...................................................................... 53. 4.2.5. Searching ........................................................................... 59. 4.2.6. Rangking Fuzzy ................................................................ 60. Desain ............................................................................................ 61. 4.3.1. Perancangan Sistem dengan ERD ..................................... 61. 4.3.2. Pembuatan Physycal Database serta Hubungannya dengan Sistem Indexing dan Searching ............................ 62. 4.3.3. Perancangan dan Pembuatan Sistem Indexing dan Searching dengan Fuzzy Relation ..................................... 68. 4.3.3.1. Proses Penyimpanan kata pada ......................... 68. 4.3.3.2. Proses Indexing dan stop word........................... 70. 4.3.3.3. Kombinasi Kata dan Perhitungan Jumlah. 4.4.. Ditemukannya Kata ............................................ 70. 4.3.3.4. Perhitungan Nilai Batas Fuzzy ........................... 72. 4.3.3.5. Relasi Fuzzy ....................................................... 73. 4.3.3.6. Rangking Fuzzy ................................................. 73. 4.3.3.7. Keyword Attach to Paper ................................... 73. 4.3.3.8. Extended Fuzzy................................................... 73. 4.3.3.9. Flowchart ........................................................... 76. a. Proses Indexing .............................................. 76. b. Proses Searching ............................................ 77. Perancangan Antarmuka ............................................................... 78. 4.4.1. Desain Halaman Home ..................................................... 78. xii.
(13) 4.4.2. Desain Halaman Login ...................................................... 78. 4.4.3. Desain Halaman Admin .................................................... 79. 4.4.4. Desain Halaman Search .................................................... 80. 4.4.5. Desain Halaman About Us ................................................ 80. State Transition Diagram .............................................................. 81. 4.5.1. State Transition Diagram Home........................................ 81. 4.5.2. State Transition Diagram Admin ...................................... 81. 4.5.3. State Transition Diagram Searching ................................. 81. 4.5.4. State Transition Diagram About Us .................................. 81. Implementasi dan Evaluasi ........................................................... 82. 4.6.1. Alur Kerja.......................................................................... 82. a. Pemasukan Data ............................................................ 82. b. Searching Data .............................................................. 82. 4.6.2. Sistem Login Pada Database ............................................. 83. 4.6.3. Daftar Function dan Kegunaan ......................................... 83. 4.7. Pencarian Kata Dengan Search Engine ......................................... 85. 4.8. Evaluasi Sistem ............................................................................. 85. 4.8.1. Testing Sistem ................................................................... 89. 4.8.1.1. Extended Fuzzy .................................................. 90. 4.8.1.2. Ranking Fuzzy bila terjadi kesamaan nilai ........ 92. 4.8.1.3. Pencarian dengan melibatkan stop word ............ 93. 4.8.1.4. Keyword attach to Paper .................................... 94. BAB V KESIMPULAN DAN SARAN ........................................................ 95. 4.5.. 4.6.. xiii.
(14) 5.1. Kesimpulan ..................................................................................... 95. 5.2. Saran ............................................................................................... 95. DAFTAR PUSTAKA .................................................................................... 97. LAMPIRAN ................................................................................................... 98. xiv.
(15) DAFTAR GAMBAR Gambar 2-1. Relasi One to One ..................................................................... 18. Gambar 2-2. Relasi One to Many ................................................................... 19. Gambar 2-3. Relasi Many to Many. ............................................................... 19. Gambar 2-4. Relasi one to many mandatory .................................................. 19. Gambar 2-5. Relasi one to many dependent ................................................... 20. Gambar 2-6. Simbol State ............................................................................. 52. Gambar 2-7. Simbol Perubahan Sistem.......................................................... 52. Gambar 2-8. Kondisi dan aksi ........................................................................ 53. Gambar 3-1. Model Sekuensial ...................................................................... 55. Gambar 4-1. Alur Crawler-Baaed Search Engine ......................................... 59. Gambar 4-2. Sistem Search Engine ................................................................ 62. Gambar 4-3. Detail Sistem Search Engine Dengan Metode Fuzzy Relation. 63. Gambar 4-4. Conceptual Data Model ............................................................ 77. Gambar 4-5. Gambar pembuatan tabel p_jndexing ........................................ 82. Gambar 4-6. Proses pemasukan data pada tabel p_indexing .......................... 85. Gambar 4-7. Flowchart proses indexing ......................................................... 91. Gambar 4-8. Flowchart proses searching ....................................................... 92. Gambar 4-9. Desain halaman home ............................................................... 93. Gambar 4-10 Desain halaman login ................................................................ 93. Gambar 4-11 Desain halaman admin .............................................................. 94. Gambar 4-12 Desain Halaman Search ............................................................ 95. Gambar 4-13 Desain Halaman About Us ........................................................ 95. xv.
(16) Gambar 4-14 Pencarian kata dengan search engine ........................................ 100. Gambar 4-15 Hasil Pencarian dengan extended fuzzy .................................... 106. Gambar 4-16 Hasil Pencarian dengan ranking fuzzy ...................................... 107. Gambar 4-17 Hasil Pencarian dengan melibatkan stop word ......................... 108. Gambar 4-18 Hasil Pencarian keyword attach to paper .................................. 109. xvi.
(17) DAFTAR TABEL Tabel 2.1 Hubungan paper terhadap paper .................................................. 12. Tabel 2.2 Hubungan keyword terhadap keyword ......................................... 14. Tabel 2.3 Contoh Tabel Mahasiswa ............................................................. 17. Tabel 2.4 Operasi Aritmatika……………………………………………… 41 Tabel 2.5 Operasi Assignment ..................................................................... . 41 Tabel 2.6 Operasi Perbandingan ................................................................. . 42 Tabel 2.7 Operasi Penggabungan kondisi ................................................... . 42 Tabel 2.8 Operasi Increment dan Decrement .............................................. . 42 Tabel 4.1 Hubungan Paper terhadap Paper .................................................. 71. Tabel 4.2 Hubungan Keyword terhadap Keyword....................................... 74. Tabel 4.3 Tabel m_document ....................................................................... 78. Tabel 4.4 Tabel m_kata ................................................................................ 78. Tabel 4.5 Tabel m_library ............................................................................ 78. Tabel 4.6 Tabel m_stop_word ...................................................................... 79. Tabel 4.7 Tabel m_keyword_attach_to_paper ............................................. 79. Tabel 4.8 Tabel p_indexmg.......................................................................... 79. Tabel 4.9 Tabel p_jml_kata_pd_document .................................................. 79. Tabel 4.10 Tabel p_keyword_to_paper.......................................................... 80. Tabel 4.11 Tabel p_paper_to_paper ............................................................... 80. Tabel 4.12 Tabel p_keyword_to_keyword .................................................... 80. Tabel 4.13 Tabel p_paper_to_keyword .......................................................... 80. Tabel 4.14 Tabel Published ............................................................................ 81. Tabel 4.15 Daftar function yang digunakan pada sistem indexing ................ 98. Tabel 4.16 Daftar function yang digunakan pada sistem searching .............. 99 xvii.
(18) Tabel 4.17 Tabel Kode Dokumen beserta isinya ........................................... 102. Tabel 4.18 Tabel Daftar Kode Kata ............................................................... 103. xviii.
(19) BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan ilmu pengetahuan pada Abad ke-21 Masehi sudah semakin pesat, terutama pada ilmu komputer. Ilmu komputer mempunyai pengaruh yang amat besar dalam berbagai bidang, misalnya di bidang pendidikan, bisnis, militer, periklanan dan lain sebagainya. Dengan memanfaatkan ilmu komputer maka pekerjaan yang rumit akan dapat diselesaikan dengan cepat. Contohnya saja pada sebuah supermarket, jika biaya belanja setiap pembeli dihitung secara manual maka akan membutuhkan waktu yang cukup lama, dengan adanya penerapan ilmu komputer maka hal tersebut dapat diselesaikan dalam waktu yang relatif singkat (http://manddha.blogspot.com/2010/10/manfaat-komputer-dalam-5-sektor.html). Dengan perkembangan ilmu komputer yang semakin pesat, internet muncul sebagai salah satu hasil dari ilmu komputer yang cukup membantu dalam mengolah informasi. Pada awalnya internet digunakan untuk komunikasi. secara. digital. dengan. menggunakan. komputer. untuk. kepentingan militer, namun seiring dengan perkembangan ilmu komputer dan kebutuhan masyarakat akan informasi maka internet pun berkembang dan dapat digunakan untuk kepentingan umum dalam memperoleh informasi secara luas. Untuk memudahkan masyarakat dalam mencari informasi di internet telah disediakan sebuah fasilitas pencari informasi atau sering disebut juga dengan search engine (http://id.wikipedia.org/wiki/Mesin_pencari).. 1.
(20) Di internet banyak sekali search engine yang dapat dimanfaatkan untuk mencari informasi. Namun tidak semua search engine memiliki kemampuan yang sama dalam proses serta penyajian informasi yang diperolehnya, masing-masing search engine memiliki kelebihan dan kekurangan.. Pada. umumnya. search. engine. melakukan. pencarian. berdasarkan pada jumlah kata kunci (keyword) yang ada pada sebuah halaman. Disatu sisi hal ini dapat dikatakan cukup karena mampu menampilkan dokumen (dalam hal ini paper) yang mempunyai kata kunci (keyword) yang kita minta. Namun disisi lain bila kita berbicara dalam lingkup keilmuan maka sebuah ilmu pastilah berhubungan dengan ilmu yang lain. Fuzzy relation dijelaskan sebagai metode untuk menjelaskan hubungan dua hal yang berbeda. Sebagai ilustrasi bila dijumpai kata "apple" (apel) dan "tiger" (harimau), secara umum kedua kata tersebut tidak berhubungan dengan asumsi secara penulisan kedua kata itu berbeda, kata "apple" merujuk kepada nama buah dan "tiger" merujuk kepada nama hewan. Dalam dunia komputer ada sebuah perusahaan pembuat software yaitu (Mac) Macintosh. Mac mempunyai simbol "apple" sehingga seringkali disebut sebagai Macinthos Apple. Mac telah mengeluarkan sistem operasi yang bernama "Tiger" OS. Dari hubungan dengan Mac inilah kata "Apple" dan "Tiger" yang sebenarnya tidak berkaitan secara umum dan secara penulisan, mempunyai hubungan dalam dunia komputer. Dengan adanya fuzzy relation, maka masalah di atas dapat diatasi. dengan sebuah asumsi dan tujuan bahwa dengan mengetahui antara kedua. 2.
(21) kata/objek maka kita bisa mengetahui hubungan kedekatan/kekerabatan antara kedua kata/objek tersebut. Lebih jauh dalam hubungannya dengan pencarian (searching), maka dengan masukkan kata "apple", ada kemungkinan bahwa kata "tiger" juga akan menjadi hasil output. Bukan karena hasilnya salah, namun karena antara "apple" dan "tiger" terdapat hubungan kekerabatan. Didalam aplikasi dunia perbankan yaitu PT. Bank Danamon Indonesia, Tbk dapat di contohkan suatu table master pasti akan memiliki hubungan kekerabatan dengan table lainnya, jika di query table account/rekening menampilkan juga informasi customer information/informasi nasabah. Bila kita berbicara mengenai hubungan maka kita juga berbicara tentang nilai/bobot hubungan karena bobot sebuah hubungan diperlukan untuk menilai seberapa jauh/dekat sebuah relasi yang terjadi. Dengan menggunakan metode fuzzy relation maka nilai/bobot hubungan antara dua kata atau lebih dapat diketahui. Berdasarkan hal di atas, maka penulis melakukan penelitian untuk membuat search engine yang melakukan pencarian tidak hanya berdasarkan kata saja, melainkan juga berdasarkan hubungan kekerabatan antara dua kata atau lebih. Oleh sebab itu dalam penyusunan tugas akhir ini penulis mengambil judul "Aplikasi Search Engine Paper/Karya Ilmiah Berbasis Web Menggunakan Metode Fuzzy Relation".. 3.
(22) 1.2. Perumusan Masalah Berdasarkan latar belakang yang penulis susun, maka ada beberapa masalah yang penulis rumuskan, yaitu : a. Bagaimana mencari nilai bobot kekerabatan antara dua dokumen atau lebih ? b. Bagaimana menyajikan informasi yang tidak hanya berdasarkan kata saja melainkan juga berdasarkan hubungan kekerabatan ? c. Bagaimana penerapan fuzzy relation pada search engine yang tidak hanya mencari berdasarkan pada kesamaan kata kunci pencarian yang di berikan dengan paper yang ada, namun juga memberikan referensi paper yang berelasi dengan paper yang lain.. 1.3. Batasan Masalah Untuk mengoptimalkan pembahasan maka penulis membatasi tulisan hanya pada ruang lingkup : a. Pencarian dilakukan pada file dengan format open source yaitu pdf (portable document format). b. Untuk menghasilkan pencarian paper/karya ilmiah yang saling memiliki keterkaitan satu dengan yang lainnya berdasarkan keyword yang di-input-kan oleh user, maka keyword ditentukan dari beberapa hal: . Keyword yang diberikan pada masing-masing paper (keyword attach). . Banyaknya kata yang muncul pada sebuah paper dikurangi kata yang sering muncul (stop word). 4.
(23) . Administrator dapat memasukkan kata kunci atau frase tambahan yang diperkirakan mempunyai relasi dengan paper. c. Fuzzy relation diterapkan untuk pencarian satu atau lebih dokumen yang memiliki hubungan (similar page) dan pengurutan dokumen berdasarkan nilai fuzzy (page rank).. 1.4. Tujuan dan Manfaat Penulisan 1.4.1. Tujuan Penulisan Tujuan dari penulisan skripsi ini adalah membuat aplikasi search engine berbasis web yang tidak hanya mencari berdasarkan pada kesamaan keyword yang ada pada paper atau journal ilmiah, namun juga memberikan referensi paper atau journal yang berelasi dengan paper atau journal yang lainnya. 1.4.2. Manfaat Penulisan Manfaat dari penulisan skripsi ini adalah : 1. Bagi penulis adalah: a. Mengembangkan pengetahuan mengenai fuzzy relation dan penerapannya pada search engine. b. Mengaplikasikan teori yang didapat di perkuliahan dengan membuat search engine. 2. Bagi orang lain adalah : a. Mendapatkan informasi yang relevan. b. Dapat. dijadikan. sebagai. bahan. referensi. dalam. mengembangkan system mesin pencari informasi lebih lanjut.. 5.
(24) c. Dapat. dijadikan. sebagai. bahan. referensi. untuk. membandingkan dengan metode lain.. 1.5. Metodologi Penelitian Pada penulisan skripsi yang berjudul " Aplikasi Search Engine Paper/Karya Ilmiah Berbasis Web Menggunakan Metode Fuzzy Relation " diperlukan data dan informasi yang lengkap guna mendukung penelitian ini serta kebenaran materi uraian dan pembahasan. Metode penelitian yang dilakukan penulis dalam melakukan penelitian terdiri dari langkah-langkah sebagai berikut: 1. Studi Pustaka Yaitu pengumpulan data dan informasi dengan cara mencari sumber-sumber literatur yang bisa digunakan untuk mengetahui landasan teori dan permasalahan mendasar dalam penelitian ini. 2. Metode Pengembangan Sistem Pengembangan sistem dalam penelitian ini, penulis menggunakan model sekuensial linier. Menurut Pressman (1997), sekuensial linear mengusulkan sebuah pendekatan kepada perkembangan perangkat lunak yang sistematik dan sekuensial yang mulai pada tingkat dan kemajuan sistem pada seluruh analisis, desain kode, pengujian, dan pemeliharaan. Berikut adalah gambar model sekuensial liner. a.. Analisis kebutuhan perangkat lunak. 6.
(25) Pada tahap ini dilakukan pengumpulan kebutuhan, khususnya pada perangkat lunak. Kebutuhan baik untuk sistem maupun perangkat lunak didokumentasikan. b.. Design Pada. tahap. ini. dilakukan. perancangan. struktur. data. (database), perancangan interface (antarmuka), dan algoritma prosedural. c.. Kode Pada tahap ini, dibuat kode-kode yang dibutuhkan untuk membangun aplikasi yang sedang dibuat.. d.. Pengujian Pada tahap. ini. dilakukan. serangkaian. pengujian. sistem,. melakukan pencarian kesalahan atau kekurangan pada sistem, baik untuk perbaikan maupun untuk pengembangan lebih lanjut. e.. Implementasi Pada tahap ini dilakukan penerapan sistem yang telah dibuat.. f.. Pemeliharaan Pada tahap ini dilakukan pemeliharaan terhadap sistem dan aplikasi. Dari tahap awal sampai dengan tahap akhir penulisan skripsi ini. dibuat, penulis menggunakan semua pendekatan (a sampai dengan f) yang terdapat di model pengembangan perangkat lunak sekuensial linier.. 7.
(26) 1.6. Sistematika Penulisan Dalam penyusunan skripsi ini pembahasan yang penulis sajikan terbagi dalam lima bab, yang secara singkat akan diuraikan sebagai berikut: BAB I. PENDAHULUAN Dalam bab ini akan diuraikan mengenai latar belakang permasalahan, perumusan masalah, batasan masalah, tujuan dan manfaat penulisan, metodelogi penelitian serta sistematika penulisan.. BAB II. LANDASAN TEORI Dalam bab ini akan diuraikan secara singkat teori yang diperlukan dalam penelitian dan penulisan skripsi.. BAB III. METODOLOGI PENELITIAN Pada bab ini akan di bahas mengenai metodologi perancangan yang digunakan dalam mengembangkan riset skripsi yang penulis buat.. BAB IV. ANALISA DAN PENERAPAN Dalam bab ini akan diuraikan perencanaan sistem yang akan dibuat dengan menggunakan Entity Relationship Diagram(ERD), Flowchart serta penjabaran dan rancangan sistem.. BAB V. PENUTUP Bab ini berisi kesimpulan dari apa yang sudah diterangkan pada bab-bab sebelumnya, dan juga berisi saran-saran perbaikan yang berhubungan dengan masalah yang dibahas oleh penulis.. 8.
(27) BAB II LANDASAN TEORI. 2.1 Search Engine Search engine merupakan perangkat pencari informasi dari dokumendokumen yang tersedia (http://dosen.narotama.ac.id/wp-content/uploads/2012/01/APLIKASIPada. SEARCH-ENGINE-DAN-PERMASALAHANNYA.pdf).. beberapa. instansi. pendidikan, search engine digunakan untuk membantu dan mengatur sejumlah besar dokumen atau penulisan ilmiah, penggunaannya pun mengutamakan pengolahan yang berkaitan dengan teks atau dokumen. Hal-hal yang dilakukan oleh search engine, diantaranya adalah : 1. Mengolah rekord-rekord berupa teks dokumen, yaitu mengidentifikasikan sejumlah keyword yang dianggap mewakili isi dokumen. 2. Mengidentifikasi permintaan informasi. 3. Menentukan dan mengambil informasi atau dokumen yang dibutuhkan sesuai dengan permintaan.. 2.2 Fuzzy Relation Fuzzy hubungan. relation dua. dijelaskan hal. yang. sebagai. metode. berbeda. (http://decsai.ugr.es/vip/files/conferences/06007592.pdf).. untuk. (completely. menjelaskan different). Sebagai ilustrasi bila dijumpai. kata “apple” (apel) dan “tiger” (harimau) maka secara umum maka jelas kedua. 9.
(28) kata itu tidak berhubungan dengan asumsi secara penulisan kedua kata itu berbeda, secara umum maka kata “apple” merujuk kepada nama buah dan “tiger” merujuk kepada nama hewan / atau lebih sempit lain hewan buas. Dalam dunia komputer ada sebuah perusahaan pembuat software yaitu Macintosh (Mac). Mac mempunyai simbol “apple” sehingga seringkali disebut sebagai Macintosh Apple. Mac mengeluarkan sistem operasinya yang bernama “Tiger” OS. Dari hubungan dengan Mac inilah kata “Apple” dan “Tiger” yang sebenarnya tidak berkaitan secara umum dan secara penulisan, mempunyai hubungan dalam dunia komputer. Dengan adanya fuzzy relation maka hubungan seperti ini akan diteliti dengan sebuah asumsi dan tujuan bahwa dengan mengetahui hubungan antara kedua kata / objek maka kita bisa mengetahui pula hubungan kedekatan / kekerabatan antara kedua kata / objek tersebut. Lebih jauh lain dalam hubungannya dengan dunia pencarian (searching) maka dengan masukkan kata “apple” maka ada kemungkinan bahwa kata tiger juga akan menjadi hasil output. Bukan karena hasilnya salah namun karena antara “apple” dan “tiger” terdapat hubungan kekerabatan. Penjelasan diatas dapat juga diuraikan secara harafiah menjadi sebagai berikut, dua buah kata yang sama sekali tidak berhubungan (contoh: “apple” dan “tiger”). Akan mempunyai hubungan bila kedua kata tersebut dibahas pada satu dokumen. Semakin banyak dokumen yang membahas keduanya maka hubungan antara kedua kata (“apple” dan “tiger”) akan semakin dekat.. 10.
(29) Fuzzy relation akan mencari 4 hubungan dari kombinasi kata (keyword) dan dokumen (paper) hubungan tersebut adalah : a. keyword terhadap paper b. paper terhadap paper c. paper terhadap keyword d. keyword terhadap keyword Penjelasan dari masing – masing hubungan tersebut beserta dengan proses perhitungannya dijelaskan sebagai berikut : 1. Pada langkah ini diasumsikan hubungan antara keyword to paper mempunyai nilai bobot dari keyword terhadap paper sebagai berikut : P = {P1,P2,....Pn} adalah set of papers D= {D1,D2,...,Dm} adalah set of keywords Misalnya dari data di peroleh relasi paper dan keyword yang dinyatakan sebagai fuzzy set paper terhadap keyword sebagai berikut : P1 = {0.3/D2, 0.7/D5, 1/D7, 1/D8}, P2 = {1/D2, 0.8/D5, 0.8/D7, 1/D8}, P3 = {0.9/D1, 0.9/D3, 1/D4, 0.8/D6}, P4 = {1/D1, 0.5/D3, 0.8/D4, 0.8/D6}, P5 = {0.1/D2, 0.7/D5, 1/D4, 1/D8}, P6 = {0.9/D2, 1/D5, 0.8/D4, 1/D8}. Untuk P={P1,P2,...P6}dan D={D1,D2,...,D8}, dimana setiap paper/dokumen dianggap sebagai suatu fuzzy set terhadap keyword sehingga didapatkan bahwa. 11.
(30) P (D ) = 0.1 5. 2. 2. Similarity antara 2 paper dinyatakan dengan suatu fungsi R dimana R:PxP [0.1] sebagaimana tertulis pada rumus :. min( P ( D) P ( D)) P ( D) i. R (Pi,Pj) =. ,. j. D. (2.1). j. D. Keterangan : R : Relasi Pi : Paper / dokumen ke – i Pj : Paper / dokumen ke – j D : Keyword. : Membership function sebagai suatu mapping dapat ditemukan hubungan antara paper – paper yang ada misal : hubungan R(P1,P2) =. 0.3 0.7 0.8 1 = 0,78 1 0.8 0.8 1. Tabel 2.1 Hubungan paper terhadap paper X/Y. P1. P2. P3. P4. P5. P6. P1. 1.00. 0.78. 0. 0. 0.64. 0.54. P2. 0.93. 1.00. 0. 0. 0.96. 0.73. P3. 0. 0. 1.0. 0.97. 0.36. 0.22. P4. 0. 0. 0.83. 1.00. 0.29. 0.22. P5. 0.60. 0.50. 0.28. 0.26. 1.00. 0.70. P6. 0.67. 0.75. 0.22. 0.26. 0.93. 1.00. 12.
(31) 3. Dari data yang ada dari hubungan keyword terhadap paper maka akan didapatkan hubungan antara paper terhadap keyword :. D (P ) = P (D ) P(PD(D) ) P (D ) i. j. j. i. i. 1. i. 2. i. (2.2). m. Keterangan : R : Relasi Pi : Paper / dokumen ke – i Pj : Paper / dokumen ke – j D : Keyword. : Membership function sebagai suatu mapping Contoh: kita akan mencari bobot keyword (D2) pada paper 1. D. 2. (P1) =. 0.3 0 .3 = = 0.1 3 0.3 0.7 1 1. hasil keseluruhan D1 = {0.25/P3, 0.32/P4}, D2 = {0.1/P1, 0.28/P2, 0.06/P5, 0.24/P6}, D3 = {0.25/P3, 0.16/P4}, D4 = {0.28/P3, 0.26/P4, 0.36/P5, 0.27/P6}, D5 = {0.23/P1, 0.22/P2, 0.25/P5, 0.27/P6}, D6 = {0.22/P3, 0.26/P4}, D7 = {0.33/P1, 0.22/P2}, D8 = {0.33/P1, 0.28/P2, 0.36/P5, 0.27/P6.}. 13.
(32) 4. Similarity antara 2 keyword dinyatakan dengan suatu fungsi R dimana R:DxD [0.1] sebagaimana tertulis pada rumus :. R(Di ,Dj) =. min(Di( P),Dj( P)) (Dj( P)) P. (2.3). P. Keterangan : R : Relasi Pi : Paper / dokumen ke – i Pj : Paper / dokumen ke – j D : Keyword. : Membership function sebagai suatu mapping dapat ditemukan hubungan antara keyword - keyword yang ada, misal hubungan R(D1,D3) =. 0.25 0.16 =1 0.25 0.16. hubungan R(D3,D1) =. 0.25 0.16 = 0.72 0.25 0.32. Tabel 2.2 Hubungan keyword terhadap keyword X/Y. D1. D2. D3. D4. D5. D6. D7. D8. D1. 1.00. 0. 1.00. 0.44. 0. 1.00. 0. 0. D2. 0. 1.00. 0. 0.26. 0.64. 0. 0.58. 0.53. D3. 0.72. 0. 1.00. 0.35. 0. 0.79. 0. 0. D4. 0.89. 0.44. 1.00. 1.00. 0.54. 1.00. 0. 0.51. D5. 0. 0.91. 0. 0.44. 1.00. 0. 0.82. 0.86. D6. 0.84. 0. 0.93. 0.41. 0. 1.00. 0. 0. D7. 0. 0.47. 0. 0. 0.46. 0. 1.00. 0.49. D8. 0. 1.00. 0. 0.54. 1. 0. 1.00. 1.00. 14.
(33) 2.3 Database Database adalah kumpulan file-file yang saling berelasi, relasi tersebut biasa ditunjukkan dengan kunci dari tiap file yang ada. Satu database menunjukkan satu kumpulan data yang dipakai dalam satu lingkup perusahaan, instansi (Kristanto, 1994). Dalam satu file terdapat record-record yang sejenis, sama besar, sama bentuk, merupakan satu kumpulan entity yang seragam. Satu record terdiri dari field-field yang saling berhubungan untuk menunjukkan bahwa field tersebut dalam satu pengertian yang lengkap dan direkam dalam satu record. 1. Entity Entity adalah orang, tempat, kejadian atau konsep yang informasinya direkam. Pada bidang Administrasi Siswa misalnya, entity adalah siswa, buku, pembayaran, nilai test. Pada bidang kesehatan, entity adalah pasien, dokter, obat, kamar, diet. 2. Atribute Setiap entity mempunyai atribute atau sebutan untuk mewakili suatu entity. Seorang siswa dapat dilihat dari atributenya, misalnya nama, nomor siswa, alamat, nama orang tua, hobby. Atribute juga disebut sebagai data elemen, data field, data item. 3. Data Value (nilai atau isi data) Data value adalah data aktual atau informasi yang disimpan pada tiap data elemen atau atribute. Atribute nama karyawan menunjukkan tempat dimana. 15.
(34) informasi nama karyawan disimpan, sedang data value adalah Sutrisno, Budiman, merupakan isi data nama karyawan tersebut. 4. Record/Tuple Kumpulan elemen-elemen yang saling berkaitan menginformasikan tentang suatu entity secara lengkap. Satu record mewakili satu data atau informasi tentang seseorang misalnya, nomor karyawan, nama karyawan, alamat, kota, tanggal masuk. 5. File Kumpulan record-record sejenis yang mempunyai panjang elemen yang sama, atribute yang sama, namun berbeda-beda data valuenya.. 2.4 MYSQL Menurut Prasetyo (2003: 1), MySql adalah Relational Database Management System (RDBMS) yang didistribusikan secara gratis di bawah lisensi GPL (General Public Lisence). MySql dikembangkan sekitar tahun 1994 oleh sebuah perusahaan pengembang software dan konsultan database bernama MySql AB yang bertempat di Swedia. Mysql adalah database server yang cukup banyak digunakan, terutama bila dikolaborasikan dengan PHP. Beberapa istilah yang digunakan pada database : a. Tabel Tabel didefinisikan sebagai sekumpulan data yang disimpan pada baris dan kolom. Contoh dari tabel terlihat pada tabel 2.3 dibawah. 16.
(35) Tabel 2.3 Contoh Tabel Mahasiswa Kode Mahasiswa. Nama Mahasiswa. Nilai. 26401000. Agus. 90. 26402000. Budi. 80. 26403000. Chandra. 95. 26404000. Dodo. 85. b. Kolom Kolom atau disebut juga sebagai field adalah yang di-refer sebagai atribut pada conceptual data model. Mysql mendukung banyak type data untuk field mulai dari char, varchar, integer, hingga blob c. Baris Baris atau disebut juga record adalah isi / data dari sebuah tabel. d. Key Key atau dikenal juga sebagai pengenal pada conceptual data model adalah field yang menjadi pengenal sebuah tabel namun tidak semua tabel mutlak untuk memiliki key. Secara umum ada dua macam key yaitu primary key dan foreign key. Keberadaan sebuah key pada tabel dapat mempercepat proses pencarian data, terutama jika tabel tersebut di – index. Primary key diartikan sebagai sebuah kolom yang berisi data – data yang murni dari tabel itu sendiri dan menjadi acuan untuk mengenali tidak baris / record yang ada pada tabel. Foreign key diartikan sebagai sebuah kolom dimana nilai yang ada pada kolom tersebut berasal dari tabel lain, foreign key tidak dapat dijadikan acuan pengenal tiap record pada tabel. Mysql tidak mengenal adanya foreign key.. 17.
(36) e. Relasi Relasi adalah hubungan yang terjadi antara 2 tabel. Ada 3 macam relasi yang dikenal pada relational database. 1. One to one artinya satu nilai pada suatu tabel hanya digunakan maksimal satu kali pada tabel yang lain sebagai foreign key 2. One to many artinya satu nilai pada suatu tabel dapat digunakan lebih dari satu kali pada tabel yang lain sebagai foreign key 3. Many to many artinya antara satu tabel dengan yang lain saling bertukar key dan masing – masing key dapat digunakan lebih dari satu kali. 2.5 Entity Relationship Diagram (ERD) Entity Relationship Diagram adalah sebuah metode untuk memodelkan suatu sistem dengan cara menentukan data apa saja yang ada pada sebuah entity dan bagaimana entity yang satu berhubungan dengan entity yang lain. Simbol – simbol yang digunakan dalam penggambaran ERD yaitu : Ent_1. Ent_2 Relation_7. Gambar 2.1 Relasi One to One Gambar 2.1 menggambarkan bentuk hubungan one to one hubungan ini ditandai dengan adanya garis tunggal yang menempel pada kedua sisi entity. Ent_4. Ent_3 Relation_8. 18.
(37) Gambar 2.2 Relasi One to Many Gambar 2.2 menggambarkan bentuk hubungan one to many. Hubungan ini ditandai dengan adanya garis dengan cabang 3 (disebut juga chicken feet) pada sisi entity yang bersifat many. Ent_6. Ent_5 Rel ation_9. Gambar 2.3 Relasi many to many Gambar 2.3 menggambarkan bentuk hubungan many to many. Hubungan ini ditandai dengan adanya garis dengan cabang 3 (disebut juga chicken feet) pada kedua sisi entity. Ent_112. Ent_102 Relation_12. Gambar 2.4 Relasi one to many mandatory Gambar 2.4 menggambarkan mandatory. Sebuah entity dapat dikatakan mandatory jika pada garis yang dekat dengan entity terdapat tanda “|”. Kemudian sebuah entity dapat dikatakan non- mandatory jika pada garis yang dekat dengan entity terdapat tanda “O”. Pada gambar 2.4 terlihat bahwa entity 102 (sisi kiri) merupakan non – mandatory dan entity 112 (sisi kanan) merupakan mandatory. istilah mandatory sama dengan obligatory dan istilah non – mandatory sama dengan non - obligatory Ent_113. Ent_103 Relation_12. Gambar 2.5 Relasi one to many dependent.. 19.
(38) Gambar 2.5 menggambarkan dependent. Pada gambar 2.5 terlihat bahwa entity 113 (sisi kanan) merupakan dependent dari entity 103 (sisi kiri). 2.6 Diagram Alir (Flowchart) Diagram alir memberikan bentuk gambar dalam merepresentasikan suatu aliran kontrol logika dengan menggunakan notasi-notasi simbol grafis (Pressman, 2002).. Pedoman yang digunakan pada saat akan menggambar atau membuat diagram alir : a. Diagram alir sebaiknya digambar dari atas ke bawah dan mulai dari bagian kiri dari suatu halaman. b. Kegiatan di dalam diagram alir harus ditunjukkan dengan jelas. c. Harus ditunjukkan dari mana kegiatan akan dimulai dan dimana akan berakhirnya. d. Masing-masing kegiatan di dalam diagram alir sebaiknya digunakan suatu kata yang mewakili suatu pekerjaan. e. Masing-masing kegiatan di dalam diagram alir harus di dalam urutan yang semestinya. f. Gunakan simbol-simbol bagan alir yang standar. Beberapa diagram alir digambar dengan menggunakan simbol-simbol yang di tampilkan pada gambar 2.6 berikut.. 20.
(39) SIMBOL. KEGUNAAN. Simbol garis alir. Untuk menghubungkan antara simbol yang satu dengan simbol yang lainnya.. Simbol Proses. Simbol yang menunjukkan pengolahan yang dilakukan oleh computer.. Simbol Keputusan. Simbol untuk kondisi menghasilkan beberapa jawaban atau aksi.. Simbol Alternate Process. Simbol untuk permulaan atau akhir dari suatu program.. Simbol Data. Simbol yang menyatakan proses input dan output tanpa tergantung dengan jenis peralatannya.. Simbol Harddisk. Menunjukkan harddisk.. Simbol Persiapan. Simbol untuk persiapan penyimpanan yang akan digunakan sebagai tempat pengolahan di dalam storage.. input/output. yang akan kemungkinan. menggunakan. Gambar 2.6 Simbol Flowchart Pada penulisan skripsi ini, simbol flowchart yang di terapkan adalah simbol garis alir, simbol proses, simbol keputusan dan simbol alternate process.. 2.7 HTML HTML singkatan dari HyperText Mark-up Language adalah file teks atau file ASCII yang berisi instruksi/script kepada web browser untuk menampilkan suatu tampilan grafis dari sebuah halaman web (Kristianto, 2002).. 21.
(40) HTML merupakan turunan dari SGML (Standart Generalized Mark-up Language). Standar HTML diatur oleh W3C (World Wide Web Consortium), sebuah organisasi yang bergerak di bidang internet dan jaringan. HTML seperti singkatannya merupakan bahasa Mark-up yaitu bahasa yang mengatur tampilan dari suatu dokumen. Pada intinya sebuah halaman HTML hanyalah sebuah dokumen (file) text yang didalamnya berisi sekumpulan teks dan tag-tag HTML. sebuah halaman web yang kita lihat menggunakan browser sebenarnya berisi tagtag HTML yang digabungkan dengan berbagai media lain seperti gambar, suara dan skrip-skrip dinamis sehingga memungkinkan kita untuk berinteraksi didalamnya Sejak pertama kali dikeluarkan HTML telah mengalami banyak sekali perubahan dan penyempurnaan. Untuk menjaga kompabilitas dengan versi – versi HTML yang ada sebelumnya maka ada sebuah policy untuk memberikan tag berisi informasi versi HTML yang digunakan pada halaman web atau dengan kata lain halaman web dibuat dengan mengikuti standar HTML versi berapa. Dengan adanya tag “DOCTYPE” yang menyatakan standar HTML yang digunakan maka diharapkan “kesalahpahaman” versi oleh browser dapat dihindari. HTML terdiri dari serangkaian tag – tag. Tag dapat diartikan sebagai sebuah penanda yang diawali dengan tanda lebih kecil “<” dan diakhiri dengan tanda lebih besar “>”. Ada 3 macam tag HTML yaitu : 1. tag tunggal, yaitu tag yang tidak membutuhkan tag penutup mis : tag <br> dan <hr>. 22.
(41) 2. tag ganda, yaitu tag yang membutuhkan tag penutup. jenis tag ini dapat juga diingat sebagai tag yang berpasangan. Sebagian besar tag HTML merupakan tag yang berpasangan mis : tag <p> </p> , <b> </b> 3. tag komentar, yaitu tag yang digunakan untuk menuliskan komentar, karena untuk komentar maka tag ini tidak akan ditampilkan oleh browser mis : <!—ini komentar -> konvensi penulisan tag HTML dijelaskan sebagai berikut: Contoh : <font face=”verdana” size=”5”> </font> Kata “font” yang diawali dengan tanda “<” dan “>” adalah tag Kata “face“ disebut sebagai atribut Kata “verdana” disebut sebagai value atribut atau disingkat menjadi value Kemudian untuk beberapa tag seperti <p>, <form>, <body> juga ada yang disebut sebagai “event”. Contoh : <body onload=”value”> Kata “onload” pada contoh adalah yang disebut sebagai event dan sama seperti sebelumnya kata “value” disebut juga sebagai value. Biasanya event digunakan untuk men-trigger sebuah atau beberapa function oleh client-side scripting.. 23.
(42) Kemudian ada sebuah peraturan yang tidak tertulis yang menganjurkan agar penulisan value haruslah diapit dengan tanda petik “”. Tidak digunakannya petik tidak akan mempengaruhi bentuk tampilan bila value yang diberikan tidak mengandung spasi. Bila mengandung spasi maka akan terjadi masalah Contoh: <a href=http://www.main.php?nilai=tidak valid> Go </a> Bila dijalankan akan mendeteksi nilai=tidak <a href=http://www.main.php?nilai=”tidak valid”> Go </a> Bila dijalankan akan mendeteksi nilai=tidak valid 2.7.1. Bagian halaman HTML Halaman HTML secara umum terbagi atas 3 bagian yaitu : 1. Bagian Versi 2. Bagian Head 3. Bagian Body. 2.7.2. Bagian Versi Bagian versi adalah bagian dari halaman HTML yang memberikan informasi mengenai versi HTML yang digunakan. Contohnya <!DOCTYPE. HTML. PUBLIC. "-//W3C//DTD. HTML. 4.01. Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">. 24.
(43) 2.7.3. Bagian Head Bagian head adalah bagian dari halaman HTML yang berisi tag <title> dan <meta>, secara umum bagian head dapat juga diartikan sebagai bagian yang berisi keterangan mengenai isi dokumen Berikut adalah beberapa contoh tag yang berada pada bagian head <title>Untitled Document</title> <base href=”http://puslit.uin.ac.id”> <meta http-equiv="Content-Type" content="text/html;charset=iso-8859-1">. <meta http-equiv="refresh" content="5"> <meta http-equiv="keywords" content="keyword,kata kunci"> Tag title memberi informasi mengenai judul dokumen Tag base memberi informasi mengenai alamat awal dari dokumen Tag meta memberi informasi mengenai deskripsi dokumen 2.7.4. Bagian Body Bagian body dari dokumen HTML merupakan isi dari dokumen pada bagian ini terdapat banyak tag – tag HTML yang digunakan untuk memformat / membentuk sebuah dokumen HTML. Tag – tag HTML yang seringkali digunakan pada bagian body 1. Tag untuk keperluan format paragraf a. Tag Paragraf. 25.
(44) Tag <p>..... </p> berfungsi untuk membuat paragraf baru. Teks yang ingin dibuat paragraf diletakkan diantara tag <p> dan tag </p> b. Tag Heading Tag <h1>.......</h1>. hingga <h6>.........</h6> digunakan untuk. membuat heading 2. Tag untuk keperluan formating teks a. Tag Bold Tag <b>...........</b> digunakan untuk membuat tebal teks yang berada diantara tag <b> dan tag </b> b. Tag Italic Tag <i>...........</i> digunakan untuk membuat miring teks yang berada diantara tag <i>.........</i> c. Tag Underline Tag <u>..........</u> digunakan untuk membuat garis bawah teks yang berada di antara tag <u>........</u> 3. Tag untuk keperluan formating font Tag <font>..........</font> digunakan untuk memformat tampilan teks Contoh : <font face="Arial, Helvetica, sans-serif" color="#00FF99" size="5"> hallo </font>. 26.
(45) 4. Tag untuk keperluan urutan a. Urutan terurut (ordered) Tag <ol>........</ol> menandakan bahwa semua yang berada di dalam tag <ol>......</ol> dan juga diapit oleh tag <il>..........</il> adalah item yang akan diurutkan dengan diberikan penomoran. Tag <il> ..... </il> adalah tag yang menandakan bahwa teks yang diapit adalah item yang akan diurutkan b. Urutan tidak terurut (unordered) Tag <ul>........</ul> menandakan bahwa semua yang berada di dalam tag <ul>......</ul> dan juga diapit oleh tag <il>..........</il> adalah item yang akan diurutkan tanpa diberikan penomoran. Tag <il> ..... </il> adalah tag yang menandakan bahwa teks yang diapit adalah item yang akan diurutkan. 5. Tag untuk keperluan tabel Untuk membuat tabel dalam HTML digunakan tag <table>....</table>. Untuk membuat baris pada tabel di gunakan tag <tr>.....</tr> atau dapat diingat dengan kata “table row” kemudian untuk membuat kolom di gunakan tag <td>.....</td> atau dapat juga diingat dengan kata “table definition”. Ada atribut khusus pada tag <td> yaitu colspan dan tag <tr> yaitu rowspan. Colspan mempunyai arti bahwa kolom akan digabungkan mulai dari tag <td> yang mempunyai atribut colspan.. 27.
(46) Rowspan mempunyai arti bahwa baris akan digabungkan mulai dari tag <tr> yang mempunyai atribut rowspan. 6. Tag untuk keperluan form Untuk membuat form digunakan tag <form>.....</form> kemudian diantara tag <form>.....</form> akan diisi oleh tag – tag yang akan membentuk sebuah form. Beberapa tag yang digunakan untuk membuat sebuah form adalah : a. Tag input Tag input mempunyai beberapa type yang masing – masing membentuk sebuah komponen b. Textfield : tempat user menginputkan informasi dalam satu baris Sintaks : <input type="text" name="textfield"> c. Hiddenfield : digunakan untuk menyimpan nilai yang tidak akan ditampilkan pada form biasanya digunakan untuk keperluan pemberian status Sintaks : <input type="hidden" name="hiddenField"> d. Textarea : tempat user menginputkan informasi dalam bentuk banyak baris Sintaks : <textarea name="textarea"></textarea> e. Checkbox : tempat user memasukkan informasi / pilihan Sintaks : <input type="checkbox" name="checkbox" value= "checkbox">. 28.
(47) f. Radiobutton : tempat user memasukkan informasi / pilihan beda dari checkbox adalah. pada radiobutton hanya satu piliha yang. boleh dipilih dari beberapa pilihan Sintaks. :. <input. name="radiobutton". type="radio". value=. "radiobutton"> g. Listbox: tempat user memilih pilihan dari daftar yang disediakan Sintaks : <select name="select"> <option></option> <option></option> <option></option> </select> h. File : tempat user memilih file (browse file) Sintaks : <input type="file" name="file"> i. Submit : tempat user mengirimkan (submit) form Sintaks : <input type="submit" name="Submit" value="Submit"> j. Reset : tempat user mengosongkan semua field pada form (reset) Sintaks : <input type="reset” name="Reset" value="Reset"> k. Button : menampilkan sebuah button Sintaks : <input type="button" name="Button" value="button">. 7. Tag untuk keperluan media Untuk menampilkan media berupa gambar digunakan tag <img href=”path_to_image”>. 29.
(48) 8. Tag untuk keperluan link Untuk menampilkan link ke dokumen HTML lain digunakan tag <a href=”http://www.google.com/ncr”> Google </a> Pada penulisan skripsi ini, semua tag body HTML di terapkan, kecuali tag untuk keperluan urutan.. 2.8 Apache Web Server Menurut Andino Masaleno, dalam “Kamus Istilah Komputer dan Informatika”, Web server adalah perangkat keras dan perangkat lunak yang dipakai untuk menyimpan dan mengirim dokumen HTML untuk digunakan dalam Worl Wide Web (Andino Masaleno, 2003). Web server saat ini merupakan inti dari server-server Internet selain e-mail server, ftp, dan news server. Web server telah dirancang untuk dapat melayani beragam jenis data, mulai dari text, hypertext, gambar (image), suara, gambar tiga dimensi, plug-in dan sebagainya. Web server pada umumnya melayani data dalam bentuk file HTML (hypertext markup language). Dari file ini kemudian dapat dikaitkan ke file HTML lainnya, ke file gambar, ke file suara, dan segala jenis file komputer yang hendak dipublikasikan di Internet. Apache merupakan web server yang paling banyak digunakan di Internet saat ini. Ini disebabkan oleh beberapa faktor seperti kecepatan, performansi, dan tentu saja harganya yang gratis. Apache merupakan turunan dari web server yang. 30.
(49) dikeluarkan oleh NCSA, yaitu NCSA HTTPd pada sekitar 1995-an. Pada dasarnya Apache adalah “A PatCHy” (patch) dan pengganti dari NCSA HTTPd. 2.9 PHP Menurut Sidik (2004: 3), PHP merupakan script untuk pemrograman script web server-side, script yang membuat dokumen HTML on the the fly, dokumen yang dihasilkan dari suatu aplikasi bukan dokumen HTML yang dibuat dengan menggunakan editor teks atau editor HTML PHP pertama kali dibuat pada musim gugur tahun 1994 oleh Rasmus Lerdoff ([email protected]), yang awalnya digunakan pada situsnya untuk mencatat siapa saja yang berkunjung dan melihat biodatanya. Kini, PHP menggunakan script engine Zend untuk lebih meningkatkan kinerja (performance) dan mempunyai dukungan yang banyak berupa ekstensi dan fungsi dari berbagai library pihak ketiga (third party), dan berjalan seolah modul asli (native) dari berbagai berbagai server web yang populer. Secara mendasar, PHP dapat mengerjakan semua yang dapat dikerjakan oleh program CGI, seperti mendapatkan data form, menghasilkan isi halaman web yang dinamik, dan menerima cookies. Kemampuan feature PHP yang paling diandalkan dan signifikan adalah dukungan kepada banyak database. PHP juga mendukung untuk berkomunikasi dengan layanan lain menggunakan protokol IMAP, SNMP, NNTP, POP3, HTTP, dan lainnya yang tidak terhitung.. 31.
(50) Berikut adalah contoh yang umum digunakan untuk menjelaskan tentang PHP sebagai script yang disipkan (embedded script) dalam dokumen HTML <html> <head> <title>Contoh</title> </head> <body> <?php echo "Hai, saya dari script PHP"; ?> </body> </html>. Saat ini PHP telah digunakan pada banyak situs web di internet. Beberapa alasan menggunakan PHP adalah karena PHP bersifat opensource sehingga PHP dapat didistribusikan dengan mudah, kemudian PHP dapat berjalan pada banyak webserver selain apache web server.. 2.10 Tools Pdftohtml Pdftohtml adalah sebuah tool untuk merubah file pdf ke dalam bentuk HTML. kegunanan utama dari pdftohtml pada tugas akhir ini adalah fasilitas untuk melihat isi dari sebuah dokumen portable document format (pdf) tanpa perlu melakukan download terlebih dahulu. pdftohtml dibuat oleh Gueorgui Ovtcharov and. Rainer. Dorsch. dan. dapat. ditemukan. pada. alamat. http://pdftohtml.sourceforge.net/ . pdftohtml merupakan sebuah program gratis (free). Sehingga pengguna tidak dibebani biaya apapun untuk menggunakan tool yang satu ini.. 32.
(51) Pdftohtml mempunyai beberapa fasilitas untuk tampilan hasil dan lain - lain. Berikut ini dijelaskan mengenai sintaks penulisan dan fasilitas / opsi yang digunakan pada tugas akhir ini. Sintaks : Pdftohtml [opsi] path_to_pdf [path_to_html_file or path_to_xml_file] Beberapa opsi pada pdftohtml yang sering digunakan pada tugas akhir : a. -v : menampilkan versi pdftohtml yang digunakan b. -noframes : hasil output tidak menggunakan frame c. -c : men-generate dokumen kompleks d. -q : bila ada error tidak akan ditampilkan Pada sintaks terlihat bahwa path_to_html_file bersifat optional. Hal ini mempunyai arti bahwa bila tidak diberikan path ke mana output akan ditulis maka secara default pdftohtml akan menuliskan hasil pada tempat file pdf berada.. 2.11 Tools Pdftotext Pdftotext merupakan sebuah tool yang mempunyai fungsi untuk mengubah file pdf ke bentuk teks (text file). Fungsi utama penggunaan tool ini adalah untuk mengubah file pdf ke dalam format yang bisa dibaca yaitu bentuk teks biasa. Pdftotext merupakan bagian dari xpdf yaitu sebuah tool untuk membaca file pdf. Pdftotext mempunyai beberapa fasilitas untuk memanipulasi bentuk hasil. Beberapa fasilitas dan Sintaks yang digunakan pada tugas akhir ini: Sintaks :. 33.
(52) pdftotext [opsi] path_to_pdf [path_to_text] Beberapa opsi yang ada pada pdftotext a. -v : menampilkan versi pdftotext yang digunakan b. -nopgbrk : saat pergantian halaman tidak diberikan page break c. -raw : hasil akan ditampilkan secara teks biasa (tidak mengikuti pola / layout yang ada pada dokumen asli) d. -q : bila ada error tidak akan ditampilkan Pada sintaks terlihat bahwa path_to_text bersifat optional. Hal ini mempunyai arti bahwa bila tidak diberikan path ke mana output akan ditulis maka secara default pdftotext akan menuliskan hasil pada tempat file pdf berada.. 2.12 STD (State Transition Diagram) Menurut Pressman (2002: 326), State Transition Diagram merupakan "suatu modeling tools yang menggambarkan sifat keterganturgan dari suatu sistem". State adalah suatu kumpulan dari tingkah laku yang dapat diobservasi. State transition diagram mewakili suatu tingkah laku dari suatu sistem dengan menggambarkan state dan kejadian yang menyebabkan sistem ke state yang lain. Ada beberapa notasi yang digunakan dalam stale transition diagram, yaitu : a. Keadaan sistem (State) Setiap kotak mewakili suatu keadaan dimana sistem mungkin berada di dalam state. Disimbolkan dengan segi empat.. 34.
(53) Gambar 2.7 Simbol State b. Perubahan sistem Untuk menghubungkan suatu keadaan dengan keadaan lain, digunakan jika sistem memiliki transisi dalam prilakunya, maka hanya jika suatu keadaan berubah menjadi keadaan tertentu.. Gambar 2.8 Simbol Perubahan Sistem. c. Kondisi dan Aksi Untuk melengkapi STD, dibutuhkan dua hal tambahan yaitu kondisi sebelum keadaan berubah dan aksi dari pemakai untuk mengubah keadaan. Dibawah ini adalah ilustrasi dari kondisi dan aksi vang ditampilkan di sebelah anak panah yang menghubungkan dua keadaan. Keadaan 1 Condition Action Keadaan 2. Gambar 2.9 Kondisi dan aksi. 35.
(54) 2.13 Studi Literatur Sejenis Terdapat beberapa studi literatur sejenis dengan skripsi yang penulis buat mengenai search engine, tetapi dengan metode berbeda dengan apa yang penulis terapkan, dapat di lihat pada tabel 2.4 dibawah. Tabel 2.4 Studi Literatur Sejenis No. Nama. Universitas. NIM. Penulisan /. Judul. Tahun 1 Pipit Kurnia UIN Jakarta 102091026305 Skripsi / 2010. Implementasi Extented Boolean dan Pemanfaatan Tesaurus pada Sistem Temu Kembali Informasi. 2 Mohammad UNIKOM. 10104485. Guntur. Skripsi /. Aplikasi Search Engine Dengan. 2010. Menggunakan Algoritma KNUTH-MURRIS-PART. 3 Rudi. Hartono. STMIK GI MDP. 2007250028. Skripsi /. Penerapan Metode Bayesian. 2011. Untuk Aplikasi Search Engine Pada Web Portal Periklanan. 4 Rhesa Rullif UNIKOM. 10103170. Elian. Skripsi /. Aplikasi Sistem Temu Kembali. 2010. Informasi Menggunakan Model Ruang Vektor Berbasis web. 5 Devy. Priatama. UNIKOM. 10106297. Skripsi /. Aplikasi Search Engine. 2010. Berdasarkan Image Recognition Dengan Jaringan Syaraf Tiruan Learning Vector Quantization. 36.
(55) BAB III METODE PENELITIAN. Pada penyusunan skripsi ini, diperlukan data-data informasi sebagai bahan yang dapat mendukung kebenaran materi uraian pembahasan. Untuk menyelesaikan masalah yang ada dalam sebuah perancangan perangkat lunak ada beberapa tahap yang harus dilakukan. Dalam bab ini dijelaskan mengenai metodologi penulisan yang digunakan penulis dan metode pengembangan sistem yang digunakan penulis.. 3.1. Metodologi Penelitian 3.1.1. Teknik Pengumpulan Data Pengumpulan data merupakan langakah yang penting untuk metode ilmiah, karena pada umumnya data yang dikumpulkan digunakan untuk menguji hipotesis yang telah dirumuskan. Pengumpulan data adalah prosedur yang sistematis dan standar untuk memperoleh data yang diperlukan (Nazir, 2003). Teknik pengumpulan data yang sering digunakan ada 3 macam teknik. Pertama, observasi yang merupakan pengamatan dan pencatatan dengan sistematik fenomena-fenomena yang diteliti. Kedua, wawancara yang merupakan suatu proses interaksi dan komunikasi serta tanya jawab dengan seseorang untuk mendapatkan keterangan atau pendapatnya tentang sesuatu hal. 37.
(56) atau masalah. Ketiga, studi pustaka dan literatur yang merupakan digunakan untuk membangun kerangka berpikir (dasar teori).. 3.1.2. Model-model Metode Pengembangan Sistem Dalam sebuah perancangan perangkat lunak diperlukan model-model proses atau paradigma rekayasa perangkat lunak berdasarkan sifat aplikasi dan proyeknya, metode dan alat bantu yang dipakai, dan kontrol serta penyampaian yang dibutuhkan. Pressman [2002: 27] menyebutkan ada beberapa model dari proses perangkat lunak, yaitu diantaranya: Model Sekuensial Linear, Model Prototipe, Model RAD (Rapid Application Development), Model Evolusioner, Model Formal dan lain-lain.. 3.2. Pemilihan Metodologi 3.2.1. Metode Pengumpulan Data 3.2.1.1 Metode Interview Dalam memperoleh data, penulis melakukan proses tanya jawab secara langsung kepada orang yang ahli dalam bidangnya atau melakukan diskusi dengan orang-orang yang mengerti terhadap materi bahasan agar mendapatkan bahan masukan untuk penyusunan skripsi ini 3.2.1.2 Studi Pustaka Pengumpulan data yang bersumber dari berbagai buku yang menjadi referensi, pedoman penulisan riset, penelitian, skripsi atau. 38.
(57) diktat yang menunjang pemecahan permasalahan yang tidak didapatkan dalam penelitian lapangan. Pencarian data melalui media internet juga dilakukan untuk memperoleh data-data tambahan dalam rangka melengkapi penulisan skripsi. Penulis mempelajari 5 buku yang berhubungan dengan masalah yang dibahas dalam skripsi ini. Pencarian data lewat internet juga dilakukan untuk memperoleh data-data tambahan, penulis mengunjungi situs yang berhubungan dengan masalah yang dibahas dalam skripsi ini. Adapun buku yang dijadikan referensi dalam skripsi ini dapat dilihat pada daftar pustaka.. 3.2.2. Metode Pengembangan Sistem Di dalam melakukan pengembangan sistem, penulis memakai metode sekuensial linear. Menurut Pressman (1997), sekuensial linear mengusulkan sebuah pendekatan kepada perkembangan perangkat lunak yang sistematik dan sekuensial yang mulai pada tingkat dan kemajuan sistem pada seluruh analisis, desain, kode, pengujian, dan pemeliharaan. Alasan penulis memilih metode sekuensial liner dalam penelitian ini karena terdapat proses pemeliharaan sistem dimana sistem yang sedang dijalankan mungkin akan mengalami modifikasi dalam rancangan atau perangkat lunak akibat dari perubahan dalam lingkungan sistem. Pemeliharaan ini akan mengaplikasikan lagi setiap fase sebelumnya dan tidak membuat yang baru lagi. Dimodelkan. 39.
(58) setelah siklus rekayasa konvensional, model sekuensial linear melingkupi aktivitas-aktivitas sebagai berikut : Analisis Desain Kode Testing Pemeliharaan Gambar 3-1 Model Sekuensial. Adapun uraian mengenai gambar 3-1 adalah sebagai berikut : a. Analisis kebutuhan perangkat lunak Proses pengumpulan kebutuhan diintensifkan dan difokuskan, khususnya pada perangkat lunak. Untuk memahami program yang dibangun, perekayasa perangkat lunak (analis) harus memahami domain informasi, tingkah laku, unjuk kerja, dan antarmuka yang diperlukan. Kebutuhan baik untuk sistem maupun perangkat lunak didokumentasikan dan dilihat lagi dengan pelanggan. b. Desain Desain perangkat lunak sebenarnya adalah proses multi langkah yang berfokus pada empat atribut sebuah program yang berbeda, struktur data,. 40.
(59) arsitektur perangkat lunak, representasi interface dan algoritma prosedural. Proses desain menterjemahkan syarat / kebutuhan ke dalam sebuah representasi perangkat lunak yang dapat diperkirakan demi kualitas sebelum dimulai. pemunculan. kode.. Sebagaimana. persyaratan,. desain. di. dokumentasikan dan menjadi bagian dari konfigurasi perangkat lunak. c.. General kode Desain harus diterjemahkan ke dalam bentuk mesin yang bisa dibaca. Langkah pembuatan kode melakukan tugas ini. Jika desain dilakukan dengan cara yang lengkap, pembuatan kode dapat diselesaikan secara mekanis.. d. Pengujian Sekali kode dibuat, pengujian program dimulai. Proses pengujian berfokus pada logika internal perangkat lunak, memastikan bahwa semua pernyataan sudah diuji, dan pada eksternal fungsional, yaitu mengarahkan pengujian untuk menemukan kesalahan-kesalahan dan memastikan bahwa input yang dibatasi akan memberikan hasil aktual sesuai dengan hasil yang dibutuhkan. d. Pemeliharaan Perangkat lunak akan mengalami perubahan setelah disampaikan kepada pelanggan (perkecualian yang mungkin adalah perangkat lunak yang dilekatkan). Perubahan akan terjadi karena kesalahan-kesalahan ditentukan, karena. perangkat. perubahan-perubahan. lunak. harus. didalam. disesuaikan lingkungan. untuk. mengakomodasi. eksternalnya. (contohnya. 41.
(60) perubahan yang dibutuhkan sebagai akibat dari perangkat peripheral atau sistem operasi yang baru), atau karena pelanggan membutuhkan perkembangan fungsional atau unjuk kerja. Pemeliharaan perangkat lunak mengaplikasikan lagi setiap fase program sebelumnya dan tidak membuat yang baru lagi.. 42.
(61) BAB IV ANALISA DAN PERANCANGAN. 4.1. Identifikasi. 4.1.1 Sistem Yang Berjalan 4.1.1.1. Metode. Metode kerja dari search engine secara umum dibagi menjadi dua bagian yaitu human-powered directories dan crawler-based search engines. Adapun contoh dari human-powered directories adalah yahoo!. Human-powered directories adalah metode yang pertama dan tertua dari search engine atau sering disebut metode indeks dan katalog. Beberapa layanan search engine menggunakan sebuah program yang disebut robot, crawler, atau spider. Metode ini masuk ke dalam Crawler-Based Search Engine . Contoh dari crawler-based search engines adalah Hotbot. Sesuai dengan perkembangan jaman, kebanyakan search engine dewasa ini menggunakan kedua tipe ini dan disebut hybrid search engine. Search engine yang tergolong dalam kategori ini disebut meta-search engine. Adapun contoh dari tipe ini seperti Google. 4.1.1.2. Cara Kerja. 1. Human-powered directories Cara kerja dari metode human-powered directories adalah para administrator atau redaksi mengumpulkan alamat-alamat web kedalam berbagai direktori yang sesuai.. 43.
(62) Perubahan yang dilakukan di website tersebut tidak akan merubah informasi yang ada di direktori search engine 2. Crawler-Based Search Engine. Gambar 4-1 Alur Crawler-Based Search Engine Cara kerja dari metode Crawler-Based Search Engine terdiri dari tiga bagian penting. a. Pertama dengan melakukan “perayapan” dan “mata-mata”, mereka akan mendata dan akan melakukan tugasnya kembali sekitar dua atau tiga bulan untuk memantau perubahan. b. Kemudian bagian kedua adalah pengindeksan, semua data-data yang diperoleh hasil dari kegiatan pertama di indeks dalam direktori yang sesuai. Perubahan dari kegiatan pertama akan merubah pengindeksan. c. Kemudian langkah ketiga adalah menggunakan search engine software untuk mendata dan mengklasifikasikan data-data di indeks sesuai dengan permintaan pengunjung.. 44.
(63) 3. Meta-search engine Sistem kerja dari metode ini adalah mereka mencari file-file atau alamat web yang dibutuhkan dari search engine-search engine yang lain. Setelah itu, search engine yang menggunakan metode ini akan menggambil hasilnya dan menampilkannya. Meta search engine akan melakukan tugas pensortiran data-data yang diperoleh sebelum menampilkannya, sehingga tidak ada data-data yang rangkap.. 4.1.2 Identifikasi Masalah The American Heritage Dictionary mendefinisikan search engine sebagai sebuah program perangkat lunak (software) yang menelusur, menjaring, dan menampilkan informasi dari pangkalan data. Informasi yang ditampilkan mengandung atau berhubungan dengan suatu istilah spesifik. Metode kerja dari search engine secara umum dibagi menjadi dua bagian yaitu human-powered directories dan crawler-based search engines. Sesuai dengan perkembangan jaman, kebanyakan search engine dewasa ini menggunakan kedua tipe ini dan disebut hybrid search engine. Search engine yang tergolong dalam kategori ini disebut meta-search engine. Cara kerja metode-metode di atas memang berbeda-beda namun metode-metode tersebut memiliki kesamaan pada hasil pencarian, yaitu menampilkan hasil pencarian yang mengandung kata-kata yang dicari, tanpa menganalisa hubungan kekerabatan kata tersebut dengan kata yang lain. Dengan Metode fuzzy relation maka kata pencarian akan dianalisa hubungan kekerabatan suatu kata dengan kata lainnya. Sehingga informasi yang dihasilkan lebih. 45.
(64) relevan dan tidak terbatas pada bentuk masukan kata. Berdasarkan hal tersebut maka penulis mencoba menerapkan metode fuzzy relation pada search engine untuk paper atau karya ilmiah. 4.1.3 Analisa Kebutuhan Berdasarkan identifikasi masalah di atas, search engine dalam melakukan pencariannya hanya berdasarkan teks saja sehingga dokumen-dokumen yang dicari hanya dokumen yang mengandung kata-kata yang dicari saja tanpa menganalisa hubungan kekerabatan kata-kata yang dicari. Kemampuan untuk menganalisa hubungan kekerabatan kata pencarian pada search engine merupakan nilai tambah karena informasi yang dihasilkan lebih relevan dan tidak terbatas pada bentuk masukan kata. Kemampuan untuk dapat menganalisa hubungan kekerabatan suatu kata pada search engine dapat digunakan metode fuzzy relation. Dengan metode ini maka pencarian akan dilakukan dengan menganalisa hubungan kekerabatan suatu kata terlebih dahulu, baru kemudian kata-kata pencarian dan kata yang memiliki hubungan kekerabatan dengan kata pencarian dilakukan pencarian terhadap dokumen.. 4.1.4 Pemecahan Masalah Berdasarkan identifikasi masalah di atas, pemecahan masalah dalam penelitian ini dijabarkan dengan kerangka pemikiran sebagai berikut : 1. Proses mengubah file portable document format (pdf) ke file teks Ini adalah proses yang dilakukan untuk mengubah file pdf menjadi format yang dapat dibaca secara program (PHP).. 46.
(65) 2. Indexing Proses indexing adalah proses mengubah/menyimpan dokumen ke dalam penyimpanan data. 3. Pembobotan keyword Proses pembobotan keyword adalah proses perhitungan relasi fuzzy suatu keyword terhadap sebuah dokumen. 4. Searching Proses Searching seperti namanya, proses ini adalah proses untuk mencari data yang telah disimpan. Proses ini sering disebut juga proses information retrieval.. 4.2. Analisa Sistem search engine secara konseptual dapat dilihat pada gambar 4-2 dan. gambar 4-3. Berdasarkan gambar 4-2 di bawah dapat kita lihat bahwa masukan berupa : (1) kumpulan dokumen, dan (2) search word dari pemakai. Sedangkan keluaran adalah dokumen berkaitan yang terambil.. Search Word. Proses Searching. Kumpulan Dokumen. Hasil Pencarian (dokumen yang berkaitan). Gambar 4-2 Sistem Search Engine. 47.
(66) Kumpulan Dokumen File pdf Simpan file pdf ke folder journals File pdf letak file pdf dan Kata kunci. Ubah pdf ke text dan simpan sebagai cahce File text Parsing File text kata Stop word Kata Non stop word Kata di library Database. Hitung relasi fuzzy Nilai relasi fuzzy. Nilai relasi fuzzy. keyword Validasi keyword dan tentukan mode pencarian. Hitung keyword attach to paper. Cari snipset/ cuplikan Keluaran. keyword. Hasil pencarian (Dokumen yang terkait). Gambar 4-3 Detail Sistem Search Engine Dengan Metode Fuzzy Relation. 48.
(67) Gambar 4-3 menggambarkan sistem search engine dengan menggunakan metode fuzzy relation. Pada Gambar 4-3 masing-masing proses di tandai oleh garis putus-putus. Garis putus-putus di atas menandakan proses indexing, sedangkan garis putus-putus bawah menandakan proses searching. Walaupun pada gambar 4-3 proses indexing dan searching dijadikan satu, namun masing-masing proses tidak dilakukan pada waktu yang sama. a. Indexing 1. Proses indexing dimulai dengan pemasukan file pdf oleh admin. 2. Kemudian proses dilanjutkan dengan penyimpanan file pdf ke direktori Journals. 3. Kemudian akan dilakukan pendataan terhadap semua file pdf yang ada pada sebuah direktori Journals dan kata kunci file pdf tersebut ke dalam database. 4. Kemudian proses dilanjutkan dengan mengubah file pdf ke dalam format teks, kemudian semua dokumen dengan format teks hasil konversi disimpan pada direktori cache. Pada direktori cache inilah sebuah dokumen yang akan di-index akan diambil beberapa teks yang dicari untuk keperluan pemberian snippets (snippets adalah cuplikan kecil pada hasil pencarian). 5. Setelah semua dokumen disimpan pada direktori cache proses berlanjut dengan proses parsing file teks yang telah dikonvert. Adapun proses parsing adalah : -. Pembacaan dari file teks. Hasil pembacaan dari file teks adalah seluruh isi dari file teks termasuk tanda baca dan new line (\n). 49.
Dokumen terkait
d. Augmented product , yaitu ada sesuatu nilai tambah yang di luar apa yang di bayangkan oleh konsumen, misalnya di kamar ada TV dengan remote control, memiliki berbagai
Y25: Jumlah toilet yang ada baik di dalam atau di luar area Objek Wisata Candi Kalasan memadai wisatawan yang datang. Y26: Terdapat fasilitas tempat sampah baik di dalam atau di
Dari hasil percobaan dapat diketahui penyerapan warna sinar polikromatik oleh kertas mika berwarna, yaitu apabila kertas warna merah dipakai sebagai filter maka
Aditif yang digunakan meliputi benzotriazol, sulfur elemental, dibutilfosfit, dan 2,5-dimercapto-1,3,4-thiadiazol (DMTD) serta kombinasinya. Hasil-hasil percobaan menunjukkan bahwa
Berdasarkan penelitian yang dilakukan di RSUD Labuang Baji Makassar menunjukkan ada hubungan antara pelayanan keparawatan dengan kepuasan pasien, dimana responden
5) menyiapkan konsep laporan hasil kajian dan pemantapan kelembagaan dan sumber daya manusia keamanan pangan segar. Melakukan penyiapan bahan penyusunan konsep
menjelaskan materi sulit dipahami oleh siswa, sehingga banyak siswa kurang dapat memahami materi yang diajarkan; 5) tidak adanya kondisi yang memungkinkan siswa untuk
Latar Belakang : Penyakit arteri perifer pada penderita Sindroma Koroner Akut telah diketahui berhubungan dengan kejadian kardiovaskular yang berat.. Namun sayangnya