SISTEM INFORMASI BERBASIS WEB
INFORMATION RETRIEVAL
KERJA PRAKTEK
Diajukan untuk Memenuhi
Tugas Mata Kuliah Kerja Praktek
Program Strata Satu Jurusan Teknik Informatika
Fakultas Teknik dan Ilmu Komputer
ALEN MAULANA 10110188
SYAKA LAMBANG PRASETYO 10110202
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
ii
DAFTAR LAMPIRAN ... vii
BAB I PENDAHULUAN ... 1
BAB II TINJAUAN PUSTAKA... 5
2.1 Profil PT INTI ... 5
2.1.1 Sejarah PT INTI ... 5
2.1.2Logo PT INTI ... 9
2.1.3Badan Hukum Instansi ... 9
2.1.4Struktur Organisasi ... 10
2.2 Landasan Teori ... 11
BAB III PEMBAHASAN ... 14
iii
3.2 Analisis Sistem ... 14
3.3 Masukan Perangkat Lunak ... 14
3.4 Proses Yang Terjadi Didalam Perangkat Lunak ... 20
3.4.1 Hapus Tag HTML ... 16
3.6 Analisis Kebutuhan Non Fungsional... 24
3.6.1 Analisis dan Kebutuhan Perangkat Lunak ... 24
3.6.2 Use Case Diagram ... 24
3.7 Identifikasi Aktor ... 25
3.7.1 Identifikasi Use Case ... 25
3.7.1.1 Use Case Login ... 26
BAB IV KESIMPULAN DAN SARAN ... 48
4.1 Kesimpulan ... 48
4.2 Saran ... 48
i
KATA PENGANTAR
Puji syukur kami panjatkan kepada Allah SWT atas segala nikmat dan karunia yang telah diberikan sehingga dapat menyelesaikan Laporan Kera Praktek ini dengan judul “Sistem Informasi Berbasis Web Retrieval Information”.
Penyusunan Laporan Kerja Praktek ini merupakan salah satu sarat memenuhi Mata Kuliah Kerja
Prakek Program Strata Satu Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer, di
Uneversitas Komputer Indonesia.
Dalam penulisan Laporan Kerja Praktek ini, kami tela mendapatkan banyak batuan dari berbagai
pihak, baik dari segi materi, spirit maupun masukan – masukan yang sangat membangun. Pada
kesempatan ini secara khusus kami ingin menyampaikan ucapan terimakasih kepada :
1. Kedua Orang Tua yang selalu memberi dukungan, semangat, kasih sayang serta doa.
2. Irawan Afrianto, S.T.,MT. selaku Ketua Jurusan Teknik Informatika Fakultas Teknik dan Ilmu
Komputer Universitas Komputer Indonesia.
3. Iskandar Ikbal, S.T.,M.Kom Selaku dosen pembimbing yang telah meluangkan waktu serta
bantuan kepada kami dalam penulisan Laporan Kerja Praktek ini.
4. Bpk. Saad Noor selaku pembimbing Praktek Kerja Lapangan.
5. Bapak/Ibu Staff di PT INTI Bandung.
6. Karyawan Sekretariat Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer
Universitas Komputer Indonesia
7. Seluruh Staf Perpustakaan yang membantu kami mendapatkan referensi dalam penyusunan
laporan.
8. Keluarga Tersayang atas semua semangat dan Doanya.
9. Teman – teman kelas IF – 5 2010 atas semua dukungan dan bantuan ilmu yang diberikan kepada
kami selama kuliah bersama di Universitas Komputer Indonesia.
10. Semua pihak yang tidak dapat kami sebutkan satu persatu.
Kami menyadari bahwa penulisan Laporan Kerja Praktek ini masih jauh dari sempurna. Oleh
karena itu, kami sangat mengharapkan saran dan kritik yang bersifat membangun demi kesempurnaan
penulisan dimasa yang akan datang. Akhir kata, semoga Laporan Kerja Praktek ini dapat bermanfaat
bagi kami khususnya dan untuk semua pembaca umumnya.
Bandung, Agustus 2013
DAFTAR PUSTAKA
Darmadi, B.A, Intan R., Lim, R., 2006, Aplikasi Search Engine Paper / Karya Ilmiah Berbasis
WEB dengan Metode Fuzzy Relation.
Grossman, D.A, Frieder, O. 2004, Information Retrieval : Algorithms and Heuristics 2nd
Edition, Springer, Netherland.
Snasel, V; Abraham, A; Owais, S; Platos, J; Kromer,P , 2008, Optimizing Information Retrieval
Using Evolutionary Algorithm and Fuzzy Inference System.
http://tiekawati.wordpress.com/2012/10/13/database-dan-sistem-retrieval-informasi-2/
1 BAB I PENDAHULUAN 1.1Latar Belakang Masalah
Sistem Informasi Berbasis Web Information Retrieval merupakan salah satu
Mesin Pencari berbasis web yang bisa mencari Informasi yang Diinginkan.
Sistem Informasi Retrieval sangat berguna untuk melakukan pencarian informasi
pada document, pencarian metadata yang menjelaskan document atau melakukan
pencarian pada database, baik relasi database yang stand-alone atau hypertext
database yang terdapat pada network seperti internet atau world wide web atau
intranet, untuk teks, suara, gambar atau data.
Saat ini Sistem Informasi Retrieval digunakan untuk mesin pencari semacam
google , dan applikasi semacam website pencari lainnya untuk mencari document,
data, image dan sebagainya.
Indonesia memiliki begitu banyak penduduknya dan rata-rata penduduk
Indonesia memakai fasilitas Internet untuk mencari informasi, bersocial media
dan pasti setiap orang yang memakai Internet ada maksud dan tujuan yaitu
mencari informasi dan pasti memakai Web Information Retrieval dan mencari
sebuah data atau informasi.dan saat kami berada di PT Inti kami disuruh membuat
sebuah Sistem Informasi Berbasis Web maka kami memilih judul “SISTEM INFORMASI BERBASIS WEB INFORMATION RETRIEVAL”.
1.2Perumusan Masalah
Dalam melakukan penyusunan Laporan Praktek Kerja Lapangan ini, masalah
pokok yang akan kami bahas adalah bagaimana membuat sebuah Sistem
Informasi Berbasis Web Information Retrieval.
1.3Maksud dan Tujuan 1.3.1 Maksud
Bagaimana cara untuk mempermudah user dalam mencari Informasi
Data, Image atau Informasi lainnya
2
Mempermudah user dalam mencari informasi Data dengan menggunakan Applikasi berbasis Web
1.4Batasan Masalah
Batasan masalah pada pembuatan Sistem Informasi berbasis web Information
Retrieval.
Data yang ditampilkan adalah data yang ada di database dan yang kita input kan
Perangkat lunak yang digunakan adalah PHP My SQL Windows 7 sebagai Sistem Operasi
1.5Metode Penelitian
Gambar 1.1 Metode Penelitian
Metodologi yang digunakan dalam penulisan Laporan Praktek Kerja
Lapangan ini adalah sebagai berikut :
3
Untuk mendapatkan data dan bahan Laporan Praktek Kerja
Lapangan ini, teknik pengumpulan data yang digunakan ada tiga jenis,
diantaranya sebagai berikut : 1) Metode Observasi
Teknik pengumpulan data dengan mengadakan pengamatan
atau kegiatan yang sistematis terhadap objek yang dituju secara
langsung
2) Metode Studi Pustaka
Yang terdiri dari pengumpulan data melalui informasi dari
buku – buku pedoman dan website yang berhubungan.
3) Metode Wawancara
Adalah suatu metode penelitian dengan mengadakan tanya
jawab langsung dengan pihak – pihak yang berhubungan dengan
masalah yang akan dibahas.
b. Analisis
Dilakukan analisis pada aplikasi yang akan dibangun agar sesuai
dengan kebutuhan.
c. Coding
Dilakukan penerjamahan aplikasi yang akan dibangun kedalam
bahasa pemograman tertentu, dalam hal ini menggunakan bahasa
pemograman c#.
d. Implementasi dan Pengujian
1) Implementasi
Implementasi dengan menerapkan aplikasi ini ke dalam system
yang selanjutnya akan dievaluasi.
2) Pengujian
Pengujian dengan menerapkan ke system yang sebenarnya,
untuk mengetahui apakah aplikasi ii sudsh sesuai dengan kebutuhan.
4
Tahap akhir dimana suatu perangkat lunak yang sudah selesai
dapat mengalami perubahan – perubahan atau penambahan.
1.6Sistematika Penulisan
Penulisan dan penyusunan Laporan Kerja Praktek ini disusun berdasarkan
pada penulisan sistematika sebagai berikut :
BAB I PENDAHULUAN
Menguraikan tentang latar belakang permasalahan, mencoba merumuskan
inti permasalahan, mencoba merumuskan inti permasalahan yang dihadapi,
menentukan tujuan dan maksud kerja praktek, yang kemudian diikuti dengan
pembatasan masalah, metode penelitian, serta sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Membahas mengenai profil PT INTI, yang terdiri dari sejarah, logo, dan
badan hukumnya. Serta membahas berbagai konsep dasar dan teori – teori
yang berkaitan dengan kerja praktek yang dilakukan dan hal – hal yang
berguna dalam proses analisis permasalahan.
BAB III PEMBAHASAN
Menganalisis kebutuhan system pengguna diataranya yaitu : analisis
prosedur yang berjalan, analisis data dari hasil penelitian, analisis basis data,
analisis non-fugsional. Perancangan sistem yang dimulai dari perancangan
prosedural hingga perancangan alir data serta tahap merancang struktur desain
menu dan antar muka (interface).
BAB IV KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran yang telah diperoleh dari hasil penulisan
5 BAB II
TINJAUAN PUSTAKA 2.1 Profil PT. Industri Telekomunikasi Indonesia Badan Usaha Milik Negara
Berdiri sejak 1974 yang berkantor pusat di Bandung. Selama lebih dari 3
dasawarsa PT.INTI berperan sebagai pemasok utama pembangunan jaringan
telepon nasional PT TelkomIndosat.
PT. INTI telah berkiprah dalam bisnis telekomunikasi selama 35 tahun
Dengan 695 orang karyawan tetap (Maret 2009). Pelanggan utama INTI antara
lain adalah THE BIG FOUR dan XL.
Sejak berkembangnya tren konvergensi antara teknologi telekomunikasi
dan teknologi informasi (IT), INTI telah melakukan perubahan orientasi bisnis
dari yang semula berbasis pure manufacture menjadi sebuah industri yang
berbasis solusi kesisteman, khususnya dalam bidang sistem infokom dan integrasi
technologi. INTI menangani solusi dan layanan integrasi jaringan tetap maupun
seluler, konten IT, seat management serta mengembangkan produk-produk seperti
IP PBX, Network Management SystemSubscriber Line Maintenance System Video
Messaging System Interface Monitoring System Disaster Forecasting and
Warning System
2.1.1 Sejarah PT INTI
a. Eksistensi & Perkembangan INTI (1974 – 2004)
Dari cikal bakal Laboratorium Penelitian & Pengembangan Industri Bidang Pos dan Telekomuniasi (LPPI-POSTEL), pada 30 Desember 1974 berdirilah PT Industri Telekomunikasi Indonesia (INTI) sebagai Badan Usaha Milik Negara (BUMN) dengan misi untuk menjadi basis dan tulang punggung pembangunan Sistem Telekomunikasi Nasional (SISTELNAS). Seiring waktu dan berbagai dinamika yang harus
6 b. Milestone Sejarah INTI
1. Era 1974 – 1984
Fasilitas produksi yang dimiliki INTI antara lain adalah:
a. Pabrik Perakitan Telepon b. Pabrik Perakitan Transmisi
c. Laboratorium Software Komunikasi Data d. Pabrik Konstruksi & Mekanik
Kerjasama Teknologi yang pernah dilakukan pada era ini antara lain dengan Siemens, BTM, PRX, JRC, dan NEC. Pada era tersebut produk Pesawat Telepon Umum Koin (PTUK) INTI menjadi standar Perumtel (sekarang Telkom).
2. Era 1984 – 1994
Fasilitas produksi terbaru yang dimiliki INTI pada masa ini, disamping fasilitas-fasilitas yang sudah ada sebelumnya, antara lain adalah Pabrik Sentral Telepon Digital Indonesia (STDI) pertama di Indonesia Trough Hole Technology Surface Mounting Technology.
Kerjasama Teknologi yang pernah dilakukan pada era ini antara lain adalah:
a. Switching Siemens
b. Siemens
c. Siemens
d. TatungTEL
Pada era ini, INTI memiliki reputasi dan prestasi yang signifikan, yaitu:
1. Menjadi pionir dalam proses digitalisasi sistem dan jaringan telekomunikasi di Indonesia.
7 3. Era 1994 – 2000
Selama 20 tahun sejak berdiri, kegiatan utama INTI adalah murni manufaktur. Namun dengan adanya perubahan dan perkembangan kebutuhan teknologi, regulasi dan pasar, INTI mulai melakukan transisi ke bidang jasa engineering. Pada masa ini aktivitas manufaktur di bidang switching situasi pasar yang berubah, kompetisi yang makin ketat dan regulasi telekomunikasi yang makin terbuka menjadikan posisi INTI di pasar market leader sales forcenetworking yang lebih baik. Kerjasama teknologi masih berlangsung dengan Siemens single-source
4. Era 2000 – 2004
Single source multi source multinasional dari Eropa dan Asia. Aktivitas manufaktur tidak lagispin-off anak-anak perusahaan dan usaha patungan, seperti:
Bidang CPE, dibentuk anak perusahaan bernama PT. INTIPISMA International yang bekerja sama dengan JITech International, bertempat di Cileungsi Bogor. Bidang mekanik dan plastik, dibentuk usaha patungan
dengan PT PINDAD bernama PT. IPMS, berkedudukan di Bandung.
Switching dengan beberapa perusahaan multinasional yang
memiliki kapabilitas memadai dan adaptif terhadap kebutuhan pasar
Beberapa perusahan multinasional yang telah melakukan kerjasama pada era ini, antara lain:.
1. SAGEM, di bidang transmisi dan selular 2. MOTOROLA, di bidang CDMA
3. fixed & optical access network 4. Ericsson, di bidang akses 5. switching
5. 2005 – sekarang
8
nasional dan dengan kompetensi sumberdaya manusia yang terus
diarahkan sesuai proses transformasi tersebut, saat ini INTI bertekad untuk menjadi mitra terpercaya di bidang penyediaan jasa profesional dan solusi total yang Infocom System & Technology Integration
Visi
INTI bertujuan menjadi pilihan pertama bagi para pelanggan untuk
mentransformasikan “MIMPI” menjadi “REALITA”
Misi
Fokus bisnis tertuju pada kegiatan jasa engineering yang sesuai dengan
spesifikasi dan permintaan konsumen memaksimalkan value (nilai) perusahaan
serta mengupayakan growth (pertumbuhan) yang berkesinambungan berperan
sebagai prime mover (penggerak utama) bangkitnya industri dalam negeri.
Tujuan
Dalam kurun waktu 2006-2010 tujuan perusahaan dirangkum dalam butir-butir
sebagai berikut:
Menjadi perusahaan yang memiliki kinerja yang baik, ditinjau dari
perspektif keuangan, proses internal maupun organisasi dan SDM. Menjadi perusahaan yang memberikan lesejahteraan kepada karyawan. Memberikan nilai yang tinggi untuk produk dan jasa kepada pelanggan. Memberikan nilai kembali yang memadai atas saham.
Turut melaksanakan dan menunjang kebijaksanaan dan program
pemerintah di bidang ekonomi dan pembangunan nasional pada umumnya
dan khususnya di bidang industri telekomunikasi, elektronika dan
informatika dengan memperhatikan prinsip-prinsip yang berlaku bagi
9 2.1.2 Logo PT INTI
Setiap perusahaan pasti memiliki logo tersendiri untuk simbol
sebuahperusahaan dan sebagai cerminan visi dan misi perusahaan. Logo PT. INTI dapat dilihat pada Gambar 2.1.
Gambar 2.1 Logo PT.INTI
trusted partner dari PT. INTI adalah :
a) Menguasai teknologi informasi dan telekomunikasi
b) Meningkatkan kemampuan nasional di bidang teknologi informasimaupun teknologi komunikasi
c) Sebagai penunjang utama dalam pembangunan sistem telekomunikasi nasional
d) Meningkatkan kemampuan perusahaan untuk tumbuh dan berkembang dengan kekuatan sendiri Menjadi sumber devisa bagi kemajuan Negara
2.1.3 Badan Hukum Instansi
Badan hukum PT INTI Bandung termasuk ke dalam Perseroan
10
perseorangan yang ada di dalamnya. Di dalam PT pemilik modal tidak harus memimpin perusahaan, karena dapat menunjuk orang lain di luar pemilik modal untuk menjadi pimpinan. Untuk mendirikan PT / perseroan terbatas dibutuhkan sejumlah modal minimal dalam jumlah tertentu dan berbagai persyaratan lainnya. Dalam kitab Undang – Undang Hukum Dagang tidak satu pasal pun yang menyatakan perseroan sebagai badan hukum, tetapi dalam Undang – Undang Perseroan Terbatas secara tegas dinyatakan dalam Pasal 1 ( but ir 1) bahwa Perseroan adalah badan hukum, ini berarti perseroan tersebut memenuhi syarat keilmuan sebagai pendukung kewajiban dan hak, antara lain memiliki harta kekayaan sendiri terpisah dari harta kekayaan pendiri atau pengurusnya.
2.1.2 Struktur Organisasi dan Job Description
Berpusat di Bandung dengan 695 orang karyawan tetap (posisi Maret 2009), PT INTI (Industri Telekomunikasi Indonesia) telah berkiprah dalam bisnis telekomunikasi selama 35 tahun. Pelanggan utama INTI antara lain adalah operator telekomunikasi di Indonesia (Telkom, Indosat, Telkomsel dan XL)
. Struktur organisasi PT. INTI dapat dilihat pada Gambar 2.2
.
11 2.2 Landasan Teori
2.2.1 Sistem
Sistem adalah suatu kesatuan utuh yang terdiri dari beberapa bagian yang saling berhubungan dan berinteraksi untuk mencapai tujuan tertentu .
2.2.2 Informasi
Informasi merupakan hasil dari pengolahan data menjadi bentuk yang
lebih berguna bagi yang menerimanya yang menggambarkan suatu kejadian –
kejadian nyata da dapat digunakan sebagai alat bantu untuk pengambilan
keputusan.
Sistem Informasi adalah suatu cara tertentu untuk menyediakan
informasi yang dibutuhkan oleh organisasi untuk beroperasi denga cara yang
sukses.
2.2.3 Database
Merupakan Representasi kumpulanfakta yang saling berhubungan disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan Data perlu disimpan dalam basis data untuk keperluan penyediaan informasi lebih lanjut. Data di dalam basis data perlu diorganisasikan sedemikian rupa, supaya informasi yang dihasilkan
berkualitas.Organisasi basis data yang baik juga berguna untuk efisiensi kapasitas penyimpanannya. Dalam maksud yang sama, bisa juga diartikan sebagai
sekumpulan informasi yang disusun sedemikian rupa untuk dapat diakses oleh sebuah software tertentu.
Database tersusun atas bagian yang disebut field dan record yang tersimpan dalam sebuah file Sebuah field merupakan kesatuan terkecil dari informasi dalam sebuahdatabase. Sekumpulan field yang saling berkaitan akan membentuk record.Dalam membuat aplikasi ini, kami membuat di microsoft access 2007 sebagai database kami. Microsoft Access merupakan salah satu software pengolah database yang berjalan dibawah sistem WINDOWS.
Microsoft Access merupakan salah satu produk Office dari Microsoft yang dapat menangani database dengan skala besar maupun kecil. Dalam
12 2.2.4 Web Programming
PHP(Hypertext Preprocessor) merupakan bahasa pemrograman yang berjalan di sisi server atau biasa disebut dengan Server Side Secara garis besar bahasa pemrograman web terdiri dari dua macam. Yang pertama disebut dengan Client Side atau script yang dijalankan di komputer client dan yang kedua biasanya disebut dengan Server Side atau script Yang dijalankan pada komputer server.Untuk dapat menjalankan PHP membutuhkan sebuah web server, disini, kami menggunakan Wamp server sebagai web servernya.
2.2.5 Web Server
Wamp server (dahulu wamp5) aplikasi ini dirancang untuk menjadi windows web linkungan pengembangan,hal ini memungkinkan untuk membuat aplikasi web dengan apache,php, dan database mysql.
Wamp server juga dilengkapi dengan php myadmin dan sqlitemanager untuk dengan mudah mengelola database anda.
Wamp server diinstal secara otomatis (installer), dan penggunaannya sangat intuitif.User dapat menyetel server anda tanpa menyentuh file pengaturan.
Wamp server merupakan salah satu solusi yang akam memungkinkan untuk mereproduksi server produksi.
Wamp server setelah terinstal akan terintegrasi dengan apache, mysql, Dan php.Wamp server juga memiliki trayicon untuk mengelola server anda dan
pengaturannya.
2.2.6 Flowchart
Flowchart merupakan gambar atau bagan yang memperlihatkan urutan dan
hubungan antar proses beserta intruksinya. Gambaran ini dinyatakan dengan symbol . Dengan demikian symbol menggambakan proses tertentu. Sedangkan
proses digambarkan dengan garis penghubung.
Dua macam flowchart yang menggambarkan proses dengan computer,
yaitu :
1) Sistem Flowchart
Bagan yang memperlihatkan urutan prosedur dan proses dari
beberapa file dalam media tertentu.Sistem flowchart
13
1. Hubungan antar suatu file dengan file lainnya.
2. Media yang dipakai untuk setiap file
2) Program Flowchart
Bagan yang memperlihatkan urutan dan hubungan proses dalam
14 BAB III PEMBAHASAN 3.1Analisis Masalah
Pada bagian ini akan dilakukan analisis terhadap Information Retrieval System (IRS) dengan menggunakan Model Ruang Vektor. Hasilnya digunakan untuk mengidentifikasi dan mengevaluasi hasil implementasi dan pengujian yang akan dibahas pada bab berikutnya. Dari proses analisis akan dapat dihasilkan berbagai macam saran perbaikan terhadap sistem yang dapat dijadikan dasar dalam perancangan Information Retrieval System.
3.2Analisis Sistem
Dari hasil survey IDC (Internasional Data Corporation) dapat diketahui bahwa dokumen yang terdapat dalam dunia maya terus bertambah. Hal ini menimbulkan kesulitan dalam menemubalikkan dokumen-dokumen tersebut. Faktor utama dalam proses pencarian suatu dokumen di dunia maya adalah bagaimana dokumen tersebut ditemubalikkan sesuai atau relevan dengan keyword atau query yang di inputkan oleh user yang akan mencari dokumen berita tersebut.
Oleh karena itu, berbagai macam penelitian di area ini telah banyak dilakukan, salah satunya adalah melalui disiplin ilmu IR (Information Retrieval).IR merupakan bidang yang mengkaji metode-metode di dalam pencarian dokumen berdasarkan representasi kebutuhan informasi berupa kata kunci,yaitu keyword atau query.
3.3Masukan Perangkat Lunak
Input dari suatu sistem temu balik informasi ini adalah query dari pengguna dan koleksi dokumen. Koleksi dokumen yang digunakan dalam sistem temu balik informasi ini yaitu content berita IT berbahasa indonesia yang dapat dikumpulkan secara manual dari situs penyedia berita di internet.
3.4Proses Yang Terjadi Didalam Perangkat Lunak
Perangkat lunak dalam laporan kerja praktek ini merupakan aplikasi Information Retrieval System dengan menggunakan Model Ruang Vektor dan metode pembobotan Term Frequency–Inverse Document Frequency (TF_IDF). Information Retrieval System ini secara umum terdapat 2 tahapan besar, yaitu preprocessing/indexing dan retrieval. Pada tahapan preprocessing mencakup penghapusan tag, tokenization, filtration, stemming, dan weigthing.Kemudian dilanjutkan dengan menyimpan setiap term yang penting ke dalam suatu index (dalam sistem ini menggunakan suatu tabel pada database MySQL).
Information Retrieval System ini akan menerima query dari pengguna kemudian memproses query tersebut dan sistem akan
15
tersedia, untuk menghasilkan kumpulan dokumen relevan dan terurut berdasarkan ranking kerelevanannya dengan query dari pengguna.Berikut ini adalah gambar dari deskripsi umum sistem :
Gambar 3.1 Proses Yang Terjadi Dalam Sistem
Dalam preprocessing dilakukan beberapa tahapan untuk melakukan pengindeksan dokumen berita diantaranya penghapusan tag html,tokenization, filtration, stemming dan weighting.Berikut ini adalah penjelasan tahapan-tahapan preprocessing yang akan diterapkan dalam sistem :
3.4.1 Hapus Tag HTML
Tahap ini menghapus semua tag markup dan format khusus dari
dokumen,terutama pada dokumen yang mempunyai banyak tag dan format
seperti dokumen (X)HTML.Untuk penghapusan tag HTML menggunakan
fungsi PHP strip_tags().Pseudocode : strip_tags(“<b>google</b>”);
16
Gambar 3.2 Flowchart Hapus Tag HTML
Dokumen berita :
Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi akan lenyap. Bukan karena Google menghapusnya, tetapi karena raksasa internet itu ingin 'membuang' kedua nama produk itu untuk diganti
namanya.
Sebelum tag html dihapus :
Dua layanan populer milik <b>Google</b>, <i>Picasa</i>dan
<i>Blogger</i> tidak lama lagi akan lenyap. Bukan karena
<b>Google</i> menghapusnya, tetapi karena raksasa internet itu ingin
17 Setelah tag html dihapus :
Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi
akan lenyap. Bukan karena Google menghapusnya, tetapi karena
raksasa internet itu ingin 'membuang' kedua nama produk itu untuk diganti
namanya.
Dari contoh diatas bisa diketahui ada 4 kata yang mengandung tag html
yang telah dihapus markup tag htmlnya.
3.4.1 Tokenization
Tokenization adalah tugas memisahkan deretan kata di dalam
kalimat, paragraf atau halaman menjadi token atau potongan kata tunggal
atau termmed word. Tahapan ini juga menghilangkan karakter-karakter
tertentu seperti tanda baca dan mengubah semua token ke bentuk huruf
kecil (lower case).Dibawah ini adalah
Flowchart alur Tokenization :
18
Untuk pemisahan kalimat ke bentuk kata menggunakan fungsi PHP explode().
Pseudocode :
explode(“ “, “Dua layanan populer milik Google”); Contoh tokenization :
Input :
Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi
akan lenyap. Bukan karena Google menghapusnya, tetapi karena raksasa internet
itu ingin 'membuang' kedua nama produk itu untuk diganti namanya.
3.4.1 Filtration
Filtration adalah proses penghapusan kata buang yaitu kata
sambung, kata depan, kata ganti, dll. Contoh stop words dalam bahasa
Indonesia : yang, juga, dari, dia, kami, kamu, aku, saya, ini, itu, atau, dan,
tersebut, pada, dengan, adalah, yaitu, ke, tak, tidak, di,pada, jika, maka,
ada, pun, lain, saja, hanya, namun, seperti, kemudian, karena, untuk, dll. Proses filtration menggunakan fungsi PHP str_replace().
Dibawah ini adalah array stopword yang telah di inputkan beserta
19
$astopword = array (" yang ", " juga ", " dari ", " dia ", " kami ", "
kamu ", "aku", " ini ", " itu ", " atau ", " dan ", " tersebut ", " pada ", "
dengan ", " adalah ", " yaitu ", " ke ", " tak "," tidak "," di ", " pada "," jika "," maka "," ada ", " pun "," lain "," saja ", " hanya "," namun "," seperti ","
kemudian "," untuk "," sudah ", " belum ", " memang "," sama ", " apa ","
apakah "," oleh ", " sangat "," sehingga "," memang "," dimana ","
sedangkan ", " selain "," tapi "," tetapi "," tanpa "," tiada "," dengan "," lain
"," akan "," lainnya "," tiada "," para ", " saat "," sebelum "," sesudah ","
karena ");
Data array akan dibaca oleh fungsi foreach :
foreach ($astopword as $i => $value) {
$teks = str_replace($astopword[$i], " ", $teks);
}
$teks adalah dokumen berita yana akan diproses oleh filtration.
20 Contoh Sebelum filtration :
dua layanan populer milik google picasa dan blogger tidak lama lagi
akan lenyap bukan karena google menghapusnya tetapi karena raksasa internet
itu ingin membuang kedua nama produk itu untuk diganti namanya
Setelah Filtration :
dua layanan populer milik google picasa blogger lama lenyap google
menghapus raksasa internet ingin membuang kedua nama produk diganti nama
3.4.4 Stemming
Stemming adalah pengubahan kata ke bentuk kata dasar atau penghapusan imbuhan. Stemming disini menggunakan kamus daftar kata berimbuhan yang mempunyai kata dasarnya dengan cara membandingkan kata-kata yang ada dalam dokumen berita dengan daftar kamus stem. Proses stemming menggunakan fungsi PHP str_replace. Berikut ini adalah contoh penggunaanya :
//buka tabel tbstem dan bandingkan dengan berita
$restem = mysql_query("SELECT * FROM stem ORDER BY id");
while($rowstem = mysql_fetch_array($restem)) {
$teks=str_replace($rowstem['term'],$rowstem['stem'], $teks);
21 Dibawah ini flowchart proses stemming :
Contoh kamus stemming
No Term Stem
1 layanan Layan
2 menghapus Hapus
3 membuang Buang
4 Kedua Dua
5 Diganti Ganti
22 Contoh stemming
dua layanan populer milik google picasa blogger lama lenyap google
menghapus raksasa internet ingin membuang kedua nama produk diganti nama
Term yang berubah saat proses steming
Mengubah ubah , Tertentu tentu
Tahapan tahap, Dilaporkan lapor
Sebelum belum,
Setelah Stemming
dua layan popular milik google picasa blogger lama lenyap google hapus
raksasa internet ingin buang dua nama produk ganti nama
3.4.5 Weighting
Pembobotan kata sangat berpengaruh dalam menentukan
kemiripan antara dokumen dengan query. Apabila bobot tiap kata dapat
ditentukan dengan tepat, diharapkan hasil perhitungan kemiripan teks akan
menghasilkan perangkingan dokumen yang baik.
Bobot term di dalam Information Retrieval System (W) dihitung
menggunakan tf-idf yang didefinisikan sebagai berikut.
W= tf ×idf
Diketahui :
W = Bobot term
tf = banyaknya kemunculan suatu kata dalam suatu dokumen/berita.
Idf = ��� (�/� )
Diketahui :
N = Jumlah artikel dalam koleksi dokumen
dji = Banyaknya Dokumen (j) yang mengandu term (i)
23 Contoh kasus
Berita 1 : Saat mengubah suatu proses kita harus mengetahui tahapan yang
Berita 2 : Saat kita telah mendegar banyak proses berita yang merugikan Berita 3 : Tokenization adalah tugas proses memisahkan deretan kata
didalam kalimat,
Diketahui :
Berita = 3 (Jumlah berita)
Idf = ��� (�/� )
dji = Banyaknya berita (j) yang mengandu term (i)
Tf Berita 1 = Banyaknya muncul kata di Berita 1
Tf Berita 2 = Banyaknya muncul kata di Berita 2
Tf Berita 3 = Banyaknya muncul kata di Berita 3
W Berita 1 = Bobot kata di Berita 1
W Berita 2 = Bobot kata di Berita 2
W Berita 3 = Bobot kata di Berita 3
24 3.5Keluaran Perangkat Lunak
Output yang diharapkan dari Information Retrieval System ini
adalah dokumen yang dianggap relevan oleh sistem berupa berita yang telah terurut berdasarkan relevansi dengan query dari pengguna.
3.6Analisis dan Kebutuhan Non Fungsional
Analisis dan kebutuhan non fungsional meliputi analisis dan kebutuhan perangkat keras serta analisis dan kebutuhan perangkat lunak.
3.6.1 Analisis dan Kebutuhan Perangkat Lunak
Spesifikasi perangkat lunak yang digunakan dalam Information
Retrieval System ini adalah :
Sistem Operasi Microsoft Windows 7 Professional Software wampp sebagai Web Server
PHP sebagai bahasa pemrograman web Mysql sebagai sistem manajemen basis data Software utility Dreamweaver CS5.
3.6.2 Use Case Diagram
Pemodelan use case adalah pemodelan sistem dari
perspektif pandangan pemakai akhir (end user). Model use case adalah
pandangan dari luar sistem, sementara model rancangan adalah pandangan
dari dalam. Model use case menangkap penggunaan penggunaan sistem,
25
Dibawah ini adalah Use Case Diagram Information Retrieval :
3.7Identifikasi Aktor
Terdapat dua aktor yang berhubungan dengan Information Retrieval System.Aktor dapat diidentifikasikan sebagai berikut :
a. Aktor pertama ialah Administrator, mempunyai hak akses untuk pengelolaan dokumen berita, melakukan indexing, dan menerapkan model ruang vektor pada dokumen berita juga mempunyai hak akses ke halaman user untuk melakukan pencarian.
b. Aktor kedua ialah User, hanya mempunyai hak akses di halaman user untuk melakukan pencarian dokumen berita.
3.7.1 Identifikasi Use Case
Tabel 3.3 Identifikasi Use Case Information Retrieval System
No. Use Case
Deskrips i
1 Login Proses
ini melakukan autentikasi terhadap aktor yang menjalankan sistem untuk memastikan bahwa orang
yang bersangkutan memiliki hak akses terhadap
26
Proses bagi admin untuk melihat dokumen berita
4 Edit
Proses bagi admin untuk mengubah dokumen berita
5 Delete
Proses bagi admin untuk menghapus dokumen berita
6 Hapus tag html Proses untuk menghapus tag html
7 Tokenization Proses untuk memecah dokumen berita menjadi
potongan-potongan kata
8 Filtration
Proses untuk stopword menghilangkan kata-kata yang
tidak diperlukan untuk pengindeksan dan menghilangkan tanda baca.
9 Stemming
Proses untuk mengubah kata ke bentuk kata dasar atau
penghapusan imbuhan.
10 Term weighting
Proses untuk pemberian bobot tf.idf terhadap term
11 Hitung panjang vektor
Proses untuk menghitung panjang vektor dokumen
12 Retrieval Proses bagi admin untuk menemubalikkan dokumen
berita.
13 Pencarian Berita
Proses bagi user untuk pencarian dokumen berita
3.2.1.1Use Case Login
Proses ini melakukan autentikasi terhadap aktor yang menjalankan sistem
untuk memastikan bahwa orang yang bersangkutan memiliki hak akses terhadap
sistem. Use case login diterangkan dan dimodelkan dengan skenario, activity
27
Tabel 3.4 Skenario Use Case Login
Identifikasi
Nama Login
Tujuan Masuk ke dalam sistem
Deskripsi Proses login merupakan proses autentifikasi
untuk menggunakan sistem.
Aktor Administrator
Skenario Utama
Kondisi awal Form login ditampilkan
Aksi actor Reaksi sistem
1) Menampilkan form login
2) Mengisi Form Login 2) Cek field masih kosong
3) Mengautentifikasi data login dengan
data username pada basis data
4) Bila cocok sistem menampilkan
halaman menu utama
Skenario Alternatif ( Auntentifikasi Gagal)
Aksi Aktor Reaksi Sistem
1) Menampilkan Pesan bahwa data
28
29
Gambar 3.9 Sequence Diagram Login
3.2.1.2Use Case Add
Proses ini melakukan penambahan dokumen berita. Use case add
diterangkan dan dimodelkan dengan skenario, activity diagram dan sequence
30
Tabel 3.5 Skenario Use Case Add Identifikasi
Nam
a Add
Tujuan Menambah dokumen berita
Deskripsi Proses Add merupakan proses untuk
Kondisi awal Klik tombol add
Aksi aktor Reaksi sistem
1. Klik add 2.
Menampilkan Form tambah dokumen
berita. 3. Mengisi Form Dokumen berita
4.
Klik tombol
simpan 5. Memproses penambahan data
Skenario Alternatif ( Auntentifikasi Gagal)
Aksi Aktor Reaksi Sistem
1. Klik tombol batal 2. Kosongkan form
Kondisi akhir Tampil Sukses
31
Gambar 3.11 Sequence Diagram Add 3.2.1.3Use Case View
Proses ini menampilkan dokumen berita. Use case view diterangkan dan
dimodelkan dengan skenario, activity diagram dan sequence diagram.
Tabel 3.6 Skenario Use Case View Identifikasi
Nama View
Tujuan Menampilkan dokumen berita
Deskripsi Proses View untuk menampilkan berita.
Aktor Administrator
Skenario Utama
Kondisi awal Klik tombol view
Aksi actor Reaksi sistem
1. Klik view 2. Tampilkan dokumen berita
32
Gambar 3.12 Activity Diagram View
Gambar 3.13 Sequence Diagram View 3.2.1.4Use Case Edit
Proses ini untuk mengubah dokumen berita. Use case edit diterangkan dan
33
Tabel 3.7 Skenario Use Case Edit Identifikasi
Nama
Edi t
Tujuan Mengubah dokumen berita
Deskripsi Proses untuk mengubah dokumen berita
Aktor Administrator
Skenario Utama
Kondisi awal Klik tombol view
Aksi actor Reaksi sistem
1. Klik Edit 2. Tampilkan form Edit Berita
3. Ubah Dokumen Berita
4. Klik Simpan 5. Simpan Hasil Edit
Kondisi akhir Admin berhasil mengubah dokumen berita
34
Gambar 3.17 Sequence Diagram Delete
3.2.1.5Use Case Hapus Tag HTML
Proses untuk menghitung panjang vektor dokumen berita. Use case hitung
panjang vector diterangkan dan dimodelkan dengan skenario, activity diagram
dan sequence diagram.
Tabel 3.8 Skenario Use Case Hapus Tag HTML
Identifikasi
Nama Hapus Tag HTML
Tujuan Menghapus Tag HTML
Deskripsi Proses untuk menghapus Tag HTML
Aktor Administrator
Skenario Utama
Kondisi awal Klik tombol Markup-free document text
Aksi actor Reaksi sistem
1. Klik Markup-free document text 2. Hapus Tag HTML
Kondisi akhir
35
Gambar 3.18 Activity Diagram Hapus Tag HTML
36 3.3Analisis dan Kebutuhan Perangkat Keras
Spesifikasi perangkat keras yang digunakan dalam Information
Retrieval System ini adalah :
Processor : AMD Turion™ X2 Dual-Core Mobile RM-74 (2 CPUs)
3.4Perancangan Sistem
Perancangan akan dimulai setelah tahap analisis terhadap sistem selesai
dilakukan. Perancangan dapat didefinisikan sebagai proses aplikasi berbagai
teknik dan prinsip bagi tujuan pendefinisian suatu perangkat, suatu proses atau
sistem dalam detail yang memadai untuk memungkinkan realisasi fisiknya.
Perancangan digambarkan sebagai proses multi-langkah dimana representasi
struktur data, struktur program, karakteristik interface, dan detail prosedur,
disintesis dari persyaratan informasi.
3.5Perancangan Basis Data
Perancangan data mentransformasi model domain informasi yang dibuat
selama analisis ke dalam struktur data yang akan diperlukan untuk
37 3.5.1 Skema Relasi
Proses relasi antar file merupakan gabungan antar file yang mempunyai
kunci utama yang sama, sehingga file-file tersebut menjadi satu kesatuan yang dihubungkan oleh field kunci tersebut. Pada proses ini elemen-elemen
data dikelompokkan menjadi satu file database beserta entitas dan
hubungannya. Berikut adalah skema relasi antar tabel yang ada di aplikasi
Information Retrieval System:
Gambar 3.4 Skema Relasi
3.5.2 Struktur Tabel
Tabel adalah sekumpulan data atau informasi spesifik tentang subjek
tertentu yang disusun dalam bentuk kolom dan baris. Tabel adalah
komponen utama dan pertama dari sebuah database. Struktur tabel
yang terdapat dalam database Information Retrieval System sebagai
38 a. Tabel Berita
Tabel Berita digunakan untuk menyimpan dokumen-dokumen berita.
Tabel 3.5 Tabel Berita
b. Tabel Indexing
Tabel Indexing digunakan untuk menyimpan data hasil
preprocessing dan weighting (pembobotan).
Tabel 3.6 Tabel Indexing
c. Tabel Stem
Tabel Stem digunakan untuk menyimpan kamus atau koleksi
term-term yang akan diubah kebentuk kata dasarnya.
39 d. Tabel Vektor
Tabel Vektor digunakan untuk menyimpan hasil perhitungan panjang
vektor dari tiap dokumen berita.
Tabel 3.8 Tabel Vektor
e. Tabel Cache
Tabel Cache digunakan untuk menyimpan history query atau keyword
dan untuk menyimpan nilai kemiripan antara query dan dokumen berita.
Tabel 3.9 Tabel Cache
f. Tabel Admin
Tabel Admin digunakan untuk menyimpan data login administrator.
40 3.6Perancangan Struktur Menu
Gambar 3.36 Struktur Menu 3.7Perancangan Antar Muka
41 3.8Perancangan Tampilan
42
43
44
45
46
47
48
49
50
Gambar 3.46 Tampilan Awal Web
51 BAB IV
KESIMPULAN DAN SARAN 4.1 Kesimpulan
Berdasarkan hasil penelitian yang dilakukan oleh penulis pada unit
Sistem Informasi Management PT.INTI Bandung mengenai Information Retrieval
Pada unit Sistem Informasi Manajemen di PT.INTI Bandung, penulis dapat
menarik kesimpulan sebagai berikut :
1. Unit Sistem Informasi Management PT.INTI Bandung merupakan suatu
unit bagian Sistem Informasi yang berfungsi untuk me manajemen
Informasi Data dan jaringan.
2. Dengan adanya membangun Sistem Informasi berbasis web maka
memperlancar kegiatan pencarian berbagai Informasi Data di perusahaan.
3. Dengan adanya Sistem Informasi yang berbasis web bertujuan
mengefisienkan pengelolaan data.
4. Pembangunan Sistem Informasi berbasis web untuk mempermudah
pengaksesan dan pencarian data di PT INTI.
4.2 Saran
Berdasarkan hasil penelitian yang dilakukan oleh penulis pada unit
Sistem Informasi Management di PT.INTI Bandung mengenai Sistem Informasi
berbasis web Information Retrieval di PT.INTI Bandung, penulis akan
memberikan saran yang diharapkan dapat berguna sebagai pertimbangan dan
masukan bagi unit Sistem Informasi Management PT.INTI Bandung pada masa
yang akan datang,yaitu:
1. Lebih ditingkatkan lagi sistem Pencarian dan Pengelolaan data di PT.INTI
dengan Sistem Informasi berbasis web.
2. Menambahkan System Security pada Sistem Informasi agar lebih aman dan