• Tidak ada hasil yang ditemukan

Sistem Informasi berbasis web Information Retrieval

N/A
N/A
Protected

Academic year: 2017

Membagikan "Sistem Informasi berbasis web Information Retrieval"

Copied!
63
0
0

Teks penuh

(1)

SISTEM INFORMASI BERBASIS WEB

INFORMATION RETRIEVAL

KERJA PRAKTEK

Diajukan untuk Memenuhi

Tugas Mata Kuliah Kerja Praktek

Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer

ALEN MAULANA 10110188

SYAKA LAMBANG PRASETYO 10110202

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)

ii

DAFTAR LAMPIRAN ... vii

BAB I PENDAHULUAN ... 1

BAB II TINJAUAN PUSTAKA... 5

2.1 Profil PT INTI ... 5

2.1.1 Sejarah PT INTI ... 5

2.1.2Logo PT INTI ... 9

2.1.3Badan Hukum Instansi ... 9

2.1.4Struktur Organisasi ... 10

2.2 Landasan Teori ... 11

BAB III PEMBAHASAN ... 14

(10)

iii

3.2 Analisis Sistem ... 14

3.3 Masukan Perangkat Lunak ... 14

3.4 Proses Yang Terjadi Didalam Perangkat Lunak ... 20

3.4.1 Hapus Tag HTML ... 16

3.6 Analisis Kebutuhan Non Fungsional... 24

3.6.1 Analisis dan Kebutuhan Perangkat Lunak ... 24

3.6.2 Use Case Diagram ... 24

3.7 Identifikasi Aktor ... 25

3.7.1 Identifikasi Use Case ... 25

3.7.1.1 Use Case Login ... 26

BAB IV KESIMPULAN DAN SARAN ... 48

4.1 Kesimpulan ... 48

4.2 Saran ... 48

(11)

i

KATA PENGANTAR

Puji syukur kami panjatkan kepada Allah SWT atas segala nikmat dan karunia yang telah diberikan sehingga dapat menyelesaikan Laporan Kera Praktek ini dengan judul “Sistem Informasi Berbasis Web Retrieval Information”.

Penyusunan Laporan Kerja Praktek ini merupakan salah satu sarat memenuhi Mata Kuliah Kerja

Prakek Program Strata Satu Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer, di

Uneversitas Komputer Indonesia.

Dalam penulisan Laporan Kerja Praktek ini, kami tela mendapatkan banyak batuan dari berbagai

pihak, baik dari segi materi, spirit maupun masukan – masukan yang sangat membangun. Pada

kesempatan ini secara khusus kami ingin menyampaikan ucapan terimakasih kepada :

1. Kedua Orang Tua yang selalu memberi dukungan, semangat, kasih sayang serta doa.

2. Irawan Afrianto, S.T.,MT. selaku Ketua Jurusan Teknik Informatika Fakultas Teknik dan Ilmu

Komputer Universitas Komputer Indonesia.

3. Iskandar Ikbal, S.T.,M.Kom Selaku dosen pembimbing yang telah meluangkan waktu serta

bantuan kepada kami dalam penulisan Laporan Kerja Praktek ini.

4. Bpk. Saad Noor selaku pembimbing Praktek Kerja Lapangan.

5. Bapak/Ibu Staff di PT INTI Bandung.

6. Karyawan Sekretariat Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer

Universitas Komputer Indonesia

7. Seluruh Staf Perpustakaan yang membantu kami mendapatkan referensi dalam penyusunan

laporan.

8. Keluarga Tersayang atas semua semangat dan Doanya.

9. Teman – teman kelas IF – 5 2010 atas semua dukungan dan bantuan ilmu yang diberikan kepada

kami selama kuliah bersama di Universitas Komputer Indonesia.

10. Semua pihak yang tidak dapat kami sebutkan satu persatu.

Kami menyadari bahwa penulisan Laporan Kerja Praktek ini masih jauh dari sempurna. Oleh

karena itu, kami sangat mengharapkan saran dan kritik yang bersifat membangun demi kesempurnaan

penulisan dimasa yang akan datang. Akhir kata, semoga Laporan Kerja Praktek ini dapat bermanfaat

bagi kami khususnya dan untuk semua pembaca umumnya.

Bandung, Agustus 2013

(12)

DAFTAR PUSTAKA

Darmadi, B.A, Intan R., Lim, R., 2006, Aplikasi Search Engine Paper / Karya Ilmiah Berbasis

WEB dengan Metode Fuzzy Relation.

Grossman, D.A, Frieder, O. 2004, Information Retrieval : Algorithms and Heuristics 2nd

Edition, Springer, Netherland.

Snasel, V; Abraham, A; Owais, S; Platos, J; Kromer,P , 2008, Optimizing Information Retrieval

Using Evolutionary Algorithm and Fuzzy Inference System.

http://tiekawati.wordpress.com/2012/10/13/database-dan-sistem-retrieval-informasi-2/

(13)

1 BAB I PENDAHULUAN 1.1Latar Belakang Masalah

Sistem Informasi Berbasis Web Information Retrieval merupakan salah satu

Mesin Pencari berbasis web yang bisa mencari Informasi yang Diinginkan.

Sistem Informasi Retrieval sangat berguna untuk melakukan pencarian informasi

pada document, pencarian metadata yang menjelaskan document atau melakukan

pencarian pada database, baik relasi database yang stand-alone atau hypertext

database yang terdapat pada network seperti internet atau world wide web atau

intranet, untuk teks, suara, gambar atau data.

Saat ini Sistem Informasi Retrieval digunakan untuk mesin pencari semacam

google , dan applikasi semacam website pencari lainnya untuk mencari document,

data, image dan sebagainya.

Indonesia memiliki begitu banyak penduduknya dan rata-rata penduduk

Indonesia memakai fasilitas Internet untuk mencari informasi, bersocial media

dan pasti setiap orang yang memakai Internet ada maksud dan tujuan yaitu

mencari informasi dan pasti memakai Web Information Retrieval dan mencari

sebuah data atau informasi.dan saat kami berada di PT Inti kami disuruh membuat

sebuah Sistem Informasi Berbasis Web maka kami memilih judul “SISTEM INFORMASI BERBASIS WEB INFORMATION RETRIEVAL”.

1.2Perumusan Masalah

Dalam melakukan penyusunan Laporan Praktek Kerja Lapangan ini, masalah

pokok yang akan kami bahas adalah bagaimana membuat sebuah Sistem

Informasi Berbasis Web Information Retrieval.

1.3Maksud dan Tujuan 1.3.1 Maksud

Bagaimana cara untuk mempermudah user dalam mencari Informasi

Data, Image atau Informasi lainnya

(14)

2

 Mempermudah user dalam mencari informasi Data dengan menggunakan Applikasi berbasis Web

1.4Batasan Masalah

Batasan masalah pada pembuatan Sistem Informasi berbasis web Information

Retrieval.

 Data yang ditampilkan adalah data yang ada di database dan yang kita input kan

 Perangkat lunak yang digunakan adalah PHP My SQL  Windows 7 sebagai Sistem Operasi

1.5Metode Penelitian

Gambar 1.1 Metode Penelitian

Metodologi yang digunakan dalam penulisan Laporan Praktek Kerja

Lapangan ini adalah sebagai berikut :

(15)

3

Untuk mendapatkan data dan bahan Laporan Praktek Kerja

Lapangan ini, teknik pengumpulan data yang digunakan ada tiga jenis,

diantaranya sebagai berikut : 1) Metode Observasi

Teknik pengumpulan data dengan mengadakan pengamatan

atau kegiatan yang sistematis terhadap objek yang dituju secara

langsung

2) Metode Studi Pustaka

Yang terdiri dari pengumpulan data melalui informasi dari

buku – buku pedoman dan website yang berhubungan.

3) Metode Wawancara

Adalah suatu metode penelitian dengan mengadakan tanya

jawab langsung dengan pihak – pihak yang berhubungan dengan

masalah yang akan dibahas.

b. Analisis

Dilakukan analisis pada aplikasi yang akan dibangun agar sesuai

dengan kebutuhan.

c. Coding

Dilakukan penerjamahan aplikasi yang akan dibangun kedalam

bahasa pemograman tertentu, dalam hal ini menggunakan bahasa

pemograman c#.

d. Implementasi dan Pengujian

1) Implementasi

Implementasi dengan menerapkan aplikasi ini ke dalam system

yang selanjutnya akan dievaluasi.

2) Pengujian

Pengujian dengan menerapkan ke system yang sebenarnya,

untuk mengetahui apakah aplikasi ii sudsh sesuai dengan kebutuhan.

(16)

4

Tahap akhir dimana suatu perangkat lunak yang sudah selesai

dapat mengalami perubahan – perubahan atau penambahan.

1.6Sistematika Penulisan

Penulisan dan penyusunan Laporan Kerja Praktek ini disusun berdasarkan

pada penulisan sistematika sebagai berikut :

BAB I PENDAHULUAN

Menguraikan tentang latar belakang permasalahan, mencoba merumuskan

inti permasalahan, mencoba merumuskan inti permasalahan yang dihadapi,

menentukan tujuan dan maksud kerja praktek, yang kemudian diikuti dengan

pembatasan masalah, metode penelitian, serta sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Membahas mengenai profil PT INTI, yang terdiri dari sejarah, logo, dan

badan hukumnya. Serta membahas berbagai konsep dasar dan teori – teori

yang berkaitan dengan kerja praktek yang dilakukan dan hal – hal yang

berguna dalam proses analisis permasalahan.

BAB III PEMBAHASAN

Menganalisis kebutuhan system pengguna diataranya yaitu : analisis

prosedur yang berjalan, analisis data dari hasil penelitian, analisis basis data,

analisis non-fugsional. Perancangan sistem yang dimulai dari perancangan

prosedural hingga perancangan alir data serta tahap merancang struktur desain

menu dan antar muka (interface).

BAB IV KESIMPULAN DAN SARAN

Berisi kesimpulan dan saran yang telah diperoleh dari hasil penulisan

(17)

5 BAB II

TINJAUAN PUSTAKA 2.1 Profil PT. Industri Telekomunikasi Indonesia Badan Usaha Milik Negara

Berdiri sejak 1974 yang berkantor pusat di Bandung. Selama lebih dari 3

dasawarsa PT.INTI berperan sebagai pemasok utama pembangunan jaringan

telepon nasional PT TelkomIndosat.

PT. INTI telah berkiprah dalam bisnis telekomunikasi selama 35 tahun

Dengan 695 orang karyawan tetap (Maret 2009). Pelanggan utama INTI antara

lain adalah THE BIG FOUR dan XL.

Sejak berkembangnya tren konvergensi antara teknologi telekomunikasi

dan teknologi informasi (IT), INTI telah melakukan perubahan orientasi bisnis

dari yang semula berbasis pure manufacture menjadi sebuah industri yang

berbasis solusi kesisteman, khususnya dalam bidang sistem infokom dan integrasi

technologi. INTI menangani solusi dan layanan integrasi jaringan tetap maupun

seluler, konten IT, seat management serta mengembangkan produk-produk seperti

IP PBX, Network Management SystemSubscriber Line Maintenance System Video

Messaging System Interface Monitoring System Disaster Forecasting and

Warning System

2.1.1 Sejarah PT INTI

a. Eksistensi & Perkembangan INTI (1974 – 2004)

Dari cikal bakal Laboratorium Penelitian & Pengembangan Industri Bidang Pos dan Telekomuniasi (LPPI-POSTEL), pada 30 Desember 1974 berdirilah PT Industri Telekomunikasi Indonesia (INTI) sebagai Badan Usaha Milik Negara (BUMN) dengan misi untuk menjadi basis dan tulang punggung pembangunan Sistem Telekomunikasi Nasional (SISTELNAS). Seiring waktu dan berbagai dinamika yang harus

(18)

6 b. Milestone Sejarah INTI

1. Era 1974 – 1984

Fasilitas produksi yang dimiliki INTI antara lain adalah:

a. Pabrik Perakitan Telepon b. Pabrik Perakitan Transmisi

c. Laboratorium Software Komunikasi Data d. Pabrik Konstruksi & Mekanik

Kerjasama Teknologi yang pernah dilakukan pada era ini antara lain dengan Siemens, BTM, PRX, JRC, dan NEC. Pada era tersebut produk Pesawat Telepon Umum Koin (PTUK) INTI menjadi standar Perumtel (sekarang Telkom).

2. Era 1984 – 1994

Fasilitas produksi terbaru yang dimiliki INTI pada masa ini, disamping fasilitas-fasilitas yang sudah ada sebelumnya, antara lain adalah Pabrik Sentral Telepon Digital Indonesia (STDI) pertama di Indonesia Trough Hole Technology Surface Mounting Technology.

Kerjasama Teknologi yang pernah dilakukan pada era ini antara lain adalah:

a. Switching Siemens

b. Siemens

c. Siemens

d. TatungTEL

Pada era ini, INTI memiliki reputasi dan prestasi yang signifikan, yaitu:

1. Menjadi pionir dalam proses digitalisasi sistem dan jaringan telekomunikasi di Indonesia.

(19)

7 3. Era 1994 – 2000

Selama 20 tahun sejak berdiri, kegiatan utama INTI adalah murni manufaktur. Namun dengan adanya perubahan dan perkembangan kebutuhan teknologi, regulasi dan pasar, INTI mulai melakukan transisi ke bidang jasa engineering. Pada masa ini aktivitas manufaktur di bidang switching situasi pasar yang berubah, kompetisi yang makin ketat dan regulasi telekomunikasi yang makin terbuka menjadikan posisi INTI di pasar market leader sales forcenetworking yang lebih baik. Kerjasama teknologi masih berlangsung dengan Siemens single-source

4. Era 2000 – 2004

Single source multi source multinasional dari Eropa dan Asia. Aktivitas manufaktur tidak lagispin-off anak-anak perusahaan dan usaha patungan, seperti:

 Bidang CPE, dibentuk anak perusahaan bernama PT. INTIPISMA International yang bekerja sama dengan JITech International, bertempat di Cileungsi Bogor.  Bidang mekanik dan plastik, dibentuk usaha patungan

dengan PT PINDAD bernama PT. IPMS, berkedudukan di Bandung.

Switching dengan beberapa perusahaan multinasional yang

memiliki kapabilitas memadai dan adaptif terhadap kebutuhan pasar

Beberapa perusahan multinasional yang telah melakukan kerjasama pada era ini, antara lain:.

1. SAGEM, di bidang transmisi dan selular 2. MOTOROLA, di bidang CDMA

3. fixed & optical access network 4. Ericsson, di bidang akses 5. switching

5. 2005 – sekarang

(20)

8

nasional dan dengan kompetensi sumberdaya manusia yang terus

diarahkan sesuai proses transformasi tersebut, saat ini INTI bertekad untuk menjadi mitra terpercaya di bidang penyediaan jasa profesional dan solusi total yang Infocom System & Technology Integration

Visi

INTI bertujuan menjadi pilihan pertama bagi para pelanggan untuk

mentransformasikan “MIMPI” menjadi “REALITA”

Misi

Fokus bisnis tertuju pada kegiatan jasa engineering yang sesuai dengan

spesifikasi dan permintaan konsumen memaksimalkan value (nilai) perusahaan

serta mengupayakan growth (pertumbuhan) yang berkesinambungan berperan

sebagai prime mover (penggerak utama) bangkitnya industri dalam negeri.

Tujuan

Dalam kurun waktu 2006-2010 tujuan perusahaan dirangkum dalam butir-butir

sebagai berikut:

 Menjadi perusahaan yang memiliki kinerja yang baik, ditinjau dari

perspektif keuangan, proses internal maupun organisasi dan SDM.  Menjadi perusahaan yang memberikan lesejahteraan kepada karyawan.  Memberikan nilai yang tinggi untuk produk dan jasa kepada pelanggan.  Memberikan nilai kembali yang memadai atas saham.

 Turut melaksanakan dan menunjang kebijaksanaan dan program

pemerintah di bidang ekonomi dan pembangunan nasional pada umumnya

dan khususnya di bidang industri telekomunikasi, elektronika dan

informatika dengan memperhatikan prinsip-prinsip yang berlaku bagi

(21)

9 2.1.2 Logo PT INTI

Setiap perusahaan pasti memiliki logo tersendiri untuk simbol

sebuahperusahaan dan sebagai cerminan visi dan misi perusahaan. Logo PT. INTI dapat dilihat pada Gambar 2.1.

Gambar 2.1 Logo PT.INTI

trusted partner dari PT. INTI adalah :

a) Menguasai teknologi informasi dan telekomunikasi

b) Meningkatkan kemampuan nasional di bidang teknologi informasimaupun teknologi komunikasi

c) Sebagai penunjang utama dalam pembangunan sistem telekomunikasi nasional

d) Meningkatkan kemampuan perusahaan untuk tumbuh dan berkembang dengan kekuatan sendiri Menjadi sumber devisa bagi kemajuan Negara

2.1.3 Badan Hukum Instansi

Badan hukum PT INTI Bandung termasuk ke dalam Perseroan

(22)

10

perseorangan yang ada di dalamnya. Di dalam PT pemilik modal tidak harus memimpin perusahaan, karena dapat menunjuk orang lain di luar pemilik modal untuk menjadi pimpinan. Untuk mendirikan PT / perseroan terbatas dibutuhkan sejumlah modal minimal dalam jumlah tertentu dan berbagai persyaratan lainnya. Dalam kitab Undang – Undang Hukum Dagang tidak satu pasal pun yang menyatakan perseroan sebagai badan hukum, tetapi dalam Undang – Undang Perseroan Terbatas secara tegas dinyatakan dalam Pasal 1 ( but ir 1) bahwa Perseroan adalah badan hukum, ini berarti perseroan tersebut memenuhi syarat keilmuan sebagai pendukung kewajiban dan hak, antara lain memiliki harta kekayaan sendiri terpisah dari harta kekayaan pendiri atau pengurusnya.

2.1.2 Struktur Organisasi dan Job Description

Berpusat di Bandung dengan 695 orang karyawan tetap (posisi Maret 2009), PT INTI (Industri Telekomunikasi Indonesia) telah berkiprah dalam bisnis telekomunikasi selama 35 tahun. Pelanggan utama INTI antara lain adalah operator telekomunikasi di Indonesia (Telkom, Indosat, Telkomsel dan XL)

. Struktur organisasi PT. INTI dapat dilihat pada Gambar 2.2

.

(23)

11 2.2 Landasan Teori

2.2.1 Sistem

Sistem adalah suatu kesatuan utuh yang terdiri dari beberapa bagian yang saling berhubungan dan berinteraksi untuk mencapai tujuan tertentu .

2.2.2 Informasi

Informasi merupakan hasil dari pengolahan data menjadi bentuk yang

lebih berguna bagi yang menerimanya yang menggambarkan suatu kejadian –

kejadian nyata da dapat digunakan sebagai alat bantu untuk pengambilan

keputusan.

Sistem Informasi adalah suatu cara tertentu untuk menyediakan

informasi yang dibutuhkan oleh organisasi untuk beroperasi denga cara yang

sukses.

2.2.3 Database

Merupakan Representasi kumpulanfakta yang saling berhubungan disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan Data perlu disimpan dalam basis data untuk keperluan penyediaan informasi lebih lanjut. Data di dalam basis data perlu diorganisasikan sedemikian rupa, supaya informasi yang dihasilkan

berkualitas.Organisasi basis data yang baik juga berguna untuk efisiensi kapasitas penyimpanannya. Dalam maksud yang sama, bisa juga diartikan sebagai

sekumpulan informasi yang disusun sedemikian rupa untuk dapat diakses oleh sebuah software tertentu.

Database tersusun atas bagian yang disebut field dan record yang tersimpan dalam sebuah file Sebuah field merupakan kesatuan terkecil dari informasi dalam sebuahdatabase. Sekumpulan field yang saling berkaitan akan membentuk record.Dalam membuat aplikasi ini, kami membuat di microsoft access 2007 sebagai database kami. Microsoft Access merupakan salah satu software pengolah database yang berjalan dibawah sistem WINDOWS.

Microsoft Access merupakan salah satu produk Office dari Microsoft yang dapat menangani database dengan skala besar maupun kecil. Dalam

(24)

12 2.2.4 Web Programming

PHP(Hypertext Preprocessor) merupakan bahasa pemrograman yang berjalan di sisi server atau biasa disebut dengan Server Side Secara garis besar bahasa pemrograman web terdiri dari dua macam. Yang pertama disebut dengan Client Side atau script yang dijalankan di komputer client dan yang kedua biasanya disebut dengan Server Side atau script Yang dijalankan pada komputer server.Untuk dapat menjalankan PHP membutuhkan sebuah web server, disini, kami menggunakan Wamp server sebagai web servernya.

2.2.5 Web Server

Wamp server (dahulu wamp5) aplikasi ini dirancang untuk menjadi windows web linkungan pengembangan,hal ini memungkinkan untuk membuat aplikasi web dengan apache,php, dan database mysql.

Wamp server juga dilengkapi dengan php myadmin dan sqlitemanager untuk dengan mudah mengelola database anda.

Wamp server diinstal secara otomatis (installer), dan penggunaannya sangat intuitif.User dapat menyetel server anda tanpa menyentuh file pengaturan.

Wamp server merupakan salah satu solusi yang akam memungkinkan untuk mereproduksi server produksi.

Wamp server setelah terinstal akan terintegrasi dengan apache, mysql, Dan php.Wamp server juga memiliki trayicon untuk mengelola server anda dan

pengaturannya.

2.2.6 Flowchart

Flowchart merupakan gambar atau bagan yang memperlihatkan urutan dan

hubungan antar proses beserta intruksinya. Gambaran ini dinyatakan dengan symbol . Dengan demikian symbol menggambakan proses tertentu. Sedangkan

proses digambarkan dengan garis penghubung.

Dua macam flowchart yang menggambarkan proses dengan computer,

yaitu :

1) Sistem Flowchart

Bagan yang memperlihatkan urutan prosedur dan proses dari

beberapa file dalam media tertentu.Sistem flowchart

(25)

13

1. Hubungan antar suatu file dengan file lainnya.

2. Media yang dipakai untuk setiap file

2) Program Flowchart

Bagan yang memperlihatkan urutan dan hubungan proses dalam

(26)

14 BAB III PEMBAHASAN 3.1Analisis Masalah

Pada bagian ini akan dilakukan analisis terhadap Information Retrieval System (IRS) dengan menggunakan Model Ruang Vektor. Hasilnya digunakan untuk mengidentifikasi dan mengevaluasi hasil implementasi dan pengujian yang akan dibahas pada bab berikutnya. Dari proses analisis akan dapat dihasilkan berbagai macam saran perbaikan terhadap sistem yang dapat dijadikan dasar dalam perancangan Information Retrieval System.

3.2Analisis Sistem

Dari hasil survey IDC (Internasional Data Corporation) dapat diketahui bahwa dokumen yang terdapat dalam dunia maya terus bertambah. Hal ini menimbulkan kesulitan dalam menemubalikkan dokumen-dokumen tersebut. Faktor utama dalam proses pencarian suatu dokumen di dunia maya adalah bagaimana dokumen tersebut ditemubalikkan sesuai atau relevan dengan keyword atau query yang di inputkan oleh user yang akan mencari dokumen berita tersebut.

Oleh karena itu, berbagai macam penelitian di area ini telah banyak dilakukan, salah satunya adalah melalui disiplin ilmu IR (Information Retrieval).IR merupakan bidang yang mengkaji metode-metode di dalam pencarian dokumen berdasarkan representasi kebutuhan informasi berupa kata kunci,yaitu keyword atau query.

3.3Masukan Perangkat Lunak

Input dari suatu sistem temu balik informasi ini adalah query dari pengguna dan koleksi dokumen. Koleksi dokumen yang digunakan dalam sistem temu balik informasi ini yaitu content berita IT berbahasa indonesia yang dapat dikumpulkan secara manual dari situs penyedia berita di internet.

3.4Proses Yang Terjadi Didalam Perangkat Lunak

Perangkat lunak dalam laporan kerja praktek ini merupakan aplikasi Information Retrieval System dengan menggunakan Model Ruang Vektor dan metode pembobotan Term Frequency–Inverse Document Frequency (TF_IDF). Information Retrieval System ini secara umum terdapat 2 tahapan besar, yaitu preprocessing/indexing dan retrieval. Pada tahapan preprocessing mencakup penghapusan tag, tokenization, filtration, stemming, dan weigthing.Kemudian dilanjutkan dengan menyimpan setiap term yang penting ke dalam suatu index (dalam sistem ini menggunakan suatu tabel pada database MySQL).

Information Retrieval System ini akan menerima query dari pengguna kemudian memproses query tersebut dan sistem akan

(27)

15

tersedia, untuk menghasilkan kumpulan dokumen relevan dan terurut berdasarkan ranking kerelevanannya dengan query dari pengguna.Berikut ini adalah gambar dari deskripsi umum sistem :

Gambar 3.1 Proses Yang Terjadi Dalam Sistem

Dalam preprocessing dilakukan beberapa tahapan untuk melakukan pengindeksan dokumen berita diantaranya penghapusan tag html,tokenization, filtration, stemming dan weighting.Berikut ini adalah penjelasan tahapan-tahapan preprocessing yang akan diterapkan dalam sistem :

3.4.1 Hapus Tag HTML

Tahap ini menghapus semua tag markup dan format khusus dari

dokumen,terutama pada dokumen yang mempunyai banyak tag dan format

seperti dokumen (X)HTML.Untuk penghapusan tag HTML menggunakan

fungsi PHP strip_tags().Pseudocode : strip_tags(“<b>google</b>”);

(28)

16

Gambar 3.2 Flowchart Hapus Tag HTML

Dokumen berita :

Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi akan lenyap. Bukan karena Google menghapusnya, tetapi karena raksasa internet itu ingin 'membuang' kedua nama produk itu untuk diganti

namanya.

Sebelum tag html dihapus :

Dua layanan populer milik <b>Google</b>, <i>Picasa</i>dan

<i>Blogger</i> tidak lama lagi akan lenyap. Bukan karena

<b>Google</i> menghapusnya, tetapi karena raksasa internet itu ingin

(29)

17 Setelah tag html dihapus :

Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi

akan lenyap. Bukan karena Google menghapusnya, tetapi karena

raksasa internet itu ingin 'membuang' kedua nama produk itu untuk diganti

namanya.

Dari contoh diatas bisa diketahui ada 4 kata yang mengandung tag html

yang telah dihapus markup tag htmlnya.

3.4.1 Tokenization

Tokenization adalah tugas memisahkan deretan kata di dalam

kalimat, paragraf atau halaman menjadi token atau potongan kata tunggal

atau termmed word. Tahapan ini juga menghilangkan karakter-karakter

tertentu seperti tanda baca dan mengubah semua token ke bentuk huruf

kecil (lower case).Dibawah ini adalah

Flowchart alur Tokenization :

(30)

18

Untuk pemisahan kalimat ke bentuk kata menggunakan fungsi PHP explode().

Pseudocode :

explode(“ “, “Dua layanan populer milik Google”); Contoh tokenization :

Input :

Dua layanan populer milik Google, Picasa dan Blogger tidak lama lagi

akan lenyap. Bukan karena Google menghapusnya, tetapi karena raksasa internet

itu ingin 'membuang' kedua nama produk itu untuk diganti namanya.

3.4.1 Filtration

Filtration adalah proses penghapusan kata buang yaitu kata

sambung, kata depan, kata ganti, dll. Contoh stop words dalam bahasa

Indonesia : yang, juga, dari, dia, kami, kamu, aku, saya, ini, itu, atau, dan,

tersebut, pada, dengan, adalah, yaitu, ke, tak, tidak, di,pada, jika, maka,

ada, pun, lain, saja, hanya, namun, seperti, kemudian, karena, untuk, dll. Proses filtration menggunakan fungsi PHP str_replace().

Dibawah ini adalah array stopword yang telah di inputkan beserta

(31)

19

$astopword = array (" yang ", " juga ", " dari ", " dia ", " kami ", "

kamu ", "aku", " ini ", " itu ", " atau ", " dan ", " tersebut ", " pada ", "

dengan ", " adalah ", " yaitu ", " ke ", " tak "," tidak "," di ", " pada "," jika "," maka "," ada ", " pun "," lain "," saja ", " hanya "," namun "," seperti ","

kemudian "," untuk "," sudah ", " belum ", " memang "," sama ", " apa ","

apakah "," oleh ", " sangat "," sehingga "," memang "," dimana ","

sedangkan ", " selain "," tapi "," tetapi "," tanpa "," tiada "," dengan "," lain

"," akan "," lainnya "," tiada "," para ", " saat "," sebelum "," sesudah ","

karena ");

Data array akan dibaca oleh fungsi foreach :

foreach ($astopword as $i => $value) {

$teks = str_replace($astopword[$i], " ", $teks);

}

$teks adalah dokumen berita yana akan diproses oleh filtration.

(32)

20 Contoh Sebelum filtration :

dua layanan populer milik google picasa dan blogger tidak lama lagi

akan lenyap bukan karena google menghapusnya tetapi karena raksasa internet

itu ingin membuang kedua nama produk itu untuk diganti namanya

Setelah Filtration :

dua layanan populer milik google picasa blogger lama lenyap google

menghapus raksasa internet ingin membuang kedua nama produk diganti nama

3.4.4 Stemming

Stemming adalah pengubahan kata ke bentuk kata dasar atau penghapusan imbuhan. Stemming disini menggunakan kamus daftar kata berimbuhan yang mempunyai kata dasarnya dengan cara membandingkan kata-kata yang ada dalam dokumen berita dengan daftar kamus stem. Proses stemming menggunakan fungsi PHP str_replace. Berikut ini adalah contoh penggunaanya :

//buka tabel tbstem dan bandingkan dengan berita

$restem = mysql_query("SELECT * FROM stem ORDER BY id");

while($rowstem = mysql_fetch_array($restem)) {

$teks=str_replace($rowstem['term'],$rowstem['stem'], $teks);

(33)

21 Dibawah ini flowchart proses stemming :

Contoh kamus stemming

No Term Stem

1 layanan Layan

2 menghapus Hapus

3 membuang Buang

4 Kedua Dua

5 Diganti Ganti

(34)

22 Contoh stemming

dua layanan populer milik google picasa blogger lama lenyap google

menghapus raksasa internet ingin membuang kedua nama produk diganti nama

Term yang berubah saat proses steming

Mengubah  ubah , Tertentu  tentu

Tahapan tahap, Dilaporkan lapor

Sebelum belum,

Setelah Stemming

dua layan popular milik google picasa blogger lama lenyap google hapus

raksasa internet ingin buang dua nama produk ganti nama

3.4.5 Weighting

Pembobotan kata sangat berpengaruh dalam menentukan

kemiripan antara dokumen dengan query. Apabila bobot tiap kata dapat

ditentukan dengan tepat, diharapkan hasil perhitungan kemiripan teks akan

menghasilkan perangkingan dokumen yang baik.

Bobot term di dalam Information Retrieval System (W) dihitung

menggunakan tf-idf yang didefinisikan sebagai berikut.

W= tf ×idf

Diketahui :

W = Bobot term

tf = banyaknya kemunculan suatu kata dalam suatu dokumen/berita.

Idf = ��� (�/� )

Diketahui :

N = Jumlah artikel dalam koleksi dokumen

dji = Banyaknya Dokumen (j) yang mengandu term (i)

(35)

23 Contoh kasus

Berita 1 : Saat mengubah suatu proses kita harus mengetahui tahapan yang

Berita 2 : Saat kita telah mendegar banyak proses berita yang merugikan Berita 3 : Tokenization adalah tugas proses memisahkan deretan kata

didalam kalimat,

Diketahui :

Berita = 3 (Jumlah berita)

Idf = ��� (�/� )

dji = Banyaknya berita (j) yang mengandu term (i)

Tf Berita 1 = Banyaknya muncul kata di Berita 1

Tf Berita 2 = Banyaknya muncul kata di Berita 2

Tf Berita 3 = Banyaknya muncul kata di Berita 3

W Berita 1 = Bobot kata di Berita 1

W Berita 2 = Bobot kata di Berita 2

W Berita 3 = Bobot kata di Berita 3

(36)

24 3.5Keluaran Perangkat Lunak

Output yang diharapkan dari Information Retrieval System ini

adalah dokumen yang dianggap relevan oleh sistem berupa berita yang telah terurut berdasarkan relevansi dengan query dari pengguna.

3.6Analisis dan Kebutuhan Non Fungsional

Analisis dan kebutuhan non fungsional meliputi analisis dan kebutuhan perangkat keras serta analisis dan kebutuhan perangkat lunak.

3.6.1 Analisis dan Kebutuhan Perangkat Lunak

Spesifikasi perangkat lunak yang digunakan dalam Information

Retrieval System ini adalah :

 Sistem Operasi Microsoft Windows 7 Professional  Software wampp sebagai Web Server

 PHP sebagai bahasa pemrograman web  Mysql sebagai sistem manajemen basis data  Software utility Dreamweaver CS5.

3.6.2 Use Case Diagram

Pemodelan use case adalah pemodelan sistem dari

perspektif pandangan pemakai akhir (end user). Model use case adalah

pandangan dari luar sistem, sementara model rancangan adalah pandangan

dari dalam. Model use case menangkap penggunaan penggunaan sistem,

(37)

25

Dibawah ini adalah Use Case Diagram Information Retrieval :

3.7Identifikasi Aktor

Terdapat dua aktor yang berhubungan dengan Information Retrieval System.Aktor dapat diidentifikasikan sebagai berikut :

a. Aktor pertama ialah Administrator, mempunyai hak akses untuk pengelolaan dokumen berita, melakukan indexing, dan menerapkan model ruang vektor pada dokumen berita juga mempunyai hak akses ke halaman user untuk melakukan pencarian.

b. Aktor kedua ialah User, hanya mempunyai hak akses di halaman user untuk melakukan pencarian dokumen berita.

3.7.1 Identifikasi Use Case

Tabel 3.3 Identifikasi Use Case Information Retrieval System

No. Use Case

Deskrips i

1 Login Proses

ini melakukan autentikasi terhadap aktor yang menjalankan sistem untuk memastikan bahwa orang

yang bersangkutan memiliki hak akses terhadap

(38)

26

Proses bagi admin untuk melihat dokumen berita

4 Edit

Proses bagi admin untuk mengubah dokumen berita

5 Delete

Proses bagi admin untuk menghapus dokumen berita

6 Hapus tag html Proses untuk menghapus tag html

7 Tokenization Proses untuk memecah dokumen berita menjadi

potongan-potongan kata

8 Filtration

Proses untuk stopword menghilangkan kata-kata yang

tidak diperlukan untuk pengindeksan dan menghilangkan tanda baca.

9 Stemming

Proses untuk mengubah kata ke bentuk kata dasar atau

penghapusan imbuhan.

10 Term weighting

Proses untuk pemberian bobot tf.idf terhadap term

11 Hitung panjang vektor

Proses untuk menghitung panjang vektor dokumen

12 Retrieval Proses bagi admin untuk menemubalikkan dokumen

berita.

13 Pencarian Berita

Proses bagi user untuk pencarian dokumen berita

3.2.1.1Use Case Login

Proses ini melakukan autentikasi terhadap aktor yang menjalankan sistem

untuk memastikan bahwa orang yang bersangkutan memiliki hak akses terhadap

sistem. Use case login diterangkan dan dimodelkan dengan skenario, activity

(39)

27

Tabel 3.4 Skenario Use Case Login

Identifikasi

Nama Login

Tujuan Masuk ke dalam sistem

Deskripsi Proses login merupakan proses autentifikasi

untuk menggunakan sistem.

Aktor Administrator

Skenario Utama

Kondisi awal Form login ditampilkan

Aksi actor Reaksi sistem

1) Menampilkan form login

2) Mengisi Form Login 2) Cek field masih kosong

3) Mengautentifikasi data login dengan

data username pada basis data

4) Bila cocok sistem menampilkan

halaman menu utama

Skenario Alternatif ( Auntentifikasi Gagal)

Aksi Aktor Reaksi Sistem

1) Menampilkan Pesan bahwa data

(40)

28

(41)

29

Gambar 3.9 Sequence Diagram Login

3.2.1.2Use Case Add

Proses ini melakukan penambahan dokumen berita. Use case add

diterangkan dan dimodelkan dengan skenario, activity diagram dan sequence

(42)

30

Tabel 3.5 Skenario Use Case Add Identifikasi

Nam

a Add

Tujuan Menambah dokumen berita

Deskripsi Proses Add merupakan proses untuk

Kondisi awal Klik tombol add

Aksi aktor Reaksi sistem

1. Klik add 2.

Menampilkan Form tambah dokumen

berita. 3. Mengisi Form Dokumen berita

4.

Klik tombol

simpan 5. Memproses penambahan data

Skenario Alternatif ( Auntentifikasi Gagal)

Aksi Aktor Reaksi Sistem

1. Klik tombol batal 2. Kosongkan form

Kondisi akhir Tampil Sukses

(43)

31

Gambar 3.11 Sequence Diagram Add 3.2.1.3Use Case View

Proses ini menampilkan dokumen berita. Use case view diterangkan dan

dimodelkan dengan skenario, activity diagram dan sequence diagram.

Tabel 3.6 Skenario Use Case View Identifikasi

Nama View

Tujuan Menampilkan dokumen berita

Deskripsi Proses View untuk menampilkan berita.

Aktor Administrator

Skenario Utama

Kondisi awal Klik tombol view

Aksi actor Reaksi sistem

1. Klik view 2. Tampilkan dokumen berita

(44)

32

Gambar 3.12 Activity Diagram View

Gambar 3.13 Sequence Diagram View 3.2.1.4Use Case Edit

Proses ini untuk mengubah dokumen berita. Use case edit diterangkan dan

(45)

33

Tabel 3.7 Skenario Use Case Edit Identifikasi

Nama

Edi t

Tujuan Mengubah dokumen berita

Deskripsi Proses untuk mengubah dokumen berita

Aktor Administrator

Skenario Utama

Kondisi awal Klik tombol view

Aksi actor Reaksi sistem

1. Klik Edit 2. Tampilkan form Edit Berita

3. Ubah Dokumen Berita

4. Klik Simpan 5. Simpan Hasil Edit

Kondisi akhir Admin berhasil mengubah dokumen berita

(46)

34

Gambar 3.17 Sequence Diagram Delete

3.2.1.5Use Case Hapus Tag HTML

Proses untuk menghitung panjang vektor dokumen berita. Use case hitung

panjang vector diterangkan dan dimodelkan dengan skenario, activity diagram

dan sequence diagram.

Tabel 3.8 Skenario Use Case Hapus Tag HTML

Identifikasi

Nama Hapus Tag HTML

Tujuan Menghapus Tag HTML

Deskripsi Proses untuk menghapus Tag HTML

Aktor Administrator

Skenario Utama

Kondisi awal Klik tombol Markup-free document text

Aksi actor Reaksi sistem

1. Klik Markup-free document text 2. Hapus Tag HTML

Kondisi akhir

(47)

35

Gambar 3.18 Activity Diagram Hapus Tag HTML

(48)

36 3.3Analisis dan Kebutuhan Perangkat Keras

Spesifikasi perangkat keras yang digunakan dalam Information

Retrieval System ini adalah :

 Processor : AMD Turion™ X2 Dual-Core Mobile RM-74 (2 CPUs)

3.4Perancangan Sistem

Perancangan akan dimulai setelah tahap analisis terhadap sistem selesai

dilakukan. Perancangan dapat didefinisikan sebagai proses aplikasi berbagai

teknik dan prinsip bagi tujuan pendefinisian suatu perangkat, suatu proses atau

sistem dalam detail yang memadai untuk memungkinkan realisasi fisiknya.

Perancangan digambarkan sebagai proses multi-langkah dimana representasi

struktur data, struktur program, karakteristik interface, dan detail prosedur,

disintesis dari persyaratan informasi.

3.5Perancangan Basis Data

Perancangan data mentransformasi model domain informasi yang dibuat

selama analisis ke dalam struktur data yang akan diperlukan untuk

(49)

37 3.5.1 Skema Relasi

Proses relasi antar file merupakan gabungan antar file yang mempunyai

kunci utama yang sama, sehingga file-file tersebut menjadi satu kesatuan yang dihubungkan oleh field kunci tersebut. Pada proses ini elemen-elemen

data dikelompokkan menjadi satu file database beserta entitas dan

hubungannya. Berikut adalah skema relasi antar tabel yang ada di aplikasi

Information Retrieval System:

Gambar 3.4 Skema Relasi

3.5.2 Struktur Tabel

Tabel adalah sekumpulan data atau informasi spesifik tentang subjek

tertentu yang disusun dalam bentuk kolom dan baris. Tabel adalah

komponen utama dan pertama dari sebuah database. Struktur tabel

yang terdapat dalam database Information Retrieval System sebagai

(50)

38 a. Tabel Berita

Tabel Berita digunakan untuk menyimpan dokumen-dokumen berita.

Tabel 3.5 Tabel Berita

b. Tabel Indexing

Tabel Indexing digunakan untuk menyimpan data hasil

preprocessing dan weighting (pembobotan).

Tabel 3.6 Tabel Indexing

c. Tabel Stem

Tabel Stem digunakan untuk menyimpan kamus atau koleksi

term-term yang akan diubah kebentuk kata dasarnya.

(51)

39 d. Tabel Vektor

Tabel Vektor digunakan untuk menyimpan hasil perhitungan panjang

vektor dari tiap dokumen berita.

Tabel 3.8 Tabel Vektor

e. Tabel Cache

Tabel Cache digunakan untuk menyimpan history query atau keyword

dan untuk menyimpan nilai kemiripan antara query dan dokumen berita.

Tabel 3.9 Tabel Cache

f. Tabel Admin

Tabel Admin digunakan untuk menyimpan data login administrator.

(52)

40 3.6Perancangan Struktur Menu

Gambar 3.36 Struktur Menu 3.7Perancangan Antar Muka

(53)

41 3.8Perancangan Tampilan

(54)

42

(55)

43

(56)

44

(57)

45

(58)

46

(59)

47

(60)

48

(61)

49

(62)

50

Gambar 3.46 Tampilan Awal Web

(63)

51 BAB IV

KESIMPULAN DAN SARAN 4.1 Kesimpulan

Berdasarkan hasil penelitian yang dilakukan oleh penulis pada unit

Sistem Informasi Management PT.INTI Bandung mengenai Information Retrieval

Pada unit Sistem Informasi Manajemen di PT.INTI Bandung, penulis dapat

menarik kesimpulan sebagai berikut :

1. Unit Sistem Informasi Management PT.INTI Bandung merupakan suatu

unit bagian Sistem Informasi yang berfungsi untuk me manajemen

Informasi Data dan jaringan.

2. Dengan adanya membangun Sistem Informasi berbasis web maka

memperlancar kegiatan pencarian berbagai Informasi Data di perusahaan.

3. Dengan adanya Sistem Informasi yang berbasis web bertujuan

mengefisienkan pengelolaan data.

4. Pembangunan Sistem Informasi berbasis web untuk mempermudah

pengaksesan dan pencarian data di PT INTI.

4.2 Saran

Berdasarkan hasil penelitian yang dilakukan oleh penulis pada unit

Sistem Informasi Management di PT.INTI Bandung mengenai Sistem Informasi

berbasis web Information Retrieval di PT.INTI Bandung, penulis akan

memberikan saran yang diharapkan dapat berguna sebagai pertimbangan dan

masukan bagi unit Sistem Informasi Management PT.INTI Bandung pada masa

yang akan datang,yaitu:

1. Lebih ditingkatkan lagi sistem Pencarian dan Pengelolaan data di PT.INTI

dengan Sistem Informasi berbasis web.

2. Menambahkan System Security pada Sistem Informasi agar lebih aman dan

Gambar

Tabel 3.3 Identifikasi Use Case Information Retrieval System
Tabel 3.4 Skenario Use Case Login
Gambar 3.8 Activity Diagram Login
Gambar 3.9 Sequence Diagram Login
+7

Referensi

Dokumen terkait

A reasonable plan of action would be to focus attention on the basic components (Land Use Change, Forest Inventory, Tim- ber Market) initially. Once these are functioning, the

Tanah untuk penyemaian tidak menggunakan tanah sawah tetapi menggunakan tanah darat yang gembur dicampur dengan kompos dengan perbandingan tanah:kompos sebaiknya minimal 2:1 dan

Puji syukur kepada kehadirat Allah SWT yang telah melimpahkan rahmat, taufiq dan hidayah-Nya sehingga penulis dapat menyelesaikan laporan Tugas Akhir yang berjudul

Transaksi penjualan untuk pelanggan perusahaan yang sudah melakukan kerjasama biasanya disebut pelanggan corporate, transaksi terjadi pelanggan melakukan bookingan

Lie (dalam Rusman, 2011: 218) bahwa “ pembelajaran kooperatif model jigsaw ini merupakan model belajar kooperatif dengan cara siswa belajar dalam kelompok kecil

Selain itu mulai tumbuh kesadaran baru mengenai hubungan antara potensi dan daya psikis tersebut dengan sikap dan pola tingkah laku manusia (Jalalludin, 1995:

Menimbang, bahwa setelah memeriksa berkas perkara dan membaca putusan yang diambil oleh Mahkamah Syar’iyah Jantho, maka Mahkamah Syar’iyah Provinsi

Peserta didik dengan kemampuan penalaran matematis kategori rendah apabila peserta didik dapat melakukan manipulasi matematika dengan benar namun kurang lengkap,