• Tidak ada hasil yang ditemukan

Pencarian Kata Tidak Baku Pada Dokumen Di Balai Bahasa Bandung Menggunakan Stemming Engine Bahasa Indonesia

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pencarian Kata Tidak Baku Pada Dokumen Di Balai Bahasa Bandung Menggunakan Stemming Engine Bahasa Indonesia"

Copied!
199
0
0

Teks penuh

(1)
(2)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia

OLEH

JAJANG APRIANSYAH

10108188

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

BANDUNG

(3)
(4)
(5)

i

ABSTRAK

PENCARIAN KATA TIDAK BAKU PADA DOKUMEN

DI BALAI BAHASA BANDUNG MENGGUNAKAN

STEMMING ENGINE BAHASA INDONESIA

Oleh

JAJANG APRIANSYAH

10108188

Balai Bahasa Bandung adalah lembaga yang bergerak dibidang kebahasaan dan kesastraan dan berada di bawah naungan Pusat Bahasa. Salah satu program kerja Balai Bahasa Bandung yaitu mengumpulkan karya ilmiah atau karya tulis dan mencetaknya dalam satu buku, untuk melakukan pemeriksaan karya ilmiah atau karya tulis dan pendistribusian karya penulis maka membutuhkan aplikasi yang bisa membantu proses pemeriksaan dokumen yang mengandung kata tidak baku. Hal ini dapat diatasi dengan stemming engine.

Stemming adalah proses pemisahan kata dengan imbuhannya sehingga menghasilkan sebuah kata dasar. Ada dua proses yang harus dilakukan sebelum

stemming yaitu tokenizing dan filtering. Tokenizing adalah proses pemotongan kalimat menjadi per kata, sedangkan filtering adalah proses penghilangan kata yang dianggap tidak penting untuk dilakukan stemming.

Berdasarkan hasil penelitian dan setelah dilakukan pengujian terhadap

stemming engine, kesimpulan yang dapat diambil yaitu stemming engine dapat membantu proses pemeriksaan dokumen yang mengandung kata tidak baku di Balai Bahasa Bandung, dapat membantu mempercepat proses pemeriksaan dan dapat membantu pendistribusian karya ilmiah ataupun karya tulis ke Balai Bahasa Bandung.

(6)

ii

ABSTRACT

PENCARIAN KATA TIDAK BAKU PADA DOKUMEN

DI BALAI BAHASA BANDUNG MENGGUNAKAN

STEMMING ENGINE BAHASA INDONESIA

By

JAJANG APRIANSYAH

10108188

Balai Bahasa Bandung is an organization which works in surface of language and literature and it in shelther of Pusat Bahasa. One of the Balai Bahasa work program is collect scientific and print it to a book. To check scientific and distribution scientific, therefore need application which can helping checking document which contain not standard word. This problem can be solved by stemming engine

Stemming is a process for separating affixes from words containing affixes and generate a basic word, there are two processes that must be done before to stemming there are tokenizing and filtering. Tokenizing is a process to cut the sentences into words, while filtering is a process to eliminate unimportant words.

Results of the study and after checking the stemming engine, the conclution is stemming engine could help checking process of the document contain not-standard word in Balai Bahasa Bandung, it could help faster checking document and it could help distribution work of scientific to Balai Bahasa Bandung.

(7)

iii

KATA PENGANTAR

Assalamu’alaikum, Wr.,Wb.

Alhamdulillah puji dan syukur kehadirat Allah SWT yang telah melimpahkan rahmat serta hidayah-Nya, karena tidak lepas dari kehendak-Nya juga penulis dapat menyelesaikan penyusunan Skripsi ini. Sholawat serta salam semoga Allah SWT limpahkan kepada junjungan alam Baginda Nabi Basar Muhammad SAW, yang telah membawa umat manusia dari alam kegelapan ke alam yang penuh dengan berkah dan maghfiroh. Skripsi ini diajukan untuk memenuhi syarat dalam menempuh Ujian Sidang Sarjana Strata Satu (S1) pada Program Studi Teknik Informatika Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia. Skripsi ini berjudul: “PENCARIAN KATA TIDAK BAKU PADA DOKUMEN DI BALAI BAHASA BANDUNG

MENGGUNAKAN STEMMING ENGINE BAHASA INDONESIA”.

Penulis mengucapkan terima kasih yang tiada terhingga kepada Ayah, Ibu, teh Ikah, Devi, Elfan, Reja, Refa dan Sri Kartika tercinta yang tiada pernah putus memberikan kasih sayang, doa dan dorongan, motivasi, perhatian serta kesabaran kepada penulis.

Sehubungan dengan telah selesainya penyusunan Skripsi ini, peneliti mengucapkan rasa terima kasih yang mendalam dan penghargaan yang setinggi tingginya kepada yang terhormat Bapak Adam Mukharil Bachtiar S.Kom,

(8)

iv

waktunya dengan memberikan suatu pengarahan dan petunjuk mengenai penyusunan Skripsi ini. Pada kesempatan ini pula, peneliti mengucapkan terima kasih yang setulus-tulusnya kepada yang terhormat :

1. Dr. Ir. Eddy Soeryanto Soegoto, Rektor Universitas Komputer Indonesia. 2. Ibu Mira Kania Sabariah, S.T., M.T., selaku Ketua Jurusan Teknik

Informatika Universitas Komputer Indonesia.

3. Seluruh Dosen Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia, terima kasih atas ilmu yang telah diberikan kepada penulis selama menjadi mahasiswa Universitas Komputer Indonesia.

4. Bapak Iskandar Ikbal, S.T., M.Kom. Selaku Dosen Penguji I, terima kasih atas bimbingannya.

5. Seluruh staff tata usaha jurusan Teknik Informatika Fakultas Teknik Dan Ilmu Komputer Universitas Komputer Indonesia.

6. Pihak Balai Bahasa Bandung yang telah memberikan izin penelitian.

7. Teman-teman Teknik Informatika angkatan 2008 khususnya kelas IF-5 yang tidak dapat disebutkan satu persatu, terima kasih untuk semuanya.

8. Sahabat-sahabatku anak decade (Agista Yuandhika, Arif Hikmatyar, Agung Prasetyo N., Bagus Adi P., Cece Budiman, Dede Patmawati, Dede Supriyatna, Eka Andriana, Ahmad Munib Kh. dan Robby Ariesa P.) Terimakasih atas semua dukungan dan semangat yang diberikan kepada penulis.

(9)

v

dan kritik guna kelengkapan dan kesempurnaan skripsi ini sangat penulis harapkan, serta demi peningkatan kemampuan dan pengetahuan dimasa-masa yang akan datang.

Sebagai penutup peneliti berharap semoga penyusunan skripsi ini berguna, khususnya bagi peneliti dan umumnya bagi kita semua. Semoga Allah SWT selalu merodhoi kita semua, amin.

Jazakumullah Khairan Katsiran,

Wassalamu alaikum, Wr., Wb.

Bandung, Agustus 2012

Penulis,

(10)

vi

DAFTAR ISI

LEMBAR JUDUL

LEMBAR PENGESAHAN

ABSTRAK ... i

ABSTRACT... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR GAMBAR ... x

DAFTAR TABEL ... xiii

DAFTAR SIMBOL ... xvi

DAFTAR LAMPIRAN ... xviii

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Perumusan Masalah ... 3

1.3 Maksud dan Tujuan... 3

1.4 Batasan Masalah... 3

1.5 Metodologi Penelitian ... 4

1.6 Sistematika Penulisan ... 7

BAB 2 TINJAUAN PUSTAKA... 9

(11)

vii

2.1.1 Sejarah Balai Bahasa Bandung ... 9

2.1.2 Visi Dan Misi Balai Bahasa Bandung ... 10

2.1.3 Struktur Organisasi Balai Bahasa Bandung ... 10

2.1.4 Job Description... 11

2.1.5 Deskripsi Tugas dan Fungsi Balai Bahasa Bandung ... 12

2.2 Landasan Teori ... 12

2.2.1 Text Mining ... 12

2.2.1.1 Tokenizing ... 13

2.2.1.2 Filtering ... 14

2.2.1.3 Stemming ... 14

2.2.2 Pembangun Perangkat Lunak ... 15

2.2.2.1 HTML ... 15

2.2.2.2 PHP ... 17

2.2.2.3 MySQL ... 18

2.2.2.4 Dreamweaver CS5 ... 21

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 24

3.1 Analisis Sistem ... 24

3.1.1 Analisis Masalah... 24

3.1.2 Analisis Sistem Yang Sedang Berjalan ... 25

(12)

viii

3.1.4 Aturan Bisnis ... 36

3.1.5 Spesifikasi Kebutuhan Perangkat Lunak ... 36

3.1.6 Analisis Kebutuhan Non Fungsional... 37

3.1.7 Analisis Data ... 41

3.1.8 Analisis Kebutuhan Fungsional ... 43

3.1.9 Spesifikasi Proses ... 54

3.1.10 Kamus Data... 66

3.2 Perancangan Sistem ... 70

3.2.1 Perancangan Data ... 70

3.2.2 Perancangan Arsitektural Perangkat lunak ... 76

3.2.1 Perancangan Struktur Menu... 76

3.2.2 Perancangan Antarmuka Perangkat Lunak ... 77

3.2.3 Perancangan Pesan ... 87

3.2.4 Perancangan Jaringan Semantik ... 88

3.2.5 Perancangan Prosedural ... 89

BAB 4 IMPLEMENTASI DAN PENGUJIAN... 98

4.1 Implementasi Sistem ... 98

4.1.1 Perangkat Implementasi Data ... 98

4.1.2 Implementasi Antarmuka ... 102

(13)

ix

4.2.1 Rencana Pengujian ... 105

4.2.2 Pengujian Black Box ... 105

4.2.3 Pengujian Beta ... 119

4.2.4 Kesimpulan Pengujian ... 121

BAB 5 KESIMPULAN DAN SARAN ... 128

5.1 Kesimpulan ... 128

5.2 Saran ... 129

DAFTAR PUSTAKA ... 130

(14)

1

1.1 Latar Belakang Masalah

Balai Bahasa Bandung resmi berdiri pada bulan September 1999. Balai Bahasa Bandung berkedudukan sebagai Unit Pelaksana Teknis (UPT) di lingkungan Departemen Pendidikan Nasional, berada di bawah Pusat Bahasa. Dalam melaksanakan tugasnya, secara teknis dan administratif balai bahasa dibina oleh Pusat Bahasa dan bertanggung jawab kepada Kepala Pusat Bahasa. Sementara itu, Pusat Bahasa berkedudukan sebagai unsur pelaksana tugas tertentu Departemen Pendidikan Nasional. Dalam melaksanakan tugasnya, Pusat Bahasa bertanggung jawab kepada Sekretaris Jenderal, Departemen Pendidikan Nasional.

(15)

penulis sering kali sulit mengirimkan karya tulisnya ke Balai Bahasa Bandung, terutama para penulis yang tempat tinggalnya jauh dari Balai Bahasa Bandung sehingga banyak penulis yang terlambat mengirimkan hasil karyanya ke pihak Balai Bahasa Bandung. Dengan keterlambatan itu maka untuk pencetakan buku yang merupakan kumpulan karya tulis penulis pun terhambat.

Untuk mengatasi masalah tersebut bisa menggunakan ilmu teknik informatika pada cabang ilmu yang mempelajari pengolahan teks, salah satu ilmu yang mempelajari untuk pengolahan teks yaitu stemming. stemming merupakan proses memisahkan awalan, akhiran, sisipan ataupun kombinasi untuk menghasilkan akar kata. Stemming bisa dimanfaatkan untuk melakukan pemeriksaan kata tidak baku yang terdapat dalam dokumen, terutama dokumen yang berbahasa Indonesia yang terdapat di Balai Bahasa Bandung.

Algoritma yang cocok digunakan untuk stemming bahasa Indonesia saat ini sudah ada dua algoritma, yaitu algoritma Nazief dan Porter, masing-masing dari algoritma tersebut memeiliki kelebihan masing-masing. Algoritma Nazief sendiri memiliki keakuratan lebih tinggi daripada algoritma Porter, sedangkan algoritma Porter sendiri memiliki kecepatan yang lebih tinggi daripada algoritma Nazief.

(16)

1.2 Perumusan Masalah

Dari latar belakang masalah ditemukan beberapa masalah yang dirumuskan dalam suatu rumusan masalah yaitu bagaimana membangun aplikasi

Stemming Engine bahasa Indonesia.

1.3 Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membangun Stemming Engine bahasa Indonesia.

Sedangkan tujuan yang akan dicapai dalam penelitian ini adalah :

1. Untuk membantu Balai Bahasa Bandung untuk memeriksa dokumen yang mengandung kata tidak baku didalamnya.

2. Untuk mempercepat proses pemeriksaan dokumen berbahasa Indonesia. 3. Membantu pendistribusian dokumen penulis ke Balai Bahasa Bandung.

1.4 Batasan Masalah

Batasan yang digunakan untuk membangun Stemming Engine bahasa Indonesia adalah sebagai berikut :

1. Data yang diolah dalam Stemming Engine adalah data dokumen, data kata dasar, data stopword, dan data hasil pemeriksaan

2. Input berupa dokumen yang berformat txt.

(17)

4. Hasil dari Stemming Engine adalah berupa kata dasar dan daftar kata yang tidak baku.

5. Pendekatan analisis pembangunan perangkat lunak yang digunakan adalah pendekatan analisis terstruktur.

6. Aplikasi dibangun dengan berbasis web.

7. Algoritma yang digunakan adalah Nazief dan Adriani.

1.5 Metodologi Penelitian

Metodologi yang dilakukan dalam penelitian perangkat lunak berupa metodologi analisis deskriptif, dengan tahapan sebagai berikut:

1. Metode Pengumpulan Data

Metode pengumpulan data yang digunakan dalam membangun aplikasi ini adalah sebagai berikut :

a. Studi Literarur

Studi literatur adalah tahap pengumpulan data dengan mencari referensi yang berkaitan dengan permasalahan mulai dari mencari dari buku-buku, jurnal maupun arikel-artikel yang terdapat di internet, dengan subjek literatur yang berkaitan dengan stemming, berbagai algoritma stemming dan text mining.

b. Observasi

(18)

c. Wawancara

Wawancara ini merupakan pengumpulan data dengan mengadakan tanya jawab secara langsung kepada pihak dari Balai Bahasa Bandung.

2. Metode Pembangunan Perangkat Lunak

Metode pembangunan perangkat lunak yang digunakan adalah dengan

menggunakan model Waterfall, model Waterfall yang digunakan dapat dilihat pada

Gambar 1.1, yang meliputi beberapa aktivitas sebagai berikut:

a. Mendefinisikan kebutuhan (Requirements definition)

Pada aktivitas ini pengumpulkan kebutuhan secara lengkap kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh program yang akan dibangun. Fase ini harus dikerjakan secara lengkap untuk bisa menghasilkan desain yang lengkap.

b. Desain sistem dan perangkat lunak (System and software design)

Pada aktivitas ini desain dikerjakan setelah kebutuhan selesai didefinisikan secara lengkap. Desain system merupakan perancangan system yang dilakukan berdasarkan data-data yang telah dikumpulkan pada tahap sebelumnya.

c. Implementasi dan pengujian perangkat lunak (Implementaion and

unit testing)

(19)

Pengujian perangkat lunak yaitu memfokuskan pada logika internal dari perangkat lunak, fungsi eksternal, dan mencari segala kemungkinan kesalahan, memeriksa apakah input sesuai dengan hasil yang diinginkan setelah proses.

d. Pengujian integrasi dan sistem (Integration and system testing)

Aktivitas ini adalah untuk memastikan bahwa semua pernyataan sudah diuji yang selanjutnya akan mengarahkan penguji untuk menemukan kesalahan yang mungkin terjadi dan juga memastikan bahwa hasil yang diharapkan dapat tercapai.

e. Operasi dan Pemeliharaan (Operation and Maintenance)

Aktivitas ini adalah untuk pemeliharaan melakukan penyesuaian apabila Stemming Engine mengalami perubahan atau penambahan sesuai dengan kebutuhan.

(20)

1.6 Sistematika Penulisan

Sistematika penulisan dibuat agar rangkaian penyajian dari laporan skripsi tentang pembangunan Stemming Engine menjadi lebih terarah. Oleh karena itu laporan skripsi tentang pembangunan Stemming Engine disusun bab per bab dengan susunan sebagai berikut.

BAB 1 PENDAHULUAN

Bab ini berisi tentang dasar-dasar pemikiran untuk membuat aplikasi Stemming Engine yang meliputi permasalahan yang melatar belakangi dibuatnya aplikasi

Stemming Engine, merumuskan masalah-masalah untuk mendukung dibuatnya

Stemming Engine, maksud dan tujuan yang harus dicapai dari pembuatan aplikasi ini, batasan-batasan untuk untuk memfokuskan pembuatan aplikasi ini, metode-metode penelitian untuk pengumpulan data, metode-metode pembangunan perangkat lunak dan sistematika penulisan yang menjelaskan garis besar dari setiap bab nya.

BAB 2 TINJAUAN PUSTAKA

Bab ini menjelaskan tentang profile tempat penelitian dan teori-teori yang menunjang dan berhubungan dengan pembuatan dan perancangan serta sebagai acuan dalam pembuatan sistem, sehingga perancangan tersebut sesuai dengan teori yang sudah ada.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

(21)

terdapat juga perancangan untuk aplikasi yang akan dibangun sesuai dengan hasil analisis yang sedang dibuat.

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini menjelaskan tentang penerapan dari analisis dan perancangan sistem. Implementasi perangkat lunak dilakukan berdasarkan kebutuhan analisis dan perancangan perangkat lunak yang sudah dilakukan. Dari hasil implementasi kemudian dilakukan pengujian perangkat lunak agar perangkat lunak yang dibangun sesuai dengan analisis dan perancangan yang telah dilakukan.

BAB 5 KESIMPULAN DAN SARAN

(22)

9

2.1 Profil Balai Bahasa Bandung

Berikut ini adalah profil dari Balai Bahasa Bandung yang merupakan

tempat penelitian untuk membangun aplikasi Stemming Engine.

2.1.1 Sejarah Balai Bahasa Bandung

Pasal 36 UUD 1945 menyebutkan bahwa bahasa resmi negara adalah

bahasa Indonesia. Berlandaskan pada pasal itu Pemerintah Indonesia berusaha

melestarikan, membina, dan mengembangkan bahasa Indonesia dan bahasa

daerah. Sebagai tindak lanjutnya, pemerintah membentuk lembaga yang bernama

Pusat Bahasa (sebelumnya pada tahun 1966 bernama Lembaga Bahasa dan

Budaya, kemudian diubah menjadi Lembaga Bahasa Nasional pada tahun 1969.

Sejak April 1975 Lembaga Bahasa Nasional diubah menjadi Pusat Pembinaan

dan Pengembangan Bahasa, lalu nama tersebut diubah lagi menjadi Pusat Bahasa

pada tahun 1999). Lembaga ini berada di bawah Departemen Pendidikan

Nasional.

Pusat Bahasa mempunyai tugas utama mengembangkan dan membina

bahasa dan sastra Indonesia dan daerah. Mengingat wilayah yang harus dijangkau

meliputi seluruh Indonesia, Pusat Bahasa mendirikan balai-balai bahasa di seluruh

Indonesia. Balai bahasa yang berada di Provinsi Jawa Barat adalah Balai Bahasa

Bandung ( yang nantinya akan bernama Balai Bahasa Provinsi Jawa Barat). Balai

(23)

2.1.2 Visi Dan Misi Balai Bahasa Bandung

Berikut ini adalah visi dan misi Balai Bahasa Bandung:

Visi

Visi Balai Bahasa Bandung adalah terwujudnya lembaga penelitian yang unggul

dan pusat informasi serta pelayanan di bidang kebahasaan dan kesastraan

(Indonesia dan daerah) di Jawa Barat.

Misi

Misi Balai Bahasa Bandung adalah:

1. meningkatkan mutu bahasa dan sastra;

2. meningkatkan sikap positif masyarakat terhadap bahasa dan sastra;

3. mengembangkan bahan informasi kebahasaan dan kesastraan;

4. mengembangkan tenaga kebahasaan dan kesastraan;

5. meningkatkan kerja sama.

2.1.3 Struktur Organisasi Balai Bahasa Bandung

Struktur organisasi Balai Bahasa Bandung tidaklah rumit dan kompleks

hanya terdiri dari bagian yang penting saja misalnya Kepala, Sub Bagian, serta

(24)

KEPALA BALAI BAHASA BANDUNG

PENGEMBANGAN DAN PELINDUNGAN

BAHASA DAN SASTRA

KASUBBAG TATA USAHA

PEMBINAAN BAHASA DAN SASTRA PENGKAJIAN BAHASA

DAN SASTRA

URUSAN KEUANGAN URUSAN PERENCANAAN

URUSAN KETATALAKSANAAN DAN KEPEGAWAIAN

URUSAN UMUM

Gambar 2.1 Struktur Organisasi Balai Bahasa Bandung

2.1.4 Job Description

Berikut ini adalah job description yang terdapat pada Balai Bahasa Bandung di bagian kelompok jabatan fungsional :

1. Menyusun program rencana penelitian, pembinaan dan pengembangan

bahasa dan sastra di daerah.

2. Mengkaji, menganalisis, menyusun bahan kebijakan teknis pembinaan

bahasa dan sastra di daerah.

3. Mengkaji, menganalisis, dan meyusun konsep, pedoman, standar dan

norma pembinaan bahasa dan sastra di daerah.

4. Melakukan penyusunan penelitian, pembinaan dan pengembangan bahasa

dan sastra di daerah.

(25)

6. Melakukan penelitian bahasa dan sastra di daerah.

7. Melakukan evaluasi hasil penelitian, pembinaan, dan pengembangan

bahasa dan sastra di daerah.

8. Menyajikan data dan informasi jaringan kebahasan dan kesastraan di

daerah.

2.1.5 Deskripsi Tugas dan Fungsi Balai Bahasa Bandung

Tugas pokok Balai Bahasa Bandung adalah melaksanakan penelitian,

pengembangan, pembinaan bahasa dan sastra di daerah. Sementara itu, fungsi

Balai Bahasa Bandung adalah:

1. Melaksanakan kebijakan teknis Pusat Bahasa di bidang pembinaan

dan pengembangan bahasa dan sastra Indonesia.

2. Merumuskan dan melaksanakan kebijakan teknis di bidang pembinaan

dan pengembangan bahasa dan sastra Indonesia di daerah.

3. Bekerja sama dengan pemerintah provinsi, kota, dan kabupaten.

2.2 Landasan Teori

Dalam pembangunan Stemming Engine terdapat beberapa landasan teori yang mendukung, diantaranya akan dijelaskan dibawah ini.

2.2.1 Text Mining

Text mining merupakan salah satu aplikasi dari data mining. Text mining

(26)

dokumen-dokumen teks. Pada intinya proses kerja text mining sama dengan proses kerja

data mining pada umumnya hanya saja data yang di mining merupakan text databases.

Data teks akan diproses menjadi data numerik agar dapat dilakukan

proses lebih lanjut. Sehingga dalam text mining ada istilah preprocessing data, yaitu proses pendahulu yang diterapkan terhadap data teks yang bertujuan untuk

menghasilkan data numerik.

Pada proses preprosesing merupakan tahap dimana deskripsi di tangani

untuk dapat siap diproses memasuki tahap text mining. Tahap-tahap tersebut adalah:

1. Tokenizing

2. Filtering

3. Stemming

4. Tagging

5. Anayizing

2.2.1.1 Tokenizing

Tokenizing adalah sebuah proses yang dilakukan seseorang untuk menjadikan sebuah kalimat menjadi lebih bermakna atau berada dengan cara

memecah kalimat tersebut menjadi kata-kata atau frase-frase (“Parsing”). Parsing di dalam pembuatan aplikasi text mining ini merupakan proses penguraian deskripsi yang semula berupa kalimat-kalimat berisi kata-kata dan tanda pemisah antara kata

seperti titik(.), koma(,), spasi dan tanda pemisah lain menjadi kata-kata saja baik itu

(27)

parsing ini terlihat sebagai proses pengambilan kata jika ketemu tanda spasi namun pada kenyataannya tidak sesederhana itu.

2.2.1.2 Filtering

Proses filtering merupakan proses mengambil kata-kata penting yang terdapat dari hasil tokenizing. Untuk melakukan filtering bisa menggunkan algoritma stop list atau word list. Pada aplikasi yang akan dibangung menggunakan algoritma stop list yaitu membuang kata yang kurang penting yang terdapat dalam data hasil tokenizing. Data hasil tokenizing akan dibandingkan dengan daftar kata tidak penting. Jika terdapat dalam daftar tersebut maka kata

tersebut maka akan dihapus.

2.2.1.3 Stemming

Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Tidak banyak algoritma yang dikhususkan untuk stemming bahasa Indonesia dengan berbagai keterbatasan didalamnya. Algoritma Porter salah

satunya, Algoritma ini membutuhkan waktu yang lebih singkat dibandingkan

dengan stemming menggunakan Algoritma Nazief & Adriani, namun proses stemming menggunakan Algoritma Porter memiliki prosentase keakuratan (presisi) lebih kecil dibandingkan dengan stemming menggunakan Algoritma

Nazief & Adriani. Algoritma Nazief & Adriani sebagai algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan

(presisi) lebih baik dari algoritma lainnya. Algoritma ini sangat dibutuhkan dan

(28)

Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks

ke bentuk kata dasarnya. Algoritma stemming untuk bahasa yang satu berbeda dengan algoritma stemming untuk bahasa lainnya. Sebagai contoh bahasa Inggris

memiliki morfologi yang berbeda dengan bahasa Indonesia sehingga

algoritma stemming untuk kedua bahasa tersebut juga berbeda. Proses stemming pada teks berbahasa Indonesia lebih rumit/kompleks karena terdapat variasi imbuhan yang harus dibuang untuk mendapatkan root word(kata dasar) dari sebuah kata [2].

2.2.2 Pembangun Perangkat Lunak

Berikut ini adalah pembahasan teori yang merupakan pembangun dari

perangkat lunak yang akan dibangun.

2.2.2.1 HTML

Sebuah bahasa markup yang digunakan untuk membuat sebuah halaman web dan menampilkan berbagai informasi di dalam sebuah browser Internet.

Bermula dari sebuah bahasa yang sebelumnya banyak digunakan di dunia

penerbitan dan percetakan yang disebut dengan SGML (Standard Generalized Markup Language), HTML adalah sebuah standar yang digunakan secara luas untuk menampilkan halaman web. HTML saat ini merupakan standar Internet

yang didefinisikan dan dikendalikan penggunaannya oleh World Wide Web

Consortium (W3C).

HTML berupa kode-kode tag yang menginstruksikan browser untuk

(29)

merupakan file HTML dapat dibuka dengan menggunakan browser web seperti

Mozilla Firefox atau Microsoft Internet Explorer. HTML juga dapat dikenali oleh

aplikasi pembuka email ataupun dari PDA dan program lain yang memiliki

kemampuan browser.

HTML dokumen tersebut mirip dengan dokumen teks biasa, hanya dalam

dokumen ini sebuah teks bisa memuat instruksi yang ditandai dengan kode atau

lebih dikenal dengan TAG tertentu.. Tanda <b> digunakan untuk mengaktifkan

instruksi cetak tebal, diikuti oleh teks yang ingin ditebalkan, dan diakhiri dengan

tanda </b> untuk menonaktifkan cetak tebal tersebut. Secara garis besar, terdapat

empat jenis elemen dari HTML:

1. structural. tanda yang menentukan level atau tingkatan dari sebuah teks akan memerintahkan browser untuk menampilkan “Golf” sebagai teks

tebal besar yang menunjukkan sebagai Heading 1

2. presentational. tanda yang menentukan tampilan dari sebuah teks tidak peduli dengan level dari teks tersebut. Tanda presentational saat ini sudah

mulai digantikan oleh CSS dan tidak direkomendasikan untuk mengatur

tampilan teks,

3. hypertext. tanda yang menunjukkan pranala ke bagian dari dokumen tersebut atau pranala ke dokumen lain akan menampilkan sebagai sebuah

hyperlink ke URL tertentu),

(30)

Selain markup presentational, markup yang lain tidak menentukan bagaimana tampilan dari sebuah teks. Namun untuk saat ini, penggunaan tag

HTML untuk menentukan tampilan telah dianjurkan untuk mulai ditinggalkan dan

sebagai gantinya digunakan Cascading Style Sheets.

2.2.2.2 PHP

PHP (Personal Home Page) merupakan script untuk pemrograman web

server-side, script yang membuat dokumen HTML secara on the fly, dokumen

HTML yang dihasilkan dari suatu aplikasi bukan dokumen HTML yang dibuat

dengan menggunakan teks editor atau editor HTML. Dengan menggunakan PHP,

maintanance suatu situs web menjadi lebih mudah. Proses update data dapat

dilakukan dengan menggunakan aplikasi yang dibuat dengan menggunakan script

PHP. PHP/FI merupakan nama awal dari PHP, dibuat pertama kali oleh Rasmus

Lerdoff. PHP awalnya merupakan program CGI yang dikhususkan untuk

menerima input melalui form yang ditampilkan dalam browser web. Software ini

disebarkan dan dilisensikan sebagai perangkat lunak Open Source. Adapun

keunggulan yang dimiliki oleh PHP adalah:

1. Life Cycle yang sangat singkat, sehingga PHP selalu up to date mengikuti perkembangan teknologi internet.

2. Cross Platform, yakni PHP dapat dipakai di hampir semua webserver yang ada di pasaran (terutama Apache dan Microsoft IIS) dan dijalankan

(31)

3. PHP mendukung koneksi ke banyak database baik yang gratis maupun

komersil, seperti MySQL, mSQL, Oracle, Microsoft SQL Server,

Interbase, dan banyak lagi.

4. PHP bersifat open source dan gratis. Kemudahan dalam mendapatkan

dokumentasi. di Internet, tidak akan sulit untuk mencari baik itu

referensi, kode-kode PHP yang sudah jadi dan juga mengajukan pertanyaan

pada grup-grup diskusi yang di dalamnya banyak sekali para master PHP.

2.2.2.3 MySQL

MySQL adalah sebuah implementasi dari sistem manajemen basisdata

relasional (RDBMS) yang didistribusikan secara gratis dibawah lisensi

GPL (General Public License). Setiap pengguna dapat secara bebas menggunakan

MySQL, namun dengan batasan perangkat lunak tersebut tidak boleh dijadikan

produk turunan yang bersifat komersial. MySQL sebenarnya merupakan turunan

salah satu konsep utama dalam basisdata yang telah ada

sebelumnya; SQL(Structured Query Language). SQL adalah sebuah konsep pengoperasian basis data, terutama untuk pemilihan atau seleksi dan pemasukan

data, yang memungkinkan pengoperasian data dikerjakan dengan mudah secara

otomatis.

Kehandalan suatu sistem basisdata (DBMS) dapat diketahui dari cara

kerja pengoptimasi-nya dalam melakukan proses perintah-perintah SQL yang

dibuat oleh pengguna maupun program-program aplikasi yang memanfaatkannya.

Sebagai peladen basis data, MySQL mendukung operasi basisdata transaksional

(32)

non-transaksional, MySQL dapat dikatakan unggul dalam hal unjuk kerja

dibandingkan perangkat lunak peladen basisdata kompetitor lainnya. Namun

demikian pada modus non-transaksional tidak ada jaminan atas reliabilitas

terhadap data yang tersimpan, karenanya modus non-transaksional hanya cocok

untuk jenis aplikasi yang tidak membutuhkan reliabilitas data seperti aplikasi

blogging berbasis web (wordpress), CMS, dan sejenisnya. Untuk kebutuhan

sistem yang ditujukan untuk bisnis sangat disarankan untuk menggunakan modus

basisdata transaksional, hanya saja sebagai konsekuensinya unjuk kerja MySQL

pada modus transaksional tidak secepat unjuk kerja pada modus

non-transaksional.

Sebagai server database dengan konsep database modern, MySQL

memiliki keistimewaan. Beberapa keistimewaan dimiliki MySQL sebagai berikut:

1. Portability Database. MySQL berfungsi dengan stabil tanpa kendala, berarti berlaku pada berbagai sistem operasi seperti Windows, Linux,

FreeBSD, Mac OS X Server, Solaris, Amiga, HP-Unix, dan lain-lain.

2. Open Source. MySQL merupakan database open source (gratis), di bawah lisensi GPL sehingga dapat memperoleh dan menggunakannya

secara cuma-cuma tanpa membayar sepersen pun.

3. Multiuser. MySQL merupakan database yang dapat digunakan untuk menangani beberapa user dalam waktu bersamaan tanpa mengalami

masalah. Dan memungkinkan sebuah database server MySQL dapat

(33)

4. Performance Tuning. MySQL mempunyai kecepatan yang cukup baik dalam menangani query query sederhana, serta mampu memproses lebih

banyak SQL per satuan waktu.

5. Column Type Database. MySQL didukung dengan tipe data yang sangat kompleks, seperti signed/unsigned integer, float, double, char, varchar,

text, blob, data, time, datetime, timestamp, year, set serta enum.

6. Command dan Functions. MySQL server memiliki operator dan fungsi secara penuh yang mendukung perintah SELECT dan WHERE dalam

query.

7. Security. Sistem Security pada MySQL mempunyai beberapa lapisan sekuritas seperti tingkatan subnetmask, hostname, dan izin akses user

dengan sistem perizinan yang mendetil serta password terenkripsi.

8. Scalability dan Limits. MySQL mempunyai kemampuan menangani database dalam skala cukup besar, dengan jumlah record lebih dari 50

juta dan 60 ribu tabel serta 5 miliar baris. Selain itu dapat menampung

indeks sampai 32 indeks pada tiap tabelnya.

9. Connectivity. Adanya kemampuan MySQL melakukan koneksi dengan client menggunakan protokol TCP/IP, Unix socket (Unix), atau Named

Pipes (NT).

(34)

11.Interface. MySQL memiliki interface terhadap berbagai aplikasi dan

bahasa pemograman menggunakan fungsi API (Application

Programming Interface).

12.Clients dan Tools. Database MySQL dilengkapi berbagai tools yang dapat digunakan untuk administrasi database.

13.Struktur Tabel. MySQL memiliki struktur tabel cukup baik serta cukup fleksibel, misalnya ketika menangani alter table.

2.2.2.4 Dreamweaver CS5

Adobe Dreamweaver merupakan program penyunting halaman web

keluaran adobe system yang dulu dikenal sebagai micromedia dreamweaver

keluaran micromedia. Program ini banyak digunakan oleh pengembang web

karena fitur-fiturnya yang menarik dan kemudahan penggunanya.Versi terakhir

Dreamweaver keluaran Adobe Systems adalah Adobe Dreamweaver CS5 yang

ada dalam Adobe Creative Suite 5.

Fitur baru Dreamweaver CS5 yang makin handal untuk versi terbaru ini

di antaranya adalah Integrated CMS Support, CSS Inspection, PHP custom class

code hinting, dan site-specific code hinting. Semua fitur baru tersebut semakin

memantapkan pengguna Adobe Dreamweaver CS5 untuk semakin

mengeksplorasi dan mengeksploitasi ide kreasi pengolahan website.

Beberapa kelebihan adobe Dreamweaver CS5 :

(35)

2. Kemampuannya membuat halaman web yang terlihat konsisten. Adobe

Dreamweaver sudah terinstall beberapa template yang elegan dan

menarik. Tentunya ini memudahkan anda yang ingin belajar membuat

sebuah web namun anda belum mampu membuat design web sendiri.

Jika anda ingin membuat lebih dari 10 halaman web dengan didasarkan

design template tertentu maka web anda akan memiliki gaya halaman

web yang sama dan terlihat konsisten dari halaman perhalaman.

3. Kemudahan dan efisiensi dalam penggunaan.

Program ini tidak hanya dirancang untuk anda yang sudah mahir dan

mengerti bahasa pemrograma. Bagi anda yang belum mengerti bahasa

pemrograman, anda bisa membuat halaman web dengan hanya cara

mengklik atau drag and drop menggunakan mouse serta anda juga bisa

melihat halaman html-nya selama proses desain berlangsung.

4. Mudah untuk mengupload melalui FTP.

Dreamweaver sudah dilengkapi dengan fitur FTP jadi setelah anda

selesai membangun sebuah web, anda bisa langsung menguploadnya

melalui FTP . FTP(singkatan dari File Transfer Protocol) adalah sebuah protokol Internet yang berjalan di dalam lapisan aplikasi yang merupakan

standar untuk pentransferan berkas (file) komputer antar mesin-mesin dalam sebuah internetwork.

5. Dapat dikustom

Dreamweaver dapat disesuaikan dengan kebutuhan yang anda perlukan.

(36)

dengan preferensi pribadi. Hal ini dapat secara efektif memudahkan

proses desain web. Selain itu dreamweaver didukung banyak plug-in

(37)

24

3.1 Analisis Sistem

Analisis adalah proses mengurai konsep ke dalam bagian-bagian yang lebih sederhana, sedemikian rupa sehingga struktur logisnya menjadi jelas. Analisis merupakan metode untuk menguji, menilai, dan memahami sistem pemikiran yang kompleks dengan memecahnya ke dalam unsur-unsur yang lebih sederhana sehingga hubungan antar unsur-unsur itu menjadi jelas.

Pada analisis sistem ini akan dilakukan penguraian dari suatu sistem informasi yang utuh kedalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan mengevaluasi permasalahan-permasalan sehingga ditemukan kelemahannya. Hambatan-hambatan yang terjadi dan kebutuhan kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan-perbaikannya. Tahap-tahap analisis sistem adalah sebagai berikut :

1. Analisis masalah.

2. Analisis sistem yang sedang berjalan. 3. Analisis kebutuhan non fungsional. 4. Analisis kebutuhan fungsional.

3.1.1 Analisis Masalah

(38)

apakah dokumen-dokumen tersebut terdapat kata-kata tidak baku atau tidak. Dengan cara seperti itu maka untuk menyelesaikan pemeriksaan dokumen dalam jumlah yang banyak sangat membutuhkan waktu yang lama.

3.1.2 Analisis Sistem Yang Sedang Berjalan

Analisis sistem yang sedang berjalan menjelaskan tentang bagaimana kegiatan sistem yang sedang berjalan di Balai Bahasa Bandung. Analisis sistem ini mencakup analisis prosedur manual dan aliran dokumen manual. Berdasarkan pengamatan yang dilakukan di Balai Bahasa Bandung, prosedur yang ada saat ini adalah prosedur pemeriksaan dokumen. Proses-proses dalam prosedur pemeriksaan dokumen tersebut adalah sebagai berikut :

1. Penulis mengirimkan atau memberikan dokumen kepada pemeriksa dokumen Balai Bahasa Bandung.

2. Setelah dokumen diberikan kepada pemeriksa dokumen maka pemeriksa melakukan pemeriksaan kata tidak baku dalam dokumen tersebut.

3. Jika dokumen tersebut tidak terdapat kata yang tidak baku maka pemeriksa langsung menyimpannya ke tempat penyimpanan.

4. Jika dokumen tersebut terdapat kata yang tidak baku maka pemeriksa melakukan perbaikan.

5. Setelah dokumen diperbaiki maka pemeriksa meminta persetujuan untuk dokumen yang telah diperbaiki.

6. Jika disetujui dokumen disimpan.

(39)

Untuk lebih jelasnya dapat dilihat pada Gambar 3.1

Pemeriksaan Dokumen

Pemeriksa Penulis

Terdapat kata tidak baku?

Dokumen Dokumen

Pemeriksaan kata baku

Dokumen tidak mengandung kata tidak baku

Dokumen mengandung kata tidak baku Ya

Tidak

Dokumen hasil perbaikan Perbaikan

dokumen

Dokumen hasil perbaikan

Penyetujuan Perbaikan Dokumen

Disetujui?

Dokumen hasil perbaikan

Dokumen hasil perbaikan Ya

[image:39.595.113.511.132.731.2]

Tidak

(40)

3.1.3 Analisis Metode

Analisis metode menjelaskan tentang bagaimana stemming itu terjadi dan menjelaskan tentang tahap-tahap yang dilakukan untuk melakukan proses

stemming. Secara umum sistem ini terdiri dari empat proses, proses-proses tersebut adalah sebagai berikut:

1. Proses Tokenizing

2. Proses Filtering

3. Proses Stemming

4. Proses Tagging, proses ini tidak digunakan dalam bahasa Indonesia karena dalam bahasa Indonesia tidak memiliki bentuk lampau.

(41)

Mulai

Data pada dokumen

Hasil stemming

Selesai Tokenizing

Filtering

[image:41.595.273.348.107.430.2]

Stemming

Gambar 3.2 Flowchart Stemming

Untuk mengetahui lebih jelas dari proses-proses tersebut maka akan di jelaskan sebagai berikut:

1. Proses Tokenizing

(42)

Proses ini akan melakukan pengecekan dari karakter pertama sampai dengan karakter terakhir. Apabila karakter ke-i bukan merupakan pemenggal kata maka akan ditambahkan dengan karakter selanjutnya. Karakter pemenggal kata ini contohnya seperti tanda baca atau spasi.

Berikut ini adalah langkah-langkah untuk melakukan tokenizing pada sebuah data yang berada dalam dokumen, data dalam dokumen tersebut adalah sebagai berikut:

a. Memotong setiap kata yang terdapat dalam teks, dan mengubahnya menjadi huruf kecil.

b. Hanya a sampai z karakter yang diterima, selain karakter tersebut akan dihilangkan.

c. Hasilnya adalah sebagai berikut :

(43)

2. Proses Filtering

Proses filtering merupakan proses mengambil kata-kata penting yang terdapat dari hasil tokenizing. Untuk melakukan filtering bisa menggunkan algoritma stop list atau word list. Pada aplikasi yang akan dibangung menggunakan algoritma stop list yaitu membuang kata yang kurang penting yang terdapat dalam data hasil tokenizing. Data hasil tokenizing akan dibandingkan dengan daftar kata tidak penting. Jika terdapat dalam daftar tersebut maka kata tersebut maka akan dihapus. Kata-kata yang tersisa merupakan kata yang dianggap penting. Untuk lebih jelasnya tahapan proses filtering adalah sebagai berikut:

a. Kata hasil dari proses tokenizing dibandingkan dengan tabel stopword.

Hasil Tokenizing

Balai Bahasa Bandung merupakan pelayan bagi masyarakat dalam hal kebahasaan.

balai bahasa bandung merupakan pelayan bagi

masyarakat dalam hal

(44)

b. Jika kata hasil tokenizing sama dengan kata di tabel stopword maka akan dihapus.

c. Jika tidak sama dengan tabel stopword maka kata tersebut akan di simpan.

Berikut ini adalah contoh dari proses filtering : Daftar stopword : merupakan, bagi, dalam, hal.

3. Proses Stemming

Proses stemming merupakan pengelolaan kata hasil filtering menjadi kata dasar yaitu dengan cara menghilangkan imbuhan yang diantaranya adalah “di”,

“ke”, “ me”, “meng”, “-an”, “-kan”. Untuk lebih jelasnya tahapan dari proses

stemming adalah sebagai berikut:

a. Data hasil dari filtering diperiksa apakah mengandung imbuhan atau tidak.

b. Jika terdapat imbuhan maka akan dilakukan pembuangan imbuhan, terus diulang sampai kata tersebut tidak mengandung imbuhan.

balai bahasa bandung merupakan pelayan bagi

masyarakat dalam hal

kebahasaan

balai bahasa bandung pelayan masyarakat kebahasaan

Hasil Tokenizing

(45)

c. Jika sudah tidak mengandung imbuhan maka akan disimpan. Contoh dari proses stemming adalah sebagai berikut :

Dalam data hasil filtering tersebut terdapat kata yang mengandung imbuhan yaitu kata “kebahasaan” yang merupakan dari kata “bahasa”. Pada

contoh ini imbuhan yang dihilangkan adalah “ke” dan “-an”.

Untuk proses stemming dalam Stemming Engine ini adalah dengan menggunakan algoritma yang dibuat oleh Bobby Nazief dan Mirna Adriani. Berikut ini adalah tahap-tahapnya:

1. Cari kata yang akan distem dalam kamus. Jika ditemukan maka diasumsikan bahwa kata tesebut adalah root word. Maka algoritma berhenti.

2. Inflection Suffixes(“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang.

Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”) maka langkah ini diulangi lagi untuk menghapus Possesive Pronouns (“

-ku”, “-mu”, atau “-nya”), jika ada.

3. Hapus Derivation Suffixes (“-i”, “-an” atau “-kan”). Jika kata ditemukan di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a

balai bahasa bandung pelayan masyarakat bahasa

Hasil Filtering Hasil Stemming

(46)

a. Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut adalah

“-k”, maka “-k” juga ikut dihapus. Jika kata tersebut ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka lakukan langkah 3b.

b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”) dikembalikan, lanjut ke langkah 4.

4. Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b.

a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak pergi ke langkah 4b. b. For i = 1 to 3, tentukan tipe awalan kemudian hapus awalan. Jika

root word belum juga ditemukan lakukan langkah 5, jika sudah maka algoritma berhenti. Catatan: jika awalan kedua sama dengan awalan pertama algoritma berhenti.

5. Melakukan Recoding.

6. Jika semua langkah telah selesai tetapi tidak juga berhasil maka kata awal diasumsikan sebagai root word. Proses selesai.

Tipe awalan ditentukan melalui langkah-langkah berikut:

(47)

2. Jika awalannya adalah “te-”, “me-”, “be-”, atau “pe-” maka dibutuhkan sebuah proses tambahan untuk menentukan tipe awalannya.

3. Jika dua karakter pertama bukan “di-”, “ke-”, “se-”, “te-”, “be-”, “me

-”, atau “pe-” maka berhenti.

4. Jika tipe awalan adalah “none” maka berhenti. Jika tipe awalan adalah

bukan “none” maka awalan dapat dilihat pada Tabel 3.2.

Tabel 3.1 Kombinasi Awalan Akhiran Yang Tidak Diijinkan

Awalan Akhiran yang tidak diijinkan

be- -i

di- -an

ke- -i, -kan

me- -an

se- -i, -kan

Tabel 3.2 Tipe Awalan Untuk Kata Yang Diawali dengan “-te”

Following Characters Tipe

Awalan

Set 1 Set 2 Set 3 Set 4

“-r” “-r” - - non

“-r” vowel - - ter-luluh

“-r” not (vowel or “-r-”) “-er” vowel ter

“-r” not (vowel or “-r-”) “-er” not vowel ter-

“-r” not (vowel or “-r-”) not “-er-“ - ter

not (vowel or “-r-”) “-er” vowel - none

(48)

Tabel 3.3 Jenis Awalan Berdasarkan Tipe Awalannya

Tipe

Awalan Akhiran yang harus dihapus

di- di-

ke- ke-

se- se-

te- te-

ter- ter-

ter-luluh ter

Berikut adalah aturan-aturan yang terdapat pada awalan sebagai pembentuk kata dasar yang harus diikuti oleh algoritma stemming:

Keterangan:

Vokal : a,i,u,e,o Konsonan : a-z 1. Awalan Se-

Se + Vokal : tidak berubah

Se + Konsonan : tidak berubah

2. Awalan Me-

Me + Vokal atau konsonan g, h , k : menjadi sengau “meng”

Me + konsonan b, p, t : menjadi “mem”

Me + konsonan c , d, j : menjadi “men”

Me + konsona s : menjadi “meny”

Me + kosonan l, m, n, r, w : tetap “me” 3. Awalan Ke-

Ke + Vokal : tidak berubah

Ke + Konsonan : tidak berubah

(49)

Pe + Vokal : menjadi “per”

Pe + Konsonan h, g, k : menjadi “per”

Pe + Konsonan t : menjadi “pen”

Pe + konsonan z, d, c, z : menjadi “pen“ Pe + konsonan b, f, v, p : menjadi “pem”

Pe + kosonan s : menjadi “peny”

Pe + konsonan l, m, n, r, w : tidak berubah

3.1.4 Aturan Bisnis

Di dalam sistem yang sedang berjalan terdapat beberapa aturan yang harus dilakukan. Aturan-aturan tersebut berfungsi untuk membatasi aplikasi yang akan dibuat agar aplikasi sesuai dengan aturan yang sudah ada. Berikut ini adalah aturan-aturan pada sistem yang sedang berjalan:

1. Dokumen yang dikirim ke Balai Bahasa Bandung harus berekstensi txt.

2. Judul, nama penulis, instansi, alamat instansi, nomor telepon serta alamat pos-el disertakan dalam dokumen.

3.1.5 Spesifikasi Kebutuhan Perangkat Lunak

(50)

Tabel 3.4 Spesifikasi Kebutuhan Perangkat Lunak Fungsional

Nomor Spesifikasi Kebutuhan Perangkat Lunak Fungsional

SKPL-F001 Sistem dapat melakukan registrasi penulis SKPL-F002 Sistem dapat melakukan proses login

SKPL-F003 Sistem dapat menerima masukan berupa dokumen dalam bentuk file

SKPL-F004 Sistem dapat melakukan proses tokenizing

SKPL-F005 Sistem dapat melakukan proses filtering

SKPL-F006 Sistem dapat melakukan proses Stemming

SKPL-F007 Sistem dapat menampilkan data hasil dari setiap proses SKPL-F008 Sistem dapat menampilkan daftar kata tidak baku

Tabel 3.5 Spesifikasi Kebutuhan Perangkat Lunak Non Fungsional

Nomor Spesifikasi Kebutuhan Perangkat Lunak Non Fungsional

SKPL-NF001 Sistem berbasis web

SKPL-NF002 File yang bisa diolah berupa file txt.

SKPL-NF003 Sistem harus memiliki dua pengguna yaitu penulis dan pemeriksa

3.1.6 Analisis Kebutuhan Non Fungsional

Analisis kebutuhan non fungsional merupakan analisis yang dibutuhkan untuk menentukan spesifikasi kebutuhan sistem. Analisis kebutuhan non fungsional juga menentukan spesifikasi inputan yang diperlukan sistem, output yang akan dihasilkan sistem dan proses yang dibutuhkan untuk mengolah inputan dan akhirnya didapatlah suatu output yang dikendaki. Kebutuhan non fungsional terbagi menjadi beberapa analisis yaitu analisis perangkat keras, perangkat lunak dan analisis pengguna.

3.1.6.1 Analisis Kebutuhan Perangkat Keras

(51)

membutuhkan data dari perangkat keras yang sedang digunakan di Balai Bahasa Bandung pada saat ini dan kebutuhan perangkat keras untuk membangun dan menjalankan aplikasi Stemming Engine

1. Spesifikasi Perangkat Keras Balai Bahasa Bandung

Perangkat keras yang terdapat di Balai Bahasa Bandung pada saat ini adalah sebagai berikut:

Tabel 3.6 Spesifikasi Perangkat Keras Balai Bahasa Bandung

No. Perangkat Keras Spesifikasi

1 Processor Pentium Dual Core 2,2 GHz

2 Monitor Monitor VGA 14 inch

3 VGA VGA Card On-Board 250 Mb

4 Harddisk 160 GB

5 Memory Memori DDR2 1GB

6 Modem 384 Kbps

7 Mouse PS/2 atau USB

8 Keyboard PS/2 atau USB

2. Spesifikasi Kebutuhan Perangkat Keras

Spesifikasi kebutuhan perangkat keras dibagi menjadi dua, yaitu spesifikasi perangkat keras untuk membangun dan spesifikasi perangkat keras untuk menjalankan aplikasi.

a. Spesifikasi Kebutuhan Perangkat Keras untuk Membangun Aplikasi Berikut ini adalah spesifikasi perangkat keras untuk membangun

(52)

Tabel 3.7 Spesifikasi Perangkat Keras untuk Membangun Aplikasi

No. Perangkat Keras Spesifikasi

1 Processor Core i5 Processor 460M : 2.53 GHz 2 Display 14" 16:9 HD (1366x768) LED backlight

3 VGA 1 GB

4 Harddisk 640 GB

5 Memory Memori DDR3 2GB

6 Modem 128 Kbps

7 Mouse PS/2 atau USB

8 Keyboard PS/2 atau USB

b. Spesifikasi Kebutuhan Perangkat Keras untuk Menjalankan Aplikasi Berikut ini adalah spesifikasi minimum perangkat keras yang dibutuhkan agar dapat menjalankan aplikasi secara optimal dapat dilihat pada Tabel 3.8.

Tabel 3.8 Spesifikasi Perangkat Keras untuk Menjalankan Aplikasi

No. Perangkat Keras Spesifikasi

1 Processor Dual Core 2,1 GHz

2 Monitor Monitor VGA 14 inch

3 VGA VGA Card On-Board 64 Mb

4 Harddisk 160 GB

5 Memory Memori DDR2 1 GB

6 Modem 128 Kbps

7 Mouse PS/2 atau USB

8 Keyboard PS/2 atau USB

(53)

3.1.6.2 Analisis Kebutuhan Perangkat Lunak

Spesifikasi kebutuhan perangkat lunak merupakan analisis yang dilakukan untuk mengetahui perangkat lunak apa saja yang digunakan untuk membangun dan menjalankan aplikasi Stemming Engine.

1. Kebutuhan Perangkat Lunak untuk Membangun Aplikasi

Kebutuhan perangkat lunak untuk membangun aplikasi merupakan kebutuhan perangkat lunak yang digunakan agar bisa membangun aplikasi ini. Untuk lebih jelasnya dapat dilihat pada Tabel 3.9.

Tabel 3.9 Kebutuhan Perangkat Lunak untuk Membangun

No. Perangkat Lunak

1 Windows 7 2 Dreamweaver CS5 3 Wampserver 2.1 4 MySQL Server 5.2

5 Google Chrome/Mozilla Firefox

2. Kebutuhan Perangkat Lunak untuk Menjalankan Aplikasi

Kebutuhan perangkat lunak untuk menjalankan aplikasi merupakan kebutuhan perangkat lunak yang digunakan agar bisa menjalankan aplikasi ini dengan optimal. Untuk lebih jelasnya dapat dilihat pada Tabel 3.10.

Tabel 3.10 Kebutuhan Perangkat Lunak untuk Menjalankan

No. Perangkat Lunak

(54)

3.1.6.3 Analisis Pengguna

Pengguna yang akan menggunakan aplikasi ini adalah pemeriksa dokumen-dokumen dan penulis yang ingin mengirimkan karya tulisnya ke Balai Bahasa Bandung. Pemeriksa bertanggung jawab untuk memeriksa dokumen-dokumen yang masih terdapat kata yang tidak baku atau tidak sesuai aturan bahasa Indonesia. Sedangkan Penulis hanya mengirimkan ke Balai Bahasa Bandung. Untuk lebih jelasnya lihat pada Tabel 3.11.

Tabel 3.11 Analisis pengguna

Pengguna Tanggung Jawab Hak Akses Tingkat

Pendidikan

Tingkat Keterampilan

Pemeriksa Memeriksa dokumen-dokumen yang dikirimkan oleh penulis a. Mengolah data kata dasar b. Mengolah data stopword c. Memeriksa dokumen

Sarjana Menguasai komputer, mengerti dalam menggunakan aplikasi web.

Penulis Mengirimkan hasil karya tulis

a. Mengolah data dokumen b. Mengolah data profil Minimal SMA Menguasai komputer, mengerti dalam menggunakan aplikasi web.

3.1.7 Analisis Data

(55)
(56)

Entitas serta relasi pada Entity Relationship Diagram (ERD) memiliki atribut yang dijelaskan pada Tabel 3.12.

Tabel 3.12 Keterangan Atribut Entitas Pada ERD

No Nama Entitas Atribut

1 Penulis id_penulis, username, password, nama, instansi, alamat_instansi, no_telepon, email.

2 Pemeriksa username, password, nama 3

Dokumen id_dokumen, judul_dokumen, nama_file, tipe, ukuran, id_penulis

4 Token id_token, kata_token, id_dokumen 5 Filter id_filter, kata_filter, id_token

6 Stopword id_stopword, kata_stopword, id_pemeriksa 7 Stem id_stem, kata_stem, id_filter

8 Kata_dasar id_katdas, kata, id_pemeriksa

9 Tidakbaku Id_tidakbaku, kata_tidakbaku, id_filter

3.1.8 Analisis Kebutuhan Fungsional

Analisis kebutuhan fungsional adalah analisis terhadap kebutuhan secara fungsional baik dalam aliran data ataupun informasi. Analisis kebutuhan fungsional digambarkan dalam analisis terstruktur yang akan digambarkan pada subbab berikutnya.

3.1.8.1. Diagram Konteks

(57)

Pemeriksa Stemming Engine Data login

Data stopword Data kata dasar Data lihat token Data lihat filter Data lihat stem Data unduh dokumen

Info kata tidak baku Info kata dasar Info stopword Info token Info filter Info stem Info login Info unduh dokumen

Penulis Data registrasi

Data login Data dokumen

Info login Info registrasi Info dokumen

Mail Server Info lupa password

Gambar 3.4 Digram Konteks

3.1.8.2. DFD Level 1 Stemming Engine

(58)

Pemeriksa dokumen stem token tidak_baku Penulis 1 Pengolahan data pengguna pemeriksa penulis 2 Pengolaha data dokumen Data registrasi Data registrasi Data registrasi Info registrasi Data login Data login Info stem Info filter Data login Info login Data login Data login 3 Pengolahan data kata Data dokumen Info dokumen

Data lihat stem Data lihat filter Data lihat token

Kata_dasar

stopword Data kata dasar

Data stopword

Data kata dasar Data kata dasar

Data stopword Data stopword Info kata dasar

Info stopword filter Data dokumen Data dokumen 4 Pemeriksaan Dokumen Info token

Info tidak baku

Data dokumen Data tidak baku Data tidak baku

Data token Data token Data filter Data filter Data stem Data stem Data kata dasar Data kata stopword Data dokumen

Info dokumen Data login Data login

Mail Server Data lupa password

(59)

3.1.8.3. DFD Level 2 Proses 1 Stemming Engine

Diagram alir data pada level 2 proses 1 yaitu proses pengolahan data pengguna ditunjukan oleh Gambar 3.6.

Penulis

1.2 Login

pemeriksa Data login

Data login

Data login

Data login Data login

Info login

Data login Info login

1.1 Registrasi Data registrasi

Info registrasi

penulis

Pemeriksa

Data registrasi Data registrasi

1.3 Lupa Password

Mail Server

(60)

3.1.8.4. DFD Level 2 Proses 2 Stemming Engine

Diagram alir data pada level 2 proses 2 yaitu proses pengolahan data dokumen ditunjukan oleh Gambar 3.7.

2.1 Tambah dokumen Penulis dokumen 2.2 Ubah dokumen 2.3 Hapus dokumen 2.4 Cari dokumen Data ubah dokumen

Info ubah dokumen Data ubah dokumen Data ubah dokumen Data tambah dokumen

Info tambah dokumen Data tambah dokumen Data tambah dokumen

Data hapus dokumen

Info hapus dokumen Data hapus dokumen Data hapus dokumen

Data cari dokumen Info cari dokumen

Data cari dokumen Data cari dokumen

2.5 Unduh Dokumen Pemeriksa

Data unduh dokumen

Info unduh dokumen Data cari dokumen

Info cari dokumen

Data unduh dokumen Data unduh dokumen

(61)

3.1.8.5. DFD Level 2 Proses 3 Stemming Engine

Diagram alir data pada level 2 proses 3 yaitu proses pengolahan data kata ditunjukan oleh Gambar 3.8.

kata_dasar

Info stopword

Data stopword 3.1

Pengolahan data kata dasar

3.2 Pengolahan data

stopword

Data kata dasar

Data kata dasar

stopword

Data stopword Pemeriksa

Data stopword Data kata dasar

Info kata dasar

(62)

3.1.8.6. DFD Level 2 Proses 4 Stemming Engine

Diagram alir data pada level 2 proses 4 yaitu proses pemeriksaan dokumen ditunjukan oleh Gambar 3.9.

4.1 Tokenizing 4.2 Filtering 4.3 Stemming Pemeriksa Kata_dasar

Info tidak baku

stopword filter stem token Data token Data token Data filter Data filter Data filter Data filter Data Stem Data stem Data stem Data stem Info token Info filter Info stem Data token Data filter Data Dokumen

Data lihat token

Data lihat filter

Data lihat stem

dokumen

tidak_baku

Data tidak baku Data lihat tidak baku

Data tidak baku

(63)

3.1.8.7. DFD Level 3 Proses 3.1 Stemming Engine

Diagram alir data pada level 3 proses 3.1 yaitu proses pengolahan data kata dasar ditunjukan oleh Gambar 3.10.

3.1.1 Tambah kata dasar

pemeriksa kata dasar

3.1.2 Ubah Kata dasar

3.1.3 Hapus kata dasar

3.1.4 Cari Kata dasar Data ubah kata dasar

Info data ubah kata dasar Data ubah kata dasar

Data ubah kata dasar Data tambah kata dasar

Info data tambah kata dasar Data tambah kata dasar Data tambah kata dasar

Data ubah kata dasar

Info ubah data kata dasar Data ubah kata dasar Data ubah kata dasar

Data cari kata dasar

Info data cari kata dasar Data cari kata dasar Data cari kata dasar

(64)

3.1.8.8. DFD Level 3 Proses 3.2 Stemming Engine

Diagram alir data pada level 3 proses 3.1 yaitu proses pengolahan data kata stopword ditunjukan oleh Gambar 3.11.

3.2.1 Tambah stopword

pemeriksa stopword

3.2.2 Ubah stopword

3.2.3 Hapus stopword

3.2.4 Cari stopword Data ubah stopword

Info data ubah stopword Data ubah stopword

Data ubah stopword Data tambah stopword

Info data tambah stopword Data tambah stopword

Data tambah stopword

Data hapus stopword

Info data hapus stopword Data hapus stopword Data hapus stopword

Data cari stopword

Info data cari stopword Data stopword Data cari stopword

(65)

3.1.8.9. DFD Level 3 Proses 4.1 Stemming Engine

Diagram alir data pada level 3 proses 4.1 yaitu proses tokenizing

ditunjukan oleh Gambar 3.12.

Pemeriksa

4.1.1 Pemotongan data dokumen Data dokumen

token

Info data token

4.1.2 Input data token

Data token

Data token

Data token

4.1.3 Tampil data

token

Data token Data token dokumen

Lihat data token

(66)

3.1.8.10.DFD Level 3 Proses 3.2 Stemming Engine

Diagram alir data pada level 3 proses 4.2 yaitu proses filtering ditunjukan oleh Gambar 3.13.

token

Pemeriksa

Data token

filter stopword Data token

Data token 4.2.1

Eliminasi kata

Info data filter

4.2.2 Input data filter

4.2.3 Tampil data

filter Data filter

Data filter

Data filter

Data filter Data filter Lihat data filter

(67)

3.1.8.11.DFD Level 3 Proses 4.3 Stemming Engine

Diagram alir data pada level 3 proses 4.3 yaitu proses stemming

ditunjukan oleh Gambar 3.14

filter Pemeriksa Data filter stem kata_dasar Data filter Data filter 4.3.1 Pemotongan kata berimbuhan Data stem Data stem

Info data stem

4.3.3 Input data

stem

4.3.4 Tampil data

stem Data stem

Data stem Lihat data stem

4.3.2 Periksa kata

tidak baku

tidak_baku Data tidak baku

Data tidak baku

4.3.5 Tampil data

tidak baku

Data tidak baku Lihat data tidak baku

Info tidak baku Data tidak baku

Gambar 3.14 DFD Level 3 Proses 3.3 Stemming

3.1.9 Spesifikasi Proses

(68)

Tabel 3.13 Spesifikasi Proses

No Urut Proses Keterangan

1 No Proses 1

Nama Proses Pengolahan data pengguna

Deskripsi Proses Proses untuk mengolah data pengguna yaitu registrasi dan login

Source (Sumber) Pemeriksa, Penulis

Input Data registrasi, data login

Output Info data registrasi, info data login Destination (Tujuan) Storage penulis, storage pemeriksa

Logika Proses 1. Penulis/Pemeriksa masuk ke pengolahan pengguna

2. Sistem akan menampilkan menu login dan registrasi.

2 No Proses 2

Nama Proses Pengolahan data kata

Deskripsi Proses Proses untuk menambah, mengubah, menghapus dan mencari data kata Source (Sumber) Pemeriksa, Penulis

Input Data dokumen, data kata dasar, data stopword Output info data kata dasar, info data stopword Destination (Tujuan) Storage kata dasar, storage stopword. Logika Proses 1. Penulis masuk ke pengolahan data kata

2. Sistem akan menampilkan menu pengolahan data kata dasar dan pengolahan data kata stopword

3 No Proses 3

Nama Proses Pengolahan data dokumen

Deskripsi Proses Proses untuk melakukan tambah, hapus, ubah unduh data dokumen

Source (Sumber) Penulis, pemeriksa

Input Data dokumen

Output Info dokumen

Destination (Tujuan) Pemeriksa

Logika Proses 1. Penulis masuk ke pengolahan data kata 2. Sistem akan menampilkan menu

pengolahan data kata dasar dan pengolahan data kata stopword

4 No Proses 4

Nama Proses Pemeriksaan dokumen

Deskripsi Proses Proses untuk memeriksa dokumen yang terdiri dari tokenizing, filtering dan stemming

(69)

Input Data dokumen

Output Info token, info filter, info stem, info tidak baku

Destination (Tujuan) Storage dokumen, storage token, storage

filter, storage stem, storage kata_dasar,

storage stopword, storage tidak baku Logika Proses 1. Pemeriksa masuk ke pemeriksaan

dokumen

2. Sistem akan menampilkan menu pemeriksaan, tokenizing, filtering dan stemming

5 No Proses 1.1

Nama Proses Registrasi

Deskripsi Proses Proses untuk melakukan pendaftaran account

penulis Source (Sumber) Penulis

Input Data registrasi

Output Info data registrasi

Destination (Tujuan) Storage penulis

Logika Proses 1. Penulis memasukan data registrasi ke dalam sistem

2. Sistem akan memeriksa data yang dimasukkan ke dalam sistem Jika data valid maka sistem akan menyimpan data registrasi ke tabel penulis dan menampilkan pesan telah disimpan

Jika data tidak valid maka sistem akan menampilkan pesan error

6 No Proses 1.2

Nama Proses Login

Deskripsi Proses Proses untuk memverifikasi username dan password agar user bisa mengakses sistem Source (Sumber) Penulis, Pemeriksa

Input Data login

Output Info login

Destination (Tujuan) Storage penulis, Storage pemeriksa

Logika Proses 1. Pemeriksa/penulis memasukan data login ke dalam sistem

2. Sistem memverifikasi data login

Jika data login valid maka akan masuk ke menu utama sistem

Jika data login tidak valid maka sistem akan menampilkan pesan error

(70)

Nama Proses Tambah Dokumen

Deskripsi Proses Proses untuk menambah data dokumen ke sistem

Source (Sumber) Penulis

Input Data tambah dokumen

Output Info tambah dokumen

Destination (Tujuan) Storage dokumen

Logika Proses 1. Pemeriksa memasukan data dokumen ke dalam sistem

2. Sistem akan memeriksa data dokumen yang akan dimasukan ke dalam sistem Jika data valid maka sistem akan menyimpan data dokumen ke tabel

dokumen dan menampilkan pesan berhasil disimpan

Jika data tidak valid maka sistem akan menampilkan pesan error

8 No Proses 2.2

Nama Proses Ubah dokumen

Deskripsi Proses Proses untuk mengubah data dokumen Source (Sumber) Penulis

Input Data ubah dokumen

Output Info ubah dokumen

Destination (Tujuan) Storage dokumen

Logika Proses 1. Penulis memilih data dokumen yang akan diedit

2. Sistem menampilkan data yang dipilih 3. Penulis mengubah data yang telah

dipilih dan ditampilkan oleh sistem 4. Sistem memeriksa data ubah yang

dimasukan oleh penulis

Jika data yang dimasukan valid maka sistem akan menampilkan pesan berhasil dan memasukan data ubah ke dalam tabel dokumen

Jika data yang dimasukan tidak valid maka sistem akan menampilkan pesan

error

9 No Proses 2.3

Nama Proses Hapus dokumen

Deskripsi Proses Proses untuk melakukan penghapusan data dokumen

Source (Sumber) Penulis

Input Data hapus dokumen

(71)

Destination (Tujuan) Storage Dokumen

Logika Proses 1. Penulis memilih data yang akan dihapus. 2. Sistem menampilkan pesan konfirmasi

untuk menghapus data.

Jika dipilih ya, maka sistem akan menghapus data dokumen

Jika dipilih tidak, maka sistem akan membatalkan proses penghapusan data dokumen

10 No Proses 2.4

Nama Proses Cari dokumen

Deskripsi Proses Proses untuk melakukan pencarian data dokumen

Source (Sumber) Pemeriksa, penulis

Input Data cari dokumen

Output Info cari dokumen

Destination (Tujuan) Storage dokumen

Logika Proses 1. Pemeriksa/penulis memasukan data cari ke dalam sistem.

2. Sistem akan menampilkan data hasil pencarian jika data cari yang dimasukan ada dalam tabel dokumen, jika tidak maka sistem akan menampilkan pesan tidak ada hasil pencarian

11 No Proses 2.5

Nama Proses Unduh dokumen

Deskripsi Proses Proses untuk melakukan unduh dokumen Source (Sumber) Pemeriksa

Input Data unduh dokumen

Output Info info unduh dokumen

Gambar

Gambar 3.1 Flowmap Pemeriksaan Dokumen
Gambar 3.2 Flowchart Stemming
Gambar 3.19 Halaman Login Penulis
Gambar 3.21 Halaman Daftar Dokumen Penulis
+7

Referensi

Dokumen terkait

Berdasarkan bagan diatas menjelaskan bahwa karakteristik keluarga yaitu pendapatan, pekerjaan, pendidikan dan jumlah balita dapat mempengaruhi pola makan anak balita

Diriwayatkan oleh Muslim di dalam kitab shahihnya dari Abi Dzar RA bahwa pada saat Nabi Muhammad SAW menyebut tentang AL-Haudh beliau bersabda: mengalir padanya dua pancuran

Radiocarbon dating applied directly on human remain from ‘Individu 11’ which is associated with bronze axes as its burial gifts resulting age ca. This date is presumably older than

Hasil dari penelitian ini yaitu ponpes Al-Intishor berhasil membuat jadwal dengan berbagai model hasil menggunakan aplikasi FET, serta para guru mampu membuat media

Lampiran 10 Hasil sidik ragam dan uji lanjut BNT bilangan peroksida sosis sapi selama penyimpanan pada suhu 4 o C.. Lampiran 11 Hasil sidik ragam dan uji lanjut

Jadi ketika membaca hukum tidak menghasilkan penafsiran makna yang sesuai dengan perubahan masyarakat maka teks akan mengalami kematian makna.. Kematian makna atas teks hukum

Latihan yang diberikan guru dimaksudkan untuk melatih keterampilan siswa dalam berinteraksi dengan materi pelajaran dengan menggunakan komputer terutama dalam pelaksanaan

saintifik (kelas eksperimen) dengan hasil belajar matematika siswa pada kelas. yang tidak diberikan perlakuan (kelas