• Tidak ada hasil yang ditemukan

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI WINDI ARINDA 091401061

N/A
N/A
Protected

Academic year: 2019

Membagikan "IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI WINDI ARINDA 091401061"

Copied!
13
0
0

Teks penuh

(1)

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN

STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI

TINGKAT KEMIRIPAN FILE TEKS YANG

BERBENTUK SKRIPSI

SKRIPSI

WINDI ARINDA

091401061

PROGRAM STUDI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

(2)

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI

TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI

SKRIPSI

Diajukan untuk melengkapi tugas akhir dan memenuhi syarat mencapai gelar Sarjana Komputer

WINDI ARINDA 091401061

PROGRAM STUDI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(3)

PERSETUJUAN

Judul : IMPLEMENTASI ALGORITMA RABIN-KARP

MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI

Kategori : SKRIPSI

Nama : WINDI ARINDA

Nomor Induk Mahasiswa : 091401061

Program Studi : SARJANA (S1) ILMU KOMPUTER

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI

Diluluskan di

Medan, Februari 2015

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Ade Candra, ST, M.Kom Dr. Poltak Sihombing, M.Kom NIP. 197909042009121002 NIP. 196203171991031001

Diketahui/Disetujui oleh

Program Studi S1 IlmuKomputer Ketua,

(4)

PERNYATAAN

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN

FILE TEKS YANG BERBENTUK SKRIPSI

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Februari 2015

(5)

PENGHARGAAN

Puji dan syukur penulis ucapkan kepada ALLAH SWT yang senantiasa melimpahkan

rahmat dan karunia-NYA sehingga skripsi ini dapat diselesaikan.

Ucapan terimakasih penulis sampaikan kepada semua pihak yang telah

membantu penulis dalam menyelesaikan skripsi ini baik secara langsung maupun

tidak langsung.

Ucapan terima kasih penulis sampaikan kepada :

1. Bapak Dr. Poltak Sihombing, M.Kom, selaku Ketua Program Studi Ilmu

Komputer Universitas Sumatera Utara.

2. Ibu Maya Silvi Lydia, B.Sc, M.Sc, selaku Sekretaris Program Studi Ilmu

Komputer Universitas Sumatera Utara.

3. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi

Informasi Universitas Sumatera Utara, semua dosen pada Program Studi

Ilmu Komputer FASILKOM-TI USU, dan semua pegawai di Ilmu

Komputer FASILKOM-TI USU.

4. Bapak Dr. Poltak Sihombing, M.Kom dan bapak Ade Candra, ST, M.Kom

selaku pembimbing skripsi yang telah banyak memberikan bantuan,

arahan, petunjuk, serta kesabaran dalam pengerjaan skripsi ini.

5. Bapak Prof. Dr. Muhammad Zarlis dan bapak Drs. Marihat Situmorang,

M.Kom selaku pembanding skripsi yang telah banyak memberikan kritik

dan saran serta arahan dalam pengerjaan skripsi ini.

6. Teristimewa untuk Ayahanda dan Ibunda penulis Bapak Sudiono dan Ibu

Nurhasanah yang dengan tulus dan sabar memberikan doa dan dukungan

moril dan materil kepada penulis selama ini, serta adik-adik tersayang

Elvina Sari, Chici Tri Andani, dan Rizky yang telah banyak memberikan

dukungan dan semangat dalam penyusunan skripsi ini.

7. Keluarga, sahabat dan pihak-pihak lainnya yang tidak dapat penulis

sebutkan satu persatu yang telah memberikan bantuan dan dukungan

(6)

Dan sekali lagi terima kasih yang sebesar-besarnya kepada semua pihak yang

membantu penyelesaian skripsi ini.

Wassalam.

Medan, Februari 2015

Penulis,

(7)

IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI

TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI

ABSTRAK

Di dunia pendidikan khususnya di kalangan universitas, rentan terjadi praktek plagiarisme. Misalnya dalam hal pembuatan Tugas Akhir, Skripsi. Untuk mendeteksi kemiripan antar Skripsi, banyak universitas masih melakukannya secara manual sehingga menghabiskan waktu yang lama dan tenaga yang ekstra. Seiring dengan perkembangan ilmu pengetahuan dan teknologi, algoritma untuk mencari tingkat kesamaan dokumen telah dikembangkan oleh para ahli. Stemming adalah salah satu cara untuk meningkatkan performa information retrieval. Data yang digunakan pada penelitian ini adalah skripsi mahasiswa S1 Ilmu komputer Universitas Sumatera Utara. Penulis menggunakan algoritma stemming Nazief dan Adriani dalam mencari kata dasar/root word untuk setiap kata dalam skripsi yang diuji. Setelah didapat kata dasar dari setiap kata, kemudian dari kata dasar tersebut dibentuk gram, dan dicari nilai hashnya menggunakan algoritma Rabin-Karp. Setelah didapat nilai hash, maka nilai hash skripsi yang diuji dibandingkan dengan nilai hash skripsi yang sudah tersimpan di database sistem menggunakan rumus Dice Coefficient Similarity. Hasil perbandingan antar skripsi dalam bentuk persen, disimpan ke database sistem dan ditampilkan di sistem secara berurut dari yang paling besar total persentase kemiripannya sampai yang paling kecil.

(8)

IMPLEMENTATION OF RABIN-KARP ALGORITHM USING STEMMING NAZIEF AND ADRIANI TO DETECT SIMILARITY

OF TEXT FILE IN FORM OF THESIS

ABSTRACT

In the world of education especially among the University, susceptible to the practice of plagiarism. For example, in terms of making a Final Project, Thesis. To detect the similarity between Thesis, many universities are still doing it manually so spend a long time and extra energy. Along with the development of science and technology, algorithm to find the degree of similarity of documents have been developed by experts. Stemming is one way to improve the performance of information retrieval. The Data used in this study is thesis of the students in Bachelor Computer Science in University of North Sumatera. The author uses stemming Nazief and Adriani algorithm in finding the basic word/root word for each word in the thesis are tested. After derived the root word of every word, then from the root word is formed to gram, and calculated it’s hash value uses Rabin-Karp algorithm. After getted the hash value, so the hash value of thesis tested to be compared with the hash value of thesis are saved in the database system uses the formula of Dice Coefficient Similarity. The result of the comparison between the thesis in the form of percent, are saved to database system and published in system sequencely from the biggest of total percentage of it’s similarity to the smallest.

(9)

DAFTAR ISI

Daftar Lampiran xii

Bab 1 Pendahuluan 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 2

1.3 Batasan Masalah 2

1.4 Tujuan Penelitian 2

1.5 Manfaat Penelitian 3

1.6 Metodologi Penelitian 3

1.7 Sistematika Penulisan 4

Bab 2 LandasanTeori 6

2.4 Dice Coefficient Similarity 17

Bab 3 Analisis dan Perancangan Sistem 18

3.1 Analisis Sistem 18

3.1.1 Analisis Masalah 18

3.1.1.1 Cause-and-Effect Analisis 18

3.1.2 Analisis Persyaratan 20

3.1.2.1 Analisis Fungsional Sistem 20

3.1.2.2 Analisis Non Fungsional Sistem 21

3.1.3 Pemodelan Sistem Dengan Use Case 21

3.1.3.1 Diagram Use Case 22

(10)

3.1.3.5 Acitvity Diagram Algoritma Stemming Nazief 26

3.1.5.2 Flow Chart Algoritma Stemming Nazief dan Adriani 35

3.2 Perhitungan Kemiripan 37

3.3 Perancangan Antar Muka 37

3.3.1 Perancangan Antar Muka Form Home 37

3.3.2 Perancangan Antar Muka Form Masukkan Skripsi 38 3.3.3 Perancangan Antar Muka Form kemiripan 40 3.3.4 Perancangan Antar Muka Form Skripsi 41 Bab 4 Implementasi dan Pengujian Sistem 42 4.1 Implementasi Sistem 42 4.1.1 Spesifikasi Perangkat Keras Yang Digunakan 42 4.1.2 Spesifikasi Perangkat Lunak Yang Digunakan 43 4.1.3 Implementasi Antarmuka Sistem 43 4.1.3.1 Tampilan Antarmuka Form Home 43 4.1.3.2 Tampilan Antarmuka Form Masukkan Skripsi 44 4.1.3.3 Tampilan Antarmuka Form Kemiripan 46 4.1.3.4 Tampilan Antarmuka Form Skripsi 48 4.2 Pengujian 50 4.2.1 Tujuan Pengujian 50

(11)

DAFTAR TABEL

Nomor

Tabel Nama Tabel Halaman

2.1 Daftar Prefiks Yang Meluluh 12

2.2 Daftar Kemungkinan Perubahan Prefiks 12

2.3 Daftar Kombinasi Prefiks dan Sufiks Yang Tidak Diperbolehkan

13

3.1 Cause-And-Effect Analysis 19

3.2 3.3

3.4 3.5 3.6

Dokumentasi Naratif Use Case Membandingkan Skripsi Dokumentasi Naratif Use Case Algoritma Stemming Nazief dan Adriani

Dokumentasi Naratif Use Case Algoritma Rabin-Karp Dokumentasi Naratif Use Case Dice Coefficient Similarity Dokumentasi Naratif Use Case Melihat Skripsi

23 25

(12)

DAFTAR GAMBAR

Nomor Gambar

Nama Gambar Halaman

2.1

Format Kata Berimbuhan Dalam Bahasa Indonesia Diagram Ishikawa Untuk Analisis Permasalahan Sistem Use Case Diagram

Activity Diagram Membandingkan Skripsi

Activity Diagram Algoritma Stemming Nazief dan Adriani Activity Diagram Algoritma Rabin-Karp

Activity Diagram Dice Coefficient Similairty Activity Diagram Melihat Skripsi

Sequence Diagram Sistem

Flow Chart Algoritma Rabin-Karp

Flow Chart Algoritma Stemming Nazief dan Adriani Tampilan Form Home

Tampilan Form Masukkan Skripsi Tampilan Form Kemiripan

Tampilan Form Skripsi

Tampilan Antarmuka Form Home

Tampilan Antarmuka Form Masukkan Skripsi

Tampilan Form Masukkan Skripsi setelah Nim dan Judul dari Skripsi yang akan dibandingkan dimasukkan

Tampilan Antarmuka Form Kemiripan

Tampilan Form Kemiripan file skripsi yang terakhir di bandingkan

Tampilan Antarmuka Form Skripsi

Tampilan Antarmuka Form Skripsi yang terakhir diinput Tampilan Form Skripsi setelah diklik Judul dari skripsi Proses Sistem Step 1 Dokumen 1

Proses Sistem Step 2, Step 3 dan step 4 Proses Sistem Step 4, Step 5 dan Step 6 Proses Sistem Dokumen 2

Persentase Kemiripan Dokumen 1 dan Dokumen 2

(13)

DAFTAR LAMPIRAN

Nomor Lampiran

Nama Lampiran Halaman

A B

Tabel ASCII Listing Program

Gambar

Tabel 2.1
Gambar 2.1
Tabel ASCII

Referensi

Dokumen terkait

Sistem yang akan dibangun dapat menghitung tingkat kemiripan antara satu file dengan file yang lain setelah sebelumnya dilakukan dulu proses stemming dan mencari

Pendekatan Algoritma Winnowing lebih baik daripada pendekatan algoritma Rabin Karp karena menghasilkan tingkat presentase yang lebih kecil dan waktu proses yang

Perbandingan hasil persentase kemiripan menggunakan algoritma Levenshtein distance tanpa stopword removal, stemming, dan sorting dengan algoritma Levenshtein

Besarnya persentase similarity akan dipengaruhi oleh tingkat kemiripan dari dokumen yang diuji, semakin besar persentase similarity maka tingkat kemiripan akan

Besarnya persentase similarity akan dipengaruhi oleh tingkat kemiripan dari dokumen yang diuji, semakin besar persentase similarity maka tingkat kemiripan akan

Proses yang harus dilakukan dalam sistem adalah proses preprocessing pada masing-masing algoritma dan kemudian menghitung tingkat kemiripan teks menggunakan algoritma

Proses yang harus dilakukan dalam sistem adalah proses preprocessing pada masing-masing algoritma dan kemudian menghitung tingkat kemiripan teks menggunakan algoritma

Untuk menemukan nilai kemiripan digunakan dice similarity coefisien.Penulis menggunakan desain penelitian hubungan kausal (eksperimental) yaitu penulis melakukan percobaan