• Tidak ada hasil yang ditemukan

ANALISIS DAN PERENCANAAN

3.1. Analisis Sistem

Analisis sistem digunakan pada penelitian ini adalah untuk mengidentifikasi dan mengevalusi penelitian ini yaitu; analisis masalah, analisis kebutuhan, analisis proses.

3.1.1. Analisis Masalah

Analisis masalah digunakan untuk mengidentifikasi langkah atau tahapan yang harus dilakukan dalam pemprosesan perencanaan untuk menemukan bukti penyelesaian masalah. Analisis masalah ini dapat dilakukan dengan menggunakan diagram fishbone atau diagram ishikawa.

Diagram fishbone atau diagram Ishikawa adalah merupakan diagram yang menemukan penyebab-penyebab yang lebih efektif pada suatu masalah. Mencari masalah-masalah yang ada pada persamaan tingkat kemiripan pada dokumen teks dan melihat berapa presentase kemiripan dalam dokumen tersebut.

Pada Gambar 3.1 diagram Ishikawa menunjukkan presentasi dari sebuah masalah dalam penelitian ini. Pada bagian “Kepala Ikan” menyatakan suatu pernyataan masalah pada penelitian. Masalah utama pada penelitian ini adalah user atau admin yang ingin mengetahui berapa tingkat kemiripan pada dokumen teksnya.

Pada bagian “Tulang Ikan” terdapat kemungkinan penyebab masalah yang bercabang. Ada empat kategori penyebab masalah yang berkaitan pada bagian

“Tulang Ikan” yaitu user atau admin, method atau metode, material, dan mechine atau alat.

Dapat dilihat pada pemodelan masalah dalam diagram Ishikawa/fishbone sebagai berikut:

16

Proses Tidak adanya ditemukan persamaan kemiripan

Gambar 3.1 Diagram Ishikawa

3.1.2. Analisis Kebutuhan

Analisis kebutuhan adalah mengidentifikasi kondisi atau kemampuan yang harus dipenuhi pada siatem yang dibuat tersebut. Terdapat dua kebutuhan yang terdapat pada analisis kebutuhan yaitu kebutuhan fungsiona dan kebutuhan non-fungsional.

Kebutuhan fungsional yang terdapat tersebut adalah sebagai berikut:

1. Sistem harus dapat memdeteksi kemiripan pada dua dokumen teks yaitu pembanding dan teks penguji.

2. Sistem harus dapat mempresentasekan berapa hasil kemiripan pada dua teks tersebut.

Sedangkan kebutuhan non-fungsional pada sistem tersebut adaalah sebagai berikut:

Sistem harus dapat mendeteksi kemiripan pada dua teks pembanding dan penguji. Sistem harus dapat menunjukkan hasil presentase dari kemiripan dokumen tersebut dan menunjukkan berapa persen yang ditemukan pada dua dokumen tersebut.

2. Mudah Digunakan

Sistem memberikan kemudahan pada user atau pengguna.

3. Hemat Biaya

Sistem tidak memerlukan perangkat tambahan sehingga dapat menghemat biaya.

4. Dokumentasi

Sistem dapat menunjukan tingkat kemiripan pada dua teks pembanding dan penguji dengan cepat dan sistem juga dapat mendeteksi kalimat yang diketikkan pada area oleh pengguna.

5. Manajemen Kualitas

Waktu proses mendeteksi tingkat kemiripan pada dokumen teks relatif cepat serta hasil presentase kemiripan cukup tinggi.

6. Kontrol

Pendeteksian dokumen tidak akan dilakukan jika pengguna tidak memasukkan kalimat atau dokumen teks dan memasukkan nilai dari k-gram, nilai window dan nilai bilangan prima kedalam area yang telah ditentukan.

3.1.3. Analisis Proses

Analisis proses digunakan untuk pembaca dapat lebih mudah memahami sistem yang akan dibangun. Pada analisis proses ini dijelaskan bahwa hasil dari sistem yang dibangun adalah menampilkan file dokumen pdf (menampilkan isi dari pdf yang dipilih), menampilkan hasil dari perhitungan k-gram, dari hasil k-gram ini menghasilkan nilai dari rolling hash, dari rolling hash dapat menghasilkan w-gramnya, dan dari w-gram sistem memilih fingerprint yang paling kecil, jika nilai hash yang kecil lebih daripada satu maka w-gram memilih nilai kecil yang sebelah kanan. Juga dapat menampilkan tingkat kemiripan pada dua dokumen teks yaitu dokumen teks uji dan dokumen teks pembanding menggunakan persamaan jaccard’s

18

coefficient dan pada sistem yang dibangun juga dapat menampilkan waktu pemrosesan dokumen tersebut.

3.2 . Perancangan Sistem

Perancangan sistem adalah merancang atau merencanakan sebuah sistem yang akan dibuat pada penelitian ini, dimana isinya membuat langkah-langkah dalam memproses pengolahan data dan prosedur yang mendukung pengoperasian sistem sehingga sistem dapat berfungsi dengan baik.

3.2.1 Kerangka menu

Kerangka menu sistem yang akan dibangun adalah berbentuk website yang hanya memiliki satu kerangka yang sangat penting yaitu kerangka pendeteksi kemiripan dokumen teks.

3.2.2 Use Case

Use case pada penelitian ini menggambarkan fungsionalitas yang dirancang dan menggambarkan interaksi antar user dengan sistem yang dirancang.

Gambar 3.2 Use Case Sistem

Pada Gambar 3.2 ini menjelasakan bahwa user menginput k-gram, w-gram, bilangan prima dan menginput dokumen teks pdf yang akan dideteksi tingkat kemiripannya menggunakan sistem yang dibangun.

Tabel 3.1 Use Case Diagram

Nama Pendeteksi Tingkat Kemiripan Dokumen Teks

Aktor User

Deskripsi Dalam mendeteksi tingkat kemiripan dokumen teks pdf menggunakan algoritma Winnowing dan presentase hasil menggunakan persamaan Jaccard’s Similarity Coeficient

Alur Dasar Diperlukannya inputan yang dari user untuk sistem yang akan memproses tugas yang diberikan oleh user

Alur Alternatif User harus menginputkan k-gram,w-gram,bilangan prima dan teks pdf

Pra Kondisi User meng-input-kan dokumen teks

Pasca Kondisi User dapat melihat hasil presentase dari pendeteksian

3.2.3. Flowchart Sistem

Flowchart sistem ini adalah untuk menunjukan alir(flow) pada sistem program yang akan digunakan. Akan menggambarkan secara terstruktur sehingga dapat memberikan gambaran pada pengguna untuk lebih mengerti atau mengetahui rancangan sistem yang akan dibangun. Rancangan sistem yang akan digunakan ini untuk menjelasakan bagaimana cara kerja atau proses dari pendeteksian kemiripan dokumen teks yang dilakukan.

Pada Gambar 3.3 flowchart preprocessing ini merupakan proses awal unntuk menghilangkan yang tidak diperukan oleh pengolahan data. Pada proses preprocessing ini membutuhkan dokumen teks yang akan dideteksi maka sistem membaca atau memproses dokumen teks yang telah dimasukkan, dokumen teks yang diproses oleh sistem akan diteruskan kedalam case folding dimana dokumen teks mengubah semua huruf kapital yang ada pada dokumen teks menjadi huruf kecil seluruhnya. Setelah dari proses case folding mengeluarkan hasil kalimat yang telah diubah tersebut, maka sistem berpindah kepada proses filtering semua dokumen teks

20

dideteksi dan dihapus kata-kata yang tidak relevan dalam dokumen teks, setelah itu hasil dari filtering mendapatkan hasil dari semua dokumen teks tersebut. Kemudian ke proses tokenizing yang memisahkan kata berdasarkan susunan kata dari keseluruhan dokumen teks. Berikut ini adalah gambar dari flowchart preprocessing:

Gambar 3.3. Flowchart Preprocessing

3.2.4 Activity Diagram

Activity diagram bertujuan untuk menggambarkan alir ataupun urutan aktivitas dalam sistem yang sedang dirancang. Activity diagram dapat menggambarkan bagaimana proses dari sistem yang akan dirancang, oleh karena itu pembaca dapat memahami gambaran umum dari sistem yang akan dirancang, baik secara interface maupun aktivitas yang dilakukan oleh sistem dengan ringkas. Akan tetapi activity diagram ini digambarkan tidak secara keseluruhan perancangan sistem seperti

flowchart yang dirancang secara keseluruhan dalam proses sistem yang akan dirancang.

Activity diagram dibuat untuk menggambarkan bagaimana aktivitas kerja sistem yang dirancang pada interface dan proses sistem, dapat dilihat pada Gambar 3.4 berikut:

Gambar 3.4 Activity Diagram

Berdasarkan Gambar 3.4 activity diagram yang diatas dijelaskan bahwa proses dari rancangan sistem dengan proses user meng-input kedua file pdf ataupun teks dalam dokumen uji dan pembanding, dan user juga harus meng-input k-gram, window dan bilangan prima yang digunakan untuk pendeteksian dokumen tersebut. Data yang akan ditampilkan oleh sistem yang akan dirancang ini adalah rangkaian k-gram, rolling hash, window, fingerprint, hasil kemiripan similarity, dan waktu proses pendeteksian.

22

3.2.5 Sequence Diagram

Sequence Diagram ini berfungsi untuk menampilkan alur-alur data yang masuk dan keluar dari sistem yang dibuat. Sequence Diagram juga berfungsi untuk mempermudah pembaca untuk menggambarkan bagaimana cara kerja objek yang saling berinteraksi satu dengan yang lain di dalam sistem yang dirancang. Diagram ini juga dapat mengilustrasikan alur bagaimana inputan dapat dikirimkan dan dapat diterima diantara objek.

Gambar 3.5 Sequence Diagram

Pada Gambar 3.5 Squence Diagram ini adalah dimana user berinteraksi antara pengguna dengan sistem yang telah dirancang yaitu menu utama memberikan intruksi untuk user input-kan data yang akan diproses oleh sistem yaitu meng-input-kan angka pada k-gram, w-gram, bilangan prima dan dokumen teks yang akan dideteksi. Maka sistem akan memproses data yang telah diintruksikan oleh user.

User menunggu hasil presentasi pemprosesan dari sistem.

Tabel 3.2 Sequence Diagram Nama Sequence Diagram

Actor User

Deskripsi Sequence Diagram ini mengilustrasikan alur-alur pada saat sistem dipergunakan

Kondisi Awal Sistem menampilkan menu untuk memasukkan nilai-nilai yang akan diproses oleh sistem

Alur Dasar Kegiatan User Sistem 1. User memasukkan nilai

k-gram, w-k-gram, bilangan prima dan memasukkan dokumen teks pdf.

1. Menginputkan data kedalam sistem agar dapat diproses oleh sistem.

2. Memproses masukkan yang diberikan user Kondisi Akhir User dapat melihat hasil

presentase sistem

Menampilkan hasil presentase kepada user

3.2.6 Kemiripan Teks Secara Manual

Berikut ini adalah contoh kalimat yang akan di deteksi kemiripan dakumen menggunakan algoritma Winnowing:

Dokumen uji : “Yulia Citra Sipayung”

Dokumen pembanding : “Lia Sipayung”

Langkah-langkah dalam penerapan algoritma Winnowing yaitu:

1. Whitespace Insensitivity, membuang karakter dari dalam dokumen yang tidak relevan seperti huruf kapital dan tanda baca.

Dokumen uji : Yulia Citra Sipayung

Penghapusan huruf kapital dan whitespace : yuliacitrasipayung Dokumen pembanding : Lia Sipayung

Penghapusan huruf kapital dan whitespace : liasipayung

24

2. Membentuk rangkaian k-gram, misalnya dengan k-gram k=3. Maka rangkaian k-grams sebagai berikut:

Dokumen uji:

Dokumen pembanding :

3. Menghitung nilai hash menggunakan rumus berikut:

H( ) = (2.2)

= (321 * 2) + 097

26

= (315 * 2) + 117 * 1

Maka dapat di proleh hasil perhitungannya sebagai berikut:

Dokumen pembanding:

28

= 828

H(ung) = (828 - ascii(y) * 2(2) ) * 2) + ascii(g) * 2(0)

= (828 – 121 * 4) * 2 + 103 * 1

= (828 - 484) * 2 + 103 * 1

= (344 * 2) + 103 * 1

= 688 + 103

= 791

Maka dapat diperoleh hasil perhitungannya sebagai berikut:

4. Membentuk Window dari nilai-nilai hash yang sudah dihitung/diperoleh.

Dimana pada contoh ini menggunakan nilai w = 4:

Dokumen uji :

739 729 723 782 741 763 747 828 791

[826 789 739 713]

[789 739 713 691]

[739 713 691 722]

[713 691 722 766]

[691 722 766 789]

[722 766 789 765]

[766 789 765 723]

[789 765 723 782]

[765 723 782 741]

[723 782 741 763]

[782 741 763 747]

[741 763 747 828]

[763 747 828 791]

30

Dokumen pembanding:

5. Pemilihan fingerprint, yaitu nilai hash minimum(terkecil) dari setiap window yang telah terbentuk. Nilai hash minimum(terkecil) dengan posisi paling kanan dari setiap window yang telah terbentuk. Dari window yang telah terbentuk akan dibentuk kepada fingerprint, jika nilai tersebut berada pada posisi yang sama yaitu posisi yang paling kanan maka kedua nilai hash tersebut dijadikan sebagai fingerprint. Berikut ini nilai hash yang dihasilkan berdasarkan indeksnya:

Pada Dokumen Uji:

Maka grams yang terdapat pada fingerprint yang telah terbentuk sebagai berikut:

Pada Dokumen Pembanding:

Maka grams yang terdapat pada fingerprint yang telah terbentuk sebagai berikut:

[739 729 723 782]

[729 723 782 741]

[723 782 741 763]

[782 741 763 747]

[741 763 747 828]

[763 747 828 791]

[739,2] [713,3] [691,4] [722,5]

[723,9] [741,11] [747,13]

lia iac aci cit asi ipa ayu

[739,0] [729,1] [723,3] [741,4] [747,6]

lia ias asi ipa ayu

6. Menghitung kemiripan antar dokumen uji dengan dokumen pembanding dengan menggunakan persamaan jaccard’s coefficient seperti berikut:

Dokumen Uji = [739] [713] [691] [722] [723] [741] [747]

Dokumen Pembanding = [739] [729] [723] [741] [747]

Similaritas (di,dj) = | | ( ( )|)|

= [ ][ ][ ][ ]

x 100%

= x 100%

= 50%

3.2.7. Perancangan Antarmuka

Perancangan antarmuka merupakan tampilan sistem yang berfungsi untuk membantu memudahkan dalam mengimplementasikan sistem.

Perancangan antarmuka sistem ini dibuat sesederhana mungkin untuk menghindari proses yang tidak relevan serta dapat membantu pengguna untuk menggunakan dan memahami sistem. Perancangan antarmuka ini dibagi menjadi dua bagian, yaitu:

1. Halaman Awal

Tampilan awal digunakan untuk memasukkan data yang digunakan dalam pendeteksian dokumen. Yang memasukkan dokumen uji dan dokumen pembanding serta memasukan berapa nilai k-gram, window dan bilangan prima yang akan diproses oleh sistem.

32

Dibawah ini adalah tampilan awal yang akan dirancang untuk mendeteksi tingkat kemiripan dokumen teks dapat dilihat pada Gambar berikut:

2.

3. Sistem Pendeteksi Kemiripan Dokumen

Gambar 3.6. Halaman Awal pada Sistem

Berikut ini adalah penjelasan dari rancangan tampilan awal sistem, yaitu

1. Masukkan atau inputkan nilai k gram, w gram, dan bilangan prima untuk mengidentifikasi tingkat kemiripan dokumen teks,

2. Tombol choose file adalah untuk mencari file pdf,

3. Texrarea dokumen uji adalah sebagai media pembaca isi file pdf uji,

4. Textarea dokumen pembanding adalah sebagai media pembaca isi file pdf pembanding,

5. Tombol proses digunakan untuk memproses mendeteksi tingkat kemiripan dokumen teksnya.

Textarea Dokumen

Dokumen terkait