Textarea Dokumen Pembanding
IMPLEMENTASI DAN PENGUJIAN
4.2. Pengujian Sistem
Pengujian sistem yang dirancang digunakan untuk mengetahui apakah sistem yang dibangun berjalan dengan baik sesuai dengan sistem atau tidak berjalan sesuai dengan sistem yang dibangun tersebut. Maka dilakukan pengujian sistem yang dirancang untuk melihat metode k-gram, w-gram, bilangan prima dan fungsi hash-nya dapat diimplementasikan pada algoritma winnowing. Dalam pengujian sistem ini dapat dilihat bagaimana sistem dapat mendeteksi dokumen teks uji dengan dokumen
teks pembanding dengan menggunakan metode k-gram, w-gram, bilangan prima, fungsi hash dan hasil presentase yang menggunakan jacquard coeficient dan dari sistem yang dibangun akan menghasilkan waktu proses pendeteksian dari dokumen uji dan dokumen pembanding tersebut.
4.2.1 Pengujian Halaman Utama Sistem
Pengujian tampilan utama pada sistem ini dilakukan untuk melihat apakah pada tampilan utama k-gam, w-gram, dan bilangan prima dapat diinputkan dengan baik, dan juga penginputan teks dokumen uji dan dokumen pembanding. Pada Gambar 4.3 ini dapat dilihat bahwa tampilan utama berjalan sesuai dengan perancangan sistem yang dibangun seperti berikut:
Gambar 4.3 Pengujian Halaman Utama Sistem
Pada Gambar 4.3 ini digunakan untuk menginputkan nilai dari k-gram, w-gram, bilangan prima dan juga memilih dokumen teks pdf yang ingin dideteksi kemiripan teksnya.
38
4.2.2 Pengujian Kemiripan Dokumen Teks
4.2.2.1 Pengujian Kemiripan Dokumen Teks yang Berbeda
Pada pengujian kemiripan dokumen teks ini dapat dilihat bahwa sistem berjalan dengan baik, sesuai dengan yang dibangun tentang mendeteksi kemiripan dokumen yang satu dengan yang lain yaitu dokumen uji dan dokumen pembanding. Dengan nilai K-Gram yang diinputkan: 5, W-Gram: 4, Bilangan Prima: 2 dan input dua dokumen yang berbeda yaitu Dok A dan Dok B. Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan form input K-Gram, W-Gram, Bilangan Prima dan menampilkan isi dari dua dokumen, yaitu:
<td><p><h2>Pilih Dokumen Uji : </p>
<input type="file" class="form-control" id="inputFile" name="inputFile1"
placeholder="File">
<?php
if (isset ($_POST['inputFile1'])) { include 'vendor/autoload.php';
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile($_POST['inputFile1']);
$dokuji = $pdf->getText();
}
?>
<div class="container">
<textarea disabled name="dokuji" style="width :100%" rows="20;
overflow-y:scroll"><?php echo $dokuji; ?></textarea></td>
<td><p><h2>Pilih Dokumen Pembanding : </p>
<input type="file" class="form-control" id="inputFile" name="inputFile2"
placeholder="File">
<?php
if (isset ($_POST['inputFile2'])) {
$pdf2 = $parser->parseFile($_POST['inputFile2']);
$dokpembanding = $pdf2->getText();
}
?>
<div class="container">
<textarea disabled name="dokpembanding" style="width :100%" rows="20;
overflow-y:scroll"><?php echo $dokpembanding;?></textarea></td>
<h2><p>K-Gram : <input type ="text" name = "k" value ="<?php echo $k;?>" >
<p>W-Gram : <input type ="text" name = "window" value = "<?php echo
$window;?>" >
<p>Bilangan Prima : <input type="text" name="prima" value=" <?php echo
$prima;?>"></p>
Maka hasil pengujian dapat dilihat padaGambar 4.4. dibawah ini:
Gambar 4.4 Pengujian Halaman Utama Dokumen Teks yang Berbeda
40
Gambar 4.4 adalah pengujian halaman utama pada sistem yang memberikan hasil ketika user memberikan perintah kepada sistem dengan menekan tombol proses yang ada pada sistem, maka hasil dari perintah tersebut menghasilkan seperti pada Gambar 4.4. Tombol proses yang diperintahkan akan menginputkan isi dari dokumen uji dan pembanding yang akan dilihat tingkat kemiripannya.
Dari Gambar 4.4. akan dilakukan merode K-Gram yang adalah suatu rangkaian token pemisahan sesuai dengan berapa yang dimasukkan pada K-Gramnya.
Contoh:
Dokumen Uji : Yulia Citra Sipayung
Whitespace dan huruf kapitalnya dihapus menjadi : yuliacitrasipayung Dokumen Pembanding : Lia Sipayung
Whitespace dan huruf kapitalnya dihapus menjadi : liasipayung
Masukkan jumlah K-Gram = 5 Dokumen Uji:
Dokumen Pembanding:
yulia uliac liaci iacit acitr citra itras trasi rasip asipa sipay ipayu payun ayung
liasi iasip asipa sipay ipayu payun ayung
Sama seperti pada contoh yang diatas ini adalah proses pada Gambar 4.5. Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan K-Gram dari dua dokumen yaitu:
$this->arr_k_gramuji = $this->k_gram($this->pdfuji, $this->k_gram_value);
$this->arr_k_grambanding = $this->k_gram($this->pdfbanding,
$this->k_gram_value);
Maka dapat dilihat hasil dari pemprosesan K-Gram pada kode program yang terjadi seperti Gambar 4.5 sebagai berikut dibawah ini:
Gambar 4.5 Hasil Proses K-Gram pada Dokumen teks yang Berbeda
Pada Gambar 4.5 hasil proses K-Gram pada dokumen teks yang berbeda ini adalah untuk memisahkan karakter-karakter sesuai dengan jumlah k-gram yang diinputkan oleh user untuk diproses oleh sistem.
42
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan Rolling hash dari dua dokumen yaitu:
$this->arr_rolling_hashuji = $this->rolling_hash($this->arr_k_gramuji);
$this->arr_rolling_hashbanding =
$this->rolling_hash($this->arr_k_grambanding);
Maka dapat dilihat hasil dari pemprosesan Rolling Hash pada kode program yang terjadi seperti Gambar 4.6 sebagai berikut dibawah ini:
Gambar 4.6 Hasil Pengujian Rolling Hash pada Dokumen Teks yang Berbeda Pada Gambar 4.6 hasil pengujian Rolling Hash pada dokumen teks yang berbeda ini adalah hasil dari karakter yang telah dipisah sesuai dengan jumlah nilai k, dan karakter yang dipisah tersebut diubah menjadi bentuk kode ASCII. Dari rangkaian nilai rolling hash akan dipilih nilai hash yang terkecil.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan W-Gram dari dua dokumen yaitu:
>arr_windowuji = >windowing(>arr_rolling_hashuji,
$this->k_window_value);
$this->arr_windowbanding =
$this->windowing($this->arr_rolling_hashbanding, $this->k_window_value);
Maka dapat dilihat hasil dari pemprosesan W-Gram pada kode program yang terjadi seperti Gambar 4.7 sebagai berikut dibawah ini:
Gambar 4.7 Hasil Pengujian W-Gram pada Dokumen Teks yang Berbeda Pada Gambar 4.7 pengujian W-Gram diatas adalah dimana nilai dari rolling hash yang didapat akan di substring menghasilkan rangkaian nilai hash sejumlah W-Gram yang sudah diinput oleh user. Dari rangkaian ini akan dipilih fingerprint yang diambil berdasarkan nilai terkecil dari nilai rolling hash tiap window. Fingerprint yang telah dipilih akan digunakan untuk pencocokkan terhadap tiap dokumen.
44
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan Fingerprint dari dua dokumen yaitu:
$this->arr_fingerprintsuji = $this->fingerprints($this->arr_windowuji);
$this->arr_fingerprintsbanding =
$this->fingerprints($this->arr_windowbanding);
Maka dapat dilihat hasil dari pemprosesan Fingerprint pada kode program yang terjadi seperti Gambar 4.8 sebagai berikut dibawah ini:
Gambar 4.8 Hasil Pengujian Fingerprint pada Dokumen Teks yang Berbeda Pada Gambar 4.8 hasil pengujian fingerprint pada dokumen yang berbeda ini adalah hasil pemilihan fingerprint dari tiap dokumen yang telah diinput-kan yang akan diproses oleh sistem.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan hasil kemiripan dari dua dokumen yaitu:
$this->jaccard_coefficient =
$this->jaccard_coefficient($this->arr_fingerprintsuji, $this->arr_fingerprintsbanding);
Maka dapat dilihat hasil dari pemprosesan hasil kemiripan pada kode program yang terjadi seperti Gambar 4.9 sebagai berikut dibawah ini:
Gambar 4.9 Hasil Presentase pada Dokumen Teks yang Sama
Pada Gambar 4.9 ini dapat dilihat bahwa dokumen yang diinputkan adalah dua dokumen yang berbeda dengan demikian dapat dilihat bahwa tingkat kemiripan dokumen uji dan dokumen pembandingnya memiliki tingkat kemiripan 56.01% ini menandakan bahwa sistem mendapati dua dokumen teks ini memiliki kemiripan yang sama 56.01% maka dari hasil pendeteksian ini dapat dinyatakan dua dokumen teks uji dan dokumen teks pembanding ini adalah dinyatakan plagiarism sedang.
Pada Gambar 4.9 ini juga dapat dilihat waktu proses dari dua dokumen yang berbeda tersebut bahwa dokumen uji dan dokumen pembanding adalah 0.68 detik, pendeteksiannya sangat cepat tidak membutuhkan waktu yang lama untuk melihat tingkat kemiripan dari dua dokumen teks tersebut.
46
Tabel 4.1 Pengujian Tingkat Kemiripan Dokumen Teks yang Berbeda No Nama Dokumen Teks bahwa sistem sangat memiliki kecepatan yang cepat untuk mendeteksi tingkat kemiripan pada dua dokumen teks yang berbeda akan tetapi memiliki input-an yang berbeda-beda, tingkat kemiripan pada dokumen kemiripan yang berbeda, dan waktu proses yang berbeda-beda. Dikarenakan, besar dari size dokumen teks dan juga dikarenakan nilai k-gram, w-gram dan bilangan primanya yang berbeda-beda.
Grafik 4.1 Tingkat Kemiripan Pengujian pada Nilai K-Gram Dokumen Teks yang Berbeda
Grafik 4.2 Waktu Proses Pengujian pada Nilai K-Gram Dokumen Teks yang Berbeda
48
4.2.2.2 Pengujian Kemiripan Dokumen Teks yang Sama
Pada pengujian kemiripan dokumen teks yang sama ini dapat dilihat apakah sistem yang dibangun dapat dinyatakan akurat, dengan nilai K-Gram yang diinputkan: 5, W-Gram: 4, dan Bilangan Prima: 2, sama dengan nilai yang dipakai pada dua dokumen berbeda. maka dapat dilihat pada Gambar 4.10:
Gambar 4.10 ini menampilkan ketika user memberikan perintah kepada sistem dengan menekan tombol proses yang ada pada sistem, maka hasil dari perintah tersebut menghasilkan seperti pada Gambar 4.10. Tombol proses yang diperintahkan akan menginputkan isi dari dokumen yang akan dilihat tingkat kemiripannya.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan form input K-Gram, W-Gram, Bilangan Prima dan menampilkan isi dari dua dokumen, yaitu:
<td><p><h2>Pilih Dokumen Uji : </p>
<input type="file" class="form-control" id="inputFile" name="inputFile1"
placeholder="File">
<?php
if (isset ($_POST['inputFile1'])) { include 'vendor/autoload.php';
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile($_POST['inputFile1']);
$dokuji = $pdf->getText();
}
?>
<div class="container">
<textarea disabled name="dokuji" style="width :100%" rows="20;
overflow-y:scroll"><?php echo $dokuji; ?></textarea></td>
<td><p><h2>Pilih Dokumen Pembanding : </p>
<input type="file" class="form-control" id="inputFile" name="inputFile2"
placeholder="File">
<?php
if (isset ($_POST['inputFile2'])) {
$pdf2 = $parser->parseFile($_POST['inputFile2']);
$dokpembanding = $pdf2->getText();
}
?>
<div class="container">
<textarea disabled name="dokpembanding" style="width :100%" rows="20;
overflow-y:scroll"><?php echo $dokpembanding;?></textarea></td>
<h2><p>K-Gram : <input type ="text" name = "k" value ="<?php echo $k;?>" >
<p>W-Gram : <input type ="text" name = "window" value = "<?php echo
$window;?>" >
<p>Bilangan Prima : <input type="text" name="prima" value=" <?php echo
$prima;?>"></p>
Maka hasil pengujian dapat dilihat padaGambar 4.10. dibawah ini:
50
Gambar 4.10 Proses Halaman Utama Dokumen Teks yang Sama
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan K-Gram dari dua dokumen yaitu:
$this->arr_k_gramuji = $this->k_gram($this->pdfuji, $this->k_gram_value);
$this->arr_k_grambanding = $this->k_gram($this->pdfbanding,
$this->k_gram_value);
Maka dapat dilihat hasil dari pemprosesan K-Gram pada kode program yang terjadi seperti Gambar 4.11 sebagai berikut dibawah ini:
Gambar 4.11 Pengujian K-Gram Halaman Utama Dokumen Teks yang Sama Pada Gambar 4.11 hasil proses K-Gram pada dokumen teks yang sama ini adalah untuk memisahkan karakter-karakter sesuai dengan jumlah k-gram yang diinputkan oleh user untuk diproses oleh sistem.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan Rolling hash dari dua dokumen yaitu:
$this->arr_rolling_hashuji = $this->rolling_hash($this->arr_k_gramuji);
$this->arr_rolling_hashbanding = $this->rolling_hash($this
>arr_k_grambanding);
Maka dapat dilihat hasil dari pemprosesan Rolling Hash pada kode program yang terjadi seperti Gambar 4.12 sebagai berikut dibawah ini:
Gambar 4.12 Hasil Pengujian Rolling Hash pada Dokumen Teks yang Sama Pada Gambar 4.12 hasil pengujian Rolling Hash pada dokumen teks yang sama ini adalah hasil dari karakter yang telah dipisah sesuai dengan jumlah nilai k, dan karakter yang dipisah tersebut diubah menjadi bentuk kode ASCII. Dari rangkaian nilai rolling hash akan dipilih nilai hash yang terkecil.
52
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan W-Gram dari dua dokumen yaitu:
>arr_windowuji = >windowing(>arr_rolling_hashuji,
$this->k_window_value);
$this->arr_windowbanding =
$this->windowing($this->arr_rolling_hashbanding, $this->k_window_value);
Maka dapat dilihat hasil dari pemprosesan W-Gram pada kode program yang terjadi seperti Gambar 4.13 sebagai berikut dibawah ini:
Gambar 4.13 Hasil Pengujian W-Gram pada Dokumen Teks yang Sama
Pada Gambar 4.13 pengujian W-Gram diatas adalah dimana nilai dari rolling hash yang didapat akan di substring menghasilkan rangkaian nilai hash sejumlah W-Gram yang sudah diinput oleh user. Dari rangkaian ini akan dipilih fingerprint yang diambil berdasarkan nilai terkecil dari nilai rolling hash tiap window. Fingerprint yang telah dipilih akan digunakan untuk pencocokkan terhadap tiap dokumen.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan Fingerprint dari dua dokumen yaitu:
$this->arr_fingerprintsuji = $this->fingerprints($this->arr_windowuji);
$this->arr_fingerprintsbanding =
$this->fingerprints($this->arr_windowbanding);
Maka dapat dilihat hasil dari pemprosesan Fingerprint pada kode program yang terjadi seperti Gambar 4.14 sebagai berikut dibawah ini:
Gambar 4.14 Hasil Pengujian Fingerprint pada Dokumen Teks yang Sama Pada Gambar 4.14 hasil pengujian fingerprint pada dokumen yang sama ini adalah hasil pemilihan fingerprint dari tiap dokumen yang telah diinputkan yang akan diproses oleh sistem.
Berikut ini merupakan kode program yang diimplementasikan untuk menampilkan hasil kemiripan dari dua dokumen yaitu:
$this->jaccard_coefficient =
$this->jaccard_coefficient($this->arr_fingerprintsuji, $this->arr_fingerprintsbanding);
54
Maka dapat dilihat hasil dari pemprosesan hasil kemiripan pada kode program yang terjadi seperti Gambar 4.15 sebagai berikut:
Gambar 4.15 Hasil Presentase pada Dokumen Teks yang Sama
Pada Gambar 4.15 hasil presentase pada dokumen teks yang sama terlihat jumlah keseluruhan fingerprint dari dokumen uji dan pembanding, Intersection (hasil Fingerprint yang sama ) pada dokumen uji dan pembandingan, pengurangan antara Union dan Intersection, hasil kemiripan yang terdeteksi oleh sistem menggunakan metode Koefisien Jaccard’s dan hasil proses pendeteksiannya adalah 0.95 detik.
Pada gambar tersebut terdapat hasil dari tingkat kemiripan pendeteksian 100% mirip maka dinyatakan adanya penjiplakan.
Tabel 4.2 Pengujian Tingkat Kemiripan Dokumen Teks yang Sama No Nama Dokumen Teks
Nama Dokumen Teks
Pada Tabel 4.2 pengujian tingkat kemiripan dokumen teks yang sama bahwa sistem sangat memiliki kecepatan yang cepat untuk mendeteksi tingkat kemiripan pada dua dokumen teks yang sama akan tetapi memiliki input-an yang berbeda-beda, tingkat kemiripan pada dokumen 100% memiliki kemiripan yang sama, dan waktu proses yang berbeda-beda. Dikarenakan, besar dari size dokumen teks dan juga dikarenakan nilai k-gram, w-gram dan bilangan primanya yang berbeda-beda.
Grafik 4.3 Waktu Proses Pengujian pada Nilai K-Gram Dokumen Teks yang Sama
0
BAB 5