• Tidak ada hasil yang ditemukan

Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Manber

N/A
N/A
Protected

Academic year: 2017

Membagikan "Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Manber"

Copied!
6
0
0

Teks penuh

(1)

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Teknologi komputer sudah berkembang pesat dan menjadi sebuah kebutuhan bagi setiap orang. Tentu perkembangan ini memiliki banyak dampak dalam kehidupan. Salah satu dampak positifnya adalah untuk membantu dan memudahkan kerja manusia. Sebagai contoh yaitu dalam melakukan suatu pendeteksian.

Banyak manfaat yang dapat diambil dengan adanya proses pendeteksian, seperti pendeteksian kemiripan dokumen teks. Deteksi kemiripan dokumen teks merupakan sebuah upaya yang dilakukan untuk menghindari tindakan plagiarisme sehingga keaslian dari dokumen teks akan tetap terjaga.

Plagiarisme atau penjiplakan dapat diartikan sebagai sebuah tindakan imitasi atau pemalsuan baik dari segi bahasa maupun ide dari orang lain dengan merepresentasikan hal tersebut sebagai hasil karyanya sendiri (Hariharan, 2012). Plagiarisme dalam bahasa latin diartikan sebagai pencurian, sehingga seseorang yang melakukan tindak penjiplakan dapat diartikan pula sebagai seorang pencuri.

(2)

tindak plagiat, baik plagiat dengan cara mencontek tugas biasa maupun tugas akhir. Tentunya ini akan merugikan kedua belah pihak, baik pelaku dan korban penjiplakan khususnya.

Penjiplakan pada tingkat pendidikan biasanya terjadi akibat deadline dari suatu pekerjaan ataupun dari sifat malas yang dimiliki. Adapun tindak penjiplakan yang sering dilakukan oleh pelajar adalah jenis copy paste, artinya dokumen teks dijiplak tanpa mengubah isi teks maupun jenis peringkasan dengan cara menutupi bagian yang disalin. Di dalam dunia pendidikan, suatu karya ilmiah dikatakan sebagai hasil plagiat atau penjiplakan apabila kutipan yang dilakukan dijiplak secara utuh dan tidak disertai penyebutan referensi secara benar (Purwitasari, et al. 2009).

Pendeteksian plagiat dapat dilakukan baik secara manual dengan mengecek langsung dokumen teks ataupun secara semi-otomatis dengan bantuan sistem komputer. Meskipun pendeteksian secara manual merupakan cara yang paling akurat dalam mendeteksi plagiat, namun cara ini sangat tidak efektif dan efisien, baik dari segi waktu, tenaga, maupun biaya. Pencegahan merupakan upaya terbaik untuk menghalangi munculnya plagiarisme, yaitu dengan menekankan moral masyarakat dan sistem pendidikan akan bahaya plagiarisme. Cara ini akan memberikan efek jangka panjang, sehingga diharapkan tindak penjiplakan dapat berkurang ataupun dituntaskan hingga selesai (Salmuasih, 2013). Pendeteksian plagiarisme pada dokumen teks dapat dilakukan dengan cara membandingkan kemiripan antara isi dokumen teks yang akan diuji dengan dokumen teks pembandingnya, dimana dokumen teks pembanding yang digunakan sudah dinyatakan valid sehingga terhindar dari tindak penjiplakan.

Pendeteksian kemiripan dokumen teks berbahasa Indonesia secara semi-otomatis cukuplah sulit untuk dilakukan karena bahasa Indonesia tidak memiliki rumus bentuk baku yang permanen (Triawati, 2009) ditambah dengan penggunaan imbuhan, kata ganti orang, dan sinonim kata yang sangat banyak dan memiliki ragam bentuk serta makna. Tentu hal ini akan semakin memudahkan terjadinya tindak plagiat dan kesulitan dalam pendeteksiannya.

(3)

perbedaan hasil similaritas sebesar 4-7% dengan responden yang mencari kesamaan dokumen secara manual. Meskipun dari segi keakuratan Winnowing lebih unggul, namun waktu proses algoritma tersebut lebih lama dari algoritma Manber.

Oleh karena itu, dibutuhkan sebuah sistem untuk mendeteksi kemiripan dokumen teks dengan tingkat keakuratan dan waktu proses yang baik. Adapun algoritma yang diimplementasikan ke dalam sistem adalah algoritma Manber. Algoritma ini memiliki waktu proses yang sangat cepat dan ketepatan yang cukup baik. Algoritma Manber merupakan salah satu dari tiga metode fingerprint selain Winnowing dan Rabin-Karp. Secara umum, algoritma Winnowing dan Manber memiliki prinsip kerja yang hampir sama dengan perbedaan, yaitu pada proses pemilihan fingerprint dokumennya. Proses stemming dan Synonym Recognition juga akan diimplementasikan ke dalam sistem untuk meningkatkan keakuratan dalam pendeteksian kemiripan dokumen teks serta mengatasi beberapa teknik penjiplakan.

1.2 Rumusan Masalah

Penjiplakan merupakan perbuatan yang secara sengaja ataupun tidak sengaja dilakukan dengan cara mengutip sebagian atau seluruh karya orang lain, tanpa menyatakan sumber secara tepat dan memadai. Salah satu objek yang sering dijadikan sebagai media penjiplakan adalah dokumen teks. Untuk melihat keaslian dokumen teks dapat diuji dengan cara membandingkan kemiripan isi dokumen teks. Oleh karena itu, diperlukan pendekatan untuk mendeteksi kemiripan suatu dokumen teks dengan dokumen teks lain sehingga tindakan penjiplakan dapat dideteksi dan dihindari.

1.3 Batasan Masalah

Agar penelitian dapat sesuai dengan permasalahan yang akan diselesaikan, maka diperlukan beberapa batasan, yaitu sebagai berikut:

1. Hanya menguji dokumen teks, tidak menguji dokumen berupa gambar ataupun suara.

(4)

3. Pengujian dilakukan pada file dengan format pdf.

4. Hanya memperhatikan tulisan, tidak termasuk makna kalimat. 5. Tidak memperhatikan kesalahan dalam penulisan kata (typo). 6. Tidak memperhatikan adanya penulisan sumber rujukan.

7. Pendeteksian pada plagiarisme jenis Technical Disguise, Disguised, dan Copy & P aste P lagiarism.

1.4 Tujuan

Tujuan dari penelitian ini adalah mendeteksi kemiripan satu dokumen teks uji dengan satu dokumen teks pembanding menggunakan algoritma Manber disertai penggunaan teknik stemming dan Synonym Recognition.

1.5 Manfaat

Adapun manfaat dari penelitian ini adalah:

1. Mengefektifkan serta mengefisiensikan waktu, tenaga, dan biaya dalam mendeteksi kemiripan dokumen teks.

2. Menambah pengetahuan atau wawasan mengenai penjiplakan dan cara untuk mendeteksi tindakan tersebut.

3. Sebagai bahan untuk pengembangan penelitian selanjutnya.

1.6 Metodologi Penelitian

Adapun metodologi pada penelitian ini adalah:

1. Studi Literatur

(5)

2. Pengumpulan Data

Dilakukan pengumpulan data dan informasi yang akan diperlukan dalam penelitian.

3. Analisis dan Perancangan

Dilakukan analisis terhadap studi literatur untuk mengetahui penyelesaian permasalahan deteksi kemiripan dokumen dan melakukan perancangan sistem.

4. Implementasi

Perancangan sistem yang telah dibuat akan diimplementasikan ke dalam aplikasi yang dibuat dengan menggunakan bahasa pemrograman PHP dan database MySQL.

5. Pengujian

Uji coba produk dan evaluasi. Melakukan uji coba program yang telah dibuat. Kemudian melakukan evaluasi terhadap kekurangan program.

6. Penyusunan Laporan

Dokumentasi dari hasil analisis dan implementasi dari sistem yang dibangun.

1.7 Sistematika Penulisan

Skripsi ini disusun dengan sistematika penulisan, sebagai berikut:

Bab 1: Pendahuluan

Pada bab ini dibahas mengenai latar belakang penulisan, rumusan masalah, batasan masalah, tujuan, manfaat, metodologi penelitian, dan sistematika penulisan skripsi.

Bab 2: Landasan Teori

(6)

Bab 3: Analisis Dan Perancangan Sistem

Pada bab ini dibahas mengenai analisis algoritma dan teknik pendukungnya dalam mendeteksi persentase kemiripan dokumen serta perancangan sistem berdasarkan hasil analisis yang dilakukan.

Bab 4: Pengimplementasian Dan Pengujian Sistem

Pada bab ini dibahas mengenai implementasi dari sistem dan melakukan pengujian terhadap kinerja dari sistem yang dibentuk.

Bab 5: Kesimpulan Dan Saran

Referensi

Dokumen terkait

Oleh karena itu, diperlukan suatu ilmu untuk mempelajari pengarahan sebuah proses produksi atau penyutradaraan dalam pembuatan suatu video animasi Iklan Layanan Masyarakat maka

Here we describe our 2-stage algorithm for generating DTMs from DSMs. The complete work flow is presented in Figure 1. The data used for developing and testing the algorithm

SISA LEBIH YANG DITERIMA ATAU DIPEROLEH BADAN ATAU LEMBAGA NIRLABA YANG BERGERAK DALAM BIDANG PENDIDIKAN DAN/ATAU BIDANG PENELITIAN DAN PENGEMBANGAN, YANG TELAH TERDAFTAR

Specifically, terrestrial laser scanning (TLS) collects high resolution 3D point clouds allowing more accurate monitoring of erosion rates and processes, and thus, quantify the

Berikut catatan-catatan khusus yang kami buat untuk mendukung bahwa transaksi yang dilakukan dengan pihak yang mempunyai hubungan istimewa telah sesuai dengan prinsip kewajaran (

Responsibility dengan tujuan agar dapat mengoptimalkan nilai perusahaan.. Investor hendaknya memperhatikan profitabilitas perusahaan, karena profitabilitas berpengaruh

The existence of the college as a center of the creation for various sciences are a particular challenge for the management to manage the knowledge optimally. Knowledges

Tujuan penelitian ini adalah: (1) mengetahui bahwa hasil belajar siswa yang dikenai pembelajaran model PBL dengan pendekatan open-ended mencapai ketuntasan belajar;