4 BAB II
TINJAUAN PUSTAKA
2.1. Landasan Teori 2.1.1. Plagiarisme
Ada beberapa definisi menurut para ahli lainnya (dalam Novanta, 2009),
yaitu :
1. Menurut Ir. Balza Achmad, M.Sc.E, plagiarisme adalah berbuat sesuatu
seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil
karya tersebut adalah milik kita,
2. Menurut Brotowidjoyo, plagiarisme merupakan pembajakan berupa fakta,
penjelasan, ungkapan, dan kalimat orang lain secara tidak sah.
Di Indonesia perlindungan hak cipta diatur dalam Undang-Undang Republik
Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Oleh karena itu kegiatan
plagiarisme atau yang lebih dikenal dengan kata plagiat harus dihindari. Di
Indonesia sendiri, pelanggaran hak cipta bisa terjadi dimana saja, mulai dari
pelanggaran hak cipta lagu, hak cipta perangkat lunak (software), dan lain-lain.
Dari salah satu berita yang diterbitkan kompas pada tanggal 11 Juli 2012
menyebutkan bahwa Indonesia berada di peringkat ke-11 Negara yang melakukan
pembajakan software. Dari hal ini patutnya kita sebagai warga Negara Indonesia
harus menyadari bahwa jangan sampai kita berada di peringkat tertinggi dalam
5
Menurut Novian, dkk. (2012), terdapat beberapa jenis plagiat yang dikenal
selama ini, yaitu :
1. Word-of-word plagiarism : menyalin setiap kata secara langsung tanpa diubah
sedikitpun.
2. Plagiarism of the form of a source : menyalin dan atau menulis ulang
kode-kode program tanpa mengubah struktur dan jalannya program.
3. Plagiarism of authorship : mengakui hasil karya orang lain sebagai hasil
karya sendiri dengan mencantumkan nama sendiri menggantikan nama
pengarang sebenarnya.
Beberapa contoh praktik plagiat pada sebuah program yang dikemukakan
oleh Novian, dkk. (2012), yaitu :
1. Leksikal : perubahan pada kode (source code) program, misalnya :
1. Komentar diubah (ditambah, dikurangi, atau diganti)
2. Format penulisan diubah
3. Nama variabel diubah
2. Struktural : perubahan struktur program
1. Perubahan urutan algoritma yang tidak mengubah jalannya program.
2. Prosedur diubah menjadi fungsi atau sebaliknya.
6 2.1.1.1. Bentuk Plagiarisme
Dalam (Novanta, 2009), bentuk-bentuk plagiarisme yang sering terjadi di
dunia akademis berdasarkan artikel Clough adalah :
1. Plagiarisme kata per kata, merupakan penyalinan kalimat secara langsung
dari sebuah dokumen teks tanpa adanya pengutipan atau perizinan.
2. Plagiarisme paraphrase, merupakan penulisan ulang dengan mengubah kata
atau sintaksis, tetapi teks aslinya masih dapat dikenali.
3. Plagiarisme sumber sekunder, merupakan perbuatan mengutip kepada sumber
asli yang didapat dari sumber sekunder dengan menghiraukan teks asli dari
sumber yang sebenarnya.
4. Plagiarisme struktur sumber, merupakan penyalinan/penjiplakan struktur
suatu argument dari sebuah sumber.
5. Plagiarisme ide, merupakan penggunaan ulang suatu gagasan/pemikiran asli
dari sebuah sumber teks tanpa bergantung bentuk teks sumber.
6. Plagiarisme authorship, merupakan pembubuhan nama sendiri secara
langsung pada hasil karya orang lain.
2.1.1.2. Identifikasi Plagiarisme
Dalam (Novanta, 2009) Beberapa faktor yang dapat digunakan untuk
mengidentifikasikan plagiarisme menurut Clough yaitu :
1. Penggunaan kosa kata.
Menganalisis kosa kata yang digunakan dalam suatu tugas terhadap
penggunaan kosa kata sebelumnya dapat membantu menentukan apakah
7
suatu kosa kata baru dalam jumlah yang besar (terutama kosa kata lanjut)
dapat menentukan apakah mahasiswa menulis teks tanpa melakukan
plagiarisme.
2. Perubahan kosa kata
Apabila penggunaan kosa kata berubah secara significant dalam suatu teks,
hal ini dapat mengindikasikan plagiarisme dengan cara copy and paste.
3. Teks yang membingungkan.
Apabila alur dari suatu teks tidak halus dan tidak konsisten, hal ini
mengindikasikan penulis tidak menulis menggunakan pemikirannya sendiri
atau beberapa bagian dari tulisannya bukanlah hasil karyanya.
4. Penggunaan tanda baca.
Tidak wajar apabila dua orang penulis menggunakan tanda baca yang persis
sama dalam membuat suatu karya tulis.
5. Jumlah kemiripan teks.
Pasti ada beberapa kemiripan antara beberapa teks yang menulis dengan topik
yang sama seperti nama-nama, istilah-istilah dan sebagainya. Bagaimanapun,
tidak wajar bila beberapa teks yang berbeda memiliki kesamaan atau
kemiripan teks dalam jumlah yang besar.
6. Kesalahan ejaan yang sama.
Merupakan hal yang biasa terjadi bagi seseorang penulis dalam membuat
suatu karya tulis. Menjadi tidak wajar bila beberapa teks yang berbeda
memiliki kesalahan-kesalahan yang sama dalam pengejaan atau jumlah ejaan
8
7. Distribusi kata-kata.
Tidak wajar apabila distribusi penggunaan kata dalam teks yang berbeda
memiliki kesamaan. Sebagai contoh, suatu teks memiliki parameter yang
sama untuk suatu distribusi statistic yang digunakan untuk menjelaskan
penggunaan istilah.
8. Struktur sintaksis teks.
Hal ini menunjukkan plagiarisme mungkin saja telah terjadi jika dua teks
secara jelas memiliki kesamaan struktur sintaksis. Hal yang wajar bila
penggunaan struktur sintaksis yang digunakan oleh beberapa penulis akan
berbeda.
9. Rangkaian-rangkaian panjang kata yang sama.
Tidak wajar apabila suatu teks yang berbeda (bahkan yang menggunakan
judul yang sama) memiliki rangkaian/urutan karakter yang sama.
10. Orde kemiripan antar teks.
Hal ini bisa mengindikasikan plagiarisme apabila orde kecocokan kata atau
frase antar dua teks sama. Meskipun diajarkan untuk menyajikan fakta-fakta
dalam suatu aturan (contohnya pendahuluan, isi, kemudian kesimpulan),
kurang wajar jika fakta-fakta yang sama dilaporkan dalam orde yang sama.
11. Ketergantungan pada kata atau frase tertentu.
Seorang penulis mungkin memilih penggunaan suatu kata atau frase tertentu.
Kekonsistenan penggunaan kata-kata tersebut dalam suatu teks yang ditulis
oleh orang lain dengan menggunakan kata yang berbeda dapat
9
12. Frekuensi kata.
Tidak wajar apabila kata-kata dari dua teks yang berbeda digunakan dengan
frekuensi yang sama.
13. Keputusan untuk menggunakan kalimat panjang atau kalimat pendek.
Tanpa sepengetahuan kita, para penulis tentu memiliki keputusan penggunaan
panjang kalimat yang tidak biasa dikombinasikan dengan fitur-fitur lain.
14. Teks yang dapat dibaca.
Penggunaan metrik/ukuran seperti index Gunning FOG, Flesch Reading Ease
Formula atau SMOG dapat membantu menentukan suatu skor kemampuan.
Tidak wajar apabila penulis yang berbeda akan memiliki skor yang sama.
15. Referensi yang tidak jelas.
Apabila referensi yang muncul dalam suatu teks tetapi tidak terdapat pada
daftar pustaka, hal ini dapat mengindikasikan plagiarisme cut and paste,
dimana penulis tidak menyalin referensinya secara lengkap.
2.1.2. Algoritma Smith-Waterman
Menurut artikel yang terdapat dalam situs Wikipedia.org, Algoritma
Smith-Waterman merupakan algoritma klasik yang telah dikenal luas dalam bidang
bioinformatika sebagai metode yang dapat mengidentifikasi local similarities
(penyejajaran sekuens) yaitu proses penyusunan dua local sequences
(rangkaian/susunan atau rentetan) nucleotide atau protein sequences sehingga
kemiripan antara dua sequence tersebut akan terlihat. Berdasarkan fungsi proses
10
pemrograman komputer untuk digunakan membantu proses pendeteksian
dokumen teks yang dianggap cenderung plagiat dengan cara melihat kesamaan isi
(local similarities) dari beberapa dokumen teks.
Gambar 2.1. Optimal Alignment Dari Dua Substring
Algoritma standar Smith-Waterman yang dipakai untuk penghitungan local
alignment berdasarkan dokumen dari situs Baylor College of Medicine HGSC
adalah (Novanta, 2009) :
1. Menambahkan sebuah nilai pada setiap perbandingan
a. Menggunakan nilai positif, apabila memiliki kemiripan.
b. Menggunakan nilai negatif, apabila memiliki perbedaan.
2. Inisialisasi awal matriks dengan nilai 0 (nol).
3. Semua nilai yang terdapat dalam matriks apabila lebih kecil dari 0 (nol),
maka nilai dianggap 0 (nol).
4. Memulai traceback dari nilai yang tertinggi yang ditemukan dimanapun pada
matriks.
5. Penghitungan dilanjutkan hingga skor bernilai 0 (nol).
A b c b a d b c a
| | | | | | | | |
A b – b – d b d a
11
Robert W. Irving dalam (Novanta, 2009) merumuskan skema pemrograman
dinamis algoritma klasik Smith-Waterman kedalam dua bagian, yaitu :
1. Didefinisikan Sij menjadi nilai maksimun yang didapatkan dari proses
perbandingan sebuah substring A pada posisi ke-i dengan sebuah substring B
pada posisi ke-j. Hubungan rekurens standar untuk Sij, yaitu :
- Jika A(i) = B(j) maka Sij = Si-1,j-1+h, atau
- Jika A(i) ≠ B(j) maka Sij = max(0,Si-1,j-d,Si,j-1-d,Si-1,j-1-r)
- Dimana kondisi awal adalah Si,0 = S0,j = 0 untuk semua i,j.
2. Digunakan ide traceback path untuk mengkonstruksikan sebuah local
alignment yang optimal pada posisi ke-i substring A dan posisi ke-j substring
B agar lebih jelas terlihat. Dengan diberikan sel (i,j) dapat didefinisikan
sebuah sel parent sebagai berikut :
- Jika Sij = 0, maka sel (i,j) tidak mempunyai parent
- Jika A(i) = B(j), maka sel (i,j) mempunyai parent sel (i-1,j-1)
- Sebagai tambahan, sel (i,j) mempunyai parent yaitu untuk sel (p,q) ϵ
{(i-1,j),(i,j-1)} sehingga Sij = Spq-d, dan/atau sel (i-1,j-1) jika Sij = Si-1,j-1-r
2.2. Penelitian Terkait
Sudah terdapat beberapa penelitian sebelumnya yang sama, yakni mengenai
sebuah sistem pendeteksi kesamaan dokumen teks. Penelitian-penelitian tersebut
menggunakan berbagai algoritma diantaranya algoritma Rabin-Karp,
12
Penelitian sebelumnya telah dilakukan oleh Novanta (2009) dengan judul
Pendeteksian Plagiarisme Pada Dokumen Teks Dengan Menggunakan Algoritma Waterman. Dari penelitian ini disimpulkan bahwa Algoritma
Smith-Waterman memiliki keakuratan yang lebih baik pada saat membandingkan
dokumen yang mengandung perubahan struktur kalimat khususnya dalam
paragraf ketimbang perubahan struktur kata di dalam kalimat. Akan tetapi sistem
ini hanya dapat membaca dokumen dengan tipe file .txt, dan masih belum
menggunakan penerapan Graphical User Interface (GUI) dalam antarmuka
sistemnya.
Penelitian lain mengenai sistem pendeteksi plagiarisme juga telah dilakukan
oleh Novian, dkk. (2012), dengan menggunakan algoritma Rabin-Karp. Judul
yang digunakan dalam penelitiannya yaitu Aplikasi Pendeteksian Plagiat Pada
Karya Ilmiah Menggunakan Algoritma Rabin-Karp. Aplikasi yang dibuat
menggunakan Microsoft Visual C++, dan modifikasi dari algoritma pencocokan
string Rabin-Karp. Aplikasi yang dibuat mampu membandingkan dokumen
dengan data yang besar dalam jumlah yang banyak dan juga menampilkan
kata-kata yang sama dari kedua dokumen yang dibandingkan.
Untuk pengembangan sistem yang lebih baik, penulis akan mengembangkan
sistem yang menggunakan algoritma Smith-Waterman yang mampu melakukan
perbandingan dokumen bukan hanya terbatas pada tipe data .txt, akan tetapi bisa
digunakan untuk pembacaan dokumen bertipe .doc, .pdf, dan juga disertai