BAB II TINJAUAN PUSTAKA. seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil

(1)

4 BAB II

TINJAUAN PUSTAKA

2.1. Landasan Teori 2.1.1. Plagiarisme

Ada beberapa definisi menurut para ahli lainnya (dalam Novanta, 2009),

yaitu :

1. Menurut Ir. Balza Achmad, M.Sc.E, plagiarisme adalah berbuat sesuatu

seolah-olah karya orang lain tersebut adalah karya kita dan mengakui hasil

karya tersebut adalah milik kita,

2. Menurut Brotowidjoyo, plagiarisme merupakan pembajakan berupa fakta,

penjelasan, ungkapan, dan kalimat orang lain secara tidak sah.

Di Indonesia perlindungan hak cipta diatur dalam Undang-Undang Republik

Indonesia Nomor 19 Tahun 2002 Tentang Hak Cipta. Oleh karena itu kegiatan

plagiarisme atau yang lebih dikenal dengan kata plagiat harus dihindari. Di

Indonesia sendiri, pelanggaran hak cipta bisa terjadi dimana saja, mulai dari

pelanggaran hak cipta lagu, hak cipta perangkat lunak (software), dan lain-lain.

Dari salah satu berita yang diterbitkan kompas pada tanggal 11 Juli 2012

menyebutkan bahwa Indonesia berada di peringkat ke-11 Negara yang melakukan

pembajakan software. Dari hal ini patutnya kita sebagai warga Negara Indonesia

harus menyadari bahwa jangan sampai kita berada di peringkat tertinggi dalam

(2)

5

Menurut Novian, dkk. (2012), terdapat beberapa jenis plagiat yang dikenal

selama ini, yaitu :

1. Word-of-word plagiarism : menyalin setiap kata secara langsung tanpa diubah

sedikitpun.

2. Plagiarism of the form of a source : menyalin dan atau menulis ulang

kode-kode program tanpa mengubah struktur dan jalannya program.

3. Plagiarism of authorship : mengakui hasil karya orang lain sebagai hasil

karya sendiri dengan mencantumkan nama sendiri menggantikan nama

pengarang sebenarnya.

Beberapa contoh praktik plagiat pada sebuah program yang dikemukakan

oleh Novian, dkk. (2012), yaitu :

1. Leksikal : perubahan pada kode (source code) program, misalnya :

1. Komentar diubah (ditambah, dikurangi, atau diganti)

2. Format penulisan diubah

3. Nama variabel diubah

2. Struktural : perubahan struktur program

1. Perubahan urutan algoritma yang tidak mengubah jalannya program.

2. Prosedur diubah menjadi fungsi atau sebaliknya.

(3)

6 2.1.1.1. Bentuk Plagiarisme

Dalam (Novanta, 2009), bentuk-bentuk plagiarisme yang sering terjadi di

dunia akademis berdasarkan artikel Clough adalah :

1. Plagiarisme kata per kata, merupakan penyalinan kalimat secara langsung

dari sebuah dokumen teks tanpa adanya pengutipan atau perizinan.

2. Plagiarisme paraphrase, merupakan penulisan ulang dengan mengubah kata

atau sintaksis, tetapi teks aslinya masih dapat dikenali.

3. Plagiarisme sumber sekunder, merupakan perbuatan mengutip kepada sumber

asli yang didapat dari sumber sekunder dengan menghiraukan teks asli dari

sumber yang sebenarnya.

4. Plagiarisme struktur sumber, merupakan penyalinan/penjiplakan struktur

suatu argument dari sebuah sumber.

5. Plagiarisme ide, merupakan penggunaan ulang suatu gagasan/pemikiran asli

dari sebuah sumber teks tanpa bergantung bentuk teks sumber.

6. Plagiarisme authorship, merupakan pembubuhan nama sendiri secara

langsung pada hasil karya orang lain.

2.1.1.2. Identifikasi Plagiarisme

Dalam (Novanta, 2009) Beberapa faktor yang dapat digunakan untuk

mengidentifikasikan plagiarisme menurut Clough yaitu :

1. Penggunaan kosa kata.

Menganalisis kosa kata yang digunakan dalam suatu tugas terhadap

penggunaan kosa kata sebelumnya dapat membantu menentukan apakah

(4)

7

suatu kosa kata baru dalam jumlah yang besar (terutama kosa kata lanjut)

dapat menentukan apakah mahasiswa menulis teks tanpa melakukan

plagiarisme.

2. Perubahan kosa kata

Apabila penggunaan kosa kata berubah secara significant dalam suatu teks,

hal ini dapat mengindikasikan plagiarisme dengan cara copy and paste.

3. Teks yang membingungkan.

Apabila alur dari suatu teks tidak halus dan tidak konsisten, hal ini

mengindikasikan penulis tidak menulis menggunakan pemikirannya sendiri

atau beberapa bagian dari tulisannya bukanlah hasil karyanya.

4. Penggunaan tanda baca.

Tidak wajar apabila dua orang penulis menggunakan tanda baca yang persis

sama dalam membuat suatu karya tulis.

5. Jumlah kemiripan teks.

Pasti ada beberapa kemiripan antara beberapa teks yang menulis dengan topik

yang sama seperti nama-nama, istilah-istilah dan sebagainya. Bagaimanapun,

tidak wajar bila beberapa teks yang berbeda memiliki kesamaan atau

kemiripan teks dalam jumlah yang besar.

6. Kesalahan ejaan yang sama.

Merupakan hal yang biasa terjadi bagi seseorang penulis dalam membuat

suatu karya tulis. Menjadi tidak wajar bila beberapa teks yang berbeda

memiliki kesalahan-kesalahan yang sama dalam pengejaan atau jumlah ejaan

(5)

8

7. Distribusi kata-kata.

Tidak wajar apabila distribusi penggunaan kata dalam teks yang berbeda

memiliki kesamaan. Sebagai contoh, suatu teks memiliki parameter yang

sama untuk suatu distribusi statistic yang digunakan untuk menjelaskan

penggunaan istilah.

8. Struktur sintaksis teks.

Hal ini menunjukkan plagiarisme mungkin saja telah terjadi jika dua teks

secara jelas memiliki kesamaan struktur sintaksis. Hal yang wajar bila

penggunaan struktur sintaksis yang digunakan oleh beberapa penulis akan

berbeda.

9. Rangkaian-rangkaian panjang kata yang sama.

Tidak wajar apabila suatu teks yang berbeda (bahkan yang menggunakan

judul yang sama) memiliki rangkaian/urutan karakter yang sama.

10. Orde kemiripan antar teks.

Hal ini bisa mengindikasikan plagiarisme apabila orde kecocokan kata atau

frase antar dua teks sama. Meskipun diajarkan untuk menyajikan fakta-fakta

dalam suatu aturan (contohnya pendahuluan, isi, kemudian kesimpulan),

kurang wajar jika fakta-fakta yang sama dilaporkan dalam orde yang sama.

11. Ketergantungan pada kata atau frase tertentu.

Seorang penulis mungkin memilih penggunaan suatu kata atau frase tertentu.

Kekonsistenan penggunaan kata-kata tersebut dalam suatu teks yang ditulis

oleh orang lain dengan menggunakan kata yang berbeda dapat

(6)

9

12. Frekuensi kata.

Tidak wajar apabila kata-kata dari dua teks yang berbeda digunakan dengan

frekuensi yang sama.

13. Keputusan untuk menggunakan kalimat panjang atau kalimat pendek.

Tanpa sepengetahuan kita, para penulis tentu memiliki keputusan penggunaan

panjang kalimat yang tidak biasa dikombinasikan dengan fitur-fitur lain.

14. Teks yang dapat dibaca.

Penggunaan metrik/ukuran seperti index Gunning FOG, Flesch Reading Ease

Formula atau SMOG dapat membantu menentukan suatu skor kemampuan.

Tidak wajar apabila penulis yang berbeda akan memiliki skor yang sama.

15. Referensi yang tidak jelas.

Apabila referensi yang muncul dalam suatu teks tetapi tidak terdapat pada

daftar pustaka, hal ini dapat mengindikasikan plagiarisme cut and paste,

dimana penulis tidak menyalin referensinya secara lengkap.

2.1.2. Algoritma Smith-Waterman

Menurut artikel yang terdapat dalam situs Wikipedia.org, Algoritma

Smith-Waterman merupakan algoritma klasik yang telah dikenal luas dalam bidang

bioinformatika sebagai metode yang dapat mengidentifikasi local similarities

(penyejajaran sekuens) yaitu proses penyusunan dua local sequences

(rangkaian/susunan atau rentetan) nucleotide atau protein sequences sehingga

kemiripan antara dua sequence tersebut akan terlihat. Berdasarkan fungsi proses

(7)

10

pemrograman komputer untuk digunakan membantu proses pendeteksian

dokumen teks yang dianggap cenderung plagiat dengan cara melihat kesamaan isi

(local similarities) dari beberapa dokumen teks.

Gambar 2.1. Optimal Alignment Dari Dua Substring

Algoritma standar Smith-Waterman yang dipakai untuk penghitungan local

alignment berdasarkan dokumen dari situs Baylor College of Medicine HGSC

adalah (Novanta, 2009) :

1. Menambahkan sebuah nilai pada setiap perbandingan

a. Menggunakan nilai positif, apabila memiliki kemiripan.

b. Menggunakan nilai negatif, apabila memiliki perbedaan.

2. Inisialisasi awal matriks dengan nilai 0 (nol).

3. Semua nilai yang terdapat dalam matriks apabila lebih kecil dari 0 (nol),

maka nilai dianggap 0 (nol).

4. Memulai traceback dari nilai yang tertinggi yang ditemukan dimanapun pada

matriks.

5. Penghitungan dilanjutkan hingga skor bernilai 0 (nol).

A b c b a d b c a

| | | | | | | | |

A b – b – d b d a

(8)

11

Robert W. Irving dalam (Novanta, 2009) merumuskan skema pemrograman

dinamis algoritma klasik Smith-Waterman kedalam dua bagian, yaitu :

1. Didefinisikan Sij menjadi nilai maksimun yang didapatkan dari proses

perbandingan sebuah substring A pada posisi ke-i dengan sebuah substring B

pada posisi ke-j. Hubungan rekurens standar untuk Sij, yaitu :

- Jika A(i) = B(j) maka Sij = Si-1,j-1+h, atau

- Jika A(i) ≠ B(j) maka Sij = max(0,Si-1,j-d,Si,j-1-d,Si-1,j-1-r)

- Dimana kondisi awal adalah Si,0 = S0,j = 0 untuk semua i,j.

2. Digunakan ide traceback path untuk mengkonstruksikan sebuah local

alignment yang optimal pada posisi ke-i substring A dan posisi ke-j substring

B agar lebih jelas terlihat. Dengan diberikan sel (i,j) dapat didefinisikan

sebuah sel parent sebagai berikut :

- Jika Sij = 0, maka sel (i,j) tidak mempunyai parent

- Jika A(i) = B(j), maka sel (i,j) mempunyai parent sel (i-1,j-1)

- Sebagai tambahan, sel (i,j) mempunyai parent yaitu untuk sel (p,q) ϵ

{(i-1,j),(i,j-1)} sehingga Sij = Spq-d, dan/atau sel (i-1,j-1) jika Sij = Si-1,j-1-r

2.2. Penelitian Terkait

Sudah terdapat beberapa penelitian sebelumnya yang sama, yakni mengenai

sebuah sistem pendeteksi kesamaan dokumen teks. Penelitian-penelitian tersebut

menggunakan berbagai algoritma diantaranya algoritma Rabin-Karp,

(9)

12

Penelitian sebelumnya telah dilakukan oleh Novanta (2009) dengan judul

Pendeteksian Plagiarisme Pada Dokumen Teks Dengan Menggunakan Algoritma Waterman. Dari penelitian ini disimpulkan bahwa Algoritma

Smith-Waterman memiliki keakuratan yang lebih baik pada saat membandingkan

dokumen yang mengandung perubahan struktur kalimat khususnya dalam

paragraf ketimbang perubahan struktur kata di dalam kalimat. Akan tetapi sistem

ini hanya dapat membaca dokumen dengan tipe file .txt, dan masih belum

menggunakan penerapan Graphical User Interface (GUI) dalam antarmuka

sistemnya.

Penelitian lain mengenai sistem pendeteksi plagiarisme juga telah dilakukan

oleh Novian, dkk. (2012), dengan menggunakan algoritma Rabin-Karp. Judul

yang digunakan dalam penelitiannya yaitu Aplikasi Pendeteksian Plagiat Pada

Karya Ilmiah Menggunakan Algoritma Rabin-Karp. Aplikasi yang dibuat

menggunakan Microsoft Visual C++, dan modifikasi dari algoritma pencocokan

string Rabin-Karp. Aplikasi yang dibuat mampu membandingkan dokumen

dengan data yang besar dalam jumlah yang banyak dan juga menampilkan

kata-kata yang sama dari kedua dokumen yang dibandingkan.

Untuk pengembangan sistem yang lebih baik, penulis akan mengembangkan

sistem yang menggunakan algoritma Smith-Waterman yang mampu melakukan

perbandingan dokumen bukan hanya terbatas pada tipe data .txt, akan tetapi bisa

digunakan untuk pembacaan dokumen bertipe .doc, .pdf, dan juga disertai