i
SKRIPSI
DETEKSI KEMIRIPAN SOURCE CODE
PADA BAHASA PEMROGRAMAN JAVA
MENGGUNAKAN METODE ANALISIS LEKSIKAL
Diajukan Untuk Memenuhi
Salah Satu Syarat Memperoleh Gelar Sarjana Teknik
HOLIS HERMANSYAH E1E1 11 035
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS HALU OLEO
KENDARI
v LEKSIKAL
Skripsi, Fakultas Teknik, 2016 (xii+53+lampiran)
Kata kunci : Source Code, Analisis leksikal,Java,Token,Plagiarism
Laboratorium Pemrograman Jurusan Teknik Infomatika Fakultas Teknik Universitas Halu Oleo sebagai tempat pembelajaran bagi para mahasiswa informatika yang mengikuti kelas pemrograman selalu memberikan praktikum sebagai salah satu media pengukur tingkat pemahaman mahasiswa dalam hal membuat program. Banyaknya source code yang harus diperiksa oleh Dosen atau Assisten Laboratorium mengakibatkan sulitnya melakukan pemeriksaan serta sulitnya mengukur kredibilitas masing-masing tugas milik mahasiswa
Metode deteksi kemiripan kode menggunakan Analisis Leksikal dapat digunakan untuk merubah kode menjadi token unik. Token ini digunakan untuk mengidentifikasi struktur program yang diperiksa. Sebelum proses pencocokan token menggunakan array, terlebih dahulu token yang terbentuk dari kedua source code yang diperiksa di sorting atau diurutkan berdasarkan abjad. Setelah itu dilakukan proses pencocokan string menggunakan array per posisi array. Semakin besar kemiripan alur dan kode program maka semakin besar kemungkinan kode tersebut merupakan plagiat.
Nilai presentase kemiripan kode program yang dihasilkan dari proses pencocokan token ini yang nantinya digunakan sebagai acuan penentuan
plagiarisme dengan ketentuan jika nilai presentase lebih besar atau sama dengan
70 % maka source dianggap plagiat, namun jika lebih kecil dari 70% tidak dianggap sebagai plagiat.
vi
Mini Thesis, Faculty of Engineering, 2016 (xii+53+attachments)
Keyword : Source Code, Lexical Analysis, Java, Token, Plagiarism
Programming Laboratory of Informatics Engineering Department of Engineering Faculty, Halu Oleo University is a learning place for college students majoring in informatics to follow programming class that become one of the standard to determine the student’s level of understanding in creating a program.
Similarity detection method using Lexical analysis can be used to convert the programming code into an unique token. This token later used to identify the structure of a program that is being examined. After that, the token that already formed from two different source codes will be sorted alphabetically before entering the string matching process by using arrays. The string matching process will do the matching based on the position of each array. The more the similarities of the structure and the program codes, the more likely the code represented as plagiarism.
The percentage value resulting from the token matching process later will be used as reference to determine the percentage of plagiarism in the program. If the similarities percentage greater than 70%, the examined source codes can be considered as plagiarism, but if it less than 70% the examined source codes will be not considered as plagiarism.
vii
Segala puji dan syukur penulis panjatkan kehadirat Allah SWT, karena atas rahmat dan ridho-Nya penulisan skripsi yang berjudul “Deteksi Kemiripan
Source Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal” ini dapat disusun dan diselesaikan sebagai syarat menyelesaikan studi di
Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo Kendari. Pada kesempatan ini dengan segala kerendahan hati penulis haturkan sebuah ucapan terima kasih yang sebesar-besarnya kepada :
1. Allah SWT yang telah menciptakan dan menuntun penulis hingga dapat menyelesaikan skripsi ini.
2. Ayahanda Jamidin, ibunda Saliyah, saudaraku Nuryoni, S.Pi, Sunarty, S.Ip, dan Nurmiftahuddin, S.Hut atas doa dan dukungan moral yang diberikan kepada penulis. 3. Bapak Bambang Pramono, S.Si.,MT dan Bapak Subardin, ST., MT sebagai dosen
pembimbing skripsi yang banyak memberikan masukan dan saran serta ketersediaan untuk meluangkan waktunya dengan penulis untuk memberikan arahan – arahan yang sangat berguna.
4. Andi Iswahyuningsih, ST , Na’firul Hasna Ariyani dan Hasrul Dimas Asgari yang turut membantu penulis dalam menyelsaikan tugas akhir ini.
5. Kawan-kawan di jurusan Teknik Informatika, khususnya angkatan 2011 dan kawan-kawan di Fakultas Teknik pada umumnya yang memberikan saran dan semangatnya selama proses penyelesaian skripsi ini.
Dengan keterbatasan pengalaman, pengetahuan maupun pustaka yang ditinjau, penulis menyadari bahwa tugas akhir ini masih banyak kekurangan dan perlu pengembangan lebih lanjut agar benar-benar bermanfaat. Oleh sebab itu, penulis sangat mengharapkan kritik dan saran agar tugas akhir ini lebih sempurna serta sebagai masukan bagi penulis untuk penelitian dan penulisan karya ilmiah di masa yang akan datang.
viii
ix
INTI SARI ... v
ABSTRACT ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... ix
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xii
BAB I PENDAHULUAN ... 1 1.1 Latar Belakang ... 1 1.2 Rumusan Masalah ... 2 1.3 Batasan Masalah ... 2 1.4 Tujuan Penelitian ... 2 1.5 Manfaat Penelitian ... 3 1.6 Sistematika Penulisan ... 3 1.7 Tinjauan Pustaka ... 4
BAB II LANDASAN TEORI ... 6
2.1 Plagiarisme ... 6 2.1.1 Pengertian Plagiarisme... 6 2.1.2 Jenis-Jenis Plagiarisme ... 6 2.2 Source Code ... 8 2.3 Analisis Leksikal ... 8 2.3.1 Tipe-Tipe Token ... 9
2.3.2 Tahap Analisis Leksikal ... 11
2.3.3 Implementasi Analisis Leksikal ... 12
2.4 Pemrograman Java ... 12
2.5 Netbeans ... 13
2.6 Perancangan Sistem ... 14
2.6.1 Pengertian UML (Unified Modeling Language) ... 14
2.6.2 Bangun Dasar Metodologi UML ... 15
2.6.3 Tujuan Penggunaan UML………...19
2.7 Flow Chart... 19
BAB III METODOLOGI PENELITIAN... 21
3.1 Waktu dan Tempat Penelitian ... 21
3.1.1 Waktu Penelitian ... 21
3.1.2 Tempat Penelitian ... 21
3.2 Metode Pengumpulan Data ... 21
3.3 Metode Pengembangan Sistem ... 22
BAB IV ANALISIS DAN PERANCANGAN SISTEM ... 24
x
4.2.3 Diagram Squence ... 27
4.3 Analisis Kebutuhan Sistem ... 28
4.3.1 Kebutuhan Data Masukan ... 28
4.3.2 Kebutuhan Data Keluaran ... 28
4.4 Flowchart ... 29
4.5 Perancangan Antar Muka (Interface)... 30
4.6. Ilustrasi Metode Analisis Leksikal Terhadap Perencanaan Aplikasi 30 4.6.1 Analisis Leksikal ... 30
4.6.2 Sorting ... 35
4.6.3 Perhitungan Nilai Kemiripan ... 38
BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM ... 44
5.1. Implementasi Sistem ... 44
5.1.1 Interface Aplikasi... 44
5.2. Pengujian Sistem ... 46
5.2.1 Pengujian Fungsionalitas Aplikasi ... 46
5.2.2 Hasil Analisa ... 50 BAB VI PENUTUP ... 53 6.1. Kesimpulan ... 53 6.2. Saran ... 53 DAFTAR PUSTAKA LAMPIRAN
xi
Tabel 2.3 Simbol Squence Diagram ... 18
Tabel 2.4 Simbol Activity Diagram ... 18
Tabel 2.5 Simbol Flow Chart ... 20
Tabel 3.1 Waktu Penelitian ... 21
Tabel 4.1 Hasil Analisis Leksikal Source Asli ... 32
Tabel 4.2 Hasil Analisis Leksikal Source Pembanding... 34
Tabel 4.3 Hasil Sorting Source Asli ... 35
Tabel 4.4 Hasil Sorting Source Pembanding ... 36
Tabel 5.1 Daftar Nama Class Source Asli ... 51
Tabel 5.2 Daftar Nama Class Source Pembanding ... 51
xii
Gambar 4.3 Diagram Activity Menu Open File ... 26
Gambar 4.4 Diagram Activity Menu Help ... 27
Gambar 4.5 Diagram Squence submenu Scanning ... 28
Gambar 4.6 Flowchart program ... 29
Gambar 4.7 Desain Interface Aplikasi ... 30
Gambar 4.8 Source Asli ... 31
Gambar 4.9 Source Pembanding ... 33
Gambar 5.1 Tampilan Progress Bar ... 44
Gambar 5.2 Tampilan Utama ... 45
Gambar 5.3 Tampilan Dialog Open Source ... 47
Gambar 5.4 Tampilan Source Code Yang Telah Di Input ... 47
Gambar 5.5 Tampilan Hasil Scanning Kemiripan... 48
Gambar 5.6 Menampilkan Hasil Analisis... 48
Gambar 5.7 Menampilkan Token Yang Sama ... 49
Gambar 5.8 Menampilkan Token Yang Tidak Sama ... 49
Gambar 5.9 Tampilan Help ... 50
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Laboratorium Rekayasa Perangkat Lunak Jurusan Teknik Infomatika Fakultas Teknik Universitas Halu Oleo sebagai tempat pembelajaran bagi para mahasiswa informatika yang mengikuti kelas pemrograman selalu memberikan praktikum sebagai salah satu media pengukur tingkat pemahaman mahasiswa dalam hal membuat program. Pemrograman adalah proses menulis, menguji dan memperbaiki, dan memelihara kode yang membangun sebuah program komputer. Kode ini ditulis dalam berbagai bahasa pemrograman.
Bahasa pemrograman merupakan alat yang sangat penting bagi
programmer untuk mengimplementasikan algoritma. Tiap bahasa pemrograman
memiliki kelebihan dan kekurangan tersendiri, dan programmer memiliki referensi tersendiri dalam memilih suatu bahasa pemrograman. Beberapa faktor penting seseorang dalam memilih bahasa pemrograman adalah syntax, editor, dokumentasi, performa, library, fleksibilitas, komunitas dan popularitas.
Banyaknya source code yang harus diperiksa oleh Dosen atau Assisten laboratorium mengakibatkan sulitnya melakukan pemeriksaan serta sulitnya mengukur kredibilitas masing-masing tugas milik mahasiswa. Kode program terperiksa yang memiliki tingkat similarity (kemiripan) yang cukup tinggi antar kode dapat dijadikan acuan adanya tindakan-tindakan kecurangan seperti melakukan tindakan plagiat kode terhadap tugas mahasiswa lain.
Metode deteksi kemiripan kode menggunakan analisis leksikal dapat digunakan untuk merubah kode menjadi node ataupun token unik masing-masing kode terperiksa. Semakin besar kemiripan maka semakin besar kemungkinan kode tersebut merupakan hasil plagiat. Pada judul yang diajukan, sistem akan melakukan analisis leksikal pada program yang diperiksa dalam hal ini bahasa pemrograman Java. Analisis ini meliputi pengubahan source code kedalam
bentuk token-token yang memiliki nama atau id yang unik, penghapusan komentar,serta penghapusan white space. Kemudian dilakukan pencocokan
source code yang telah menjadi token yang memiliki kesamaan pada program
pembanding berdasarkan struktur yang terbentuk. Jika ditemukan id token dan token yang sama pada posisi yang sama maka program akan mencatatnya dan kemudian menghitung tingkaat kemiripan source code tersebut dan memberikan nilai presentase (similarity).
1.2 Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah sebagai berikut:
1. Bagaimana membangun aplikasi deteksi kemiripan Source code pada bahasa pemrograman java menggunakan metode analisis leksikal.
2. Bagaimana akurasi aplikasi deteksi kemiripan source code tersebut dapat mendeteksi kemiripan dua source code.
1.3 Batasan Masalah
Batasan masalah dalam penelitian ini adalah sebagai berikut:
1. Source code yang diperiksa dalam aplikasi ini adalah source code java.
2. File pembanding yang diperiksa adalah dokumen dalam bentuk class file java bukan dalam bentuk project.
3. Source code yang diperiksa merupakan source code pemrograman dasar
yang sekurang-kurangnya memiliki algoritma.
1.4 Tujuan Penelitian
Tujuan dalam penelitian ini adalah sebagai berikut:
1. Membangun sistem aplikasi deteksi kemiripan source code pada bahasa pemrograman java menggunakan metode analisis leksikal.
2. Mengetahui akurasi kemiripan (similarty) antara satu file dengan file lainnya.
1.5. Manfaat Penelitian
Manfaat penelitian dalam penelitan ini adalah :
1. Dapat membantu instansi pendidikan dalam mendeteksi hasil praktikum dan tugas yang diberikan.
2. Mengetahui tingkat kemiripan (similarity) source code antara file yang satu dengan yang lain.
3. Dengan mengetahui persentase kemiripan source code, sehingga dapat digunakan sebagai bahan pertimbangan untuk mendeteksi adanya tindakan plagiat.
4. Mempercepat proses pengoreksian dengan cepat dan efektif.
1.6. Sistematika Penulisan
Sistematika dalam skripsi ini terdiri dari beberapa bagian utama yaitu sebagai berikut:
BAB I Pendahuluan
Merupakan bab pendahuluan yang menguraikan latar belakang masalah, rumusan masalah, tujuan penelitian, manfaat penelitian, batasan masalah dan sistematika penulisan.
BAB II Landasan Teori
Membahas mengenai dasar-dasar teori pendukung yang digunakan dalam penelitian ini seperti plagiat, bahasa pemrograman java, metode leksikal, source
code.
BAB III Metodologi Penelitian
Membahas mengenai waktu dan tempat penelitian, metode pengumpulan data, metode pengembangan sistem yang digunakan dalam penelitian tugas akhir ini.
BAB IV Analisis dan Perancangan Sistem
Pada bagian ini diuraikan analisis sistem yang akan dibuat dan kebutuhan sistem yang meliputi kebutuhan fungsional, kebutuhan non fungsional sistem.
Rancangan sistem meliputi rancangan arsitektur sistem, rancangan proses, rancangan prosedural, rancangan data, dan rancangan user interface.
BAB V Implementasi dan Pengujian Sistem
Menguraikan tentang implementasi dan pengujian dari perangkat lunak yang dibangun berdasarkan hasil analisis dan perancangan (desain) pada bab sebelumnya.
BAB VI Penutup
Menguraikan kesimpulan penelitian dan saran-saran sebagai bahan pertimbangan untuk pengembangan penelitian.
1.7. Tinjauan Pustaka
Penelitian ini didasarkan pada penelitian sebelumnya yang dilakukan oleh Budhy (2014) yang berjudul “Deteksi Similarity Source Code Menggunakan Metode Deteksi Abstract Syntax Tree” dalam penelitian tersebut cara mendeteksi kemiripan code menggunakan Abstract Syntax Tree dapat digunakan untuk merubah code menjadi node ataupun token unik masing-masing code terperiksa. Semakin besar kemiripan maka semakin besar kemungkinan code tersebut merupakan hasil plagiat.
Salah satu penelitian yang mendasari penelitian ini adalah penelitian yang dilakukn oleh Aulia, (2013) “Pemanfaatan Algoritma Rabin-Karp untuk Mengetahui Tingkat Kemiripan dari Source Code pada pemrograman lisp” dalam penelian tersebut membangun sistem deteksi plagiarism kode sumber lisp dengan tahapan pencocokan yang diawali dengan menghilangkan spasi pada string, membagi string ke substring substring, menghitung hash tiap substring menggunakan teknik rolling hash kemudian menghitung persentase kemiripan antar dokumen menggunakan Dice Similarity Coeficient.
Redya Febriyanto dkk. (2006) dalam penelitiannya yang berjudul “Penerapan Algoritma Boyer-Moore Untuk Pengecekan Plagiatisme Source Code” dalam penelitian tersebut proses pendeteksian plagiatisme menggunakan penghitungan jumlah prosedur/fungsi, loop, if dan variable dengan pembobotan
sederhana. Aplikasi melakukan scanning keyword-keyword tertentu menggunakan
Boyer-Moore untuk menentukan bagian dari source yang memenuhi kondisi
tertentu. Setelah seluruh prosedur/fungsi selesai diperiksa maka langkah terakhir membandingkan elemen array dari source code yang dicurigai melakukan
plagiatisme terhadap source yang asli. Jika didapati ada prosedur/fungsi yang
sama maka akan dicatat sebagai satu kesamaan kemudian dilakukan perhitungan presentase kemiripan.
Dari beberapa penelitian tersebut yang mendasari penulis untuk melakukan penelitian yang berjudul “Deteksi Kemiripan Source Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal”. Yang membedakan dengan penelitian sebelumnya yaitu, pada penelitian ini tidak hanya mendeteksi source-nya saja melainkan juga dengan mendeteksi dari alur atau struktur source code yang diperiksa. Sebagai contoh pada program perulangan, walaupun isi source mempunyai banyak kesamaan namun secara logika source berbeda, misalkan source satu menggunakan perulangan for sedangkan yang source kedua menggunakan while, maka source tersebut tidak bias dianggap sebagai plagiat, begitu juga sebaliknya.
6
BAB II
LANDASAN TEORI
2.1. Plagiarisme
2.2.1. Pengertian Plagiarisme
Plagiarisme merupakan tindakan kriminal yang sering terjadi dalam dunia
akademis. Plagiarisme itu sendiri berasal dari kata latin “Plagiarus” yang berarti penculik dan “Plagiare” yang berarti mencuri. Jadi, secara sederhana plagiat berarti mengambil ide, kata-kata, dan kalimat seseorang dan memposisikannya sebagai hasil karyanya sendiri atau mengunakan ide, kata-kata, dan kalimat tanpa mencantumkan sumber dimana seorang penulis mengutipnya (Sastroasmoro, 2007).
Dalam Kamus Besar Bahasa Indonesia (2008) disebutkan: "Plagiat adalah pengambilan karangan (pendapat dan sebagainya) orang lain dan menjadikannya seolah-olah karangan (pendapat) sendiri". Plagiat dapat di anggap sebagai tindak kriminal karena mencuri hak cipta orang lain. Di dalam dunia akademis, pelaku
plagiarisme akan mendapat hukuman yang berat. Pelaku plagiat disebut plagiator.
2.2.2. Jenis-Jenis Plagiarisme
Terdapat jenis jenis plagiarism, menurut Sudigdo Sastroasmoro dalam makalahnya berjudul Beberapa Catatan tentang Plagiarisme pada tahun 2007, mengklasifikasikan plagiarisme dalam empat jenis. Jenis plagiarisme berdasarkan klasifikasinya diantaranya:
a. Jenis plagiarisme berdasarkan aspek yang dicuri
Dalam klasifikasi ini terdiri atas 4 kategori yaitu kategori plagiarisme ide,
plagiarisme isi, plagiarisme kata, kalimat, paragraf, dan plagiarisme total. Plagiarisme ide sering dikaitkan dengan penelitian replikatif. Penelitian reflikatif
adalah penelitian yang berdasarkan atas ide orang lain. Apabila dalam melakukan penelitian, analisis yang digunakan sama dengan penelitian sebelumnya sama,
maka harus mencantumkan sumber dan alasan ilmiah mengapa penelitian ulang tersebut perlu dilakukan.
b. Klasifikasi berdasarkan sengaja atau tidaknya plagiarisme
Plagiarisme sengaja adalah mencuri atau dengan sengaja menjiplak hasill karya
orang lain dengan kepentingannya sendiri. Hal ini dapat terjadi bila seseorang menjiplak ide, kata, frasa, kalimat atau pragraf tanpa mencantumkan sumbernya dan dilakukan dengan sadar untuk kepentingan sendiri.
Plagiarisme tidak disengaja adalah plagiarisme yang terjadi karena ketidaktahuan.
Ketidaktahuan ini biasa terjadi dalam menggunakan dokumentasi, teknik mengutip karya tulis, dan parafrase kalimat yang keliru. Meskipun plagirisme tidak disengaja namun sanksi yang dikenakan sama seperti plagiarisme yang disengaja. Hal tersebut dapat dicegah dengan menunjukan bagaimana menghindari plagiarisme.
c. Klasifikasi berdasarkan proporsi atau persentase kata, kalimat, paragraf yang dibajak
1. Plagiarisme ringan, plagiarisme yang jumlah poporsi atau persentase kata, kalimat, paragraf yang dibajak tidak melebihi 30 persen (< 30%).
2. Plagiarisme sedang, plagiarisme yang jumlah poporsi atau persentase kata, kalimat, paragraf yang dibajak antara 30-70 persen.
3. Plagiarisme berat, plagiarisme yang jumlah poporsi atau persentase kata, kalimat, paragraf yang dibajak lebih dari 70 persen (>70%).
d. Berdasarkan pada pola plagiarisme
Berdasarkan pada pola plagiarisme dibedakan menjadi dua yaitu plagiarisme kata demi kata (word for word plagiarizing) dan plagiarisme mosaik. Plagiarisme kata demi kata (word for word plagiarizing) adalah pola plagiarisme dengan melakukan penjiplakan sebagian kecil kalimat, dapat juga satu paragraf, atau seluruh isi meskipun di tulis dengan bahasa lain. Sedangkan plagiarisme mosaik adalah penyajian tidak dilakukan kata demi kata, tapi menyipkan kata atau frase dari beberapa karya orang lain tanpa menuliskan sumbernya sehingga memberi kesan kalimat tersebut adalah asli penulis.
2.2. Source Code
Dalam bahasa pemrograman, kita mengenal adanya Source Code, Dalam ilmu komputer, source code (atau disebut juga source) adalah kumpulan pernyataan atau deklarasi bahasa pemrogramman komputer yang ditulis dan dapat di baca manusia. Source Code memungkinkan programmer untuk berkomunikasi dengan komputer menggunakan beberapa perintah yang telah terdefinisi.
Source code merupakan sebuah program yang biasanya dibuat dalam satu
atau lebih file teks, kadang-kadang disimpan dalam database yang disimpan sebagai prosedur dan dapat juga muncul sebagai potongan kode yang tercetak di buku atau media lainnya. Banyaknya koleksi file source code dapat diatur dalam direktori pohon, dalam hal ini mungkin juga dikenal sebagai source tree.
Executable Binary atau yang lebih dikenal dengan Executable-code adalah
kode yang bisa dieksekusi oleh komputer sedangkan source code tidak dapat dieksekusi oleh komputer. Sedangkan intermediate-code (kode antara) merupakan bentuk yang terletak diantara source-code dan executable-code (Arifin, 2011).
2.3. Analisis Leksikal
Menurut Henryw (2014) analisis leksikal merupakan fungsi analisis dalam
compiler yang bertugas mendekomposisi program sumber menjadi bagian-bagian
kecil (token). Analisis leksikal atau scanner bertugas mengidentifikasi semua besaran pembangun bahasa (leksikal) yang ada pada source code. Scanner menerima masukan source code berupa serangkaian karakter kemudian memilah-milahnya menjadi bagian-bagian kecil yang mempunyai satu arti yang disebut
token, seperti : konstanta, nama variabel, keyword, operator. Token-token ini akan
menjadi masukan bagi analisis selanjutnya yaitu analisis sintaksis. Dari fungsi scanner secara umum seperti telah disebutkan di atas, maka tugas
scanner secara rinci adalah:
1. Membaca serangkaian karakter dari source code. 2. Mengenalinya ke dalam satuan leksikal.
3. Mengubahnya menjadi token dan menentukan jenis tokennya.
5. Mengabaikan karakter white space (spasi, enter, ganti baris, penanda akhir
file) dan komentar (remark) apabila ada di dalam source code.
6. Menangani error. 7. Menangani tabel simbol
Scanner bekerja berdasarkan prinsip mesin Finite State Automata (FSA).
Diagram keadaan dapat digunakan untuk membantu mengkonstruksi scanner. Besaran pembangun bahasa (leksikal) meliputi:
1. Identifier
Identifier atau pengenal dapat berupa:
a. Kata tercadang atau kata kunci (reserve word) yang telah didefinisikan oleh bahasa pemrograman.
b. Kata yang dideklarasikan sendiri oleh pemakai (si pembuat program) disebut dengan variabel.
2. Nilai konstanta
Nilai konstanta disini dapat berupa: integer, real, boolean, character, String, dan sebagainya.
3. Operator dan Delimineter a. Operator aritmatika ( +, -, *, /
b. Operator logika (<, =, >, <=, >=, !=, <>)
c. Delimiter berguna sebagai pemisah atau pembatas, contoh: d. Karakter sebagai berikut ( ) { } ; . , :
e. Karakter white space.
2.3.1. Tipe-Tipe Token
Berikut ini contoh tipe-tipe token yang digunakan pada saat proses analisis leksikal pada bahasa java :
Tabel 2.1 Tipe-Tipe Token
No Token Tipe Token ID Token
1 class,abstract, assert, break, const, boolean, byte, case, catch, char, continue, default, do, double, else,
enum, extends, final, finally, float, for, goto, if, implements, import, instance of, int, interface, long,
native, new, package, private,
protected, public, return, short, static, super, switch, synchronized, String, strictfp, this, throw, throws, transient, try, void, volatile, false, true, null, while
2 Variabel Identifier ID 3 ; Semicolon SM 4 + Plus Operator PO 5 - Minus Operator MO 6 * Multiplication Operator TO 7 , Comma FA 8 ( Left parenthesis LP 9 ) Right Parenthesis RP 10 { Left Brace LB 11 } Right Brace RB 12 [ Left Square LS 13 ] Right Square RS 14 < Less Than LT 15 > Greater Than GT 16 . Dot DT 17 % Modulus MD 18 1,2,3,4,5,6,7,8,9,0 Numeric NM 19 == Equals EQ 20 = Equals Operator AO 21 != Not Equals NE
23 | atau || Logical OR LO
24 A-Z / a-z String ST
25 / Division Operator DO
2.3.2. Tahap Analisis Leksikal
Pada tahap analisa terjadi interaksi antara scanner dan parser. Scanner dipanggil saat parser memerlukan token berikutnya. Pendekatan ini lebih baik karena bentuk internal program sumber yang lengkap tidak perlu dibangun dan disimpan di memori sebelum parsing dimulai (Henryw, 2014).
2.3.3. Implementasi Analisis Leksikal
Berikut ini contoh analisis leksikal (scanner) pada potongan program menggunakan bahasa java :
Setelah listing program tersebut diproses menggunakan analisis leksikal maka akan menjadi seperti berikut :
KW public AO = DT . KW void NM 0 ID out ID main SM ; DT . LP ( ID j ID println KW String LT < LP ( LS [ AO = ST "Helo world.." RS ] NM 5 RP ) ID args SM ; SM ; RP ) ID j RB } LB { PO + RB } KW for PO + LP ( RP ) KW int LB { ID j ID System 2.4. Pemrograman Java
Java adalah sebuah bahasa pemrograman yang dikembangkan sebagai komponen
utama platform Java oleh Sun MicroSystems dan diluncurkan pada tahun 1995. Bahasa ini banyak mengadopsi sintaksis yang terdapat pada C dan C++ namun dengan sintaksis model objek yang lebih sederhana serta dukungan rutin-rutin aras bawah yang minimal. Aplikasi-aplikasi berbasis java umumnya
public void main(String[]args){ for(int j=0;j<=5;j++){
System.out.println("Helo world.."); }
dikompilasi ke dalam p-code (bytecode) dan dapat dijalankan pada berbagai Java
Virtual Machine (JVM). Java merupakan bahasa pemrograman yang bersifat
umum/non-spesifik (general purpose), dan secara khusus didisain untuk memanfaatkan dependensi implementasi seminimal mungkin. Karena fungsionalitasnya yang memungkinkan aplikasi java mampu berjalan di beberapa platform sistem operasi yang berbeda, java dikenal pula dengan slogannya, "Tulis sekali, jalankan di mana pun". Saat ini java merupakan bahasa pemrograman yang paling populer digunakan, dan secara luas dimanfaatkan dalam pengembangan berbagai jenis perangkat lunak aplikasi ataupun aplikasi berbasis web.
Versi awal Java ditahun 1996 sudah merupakan versi release sehingga dinamakan Java Versi 1.0. Java versi ini menyertakan banyak paket standar awal yang terus dikembangkan pada versi selanjutnya:
1. java.lang: Peruntukan kelas elemen-elemen dasar.
2. java.io: Peruntukan kelas input dan output, termasuk penggunaan berkas. 3. java.util: Peruntukan kelas pelengkap seperti kelas struktur data dan
kelaskelas penanggalan.
4. java.net: Peruntukan kelas TCP/IP, yang memungkinkan berkomunikasi dengan komputer lain menggunakan jaringan TCP/IP.
5. java.awt: Kelas dasar untuk aplikasi antarmuka dengan pengguna (GUI) 6. java.applet: Kelas dasar aplikasi antar muka untuk diterapkan pada penjelajah 2.5. Netbeans
Netbeans adalah salah satu aplikasi IDE yang digunakan programmer
untuk menulis, mengompile, mencari kesalahan, dan menyebarkan program.
Netbeans ditulis dalam bahasa java namun dapat juga mendukung Bahasa
pemrogramman lain (Miftahul, 2010).
1. Smart code completion: mengusulkan nama variabel dari suatu tipe,melengkapi
keyword, dan mengusulkan tipe parameter dari method
2. Menggunakan code generator: dengan menggunakan fitur ini kita
dapatmeng-generate constructor, setter and getter method, dll.
4. Bookmarking: fitur yang digunakan untuk menandai baris yang suatu saat hendak kita modifikasi.
5. Go to commands: fitur yang digunakan untuk jump ke deklarasi variable,Source Code atau file yang ada pada project yang sama.
Database yang didukung Netbeans
a. JDBC merupakan spesifikasi standar dari javasoft API yang memungkinkan program java untuk mengakses sistem database manajemen.
b. JDBC API terdiri dari satu set interface dan kelas yang ditulis dengan bahasa pemrogramman java.
c. OJDBC (oracle java database conectivity) adalah driver yangmenghubungkan program java dan oracle.
d. mysql-connector-java adalah driver yang menghubungkan program java dan
mysql
e. JDBC-ODBC f. mySQL-server
2.6. Perancangan Sistem
2.6.1. Pengertian UML (Unified Modeling Language)
UML (Unified Modeling Language) adalah ‘bahasa’ pemodelan untuk sistem atau perangkat lunak yang berparadigma ‘berorientasi objek”. Pemodelan (modeling) sesungguhnya digunakan untuk penyederhanaan permasalahan-permasalahan yang kompleks sedemikian rupa sehingga lebih mudah dipelajari dan dipahami( Rosa & Shalahuddin, 2013)
Unified Modeling Language adalah metodologi kolaborasi antara
metode-metode Booch, OMT (Object Modeling Technique), serta OOSE (ObjectOriented
Software Enggineering) dan beberapa metoda lainnya, merupakan metodologi
yang paling sering digunakan saat ini untuk analisa dan perancangan sistem dengan metodologi berorientasi objek mengadaptasi maraknya penggunaan bahasa pemrograman berorientasi objek (OOP).
Berdasarkan pendapat yang dikemukakan sebelumnya, dapat ditarik kesimpulan bahwa Unified Modelling Language(UML) adalah sebuah bahasa
yang berdasarkan grafik atau gambar untuk menvisualisasikan, menspesifikasikan, membangun dan pendokumentasian dari sebuah sistem pengembangan perangkat lunak berbasis Objek (Object Oriented programming).
2.6.2. Bangunan Dasar Metodologi Unified Modeling Language (UML) Bangunan dasar metodologi Unified Modeling Language (UML) menggunakan tiga bangunan dasar untuk mendeskripsikan sistem/perangkat lunak yang akan dikembangkan yaitu:
1. Sesuatu (things)
Ada 4 things dalam Unified Modeling Language (UML), yaitu: a. Structural things
Merupakan bagian yang relatif statis dalam model Unified Modeling Language (UML). Bagian yang relatif statis dapat berupa elemen-elemen yang bersifat fisik maupun konseptual.
b. Behavioral things
Merupakan bagian yang dinamis pada model Unified Modeling Language (UML), biasanya merupakan kata kerja dari model Unified Modeling Language (UML), yang mencerminkan perilaku sepanjang ruang dan waktu.
c. Grouping things
Merupakan bagian pengorganisasi dalam Unified Modeling Language (UML). Dalam penggambaran model yang rumit kadang diperlukan penggambaran paket yang menyederhanakan model. Paket-paket ini kemudian dapat didekomposisi lebih lanjut. Paket berguna bagi pengelompokkan sesuatu, misalnya model-model dan subsistem.
d. Annotational things
Merupakan bagian yang memperjelas model Unified Modeling Language (UML) dan dapat berupa komentar-komentar yang menjelaskan fungsi serta ciri-ciri setiap elemen dalam model Unified Modeling Language (UML) .
2. Relasi (Relationship)
Ada 4 (empat) macam relationship dalam Unified Modeling Language (UML), yaitu:
a. Kebergantungan
Merupakan hubungan dimana perubahan yang terjadi pada suatu elemen mandiri (independent) akan mempengaruhi elemen yang bergantung pada elemen yang tidak mandiri (independent).
b. Asosiasi
Merupakan apa yang menghubungkan antara objek satu dengan objek lainnya, bagaimana hubungan suatu objek dengan objek lainnya. Suatu bentuk asosiasi adalah agregasi yang menampilkan hubungan suatu objek dengan bagian-bagiannya.
c. Generalisasi
Merupakan hubungan dimana objek anak (descendent) berbagi perilaku dan struktur data dari objek yang ada diatasnya objek induk (ancestor). Arah dari atas kebawah dari objek induk ke objek anak dinamakan spesialisasi, sedangkan arah berlawanan sebaliknya dari arah bawah keatas dinamakan generalisasi.
d. Realisasi
Merupakan operasi yang benar-benar dilakukan oleh suatu objek. 3. Diagram
Ada berbagai macam diagram dalam Unified Modeling Language (UML), yaitu: a. Diagram Usecase b. Diagram Class c. Diagram Package d. Diagram Sequence e. Diagram Collaboration f. Diagram StateChart g. Diagram Activity h. Diagram Deployment
UML yang akan digunakan yaitu diagram usecase, sequence dan activity. 1. Diagram Usecase
Diagram usecase menggambarkan fungsionalitas yang diharapkan dari sebuah sistem. Pada diagaram ini yang ditekankan adalah “apa” yang diperbuat
sistem dan bukan “bagaimana”. Menggambarkan kebutuhan sistem dari sudut pandang user.Mengfokuskan pada proses komputerisasi (automated processes). Menggambarkan hubungan antara Usecase dan actor Usecase menggambarkan proses sistem (kebutuhan sistem dari sudut pandang user).
Tabel 2.2 Simbol usecase diagram
Simbol Deskripsi
Aktor, mewakili peran orang sistem yang lain atau alat ketika berkomunikasi dengan usecase
Usecase abstraksi dari interaksi antara
sistem dan actor
Association adalah abstraksi dari
penghubung antara actor dan usecase
<<include>>
Menunjukan bahwa suatu usecase
seluruhnya merupakan fungsionalitas dari usecase lainnya
<<extend>>
Menunjukan bahwa suatu usecase
merupakan tambahan fungsionalitas dari
usecase lainnya
Genealisasi, menunjukan spesialisasi
actor untuk dapat berpartisipasi dalam usecase
(Sumber : Rosa A.S & M.Shalahuddin, 2013) 2. Diagram Sequence
Diagram ini memperlihatkan interaksi yang menekankan pada pengiriman pesan (message) dalam suatu waktu tertentu.Diagram squence biasa digunakan untuk menggambarkan skenario atau rangkaian langkah-langkah yang dilakukan sebagai respons dari sebuah event untuk menghasilkan output tertentu.
Nama use case Aktor
Tabel 2.3 Simbol diagram squence
Simbol Nama Deskripsi
LifeLine
Objek entity, antarmuka yang saling berinteraksi.
Message
Spesifikasi dari komunikasi antar objek yang memuat informasi-informasi tentang aktifitas yang terjadi
Message
Spesifikasi dari komunikasi antar objek yang memuat informasi-informasi tentang aktifitas yang terjadi
(Sumber : Rosa A.S & M.Shalahuddin, 2013) 3. Diagram Activity
Diagram Activity memodelkan workflow proses dan urutan aktivitas
dalam sebuah proses. Diagram ini sangat mirip dengan flowchart karena memodelkan workflow dari satu aktivitas ke aktivitas lainnya atau dari aktivitas ke status. Menguntungkan untuk membuat Diagram Activity pada awal pemodelan proses untuk membantu memahami keseluruhan proses. Diagram
Activity juga bermanfaat untuk menggambarkan parallel behaviour atau
menggambarkan interaksi antara beberapa usecase.
Tabel 2.4 Simbol Diagram Activity
Simbol Deskripsi
Titik awal
Titik akhir
Pilihan untuk mengambil keputusan dan mengakhiri kondisi
Fork &Join; untuk menunjukan
kegiatan yang dilakukan secara paralel dan digabungkan kembali
(Sumber : Rosa A.S & M.Shalahuddin, 2013) 2.6.3. Tujuan Penggunaan UML
Tujuan Penggunaan Unified Modeling Language (UML) adalah :
1. Memberikan bahasa pemodelan yang bebas dari berbagai bahasa pemrograman dan proses rekayasa.
2. Menyatukan praktek-praktek terbaik yang terdapat dalam pemodelan.
3. Memberikan model yang siap pakai, bahsa pemodelan visual yang ekspresif untuk mengembangkan dan saling menukar model dengan mudah dan dimengerti secara umum.
4. UML bisa juga berfungsi sebagai sebuah (blue print) cetak biru karena sangat lengkap dan detail. Dengan cetak biru ini maka akan bias diketahui informasi secara detail tentang coding program atau bahkan membaca program dan menginterpretasikan kembali ke dalam bentuk diagram (reserve enginering). 2.7. Flowchart
Algoritma merupakan suatu alur pemikiran seseorang yang harus dapat dituangkan secara tertulis. Salah satu caranya adalah dengan menggunakan simbol-simbol yang memang sudah standar pada dunia komputer. Simbol itu disebut dengan flowchart (Antonius, 2010). Dengan menggunakan flowchart (diagram alir) maka seseorang programmer dapat memberikan idenya secara tertulis sehingga dapat dipahami oleh programmer lain, oleh klien, atau oleh tim kerjanya.
Flowchart merupakan alur pemikiran yang dituangkan ke dalam bentuk
simbol. Dengan demikian perlu dipelajari terlebih dahulu bentuk-bentuk simbol standar beserta kegunaan masing-masing. Berikut adalah tabel simbol-simbol
Tabel 2.5 Simbol flowchart Simbol Deskripsi Mulai Selesai Aliran data Proses / kejadian Percabangan Input Output (Sumber : Antonius , 2010) Start Finish X = y + z X > 2 Masukan data Tampilkan data
21
BAB III
METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian 3.1.1 Waktu Penelitian
Waktu pelaksanaan penelitian tugas akhir dilaksanakan mulai dari bulan Februari 2016. Rincian kegiatan dapat dilihat pada tabel 3.1.
Tabel 3.1 Waktu penelitian
N o Uraian Tahun 2016 Februari (Minggu ke-) Maret (Minggu ke-) April (Minggu ke-) 1 2 3 4 1 2 3 4 1 2 1 Studi Literatur 2 Analisis 3 Desain 4 Pembuatan Program 5 Pengujian 6 Pemeliharaan 3.1.2 Tempat Penelitian
Penelitian tugas akhir ini bertempat di Laboraturium Rekayasa Perangkat Lunak Fakultas Teknik Universitas Halu Oleo
3.2 Metode Pengumpulan Data
Beberapa metode yang digunakan dalam pengumpulan data adalah sebagai berikut:
1. Wawancara (Interview)
Pengumpulan data dengan wawancara ini dilakukan untuk mencari data dan informasi tentang hal-hal yang dibutuhkan dalam penelitian. Wawancara dilakukan dengan dosen yang bertanggung jawab pada Laboraturium Perangkat
Lunak untuk mendapatkan informasi yang berhubungan dengan pengaambilan sample yang akan dilakukan.
2. Studi Literatur
Guna mendapatkan data, gambaran dan keterangan yang lebih lengkap peneliti menggunakan studi literatur dengan cara mengumpulkan dan mempelajari literatur yang berkaitan dengan teori sistem perancangan aplikasi kesamaan
Source Code pada bahasa pemrograman java dan metode leksikal. Sumber
literatur berupa paper, jurnal, karya ilmiah, dan situs-situs penunjang. 3. Sampling
Pada tahap ini peneliti membutuhkan suatu sampel data yang berupa file
project dari tugas mahasiswa yang melakukan praktikum di Laboraturium
Rekayasa Perangkat Lunak sebagai bahan uji coba pada aplikasi Deteksi Kemiripan Source Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal.
3.3 Metode Pengembangan Sistem
Metode pengembangan perangkat lunak yang digunakan dalam pembangunan sistem ini adalah metode Waterfall yang terdiri dari beberapa tahap yaitu :
1. Studi Literatur
Tahap pertama yang dilakukan peneliti yaitu mengumpulkan data, gambaran dan keterangan yang lebih lengkap dalam penelitian ini dengan cara mengumpulkan dan mempelajari literatur yang berkaitan dengan judul penelitian. Yang bersumber dari buku teks, paper, jurnal, karya ilmiah, dan situs-situs penunjang lainnya.
2. Analisis
Tahap analisis adalah tahap dimana peneliti menganalisis permasalahan yang ada yaitu kriteria-kiteria dan persyaratan penerimaan peserta didik baru dan melakukan perhitungan.
3. Desain
Pada tahap desain merupakan tahap peneliti merancang pembuatan tampilan awal atau interface dari aplikasi yang akan dibangun. Tampilan interface akan dirancang melalui data-data yang telah diperoleh pada saat tahap analisis. 4. Pembuatan Program
Pada tahap pengkodean yaitu menerjemahkan aplikasi kedalam bahasa pemrograman yang telah ditentukan yaitu bahasa pemograman Java.
5. Pengujian
Merupakan tahap pengujian terhadap aplikasi yang telah dibuat menjadi suatu perangkat lunak yang siap pakai dengan tujuan apakah sistem yang sudah jadi sudah sesuai dengan yang diharapkan.
6. Pemeliharaan
Pada tahap pemeliharan yaitu tahap dimana melakukan koreksi dari berbagai error yang tidak ditemukam pada tahap-tahap sebelumnya sehingga dapat dilakukan perbaikan, agar dapat menghasilkan sistem yang lebih baik dari sebelumnya.
24 BAB IV
ANALISIS DAN PERANCANGAN SISTEM
4.1. Analisis Sistem
4.1.1. Sistem yang Sedang Berjalan
Laboratorium Rekayasa Perangkat Lunak Jurusan Teknik Informatika Universitas Halu Oleo saat ini belum memiliki sistem yang dapat mendeteksi kemiripan source code untuk memeriksa adanya tindakan plagiat secara otomatis berbasis aplikasi komputer. Sistem yang sedang berjalan saat ini dalam mendeteksi kemiripan source code dilakukan secara manual, dimana Dosen atau Asisten laboratorium harus memeriksa satu persatu file source code yang diperiksa. Pendeteksian secara manual selain membutuhkan waktu yang lama juga tingkat ketelitiannya masih kurang. Hal ini disebabkan faktor ketelitian manusia berbeda dengan komputer.
4.1.2. Sistem yang Diusulkan
Sistem yang diusulkan dalam pedeteksi kemiripan source code adalah sistem yang dilakukan secara otomatis. Aplikasi proses pendeteksi kemiripan
source code yang diusulkan ini menggunakan metode Analisis Leksikal. File yang
diperiksa dalam sistem ini adalah file class yang berekstensi .java. User memasukan dua buah file dimana file pertama merupakan file pembanding dan file kedua merupakan file yang akan diperiksa kemiripannya. Keluaran dari sistem ini adalah presentase tingkat kemiripan isi source code. Setelah user memasukan kedua file yang akan diperiksa maka sistem akan melakukan tahap analisis. Untuk melihat persentasi kemiripan user memilih menu scanning, maka presentase kemiripan akan tampil.
4.2. Perancangan Sistem 4.2.1. Diagram Usecase
Gambar 4.1 Diagram Usecase
Pada diagram Usecase, pengguna dapat mengakses form utama, membuka
file, melakukan scanning, mengakses menu Help.
4.2.2. Diagram Activity
1. Diagram Activity menu Scanning
Pada diagram activity scanning, user dapat membuka dua file yang akan dibandingkan. Setelah user memilih file yang akan dibandingkan user dapat memilih menu scanning untuk mengetahui presentase dari hasil perbandingan dari kedua file tersebut.
Gambar 4.2 Diagram Activity Menu Scanning
2. Diagram Activity submenu Open File
Pada diagram activity menu Open File, user mengakses aplikasi, kemudian sistem menampilkan halaman utama, lalu user memilih menu Open File, sistem kemudian menampilkan dialog open file. Seperti dijelaskan pada gambar 3.2 berikut.
3. Diagram Activity menu Help
Pada menu Help user dapat membaca tutorial penggunaan aplikasi dengan cara pilih menu Help kemudian pilih sumenu Help
Gambar 4.4 Diagram Activity Menu Help
4.2.3. Diagram Sequence
1. Diagram Sequence Menu Scanning
Pada diagram Sequence dapat dilihat setelah user melakukan input file maka sistem akan membaca dan akan menampilkan isi dari file tersebut. Setelah itu sistem akan melakukan proses analisis leksikal. Setelah user memilih submenu scanning, sistem akan melakukan pencocokan token berdasarkan posisi array dan
menghitung jumlah kemiripan sehingga akan keluar hasil presentase nilai
similarity atau kemiripan source code dan waktu proses yang dibutuhkan.
Gambar 4.5 Diagram Sequences submenu scanning
4.3. Analisis Kebutuhan Sistem 4.3.1. Kebutuhan Data Masukan
Untuk data masukan yang dibutuhkan dari sistem ini adalah adanya file
class java yang akan dihitung presentase kemiripannya minimal dua buah file class, selanjutnya sistem akan menggunakan metode analisis leksikal dan
pencocokan string untuk menghasilkan output.
4.3.2. Kebutuhan Data Keluaran
Data keluaran dari sistem yang telah di proses untuk kemudian ditampilkan kepada pengguna sistem yaitu presentase nilai kemiripan dan kesimpulan dari hasil presentase apakah file tersebut merupakan plagiat atau bukan.
4.4. Flowchart
Flowchart dari proses sistem yang dilakukan secara keseluruhan dapat
dijelaskan seperti gambar berikut:
4.5. Peracangan Antar Muka (Interface)
Perancangan antar muka (interface) merupakan perancangan untuk melihat desain awal dari sebuah sistem. Berikut adalah perancangan sistem interface dari peracangan aplikasi pendeteksi kemiripan source code.
Gambar 4.7 Desain interface aplikasi
Gambar diatas merupakan rancangan desain dari halaman utama aplikasi yang terdiri dari tiga meu, yaitu: file, process dan help. Pada menu File terdiri submenu Open Source 1 dan Open Source 2 yang berfungsi untuk menginsert file dan exit. Pada menu Process terdiri submenu Scanning yang berfungsi untuk mencocokan kedua file Source code yang akan dibandingkan, show analisis untuk menampilkan hasil analisis, show similar untuk menampilkan token-token yang mempunyai kemiripan, show not similar untuk menampilkan token-token yang tidak sama dan reset untuk merefresh halaman utama ke default. Pada menu Help merupakan batuan tentang bagaimana menjalankan aplikasi. Terdiri dari submenu help dan about.
4.6. Ilustrasi Metode Analisis Leksikal Terhadap Perencanaan Aplikasi 4.6.1. Analisis Leksikal
Tahap ini merupakan tahap awal sebelum dilakukan perhitungan kemiripan kedua source code yang akan diperiksa. Setelah source code dimasukan
maka sistem otomatis akan mentransformasikan source code tersebut kedalam bentuk token berdasarkan id masing-masing tipe. Untuk daftar tipe-tipe token dapat dilihat pada tabel tipe token pada bab sebelumnnya.
Berikut contoh analisis leksikal pada dua buah source code yang akan diperiksa kemiripannya.
1. Source Asli
Gambar 4.8 source asli
Setelah dilakukan analisis leksikal maka source asli akan berbentuk seperti tabel 4.1
Tabel 4.1 Hasil Analisis Leksikal Source Asli. ID Token Token ID Token Token ID Token Token KW package LP ( SM ;
ID contoh ST "Mobil maju sejauh " RB }
SM ; PO + KW public
KW public ID maju KW static
KW class PO + KW void
ID Mobil ST " meter" ID main
LB { RP ) LP (
KW String SM ; KW String
ID warna RB } LS [
SM ; KW public RS ]
KW int KW void ID args
ID jumlah_pintu ID Mundur RP )
SM ; LP ( LB {
KW float KW int ID Mobil
ID isi_tangki ID mundur ID BMW
SM ; RP ) AO =
KW public LB { KW new
KW void KW int ID Mobil
ID Maju ID mundurbelakang LP ( LP ( AO = RP ) KW int NM 0 SM ; ID maju SM ; ID BMW RP ) ID mundurbelakang DT . LB { AO = ID Maju KW int ID mundurbelakang LP ( ID majukedepan PO + NM 75 AO = ID mundur RP ) NM 0 SM ; SM ; SM ; ID System ID BMW ID majukedepan DT . DT . AO = ID out ID Mundur ID majukedepan DT . LP ( PO + ID println NM 5 ID maju LP ( RP )
SM ; ST "Mobil mundur sejauh " SM ; ID System PO + RB } DT . ID mundur RB } ID out PO + DT . ST " meter" ID println RP ) 2. Source Pembanding
Gambar 4.9 Source Pembanding
Setelah dilakukan analisis leksikal maka source pembanding ini akan berbentuk seperti tabel 4.2
Tabel 4.2 Hasil Analisis Source Pembanding ID Token Token ID Token Token ID Token Token KW package LP ( SM ;
ID contoh2 ST "Mobil maju sejauh " RB }
SM ; PO + KW public
KW public ID maju KW static
KW class PO + KW void
ID Mobil2 ST " meter" ID main
LB { RP ) LP (
KW String SM ; KW String
ID warna RB } LS [
SM ; KW public RS ]
KW int KW void ID args
ID jumlah_pintu ID Mundur RP )
SM ; LP ( LB {
KW float KW int ID Mobil
ID isi_tangki ID mundur ID BMW
SM ; RP ) AO =
KW public LB { KW new
KW void KW int ID Mobil
ID Maju ID mundurbelakang LP ( LP ( AO = RP ) KW int NM 0 SM ; ID maju SM ; ID BMW RP ) ID mundurbelakang DT . LB { AO = ID Maju KW int ID mundurbelakang LP ( ID majukedepan PO + NM 75 AO = ID mundur RP ) NM 0 SM ; SM ; SM ; ID System ID BMW ID majukedepan DT . DT . AO = ID out ID Mundur ID majukedepan DT . LP ( PO + ID println NM 5 ID maju LP ( RP )
SM ; ST "Mobil mundur sejauh " SM ; ID System PO + RB } DT . ID mundur RB } ID out PO + DT . ST " meter" ID println RP ) 4.6.2. Sorting
Proses ini merupakan proses mengurutkan token-token yang terbentuk dari kedua source code yang diperiksa menurut abjad. Proses ini dilakukan dengan tujuan supaya jika terdapat source code yang sama tetapi terdapat fungsi atau prosedure yang sama pada posisi yang berbeda tetap akan terdeteksi.
Setelah kedua source code diurutkan, maka masing-masing akan berbentuk sebagai berikut.
1. Source Asli
Tabel 4.3. Hasil Sorting Source Asli
ID Token Token ID Token Token ID Token Token AO = ID println NM 75 AO = ID println PO + AO = ID System PO + AO = ID System PO + AO = ID warna PO + DT . KW class PO + DT . KW float PO + DT . KW int RB } DT . KW int RB } DT . KW int RB } DT . KW int RB } ID args KW int RP ) ID BMW KW new RP ) ID BMW KW package RP ) ID BMW KW public RP ) ID contoh KW public RP ) ID isi_tangki KW public RP )
ID jumlah_pintu KW public RP ) ID main KW static RP ) ID maju KW String RS ] ID maju KW String SM ; ID maju KW void SM ; ID Maju KW void SM ; ID Maju KW void SM ; ID majukedepan LB { SM ; ID majukedepan LB { SM ; ID majukedepan LB { SM ; ID Mobil LB { SM ; ID Mobil LP ( SM ; ID Mobil LP ( SM ; ID mundur LP ( SM ; ID mundur LP ( SM ; ID mundur LP ( SM ; ID Mundur LP ( ST " meter" ID Mundur LP ( ST " meter" ID mundurbelakang LP ( ST "Mobil maju sejauh " ID mundurbelakang LS [ ST "Mobil mundur sejauh " ID mundurbelakang NM 0 ID out NM 0 ID out NM 5 2. Source Pembanding
Tabel 4.4. Hasil Sorting Source Pembanding
ID Token Token ID Token Token ID Token Token AO = ID println NM 75 AO = ID println PO + AO = ID System PO + AO = ID System PO + AO = ID warna PO + DT . KW class PO +
DT . KW float PO + DT . KW int RB } DT . KW int RB } DT . KW int RB } DT . KW int RB } ID args KW int RP ) ID BMW KW new RP ) ID BMW KW package RP ) ID BMW KW public RP ) ID contoh2 KW public RP ) ID isi_tangki KW public RP ) ID jumlah_pintu KW public RP ) ID main KW static RP ) ID maju KW String RS ] ID maju KW String SM ; ID maju KW void SM ; ID Maju KW void SM ; ID Maju KW void SM ; ID majukedepan LB { SM ; ID majukedepan LB { SM ; ID majukedepan LB { SM ; ID Mobil LB { SM ; ID Mobil2 LP ( SM ; ID Mobil LP ( SM ; ID mundur LP ( SM ; ID mundur LP ( SM ; ID mundur LP ( SM ; ID Mundur LP ( ST " meter" ID Mundur LP ( ST " meter" ID mundurbelakang LP ( ST "Mobil maju sejauh " ID mundurbelakang LS [ ST "Mobil mundur sejauh " ID mundurbelakang NM 0 ID out NM 0 ID out NM 5
4.6.3. Perhitungan Nilai Kemiripan
Setelah kedua source code berbentuk token dan token-token telah terurut, maka proses selanjutnya adalah perhitungan nilai kemiripan kedua source menggunakan array. Panjang array sesuai dengan panjang token yang terbentuk. Pada contoh diatas panjang token adalah 117.
Metode perhitungan kemiripan ini didasarkan atas posisi dan isi dari token tersebut. Jika pada posisi array ke-0 di cocokan dengan posisi array ke-0 pada source kedua sama, baik id token dan isi dari token maka program akan mencatat sebagi satu kemiripan. Kemdian program akan melanjutkan pada posisi array selanjutnya sampai posisi terakhir pada array.
Jika panjang array pada kedua source berbeda dikarenakan banyaknya token yang terbentuk pada kedua source berbeda, maka pencocokan diberhentikan pada nilai array yang terpendek dan sisanya dianggap sebagai ketidaksamaan.
Berikut ilustrasi perhitungan nilai kemiripan menggunakan array pada kedua source code yang telah berbentuk token.
Source Asli Source Pembanding
AO = sama AO = AO = sama AO = AO = sama AO = AO = sama AO = AO = sama AO = DT . sama DT . DT . sama DT . DT . sama DT . DT . sama DT . DT . sama DT . DT . sama DT .
ID args sama ID args
ID BMW sama ID BMW
ID BMW sama ID BMW
ID contoh beda ID contoh2
ID isi_tangki sama ID isi_tangki
ID jumlah_pintu sama ID jumlah_pintu
ID main sama ID main
ID maju sama ID maju
ID maju sama ID maju
ID maju sama ID maju
ID Maju sama ID Maju
ID Maju sama ID Maju
ID majukedepan sama ID majukedepan
ID majukedepan sama ID majukedepan
ID majukedepan sama ID majukedepan
ID Mobil sama ID Mobil
ID Mobil sama ID Mobil
ID Mobil beda ID Mobil2
ID mundur sama ID mundur
ID mundur sama ID mundur
ID mundur sama ID mundur
ID Mundur sama ID Mundur
ID Mundur sama ID Mundur
ID mundurbelakang sama ID mundurbelakang
ID mundurbelakang sama ID mundurbelakang
ID mundurbelakang sama ID mundurbelakang
ID out sama ID out
ID out sama ID out
ID println sama ID println
ID println sama ID println
ID System sama ID System
ID Warna sama ID Warna
KW class sama KW class
KW float sama KW float
KW int sama KW int
KW int sama KW int
KW int sama KW int
KW int sama KW int
KW int sama KW int
KW new sama KW new
KW package sama KW package
KW public sama KW public
KW public sama KW public
KW public sama KW public
KW public sama KW public
KW static sama KW static
KW String sama KW String
KW String sama KW String
KW void sama KW void
KW void sama KW void
KW void sama KW void
LB { sama LB { LB { sama LB { LB { sama LB { LB { sama LB { LP ( sama LP ( LP ( sama LP ( LP ( sama LP ( LP ( sama LP ( LP ( sama LP (
LP ( sama LP ( LP ( sama LP ( LS [ sama LS [ NM 0 sama NM 0 NM 0 sama NM 0 NM 5 sama NM 5 NM 75 sama NM 75 PO + sama PO + PO + sama PO + PO + sama PO + PO + sama PO + PO + sama PO + PO + sama PO + RB } sama RB } RB } sama RB } RB } sama RB } RB } sama RB } RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RP ) sama RP ) RS ] sama RS ] SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ;
SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ; SM ; sama SM ;
ST " meter" sama ST " meter" ST " meter" sama ST " meter" ST "Mobil maju
sejauh "
sama ST "Mobil maju
sejauh " ST "Mobil mundur
sejauh "
sama ST "Mobil mundur
sejauh "
Pada ilustrasi diatas dapat kita lihat bahwa, dari kedua source yang diperiksa terdapat 115 jumlah kemiripan dan terdapat 2 perbedaan saja yang ditemukan. Sehingga dari data tersebut kita dapat menentukan nilai kemiripan dengan ketentuan:
Jumlah kesamaan = 115 Jumlah perbedaan = 2
Jumlah elemen objek = 117
= (115/117) x 100 %
Karena hasil dari perhitungan lebih besar dari 70%, maka source code tersebut dianggap sebagai plagiat.
44
BAB V
IMPLEMENTASI DAN PENGUJIAN SISTEM
5.1 Implementasi Sistem
Pada tahap ini merupakan tahap penerapan sistem pada keadaan yang sebenarnya agar dapat berfungsi sesuai kebutuhan, sehingga dapat diketahui apakah sistem yang dibuat sesuai dengan perancangan sebelumnya. Disini akan dijelaskan bagaimana sistem ini dengan memberikan contoh-contoh tampilan aplikasi yang terdapat pada aplikasi ini.
5.1.1 Interface aplikasi
Adapun interface dan preview dari aplikasi Deteksi Kemiripan Source Code Pada Bahasa Pemrograman Java Menggunakan Metode Analisis Leksikal adalah sebagai berikut :
1. Progress Bar
Tampilan ini merupakan tampilan progress bar yang berjalan ketika pertama kali aplikasi dijalankan.
Gambar 5.1. Tampilan progress bar 2. Tampilan Utama
Pada tampilan utama ini terdapat tiga menu yaitu menu file,process dan help. Pada menu file terdapat tiga submenu file yaitu open source 1,open source 2 dan
analysis, show similar, show not similar dan reset. Sedangkan pada menu help
terdapat dua submenu yaitu submenu help dan about.
Gambar 5.2 Tampilan utama a. Submenu Open source
Merupakan submenu untuk menginput source yang akan diperiksa. Submenu
open source 1 berfungsi menginput source pertama dan submenu open source 2
berfungsi untuk menginput source yang kedua kemudian source akan tampil pada masing-masing text editor. Setelah source telah dimasukan maka akan tampil properties dari kedua source berupa jumlah kata, jumlah simbol, jumlah angka, jumlah token dan letak source .
b. Submenu exit
Submenu ini berfungsi untuk keluar dari aplikasi
c. Submenu Scanning
Submenu ini berada pada menu Process, dimana submenu ini berfungsi untuk
mengetahui presentase kemiripan source code yang diperiksa. Setelah user memilih submenu scanning maka akan tampil Jumlah token yang sama, jumlah
token yang tidak sama, jumlah token yang diperiksa , presentase kemiripan,
d. Submenu Show analysis
Submenu ini berfungsi untuk menampilkan hasil analisis leksikal setelah user
menginput source yang akan diperiksa. Hasil analisis ini akan tampil pada text editor masing-masing source .
e. Submenu show similar
Merupakan submenu untuk melihat token-token mana saja yang memiliki kemiripan pada kedua source yang diperiksa
f. Submenu not similar
Merupakan submenu untuk menampilkan token-token yang tidak sama pada kedua
source.
g. Submenu reset
Submenu ini berfungsi untuk mereset tampilan utama ke default
h. Submenu Help
Submenu ini akan menampilkan bantuan atau panduan cara menggunakan aplikasi
dalam bentuk pdf.
i. Submenu About
Merupakan submenu untuk menampilkan informasi tentang aplikasi deteksi kemiripan source code ini.
5.2. Pengujian Sistem
5.2.1. Pengujian Fungsionalitas Aplikasi
Pengujian ini dilakukan untuk memeriksa apakah semua menu dan
submenu yang ada pada sistem dapat berfungsi dengan baik. Pengujian ini
dilakukan dengan memasukkan source code, scanning, menampilkan hasil analisis, menampilkan token yang mirip dan yang tidak mirip pada source code yang diperiksa serta menampilkan menu help dan about.
Gambar 5.3 Tampilan dialog open source
2. Setelah source code terinput maka pada menu utama akan tampil properties masing-masing source code yang berupa jumlah kata,jumlah simbol,jumlah angka dan total token yang terbentuk.
Gambar 5.4 Tampilan source code yang telah di input
3. Langkah selanjutnya yaitu melakukan proses scanning dengan menekan menu
process dan memilih submenu scanning. Setelah sistem selesai menscan kedua source maka akan tampil jumlah token yang sama, jumlah token yang tidak sama,
dalam bentuk radio button dan waktu yang diperlukan pada saat melakukan proses
scanning.
Gambar 5.5 Tampilan hasil scanning kemiripan
4. Menampilkan hasil analisis keseluruahan
5. Menampilkan token yang sama/mirip
Gambar 5.7 Menampilkan token yang sama
6. Menampilkan token yang tidak sama/tidak mirip
Gambar 5.8 Menampilkan token yang tidak sama
7. Langkah selanjutnya yaitu menguji menu help. Pilih menu help kemudian pilih
Gambar 5.9 Tampilan Help
8. Selanjutnya menu about
Gambar 5.10 Tampilan About 5.2.2. Hasil Analisa
Pada pengujian sistem yang dilakukan, sistem memeriksa dua source code yang masing-masing berjumlah 10 file class. Daftar file class yang di uji dapat di lihat pada tabel 5.1 dan tabel 5.2.
Tabel 5.1 Daftar Nama Class Source Asli NO SOURCE ASLI NAMA CLASS ∑ KATA ∑ SIMBOL ∑ANGKA TOTAL TOKEN 1 BilPrima.java 42 48 2 92 2 CekNilai.java 94 120 5 219 3 HitungLingkaran.java 47 47 2 96 4 test1.java 20 25 2 47 5 test3.java 25 31 2 58 6 test5.java 28 36 4 68 7 NilaiUjian.java 75 104 10 189 8 scanner.java 33 33 0 66 9 MembuatPolaXDiJava.java 59 88 3 154 10 Main.java 100 123 1 224
Tabel 5.2 Daftar Nama Class Source Pembanding
NO
SOURCE PEMBANDING
NAMA
CLASS ∑ KATA ∑ SIMBOL ∑ANGKA
TOTAL TOKEN 1 prima.java 46 49 2 97 2 nilai.java 94 120 5 219 3 Lingkaran.java 49 50 2 101 4 test2.java 20 25 2 47 5 test4.java 25 31 2 58 6 test6.java 29 36 4 69 7 nilaiujian.java 75 104 10 189 8 inputNama.java 33 33 0 66 9 NewMain2.java 60 87 3 154 10 Main.java 100 123 1 224
Untuk hasil analisa pengujian sistem terhadap kinerja algoritma dapat dilihat pada tabel 5.3.