ANALISIS DAN PERANCANGAN SISTEM
5.3 Pemodelan Fungsi
4.3.1 Data Flow Diagram (DFD)
Untuk membantu perancangan sistem digunakan DFD (Data Flow Diagram), yaitu pemodelan fungsi yang menggambarkan secara umum proses sistem yang terjadi dengan menggunakan notasi-notasi yang memperlihatkan dan mendefinisikan dengan jelas masukan dan keluaran data pada masing-masing proses. Model fungsional ini berfungsi membantu memahami cara kerja sistem dan hubungan setiap proses dalam sistem secara terstruktur dan logis.
Dengan mengidentifikasikan semua kesatuan luar yang terlibat dengan sistem dan semua masukan dan keluaran yang berhubungan dengan kesatuan luar, maka dapat dijelaskan bahwa input merupakan pilihan menu yang terdiri atas tiga option, yaitu:
1. Deteksi plagiarisme 2. Informasi sistem 3. Keluaran dari sistem
Sistem pendeteksi akan memberikan output sesuai pilihan yang di-input oleh user. Output yang mungkin dihasilkan oleh sistem adalah sebagai berikut:
1. Tampilan teks pada layar komputer yang memberikan keterangan mengenai sistem pendeteksi plagiarisme.
2. Bobot kecenderungan plagiarisme dan local similarities yang dihasilkan.
Dari penjelasan input-output sistem pendeteksi plagiarisme di atas, mak dapat digambarkan DFD level 0 atau diagram konteks dari sistem pendeteksi plagiarisme seperti di bawah ini.
PEMERIKSA SISTEM PENDETEKSI
PLAGIARISME Informasi_Sistem
Pilihan_Menu
Bobot_Plagiarisme dan Local_Similarities
Diagram konteks berfungsi menggambarkan hubungan antara entitas luar, berupa masukan dan keluaran sistem. Dari Gambar 3.1 dapat dilihat hanya terdapat sebuah entitas luar, yaitu pemeriksa. Pemeriksa merupakan source terminal yang memberikan masukan ke sistem dan juga merupakan sink terminal yang menerima keluaran dari sistem.
Dalam konteks pemakaian sistem pendeteksi plagiarisme, maka definisi pemeriksa yang melakukan proses input dan menerima output merupakan pengguna yang bertingkat, sebagai contoh pengguna I adalah dosen dan pengguna II adalah mahasiswa. Dengan penjelasan, pengguna I menggunakan secara langsung sistem pendeteksi plagiarisme dan hasilnya dapat diberikan kepada pengguna II. Pengguna tingkat kedua merupakan pengguna yang tidak berinteraksi langsung dengan sistem sehingga pengguna tingkat kedua tidak digambarkan pada diagram konteks.
Data pilihan menu pada diagram konteks terdiri dari tiga option. Seperti yang telah dijelaskan sebelumnya bahwa pilihan ketiga adalah perintah untuk keluar dari sistem, maka DFD level 1 hanya terdiri atas dua proses, yaitu proses tampilkan informasi dan proses deteksi plagiarisme. DFD level 1 dapat digambarkan sebagai berikut. PEMERIKSA TAMPILKAN INFORMASI Informasi_Sistem Bobot_Plagiarisme dan Local_Similarities 1.1* DETEKSI PLAGIARISME 1.2 Option_1 Option_2 Path_Source_File Path_Copy_File Database Source File Database Copy File Source_File Copy_File
Gambar 3.2 DFD Level 1
Proses tampilkan informasi (1.1) adalah proses tambahan pada sistem yang berguna menampilkan teks informasi pada layar monitor. Sedangkan proses deteksi plagiarisme (1.2) merupakan proses utama dari sistem pendeteksi plagiarisme. Proses ini membutuhkan data masukan berupa path source file dan path copy file yang menentukan lokasi dokumen yang akan dibandingkan.
Masing-masing entitas data yang tercantum pada DFD level 1 ditampilkan pada tabel di bawah ini.
Tabel 3.1 Entitas Data pada DFD Level 1
Nama Keterangan
Option_1 Pilihan yang di-input pemeriksa yang menandakan pemeriksa ingin mendeteksi plagiarisme
Option_2 Pilihan yang di-input pemeriksa yang ingin
menampilkan informasi mengenai sistem pendeteksi plagiarisme
Informasi_sistem Informasi tekstual yang ditampilkan sistem pada layar monitor komputer mengenai sistem pendeteksi plagiarisme
Bobot_plagiarisme dan local_similarities
Output yang dihasilkan sistem pendeteksi plagiarisme yang memberi nilai kecenderungan tindakan plagiat Path_source_file Lokasi source file yang berada dalam harddisk
komputer
Path_copy_file Lokasi copy file yang berada dalam harddisk komputer Source_file Dokumen yang diasumsikan sumber ide dari tindakan
plagiat
Proses deteksi plagiarisme terdiri dari tiga proses, yaitu proses baca dokumen, proses optimasi dan proses pembobotan. Proses optimasi pada DFD level 2 merupakan proses bantuan pre-processing, sehingga proses optimasi ini hanya mengoptimalkan source dan copy file yang dibandingkan. DFD level 2 untuk proses deteksi plagiarisme dapat digambarkan sebagai berikut.
PEMERIKSA Bobot_Plagiarisme dan Local_Similarities BACA DOKUMEN 1.2.1* Path_Copy_File Database Source File Database Copy File Source_File Copy_File Path_Source_File OPTIMASI PEMBOBOTAN 1.2.2* 1.2.3* Copy_File Source_File Copy_File_TerOptimasi Source_File_TerOptimasi Gambar 3.3 DFD Level 2
Proses baca dokumen (1.2.1) berfungsi membaca dokumen dari corpus (kumpulan dokumen) yang merupakan lokasi source file dan copy file yang ingin dibandingkan. Untuk memperoleh kedua file tersebut, pengguna harus memasukan kedua path file tersebut terlebih dahulu. Proses baca dokumen memiliki fungsionalitas sebagai berikut:
a. Pembacaan karakter dari tiap dokumen
b. Penghapusan string yang berada di dalam tanda kutip dua c. Konversi huruf besar menjadi huruf kecil
Proses baca dokumen dimulai dengan membaca file karakter per karakter dan melakukan konversi semua karakter dokumen menjadi huruf kecil. Karakter yang dikumpulkan dibentuk menjadi kalimat sebelum dilakukan pemeriksaan kalimat yang diasumsikan tergolong kutipan langsung. Proses baca dokumen akan mengembalikan pasangan file menjadi pasangan string dokumen. Alur proses baca dokumen dapat dilihat pada gambar flowchart di bawah ini
mulai file Baca file perkarakter Karakter==null selesai ya
Konversi huruf besar menjadi huruf kecil
(karakter==null) atau (karakter==angka) Kalimat += karakter Kalimat kutipan langsung Dokumen += kalimat dokumen tidak
tidak Hapus kalimat
ya tidak
Gambar 3.4 Flowchart Untuk Proses Baca Dokumen
Proses optimasi berfungsi mengoptimalkan kalimat dengan mengurangi noise berupa penghilangan kata yang tergolong closed-class word dan stop words dalam masing-masing kalimat dan mengembalikan bentukan dasar dari kata yang berimbuhan. Proses optmiasi merupakan proses yang mengolah dokumen dalam bentuk kata per kata. Alur proses optimasi dapat dilihat pada gambar flowchart di bawah ini.
mulai
dokumen
parsing
Cek jenis kata
Hapus kata
Ambil sebuah kata
Dokumen += kata dokumen Dokumen==null selesai Kata tergolong closed-class word
dan stop word
stemming
ya
tidak
ya
Gambar 3.5 Flowchart Untuk Proses Optimasi
Proses optimasi (1.2.2) berguna untuk mengoptimalkan pasangan dokumen yang dibandingkan secara keseluruhan dengan menghilangkan data noise. Proses ini mengandung subproses:
a. Eliminasi closed-class word b. Eliminasi stop words
c. Stemming
Di dalam proses optimasi terdapat proses parsing. Proses ini berguna memecah file/dokumen menjadi bagian yang lebih sederhana yaitu menguraikan dokumen menjadi kalimat-kalimat dan menguraikan kalimat menjadi kata-kata. Pada proses optimasi juga terdapat proses stemming. Proses ini memiliki beberapa subproses yaitu:
1. Pemeriksaan awalan (prefix) 2. Pemeriksaan akhiran (suffix)
3. Pemeriksaan partikel (particle) dan kata ganti orang (possesive pronoun)
Pembuatan setiap file di dalam database kamus yang digunakan pada proses stemming merupakan file plain text, dimana setiap kata di dalam file merupakan kata dasar dan digolongkan ke dalam 26 file tekstual yang mewakili masing-masing huruf awal dari tiap kata. Sebagai contoh kata “saya” akan dimasukkan ke dalam file a.txt, sedangkan kata “pergi” dimasukkan ke dalam file p.txt. Format penulisan kata-kata di dalam file ditulis terurut dan satu kata dengan kata yang lain dipisahkan oleh tanda titik tanpa spasi.
Proses yang terakhir adalah proses pembobotan melalui pembandingan dengan menggunakan algoritma Smith-Waterman. Di dalam proses ini terdapat proses tokenisasi yaitu proses yang merepresentasikan tiap kata dari dokumen menjadi simbol numerik. Alur penghitungan bobot/nilai menggunakan algoritma Smith-Waterman dapat digambarkan seperti flowchart di bawah ini.
mulai kalimat tokenisasi Pembandingan dengan algoritma Smith-Waterman Bobot plagiarisme dan local similarities selesai
Gambar 3.6 Flowchart Untuk Proses Pembobotan Algoritma Smith-Waterman