• Tidak ada hasil yang ditemukan

Pengukuran Tingkat Kemiripan Dokumen Teks Dengan Proses Algoritma Genetika Menggunakan POSI Formulation

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pengukuran Tingkat Kemiripan Dokumen Teks Dengan Proses Algoritma Genetika Menggunakan POSI Formulation"

Copied!
4
0
0

Teks penuh

(1)

1

BAB 1

PENDAHULUAN

1.1Latar Belakang

Dengan meningkatnya jumlah hasil penelitian maupun karya ilmiah lainnya dalam bentuk dokumen digital terutama pada bidang akademik seperti skripsi, tesis, jurnal, prosiding dan sejenisnya. Sehingga kemungkinan dokumen dapat terjadi kemiripan seperti pada judul tulisan, abstrak, permasalahan, metode yang digunakan, objek penelitian, pembahasan dan hasilnya. Sehingga untuk menghindari pengulangan penulisan yang sama perlu dilakukan antisipasi agar kesamaan dokumen dapat dihindari. Pengukuran kemiripan dokumen merupakan pendeteksian kesamaan beberapa dokumen dengan membandingkan isi dokumen sehingga menghasilkan bobot atau nilai kemiripan dari dokumen yang dibandingkan. Salah satu kegunaan perbandingan isi dokumen adalah untuk membantu pengguna dalam pengelompokan dokumen dan juga memungkinkan pengguna mengetahui apakah isi dokumen yang satu merupakan dokumen yang pada dasarnya sama dengan dokumen yang lain. Hal ini berfungsi untuk mengetahui apakah sebuah dokumen mirip dengan dokumen lain (Sihombing, 2010).

Pengujian kemiripan dokumen ini dapat dilakukan dengan beberapa teknik, misalnya teknik pencarian informasi, teknik penghitungan statistik, atau dengan menggunakan informasi sintaktik dari kalimat perkalimatnya (Taufiq, 2013). Pendekatan-pendekatan tersebut tidaklah sempurna, masih terdapat beberapa kelemahan, misalnya penghitungan statistik yang membandingkan frekuensi kata dari dokumen satu dengan dokumen yang lain, tidak memperhatikan struktur kalimat. Sedangkan dalam teknik sintaktik kalimat,

(2)

2

urutan kata dalam kalimat diperiksa unsur semantiknya dengan cara mengolah letak kata sesuai tatabahasanya atau dengan penggantian sebuah kata dengan sinonim dari kata tersebut. Teknik ini mempunyai kelemahan, yaitu setiap kata dikelompokkan pada label masing-masing untuk mengetahui struktur kalimat. Penelitian ini bertujuan mengembangkan pengukuran kemiripan satu dokumen degnan dokumen lain yang berada dalam satu database. Proses yang akan dilakukan adalah dengan mengadakan kompetisi kata kunci untuk mendapatkan kata kunci solusi (keyword solution) yang ada pada sebuah dokumen menggunakan algoritma genetika metode jaccard function dan fungsi cosine similarity.

Dalam pengujian sebuah dokumen dapat dibandingkan dengan multi dokumen yang telah dikelompokkan dalam sebuah server atau pusat database. Dimana informasi terhadap sebuah dokumen tersebut sudah dimasukkan terlebih dahulu dalam bentuk digital seperti kata kunci, id dokumen, abstrak, judul, dan informasi penting yang dapat mewakili informasi dokumen tersebut seperti daftar pustaka atau referensi utama yang digunakan. Sehingga diharapakan dokumen yang diuji kemiripannya dapat menghasilkan persentase kemiripan antara dokumen yang dipilih oleh user dibandingkan dengan sekumpulan dokumen lainnya dalam database. Maka pengguna dokumen dapat terbantu dalam mengetahui isi dari sebuah dokumen/karya ilmiah tanpa harus membaca isi keseluruhan dokumen tersebut.

1.2 Rumusan Masalah

Adapun rumusan masalah dalam penelitian ini adalah berapa persentase kemiripan sebuah dokumen jika dibandingkan dengan dokumen lain di dalam sebuah database dengan proses algoritma genetika menggunakan Perentage of Similarity (POSI) Formulation”

1.3 Batasan Masalah

Dalam penelitian ini akan dibatasi ruang lingkup antara lain:

1. Mengunakan Algoritma Genetika dalam melakukan kompetisi kata kunci untuk mencari kata kunci solusi (keyword solution)

(3)

3

2. Fungsi yang digunakan fungsi cosine (cosine similirity) dan Jaccard Function

3. Dokumen yang diuji adalah berupa dokumen jurnal yang telah memiliki format penulisan yang sama.

4. Formula perhitungan pengukuran kemiripan dengan POSI Formulation

5. Menggunakan data yang bersumber dari karya Ilmiah/Prosiding Seminar Nasional Ilmu Komputer (SNIKOM) APTIKOM Wilayah I

6. Pengujian kata kunci solusi dilakukan terhadap judul tulisan, kata kunci, abstrak dan referensi

7. Aplikasi yang dirancang digunakan secara multiuser dan menyediakan fasilitas pencarian dokumen pada aplikasi untuk memudahkan mengetahui isi dokumen.

1.4 Tujuan dan Manfaat

Adapun tujuan penelitian ini adalah untuk mengetahui hasil persentase kemiripan sebuah dokumen dengan dokumen lainnya. Sedangkan manfaatnya adalah pengguna dapat mengetahui dengan cepat kemiripan dokumen tanpa harus membaca keseluruhan isi dokumen.

1.5 Sistematika Penulisan

Agar penulisan tesis ini sesuai dengan format yang ditentukan maka diberikan sistematika penulisan yang terdiri dari:

Bab 1 : Pendahuluan meliputi latar belakang, rumusan masalah, batasan masalah, tujuan dan manfaat dan sistematika penulisan.

Bab 2 : Landasan Teori terutama tentang Algoritma Genetika,

Information Retrieval dan POSI Formulation

Bab 3 : Metodologi Penelitian yang meliputi kerangka kerja penelitian dan metode yang digunakan

(4)

4

Bab 4 : Pembahasan dan Hasil meliputi algoritma genetika, kompetisi kata kunci, penentuan populasi, evaluasi fitness, crossover, mutasi, penetuan generasi terkahir, user interface aplikasi

Bab 5 : Simpulan dan Saran yang dapt memberikan simpulan terhadap penelitian dan saran untuk pengembangan dan penelitian berikutnya

Referensi

Dokumen terkait

Tingkat gangguan habitat yang diukur menggunakan indeks habitat (Gambar 3b) menunjukkan bahwa bagian hulu Sungai Menduk (st. 1) akibat penambangan sudah masuk

Hal ini sesui dengan hadits nabi yang menyatakan, “Yang sakit tidak boleh merawat orang yang sehat.” (HR. Imam Muslim). Maksudnya tidak semua penyakit dapat

Here we describe our 2-stage algorithm for generating DTMs from DSMs. The complete work flow is presented in Figure 1. The data used for developing and testing the algorithm

Specifically, terrestrial laser scanning (TLS) collects high resolution 3D point clouds allowing more accurate monitoring of erosion rates and processes, and thus, quantify the

Berikut catatan-catatan khusus yang kami buat untuk mendukung bahwa transaksi yang dilakukan dengan pihak yang mempunyai hubungan istimewa telah sesuai dengan prinsip kewajaran (

Tujuan penelitian ini untuk membangun nilai-nilai kerjasama dalam permainan pembelajaran bola voli untuk mengatahui sejauh mana penerapan bermain dalam membangun nilai-nilai

Tujuan penelitian ini adalah: (1) mengetahui bahwa hasil belajar siswa yang dikenai pembelajaran model PBL dengan pendekatan open-ended mencapai ketuntasan belajar;

Dana asuransi yang diterima oleh pihak tertanggung tidak hanya dinikmati oleh pihak tertanggung, tetapi secara tidak langsung dapat memberikan pendapatan pada daerah atau