• Tidak ada hasil yang ditemukan

Pengukuran Tingkat Kemiripan Dokumen Teks Dengan Proses Algoritma Genetika Menggunakan POSI Formulation

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pengukuran Tingkat Kemiripan Dokumen Teks Dengan Proses Algoritma Genetika Menggunakan POSI Formulation"

Copied!
2
0
0

Teks penuh

(1)

xiii

ABSTRAK

Mengukur persentase kemiripan dokumen menjadi penting saat ini karena banyaknya dokumen digital khususnya karya ilmiah. Pengukuran yang dilakukan dengan menggunakan kata kunci solusi dari beberapa dokumen yang dipilih user setelah proses kompetisi kata kunci. Proses penentuan kata kunci solusi dengan alogoritma genetika

sampai menghasilkan generasi terakhir yang terbaik dengan metode Jaccard dan

Cosine Similarity. Kemudian proses perhitungan kemiripan akan dilakukan dengan

menggunakan query membandingkan kata kunci solusi dengan dokumen yang ada dalam database yaitu pada judul tulisan, abstrak, kata kunci dan referensi. Metode

perhitungan kemiripan yang digunakan adalah Percentage of Similarity (POSI)

Formulation. Jumlah yang kata kunci yang ditemukan pada setiap dokumen akan

dibagikan pada keseluruhan kata kunci yang ditemukan untuk menghasilkan persentase kemiripan. Dari pengujian yang dilakukan diperoleh hasil kemiripan dari dokumen IdDoc-661 sebesar 32,26%, urutan kedua 24,19% pada IdDoc-665 dan urutan ketiga sejumlah 19,35% pada IdDoc-663 dan urutan keempat sebesar 12,90% pada IdDoc-667 dan yang terakhir sebesar 11,29% pada IdDoc-666. Berdasarkan pengujian tersebut user dapat mengetahui kemiripan sebuah dokumen dengan yang lainnya.

Kata Kunci : Kemiripan Dokumen, Algoritma Genetika (GA), Cosine Similirity, POSI

Formulation

(2)

xiv

SIMILARITY MEASUREMENT DOCUMENT PROCESS WITH GENETIC ALGORITHM USING POSI FORMULATION

ABSTRACT

Measures the percentage similarity becomes important documents today because of the many digital documents in particular scientific work. Measurements were performed by using keywords solution of some of the documents that the user selected after the competition keywords. The process of determining keywords alogorithm solution with genetics to produce the latest generation of the best with Jaccard and Cosine Similarity method. Then the similarity calculation process will be done using the keyword query comparing the solution with an existing document in a database that is in the post title, abstract, keywords and references. Similarity calculation method used is the Percentage of Similarity (POSI) Formulation. The number of keywords found on each document will be distributed in the whole of keywords that are found to produce a percentage of similarity. From the tests results obtained similarity of documents idDoc-661 amounted to 32.26%, 24.19% in the second sequence idDoc-665 and the third number of 19.35% on 663 and fourth at 12.90% in idDoc -667 and the latter by 11.29% in idDoc-666. Based on these tests a user can find out similarities with the other documents.

Keywords: Document similarity, Genetic Algorithm (GA), Cosine Similirity, POSI

Formulation

Referensi

Dokumen terkait

Jika kepala madrasah seorang idealis dan menghendaki perbaikan pendidikan anak-anak, maka tidak ada kesempatan yang lebih bagus dibandingkan dengan pendidikan pada pendidikan

Penulis tidak meneliti secara keseluruhan dari penumpang bus Rajawali trayek Solo - Semarang, melainkan cukup dengan mengambil sampel dari mahasiswa Univeritas Diponegoro

Dana asuransi yang diterima oleh pihak tertanggung tidak hanya dinikmati oleh pihak tertanggung, tetapi secara tidak langsung dapat memberikan pendapatan pada daerah atau

Untuk pencarian data tunggal, akan muncul informasi tambahan mengenai attachment (jika ada) atas proses instalasi dan periodic inspection dari komponen

Dari keempat faktor penyebab terhambatnya keterwakilan politik perempuan seperti faktor sistem politik, sosial budaya, ekonomi, psikologis, penulis menyimpulkan bahwa faktor

[r]

Kalimat (19a) di atas secara gramatikal dapat diterima dalam bahasa Arab dan makna semula tidak bergeser, sedangkan kalimat (19b) memerlukan imbuhan pronomina

Penelitian dilakukan secara berjenjang dengan beberapa langkah yaitu: (1) Survei sapi yang melahirkan anak kembar, baik pada industri peternakan maupun peternakan rakyat