peringkasan dokumen

Top PDF peringkasan dokumen:

Otomatisasi Peringkasan Dokumen Sebagai Pendukung Sistem Manajemen Surat

Otomatisasi Peringkasan Dokumen Sebagai Pendukung Sistem Manajemen Surat

Penelitian peringkasan dokumen otomatis dalam bahasa Indonesia sebelumnya pernah dilakukan. Tetapi hanya sedikit peneliti yang menjadikan bahasa Indonesia sebagai objek penelitiannya. Budhi et al. mengembangkan sistem untuk peringkasan dokumen berbahasa Indonesia berbasis graf (Budhi, Intan, R, & R, 2007). Metode yang digunakan adalah algoritma exhaustive shortest path. Dalam penelitiannya Budhi juga mempertimbangkan model paragraf deduktif dan induktif. Untuk menguji hasilnya, Budhi menggunakan metode interview kepada pembaca, pembaca diberikan dokumen asli, ringkasan, dan beberapa pertanyaan. Jika pertanyaan-pertanyaan yang disajikan kepada pembaca bisa terjawab berdasarkan hasil ringkasan, maka ringkasan yang dihasilkan sistem dinilai baik. Peneliti lain yang menjadikan bahasa Indonesia sebagai objek penelitiannya adalah (Nandhini & S, 2013). Aristoteles et al. menggunakan algoritma genetika dalam melakukan proses peringkasan dokumen berbahasa Indonesia.
Baca lebih lanjut

6 Baca lebih lajut

Peringkasan Dokumen Bahasa Indonesia Menggunakan Metode K-Means.

Peringkasan Dokumen Bahasa Indonesia Menggunakan Metode K-Means.

Penelitian yang sudah sering dilakukan umumnya digunakan untuk dokumen yang pendek seperti dokumen artikel dan berita, sedangkan untuk dokumen yang panjang seperti dokumen karya ilmiah yang terdiri atas beberapa bab belum terlalu banyak dilakukan. Oleh karena itu, penelitian yang akan dilakukan adalah membuat peringkasan dokumen otomatis untuk dokumen karya ilmiah, yaitu skripsi, dengan menggunakan teknik ekstraksi dengan menggunakan metode K-Means sebagai pembobotan kalimat. Hal ini karena K-Means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien (Arai dan Barakbah 2007).
Baca lebih lanjut

44 Baca lebih lajut

Peringkasan Dokumen Bahasa Indonesia Menggunakan Pembobotan Fitur Kalimat

Peringkasan Dokumen Bahasa Indonesia Menggunakan Pembobotan Fitur Kalimat

Dengan ini saya menyatakan bahwa skripsi berjudul Peringkasan Dokumen Bahasa Indonesia Menggunakan Pembobotan Fitur Kalimat adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

30 Baca lebih lajut

Sistem Peringkasan Dokumen Berita Bahasa Indonesia Menggunakan MetodeRegresi Logistik Biner

Sistem Peringkasan Dokumen Berita Bahasa Indonesia Menggunakan MetodeRegresi Logistik Biner

Pada peringkasan dokumen secara otomatis, kalimat-kalimat yang terpilih menjadi hasil ringkasan merupakan kalimat yang dianggap penting. Penting atau tidaknya suatu kalimat tergantung pada nilai peluang dari hasil perhitungan beberapa fitur. Oleh karena itu, penelitian ini menelaah peringkasan teks dengan membuat pembobotan fitur menggunakan metode regresi logistik biner. Hasil dari penelitian akan dibandingkan dengan hasil penelitian dari Aristoteles (2011) yang meneliti tentang pembobotan fitur pada peringkasan teks bahasa Indonesia menggunakan algoritme genetika.
Baca lebih lanjut

26 Baca lebih lajut

PERINGKASAN DOKUMEN BAHASA INDONESIA BERBASIS NON-NEGATIVE MATRIX FACTORIZATION ( NMF)

PERINGKASAN DOKUMEN BAHASA INDONESIA BERBASIS NON-NEGATIVE MATRIX FACTORIZATION ( NMF)

(1995). Chuang and Yang (2000) mengusulkan metode supervisi yang menggunakan teknik mesin pembelajaran (machine learning) untuk mengekstrak kalimat. Metode ini membagi kalimat-kalimat ke dalam segmen-segmen yang di representasikan oleh sekumpulan fitur yang telah didefinisikan sebelumnya. Peringkasan dilatih untuk mengestrak bagian-bagian kalimat penting berdasarkan pada kumpulan fitur ini. Amini and Gallinari (2002) mengusulkan algoritma semi-supervisi untuk melatih model pengklasifikasi peringkasan teks. Metode ini menggunakan CEM (classification exptectation maximum) sebagai suatu metode semi- supervisi dengan cara member label beberapa item data yang digunakan bersama-sama dengan sejumlah besar data yang belum berlabel untuk pelatihan. Yeh dan kawan-kawan (2005) mengusulkan suatu peringkasan baru yang dapat dilatih untuk peringkasan dokumen dengan menggunakan beberapa fitur dokumen. Posisi kalimat dirangking dan selanjutnya digunakan algoritma genetic untuk melatih fungsi skor.
Baca lebih lanjut

6 Baca lebih lajut

Peringkasan Dokumen Bahasa Indonesia Menggunakan Logika Fuzzy

Peringkasan Dokumen Bahasa Indonesia Menggunakan Logika Fuzzy

Peringkasan dokumen diperlukan untuk membantu menafsirkan informasi berukuran besar yang terdapat dalam dokumen. Peringkasan dokumen otomatis merupakan proses penciptaan dokumen versi pendek dari sebuah dokumen sumber oleh mesin untuk menyajikan informasi penting dan membantu mempercepat pengguna dalam memahami informasi skala besar pada dokumen. Penelitian ini mengusulkan peringkasan dokumen otomatis dengan menggunakan konsep Fuzzy Inference System (FIS), karena tingkat kepentingan kalimat pada sebuah dokumen memiliki sifat yang tidak pasti (fuzzy). Keuntungan dari logika fuzzy adalah kemampuan penalaran secara bahasa ( linguistic reasoning), sehingga tidak memerlukan persamaan matematika. Simulasi dilakukan terhadap 50 buah data uji. Hasil penelitian menunjukkan bahwa akurasi rata-rata terbaik yang diperoleh adalah sebesar 50.58% dan akurasi peringkasan tunggal terbaik adalah sebesar 100%.
Baca lebih lanjut

35 Baca lebih lajut

Peringkasan dokumen berita Bahasa Indonesia menggunakan metode Cross Latent Semantic Analysis

Peringkasan dokumen berita Bahasa Indonesia menggunakan metode Cross Latent Semantic Analysis

Salah satu algoritma yang digunakan untuk menyelesaikan peringkasan ekstraktif adalah Latent Semantic Analysis (LSA). Peringkasan dokumen dengan LSA menggunakan Singular Value Decomposition (SVD) untuk menemukan kemiripan semantik kata dan kalimat pada sebuah dokumen. SVD adalah model hubungan antara kata dan kalimat (Ozsoy, Cicekli, & Alpaslan, 2010). Peringkasan dokumen mengunakan LSA pertama kali diusulkan Gong dan Liu. Penelitian ini menggunakan dua metode yaitu Information Retrieval (IR) dan LSA. IR melakukan pendekatan pada ukuran relevansi dengan mengambil kalimat nilai relevansi tertinggi untuk dijadikan ringkasan, sedangkan LSA mengidentifikasi kalimat yang memiliki nilai indeks dan singular vector terbesar untuk dijadikan sebuah ringkasan. Dengan menggunakan tiga pakar dari 243 artikel berita, hasil evaluasi dari kedua metode tersebut tidak jauh berbeda yaitu F-Measure IR 0,55% dan LSA 0,57% (Gong & Liu, 2001), namun menurut Steinberger dan Ježek (2004) menyebutkan ada dua kelemahan yang terdapat pada penelitian Gong: 1) Apabila menggunakan demensi yang lebih tinggi, maka jumlah ruang demensi akan berkurang, hal ini menyebabkan topik sebuah berita kurang signifikan untuk menghitung ringkasan, akan tetapi kekurangan ini menjadi keuntungan apabila mengetahui berapa banyak topik yang berbeda pada dokumen asli; dan 2) Kalimat yang memiliki nilai indeks besar, tetapi tidak terbesar, tidak dipilih meskipun isinya untuk ringkasan sangatlah cocok.
Baca lebih lanjut

11 Baca lebih lajut

Perbandingan Kinerja Algoritme TextRank dengan Algoritme LexRank pada Peringkasan Dokumen Bahasa Indonesia

Perbandingan Kinerja Algoritme TextRank dengan Algoritme LexRank pada Peringkasan Dokumen Bahasa Indonesia

Peringkasan dokumen merupakan cara yang efektif untuk mendapatkan informasi dari suatu dokumen tanpa membaca keseluruhan dokumen. Peringkasan dokumen secara otomatis untuk bahasa Indonesia masih sedikit jumlahnya jika dibandingkan dengan perkembangan untuk bahasa lainnya. Penelitian ini mengembangkan peringkasan dokumen otomatis bahasa Indonesia menggunakan metode berbasis graf yaitu algoritme TextRank dan algoritme LexRank yang sudah terbukti baik kinerjanya untuk bahasa Inggris. Jumlah kalimat yang diekstraksi adalah 25% dari total kalimat dalam dokumen. Hasil ringkasan kedua algoritme dievaluasi dengan metode kappa measure. Hasil perhitungan kappa measure memperlihatkan algoritme TextRank lebih baik daripada algoritme LexRank.
Baca lebih lanjut

29 Baca lebih lajut

PERINGKASAN REVIEW PRODUK BERBASIS FITUR DENGAN MENGGUNAKAN USER SCORE FEATURE BASED REVIEW PRODUCT SUMMARIZATION USING USER SCORE

PERINGKASAN REVIEW PRODUK BERBASIS FITUR DENGAN MENGGUNAKAN USER SCORE FEATURE BASED REVIEW PRODUCT SUMMARIZATION USING USER SCORE

Ulasan sebuah produk dari konsumen dapat digunakan oleh perusahan untuk meningkatkan penjualan dan kualitas produknya sedangkan bagi konsumen dapat memberikan keputusan dalam pembelian. Dengan meningkatnya jumlah ulasan serta user score dari konsumen memunculkan masalah baru yaitu ketika ulasan yang diberikan oleh konsumen tidak sesuai dengan user score yang diberikan. Untuk itu dibangun sebuah sistem yang dapat melakukan peringkasan untuk memberikan nilai terhadap ulasan konsumen dengan bantuan user score dari konsumen. Tahapan pertama untuk membangun sistem ini adalah preprocessing dimana preprocessing terdiri dari 3 tahapan yaitu Stopword Removal, Lemmatization, dan POS Tagging. Tahap kedua adalah ekstrasi fitur dan opini dengan menggunakan Type Dependency Parser. Tahap ketiga adalah penentuan polaritas fitur dengan menggunakan Semantic Orientation – Pointwise Mutual Information. Tahap keempat adalah peringkasan dengan menggunakan feature scoring dan Pearson Correlation untuk mengetahui nilai dari setiap fitur yang terekstrak. Hasil proses ekstraksi dan penentuan polaritas adalah daftar fitur dan opini serta polaritas dari setiap fitur. Peringkasan dokumen dengan menggunakan feature scoring menghasilkan skor dari setiap fitur yang berhasil terekstrak pada setiap ulasan yang kemudian dilanjutkan dengan proses Pearson Correlation untuk meilhat trend antara skor dari dataset dengan skor yang dihasilkan oleh feature scoring dimana nilai korelasi tertinggi adalah pada dataset Nook Tablet 16Gb yaitu fitur ke-46 Seller dengan nilai korelasi 1.00 atau berkorelasi sangat kuat dan nilai korelasi terendah adalah pada dataset Nook Tablet 16Gb yaitu fitur ke-62 Unit dengan nilai korelasi -0.94 atau berkorelasi terbalik sangat kuat.
Baca lebih lanjut

9 Baca lebih lajut

Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum  Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum Marginal Relevance dengan K- Means.

Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum Marginal Relevance dengan K- Means.

Penulis membangun aplikasi pengelompokan dokumen dengan metode K-Means dam peringkasan dokumen menggunakan Maximum Marginal Relative. Aplikasi ini mampu memudahkan pengguna sehingga tidak perlu membaca topik yang sama dari berbagai macam sumber, tetapi cukup membaca dari 1 sumber saja.

14 Baca lebih lajut

Peringkasan multi-dokumen berita berdasarkan fitur berita dan part

Peringkasan multi-dokumen berita berdasarkan fitur berita dan part

Automatic text summarization adalah proses peringkasan dokumen teks yang dilakukan secara otomatis melalui mesin komputer. Otomatisasi ringkasan dapat dilakukan terhadap satu dokumen atau banyak dokumen (Aditya, Fatichah, & Purwitasari, 2016). Peringkasan dokumen dapat dibedakan menjadi dua yaitu abstractive dan extractive. Peringkasan abstractive dilakukan dengan cara menulis ulang kalimat berdasarkan pemahaman terhadap dokumen sumber dan disampaikan dengan menghasilkan kalimat baru dari dokumen yang diringkas. Peringkasan extractive dilakukan dengan cara ekstraksi kalimat penting yang ada di dalam dokumen yang akan dijadikan sebagai kandidat ringkasan berdasarkan fitur statistik dan linguistik, kemudian menggabungkannya untuk membentuk sebuah ringkasan (Mandar & Gunawan, 2017). Berikut penjelasan tentang landasan teori yang diambil dari pustaka penelitian sebelumnya sebagai bahan acuan dalam melakukan penelitian ini.
Baca lebih lanjut

11 Baca lebih lajut

BAB 2   TINJAUAN PUSTAKA  Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum Marginal Relevance dengan K- Means.

BAB 2 TINJAUAN PUSTAKA Pembandingan Aplikasi Peringkasan Multi Dokumen menggunakan Sentence Scoring dan Maximum Marginal Relevance dengan K- Means.

Muztahid membuat penelitian untuk pembuatan peringkasan dokumen otomatis menggunakan fitur kata dan metode KMeans. Ringkasan dokumen otomatis dapat digunakan untuk mendapatkan ringkasan teks dengan cepat sehingga memudahkan pengguna untuk mendapatkan informasi utama dari sebuah dokumen. Penelitian ini melakukan peringkasan dokumen dengan menggunakan fitur kata dan metode k-means (Muztahid, 2015).

4 Baca lebih lajut

PEMBOBOTAN KATA BERDASARKAN KLASTER PADA OPTIMISASI COVERAGE, DIVERSITY DAN COHERENCE UNTUK PERINGKASAN MULTI DOKUMEN

PEMBOBOTAN KATA BERDASARKAN KLASTER PADA OPTIMISASI COVERAGE, DIVERSITY DAN COHERENCE UNTUK PERINGKASAN MULTI DOKUMEN

Peringkasan yang baik dapat diperoleh dengan coverage, diversity dan coherence yang optimal. Namun, terkadang sub-sub topik yang terkandug dalam dokumen tidak terekstrak dengan baik, sehingga keterwakilan setiap sub-sub topik tersebut tidak ada dalam hasil peringkasan dokumen. Pada paper ini diusulkan metode baru pembobotan kata berdasarkan klaster pada optimisasi coverage, diversity dan coherence untuk peringkasan multi- dokumen. Metode optimasi yang digunakan ialah self-adaptive differential evolution (SaDE) dengan penambahan pembobotan kata berdasarkan hasil dari pembentukan cluster dengan metode Similarity Based Histogram Clustering (SHC). Metode SHC digunakan untuk mengklaster kalimat sehingga setiap sub-topik pada dokumen bisa terwakili dalam hasil peringkasan. Metode SaDE digunakan untuk mencari solusi hasil ringkasan yang memiliki tingkat coverage, diversity, dan coherence paling tinggi. Uji coba dilakukan pada 15 topik dataset Text Analysis Conference (TAC) 2008. Hasil uji coba menunjukkan bahwa metode yang diusulkan dapat menghasilkan ringkasan skor ROUGE-1 sebesar 0.6704, ROUGE-2 sebesar 0.2051, ROUGE-L sebesar 0.6271 dan ROUGE-SU sebesar 0.3951.
Baca lebih lanjut

9 Baca lebih lajut

Welcome to Repositori Universitas Muria Kudus - Repositori Universitas Muria Kudus

Welcome to Repositori Universitas Muria Kudus - Repositori Universitas Muria Kudus

Aedytha Luthfiarta, Junta Zeniarja, Abu Salam, 2003 Algoritma Latent Semantic Analysis LSA pada Peringkasan Dokumen Otomatis Untuk Proses Clustering Dokumen 3.. Arlisa Yuliawati, D[r]

1 Baca lebih lajut

PERINGKASAN TEKS MODEL GRAF PADA SINGLE DOKUMEN DENGAN METODE SPARSE NON NEGATIVE MATRIX FACTORIZATION

PERINGKASAN TEKS MODEL GRAF PADA SINGLE DOKUMEN DENGAN METODE SPARSE NON NEGATIVE MATRIX FACTORIZATION

Peringkasan teks secara otomatis dapat digunakan untuk mengelola sejumlah besar informasi di web atau dokumen. Ringkasan dapat membantu pembaca untuk mendapatkan gambaran singkat keseluruhan dokumen atau kumpulan dokumen dan dengan demikian mengurangi waktu untuk membaca. Proses dokumen summarization dapat berguna untuk berbagai aplikasi seperti (document indexing) pengindekan dokumen, (question-answering system) sistem tanya jawab, sistem pencarian, dan klasifikasi dokumen. peringkasan teks otomatis dapat dikategorikan sebagai peringkasan dokumen tunggal dan peringkasan multi dokumen. Bila inputannya hanya satu dokumen, maka disebut summarization teks dokumen tunggal dan bila inputannya adalah satu set dokumen teks yang saling berhubungan maka disebut multi-dokumen (kamal sakar 2013). Dalam penelitian ini yang akan dibahas adalah kalimat didalam single dokumen yang akan di buat ringkasannya secara automatic.
Baca lebih lanjut

11 Baca lebih lajut

SEMANTIC RULE LABELING DAN SENTENCE INFORMATION DENSITY DALAM PEMILIHAN KALIMAT REPRESENTATIF CLUSTER PADA PERINGKASAN MULTI-DOKUMEN

SEMANTIC RULE LABELING DAN SENTENCE INFORMATION DENSITY DALAM PEMILIHAN KALIMAT REPRESENTATIF CLUSTER PADA PERINGKASAN MULTI-DOKUMEN

Coverage dan salient merupakan masalah utama yang menjadi perhatian para peneliti dalam peringkasan dokumen. Pendekatan clustering mampu memberikan coverage yang baik terhadap semua topik namun tidak memiliki informasi-informasi yang bisa mewakili kalimat- kalimat lain (salience sentence).Salience dapat digali dengan melihat hubungan dari satu kalimat dengan kalimat lain yang dibangun dengan pendekatan position text graph, namun position text graph hanya mampu menggali hubungan antar kalimat tanpa memperhatikan peran semantik kata ( “who” did “what” to “whom”, “where”, “when”, and “how” ) dalam kalimat yang dibandingkan.Pada paper ini kami mengusulkan sebuah metode baru strategi pemilihan kalimat representatif cluster dengan pendekatan sentence information density dan Semantic Rule labeling. Hasil uji coba menunjukkan metode yang metode yang diusulkan mampu memilih kalimat ringkasan lebih baik dari metode Sentence Information Density (SID) dengan rata-rata nilai Rouge-1 0.32511.
Baca lebih lanjut

8 Baca lebih lajut

Peringkasan Multi-dokumen Berita Berbahasa Indonesia menggunakan Conditional Random Fields (CRF)

Peringkasan Multi-dokumen Berita Berbahasa Indonesia menggunakan Conditional Random Fields (CRF)

Peringkasan multi-dokumen dibutuhkan agar pencarian informasi dapat berjalan lebih efektif dan efisien. Sistem peringkasan ini menggunakan framework ekstraksi yang telah secara luas digunakan untuk meringkas dokumen, dimana hasil ringkasan merupakan kalimat- kalimat yang telah diekstraksi dari dokumen. Peringkasan dokumen dapat dilakukan dengan melihat nilai informasi suatu kalimat dari dokumen tersebut berdasarkan fitur yang diterapkan pada kalimat yang ada. Fitur tersebut diantaranya adalah fitur linguistik dan statistikal seperti posisi kalimat. Conditional Random Fields (CRF) merupakan salah satu model probabilistik untuk mengatasi segmentasi dan pemberian label pada data sekuens. CRF digunakan untuk mengkombinasikan fitur- fitur untuk mendapatkan model yang akan digunakan untuk menilai tingkat kepentingan kalimat. Fitur yang digunakan adalah basic feature dan complex feature. Sistem akan dinilai akurasinya menggunakan F- Measure, dengan membandingkan ringkasan yang dibuat oleh sistem dengan ringkasan yang dibuat oleh ahli. Hasil pengujian menunjukkan bahwa rata- rata akurasi yang dihasilkan sebesar 62,5% dengan menentukan nilai threshold sebesar 0.45 dimana nilai tersebut digunakan untuk mengklasifikasikan kalimat summary dan non- summary.
Baca lebih lanjut

12 Baca lebih lajut

Peringkasan Multi-Dokumen Berbasis Clustering pada Sistem Temu Kembali Berita Online Menggunakan Metode K-Means

Peringkasan Multi-Dokumen Berbasis Clustering pada Sistem Temu Kembali Berita Online Menggunakan Metode K-Means

2.2 Pembobotan Kata (Term Weighting) Setiap kata atau term memiliki nilai atau bobotnya masing-masing, pada penelitian ini menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) sebagai metode term weighting. Term frequency (TF) adalah jumlah munculnya suatu term dalam suatu dokumen. Manning et al. (2008) menjelaskan bahwa metode Inverse Document Frequency (IDF) baik digunakan untuk peringkasan teks. IDF merupahan operasi pembagian jumlah dokumen dengan frekuensi dokumen yang membuat suatu term. sedangkan TF-IDF adalah hasil perkalian nilai TF dengan IDF untuk sebuah term dalam dokumen. Persamaan IDF dan TF-IDF dapat dilihat pada persamaan (1) dan (2) dibawah ini.
Baca lebih lanjut

7 Baca lebih lajut

Peringkas dokumen berbahasa indonesia berbasis kata benda dengan BM25

Peringkas dokumen berbahasa indonesia berbasis kata benda dengan BM25

Ukuran kesamaan yang digunakan Miptahudin (2010) dalam perhitungannya ialah cosine similarity dan content overlap. Sebelum melakukan perhitungan similarity terlebih dahulu dilakukan preprocessing seperti segmentasi, tokenizing, stemming, dan pemilihan kata benda. Cosine similarity atau ukuran kesamaan kosinus adalah ukuran kesamaan antara dua vektor dengan mengukur kosinus sudut antara mereka (Manning et al. 2009). Vektor merepresentasikan tiap kalimat dan berisi bobot dari tiap term. Nilai bobot dihitung menggunakan pembobotan tf.idf terhadap setiap kalimat bukan dokumen pada umumnya.
Baca lebih lanjut

23 Baca lebih lajut

Show all 10000 documents...