PERANCANGAN PERINGKAS BERITA OTOMATIS
DENGAN MEMPERHATIKAN SINONIM MENGGUNAKAN
METODE WEIGHT OF FEATURE
Ardianto
1)Jeanny Pragantha
2)Viny Christanti M.
3)1)
Teknik Informatika Universitas Tarumanagara
Jl. S Parman No.1, Jakarta Barat 11440 Indonesia
email :
1)[email protected],
2)[email protected]
,
3)[email protected]
ABSTRACT
This application is designed for automatic news summarization by using Weight of Feature method combined with NER, sentence position, finding similarities between title and sentences, and Synonyms. when there word are 2 sentences which have synonymous, 2 word those sentences are considered to have a closer relationship than 2 sentences that have no synonyms. This application works with extraction system and uses single document. Summarization results with Q&A evaluation result of 25% successfully answered questions with 56.24%, while 50% successfully answered questions with 83.84%, and 75% % successfully answered questions with 96.02%.
Key words
Automatic Summarization System, NER, Sentence Position, Synonyms, Weight Of Feature
1. Pendahuluan
Membaca berita yang diringkas membutuhkan waktu yang lebih singkat dari pada membaca seluruh isi berita, tetapi membuat ringkasan berita memerlukan waktu yang banyak. Apalagi dokumen yang diringkas banyak, karena itu dibutuhkan mesin peringkas otomatis untuk mengatasi masalah waktu tadi. Peringkasan teks berita otomatis adalah suatu proses untuk menghasilkan ringkasan dari suatu dokumen berita tapi tetap akurat dan memiliki gambaran dari isi suatu dokumen.[1]. Peringkasan teks dokumen berita terdapat 2 jenis kriteria peringkasan teks, yaitu berdasarkan ekstraksi dan abstraksi. Pada teknik ekstraksi sistem menyalin unit-unit kalimat yang dianggap penting atau informatif.[1]
Pada teknik abstraksi mengambil intisari sumber teks dalam bentuk berbeda.[1] Perancangan peringkasan berita ini menggunakan metode Weight of feature adalah metode untuk menghitung bobot dari masing-masing kalimat dalam dokumen menggunakan kombinasi linear dari setiap bobot fungsi yang telah di hitung.[2]
Perhitungan bobot pada setiap kalimat digunakan untuk mengetahui seberapa pentingnya suatu kalimat, semakin penting kalimat semakin besar nilai bobotnya. Kegunaan dari program ini adalah untuk menghasilkan hasil ringkasan otomatis yang baik dengan memperhatikan kalimat yang bersinonim, dan mendapatkan intisari berita secara informatif. Pada peringkasan ini menggunkan teknik ekstraksi dan menggunakan single dokumen. Sinonim adalah dua kata atau lebih kalimat yang mempunyai makna yang sama, tetapi bentuknya berlainan. Sinonim ini digunakan untuk mengalihkan pemakaian kata yang sama sehingga kalimat itu tidak membosankan bagi pembaca. Dalam penggunaannya apabila ada 2 kalimat yang saling bersinonim jadi ke 2 kalimat tersebut memiliki hubungan yang lebih dekat dibandingkan 2 kalimat yang tidak memiliki sinonim.
2. Ringkasan dengan metode Weight of
feature
Sistem yang dirancang adalah suatu program aplikasi untuk meringkasan berita dengan memperhatikan sinonim menggunakan metode Weight of Feature. Proses Weight of Feature nya adalah input data setelah itu ke tahap 1 yaitu preprocessing setelah melewati tahap 1 masuk ke tahap 2 summarization feature setelah itu masuk ke tahap 3 analisis dan masuk ke tahap 4 generating summaries. Diagram proses peringkasan berita dapat dilihat pada Gambar 1.
2.1.Preprocessing
Pada tahap preprocessing ini adalah untuk memberikan nama entitas pada dokumen, menghapus kata-kata yang tidak perlu lalu melakukan tokenisasi, tahapannya sebagai berikut:
1. Named Entities Recognition
Named Entities Recognation adalah salah satu usaha untuk mengenali entitas nama orang, organisasi dan lokasi.[3] nama entitas ini digunakan untuk menetukan hasil ringkasan dari dokumen berita. Proses nama dalam entitas untuk mendeteksi nama orang, nama lokasi dan nama organisasi.
2. Tokenisasi
Tokenisasi adalah proses memecahkan sekumpulan karakter kalimat dalam suatu teks ke dalam satuan kata.[4] Proses tokenisasi yang pertama dilakukan adalah memecahkan sekumpulan karakter kalimat ke dalam satuan kata dan mengubah huruf besar menjadi huruf kecil, terakhir yang dilakukan oleh proses tokenisasi adalah menghapus tanda baca.
3. Stopword
Stopword adalah menghapus kata yang sering muncul pada sebuah dokumen yang tidak memiliki makna.[5] Sebagai contoh di dalam bahasa Indonesia seperti kata “di”, “yang”, “ke” dan seterusnya, dalam bahasa Inggris seperti kata “of”, “this”, dan seterusnya. Cara proses Stop Word Removal yang pertama dilakukan adalah memeriksa perkata dalam kalimat kemudian proses berikutnya dilakukan mengecek didalam list stop word apakah di dalam kalimat tersebut ada kata yang sama didalam list stop word bila ada kata tersebut akan di hapus.
2.2.Summarization feature
Bagian Summarization Feature adalah untuk memberikan nilai bobot setiap posisi pada kalimat dan memberikan nilai bobot pada setiap kalimat berdasarkan banyaknya kata yang sama dengan kata yang ada pada judul. Tahapannya sebagai berikut:[2]
1. Posisi kalimat
Posisi kalimat adalah letak kalimat dalam sebuah paragraph. Pada proses ini diasumsikan bahwa kalimat pertama pada setiap paragraf adalah kalimat yang paling penting.[1] Contoh bila dalam satu dokumen terdapat 1 paragaf berisi empat kalimat. Perhitungan skor fitur teks posisi kalimat untuk kalimat pertama adalah , skor kalimat kedua adalah , skor kalimat ketiga adalah , dan skor kalimat keempat adalah . .[1] Rumusnya adalah:[6]
( ) ………(1)
2. Judul
Kata atau kalimat di dalam dokumen yang mirip dengan judul akan dihitung.
Contoh:
Judul : Kegiatan Saya Kalimat 1: Saya Sekolah. Kalimat 2: Saya bermain . Kalimat 3: Kegiatan Saya bekerja.
Berdasarkan contoh diatas, untuk perhitungan Skor kalimat yang menyerupai judul, nilai kalimat pertama adalah , nilai kalimat kedua , dan nilai kalimat ketiga adalah . Pada kalimat pertama mempunyai satu kata yang sama dengan judul yaitu kata “saya”, Kalimat kedua mempunyai satu kata yang sama dengan judul yaitu kata “saya” pada Kalimat ketiga mempunyai dua kata yang sama dengan judul dokumen yaitu “Kegiatan saya”. Rumusnya adalah:
( ) ∩ ∪ … (2) 3. Sinonim
Sinonim adalah dua kata atau lebih kalimat yang mempunyai makna yang sama, tetapi bentuknya berlainan.[7] Sinonim ini digunakan untuk mengalihkan pemakaian kata yang sama sehingga kalimat itu tidak membosankan bagi pembaca. Dalam penggunaannya kalimat yang memiliki sinonim memiliki nilai yang lebih besar daripada kalimat yang tidak memiliki sinonim. Dalam menentukan sinonim proses yang harus dilakukan adalah mengecek perkata mulai dari kalimat pertama setelah itu kata tersebut dicek di kamus sinonim elektronik setelah itu sinonim dari kata tersebut dicari perkata setiap kalimat dan kata dalam judul. Contoh kalimat yang bersinonim:
Alessandro Del Piero Negosiasi Dengan Olympiakos
Mantan bintang Juventus, Alessandro Del Piero sedang melakukan pembicaraan dengan manajemen Olympiakos mengenai kemungkinan memperkuat klub Yunani tersebut.
Kata yang ada dalam kamus sinonim:
Negoisasi = musyawarah, pembicaraan, rembukan, Transaksi.
Dalam pembuatan kamus sinonim elektronik dilakukan dengan cara mengetik kata yang ada dalam buku kamus tesaurus ke dalam notepad. Kata-kata yang mengandung Named Entities Recognation dan Stopword tidak perlu dicari sinonimnya. Nilai kata yang bersinonim bernilai 2, sedangkan kata yang tidak bersinonim bernilai 1
2.3.Analisis Kalimat
Bagian analisis adalah menganalisis kalimat yang penting dan memberikan nilai, tahapannya adalah:[2]
Pemberian skor pada setiap kalimat (skor(i)) yang berdasarkan hasil kombinasi linier dan weight of feature.
Score(i)=(∝ !,#$%&) '(!) (()*( !)% )+(!)
( ,% ) …(3)
Penjelasan:[2]
N = jumlah kalimat pada dokumen.
n(Si) = jumlah kalimat yang memiliki sinonim bila ada kata yang besinonim diberi nilai 2, jika tidak ada diberi nilai 1.
P(Si) = bobot posisi pada kalimat.
Sim(Si,T) = kesamaan antara judul dan kalimat(i). NE = jumlah nama entitas dalam dokumen.
FNE(Si) = jumlah nama entitas terkandung dalam kalimat(i).
α= nilainya 0.5. β = nilainya 0.5.
α dan β diberi nilai 0.5 supaya bila di dalam kalimat
tidak ada kata atau kalimat yang sama dengan judul hasil score (i) tidak 0. Nilai alfa dan beta 0.5 karena itu adalah nilai standar dalam bidang statistik. Proses Scoring Sentence dan algoritma Weight of feature nya:
a. Menghitung jumlah entitas (FNE(Si)) pada kalimat.
b. Menghitung seluruh jumlah entitas(NE(Si)) pada dokumen.
c. Menghitung jumlah kalimat pada dokumen (N). d. Memberi bobot posisi pada setiap kalimat,
kalimat pertama mendapat nilai yang lebih besar karena di anggap paling penting (P(Si)).
e. Menghitung kata yang memiliki sinonim (n(Si)). f. Menghitung kemiripan kata atau kalimat dengan
judul Sim(Si,T).
g. Mengurutkan hasil hitungan scoring sentence terbesar sampai terkecil pada setiap kalimat. 2. Stanford Named Entities Recognition
Stanford Named Entities Recognition adalah sebuah perangkat lunak untuk memberikan label entitas pada setiap kata seperti nama orang, lokasi dan nama organisasi. Di dalam penerapannya NER Stanford dilatih untuk membuat sebuah Classifier. Classifier merupakan sebuah alat pembelajaran yang mengambil item data dan menempatkan mereka ke dalam salah satu kelas k[8]. Dalam memberi rangkaian label entitas named entities recognition menggunakan rumus CRF. CRF adalah suatu model grafis terarah yang setiap variabel acaknya harus didistribusikan[9]. Dalam mendefinisikan distribusi probabilitas, sebuah rangkaian label Y berdasarkan suatu rangkaian observasi X sebagai P(Y|X) jadi Y adalah sebuah titik pada sebuah graf, distribusi sebaran Y sangat bergantung pada suatu rangkaian observasi X yang menjadi masukan untuk CRF.[9] Algoritma stanford NER sebagai berikut:
1.Memberi entitas pada data training bila kata dalam dokumen tidak bermakna diberi tanda O bila kata tersebut bermakna diberi entitas nama, organisasi dan nama tempat.
2.Menghitung banyaknya entitas pada setiap dokumen.
3.Menyusun semua fungsi fitur untuk setiap entitas. 4.Menghitung nilai probabilitas kondisional antara
kata dan entitas untuk masukan nilai f1 dan g1. 5.Menghitung probabilitas bersyarat P(3|4). 6.Hasil perhitungan.
3. Pembuatan
Program aplikasi yang dibuat adalah program peringkasan dokumen berita berbahasa Indonesia menggunakan Metode Weight of Feature, hal pertama yang dilakukan adalah input dokumen berita dalam bentuk teks. Sistem melakukan tahap preprocessing yang fungsinya untuk memberikan entitas pada setiap kalimat, melakukan tokenisasi dan Stop Word Removal. Langkah berikutnya melakukan tahap Summarization feature. Pada tahap ini dilakukan pemberian bobot pada posisi setiap kalimat dan mencari kesamaan antar kata dan judul. Langkah berikutnya melakukan analisis untuk menghitung bobot kalimat pada setiap posisi dan mencari kesamaan kata atau sinonim. Langkah terakhir dilakukan proses generating summary untuk mengurutkan kalimat berdasarkan bobot setiap kalimat setelah dihitung.
Algoritma Weight of Feature untuk membuat ringkasan adalah sebagai berikut:
1. Input dokumen
2. Dilakukan proses Named Entities Recognation dengan bantuan Stanford NER.
3. Menghitung jumlah entitas pada setiap kalimat. 4. Menghitung jumlah entitas pada dokumen. 5. Menghitung jumlah kata yang memiliki sinonim. 6. Menghitung kesamaan judul dengan kalimat. 7. Menghitung Jumlah kalimat pada dokumen. 8. Memberikan bobot pada posisi setiap kalimat. 9. Menghitung bobot setiap kalimat menggunakan
metode Weight of Feature.
10.Mengambil kalimat dari bobot terbesar sampai terkecil.
Spesifikasi perangkat keras dan perangkat lunak yang digunakan sebagai berikut:
Spesifikasi dari perangkat keras yang akan digunakan dalam perancangan program aplikasi ini antara lain: 1. Processor Intel(R) Pentium® T4300(2.1 GHz, 800
MHz FSB).
2. Hard disk berkapasitas 160 GB. 3. Memori RAM 2 GB.
4. Monitor 14,0” 5. Keybord 6. Optional mouse
Spesifikasi dari perangkat lunak yang akan digunakan dalam rancangan program aplikasi ini antara lain:
1. Sistem Operasi Microsoft Windows XP. 2. Microsoft Visual Basic 2008.
3. Notepad.
Program aplikasi yang dibuat diawali dengan membuat GUI (Graphical User Interface) dari masing-masing form sebagai berikut:
a. Form Utama
Form utama adalah tampilan awal saat program dijalankan. Pada form ini terdapat 1 textbox. Textbox ini berfungsi untuk mengambil dokumen yang akan di input. Selain itu didalam form utama ini terdapat 6 tombol yaitu browse yang berfungsi sebagai alat untuk pindah ke modul input. Tombol label untuk memanggil modul label, tombol hasil untuk memanggil modul hasil, tombol kamus untuk memanggil modul kamus tombol help untuk memanggil modul help dan modul about untuk memanggil modul about. Tampilan Form utama dapat dilihat pada gambar 2.
Gambar 2 Form Utama
b. Form label
Form label ini berfungsi untuk melakukan proses preprocessing. Pertama dilakukan adalah melakukan NER, tokenisasi, stop word removal dan ada tombol reset untuk menghapus proses preprocessing dan tombol file awal untuk melihat dokumen yang di input. Tampilan Form label dapat dilihat pada
gambar 3.
Gambar 3 Form label
c. Form hasil
Form hasil ini berfungsi untuk melakukan proses perhitungan weight of feature untuk menghitung bobot dokumen setiap kalimat. Dalam form ini terdapat 5 tombol dan 1 textbox. Tombol pertama adalah simpan untuk menyimpan hasil ringkasan,
tombol kedua adalah bobot berfungsi sebagai memanggil modul bobot yang isinya hasil perhitungan weight of feature. tombol ketiga adalah entitas berfungsi untuk memanggil modul entitas yang isinya adalah hasil entitas pada dokumen. Tombol keempat adalah tombol sinonim yang berfungsi untuk memanggil modul sinonim yang isinya jumlah sinonim pada dokumen. Tombol ke 5 adalah tombol back berfungsi untuk kembali ke form utama. Text box pada form ini berfungsi untuk menampilkan hasil ringkasan dokumen. Tampilan Form hasil dapat dilihat pada gambar 4.
Gambar 4 Form hasil
d. Form bobot
Form bobot berfungsi untuk melihat nilai hasil perhitungan weight of feature setiap kalimat. Tampilan Form bobot dapat dilihat pada gambar 5.
Gambar 5 Form bobot
e. Form entitas
Form entitas berfungsi untuk melihat jumlah entitas setiap kalimat dan daftar entitas setiap kalimat. Tampilan Form entitas dapat dilihat pada gambar 6.
f. Form sinonim
Form sinonim berfungsi untuk melihat kata yang bersinonim antar kalimat. Tampilan Form entitas dapat dilihat pada gambar 7.
Gambar 7 Form sinonim
g. Form kamus
Form kamus ini berfungsi untuk melihat kamus sinonim yang digunakan. Tampilan Form kamus dapat dilihat pada gambar 8.
Gambar 8 Form kamus
h. Form help
Pada form ini berisi informasi untuk penggunaan program aplikasi. Hasil rancangan form help. Tampilan Form help dapat dilihat pada gambar 9.
Gambar 9 Form help
i. Form about
Pada form ini berisi tentang program aplikasi. Tampilan Form about dapat dilihat pada gambar 10.
Gambar 10 Form about
Tahap-tahap pembuatan sistem :
1. Mengumpulkan dokumen berita yang akan ditampilkan dalam pengujian. Dokumen yang digunakan adalah dokumen berita olahraga berbahasa Indonesia, Dokumen diambil dari situs www.goal.co.id dan www.okezone.com. Dokumen yang diperoleh disimpan dalam format .RTF. Jumlah dokumen yang digunakan sebanyak 50 dokumen berita sepak bola bahasa Indonesia. 2. Membentuk data training untuk program Stanford
Named Entities recognition supaya dapat digunakan kedalam Bahasa Indonesia. Data training yang digunakan sebanyak 100 dokumen berita olahraga bahasa Indonesia, dokumen tersebut diberi tag entitas secara manual seperti nama, organisasi dan lokasi secara manual. Dokumen yang telah diberikan entitas akan diproses oleh Stanford NER sehingga dapat menghasilkan classifier yang berisikan data training.
3. Melakukan pengujian pada setiap modul dan tombol untuk memeriksa apakah sudah berjalan sesuai dengan fungsinya masing-masing. Pada pengujian ini menggunakan metode Black Box Testing. 4. Melakukan pengujian terhadap sistem yang
dirancang. Pengujian ini berguna untuk memeriksa seberapa akurat hasil ringkasan yang telah diproses oleh aplikasi. Metode yang digunakan untuk memeriksa keakuratan hasil ringkasan menggunakan Q&A Evaluation. Pengujian ini diawali dengan memberikan 5 pertanyaan dari setiap dokumen berita bola. Pertanyaan yang telah dibuat dijawab oleh 50 responden. Setiap responden diberikan 3 buah hasil ringkasan yaitu hasil ringkasan 25%, 50% dan 75% dari sumber dokumen yang sama untuk menjawab pertanyaan yang diberikan.
4. Pengujian
Pada pengujian hasil ringkasan ini menggunakan metode Question & Answer Evalution. Metode ini menggunakan cara tanya jawab. Penguji akan membuat soal dari dokumen asli yang belum diringkas, soal tersebut dijawab oleh seorang responden menggunakan hasil dari ringkasan dokumen. Pada pengujian ini menggunakan 50 dokumen berita sepak bola. Dokumen
yang telah diperoleh dilakukan proses peringkasan sebesar 25%, 50% dan 75%.
Kompresi 25% adalah mengeluarkan hasil ringkasan sebanyak 25% dari seluruh dokumen, Kompresi 50% adalah mengeluarkan hasil ringkasan sebanyak 50% dari selruh dokumen dan Kompresi 75% adalah mengeluarkan hasil ringkasan sebanyak 75% dari seluruh dokumen. Satu orang responden akan menjawab soal yang sama sebanyak 3 kali. Pertama menggunakan hasil ringkasan dengan nilai kompresi 25% dan dilanjutkan dengan 50% dan 75%. Pengujian untuk hasil ringkasan dilakukan dengan meminta bantuan 50 responden menggunakan Q & A Evaluation. Pengujian dilakukan dari tanggal 12 – 14 Desember 2012. Para responden adalah mahasiswa dan mahasiswi Universitas Tarumanagara serta masyarakat umum. Pengujian dilakukan menggunakan kertas jawaban, pada langkah awal responden harus memasukan nama dan pekerjaan. Setelah itu responden harus menjawab 5 buah pertanyaan yang telah disediakan, menggunakan ringkasan 25%, 50% dan 75%.
Contoh dokumen dapat dilihat pada gambar 11, dan contoh pertanyaan dapat dilihat pada gambar 12 hasil ringkasan dokumen 25%, 50% dan 75% dapat dilihat pada gambar 13, gambar 14. Dan gambar 15.
Klub Ini Ingin Diperkuat Kembali oleh Messi
Klub asal Argentina, Newell s Old Boys mengutarakan keinginannya untuk bisa mendatangkan pemain bintang saat ini, Lionel Messi. Hal tersebut dingkapkan oleh sang presiden klub, Guillermo Lorente.
Klub yang bermain di Liga Primera ini memang bukanlah hal baru bagi seorang Messi.
Pasalnya, sebelum bergabung dengan Barcelona pada tahun 2000, Messi terlebih dahulu bermain dan menimba ilmu di Newell s pada medio 1995-2000.
Ternyata, pemain yang kini menginjak usai 25 tahun tersebut telah berubah menjadi pemain bintang dengan segudang prestasi. Hal tersebutlah yang membuat Lorente ingin mendatangkan kembali Messi dan mengulang masa lalu.
“Kami bisa kembali menonton Messi dan bermimpi pada suatu hari nanti ia mau kembali bermain di sini. Kala itu masih muda dan kini kami mengharapkan ia bisa kembali dan memilih mengakhiri kariernya di sini,” ungkap Lorente, seperti dilansir Goal, Selasa (17/7/2012).
Namun, keinginan Lorente tersebut belum mendapat tanggapan dari top skorer La Liga di musim lalu itu. Meskipun, sebelumya Messi sendiri pernah mengungkapkan keinginannya untuk mengakhiri karier sepakbolanya di Barcelona.
Gambar 11 Contoh dokumen
Gambar 12 Contoh pertanyaan
Klub Ini Ingin Diperkuat Kembali oleh Messi
Klub asal Argentina, Newell s Old Boys mengutarakan keinginannya untuk bisa mendatangkan pemain bintang saat ini, Lionel Messi .
Hal tersebut dingkapkan oleh sang presiden klub , Guillermo Lorente .
Gambar 13 Hasil ringkasan 25%
Klub Ini Ingin Diperkuat Kembali oleh Messi
Klub asal Argentina, Newell s Old Boys mengutarakan keinginannya untuk bisa mendatangkan pemain bintang saat ini, Lionel Messi.
Hal tersebut dingkapkan oleh sang presiden klub, Guillermo Lorente.
Pasalnya , sebelum bergabung dengan Barcelona pada tahun 2000 , Messi terlebih dahulu bermain dan menimba ilmu di Newell s pada medio 1995-2000.
Hal tersebutlah yang membuat Lorente ingin mendatangkan kembali Messi dan mengulang masa lalu.
Klub yang bermain di Liga Primera ini memang bukanlah hal baru bagi seorang Messi.
Gambar 14 Hasil ringkasan 50%
Klub Ini Ingin Diperkuat Kembali oleh Messi
Klub asal Argentina, Newell s Old Boys mengutarakan keinginannya untuk bisa mendatangkan pemain bintang saat ini, Lionel Messi.
Hal tersebut dingkapkan oleh sang presiden klub, Guillermo Lorente.
Pasalnya, sebelum bergabung dengan Barcelona pada tahun 2000, Messi terlebih dahulu bermain dan menimba ilmu di Newell s pada medio 1995-2000.
Hal tersebutlah yang membuat Lorente ingin mendatangkan kembali Messi dan mengulang masa lalu.
Kami bisa kembali menonton Messi dan bermimpi pada suatu hari nanti ia mau kembali bermain di sini.
Kala itu masih muda dan kini kami mengharapkan ia bisa kembali dan memilih mengakhiri kariernya di sini, ungkap Lorente, seperti dilansir Goal, Selasa ( 17/7/2012 ).
Gambar 15 Hasil ringkasan 75%
Contoh dokumen dapat dilihat pada gambar 16, dan hasil ringkasan dokumen 25%, 50% dan 75% dapat dilihat pada gambar 17, gambar 18 dan gambar 19. Contoh Pertanyaan pada gambar 20.
Luiz Adriano Dihukum Satu Laga
Buntut dari aksi tidak sportif Luiz Adriano di Liga Champions, UEFA akhirnya mengambil tindakan tegas. Penyerang Shakhtar Donetsk ini dilarang tampil satu pertandingan.
Komisi Disiplin UEFA beralasan striker asal Brasil berusia 25 tahun ini melanggar kode etik yang tertera dalam regulasi disiplin UEFA pasal 5 saat laga melawan Nordsjaelland di Kopenhagen pekan lalu.
Saat itu, Luiz Adriano menyerobot bola yang seharusnya diberikan kepada kiper tuan rumah. Aksi tidak sportif Luiz Adriano ini sontak jadi headline di seluruh dunia. Badan sepak bola Eropa itu pun segera memulai penyelidikan atas hal tersebut.
1.Apa nama klub yang ingin mendapatkan messi 2.Bermain di liga apakah klub tersebut? 3.Siapa nama presiden klub tersebut?
4.Kapan messi pernah bermain di klub tersebut? 5.Kapan messi bergabung dengan Barcelona?
Dengan demikian, Luiz Adriano tak bisa membela timnya ketika melakoni laga krusial menjamu Juventus di partai terakhir penyisihan Grup E. Shakhtar kini mengumpulkan nilai 10, sementara Juve 9 poin, dan Chelsea 7 poin. Hasil seri di Donbass Arena akan meloloskan Shakhtar dan Juve ke 16 besar sekaligus membuat The Blues yang berstatus sebagai juara bertahan LC tersingkir ke ajang Europa League.
Gambar 16 Contoh dokumen
Luiz Adriano Dihukum Satu Laga
Buntut dari aksi tidak sportif Luiz Adriano di Liga Champions, UEFA akhirnya mengambil tindakan tegas. Komisi Disiplin UEFA beralasan striker asal Brasil berusia 25 tahun ini melanggar kode etik yang tertera dalam regulasi disiplin UEFA pasal 5 saat laga melawan Nordsjaelland di Kopenhagen pekan lalu .
Gambar 17 Hasil ringkasan 25%
Luiz Adriano Dihukum Satu Laga
Buntut dari aksi tidak sportif Luiz Adriano di Liga Champions,UEFA akhirnya mengambil tindakan tegas. Komisi Disiplin UEFA beralasan striker asal Brasil berusia 25 tahun ini melanggar kode etik yang tertera dalam regulasi disiplin UEFA pasal 5 saat laga melawan Nordsjaelland di Kopenhagen pekan lalu.
Aksi tidak sportif Luiz Adriano ini sontak jadi headline di seluruh dunia.
Dengan demikian, Luiz Adriano tak bisa membela timnya ketika melakoni laga krusial menjamu Juventus di partai terakhir penyisihan Grup E. Shakhtar kini mengumpulkan nilai 10, sementara Juve 9 poin, dan Chelsea 7 poin.
Gambar 18 Hasil ringkasan 50%
Ket: Kata yang di garis bawah adalah kata yang bersinonim.
Luiz Adriano Dihukum Satu Laga
Buntut dari aksi tidak sportif Luiz Adriano di Liga Champions, UEFA akhirnya mengambil tindakan tegas. Penyerang Shakhtar Donetsk ini dilarang tampil satu pertandingan.
Komisi Disiplin UEFA beralasan striker asal Brasil berusia 25 tahun ini melanggar kode etik yang tertera dalam regulasi disiplin UEFA pasal 5 saat laga melawan Nordsjaelland di Kopenhagen pekan lalu.
Saat itu , Luiz Adriano menyerobot bola yang seharusnya diberikan kepada kiper tuan rumah.
Aksi tidak sportif Luiz Adriano ini sontak jadi headline di seluruh dunia.
Dengan demikian , Luiz Adriano tak bisa membela timnya ketika melakoni laga krusial menjamu Juventus di partai terakhir penyisihan Grup E.
Shakhtar kini mengumpulkan nilai 10 , sementara Juve 9 poin , dan Chelsea 7 poin.
Gambar 19 Hasil ringkasan 75%
Ket: Kata yang di garis bawah adalah kata yang bersinonim.
1. Siapa nama striker Shakhtar Donetsk yang dilarang tampil satu pertandingan?
2. Berasal dari Negara manakah pemain tersebut? 3. Berapa umur pemain tersebut?
4. Apa nama klub yang memiliki poin 9 di penyisihan grup E?
5. Apa nama klub yang memiliki poin 7 di penyisihan grupE?
Gambar 20 Daftar Pertanyaan
Hasil dari Q&A Evaluation untuk hasil kompresi 25%, 50% dan 75% dapat dilihat pada tabel1
Tabel 1 Q&A Evaluation
25% 50% 75% Persentase pertanyaan yang berhasil dijawab 56.24% 83.84% 96.02%
5. Pembahasan
Berdasarkan hasil pengujian di atas dapat disimpulkan hasil kompresi 75% memiliki banyak informasi, karena kalimat yang dibuang lebih sedikit. Sedangkan hasil kompresi 25% memiliki sedikit informasi karena banyak kalimat yang dibuang. Dari hasil Q&A Evaluation ada 32 dokumen yang nilai benarnya 100% untuk nilai kompresi 75% dan dalam pengujian ada 21 dokumen yang memiliki sinonim. Dalam pengujian ini masih ada beberapa kata masih salah tagging.
6. Kesimpulan
Kesimpulan yang diperoleh dari penelitian ini adalah: 1. Metode Weight of Feature telah berhasil
menampilkan hasil ringkasan dengan teknik ekstraksi.
2. Pada perancangan ini masih ada beberapa kata yang salah tagging.
3. Pada perancangan ini telah berhasil membaca kata yang bersinonim.
4. Dalam hasil perbandingan dengan perancangan sebelumnya nilai kompresi 75% mempunyai nilai lebih tinggi dari nilai kompresi 75% perancangan sebelumnya dangan nilai benar 96.02%
REFERENSI
[1] Aristoteles., 2011, “Pembobotan Fitur Pada Teks Bahasa Indonesia Menggunakan Algoritme Genetika”, Tesis Sekolah Pascasarjana Institut Pertanian Bogor.
[2] Abdullah, Bawakit., Mourad, Oussalah., 2008, “A Semantic Summarization System”, Proceeding The Frist Text Conference TAC (2008) November 17-19, 2008 Nasional Institute of Standards and Technology Gaithersburg, Maryland, USA
[3] Markus., 2007, “Pengenalan Entitas Bernama menggunakan Metode Association Rules Pada Dokumen Berbahasa Indonesia”, Skripsi Fakultas Ilmu Komputer
Program Studi Ilmu Komputer Universitas Indonesia, Depok, Jawa Barat.
[4] Budi, Susanto., 2012, “Pengantar Text Mining dan Intelligent Web”, Teknik Informatika UKDW Yogyakarta, Indonesia[5] William, B., Ricardo, Baeza-Yates., 1992, “Information Retrival : Data Structures & Algorithms, Upper Saddle River, Prentice Hall.
[6] Mohamed, Abdel, Fattah., Fuji, Ren., 2008, “Automatic Text Summarization”, World Academy of Science, Engineering and Technology.
[7] Zaenal, Arifin., 2008, “Cermat Berbahasa Indonesia”, Akademika Pressindo, Jakarta
[8] The Stanford Natural language processing Group,
“Stanford Classifer”,
http://nlp.stanford.edu/software/classifier.shtml
[9] Jenny, Rose, Finkel,et al., 2005, “Incorporating Non-Local Information into Information Extraction System By Gibbs Sampling”, ACL’ 05 Proceedings of the 43rd Annualy Meeting on association for Computational Linguistics.
Penulis Pertama, mahasiswa Universitas Tarumanagara
program studi Teknik Informatika Fakultas Teknologi Informasi
Penulis Kedua, memperoleh gelar Ir dari Departemen Teknik
Fisika Institut Teknologi Bandung, Indonesia dan memperoleh gelar M.Eng diperoleh dari Departement of Computer Science Asian Instute of Technology, Bangkok, Thailand.
Penulis Ketiga, memperoleh gelar S.Kom Universitas
Tarumanagara program studi Teknik Informatika Fakultas Teknologi Informasi dan memperoleh M.Kom dari Universitas Indonesia Depok Indonesia.