Tugas Matrikulasi Struktur Data – Universitas Budi Luhur
TUGAS MATRIKULASI
PAPER REVIEW
NATURAL LANGUAGE PROCESSING
Oleh:
AHMAD JURNAIDI WAHIDIN
1611600253
ANITA TRIANA
1611600352
ANGGER STYO YUNIARTI
1611600345
JONO AFRIANTO
1611600238
RATNASARI
1611600378
SARUNI DWI ASNAWATI
1611600246
PROGRAM MAGISTER ILMU KOMPUTER
UNIVERSITAS BUDI LUHUR – JAKARTA
TAHUN AKADEMIK
2016
Paper Review : Natural Language Processing –Universitas Budi Luhur
Paper Review:
Natural Language Processing
Ahmad Jurnaidi Wahidin1, Anita Triana2, Angger Styo Yuniarti3, Jono Afrianto4,
Ratnasari5, Saruni Dwi Asnawati6
Program Magister Ilmu Komputer,Fakultas Pascasarjana, Universitas Budi Luhur Jl. Raya Ciledug, Petukangan Utara, Kebayoran Lama, Jakarta Selatan 12260
E-mail : 1)ahmadjurnaidi@gmail.com, 2)anita.triana@gmail.com,
3)angger.sangpemimpi@gmail.com, 4)jn.kete@gmail.com, 5)rathna.saery@gmail.com, 6)saruni.dwiasnati25@gmail.com.
ABSTRAK
Bahasa alami (Natural Language) merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum. Pengambilan data dari bahasa alami merupakan proses dalam penerapan Natural Language Processing. Natural Language Processing merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence). NLP merupakan percobaan untuk mendapatkan representasi arti dari teks bebas yang lebih lengkap [3]. Beberapa teknik dan pendekatan digunakan serta dikembangkan dengan tujuan agar komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa sehari-hari (bahasa alami). Berdasarkan 10 jurnal nasional dan internasional yang sudah di-review dimana dapat disimpulkan bahwasanya Natural Language Processing dapat diimplementasikan dalam banyak bidang studi dengan memanfaatkan teks dan suara sebagai sumber pengambilan data dan aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application.
Kata kunci : Paper Review, Natural Language Processing, Bahasa Alami
1. PENDAHULUAN
Penggunaan bahasa alami (Natural
Language), bahasa keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas [5] (Jurnal ke 7).
Bahasa alami merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum.
Pengambilan data dari bahasa alami
merupakan proses dalam penerapan Natural
Language Processing. Natural Language
Processing merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence).
Pada era globalisasi ini, sudah banyak
aplikasi yang digunakan untuk
mengalihbahasakan bahasa daerah ke bahasa lain. Aplikasi ini menggunakan Natural
Language Processing. Natural Language
Processing (Pemrograman Bahasa Alami) adalah pembuatan program yang memiliki
kemampuan untuk memahami bahasa
manusia. Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antar
manusia. NLP adalah upaya untuk
mengekstrak lebih jauh representasi dari suatu teks bebas. Hal ini dapat dimasukkan
secara kasar seperti mencari siapa
melakukan apa kepada siapa, kapan, di mana, bagaimana dan mengapa. NLP biasanya membuat penggunaan konsep-konsep linguistic seperti kata benda, kata kerja, kata sifat, dan lainnya dan struktur gramatikal (baik direpresentasikan sebagai
ungkapan-ungkapan seperti frase nomina atau frase preposisional, atau hubungan ketergantungan seperti subjek dari- atau objek-dari) [1].
2. LANDASAN TEORI
2.1 Bahasa Alami (Natural Language)
Penggunaan bahasa alami, bahasa
keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas[5] (jurnal ke 7).
Bahasa melibatkan proses pengenalan bunyi atau huruf, sintaksis, kalimat, inferensi semantik tingkat tinggi bahkan komunikasi emosi lewat irama bicara. Untuk mengelola kerumitan ini, para ahli bahasa telah mendefinisikan tingkat analisis yang berbeda untuk bahasa alami yaitu persanjakan, fonologi, morfologi, sintaksis, semantik, pragmatik, dan pengetahuan tentang dunia sekitar [3]. Salah satu unit dasar bahasa alami adalah kalimat. Kalimat menyatakan pikiran secara lengkap dalam bentuk pertanyaan, perintah, atau seruan. Kalimat terdiri atas unit-unit individu yang disebut kata.
2.2 Pemrosesan Bahasa Alami (Natural
Language Processing)
Natural Language Processing (NLP) merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence).
NLP merupakan percobaan untuk
mendapatkan representasi arti dari teks bebas yang lebih lengkap [3].
Pengambilan kembali informasi yang
tersimpan dalam basis data bisa
dilaksanakan dengan menggunakan
pengolahan bahasa alami. Beberapa teknik
dan pendekatan digunakan serta
dikembangkan dengan tujuan agar komputer
mampu memahami instruksi/permintaan
manusia melalui penggunaan bahasa sehari-hari (bahasa alami). Elemen pengolah
translator, dan evaluator sebagaimana
ditampilkan pada Gambar 1 berikut ini.
Gambar 1. Komponen pengolah bahasa alami [6] (Jurnal no 5)
2.3 TerminologiNLP
Perkembangan NLP menghasilkan
kemungkinan dari interface bahasa natural menjadi knowledge base dan penterjemahan bahasa natural. [4] menjelaskan bahwa ada 3 (tiga) aspek utama pada teori pemahaman mengenai natural language:
1. Syntax: menjelaskan bentuk dari bahasa. Syntax biasa dispesifikasikan
oleh sebuah grammar. Natural
language jauh lebih daripada formal language yang digunakan untuk
logika kecerdasan buatan dan
program komputer
2. Semantics: menjelaskan arti dari kalimat dalam satu bahasa. Meskipun teori semantics secara umum sudah ada, ketika membangun sistem
natural language understanding
untuk aplikasi tertentu, akan
digunakan representasi yang paling sederhana.
Paper Review : Natural Language Processing –Universitas Budi Luhur 3. Pragmatics: menjelaskan bagaimana
pernyataan yang ada berhubungan dengan dunia. Untuk memahami
bahasa, agen harus
mempertimbangan lebih dari hanya sekedar kalimat. Agen harus melihat lebih ke dalam konteks kalimat, keadaan dunia, tujuan dari speaker dan listener, konvensi khusus, dan sejenisnya.
3. METODOLOGI PENELITIAN
Penelitian ini adalah memahami
penerapan sistem pengolahan bahasa alami (Natural Language Processing) Dalam melakukan penelitian ini langkah yang dilakukan adalah melakukan studi pustaka yang berkaitan dengan sistem pengolahan
bahasa alami (Natural Language
Processing) dimana dengan menganalisa 10 jurnal nasional maupun internasionnal yang
berhubungan dengan NLP. Kemudian
melakukan pengamatan terhadap
obyek-obyek yang terdapat disetiap jurnal,
dilanjutkan dengan mengelompokan jurnal berdasarkan ketentuan yang disiapkan. Setelah pengelompokan dilakukan dan mendapatkan data berupa tabel yang selanjutnya adalah membandingkan setiap jurnal, yang terkahir mengambil kesimpulan.
4. HASIL DAN PEMBAHASAN
4.1 Jurnal-Jurnal Yang Di Review
Berikut 10 jurnal yang menjadi bahan untuk direview:
No Nama Peneliti
(tahun) Judul Jurnal Alat analisis dan unit analisis Hipotesis penelitian
1 Nitesh Patel
dan V. N. Pati (2014)
Optimized Approach to Voice Translation
Terjemahan di komputer, laptop dan ponsel.
Mengembangkan sebuah model sistem baru untuk alat dan layanan terjemahan suara yang memproses bahasa alami dan mengkonversi,
dengan memanfaatkan metode
parsing penelitian ini lebih
berkonsetrasi menangkap kata
kunci dan menerjemahkannya.
2 Ying Li, Hojjat
Salmasian MD-MPH, Rave Harpaz PhD, Herbert Chase MD, Carol Friedman PhD (2011)
Determining the Reasons for Medication Prescriptions in the
EHR using Knowledge and
Natural Language Processing
Informasi pasien dan infromasi dari Electronic Health Record (EHR)
Menggunakan NLP untuk membuat
sebuah aplikasi yang dapat
membantu proses menentukan
resep obat pada seorang pasien
berdasarkan informasi yang
terkandung dalam Electronic
Health Record (EHR) sehingga dapat membantu dokter.
3 M ishalakshi,
Dr.V.
Krishnapriya (2013)
Automatic Generation of Commit Messages using Natural Language Processing
File dari perangkat lunak yang berupa kode.
Mengubah sebuah kode dari sebuah file dan diperbaharui menjadi sebuah pesan untuk mempermudah
untuk kegiatan pengembangan
sebuah proyek.
4 Nisa Kurniasih
Wangsanegara, Beki Subaeki (2015)
Implementasi Natural Language
Processing Dalam Pengukuran
Ketepatan Ejaan Yang
Disempurnakan (EYD) Pada
Abstrak Skripsi Menggunakan
20 abstak skripsi yang dapat di copy-paste ataupun menggunakan upload-file (Doc, docx, txt, pdf)
Kesalahan penulisan pada abstrak skripsi biasanya terletak pada kesalahan penulisan kata, tanda baca maupun huruf kapital.
Paper Review : Natural Language Processing –Universitas Budi Luhur
penulisan huruf kapital/ kata dan
tanda baca. Hasil pengujian
terhadap 20 abstrak skripsi
menunjukkan 70% sesuai dengan pemeriksaanmanua 5 Hernawan Sulistyanto dan Nurgiyatna (2015)
Pengembangan Model Pencarian Kamar Dalam Sistem Reservasi Hotel Dengan Antarmuka Bahasa Alami
Calon Tamu Hotel dan Scanner
(Analisis Leksikal), Parser
(Analisa Sintaks), Translator
(Analisis Semantik), Evaluator (Analisis Pragmatik)
Aplikasi Sistem Reservasi dengan
mengimplementasikan bahasa
alami mampu melaksanakan query terhadap data yang tersimpan dalam basis data dengan menggunakan bahasa Indonesia
6 James Suciadi
(2001)
Studi Analisis Metode-Metode Parsing Dan Interpretasi Semantik
Pada Natural Language
Processing
Tiga proses yang dilakukan untuk mencapai tujuan adalah Parshing
atau analisis sintakis yang
memeriksa kebenaran struktur kalimat berdasarkan gramer dan lexicon.
Jika aplikasi NLP yang dibuat
menggunakan grammar yang
kompleks, makaparser yang
menggabungkan metode top-down dan bottom-up merupakan pilihan yang terbaik karena mengatasi kekurangan pada masing-masing metode. Word-sense hierarchy yang
digunakan oleh selectional
restrictions sangat membantu dalam
melakukan proses word-sense
disambiguation, sehingga lebihbaik dibandingkan context activation.
7 Suwanto
Raharjo dan
Sri Hartati.
(2014)
Antarmuka Bahasa Alami Untuk
Melakukan Query Terhadap
Terjemahan Al-Quran
Al-Qur’an dan Scanner (Analisi
Leksikal), Parser (Analisis
Sintaks), Translator (Analisis Semantik) Evaluator (Analisis Pragmatik)
Aplikasi Terjemahan Al-Qur’an
dengan mengimplementasikan
bahasa alami mampu melaksanakan query terhadap data yang terismpan
dalam basis data dengan
menggunakan bahasa indonesia.
8 Ngurah Agus
Sanjaya ER
Purwarupa Aplikasi Perangkat Bergerak Untuk Alihbahasa
XCODE dan Scanner (Analisi Leksikal), Parser (Analisis
Aplikasi Alih Bahasa dari Bahasa Inggris Ke Bahasa Bali dengan
dan Agus Muliantara. (2014)
Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis Aturan
Sintaks), Analisis Alih Bahasa mengimplementasikan bahasa
alami mampu melaksanakan query terhadap data yang terismpan dalam basis data dengan menggunakan bahasa Bali.
9 Setyawan
Wibisono (2013)
Aplikasi Pengolah Bahasa Alami Untuk Query Basis data
Akademik Dengan Format Data Xml
Data akademik mahasiswa dari
sistem akademik Universitas
Stikubank Semarang
Proses yang dilakukan oleh aplikasi ini adalah mengidentifikasi kata-kata dalam kalimat alami dan melihat struktur kalimat.
10 Herny
Februariyanti dan Eri Zuliarso (2013)
Membangun Aplikasi Natural Language Processing
Menggunakan Instant Messenger Untuk Informasi Bencana
Intant Messager dengan memanfaatkanlayanan Google Talt dan mempunyai account email Gmail
Instant Messaging untuk bertukar informasi seputar bencana alam sebelum dan sesudah bencana itu terjadi serta memiliki fasilitas Question Answer yang dapat menjawab kebutuhan request informasi bencana dari pengguna
Paper Review : Natural Language Processing –Universitas Budi Luhur
4.2 Aplikasi Dalam Bidang Natural
Language
Jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah: Text-based application dan dialogue-based application.
Text-based application mencakup segala macam aplikasi yang melakukan proses terhadap aplikasi tertulis seperti misalnya buku, berita,surat kabar, email dan lain-lain. Dialogue – based applications idealnya pendekatan ini melibatkjan bahasa lisan atau pengenalan suara,akan tetapi bidang ini juga
memasukkan interaksi dengan cara
memasukkan teks pertanyaan memalui kybord. Berikut pengelompokan 10 jurnal
yang telah direview berdasarkan jenis
aplikasinya: Jurnal Jenis Aplikasi Text-based application Dialogue-based application [1] √ [2] √ [3] √ [4] √ [5] √ [6] √ √ [7] √ [8] √ [9] √ [10] √
Tabel 2. Pengelompokan jurnal berdasarkan aplikasi dalam bidang NLP
4.3 Jenis Data dan Bidang Studi
Berikut pengelompokan 10 jurnal yang telah direview berdasarkan data dan bidang studi:
Jur nal
Data yang
didapat Bidang Studi
Text Suara A B C D E F G [1] √ √ √ √ √ √ [2] √ √ [3] √ √ √ [4] √ √ [5] √ √ √ [6] √ √ √ √ [7] √ √ √ √ [8] √ √ √ √ [9] √ √ √ [10] √ √ √ √ √ √
Tabel 3. Pengelompokan jurnal berdasarkan jenis data dan bidang studi
Keterangan bidang studi:
[A] Terjemahan Mesin
[B] Pengolahan teks bahasa alami
[C] User interface
[D] Multibahasa dan pengambilan informasi bahasa silang
[E] Pengenalan suara
[F] Kecerdasan buatan
[G] Sistem pakar
4.4Area Utama Penelitian Pada Field NLP
Pustejovsky dan Stubbs (2012)
menjelaskan bahwa ada beberapa area utama penelitian pada field NLP[2], diantaranya:
1. Question Answering Systems (QAS).
Kemampuan komputer untuk menjawab pertanyaan yang diberikan oleh user. Daripada memasukkan keyword ke dalam browser pencarian, dengan QAS, user bisa langsung bertanya dalam bahasa natural yang digunakannya, baik
itu Inggris, Mandarin, ataupun
Indonesia.
2. Summarization. Pembuatan ringkasan
dari sekumpulan konten dokumen atau email. Dengan menggunakan aplikasi
ini, user bisa dibantu untuk
mengkonversikan dokumen teks yang besar ke dalam bentuk slide presentasi.
3. Machine Translation. Produk yang
dihasilkan adalah aplikasi yang dapat
memahami bahasa manusia dan
menterjemahkannya ke dalam bahasa lain. Termasuk di dalamnya adalah Google Translate yang apabila dicermati semakin membaik dalam penterjemahan
bahasa. Contoh lain lagi adalah BabelFish yang menterjemahkan bahasa pada real time.
4. Speech Recognition. Field ini
merupakan cabang ilmu NLP yang cukup sulit. Proses pembangunan model untuk digunakan telpon/komputer dalam mengenali bahasa yang diucapkan sudah banyak dikerjakan. Bahasa yang sering digunakan adalah berupa pertanyaan dan perintah.
5. Document classification. Sedangkan
aplikasi ini adalah merupakan area penelitian NLP Yang paling sukses. Pekerjaan yang dilakukan aplikasi ini adalah menentukan dimana tempat terbaik dokumen yang baru diinputkan ke dalam sistem. Hal ini sangat berguna pada aplikasi spam filtering, news article classification, dan movie review. Berikut pengelompokan 10 jurnal yang telah direview berdasarkan area utama penelitian:
Jurn al QAS Sum mari zatio n Mac hine Tran slati on Spee ch Reco gniti on Docu ment class ificat ion [1] √ [2] √ [3] √ [4] √ [5] √ [6] √ [7] √ [8] √ [9] √ [10] √ √
Tabel 4. Pengelompokan jurnal berdasarkan area utama penelitian
5. PENUTUP
5.1.Kesimpulan
Berdasarkan hasil pembahasan
mengenai Natural Language Processing
menggunakan bahasa alami dalam
penerapannya. Dimana aplikasi yang dapat dibuat adalah alihbahasa dan banyak lainnya, jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application. Pendekatan NLP dikembangkan dengan tujuan agar komputer mampu memahami
instruksi/permintaan manusia melalui
penggunaan bahasa bahasa alami.
Hasil review terhadap 10 jurnal
menyimpulkan jenis data yang didapat sebagai sumber bahasa adalah teks dan suara.
5.2.Saran
Setelah melakukan review pada 10
jurnal, maka penulis memilik saran untuk
pengembangan aplikasi selanjutnya
memanfaatkan suara sebagai sumber data
dan Dialogue-based application sebagai
jenis aplikasi yang digunakan karena masih sedikit dalam penerapannya.
DAFTAR PUSTAKA
[1] Daeli, Irlani. Natural Language
Processing Analysis Of Sentences With Turbo Prolog. Universitas Gunadarma [2] Pustejovsky, J., Stubbs A. (2012).
Natural Language Annotation for Machine Learning. Beijing: O’Reilly [3] Kao, A., Poteet, S. R. (2007). Natural
Language Processing and Text
Mining. USA: Springer.
[4] Poole L. David dan Mackworth K. Alan
(2010),”Artifical Intelligence”
University of British Columbia:
Vancouver
[5] Wicaksana, I.W.S, Wulandari, L, dan Wirawan, S. (2005), “Pentingnya
Paper Review : Natural Language Processing –Universitas Budi Luhur
Interoperabilitas Informasi
berbasiskan Komputer karena
Keragaman Semantik” Prosiding
Seminar Ilmiah Nasional (PESAT
2005), Universitas Gunadarma,
Jakarta, halaman S9-S16, 2005
[6] Sulistyanto, Hernawan, Nurgiyatna,
(2015), “Pengembangan Model
Pencarian Kamar Dalam Sistem Reservasi Hotel Dengan Antarmuka
Bahasa Alami”, Universitas
Muhammadiyah Surakarta: Surakarta. [7] Raharjo, Suwanto, Hartati, Sri, (2014)
“Antarmuka Bahasa Alami Untuk
Melakukan Query Terhadap
Terjemahan Al-Quran’.UGM.
Yogyakarta.
[8] Wibisono, Setyawan (2013), “Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik dengan Format
Data Xml”, Universitas
Stikubank:Semarang.
[9] Kurniasih, Nisa, dkk, (2015), ”
Implementasi Natural Language
Processing Dalam Pengukuran
Ketepatan Ejaan Yang Disempurnakan
(EYD) Pada Abstrak Skripsi
Menggunakan Algoritma Fuzzy
Logic”, UIN Sunan Gunung Djati:
Bandung.
[10] Agus, Ngurah, Muliantara Agus (2014),
“Purwarupa Aplikasi Perangkat
Bergerak Untuk Alihbahasa Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis
Aturan”, Universitas Udayana:
Bandung.
[11] Suciadi James (2004),” Studi Analisis
Metode-Metode Parsing dan
Interpretasi Semantik Pada Natural Language Processing”, Universistas Kristen Petra: Surabaya.
[12] Patel Nitesh , Patil V. N. (2012),
”Optimized Approach to Voice
Translation”, Talegaon Dabhade
Taluka Maval Dist: Pune Maharashtra
[13] Li Ying (2011),”Determining the Reasons for Medication Prescriptions in the EHR using Knowledge and
Natural Language Processing”,
Department of Biomedical
Informatics, Columbia University,
New York
[14] Ishalakshi M., Krishnapriya V.
(2013),” Automatic Generation of
Commit Messages using Natural Language Processing”, Department of Computer Science, Sri Ramakrishna College of Arts and Science for Women, Coimbatore.