TUGAS MATRIKULASI
PAPER REVIEW
NATURAL LANGUAGE PROCESSING
Oleh:
AHMAD JURNAIDI WAHIDIN
1611600253
ANITA TRIANA
1611600352
ANGGER STYO YUNIARTI
1611600345
JONO AFRIANTO
1611600238
RATNASARI
1611600378
SARUNI DWI ASNAWATI
1611600246
PROGRAM MAGISTER ILMU KOMPUTER
UNIVERSITAS BUDI LUHUR
–
JAKARTA
TAHUN AKADEMIK
Paper Review : Natural Language Processing –Universitas Budi Luhur
Paper Review:
Natural Language Processing
Ahmad Jurnaidi Wahidin1, Anita Triana2, Angger Styo Yuniarti3, Jono Afrianto4,
Ratnasari5, Saruni Dwi Asnawati6
Program Magister Ilmu Komputer,Fakultas Pascasarjana, Universitas Budi Luhur
Jl. Raya Ciledug, Petukangan Utara, Kebayoran Lama, Jakarta Selatan 12260 E-mail : 1)ahmadjurnaidi@gmail.com, 2)anita.triana@gmail.com,
3)angger.sangpemimpi@gmail.com, 4)jn.kete@gmail.com, 5)rathna.saery@gmail.com, 6)saruni.dwiasnati25@gmail.com.
ABSTRAK
Bahasa alami (Natural Language) merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum. Pengambilan data dari bahasa alami merupakan proses dalam penerapan Natural Language Processing. Natura l Language Processing
merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence). NLP merupakan percobaan untuk mendapatkan representasi arti dari teks bebas yang lebih lengkap [3]. Beberapa teknik dan pendekatan digunakan serta dikembangkan dengan tujuan agar komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa sehari-hari (bahasa alami). Berdasarkan 10 jurnal nasional dan internasional yang sudah di-review
dimana dapat disimpulkan bahwasanya Natural Language Processing dapat diimplementasikan dalam banyak bidang studi dengan memanfaatkan teks dan suara sebagai sumber pengambilan datadan aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application.
Kata kunci : Paper Review, Natural Language Processing, Bahasa Alami
1. PENDAHULUAN
Penggunaan bahasa alami (Natural Language), bahasa keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas [5] (Jurnal ke 7).
Bahasa alami merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum. Pengambilan data dari bahasa alami merupakan proses dalam penerapan Natural
Language Processing. Natural Language
Processing merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence).
Pada era globalisasi ini, sudah banyak aplikasi yang digunakan untuk
mengalihbahasakan bahasa daerah ke bahasa lain. Aplikasi ini menggunakan Natural
Language Processing. Natural Language
Processing (Pemrograman Bahasa Alami)
ungkapan-ungkapan seperti frase nomina atau frase preposisional, atau hubungan ketergantungan seperti subjek dari- atau objek-dari) [1].
2. LANDASAN TEORI
2.1 Bahasa Alami (Natural Language)
Penggunaan bahasa alami, bahasa keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas[5] (jurnal ke 7).
Bahasa melibatkan proses pengenalan bunyi atau huruf, sintaksis, kalimat, inferensi semantik tingkat tinggi bahkan komunikasi emosi lewat irama bicara. Untuk mengelola kerumitan ini, para ahli bahasa telah mendefinisikan tingkat analisis yang berbeda untuk bahasa alami yaitu persanjakan, fonologi, morfologi, sintaksis, semantik, pragmatik, dan pengetahuan tentang dunia sekitar [3]. Salah satu unit dasar bahasa alami adalah kalimat. Kalimat menyatakan pikiran secara lengkap dalam bentuk pertanyaan, perintah, atau seruan. Kalimat terdiri atas unit-unit individu yang disebut kata.
2.2 Pemrosesan Bahasa Alami (Natural
Language Processing)
Natural Language Processing (NLP)
merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence). NLP merupakan percobaan untuk mendapatkan representasi arti dari teks bebas yang lebih lengkap [3].
Pengambilan kembali informasi yang tersimpan dalam basis data bisa dilaksanakan dengan menggunakan pengolahan bahasa alami. Beberapa teknik dan pendekatan digunakan serta dikembangkan dengan tujuan agar komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa
sehari-translator, dan evaluator sebagaimana ditampilkan pada Gambar 1 berikut ini.
Gambar 1. Komponen pengolah bahasa alami [6] (Jurnal no 5)
2.3 TerminologiNLP
Perkembangan NLP menghasilkan kemungkinan dari interface bahasa natural menjadi knowledge base dan penterjemahan bahasa natural. [4] menjelaskan bahwa ada 3 (tiga) aspek utama pada teori pemahaman mengenai natural language:
1. Syntax: menjelaskan bentuk dari bahasa. Syntax biasa dispesifikasikan oleh sebuah grammar. Natural language jauh lebih daripada formal language yang digunakan untuk logika kecerdasan buatan dan program komputer
Paper Review : Natural Language Processing –Universitas Budi Luhur
3. Pragmatics: menjelaskan bagaimana pernyataan yang ada berhubungan dengan dunia. Untuk memahami bahasa, agen harus mempertimbangan lebih dari hanya sekedar kalimat. Agen harus melihat lebih ke dalam konteks kalimat, keadaan dunia, tujuan dari speaker dan listener, konvensi khusus, dan sejenisnya.
3. METODOLOGI PENELITIAN
Penelitian ini adalah memahami penerapan sistem pengolahan bahasa alami
(Natural Language Processing) Dalam
4. HASIL DAN PEMBAHASAN 4.1 Jurnal-Jurnal Yang Di Review
Berikut 10 jurnal yang menjadi bahan untuk direview:
No Nama Peneliti
(tahun) Judul Jurnal Alat analisis dan unit analisis Hipotesis penelitian
1 Nitesh Patel dan V. N. Pati (2014)
Optimized Approach to Voice Translation
Terjemahan di komputer, laptop dan ponsel.
Mengembangkan sebuah model sistem baru untuk alat dan layanan terjemahan suara yang memproses bahasa alami dan mengkonversi, dengan memanfaatkan metode parsing penelitian ini lebih berkonsetrasi menangkap kata kunci dan menerjemahkannya. 2 Ying Li, Hojjat
Determining the Reasons for Medication Prescriptions in the EHR using Knowledge and Natural Language Processing
Informasi pasien dan infromasi dari Electronic Health Record (EHR)
Menggunakan NLP untuk membuat sebuah aplikasi yang dapat membantu proses menentukan resep obat pada seorang pasien berdasarkan informasi yang terkandung dalam Electronic Health Record (EHR) sehingga dapat membantu dokter.
3 M ishalakshi, Dr.V.
Krishnapriya (2013)
Automatic Generation of Commit Messages using Natural Language Processing
File dari perangkat lunak yang berupa kode.
Mengubah sebuah kode dari sebuah file dan diperbaharui menjadi sebuah pesan untuk mempermudah untuk kegiatan pengembangan sebuah proyek.
4 Nisa Kurniasih Wangsanegara, Beki Subaeki (2015)
Implementasi Natural Language
Processing Dalam Pengukuran
Ketepatan Ejaan Yang Disempurnakan (EYD) Pada Abstrak Skripsi Menggunakan
20 abstak skripsi yang dapat di
copy-paste ataupun menggunakan
upload-file (Doc, docx, txt, pdf)
Kesalahan penulisan pada abstrak skripsi biasanya terletak pada kesalahan penulisan kata, tanda baca maupun huruf kapital.
Paper Review : Natural Language Processing –Universitas Budi Luhur
penulisan huruf kapital/ kata dan tanda baca. Hasil pengujian terhadap 20 abstrak skripsi menunjukkan 70% sesuai dengan pemeriksaanmanua
Pengembangan Model Pencarian Kamar Dalam Sistem Reservasi Hotel Dengan Antarmuka Bahasa Alami
Calon Tamu Hotel dan Scanner
(Analisis Leksikal), Parser (Analisa Sintaks), Translator (Analisis Semantik), Evaluator (Analisis Pragmatik)
Aplikasi Sistem Reservasi dengan mengimplementasikan bahasa alami mampu melaksanakan query terhadap data yang tersimpan dalam basis data dengan menggunakan bahasa Indonesia
6 James Suciadi (2001)
Studi Analisis Metode-Metode Parsing Dan Interpretasi Semantik Pada Natural Language Processing
Tiga proses yang dilakukan untuk mencapai tujuan adalah Parshing atau analisis sintakis yang memeriksa kebenaran struktur kalimat berdasarkan gramer dan lexicon.
Jika aplikasi NLP yang dibuat menggunakan grammar yang kompleks, makaparser yang menggabungkan metode top-down dan bottom-up merupakan pilihan yang terbaik karena mengatasi kekurangan pada masing-masing metode. Word-sense hierarchy yang digunakan oleh selectional restrictions sangat membantu dalam melakukan proses word-sense disambiguation, sehingga lebihbaik dibandingkan context activation. 7 Suwanto
Raharjo dan Sri Hartati. (2014)
Antarmuka Bahasa Alami Untuk Melakukan Query Terhadap Terjemahan Al-Quran
Al-Qur’an dan Scanner (Analisi Leksikal), Parser (Analisis Sintaks), Translator (Analisis Semantik) Evaluator (Analisis Pragmatik)
Aplikasi Terjemahan Al-Qur’an dengan mengimplementasikan bahasa alami mampu melaksanakan query terhadap data yang terismpan dalam basis data dengan menggunakan bahasa indonesia. 8 Ngurah Agus
Sanjaya ER
Purwarupa Aplikasi Perangkat Bergerak Untuk Alihbahasa
XCODE dan Scanner (Analisi Leksikal), Parser (Analisis
dan Agus Muliantara. (2014)
Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis Aturan
Sintaks), Analisis Alih Bahasa mengimplementasikan bahasa alami mampu melaksanakan query terhadap data yang terismpan dalam basis data dengan menggunakan bahasa Bali.
9 Setyawan Wibisono (2013)
Aplikasi Pengolah Bahasa Alami Untuk Query Basis data
Akademik Dengan Format Data Xml
Data akademik mahasiswa dari sistem akademik Universitas Stikubank Semarang
Proses yang dilakukan oleh aplikasi ini adalah mengidentifikasi kata-kata dalam kalimat alami dan melihat struktur kalimat.
10 Herny Februariyanti danEri Zuliarso (2013)
Membangun Aplikasi Natural Language Processing
Menggunakan Instant Messenger Untuk Informasi Bencana
Intant Messager dengan memanfaatkanlayanan Google Talt dan mempunyai account email Gmail
Paper Review : Natural Language Processing –Universitas Budi Luhur
4.2 Aplikasi Dalam Bidang Natural
Language
Jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah: Text-based application dan dialogue-based application.
Text-based application mencakup segala macam aplikasi yang melakukan proses terhadap aplikasi tertulis seperti misalnya buku, berita,surat kabar, email dan lain-lain.
Dialogue – based applications idealnya pendekatan ini melibatkjan bahasa lisan atau pengenalan suara,akan tetapi bidang ini juga memasukkan interaksi dengan cara memasukkan teks pertanyaan memalui kybord. Berikut pengelompokan 10 jurnal yang telah direview berdasarkan jenis aplikasinya:
Tabel 2. Pengelompokan jurnal berdasarkan aplikasi dalam bidang NLP
4.3 Jenis Data dan Bidang Studi
Berikut pengelompokan 10 jurnal yang telah direview berdasarkan data dan bidang studi:
Jur nal
Data yang
didapat Bidang Studi
Text Suara A B C D E F G
Tabel 3. Pengelompokan jurnal berdasarkan jenis data dan bidang studi
Keterangan bidang studi:
[A] Terjemahan Mesin
[B] Pengolahan teks bahasa alami [C] User interface
[D] Multibahasa dan pengambilan informasi
bahasa silang
[E] Pengenalan suara [F] Kecerdasan buatan [G] Sistem pakar
4.4Area Utama Penelitian Pada Field NLP
Pustejovsky dan Stubbs (2012) menjelaskan bahwa ada beberapa area utama penelitian pada field NLP[2], diantaranya:
1. Question Answering Systems (QAS). Kemampuan komputer untuk menjawab pertanyaan yang diberikan oleh user. Daripada memasukkan keyword ke dalam browser pencarian, dengan QAS, user bisa langsung bertanya dalam bahasa natural yang digunakannya, baik itu Inggris, Mandarin, ataupun Indonesia.
2. Summarization. Pembuatan ringkasan dari sekumpulan konten dokumen atau email. Dengan menggunakan aplikasi ini, user bisa dibantu untuk mengkonversikan dokumen teks yang besar ke dalam bentuk slide presentasi. 3. Machine Translation. Produk yang
bahasa. Contoh lain lagi adalah BabelFish yang menterjemahkan bahasa pada real time.
4. Speech Recognition. Field ini merupakan cabang ilmu NLP yang cukup sulit. Proses pembangunan model untuk digunakan telpon/komputer dalam mengenali bahasa yang diucapkan sudah banyak dikerjakan. Bahasa yang sering digunakan adalah berupa pertanyaan dan perintah.
5. Document classification. Sedangkan aplikasi ini adalah merupakan area penelitian NLP Yang paling sukses. Pekerjaan yang dilakukan aplikasi ini adalah menentukan dimana tempat terbaik dokumen yang baru diinputkan ke dalam sistem. Hal ini sangat berguna pada aplikasi spam filtering, news article classification, dan movie review. Berikut pengelompokan 10 jurnal yang telah direview berdasarkan area utama penelitian:
Jurn
Tabel 4. Pengelompokan jurnal berdasarkan area utama penelitian
5. PENUTUP
5.1.Kesimpulan
Berdasarkan hasil pembahasan
menggunakan bahasa alami dalam penerapannya. Dimana aplikasi yang dapat dibuat adalah alihbahasa dan banyak lainnya, jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application. Pendekatan NLP dikembangkan dengan tujuan agar komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa bahasa alami.
Hasil review terhadap 10 jurnal menyimpulkan jenis data yang didapat sebagai sumber bahasa adalah teks dan suara.
5.2.Saran
Setelah melakukan review pada 10 jurnal, maka penulis memilik saran untuk pengembangan aplikasi selanjutnya memanfaatkan suara sebagai sumber data dan Dialogue-based application sebagai jenis aplikasi yang digunakan karena masih sedikit dalam penerapannya.
DAFTAR PUSTAKA
[1] Daeli, Irlani. Natural Language Processing Analysis Of Sentences With Turbo Prolog. Universitas Gunadarma [2] Pustejovsky, J., Stubbs A. (2012).
Natural Language Annotation for Machine Learning. Beijing: O’Reilly
[3] Kao, A., Poteet, S. R. (2007). Natural
Language Processing and Text
Mining. USA: Springer.
[4] Poole L. David dan Mackworth K. Alan (2010),”Artifical Intelligence” University of British Columbia: Vancouver
Paper Review : Natural Language Processing –Universitas Budi Luhur
Interoperabilitas Informasi
berbasiskan Komputer karena
Keragaman Semantik” Prosiding
Seminar Ilmiah Nasional (PESAT 2005), Universitas Gunadarma, Jakarta, halaman S9-S16, 2005
[6] Sulistyanto, Hernawan, Nurgiyatna, (2015), “Pengembangan Model
Pencarian Kamar Dalam Sistem
Reservasi Hotel Dengan Antarmuka
Bahasa Alami”, Universitas
Muhammadiyah Surakarta: Surakarta. [7] Raharjo, Suwanto, Hartati, Sri, (2014)
“Antarmuka Bahasa Alami Untuk
Melakukan Query Terhadap
Terjemahan Al-Quran’.UGM.
Yogyakarta.
[8] Wibisono, Setyawan (2013), “Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik dengan Format
Data Xml”, Universitas
Stikubank:Semarang.
[9] Kurniasih, Nisa, dkk, (2015), ”
Implementasi Natural Language
Processing Dalam Pengukuran
Ketepatan Ejaan Yang Disempurnakan
(EYD) Pada Abstrak Skripsi
Menggunakan Algoritma Fuzzy
Logic”, UIN Sunan Gunung Djati:
Bandung.
[10] Agus, Ngurah, Muliantara Agus (2014),
“Purwarupa Aplikasi Perangkat
Bergerak Untuk Alihbahasa Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis
Aturan”, Universitas Udayana:
Bandung.
[11] Suciadi James (2004),” Studi Analisis
Metode-Metode Parsing dan
Interpretasi Semantik Pada Natural Language Processing”, Universistas Kristen Petra: Surabaya.
[12] Patel Nitesh , Patil V. N. (2012),
”Optimized Approach to Voice
Translation”, Talegaon Dabhade
Taluka Maval Dist: Pune Maharashtra
[13] Li Ying (2011),”Determining the Reasons for Medication Prescriptions in the EHR using Knowledge and
Natural Language Processing”,
Department of Biomedical Informatics, Columbia University, New York
[14] Ishalakshi M., Krishnapriya V. (2013),” Automatic Generation of
Commit Messages using Natural