• Tidak ada hasil yang ditemukan

TUGAS MATRIKULASI PAPER REVIEW NATURAL LANGUAGE PROCESSING. Oleh:

N/A
N/A
Protected

Academic year: 2021

Membagikan "TUGAS MATRIKULASI PAPER REVIEW NATURAL LANGUAGE PROCESSING. Oleh:"

Copied!
10
0
0

Teks penuh

(1)

Tugas Matrikulasi Struktur Data – Universitas Budi Luhur

TUGAS MATRIKULASI

PAPER REVIEW

NATURAL LANGUAGE PROCESSING

Oleh:

AHMAD JURNAIDI WAHIDIN

1611600253

ANITA TRIANA

1611600352

ANGGER STYO YUNIARTI

1611600345

JONO AFRIANTO

1611600238

RATNASARI

1611600378

SARUNI DWI ASNAWATI

1611600246

PROGRAM MAGISTER ILMU KOMPUTER

UNIVERSITAS BUDI LUHUR – JAKARTA

TAHUN AKADEMIK

2016

(2)

Paper Review : Natural Language Processing –Universitas Budi Luhur

Paper Review:

Natural Language Processing

Ahmad Jurnaidi Wahidin1, Anita Triana2, Angger Styo Yuniarti3, Jono Afrianto4,

Ratnasari5, Saruni Dwi Asnawati6

Program Magister Ilmu Komputer,Fakultas Pascasarjana, Universitas Budi Luhur Jl. Raya Ciledug, Petukangan Utara, Kebayoran Lama, Jakarta Selatan 12260

E-mail : 1)ahmadjurnaidi@gmail.com, 2)anita.triana@gmail.com,

3)angger.sangpemimpi@gmail.com, 4)jn.kete@gmail.com, 5)rathna.saery@gmail.com, 6)saruni.dwiasnati25@gmail.com.

ABSTRAK

Bahasa alami (Natural Language) merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum. Pengambilan data dari bahasa alami merupakan proses dalam penerapan Natural Language Processing. Natural Language Processing merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence). NLP merupakan percobaan untuk mendapatkan representasi arti dari teks bebas yang lebih lengkap [3]. Beberapa teknik dan pendekatan digunakan serta dikembangkan dengan tujuan agar komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa sehari-hari (bahasa alami). Berdasarkan 10 jurnal nasional dan internasional yang sudah di-review dimana dapat disimpulkan bahwasanya Natural Language Processing dapat diimplementasikan dalam banyak bidang studi dengan memanfaatkan teks dan suara sebagai sumber pengambilan data dan aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application.

Kata kunci : Paper Review, Natural Language Processing, Bahasa Alami

1. PENDAHULUAN

Penggunaan bahasa alami (Natural

Language), bahasa keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas [5] (Jurnal ke 7).

Bahasa alami merupakan suatu bahasa yang diucapkan, ditulis dan diisyaratkan oleh manusia untuk komunikasi umum.

Pengambilan data dari bahasa alami

merupakan proses dalam penerapan Natural

Language Processing. Natural Language

Processing merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence).

Pada era globalisasi ini, sudah banyak

aplikasi yang digunakan untuk

mengalihbahasakan bahasa daerah ke bahasa lain. Aplikasi ini menggunakan Natural

Language Processing. Natural Language

Processing (Pemrograman Bahasa Alami) adalah pembuatan program yang memiliki

kemampuan untuk memahami bahasa

manusia. Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antar

manusia. NLP adalah upaya untuk

mengekstrak lebih jauh representasi dari suatu teks bebas. Hal ini dapat dimasukkan

secara kasar seperti mencari siapa

melakukan apa kepada siapa, kapan, di mana, bagaimana dan mengapa. NLP biasanya membuat penggunaan konsep-konsep linguistic seperti kata benda, kata kerja, kata sifat, dan lainnya dan struktur gramatikal (baik direpresentasikan sebagai

(3)

ungkapan-ungkapan seperti frase nomina atau frase preposisional, atau hubungan ketergantungan seperti subjek dari- atau objek-dari) [1].

2. LANDASAN TEORI

2.1 Bahasa Alami (Natural Language)

Penggunaan bahasa alami, bahasa

keseharian seperti bahasa Indonesia dalam era internet sekarang bukan lagi merupakan domain ilmu sosial saja namun juga ilmu eksak seperti komputasi dengan tujuan interoperabilitas[5] (jurnal ke 7).

Bahasa melibatkan proses pengenalan bunyi atau huruf, sintaksis, kalimat, inferensi semantik tingkat tinggi bahkan komunikasi emosi lewat irama bicara. Untuk mengelola kerumitan ini, para ahli bahasa telah mendefinisikan tingkat analisis yang berbeda untuk bahasa alami yaitu persanjakan, fonologi, morfologi, sintaksis, semantik, pragmatik, dan pengetahuan tentang dunia sekitar [3]. Salah satu unit dasar bahasa alami adalah kalimat. Kalimat menyatakan pikiran secara lengkap dalam bentuk pertanyaan, perintah, atau seruan. Kalimat terdiri atas unit-unit individu yang disebut kata.

2.2 Pemrosesan Bahasa Alami (Natural

Language Processing)

Natural Language Processing (NLP) merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence).

NLP merupakan percobaan untuk

mendapatkan representasi arti dari teks bebas yang lebih lengkap [3].

Pengambilan kembali informasi yang

tersimpan dalam basis data bisa

dilaksanakan dengan menggunakan

pengolahan bahasa alami. Beberapa teknik

dan pendekatan digunakan serta

dikembangkan dengan tujuan agar komputer

mampu memahami instruksi/permintaan

manusia melalui penggunaan bahasa sehari-hari (bahasa alami). Elemen pengolah

translator, dan evaluator sebagaimana

ditampilkan pada Gambar 1 berikut ini.

Gambar 1. Komponen pengolah bahasa alami [6] (Jurnal no 5)

2.3 TerminologiNLP

Perkembangan NLP menghasilkan

kemungkinan dari interface bahasa natural menjadi knowledge base dan penterjemahan bahasa natural. [4] menjelaskan bahwa ada 3 (tiga) aspek utama pada teori pemahaman mengenai natural language:

1. Syntax: menjelaskan bentuk dari bahasa. Syntax biasa dispesifikasikan

oleh sebuah grammar. Natural

language jauh lebih daripada formal language yang digunakan untuk

logika kecerdasan buatan dan

program komputer

2. Semantics: menjelaskan arti dari kalimat dalam satu bahasa. Meskipun teori semantics secara umum sudah ada, ketika membangun sistem

natural language understanding

untuk aplikasi tertentu, akan

digunakan representasi yang paling sederhana.

(4)

Paper Review : Natural Language Processing –Universitas Budi Luhur 3. Pragmatics: menjelaskan bagaimana

pernyataan yang ada berhubungan dengan dunia. Untuk memahami

bahasa, agen harus

mempertimbangan lebih dari hanya sekedar kalimat. Agen harus melihat lebih ke dalam konteks kalimat, keadaan dunia, tujuan dari speaker dan listener, konvensi khusus, dan sejenisnya.

3. METODOLOGI PENELITIAN

Penelitian ini adalah memahami

penerapan sistem pengolahan bahasa alami (Natural Language Processing) Dalam melakukan penelitian ini langkah yang dilakukan adalah melakukan studi pustaka yang berkaitan dengan sistem pengolahan

bahasa alami (Natural Language

Processing) dimana dengan menganalisa 10 jurnal nasional maupun internasionnal yang

berhubungan dengan NLP. Kemudian

melakukan pengamatan terhadap

obyek-obyek yang terdapat disetiap jurnal,

dilanjutkan dengan mengelompokan jurnal berdasarkan ketentuan yang disiapkan. Setelah pengelompokan dilakukan dan mendapatkan data berupa tabel yang selanjutnya adalah membandingkan setiap jurnal, yang terkahir mengambil kesimpulan.

(5)

4. HASIL DAN PEMBAHASAN

4.1 Jurnal-Jurnal Yang Di Review

Berikut 10 jurnal yang menjadi bahan untuk direview:

No Nama Peneliti

(tahun) Judul Jurnal Alat analisis dan unit analisis Hipotesis penelitian

1 Nitesh Patel

dan V. N. Pati (2014)

Optimized Approach to Voice Translation

Terjemahan di komputer, laptop dan ponsel.

Mengembangkan sebuah model sistem baru untuk alat dan layanan terjemahan suara yang memproses bahasa alami dan mengkonversi,

dengan memanfaatkan metode

parsing penelitian ini lebih

berkonsetrasi menangkap kata

kunci dan menerjemahkannya.

2 Ying Li, Hojjat

Salmasian MD-MPH, Rave Harpaz PhD, Herbert Chase MD, Carol Friedman PhD (2011)

Determining the Reasons for Medication Prescriptions in the

EHR using Knowledge and

Natural Language Processing

Informasi pasien dan infromasi dari Electronic Health Record (EHR)

Menggunakan NLP untuk membuat

sebuah aplikasi yang dapat

membantu proses menentukan

resep obat pada seorang pasien

berdasarkan informasi yang

terkandung dalam Electronic

Health Record (EHR) sehingga dapat membantu dokter.

3 M ishalakshi,

Dr.V.

Krishnapriya (2013)

Automatic Generation of Commit Messages using Natural Language Processing

File dari perangkat lunak yang berupa kode.

Mengubah sebuah kode dari sebuah file dan diperbaharui menjadi sebuah pesan untuk mempermudah

untuk kegiatan pengembangan

sebuah proyek.

4 Nisa Kurniasih

Wangsanegara, Beki Subaeki (2015)

Implementasi Natural Language

Processing Dalam Pengukuran

Ketepatan Ejaan Yang

Disempurnakan (EYD) Pada

Abstrak Skripsi Menggunakan

20 abstak skripsi yang dapat di copy-paste ataupun menggunakan upload-file (Doc, docx, txt, pdf)

Kesalahan penulisan pada abstrak skripsi biasanya terletak pada kesalahan penulisan kata, tanda baca maupun huruf kapital.

(6)

Paper Review : Natural Language Processing –Universitas Budi Luhur

penulisan huruf kapital/ kata dan

tanda baca. Hasil pengujian

terhadap 20 abstrak skripsi

menunjukkan 70% sesuai dengan pemeriksaanmanua 5 Hernawan Sulistyanto dan Nurgiyatna (2015)

Pengembangan Model Pencarian Kamar Dalam Sistem Reservasi Hotel Dengan Antarmuka Bahasa Alami

Calon Tamu Hotel dan Scanner

(Analisis Leksikal), Parser

(Analisa Sintaks), Translator

(Analisis Semantik), Evaluator (Analisis Pragmatik)

Aplikasi Sistem Reservasi dengan

mengimplementasikan bahasa

alami mampu melaksanakan query terhadap data yang tersimpan dalam basis data dengan menggunakan bahasa Indonesia

6 James Suciadi

(2001)

Studi Analisis Metode-Metode Parsing Dan Interpretasi Semantik

Pada Natural Language

Processing

Tiga proses yang dilakukan untuk mencapai tujuan adalah Parshing

atau analisis sintakis yang

memeriksa kebenaran struktur kalimat berdasarkan gramer dan lexicon.

Jika aplikasi NLP yang dibuat

menggunakan grammar yang

kompleks, makaparser yang

menggabungkan metode top-down dan bottom-up merupakan pilihan yang terbaik karena mengatasi kekurangan pada masing-masing metode. Word-sense hierarchy yang

digunakan oleh selectional

restrictions sangat membantu dalam

melakukan proses word-sense

disambiguation, sehingga lebihbaik dibandingkan context activation.

7 Suwanto

Raharjo dan

Sri Hartati.

(2014)

Antarmuka Bahasa Alami Untuk

Melakukan Query Terhadap

Terjemahan Al-Quran

Al-Qur’an dan Scanner (Analisi

Leksikal), Parser (Analisis

Sintaks), Translator (Analisis Semantik) Evaluator (Analisis Pragmatik)

Aplikasi Terjemahan Al-Qur’an

dengan mengimplementasikan

bahasa alami mampu melaksanakan query terhadap data yang terismpan

dalam basis data dengan

menggunakan bahasa indonesia.

8 Ngurah Agus

Sanjaya ER

Purwarupa Aplikasi Perangkat Bergerak Untuk Alihbahasa

XCODE dan Scanner (Analisi Leksikal), Parser (Analisis

Aplikasi Alih Bahasa dari Bahasa Inggris Ke Bahasa Bali dengan

(7)

dan Agus Muliantara. (2014)

Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis Aturan

Sintaks), Analisis Alih Bahasa mengimplementasikan bahasa

alami mampu melaksanakan query terhadap data yang terismpan dalam basis data dengan menggunakan bahasa Bali.

9 Setyawan

Wibisono (2013)

Aplikasi Pengolah Bahasa Alami Untuk Query Basis data

Akademik Dengan Format Data Xml

Data akademik mahasiswa dari

sistem akademik Universitas

Stikubank Semarang

Proses yang dilakukan oleh aplikasi ini adalah mengidentifikasi kata-kata dalam kalimat alami dan melihat struktur kalimat.

10 Herny

Februariyanti dan Eri Zuliarso (2013)

Membangun Aplikasi Natural Language Processing

Menggunakan Instant Messenger Untuk Informasi Bencana

Intant Messager dengan memanfaatkanlayanan Google Talt dan mempunyai account email Gmail

Instant Messaging untuk bertukar informasi seputar bencana alam sebelum dan sesudah bencana itu terjadi serta memiliki fasilitas Question Answer yang dapat menjawab kebutuhan request informasi bencana dari pengguna

(8)

Paper Review : Natural Language Processing –Universitas Budi Luhur

4.2 Aplikasi Dalam Bidang Natural

Language

Jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah: Text-based application dan dialogue-based application.

Text-based application mencakup segala macam aplikasi yang melakukan proses terhadap aplikasi tertulis seperti misalnya buku, berita,surat kabar, email dan lain-lain. Dialogue – based applications idealnya pendekatan ini melibatkjan bahasa lisan atau pengenalan suara,akan tetapi bidang ini juga

memasukkan interaksi dengan cara

memasukkan teks pertanyaan memalui kybord. Berikut pengelompokan 10 jurnal

yang telah direview berdasarkan jenis

aplikasinya: Jurnal Jenis Aplikasi Text-based application Dialogue-based application [1] [2] [3] [4] [5] [6] √ √ [7] [8] [9] [10]

Tabel 2. Pengelompokan jurnal berdasarkan aplikasi dalam bidang NLP

4.3 Jenis Data dan Bidang Studi

Berikut pengelompokan 10 jurnal yang telah direview berdasarkan data dan bidang studi:

Jur nal

Data yang

didapat Bidang Studi

Text Suara A B C D E F G [1] √ √ √ √ √ √ [2] √ √ [3] √ √ √ [4] √ √ [5] √ √ √ [6] √ √ √ √ [7] √ √ √ √ [8] √ √ √ √ [9] √ √ √ [10] √ √ √ √ √ √

Tabel 3. Pengelompokan jurnal berdasarkan jenis data dan bidang studi

Keterangan bidang studi:

[A] Terjemahan Mesin

[B] Pengolahan teks bahasa alami

[C] User interface

[D] Multibahasa dan pengambilan informasi bahasa silang

[E] Pengenalan suara

[F] Kecerdasan buatan

[G] Sistem pakar

4.4Area Utama Penelitian Pada Field NLP

Pustejovsky dan Stubbs (2012)

menjelaskan bahwa ada beberapa area utama penelitian pada field NLP[2], diantaranya:

1. Question Answering Systems (QAS).

Kemampuan komputer untuk menjawab pertanyaan yang diberikan oleh user. Daripada memasukkan keyword ke dalam browser pencarian, dengan QAS, user bisa langsung bertanya dalam bahasa natural yang digunakannya, baik

itu Inggris, Mandarin, ataupun

Indonesia.

2. Summarization. Pembuatan ringkasan

dari sekumpulan konten dokumen atau email. Dengan menggunakan aplikasi

ini, user bisa dibantu untuk

mengkonversikan dokumen teks yang besar ke dalam bentuk slide presentasi.

3. Machine Translation. Produk yang

dihasilkan adalah aplikasi yang dapat

memahami bahasa manusia dan

menterjemahkannya ke dalam bahasa lain. Termasuk di dalamnya adalah Google Translate yang apabila dicermati semakin membaik dalam penterjemahan

(9)

bahasa. Contoh lain lagi adalah BabelFish yang menterjemahkan bahasa pada real time.

4. Speech Recognition. Field ini

merupakan cabang ilmu NLP yang cukup sulit. Proses pembangunan model untuk digunakan telpon/komputer dalam mengenali bahasa yang diucapkan sudah banyak dikerjakan. Bahasa yang sering digunakan adalah berupa pertanyaan dan perintah.

5. Document classification. Sedangkan

aplikasi ini adalah merupakan area penelitian NLP Yang paling sukses. Pekerjaan yang dilakukan aplikasi ini adalah menentukan dimana tempat terbaik dokumen yang baru diinputkan ke dalam sistem. Hal ini sangat berguna pada aplikasi spam filtering, news article classification, dan movie review. Berikut pengelompokan 10 jurnal yang telah direview berdasarkan area utama penelitian:

Jurn al QAS Sum mari zatio n Mac hine Tran slati on Spee ch Reco gniti on Docu ment class ificat ion [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] √ √

Tabel 4. Pengelompokan jurnal berdasarkan area utama penelitian

5. PENUTUP

5.1.Kesimpulan

Berdasarkan hasil pembahasan

mengenai Natural Language Processing

menggunakan bahasa alami dalam

penerapannya. Dimana aplikasi yang dapat dibuat adalah alihbahasa dan banyak lainnya, jenis aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan dialogue-based application. Pendekatan NLP dikembangkan dengan tujuan agar komputer mampu memahami

instruksi/permintaan manusia melalui

penggunaan bahasa bahasa alami.

Hasil review terhadap 10 jurnal

menyimpulkan jenis data yang didapat sebagai sumber bahasa adalah teks dan suara.

5.2.Saran

Setelah melakukan review pada 10

jurnal, maka penulis memilik saran untuk

pengembangan aplikasi selanjutnya

memanfaatkan suara sebagai sumber data

dan Dialogue-based application sebagai

jenis aplikasi yang digunakan karena masih sedikit dalam penerapannya.

DAFTAR PUSTAKA

[1] Daeli, Irlani. Natural Language

Processing Analysis Of Sentences With Turbo Prolog. Universitas Gunadarma [2] Pustejovsky, J., Stubbs A. (2012).

Natural Language Annotation for Machine Learning. Beijing: O’Reilly [3] Kao, A., Poteet, S. R. (2007). Natural

Language Processing and Text

Mining. USA: Springer.

[4] Poole L. David dan Mackworth K. Alan

(2010),”Artifical Intelligence”

University of British Columbia:

Vancouver

[5] Wicaksana, I.W.S, Wulandari, L, dan Wirawan, S. (2005), “Pentingnya

(10)

Paper Review : Natural Language Processing –Universitas Budi Luhur

Interoperabilitas Informasi

berbasiskan Komputer karena

Keragaman Semantik” Prosiding

Seminar Ilmiah Nasional (PESAT

2005), Universitas Gunadarma,

Jakarta, halaman S9-S16, 2005

[6] Sulistyanto, Hernawan, Nurgiyatna,

(2015), “Pengembangan Model

Pencarian Kamar Dalam Sistem Reservasi Hotel Dengan Antarmuka

Bahasa Alami”, Universitas

Muhammadiyah Surakarta: Surakarta. [7] Raharjo, Suwanto, Hartati, Sri, (2014)

“Antarmuka Bahasa Alami Untuk

Melakukan Query Terhadap

Terjemahan Al-Quran’.UGM.

Yogyakarta.

[8] Wibisono, Setyawan (2013), “Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik dengan Format

Data Xml”, Universitas

Stikubank:Semarang.

[9] Kurniasih, Nisa, dkk, (2015), ”

Implementasi Natural Language

Processing Dalam Pengukuran

Ketepatan Ejaan Yang Disempurnakan

(EYD) Pada Abstrak Skripsi

Menggunakan Algoritma Fuzzy

Logic”, UIN Sunan Gunung Djati:

Bandung.

[10] Agus, Ngurah, Muliantara Agus (2014),

“Purwarupa Aplikasi Perangkat

Bergerak Untuk Alihbahasa Kalimat Bahasa Inggris Ke Bahasa Bali Menggunakan Pendekatan Berbasis

Aturan”, Universitas Udayana:

Bandung.

[11] Suciadi James (2004),” Studi Analisis

Metode-Metode Parsing dan

Interpretasi Semantik Pada Natural Language Processing”, Universistas Kristen Petra: Surabaya.

[12] Patel Nitesh , Patil V. N. (2012),

”Optimized Approach to Voice

Translation”, Talegaon Dabhade

Taluka Maval Dist: Pune Maharashtra

[13] Li Ying (2011),”Determining the Reasons for Medication Prescriptions in the EHR using Knowledge and

Natural Language Processing”,

Department of Biomedical

Informatics, Columbia University,

New York

[14] Ishalakshi M., Krishnapriya V.

(2013),” Automatic Generation of

Commit Messages using Natural Language Processing”, Department of Computer Science, Sri Ramakrishna College of Arts and Science for Women, Coimbatore.

Gambar

Gambar 1. Komponen pengolah bahasa  alami [6] (Jurnal no 5)
Tabel 2. Pengelompokan jurnal berdasarkan  aplikasi dalam bidang NLP
Tabel 4. Pengelompokan jurnal berdasarkan  area utama penelitian

Referensi

Dokumen terkait

Uji organoleptik untuk warna bunga tanaman Zingiberaceae menurut para ahli yang paling besar memiliki potensi untuk dapat dimasukkan sebagai elemen dalam desain lanskap

Past Future continuous Tense digunakan untuk menyatakan kegiatan atau peristiwa yang akan sedang berlangsung di masa lampau atau sudah lewat.. Past Future

rozottan ellenezte a szociolingvisztika terminust, mivel azt implikálja, hogy le- hetséges olyan sikeres nyelvészet (elmélet vagy gyakorlat), ami nem társadalmi nyelvészet ( l abov

Benar sekali anak-anak yang dikatakan oleh teman kalian, selanjutnya dikelompokkan menjadi berapa materi berdasarkan wujudnya, adakah yang bisa menyebutkannya, coba

Seperti yang dijelaskan sebelumnya, bahwa ilustrasi digunakan untuk menyampaikan proses komunikasi secara cepat, tepat, dan tegas serta sedapat mungkin mampu

Terlebih jika saat ini kita rindu agar blessing dan anointing dari Tuhan terjadi dalam hidup kita, maka kita harus memiliki kehausan yang besar akan Tuhan. Jangan

Menurut desmita (2008), resiliensi (daya lentur) adalah kemampuan atau kapasitas yang dimiliki seseorang, kelompok atau masyarakat yang memungkinkan untuk menghadapi, mencegah,

Model Omisi (menghilangkan) berarti sesuatu yang ada dalam kurikulum umum tidak disampaikan atau tidak diberikan kepada siswa berkebutuhan khusus. Bedanya dengna subtitusi adalah