PEMBELAJARAN
2019
UNIVERSITAS DIAN NUSWANTORO
RENCANA
Jl. Imam Bonjol 205 – 207 Gedung G lt. 2 Semarang Telp (024) 3547038 , (024) 70793727
SEMESTER
PRODI MAGISTER
TEKNIK INFORMATIKA
NATURAL LANGUAGE
PROCESSING
,i
oC6E:=CJ
C,(!Lro(J4)
6
(c{!c6E(!)E(oL
GEgo:-boooE-:la) .@ao_oc(o3-c6qJb!E{.,acGYfE6-oqJ=€JEoOJbDc(]E
i
6E'i
cUE6
!E.:Z(I.lz3E0.,()Ecib0C5CEi
(o-:4(o'6Ca)Efo
E(tr EoYC6E0l6
oaosojoEc6E6ooGcc.9=
6OJJC6p
-oC66OJJ(JG(o_o(sBGc6OJo(oJ,qc6"vf:
(uL5'ooo--c(66(oEc660Jc(oxG5ELoEa)E=o-EGEG()CqG!EE66o0lf-oOJC,)cJ-c6clo.0Co)o.o!CG3
_oEoo f,:fsJCro'ooG-o.9'-
oOJAJEoCG-oEfE3(o([Ia)r!FECa3Eov.Ec6=-C6OJoacoo=
-o.@.tLo_c)Cov'66:luoc(J 0lUoo-AJbo(s=u0C(o)
E=Gz
oo-G(oo!c6IoBOJE'66f0lCq)EcG'If,c(gjC-oE'66JCCJEfo.E(I gC.(oCJrlE5
6unao)E65OJb,E(o(!.o(oE3ECEfttll6OJ=(.)EUg6g1=()o.Eo.,EcIcc6:f-cos
(EEo,c_.Ef,6oC6c6E(]ooCoo-YqiEoE66?FGo.cco.q6EGJ.q.F.;.t3b!C6=.FC0,o-C6Lo(,,E=E(o;
J:JC6EffE_o'iEc6EG'=aCcGYv.=c:fc(,)Efo.E6 .:,6;
{oLG6EC(E't*
E€lGvG(oGEGEov.g-(,oE'=(gOJEfgcE(o'a6.E5EbICc,E (uLc).Eo,(ugs(oc;(UCLGGEL6.,&CE-o=G,boc3ooODtqc,-(:LIdJJE'64)EODlgC(E.EdJ=
-.c'15c(.)Ef,oE(! .Etr
.qp
g3E6Ee:0Ec);
(g6Y(JE{Jo.'=6EEc6Yo!CG-oEOJE c(o:
CJCo-(ECJa6-
E6(oocG:3oo_EoE(o:o(!C(o.€6
coo-qJ-oE(E(]Ehoc6C1635
(]Jo!Co-o5
'663EOJ=
uocq)E-
EG=
6-c(g-:4LG'-oLo-o(oc,9.C(E{,b!cG-o5
-c(o6
(oEc.9(EgOJcdJo_{,ogEE6aCJfE6uq)a(E-.
eGOo0)-c_C=6-o :ol6(G(Eor, trC-
or-
E(i:LC='I
=6F:6(t
>E
L0,.EE
.3=v
=El(o.5 '=G(.iE(oF(EEo;
6JaEo\zfEooc(oEEs
(oE'f,ooo-:za)(!Ec'6(oE6GoEq)o_c(o(sIJE0.)EC(ufaE(!Eo,-v=.E6J:
.:Z6Eou=o-EJE=
E5E'aC'C(}"'6C'-
o.o-oC65E=
c.)vEloh!{3-oE(.}o!Cc.}eE{E-cG-of, ,=(o'o'6fECJ(€ro(o2(uo-Eo(aL-oofE{)0.1oEoJfs
6Eo,(6E'acG,E(o(gE{,(}.c{oEc(!3(oc.)ODC€.}o_'6f,o-Ec, d,u.tFvttr.tUJqz
E3
lrlcoEgJa-z
()z
UJE Eovj
0dc-
fj(]EE(!
EOoo-
3
t!= EoYa.dc
-
fjo
o-(J
go
(E
s
o.oEoCLg.g|!a{oIJ)
Zf/f,*aar*i' Nth
I
6
(9zo
]-JZ. ltS,aS EE= P?E ur<E
CLE6-o
&,o
Fz 3
thJz z <e, 6H
lrt J<a-
F=B9 ur- >= z>
(ocJcoo-EUIDItrGF or{o
N6oa T'tnEIEUIoEL(o0,E
PthE(t
bIoo-CttL.(o!o
Eo,o-c.g(!o(E(J -c.g
)
(tGc(!.gs
@EOJo.G(!or!U @P(,ECJttaul{h (Yl=G,oP(!g
ooY
(Y!
.gl!
(EE
d t)o-&bItr(oEc,q
aio-
ooo
o)1'o o$o(ao- oodo- G!'l:f Nf an
)
Y. <-fv. LN:)v \Z:l N\z 1r)\Z(E(!
(o 0)uo(t3hlh0tr(uqJO-gruOLL50_(E
z
(!ooM1 Mahasiswa memahami konsep dan model NLP
M2 Mahasiswa memahami algoritma kecerdasan buatan dan NLP yang diperlukan pada pengembangan model Natural Language Processing
M3 Mahasiswa memahami arah terbaru penelitian NLP
M4 Mahasiswa mampu melakukan penelitian pada bidang sistem Natural Language processing Deskripsi Singkat
Mata Kuliah Matakuliah ini mempelajari kasus-kasus dan penyelesaian kasus dengan metode-metode yang ada pada Natural Language Processing.
Materi Pembelajaran/
Pokok Bahasan
1. Pengenalan natural language processing
2. Memahami tentang konsep bahasa dan operasi dalam bahasa
3. Memahami finite state automata (FSA), regular expression dan menggunakannya untuk menemukan pola 4. Memahami tentang aspek morfologi dan membuat morphological parser sederhana
5. Minimum Edit Distance 6. Language Model (N-Gram) 7. Part of Speech Tagging 8. Hidden Markov Model 9. Klasifikasi Teks 10. Clustering Teks 11. Ekstraksi Informasi 12. Syntactic Parser
13. Question-Answering System 14. Neural Network untuk NLP
15. Speech Processing (Speech To Text dan Text To Speech)
Pustaka
Utama :
1. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, by Daniel Jurafsky and James H. Martin
Pendukung :
2. Suanmali et al, Fuzzy Logic Based Method for Improving Text Summarization
3. Ju Hong Lee et al, Automatic generic document summarization based on non-negative matrix factorization 4. Gleb Sizov, Extraction-Based Automatic Summarization
5. Chen et al, Turning from TF-IDF to TF-IGM for term weighting in text classification, 2016
Media Pembelajaran Perangkat Lunak : Perangkat Keras :
Python GUI, Weka, Orange Laptop, Proyektor
Tim Teaching Dr. Muljono, S.Si, M.Kom Mata Kuliah Syarat
Mgg ke
Sub CP MK (sebagai kemampuan
akhir yang diharapkan) Indikator Kriteria & Bentuk Penilaian
Metode Pembelajaran [Estimasi Waktu]
Pengalaman Belajar Materi pembelajaran Bobot Penilaian
(1) (2) (3) (4) (5) (6) (7)
1 Mahasiswa mampu menjelaskan konsep natural language processing dan penerapannya
Ketepatan dalam menjelaskan konsep, penggunaan serta penerapan sistem temu kembali informasi
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi [TM:3x50’]
a. Pengertian natural language processing
b. Contoh penerapan aplikasi natural language processing
2 Mahasiswa mampu memahami konsep bahasa dan operasi dalam bahasa
Ketepatan dalam menjelaskan konsep bahasa dan operasi dalam bahasa
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Konsep bahasa: abjad,
string(kata), frasa, kalimat dan bahasa
b. Operasi dalam bahasa
(concatenation, segmentation dan exponential)
3 Mahasiswa mampu memahami finite state automata (FSA), regular expression dan
menggunakannya untuk menemukan pola
Ketepatan dalam menjelaskan finite state automata (FSA), regular expression dan menggunakannya untuk menemukan pola
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi [TM:3x50’]
• Tugas-1: pemberian soal latihan terkait Regex
a. FSA b. Regex c. Notasi regex
d. Pola-pola regex yang umum digunakan
4 Mahasiswa mampu memahami konsep morfologi dan minimum edit distance
Ketepatan dalam menjelaskan morfologi dan minimum edit distance
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. FSA (Fine State Automata) b. Morphological parser
c. Konsep minimum edit distance.
d. Teknik menghitung minimum edit distance dengan Levenshtein Distance
5 Mahasiswa mampu menjelaskan Language Model (N-Gram)
Ketepatan dalam menjelaskan
Language Model (N-Gram) Kriteria : Ketepatan dan penguasaan
• Kuliah & Diskusi
[TM:3x50’] a. Konsep languange model dan manfaatnya.
b. N-Gram
Mgg ke
Sub CP MK (sebagai kemampuan
akhir yang diharapkan) Indikator Kriteria & Bentuk Penilaian
Metode Pembelajaran [Estimasi Waktu]
Pengalaman Belajar Materi pembelajaran Bobot Penilaian
(1) (2) (3) (4) (5) (6) (7)
Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
c. Probabilistic language model
6 Mahasiswa mampu menjelaskan konsep Part of Speech Tagging
Ketepatan dalam menjelaskan pengertian dan penerapan Part of Speech Tagging
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Konsep dan manfaat POS Tag b. Teknik untuk mendapatkan POS-
TAG
7 Mahasiswa mampu menjelaskan konsep algortima Hidden Markov Model
Ketepatan dalam menjelaskan pengertian dan penerapan algortima Hidden Markov Model
Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Konsep dan teknik HMM b. HMM untuk POS-Tag
c. HMM untuk memprediksi kata.
8 Mahasiswa mampu menjelaskan konsep klasifikasi teks
Ketepatan dalam menjelaskan
klasifikasi teks Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Konsep dan manfaat klasifikasi.
b. Pembobotan kata
c. Contoh satu teknik klasifikasi:
naive bayes.
9 Mahasiswa mampu menjelaskan konsep clustering teks
Ketepatan dalam menjelaskan
clustering teks Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab
• Kuliah & Diskusi
[TM:3x50’] a. Konsep dan manfaat clustering.
b. Pembobotan kata
c. Contoh satu teknik clustering: k- means.
Mgg ke
Sub CP MK (sebagai kemampuan
akhir yang diharapkan) Indikator Kriteria & Bentuk Penilaian
Metode Pembelajaran [Estimasi Waktu]
Pengalaman Belajar Materi pembelajaran Bobot Penilaian
(1) (2) (3) (4) (5) (6) (7)
pemahaman mahasiswa 10 Mahasiswa mampu
menjelaskan konsep ekstraksi informasi
Ketepatan dalam menjelaskan
ekstraksi informasi Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Konsep dan manfaat esktraksi informasi.
b. Teknik ekstraksi informasi c. Named Entity Recognition
11 Mahasiswa mampu menjelaskan konsep syntactic parser
Ketepatan dalam menjelaskan
syntactic parser Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi [TM:3x50’]
•
a. Konsep dan manfaat syntatic parser.
b. CFG (Context Free Grammar) dan PCFG
c. CKY Parsing
12 Mahasiswa mampu menjelaskan konsep Question-Answering System
Ketepatan dalam menjelaskan
Question-Answering System Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi [TM:3x50’]
•
a. Konsep dan manfaat QA System.
b. Tahapan dam teknik pengembangan QA System
13 Mahasiswa mampu menjelaskan konsep Neural Network untuk NLP
Ketepatan dalam menjelaskan
Neural Network untuk NLP Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi [TM:3x50’]
•
a. Pengenalan neural network dan deep learning.
b. Pemanfaatan NN untuk NLP
Mgg ke
Sub CP MK (sebagai kemampuan
akhir yang diharapkan) Indikator Kriteria & Bentuk Penilaian
Metode Pembelajaran [Estimasi Waktu]
Pengalaman Belajar Materi pembelajaran Bobot Penilaian
(1) (2) (3) (4) (5) (6) (7)
14 Mahasiswa mampu menjelaskan konsep Speech Processing
Ketepatan dalam menjelaskan
Speech Processing Kriteria : Ketepatan dan penguasaan Bentuk non test : Melakukan tanya jawab pemahaman mahasiswa
• Kuliah & Diskusi
[TM:3x50’] a. Speech To Text b. Text To Speech
15 Pengumpulan Tugas (Proyek Akhir)
Catatan :
[1]. TM : tatap Muka
[2]. [TM:3x50’] : Kuliah tatap muka 1 kali (minggu) x 3 sks x 50 menit=150 menit
[3]. RPS: Rencana Pembelajaran Semester, RMK: Rumpun Mata Kuliah, Prodi: Program Studi
FM-UDINUS-BM-04-16/R0
PROGRAM MAGISTER TEKNIK INFORMATIKA
UNIVERSITAS DIAN NUSWANTORO
Jl. Imam Bonjol No. 207 Semarang 50131, Telp. (024) 70793727, Telp./Fax. (024) 3547038 Homepage: www.dinus.ac.id e-mail: sekretariat@pps.dinus.ac.id
Mata Kuliah : Natural Language Processing Sifat : Close Book Hari, Tanggal : Kamis, 27 Juli 2018 Waktu : 19.00 – 21.00
Kelompok : XXXI Dosen : Dr. Muljono, S.Si, M.Kom.
UJIAN AKHIR SEMESTER GENAP TAHUN 2016/2017 LEMBAR SOAL
1. Soal Analisis Semantik :
Pertimbangkan matriks co-occurrence berikut ini untuk vocabulary 6 kata yaitu coffee, tea, beans, bubble, cocoa, taxi. Baris sesuai dengan kata-kata target, kolom sesuai dengan kata-kata kontex. Semua jumlah yang tidak diberikan secara eksplisit adalah nol.
beans bubble cocoa taxi
coffee 35 0 11 0
tea 1 17 4 0
a) Baca nilai-nilai berikut dari matrik co-occurrence : #(coffee, cocoa) #(coffee) #(cocoa)
b) Sebutkan semua target pasangan kata-konteks kata, yang informasi timbal baliknya secara positif (ketat) lebih besar dari nol.
c) Apa yang membuat model continuous bag-of-words dan model skip gram- model yang diterapkan dalam Google’s word2vec begitu menarik, dibandingkan dengan metode embedding kata melalui singular value decomposition terpotong?
2. Soal Levenshtein distance :
The following matrix shows the values computed by the Wagner–Fischer
algorithm for finding the Levenshtein distance between the two words student
and teacher. Note that the matrix is missing a value (marked cell).
7 6 5 5
(
6 66 5 4 4 5 5 6 6
5 4 3 4 4 5 5 6
4 Ja 3 4 5 6 7
Ja 2 2 3 4 5 6 7
2 L 2 3 4 5 6 7
1 L 2 3 4 5 6 7
0 1 2 aJ 4 5 6 7
a) Tentukan konsep jarak Levenshtein [Levenshtein distance J antara
dua kata.b] Hitung nilai untuk sel yang ditandai.
Jelaskan!!Tunjukkan bahwa
Anda telah memahamialgoritma
Wagner-Fischer.cJ
Bagi penggunamungkin terjadi
salahketik
katastudent terketik menjadi stusent daripada stulent; ini karena tombol untuk huruf d dan s lebih
dekat satu samalain
padakeyboard daripada tombol untuk huruf
d dan l.Jelaskan
bagaimana algoritma Wagner-Fischer dapat diadaptasi untuk
kasus
ini.
Diperiksa oleh:
Koordinator Matakuliah NLP
Disetujui oleh :
Ketua Program Studi Magister Teknik Informatika
,r*l V
rno, S.Si, M.Kom Dr. Moch Arief Soeleman, M.Kom
n
d
u
fr