SKRIPSI
NADIA WIDARI NASUTION
110803016
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
PENERAPAN HIDDEN MARKOV MODEL
UNTUK PENGENALAN UCAPAN
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
NADIA WIDARI NASUTION 110803016
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2015
PERSETUJUAN
Judul : PENERAPAN HIDDEN MARKOV MODEL
UNTUK PENGENALAN UCAPAN
Kategori : Skripsi
Nama : NADIA WIDARI NASUTION
Nomor Induk Mahasiswa : 110803016
Program Studi : SARJANA (S1) MATEMATIKA
Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, April 2015
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. Sawaluddin, M.IT Dra. Normalina Napitupulu, M.Sc NIP.19591231 199802 1 001 NIP.19631106 198902 2 001
Diketahui/Disetujui oleh
Departemen Matematika FMIPA USU Ketua
Prof. Dr. Tulus, M.Si
PERNYATAAN
PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, April 2015
NADIA WIDARI NASUTION 110803016
PENGHARGAAN
Puji syukur kehadirat Allah SWT Yang Maha Pemurah dan Maha Penyayang, dengan limpahan karunia-Nya, skripsi ini berhasil diselesaikan dalam waktu yang telah ditetapkan. Shalawat beriring salam kepada Rasulullah SAW, sebagai rahmatan lil’alamin.
Ucapan terima kasih penulis sampaikan kepada Ibu Dra. Normalina Napitupulu, M.Sc dan Bapak Dr. Sawaluddin, M.IT selaku pembimbing yang telah memberikan panduan dan penuh kepercayaan kepada penulis untuk menyempurnakan skripsi ini. Bapak Drs. Marihat Situmorang, M.Kom dan Bapak Dr. Suyanto, M.Kom selaku penguji yang telah memberikan kritikan dan saran yang membangun dalam penyempurnaan skripsi ini. Dekan dan Pembantu Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara. Ketua dan Sekretaris Departemen Matematika Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si. Seluruh staf pengajar dan staf administrasi di lingkungan Departemen Matematika, serta seluruh civitas akademika di lingkungan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.
Ucapan terima kasih juga ditujukan kepada kedua orang tua penulis tercinta, Ayahanda Muhammad Daud Nasution, S.H dan Ibunda Winarti yang telah memberikan banyak bantuan baik materi, moral maupun spiritual. Kepada adik-adik penulis, Iqbal Naufal Khalis Nasution dan Rohid Zaidan Nasution. Penulis juga mengucapkan banyak terima kasih kepada teman-teman yang banyak memberikan masukan kepada penulis dalam menyelesaikan skripsi ini dan menyelesaikan studi di Departemen Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.
Tidak terlupakan, ucapan terima kasih kepada teman-teman stambuk 2011, teman-teman di Himpunan Mahasiswa Matematika, teman-teman di Ikatan Mahasiswa Matematika Muslim diFakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara, dan kepada semua pihak yang telah memberikan bantuan dan dorongan yang tidak dapat disebutkan satu per satu.
PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN
ABSTRAK
Pengenalan ucapan adalah suatu proses yang dilakukan komputer untuk mengenali kata-kata yang diucapkan oleh seseorang tanpa memperdulikan identitas orang terkait. Kata-kata tersebut akan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka lalu disesuaikan dengan kode-kode tertentu dan dicocokkan dengan suatu pola yang tersimpan dalam suatu perangkat. Pada tulisan ini dibahas tentang bagaimana pengenalan ucapan menggunakan metode Hidden Markov Model(HMM). HMM adalah suatu model statistik dari sebuah sistem yang diasumsikan sebuah proses Markov dengan parameter-parameter yang tidak diketahui dan memiliki ketepatan dalam identifikasi suara. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi, yaitu menggunakan software Microsoft Speech Application Programming Interface.
Kata kunci : Pengenalan ucapan, Proses sinyal suara, Hidden Markov Model, Microsoft Speech Application Programming Interface
THE APPLICATION OF HIDDEN MARKOV MODEL FOR SPEECH RECOGNITION
ABSTRACT
Speech recognition is a process that is done the computer to recognize words spoken by a person without regard to the identity of persons.The words will be transformed into digital signals by converting sound waves into a set of numbers and then adjusted with certain codes and matched with a pattern stored in a device. In this paper discussed about how speech recognition using hidden Markov Model (HMM). HMM is a statistical model of a system that is assumed to be a Markov process with parameters that are unknown and has accuracy in voice identification. The result of the identification of the spoken word can be displayed in written form or can be read by the device technology, which uses software Microsoft Speech Application Programming Interface.
Keywords: Speech Recognition, Hidden Markov Model, Microsoft Speech Application Programming Interface
DAFTAR ISI Halaman PERSETUJUAN iii PERNYATAAN iv PENGHARGAAN v ABSTRAK vi ABSTRACT vii
DAFTAR ISI viii
DAFTAR GAMBAR x
DAFTAR TABEL xi
DAFTAR SINGKATAN xii
BAB 1 PENDAHULUAN 1.1.Latar Belakang 1 1.2.Rumusan Masalah 2 1.3.Batasan Masalah 2 1.4.Tinjauan Pustaka 3 1.5.Tujuan Penelitian 6 1.6.Manfaat Penelitian 6 1.7.Metodologi Penelitian 7
BAB 2 LANDASAN TEORI
2.1.Suara 8
2.2.Proses Sinyal Suara 10
2.2.1. Pulse Code Modulation 10
2.2.2. Delta Modulation 18
2.3.Pengenalan Ucapan 19
2.4.Tahapan-Tahapan dalam Pengenalan Ucapan 21
2.3.1. Ekstraksi Fitur 22
2.3.2. Pemodelan Akustik 26
2.3.3. Pemodelan Ucapan 27
2.3.4. Model Bahasa 29
2.3.5. Decoder 31
2.5.Hidden Markov Model (HMM) 31
2.4.1. Tipe HMM 32
2.4.2. Elemen HMM 33
2.4.3. Fungsi Rekursif HMM 35
2.6.Contoh Penyelesaian Rantai Markov pada Kasus Cuaca 38 2.7.Contoh Penyelesaian Hidden Markov Model pada Kasus Cuaca 40
2.8.Microsoft Speech API 42
BAB 3 PEMBAHASAN
3.1.1 Flowchart Proses Suara 45
3.1.2 Flowchart Pemodelan HMM 46
3.2.Perancangan Perangkat Lunak 47
3.3.SoftwareMicrosoft Speech API 47
3.4.Halaman Perekaman 51
3.5.Halaman Hasil 52
BAB 4 KESIMPULAN DAN SARAN
4.1.Kesimpulan 53
4.2.Saran 53
DAFTAR GAMBAR
Nomor Judul Halaman
Gambar
1.1. Rantai Markov 3
1.2. Blok diagram untuk sistem pengenalan ucapan 5
2.1. Organ Pernapasan Manusia 9
2.2 Pengkodean PCM 11
2.3 Pencacahan dengan berbagai frekuensi pencacah 12
2.4 Pencacahan natural dan sample and hold 14
2.5 Proses kuantisasi 15
2.6 Ilustrasi Delta Modulation (DM) 18
2.7. Blok diagram untuk sistem pengenalan ucapan 22
2.8. Blok diagram LPC 23
2.9. Rantai Markov 27
2.10. HMM model basis phone 28
2.11. HMM model ergodic 32
2.12. HMM model kiri-kanan 33
2.13. Contoh Hidden Markov Model (HMM) 34
2.14. Ilustrasi Alur Algoritma Forward 35
2.15. Ilustrasi Alur Algoritma Backward 36
2.16. Ilustrasi Perhitungan pada Algoritma Baum-Welch 38
2.17. Rantai Markov pada kasus cuaca 39
2.18. Arsitektur Microsoft Speech Application Programming Interface 43
3.1. Flowchart Proses Suara 45
3.2. Flowchart Pemodelan HMM 46
3.3. Tampilan Utama Windows Speech Recognition 48
3.4. Jenis microphone 48
3.5. Set up microphone 49
3.6. Read the following the sentence 49
3.7. Microphone is now set up 50
3.8. Run Speech Recognition 50
3.9. Tampilan Speech Dictionary 51
3.10. Tampilan menambahkan kata yang akan diucapkan 51
DAFTAR TABEL
Nomor Judul Halaman
Tabel
2.1. Pengkodean digital 16
2.2. Probabilitas cuaca hari ini berdasarkan cuaca esok hari 38 2.3 Probabilitas melihat sebuah payung berdasarkan cuaca 40
DAFTAR SINGKATAN
HMM = Hidden Markov Model
ASR = Automatic Speech Recognition LPC = Linear Prediction Coding ANN = Artificial Neural Network DBN = Dinamic Bayesian Network SVM = Supported Vectoc Machine
API = Application Programming Interface SDK = System Development Kit
PAM = Pulse Amplitudo Modulation PCM = Pulse Code Modulation DM = Delta Modulation SNR = Signal to Noise Ratio
ISR = Independent Speech Recognition DSR = Dependent Speech Recognition