PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN SKRIPSI NADIA WIDARI NASUTION

(1)

SKRIPSI

NADIA WIDARI NASUTION

110803016

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

2015

(2)

PENERAPAN HIDDEN MARKOV MODEL

UNTUK PENGENALAN UCAPAN

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

NADIA WIDARI NASUTION 110803016

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2015

(3)

PERSETUJUAN

Judul : PENERAPAN HIDDEN MARKOV MODEL

UNTUK PENGENALAN UCAPAN

Kategori : Skripsi

Nama : NADIA WIDARI NASUTION

Nomor Induk Mahasiswa : 110803016

Program Studi : SARJANA (S1) MATEMATIKA

Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN

ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, April 2015

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dr. Sawaluddin, M.IT Dra. Normalina Napitupulu, M.Sc NIP.19591231 199802 1 001 NIP.19631106 198902 2 001

Diketahui/Disetujui oleh

Departemen Matematika FMIPA USU Ketua

Prof. Dr. Tulus, M.Si

(4)

PERNYATAAN

PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, April 2015

NADIA WIDARI NASUTION 110803016

(5)

PENGHARGAAN

Puji syukur kehadirat Allah SWT Yang Maha Pemurah dan Maha Penyayang, dengan limpahan karunia-Nya, skripsi ini berhasil diselesaikan dalam waktu yang telah ditetapkan. Shalawat beriring salam kepada Rasulullah SAW, sebagai rahmatan lil’alamin.

Ucapan terima kasih penulis sampaikan kepada Ibu Dra. Normalina Napitupulu, M.Sc dan Bapak Dr. Sawaluddin, M.IT selaku pembimbing yang telah memberikan panduan dan penuh kepercayaan kepada penulis untuk menyempurnakan skripsi ini. Bapak Drs. Marihat Situmorang, M.Kom dan Bapak Dr. Suyanto, M.Kom selaku penguji yang telah memberikan kritikan dan saran yang membangun dalam penyempurnaan skripsi ini. Dekan dan Pembantu Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara. Ketua dan Sekretaris Departemen Matematika Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si. Seluruh staf pengajar dan staf administrasi di lingkungan Departemen Matematika, serta seluruh civitas akademika di lingkungan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.

Ucapan terima kasih juga ditujukan kepada kedua orang tua penulis tercinta, Ayahanda Muhammad Daud Nasution, S.H dan Ibunda Winarti yang telah memberikan banyak bantuan baik materi, moral maupun spiritual. Kepada adik-adik penulis, Iqbal Naufal Khalis Nasution dan Rohid Zaidan Nasution. Penulis juga mengucapkan banyak terima kasih kepada teman-teman yang banyak memberikan masukan kepada penulis dalam menyelesaikan skripsi ini dan menyelesaikan studi di Departemen Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.

Tidak terlupakan, ucapan terima kasih kepada teman-teman stambuk 2011, teman-teman di Himpunan Mahasiswa Matematika, teman-teman di Ikatan Mahasiswa Matematika Muslim diFakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara, dan kepada semua pihak yang telah memberikan bantuan dan dorongan yang tidak dapat disebutkan satu per satu.

(6)

PENERAPAN HIDDEN MARKOV MODEL UNTUK PENGENALAN UCAPAN

ABSTRAK

Pengenalan ucapan adalah suatu proses yang dilakukan komputer untuk mengenali kata-kata yang diucapkan oleh seseorang tanpa memperdulikan identitas orang terkait. Kata-kata tersebut akan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka lalu disesuaikan dengan kode-kode tertentu dan dicocokkan dengan suatu pola yang tersimpan dalam suatu perangkat. Pada tulisan ini dibahas tentang bagaimana pengenalan ucapan menggunakan metode Hidden Markov Model(HMM). HMM adalah suatu model statistik dari sebuah sistem yang diasumsikan sebuah proses Markov dengan parameter-parameter yang tidak diketahui dan memiliki ketepatan dalam identifikasi suara. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi, yaitu menggunakan software Microsoft Speech Application Programming Interface.

Kata kunci : Pengenalan ucapan, Proses sinyal suara, Hidden Markov Model, Microsoft Speech Application Programming Interface

(7)

THE APPLICATION OF HIDDEN MARKOV MODEL FOR SPEECH RECOGNITION

ABSTRACT

Speech recognition is a process that is done the computer to recognize words spoken by a person without regard to the identity of persons.The words will be transformed into digital signals by converting sound waves into a set of numbers and then adjusted with certain codes and matched with a pattern stored in a device. In this paper discussed about how speech recognition using hidden Markov Model (HMM). HMM is a statistical model of a system that is assumed to be a Markov process with parameters that are unknown and has accuracy in voice identification. The result of the identification of the spoken word can be displayed in written form or can be read by the device technology, which uses software Microsoft Speech Application Programming Interface.

Keywords: Speech Recognition, Hidden Markov Model, Microsoft Speech Application Programming Interface

(8)

DAFTAR ISI Halaman PERSETUJUAN iii PERNYATAAN iv PENGHARGAAN v ABSTRAK vi ABSTRACT vii

DAFTAR ISI viii

DAFTAR GAMBAR x

DAFTAR TABEL xi

DAFTAR SINGKATAN xii

BAB 1 PENDAHULUAN 1.1.Latar Belakang 1 1.2.Rumusan Masalah 2 1.3.Batasan Masalah 2 1.4.Tinjauan Pustaka 3 1.5.Tujuan Penelitian 6 1.6.Manfaat Penelitian 6 1.7.Metodologi Penelitian 7

BAB 2 LANDASAN TEORI

2.1.Suara 8

2.2.Proses Sinyal Suara 10

2.2.1. Pulse Code Modulation 10

2.2.2. Delta Modulation 18

2.3.Pengenalan Ucapan 19

2.4.Tahapan-Tahapan dalam Pengenalan Ucapan 21

2.3.1. Ekstraksi Fitur 22

2.3.2. Pemodelan Akustik 26

2.3.3. Pemodelan Ucapan 27

2.3.4. Model Bahasa 29

2.3.5. Decoder 31

2.5.Hidden Markov Model (HMM) 31

2.4.1. Tipe HMM 32

2.4.2. Elemen HMM 33

2.4.3. Fungsi Rekursif HMM 35

2.6.Contoh Penyelesaian Rantai Markov pada Kasus Cuaca 38 2.7.Contoh Penyelesaian Hidden Markov Model pada Kasus Cuaca 40

2.8.Microsoft Speech API 42

BAB 3 PEMBAHASAN

(9)

3.1.1 Flowchart Proses Suara 45

3.1.2 Flowchart Pemodelan HMM 46

3.2.Perancangan Perangkat Lunak 47

3.3.SoftwareMicrosoft Speech API 47

3.4.Halaman Perekaman 51

3.5.Halaman Hasil 52

BAB 4 KESIMPULAN DAN SARAN

4.1.Kesimpulan 53

4.2.Saran 53

(10)

DAFTAR GAMBAR

Nomor Judul Halaman

Gambar

1.1. Rantai Markov 3

1.2. Blok diagram untuk sistem pengenalan ucapan 5

2.1. Organ Pernapasan Manusia 9

2.2 Pengkodean PCM 11

2.3 Pencacahan dengan berbagai frekuensi pencacah 12

2.4 Pencacahan natural dan sample and hold 14

2.5 Proses kuantisasi 15

2.6 Ilustrasi Delta Modulation (DM) 18

2.7. Blok diagram untuk sistem pengenalan ucapan 22

2.8. Blok diagram LPC 23

2.9. Rantai Markov 27

2.10. HMM model basis phone 28

2.11. HMM model ergodic 32

2.12. HMM model kiri-kanan 33

2.13. Contoh Hidden Markov Model (HMM) 34

2.14. Ilustrasi Alur Algoritma Forward 35

2.15. Ilustrasi Alur Algoritma Backward 36

2.16. Ilustrasi Perhitungan pada Algoritma Baum-Welch 38

2.17. Rantai Markov pada kasus cuaca 39

2.18. Arsitektur Microsoft Speech Application Programming Interface 43

3.1. Flowchart Proses Suara 45

3.2. Flowchart Pemodelan HMM 46

3.3. Tampilan Utama Windows Speech Recognition 48

3.4. Jenis microphone 48

3.5. Set up microphone 49

3.6. Read the following the sentence 49

3.7. Microphone is now set up 50

3.8. Run Speech Recognition 50

3.9. Tampilan Speech Dictionary 51

3.10. Tampilan menambahkan kata yang akan diucapkan 51

(11)

DAFTAR TABEL

Nomor Judul Halaman

Tabel

2.1. Pengkodean digital 16

2.2. Probabilitas cuaca hari ini berdasarkan cuaca esok hari 38 2.3 Probabilitas melihat sebuah payung berdasarkan cuaca 40

(12)

DAFTAR SINGKATAN

HMM = Hidden Markov Model

ASR = Automatic Speech Recognition LPC = Linear Prediction Coding ANN = Artificial Neural Network DBN = Dinamic Bayesian Network SVM = Supported Vectoc Machine

API = Application Programming Interface SDK = System Development Kit

PAM = Pulse Amplitudo Modulation PCM = Pulse Code Modulation DM = Delta Modulation SNR = Signal to Noise Ratio

ISR = Independent Speech Recognition DSR = Dependent Speech Recognition