• Tidak ada hasil yang ditemukan

BINUS UNIVERSITY. Program Studi Ganda. Teknik Informatika Matematika PERANCANGAN PROGRAM APLIKASI SPEECH RECOGNIZER DENGAN SPECTROGRAM

N/A
N/A
Protected

Academic year: 2021

Membagikan "BINUS UNIVERSITY. Program Studi Ganda. Teknik Informatika Matematika PERANCANGAN PROGRAM APLIKASI SPEECH RECOGNIZER DENGAN SPECTROGRAM"

Copied!
12
0
0

Teks penuh

(1)

BINUS UNIVERSITY

Program Studi Ganda Teknik Informatika – Matematika

PERANCANGAN PROGRAM APLIKASI SPEECH RECOGNIZER DENGAN SPECTROGRAM

Stefan A.Y. NIM : 0700683673

ABSTRAK

Speech Recognizer atau pengenal percakapan merupakan salah satu hasil dari perkembangan ilmu pengetahuan dan teknologi. Kemampuan pengenalan suara yang dahulu terasa sulit untuk dilakukan oleh suatu mesin komputer sekarang bukanlah lagi hal yang mustahil. Skripsi ini bertujuan untuk menghasilkan sebuah program aplikasi Speech Recognizer yang dapat mengenali suara (kata-kata) yang diucapkan manusia dan menampilkannya kembali ke dalam bentuk tulisan atau bisa juga disebut dengan Speech-To-Text (STT). Proses pengenalan maupun training yang dilakukan pada skripsi ini menggunakan Spectrogram dan Backpropagation.

Metodologi yang digunakan dalam perancangan aplikasi ini disesuaikan dengan standar System Development Life Cycle (SDLC) yaitu dengan menggunakan metode waterfall sehingga program aplikasi yang dirancang dan merupakan hasil dari skripsi ini dapat memenuhi tujuan yang diharapkan.

Program aplikasi yang dirancang dalam skripsi ini menggunakan kata-kata berupa angka sebagai data training dan mampu mengenali kembali kata-kata baru yang diucapkan sesuai target yang diharapkan dengan tingkat akurasi yang tergantung pada kualitas data yang ditraining dan lamanya training. Training dapat terus dilanjutkan sampai pengenalan suara sampai program aplikasi mencapai tingkat akurasi yang diinginkan.

Program aplikasi Speech Recognizer ini dikembangkan dan diuji pada sebuah komputer pribadi dengan sistem operasi Windows, sedangkan alat-alat yang dibutuhkan berupa perangkat multimedia khususnya microphone atau alat input suara lainnya.

Kata Kunci: Speech Recognizer, Speech-To-Text, Pengenalan Suara, Pengenalan Percakapan, Spectrogram, Backpropagation, Artificial Neural Network, Jaringan Saraf Tiruan, Automatic Speech Recognition.

(2)

KATA PENGANTAR

Sebelumnya secara khusus penulis mengucap syukur dan terima kasih kepada Tuhan Yang Maha Esa yang menyertai penulis dalam perjuangan mengatasi rintangan untuk dapat menyelesaikan skripsi ini. Kuasa-Nya menjadi nyata saat penulis melihat kemustahilan.

Walaupun tugas membuat Skripsi ini terasa berat oleh penulis, namun dengan dukungan dari para dosen pembimbing dan orang-orang tercinta, akhirnya Skripsi ini dapat diselesaikan juga. Penulisan skripsi ini membuat penulis merasakan bahwa ketika tidak cepat menyerah, tidak ada yang mustahil untuk diselesaikan.

Skripsi ini disusun berdasarkan penelitian yang diperoleh dengan bertanya pada teman-teman penulis yang pernah menekuni bidang yang berkaitan dengan skripsi ini dan melalui referensi dari internet maupun buku-buku di perpustakaan ditambah lagi dengan penjelasan dari para dosen dan buku-buku yang berhubungan dengan topik Skripsi ini.

Penulis menyadari masih banyak kekurangan–kekurangan di dalam Skripsi ini, sehingga sangat mengharapkan bantuan berupa kritik dan saran dari para dosen berkaitan dengan penelitian dan pengembangan program aplikasi Speech Recognizer ini. Juga tidak lupa yang berkaitan dengan cara-cara yang baik untuk menyusun karya ilmiah di masa yang akan datang.

Penulis mengucapkan terima kasih kepada para pembimbing yang telah meluangkan waktu untuk memberikan petunjuk dalam mewujudkan Skripsi ini, terutama kepada:

• Bapak Prof. Dr. Geraldus Polla, M.App.Sc., selaku Rektor Universitas Bina Nusantara, yang telah berkenan memberikan kesempatan untuk menuntut ilmu kepada penulis di Universitas yang berada di bawah pimpinan beliau.

• Bapak Wikaria Gazali, S.Si., MT., selaku Dekan dan Ketua Jurusan Matematika Fakultas MIPA Universitas Bina Nusantara atas perhatian, pertolongan dan pengajaran yang telah diberikan selama ini.

(3)

• Bapak Ir. Sablin Yusuf, M.Sc., M.Comp.Sc., selaku Dekan Fakultas Teknik Informatika dan sekaligus sebagai Dosen Pembimbing penulisan skripsi ini yang sudah meluangkan waktunya untuk membimbing penulis mengerjakan skripsi ditengah-tengah kesibukan Beliau sebagai Dekan. • Bapak Rojali, S. Si., selaku Sekretaris Jurusan Matematika Fakultas MIPA

Universitas Bina Nusantara atas perhatian, pertolongan dan pengajaran yang telah diberikan selama ini.

• Bapak Fredy Purnomo, S.Kom., M. Kom., selaku Ketua Jurusan Teknik Informatika Fakultas TI Universitas Bina Nusantara atas perhatian, pertolongan dan pengajaran yang telah diberikan selama ini.

• Bapak Ashadi Salim, Drs., DR, selaku Dosen Pembimbing dari Fakultas MIPA yang berkat bimbingan dan kesabarannya dalam membimbing penulisan skripsi ini penulis mendapatkan semangat untuk mengerjakan skripsi ini sampai selesai.

• Bapak Ngarap Imanuel Manik, Drs., M.Kom., yang dengan hangat selalu menyambut dan membantu penulis selama menyelesaikan skripsi ini. • Para dosen MIPA maupun Teknik Informatika lainnya yang selama ini

sudah mengajar saya selama kuliah dan tentu saja tidak dapat disebutkan namanya satu per satu pada prakata ini.

• Kepada teman-teman yang terus mendukung dalam penulisan skripsi ini sehingga skripsi ini akhirnya bisa terwujud.

Walaupun telah berusaha dengan sebaik mungkin, penulis menyadari begitu banyak kekurangan yang terdapat dalam penulisan skripsi ini. Dengan segala kerendahan hati, penulis sangat menghargai segala saran maupun kritik yang membangun dari para pembaca untuk penyempurnaan skripsi ini dimasa yang akan datang. Akhir kata penulis berharap semoga skripsi ini dapat berkontribusi terhadap kemajuan dan perkembangan ilmu pengetahuan dan teknologi di Indonesia.

Jakarta, 30 Januari 2008 Penulis

(4)

vii

DAFTAR ISI

Halaman Judul Luar ... i

Halaman Judul Dalam ... ii

Halaman Persetujuan Pendukung ... iii

Abstrak ... iv

Kata Pengantar ... v

DAFTAR ISI ... vii

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Tujuan dan Manfaat ... 2

1.2.1 Tujuan ... 2

1.2.2 Manfaat ... 2

1.3 Ruang Lingkup ... 3

1.4 Metodologi Penelitian ... 4

1.5 Sistematika Penulisan ... 4

BAB II LANDASAN TEORI ... 7

2.1 System Development Life Cycle (SDLC) ... 7

2.2 Flowchart ... 8

(5)

viii

2.4 Sinyal Percakapan ... 10

2.5 Speech Recognition, Speaker Identity Verivication dan Speech Recognizer .. 13

2.6 Spectrogram dan Transformasi Fourier ... 14

2.7 Discrete-Time Short-Time Fourier Transform (STFT) ... 20

2.8 Biological Neural Network (Jaringan Saraf Biologi) ... 21

2.9 Artificial Neural Network (Jaringan Saraf Tiruan) ... 24

2.10 Fungsi Aktifasi ... 26

2.10.1 Fungsi Threshold (batas ambang) ... 26

2.10.2 Fungsi Sigmoid ... 27

2.10.3 Fungsi Identitas ... 27

2.11 Bias dan Threshold ... 27

2.12 Model Artificial Neural Network ... 28

2.12.1 Pelatihan dengan supervisi (Supervised Training) ... 28

2.12.2 Pelatihan tanpa supervisi (Unsupervised Training) ... 28

2.12.3 Jaringan Lapis Tunggal (Single Layer Network) ... 29

2.12.4 Jaringan Lapis Jamak (Multi Layer Network) ... 29

2.12.5 Jaringan Recurrent (Recurrent Network) ... 30

2.13 Backpropagation ... 31

BAB III ANALISIS DAN PERANCANGAN SISTEM PROGRAM ... 35

3.1 Analisis kebutuhan dan permasalahan ... 35

3.1.1 Tahap Pemrosesan Sinyal (Signal Processing) ... 35

3.1.2 Tahap Pelatihan (Training) ... 41

3.1.3 Tahap Pengenalan (Recognizing) ... 41

(6)

ix

3.2.1 Rancangan Program ... 42

3.2.1.1 Flowchart dan Sequence Diagram form Speech Recording... 42

3.2.1.2 Flowchart dan Sequence Diagram form Data Training ... 44

3.2.1.3 Flowchart dan Sequence Diagram form Recognize Speech ... 46

3.2.2 Rancangan Layar ... 48

3.2.2.1 Rancangan Layar Form Speech Recording ... 48

3.2.2.2 Rancangan Layar Form Data Training ... 49

3.2.2.3 Rancangan Layar Form Recognize Speech ... 50

3.2.2.4 Rancangan Laar Form About ... 51

3.2.3 Rancangan Struktur Menu ... 51

3.2.4 Rancangan Modul ... 52

BAB IV IMPLEMENTASI DAN EVALUASI PROGRAM ... 55

4.1 Kebutuhan Sistem ... 55

4.2 Contoh Pengoperasian ... 55

4.2.1 Form Speech Recording ... 57

4.2.2 Form Training Data ... 58

4.2.3 Form Recognize Speech ... 60

4.2.4 Form About ... 61

4.3 Pengujian Sistem ... 62

4.3.1 Perekaman Suara Percakapan (Speech Recording) ... 62

4.3.2 Pelatihan Data Suara (Data Training) ... 62

4.3.3 Pengenalan Suara Percakapan (Recognize Speech) ... 62

4.3.3.1 Pengenalan Terhadap Suara Pria ... 63

(7)

x

4.4 Pembahasan Hasil ... 65

BAB V KESIMPULAN DAN SARAN ... 67

5.1 Kesimpulan... 67

5.2 Saran ... 67

DAFTAR PUSTAKA ... 69

DAFTAR RIWAYAT HIDUP ... 71 LAMPIRAN ... L 1

(8)

xi

DAFTAR TABEL

Tabel 4.1 Hasil uji pengenalan terhadap suara 15 orang Pria ... 63 Tabel 4.2 Hasil uji pengenalan terhadap suara 15 orang Wanita ... 64

(9)

xii

DAFTAR GAMBAR

Gambar 2.1 System Development Life Cycle dengan Waterfall Model ... 7

Gambar 2.2 Flowchart untuk menghitung faktorial N (N!) ... 9

Gambar 2.3 Diagram sinyal analog dan sinyal digital ... 12

Gambar 2.4 Diagram model sistem produksi suara manusia ... 12

Gambar 2.5 Spectrogram ... 15

Gambar 2.6 Spektrum selama rentang waktu yang singkat ... 15

Gambar 2.7 Wide Band Spectrogram ... 16

Gambar 2.8 Spectrogram dari pengucapan kalimat “We were away a year ago” ... 16

Gambar 2.9 Transformasi narrowband dan wideband ... 17

Gambar 2.10 Wideband, narrowband spectrogram dan amplitudo percakapan untuk pengucapan kata “Every salt breeze comes from the sea.” ... 18

Gambar 2.11 Spectrogram dalam berbagai ukuran window ... 19

Gambar 2.12 Spectrogram dalam berbagai ukuran window ... 21

Gambar 2.13 Sel saraf pada otak manusia (Halici 2008, p3) ... 22

Gambar 2.14 Scwann Cell dalam sel saraf pada otak manusia (Halici 2008, p3) ... 22

Gambar 2.15 Sinapsis yg terbentuk antara neuron (Halici, 2008, p4) ... 23

Gambar 2.16 Model jaringan Artificial Neural Network ... 25

Gambar 2.17 Arsitektur jaringan lapis tunggal ... 29

Gambar 2.18 Arsietektur jaringan lapis jamak ... 30

Gambar 2.19 Arsitektur Backpropagation dengan satu hidden layer ... 31

(10)

xiii

Gambar 3.2 Sinyal suara pengucapan “satu dua tiga” sebelum dan sesudah penghilangan

noise ... 36

Gambar 3.3 Sinyal kata “satu” yang terpisah menjadi potongan kata “sa” dan “tu” yang terpotong saat penghilangan noise ... 37

Gambar 3.4 Sinyal suara pengucapan “satu dua tiga” sebelum dan sesudah pengelompokan kata ... 38

Gambar 3.5 Sinyal potongan kata “sa” dan “tu” yang disatukan kembali menjadi kata “satu” ... 38

Gambar 3.6 Penentuan batas awal dan akhir suatu kata untuk kemudian dipotong menjadi sinyal terpisah untuk di-training maupun untuk dikenali ... 39

Gambar 3.7 Spectrogram dari pengucapan kalimat yang sudah dipisahkan menjadi kata-kata: “satu”, “dua” dan “tiga” ... 40

Gambar 3.8 Spectrogram pengucapan kata “satu” yang dipotong menjadi 5 bagian vertikal dan 30 bagian horisontal ... 40

Gambar 3.9 Flowchart perekaman suara ... 43

Gambar 3.10 Sequence diagram perekaman suara ... 44

Gambar 3.11 Flowchart training data ... 45

Gambar 3.12 Sequence diagram training suara ... 46

Gambar 3.13 Flowchart pengenalan suara ... 47

Gambar 3.14 Sequence diagram pengenalan terhadap suara ... 48

Gambar 3.15 Rancangan form pengenalan suara ... 49

Gambar 3.16 Form dialog input nama file ... 49

Gambar 3.17 Rancangan form training data ... 50

(11)

xiv

Gambar 3.19 Rancangan form pengenalan suara ... 51

Gambar 3.20 Rancangan susunan menu ... 52

Gambar 4.1 Menyalin folder program aplikasi ke local directory komputer ... 56

Gambar 4.2 Mengganti active directory ke tempat program aplikasi terpasang ... 56

Gambar 4.3 Tampilan menu navigasi program ... 57

Gambar 4.3 Form Speech Recording ... 57

Gambar 4.4 pesan permintaan nama file ... 58

Gambar 4.5 Form Training Data ... 58

Gambar 4.6 Dialog untuk memilih folder ... 59

Gambar 4.7 Permintaan nilai epoch dan goal ... 60

Gambar 4.8 Form Recognize Speech ... 60

Gambar 4.8 Form Recognize Speech ... 60

(12)

xv

DAFTAR LAMPIRAN

Referensi

Dokumen terkait

Berdasarkan hasil dan pembahasan penelitian hubungan pengetahuan ibu yang memiliki bayi tentang imunisasi dasar dengan kepatuhan pemberian imunisasi di kelurahan Tipar

Tindakan strategi yang dilakukan dalam Pembentukan Kecamatan Kubu Babussalam Kabupaten Rokan Hilir Tahun 2002-2011 adalah sebuah tindakan musyawarah yang mana dalam

Perilaku menggunakan air sungai Linear Quadratic Cubic Persepsi terhadap kesehatan Included Unspecified .0001 Model Name 1 Dependent Variable 1 2 3 Equation Independent

Berdasarkan hasil jawaban siswa dan wawancara S1 pada masalah 1, maka disimpulkan bahwa, S1 sudah memiliki kemampuan pemecahan masalah dalam menyelesaikan masalah

etika yang mana konsep kehendak bebas menurut Henri Bergson

Transformational leadership variable was the most dominant influence on the work environment variable with the path coefficient (0.46 or 46%). There was a positive

membedakan pada media dan alat mainnya saja. Ular tangga ini bisa dimainkan maksimal oleh empat orang anak. Tawarkan pada yang mau bermain ular tangga.. Permainan berawal di

8 Tahun 2010 tentang tindak pidana pencucian uang (Money Laundering) dalam pencegahan aliran dana transaksi yang berasal dari suatu tindak pidana dalam penyedia