APLIKASI PENGENALAN SUARA PEMBICARA MENGGUNAKAN HIDDEN MARKOV MODEL (HMM).

(1)

APLIKASI PENGENALAN SUARA PEMBICARA MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)

SKRIPSI

Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Sarjana Komputer

Program Studi Ilmu Komputer

Oleh:

Rezdy Anugrah Perdana 0608616

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA

(2)

Aplikasi Pengenalan Suara

Pembicara Menggunakan

Hidden

Markov Model

_(HMM)

Oleh

Rezdy Anugrah Perdana

Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam

Agustus 2013

Hak Cipta dilindungi undang-undang.

(3)

APLIKASI PENGENALAN SUARA PEMBICARA MENGGUNAKAN HIDDEN MARKOV MODEL (HMM)

Oleh:

Rezdy Anugrah Perdana 0608616

Disetujui dan disahkan oleh: Pembimbing I,

Drs. Waslaluddin, M.T. NIP. 196302071991031002

Pembimbing II,

Muhammad Nursalman, M.T. NIP. 197909292006041002

Mengetahui,

Ketua Program Studi Ilmu Komputer

Rasim, M.T.

(4)

Rezdy Anugrah Perdana, 2014

Aplikasi Pengenalan Suara Pembicara Menggunakan Hidden Markov Model (HMM)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu ABSTRAK

Sistem Speaker Recognition merupakan sebuah sistem yang dapat mengenali pembicara hanya melalui suaranya. Terdapat dua jenis speaker recognition, yaitu speaker identification dan speaker verification. Speaker recognition digunakan untuk mengidentifikasi siapa yang sedang berbicara sedangkan speaker verification digunakan untuk mengesahkan apakah orang yang sedang berbicara merupakan target speaker. Dalam skripsi ini digunakan metode ekstraksi ciri Mel-Frequency Cepstral Coefficients (MFCC) dan pengenalan pola menggunakan Hidden Markov Models. Eksperimen dilakukan dengan 8 orang responden yang mengucapkan kata “Pendidikan” sebanyak 20 kali secara berturut-turut. 10 data ucapan digunakan sebagai data training sedangkan 10 sisanya digunakan sebagai data uji. Hasil eksperimen tersebut menunjukkan tingkat akurasi dari sistem adalah sebesar 71.25%.

(5)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu ABSTRACT

Speaker Recognition System is a system that can recognize people only through his voice. There are two types of speaker recognition, the speaker identification and speaker verification. Speaker recognition is used to identify who is speaking while the speaker verification is used to validate whether the person who is speaking is the target speaker. This study used Mel-Frequency Cepstral Coefficients (MFCC) feature extraction method and pattern recognition using Hidden Markov Models. Experiments performed with 8 respondents who say the word "Pendidikan" as many as 20 times in a row. 10 are used as training data, while the remaining 10 are used as test data. The experimental results demonstrate the accuracy of the system is equal to 71.25%.

(6)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu DAFTAR ISI

BAB II TINJAUAN PUSTAKA ... 10

2.1 Proses Produksi Suara ... 10

2.2 Sinyal dan Sinyal Percakapan ... 11

(7)

vi

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

2.4.1 Algoritma Endpoint Detection ... 19

2.4.2 Pre-emphasis ... 21

2.5 Ekstraksi Ciri ... 22

2.5.1 Framing ... 22

2.5.2 Windowing ... 23

2.5.3 Fast Fourier Transform ... 24

2.5.4 Mel-Frequency Cepstrum Coefficients (MFCCs) ... 24

2.5.5 Discrete Cosine Transform ... 28

2.6 Hidden Markov Model ... 29

2.6.1 Algoritma Forward-Backward... 31

2.6.2 Algoritma Viterbi ... 33

2.7 Dynamic Time Warping (DTW) ... 36

BAB III METODOLOGI PENELITIAN ... 39

3.1 Desain Penelitian ... 39

3.2 Alat dan Bahan Penelitian ... 42

3.2.1 Alat Penelitian ... 42

3.2.2 Bahan Penelitian... 42

3.3 Metode Penelitian ... 43

3.3.1 Metode Pengumpulan Data ... 43

3.3.2 Metode Pengembangan Perangkat Lunak ... 43

3.4 Implementasi ... 48

BAB IV HASIL PENELITIAN DAN PEMBAHASAN ... 49

4.1 Pengembangan Sistem Speaker Recognition... 49

4.2 Alur Sistem Speaker Recognition ... 49

4.2.1 Input Data ... 50

4.2.2 Ekstraksi Informasi ... 52

4.2.3 Hidden Markov Model ... 70

4.3 Perancangan Perangkat Lunak ... 72

4.4 Implementasi Sistem ... 74

(8)

vii

4.5.1 Skenario Pengujian... 76

4.5.2 Hasil Pengujian ... 77

BAB V KESIMPULAN DAN SARAN ... 79

5.1 Kesimpulan ... 79

5.2 Saran ... 79

(9)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu DAFTAR TABEL

Tabel 2.1 Model Koin dengan Probabilitas ... 34

Tabel 4.1 Interval Frekuensi Sampling dan Jumlah Sampel yang Dihasilkan ... 51

Tabel 4.2 Data Contoh Sinyal Ucapan ... 52

Tabel 4.3 Jumlah Sampel Setelah EPD, Sebelum EPD dan Kerapatan Ucapan . 55 Tabel 4.4 Data yang Telah Ditandai dan dimasukkan kedalam frame-frame. ... 56

Tabel 4.5 Jumlah Frame Untuk Tiap Pembicara ... 63

Tabel 4.6 Data yang Telah Dikelompokkan Ke Dalam Frame ... 64

Tabel 4.7 Kelas Kelas Antarmuka ... 76

(10)

ix

DAFTAR GAMBAR

Gambar 2.1 (a) Sinyal Waktu Kontinu dan (b) Sinyal Waktu Diskrit ... 12

Gambar 2.2 Produksi Suara Manusia ... 13

Gambar 2.3 Sampling Sinyal ... 15

Gambar 2.4 Pembentukan Frame Pada Sinyal Ucapan ... 23

Gambar 2.5 Blok Diagram MFCC ... 25

Gambar 2.6 Mel Filterbank ... 27

Gambar 2.7 Topologi Model HMM Jenis Kiri ke Kanan dengan Empat State... 30

Gambar 2.8 Topologi Model HMM Jenis Kiri ke Kanan Pada Kata yang Terbentuk dengan Empat Fonem ... 30

Gambar 2.9 Lintasan Viterbi ... 36

Gambar 2.10 Pencocokan sequence(a) alignment asli dari 2 sequence(b) alignment dengan DTW ... 37

Gambar 3.1 Desain Penelitian ... 39

Gambar 3.2 Model Pengembangan Perangkat Lunak ... 47

Gambar 4.1 Perancangan Model Sistem Speaker Recognition ... 49

Gambar 4.2 Sinyal Ucapan Sebelum EPD ... 53

Gambar 4.3 Sinyal Ucapan Sesudah EPD ... 54

Gambar 4.4 Gambar Sinyal Suara Sebelum dan Sesudah PreEmphasis ... 58

Gambar 4.5 Mel Filterbank ... 69

Gambar 4.6 Topologi model HMM untuk kata “pendidikan” ... 71

Gambar 4.7 Rancangan Antarmuka Form Utama ... 72

Gambar 4.8 Rancangan Antarmuka Form Training ... 73

Gambar 4.9 Rancangan Antarmuka Form Rekam Data Training ... 73

Gambar 4.10 Rancangan Antarmuka Form Kenali Suara Pembicara ... 73

Gambar 4.11 Implementasi Antarmuka Form Utama ... 74

Gambar 4.12 Implementasi Antarmuka Form Training ... 74

Gambar 4.13 Implementasi Antarmuka From Rekam Data Training ... 75

(11)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu BAB I

PENDAHULUAN

1.1 Latar Belakang

Menurut Kamus Besar Bahasa Indonesia (KBBI) suara adalah bunyi yang dikeluarkan dari mulut manusia (Seperti pada waktu bercakap-cakap, menyanyi, tertawa, dan menangis). Dalam perkembangannya suara dapat dipelajari sebagai suatu media yanga dapat diidentifikasi untuk mengenali identitas seseorang yang menjadi sumber suara (orang yang mengeluarkan suara) yang nantinya hasil identifikasi tersebut dapat digunakan dalam berbagai hal sesuai peruntukannya.

(12)

2

siapa yang menyanyi dengan ketentuan kita telah mengenali orang tersebut sebelumnya. Artinya dari suara pembicara yang kita dengar kita bisa mengetahui identitas pembicara.

Selain untuk mengenali identitas pembicara, dari suara yang kita dengar kita juga bisa menentukan orang yang berbicara tersebut kita kenali atau tidak. Bagaimana kita bisa menentukannya? Kita dapat menentukan orang yang berbicara kita kenali atau tidak diperoleh dari hasil identifikasi suara yang kemudian dicocokkan secara visual dengan fisik orang yang berbicara sehingga tanpa melihat orangnya langsung kita bisa mengetahui orang yang berbicara tersebut kita kenali atau tidak.

Proses pengenalan identitas seperti yang dijelaskan di atas dikenal sebagai speaker recognition atau voice recognition (Pengenalan pembicara). Speaker

recognition (Pengenalan pembicara) terdiri dari dua jenis, yaitu speaker

verification (Verifikasi pembicara), dan speaker identification (Identifikasi

(13)

3

spesifik identitas pembicara. Artinya pada bagian ini akan memberikan informasi identitas pembicara secara lebih rinci. Ada banyak perusahaan yang telah membuat aplikasi pengenalan suara yang digunakan untuk merespon perintah suara yang diberikan oleh pembicara diantaranya adalah Nuance Voice Biometrics yang telah konsen menjadi perusahaan yang menyediakan aplikasi pengenalan suara sebagai kata sandi (password). Selain itu ada juga Mobbeel yang merupakan salah satu perusahaan yang mengembangkan aplikasi pengenalan suara untuk sistem operasi Android dan iOS pada telepon pintar (smartphone).

Informasi mengenai identitas pembicara yang diperoleh dari suara merupakan hal yang sangat unik bagi siapa saja termasuk bagi peneliti. Keunikan inilah sangat menarik untuk dikaji lebih dalam sehingga dapat diimplementasikan di masa sekarang dan masa yang akan datang. Salah satu keunikan menggunakan metode-metode biometric seperti ini adalah tingkat sekuritasnya yang tinggi.

Pada dasarnya suara yang dikeluarkan oleh tiap orang memiliki karakter yang berbeda-beda. Setiap manusia dikaruniai dengan sebuah sistem pembangkit suara (rongga perut-membran-rongga dada) vocal fold dan sistem modulator/resonator yang kompleks (filter) yang disebut vocal tract (mulai dari laryng sampai bibir). Pada sistem pembangkit suara saja setiap orang

(14)

4

Sama halnya pada sistem pembangkit suara, pada sistem vocal tract manusia pun antara satu orang dengan orang yang lainnya memiliki vocal tract yang berlainan mulai dari larying hingga bibir. Tentu saja bibir yang bentuknya dan ukuran yang tidak sama akan menghasilkan suara yang tidak sama pula. Selain itu logat dan intonasi suara yang diucapkan seorang pembicara juga bisa menjadi salah satu faktor pembeda suara yang dikeluarkan oleh masing-masing orang. Artinya logat dan intonasi suara akan memberikan pengaruh terhadap karakteristik suara seseorang sehingga setiap orang akan memiliki keunikan suara tersendiri berbeda dengan yang lain walaupun ada beberapa kasus yang bisa meniru suara orang lain tapi dapat dipastikan itu hanya bersifat identik sama bukan sama percis dengan suara pembicara yang sebenarnya. Maka dapat disimpulkan setiap orang memiliki karakter suara tersendiri berbeda dengan yang lain sehingga pada kondisi normal suara seorang manusia dapat dikatakan unik atau berbeda satu sama lain. Keunikan inilah yang menyebabkan suara memiliki tingkat sekuritas yang tinggi karena suara merupakan unsur yang lebih rumit untuk bisa dimodifikasi atau ditiru sehingga diharapkan di masa mendatang penggunaan password dengan cara ditik melalui keyboard atau alat masukan lainnya dapat digantikan dengan masukan berupa suara.

(15)

5

dapat dikenali. Tujuan akhir dari penelitian ini adalah menciptakan sebuah prototype aplikasi pengenalan suara pembicara yang nantinya dapat

dikembangkan lagi menjadi aplikasi untuk membuka sandi dengan menggunakan suara seperti aplikasi face recognition untuk membuka sandi dengan menggunakan wajah yang telah banyak dikembangkan.

Berdasarkan pemaparan di atas maka peneliti melakukan penelitian yang berjudul “Aplikasi Pengenalan Suara Pembicara Menggunakan Hidden Markov Models (HMM)” dan produk hasil penelitian berupa prototype aplikasi pengenalan suara pembicara (APSP).

1.2 Perumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka permasalahan yang akan dikaji dalam penelitian ini dapat dijabarkan ke dalam beberapa pertanyaan penelitian sebagai berikut:

1. Bagaimana membangun aplikasi pengenalan pembicara menggunakan Hidden Markov Model (HMM)?

(16)

6

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu 1.3 Batasan Masalah

Agar penelitian ini lebih terarah, maka peneliti akan memberikan batasan-batasan pada permasalahan yang akan dikaji. Batasan masalah dalam penelitian ini difokuskan hanya pada hal-hal sebagai berikut:

1. Membangun aplikasi yang dapat mengenal pembicara dengan menggunakan Hidden Markov Model.

2. Aplikasi yang dibangun masih merupakan prototype.

3. Data suara yang digunakan merupakan data suara yang telah ditentukan penyebutannya oleh peneliti yang dilakukan pembicara yang dijadikan percobaan.

4. Aplikasi yang dibuat dalam penelitian ini hanya untuk sebuah aplikasi pengenalan suara pembicara.

5. Persentase kebenaran yang muncul hanya untuk pengujian dari data training yang telah ada.

6. Sistem hanya dapat menggunakan database training yang dibuat oleh penulis.

7. Pengujian dilakukan dengan menggunakan suara berbeda yang telah terlebih dahulu ada didalam database training.

(17)

7

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu 1.4 Tujuan Penelitian

Tujuan yang hendak dicapai dalam penelitian ini adalah membangun suatu perangkat lunak pengenalan suara pembicara menggunakan Hidden Markov Model sehingga diperoleh prototype aplikasi pengenalan suara pembicara yang

nantinya dapat dikembangkan menjadi aplikasi-aplikasi lain yang lebih besar. Adapun detail dari tujuan yang ingin penulis capai antara lain:

1. Mengetahui langkah-langkah dalam membangun suatu aplikasi Pengenalan Suara Pembicara.

2. Memahami bagaimana Hidden Markov Model diterapkan dalam Aplikasi Pengenalan Suara Pembicara.

1.5 Manfaat Penelitian

Setiap penelitian sudah semestinya memiliki sejumlah manfaat, baik bagi peneliti maupun bagi pihak-pihak lain yang terkait dengan permasalahan yang dikaji dalam penelitian. Beberapa manfaat yang diperoleh dari penelitian yang dilakukan adalah sebagai berikut:

1. Mengetahui cara kerja pola pengenalan suara pembicara menggunakan Hidden Markov Model (HMM).

(18)

8

3. Hasil penelitian ini diharapkan dapat membantu para pengembang supaya dapat mengembangkan aplikasi yang lebih kompleks sehingga hasilnya mempunyai nilai jual yang sangat tinggi dan bermanfaat bagi kehidupan orang banyak.

1.6 Metode Penelitian

Adapun metodologi yang diterapkan dalam pembuatan skripsi ini, antara lain:

1. Studi Literatur

Mempelajari konsep dan teori mengenai pengenalan pembicara dan Hidden Markov Model melalui literatur-literatur seperti buku (textbook),

paper, dan sumber ilmiah lain seperti situs intenet ataupun artikel dokumen teks yang berhubungan.

2. Analisis dan Perancangan Perangkat Lunak

Analisis dan perancangan perangkat lunak dilakukan untuk menentukan permasalahan mengenai bahasa pemrograman yang akan digunakan, struktur data, serta input/output program.

(19)

9

Detail mengenai implementasi program dilakukan sesuai hasil analisis pada tahapan sebelumnya dan melakukan pengujian terhadap perangkat lunak yang dihasilkan dari tahap sebelumnya.

4. Hasil Akhir dan Penarikan kesimpulan

Analisis hasil dilakukan untuk mengetahui performasi pembangunan Aplikasi Pengenalan Suara Pembicara untuk membantu mereka yang membutuhkan.

1.7 Sistematika Penulisan

Sistematika penulisan yang digunakan dalam penelitian ini antara lain : BAB 1 PENDAHULUAN

Bab ini membahas mengenai latar belakang penulisan skripsi, perumusan masalah, pembatasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian dan sistematika penulisan yang digunakan.

BAB 2 TINJAUAN PUSTAKA

Meliputi gambaran konseptual dan pendekatan teoritis yang terkait dengan lingkup penelitian yang dilakukan.

BAB 3 METODE PENELITIAN

(20)

10

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu BAB 4 HASIL PENELITIAN DAN PEMBAHASAN

Bab ini menjelaskan pembahasan terhadap masalah-masalah yang telah dirumuskan dan hasil penelitian yang telah dilakukan.

BAB 5 PENUTUP

(21)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu BAB III

METODOLOGI PENELITIAN

3.1 Desain Penelitian

(22)

40

Gambar 3.1 Desain Penelitian

Penjelasan mengenai gambar desain penelitian adalah sebagai berikut:

1. Rumusan masalah merupakan dasar pemikiran dan merupakan acuan dalam penelitian ini. Dalam penelitian ini, permasalahan yang akan di analisis adalah mengenai pengenalan suara pembicara. untuk lebih jelas Studi Literatur

Hasil Penelitian Dokumentasi Hasil

Penelitian Dokumentasi

Analisis Hasil Penelitian

Pelatihan HMM Pemodelan HMM

Pengujian Prediksi

(23)

41

mengenai rumusan masalah dari penelitian ini dapat dilihat pada subbab 1.2 rumusan masalah.

2. Studi literatur dan kepustakaan dilakukan dengan mempelajari dan memahami teori-teori yang berkaitan dengan penelitian ini seperti masalah pemrosesan sinyal suara, pencarian fitur dari sinyal suara, implementasi Hidden Markov Models untuk pelatihan maupun pengenalan suara pembicara, dan yang berkaitan dengan pengembangan perangkat lunak. 3. Data latih maupun data uji didapatkan melalui antarmuka aplikasi yang

dikembangkan. Data latih merupakan data sampel suara dari Target Speaker. Sedangkan data uji merupakan data sampel suara dari Test Speaker.

4. Data latih maupun uji melalui pra proses terlebih dahulu, dimana praproses tersebut adalah normalisasi sinyal, normalisasi dilakukan agar sinyal suara memiliki rentang nilai yang sama. Selain itu dilakukan juga penghilangan silence-frame, silence-frame merupakan sinyal suara yang tak bernilai.

Penghilangan silence-frame dilakukan menggunakan algoritma EndPoint Detection.

(24)

42

diskontinuitas pada bagian awal dan akhir sinyal. Model window yang digunakan pada sistem ini adalah hamming window.

6. Setelah melalui framing dan windowing, sinyal suara diproses lebih lanjut menggunakan ekstraksi ciri. Pada penelitian ini ekstraksi ciri yang digunakan adalah MFCC (Mel-Frequency Cepstral Coefficients).

7. Pada tahap ini, data latih yang telah di ekstrak cirinya akan dilakukan pelatihan menggunakan HMM untuk mendapatkan template model dari data tersebut. Sementara itu data uji dilakukan pembuatan model yang nantinya akan dibandingkan dengan template model.

8. Setelah model dari data uji didapatkan, selanjutnya model tersebut dibandingkan dengan template model yang telah dibuat dan disimpan sebelumnya untuk mencari kemiripan antar model. Pada tahap ini dicari model dengan tingkat kemiripan yang tinggi.

9. Aplikasi Pengenal Suara Pembicara atau disebut APSP merupakan nama perangkat lunak yang dikembangkan.

10.Metode pendekatan yang digunakan dalam penelitian ini menggunakan pendekatan Object Oriented dengan model proses prototype.

(25)

43

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu 3.2 Alat dan Bahan Penelitian

3.2.1 Alat Penelitian

Alat yang digunakan dalam penelitian ini adalah seperangkat komputer dengan spesifikasi yang cukup untuk menjalankan perangkat lunak Netbeans IDE 7.3 dengan menggunakan bahasa pemrograman Java yang berjalan pada Sistem Operasi Windows XP SP3 32bit. Adapun spesifikasi dari computer yang digunakan dalam penelitian adalah:

 Processor dual core 2.1 Ghz  RAM 2 GB

 Harddisk 320 GB

 Monitor dengan kemampuan resolusi 1366 x 768 pixel, dengan kedalaman warna 32 bit

 Perangkat Mouse dan Keyboard  Soundcard internal

 Microphone untuk melakukan perekaman suara

3.2.2 Bahan Penelitian

(26)

44

sebelumnya, yaitu ucapan “Pendidikan”. setiap naracoba diambil sampelnya untuk pelatihan diambil sebanyak 10 sampel, yang nantinya akan diambil data sampel tersebut untuk membuat pola HMM tiap-tiap pembicara untuk dijadikan acuan pada tahap pengenalan. Algoritma yang digunakan untuk membuat pola HMM tersebut adalah algoritma forward-backward.

3.3 Metode Penelitian

Pada penelitian ini, metode yang digunakan meliputi metode pengumpulan data dan metode pengembangan perangkat lunak.

3.3.1 Metode Pengumpulan Data

Metode pengumpulan data dalam skripsi ini adalah studi literatur. Studi literatur dilakukan dengan mengumpulkan dan mempelajari literatur atau kepustakaan yang berkaitan dengan skripsi ini, seperti teori dan konsep Hidden Markov Models dan pembahasan mengenai masalah identifikasi suara pembicara

(27)

45

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu 3.3.2 Metode Pengembangan Perangkat Lunak

3.3.2.1Pendekatan Pengembangan Perangkat Lunak

Dalam proses pengembangan perangkat lunak ini, pendekatan yang digunakan adalah pendekatan berorientasi objek, dimana dalam paradigma ini domain permasalahan diabstraksikan sebagai suatu set objek yang mempunyai atribut dan perilaku tertentu.

Pada paradigma berorientasi objek ini, ada beberapa konsep yang harus diketahui, yaitu :

1. Class dan Object

Class merupakan model yang berisi kumpulan attribute dan method dalam

suatu unit untuk suatu tujuan tertentu. Sebagai contoh class manusia memiliki attribute berat, tinggi, usia kemudian memiliki method makan, minum, tidur. Method dalam sebuah class dapat merubah attribute yang dimiliki oleh class tersebut. Sebuah class merupakan dasar dari modularitas dan struktur dalam pemrograman berorientasi object.

Sedangkan Object merupakan perwujudan dari class, setiap object akan mempunyai attribute dan method yang dimiliki oleh class-nya, contohnya: amir, ahmad, yani merupakan object dari class manusia. Setiap object dapat berinteraksi dengan object lainnya meskipun berasal dari class yang berbeda.

(28)

46

Adalah berbagai variabel yang mengitari class, dengan nilai datanya bisa ditentukan di object.

3. Operations, Method, dan Services

Setiap object membungkus data (yang direpresentasikan dalam suatu koleksi attribute) dan algoritma yang akan mengolah data tersebut. Algoritma-algoritma tersebutlah yang dimaksud dengan operations, method atau services.

4. Messages

Suatu class harus berinteraksi dengan class lainnya untuk mencapai suatu tujuan tertentu. Messages ini memungkinkan object untuk menstimulasi object lainnya untuk melakukan suatu behavior terentu.

5. Encapsulation, Inheritance, dan Polymorphism

Ketiga hal ini merupakan karakteristik dari paradigma berorientasi objek, Encapsulation yaitu merupakan suatu mekanisme untuk menyembunyikan

atau memproteksi suatu proses dari kemungkinan interferensi atau penyalahgunaan dari luar sistem dan sekaligus menyederhanakan penggunaan sistem tersebut.

(29)

47

yang spesifik didalamnya, sedangkan attribute dan method yang lebih umum akan didapatkan dari class yang menjadi induknya.

Polymorphism merupakan konsep yang memungkinkan digunakannya suatu interface yang sama untuk memerintah suatu object agar melakukan suatu tindakan yang mungkin secara prinsip sama tetapi secara proses berbeda.

Untuk pemodelan perangkat lunak berorientasi objek, digunakan UML (Unified Modeling Language) yang merupakan bahasa standar yang digunakan untuk memvisualisasikan dan menjelaskan artifak dari proses analisis dan desain berorientasi objek. UML menyediakan standar notasi dan diagram-diagram yang bisa digunakan untuk memodelkan sistem.

Diagram-diagram pada UML terbagi kedalam 3 klasifikasi, yaitu : 1. Behavior Diagrams

Jenis diagram yang menggambarkan perilaku fitur dari sistem atau proses bisnis. Diagram-diagram yang termasuk dalam klasifikasi ini adalah activity diagram, state machine diagram, use case diagram, dan ke 4 subset dari interaction diagrams.

2. Interaction Diagrams

(30)

48

communication diagram, interaction overview diagram, sequence

diagram, dan timing diagrams.

3. Structure Diagrams

Jenis diagram yang menggambarkan unsur-unsur yang harus ada pada sistem. Diagram-diagram yang termasuk dalam klasifikasi ini adalah composite structure diagram, component diagram, deployment diagram,

object diagram, dan package diagrams.

3.3.2.2Model Proses

Dalam pengembangan perangkat lunak, penulis menggunakan model Prototype. Untuk lebih jelasnya dapat dilihat pada gambar berikut:

Gambar 3.2 Model Pengembangan Perangkat Lunak

(31)

49

Pada tahap awal dilakukan analisis kebutuhan, proses ini dilakukan untuk mengetahui informasi, model, dan spesifikasi dari sistem yang dibutuhkan.

2. Pembuatan Prototype

Pada tahap ini, akan dilakukan pembuatan prototype sesuai dengan kebutuhan.

3. Evaluasi Prototype

Tahap dimana prototype dievaluasi apakah sudah cocok atau belum dengan kebutuhan.

4. Pengembangan perangkat lunak akhir

Melakukan pembuatan perangkat lunak yang telah cocok sesuai dengan kebutuhan sekaligus melakukan penyelesaian pengembangan perangkat lunak.

5. Pengujian (Testing)

Tahapan selanjutnya adalah proses pengujian perangkat lunak, proses pengujian ini dilakukan untuk memastikan perangkat lunak yang telah dibuat telah sesuai dengan kebutuhan. Pengujian menggunakan metode blackbox.

(32)

50

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu 3.4 Implementasi

(33)

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Dari penelitian yang telah dilakukan dapat ditarik kesimpulan sebagai berikut:

1. Langkah-langkah untuk membuat aplikasi pengenalan suara pembicara antara lain adalah silence removal, preemphasis, framing, windowing, feature extraction menggunakan Mel Frequency Cepstral Coefficient

(MFCC), kemudian training menggunakan algoritma forward-backward dan pencocokan suara menggunakan algoritma viterbi.

2. Pada penelitian ini, hasil akurasi dari sistem dengan mengucapkan kata “pendidikan” yang dilakukan oleh 8 orang pembicara, 10 buah sampel training dan 10 buah sampel uji, diperoleh rata-rata akurasi sebesar 71.25 %.

5.2 Saran

Saran penulis untuk penelitian lebih lanjut dalam penelitian Sistem Speaker Recognition adalah:

1. Sistem identifikasi pembicara yang berhasil dibuat dalam penelitian ini

(34)

80

diharapkan dapat menciptakan algoritma yang lebih baik yang mampu

mengatasi masalah noise tersebut.

2. diharap untuk penelitian selanjutnya, sistem dapat mengenali suara

pembicara otomatis, dengan kata lain sistem dapat mengenali pembicara

ketika pembicara berbicara tanpa harus di stop.

3. sistem ini dapat dikembangkan lagi untuk keperluan security, seperti

menggunakan suara sebagai password.

4. Sistem ini dapat dikembangkan menjadi voice command untuk menjalankan suatu aplikasi atau menjadi aplikasi speech to text dimana

kita tidak perlu lagi menggunakan keyboard untuk mengetik, cukup

dengan suara saja.

5. Untuk penelitian selanjutnya, diharapkan sistem dapat menolak pembicara yang tidak terdapat dalam database. Dengan kata lain pembicara yang

tidak ada dalam database pembicara tidak akan dikenali sebagai pembicara

(35)

81

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu DAFTAR PUSTAKA

Abdalla, M. I., & Ali, H. S. (2010, March). Wavelet-Based Mel-Frequency Cepstral Coefficients for Speaker Identification using Hidden Markov

Models. JOURNAL OF TELECOMMUNICATIONS, 1(2), pp. 16-21.

Abdallah, S. J., Osman, I. M., & Mustafa, M. E. (2012). Text-Independent Speaker Identification Using Hidden Markov Model. World of Computer

Science and Information Technology Journal (WCIST), 2(6), pp. 203-208. Antoniou, A. (2006). Digital Signal Processing. New York: McGraw-Hill.

Buono, Agus., Mandasari. Yani., & Neyman, Shelvie Nidya. (2010) Pengembangan Model Markov Tersembunyi untuk Pengenalan Kata Berbahasa Indonesia. Seminar dan Call for Paper Munas Aptikom. Bandung, Indonesia.

Fang, Chunsheng., 2009, From Dynamic Time Warping (DTW) to Hidden Markov Model (HMM), Final project report for ECE742 Stochastic Decision,

University of Cincinnati, USA.

Gangisetty, Smitha. 2005. “Text-Independent Speaker Recognition”. College of Engineering and Mineral Resources. Morgantown: West Virginia University.

(36)

82

Ihsan, Mahyus. 2006. “Pengembangan Model Markov Tersembunyi Pada Identifikasi Pembicara”. Sekolah Pascasarjana. Bogor: Institut Pertanian Bogor.

Ilyas, M. Z., Samad, S. A., Hussain, A., & Ishak, K. A. (2007). Speaker Verification using Vector Quantization and Hidden Markov Model.

Student Conference on Research and Development, pp. 1 - 5.

Khairulvani, Feni. 2007. “Identifikasi Individu Melalui Suara Ucapan Dengan Ekstraksi Ciri Mel-Frequency Cepstral Coefficient(MFCC) Sebagai Input

Jaringan Syaraf Tiruan”, Tugas Akhir, Institut Teknologi Bandung,

Bandung, Indonesia.

Manunggal, Heri Sugianto. 2010. “Perancangan dan pembuatan perangkat lunak pengenalan suara pembicara dengan menggunakan analisa MFCC

feature extraction”. Program Studi Teknik Informatika. Surabaya: Universitas Kristen Petra.

Muda, L., Begam, M., & Elamvazuthi, I. (2010, March 1). Voice Recognition Algorithms using Mel Frequency Cepstral Coefficient (MFCC) and Dynamic Time Warping (DTW) Techniques. JOURNAL OF COMPUTING, vol 2(3), pp. 138-143.

(37)

83

Pressman, R. S. (2005). Software engineering a practitioner's approach. New York: McGraw- Hill.

Rabiner, L. R. (1989, February 1). A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proc. IEEE, 7(2), pp. 257-286.

Saha, G., Chakroborty. Sandipan., & Senapati, S. (2005) A New Silence Removal and Endpoint Detection Algorithm for Speech and Speaker Recognition Applications. Eleventh National Conference On Communications. Kharagpur, India.

Santamarina, J. C. (2005). Discrete Signals And Inverse Problems An Introduction For Engineers And Scientists. New Jersey: John Wiley &

Sons.

Suwandy. 2011. “Perancangan Program Aplikasi Absensi Pada Binus Learning Community SAC Dengan Menggunakan Hidden Markov Model”. Program Ganda Teknik Informatika dan Matematika. Jakarta: Universitas Bina Nusantara.