Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

(1)

TUGAS AKHIR

PENGENALAN KARAKTERISTIK SUARA MENGGUNAKAN MEL

FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) PADA SISTEM

PENGENALAN PEMBICARA (SPEAKER RECOGNITION SISTEM)

Diajukan untuk memenuhi persyaratan

menyelesaikan Pendidikan Sarjana (S-1) pada

Departemen Teknik Elektro Sub konsentrasi Teknik Telekomunikasi

Oleh

NIM : 100402004 WINDY PRATAMA RIZKIA

DEPARTEMEN TEKNIK ELEKTRO

FAKULTAS TEKNIK

UNIVERSITAS SUMATERA UTARA

MEDAN

(2)

(3)

ABSTRAK

Perkembangan teknologi pengolahan sinyal suara manusia pada akhir-akhir ini banyak digemari dan dikembangkan. Salah satu contoh pengolahan sinyal suara manusia yang sedang dikembangkan adalah sistem pengenalan pembicara (speaker recognitionsystem). Pengenalan pembicara (Speaker

recognition) memungkinkan untuk menggunakan suara untuk mengontrol atau

memverifikasi identitas sumber suara. Pada sistem penelitian ini digunakan metode MFCC (mel frequency cepstrum coefficients) dimana MFCC ini mampu menangkap karakteristik pengenalan suara manusia atau dengan kata lain mampu menangkap informasi yang terkandung dalam sinyal suara.

Pada sistem yang akan dibuat menggunakan software MATLAB memiliki kemampuan membedakan setiap file suara yang telah diambil datanya. Pada penerapannya nilai jumlah koefisien (N) ditentukan atau ditetapkan berdasarkan nilai yang ditulis dalam program yang panjangnya antara 10-30 ms atau 256-1024 data. Sinyal suara yang kontinyu akan diblock menjadi frame sampel N, dengan

frame yang berdekatan dipisahkan oleh nilai koefisien (M) dengan ketentuan

dimana M<N.

Berdasarkan hasil pengujian sistem yang telah dilakukan terdapat beberapa jumlah sinyal suara yang telah dianalisa dan memiliki perbedaan jumlah koefisien pada pengujian pertama pada pengucapan kata “MAKAN” memiliki selisih jumlah koefisien terhadap pengucapan kata “MINUM” sebesar 2 koefisien, pengucapan kata “MAKAN” terhadap koefisien pengucapan kata “BELAJAR” memiliki selisih 3 koefisien.

(4)

KATA PENGANTAR

Segala Puji dan syukur penulis ucapkan kepada Allah SWT atas Berkah dan Rahmat-Nya sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul:

“PENGENALAN KARAKTERISTIK SUARA MENGGUNAKAN MEL

FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) PADA SISTEM

PENGENALAN PEMBICARA (SPEAKER RECOGNITION SISTEM)”

Tugas akhir ini merupakan bagian dari kurikulum yang harus diselesaikan untuk memenuhi persyaratan menyelesaikan pendidikan Sarjana Strata Satu (S-1) di Departemen Teknik Elektro Fakultas Teknik Universitas Sumatera Utara.

Selama penulis menjalani pendidikan di kampus hingga diselesaikannya Tugas Akhir ini, penulis banyak menerima bantuan, bimbingan serta dukungan dari berbagai pihak. Pada kesempatan ini penulis ingin menyampaikan terimakasih yang tulus dan sebesar-besarnya kepada:

1. Bapak Ir. Arman Sani, MT sebagai Dosen Pembimbing Tugas Akhir penulis yang selalu bersedia memberikan bantuan yang sangat dibutuhkan oleh penulis dalam menyelesaikan Tugas Akhir ini.

2. Bapak Ir. Surya Tarmizi Kasim,M.Si sebagai Ketua Departemen Teknik Elektro Fakultas Teknik Universitas Sumatera Utara.

3. Bapak Rahmad Fauzi, ST, MT sebagai Sekretaris Departemen Teknik Elektro dan Bapak Yulianta Siregar, ST, MT sebagai Dosen Wali penulis yang membantu penulis selama menyelesaikan pendidikan di kampus USU.

4. Seluruh Staf Pengajar dan Pegawai Departemen Teknik Elektro FT-USU. 5. Orang tua khususnya Ayahanda Nukman Hasfa dan Ibunda Hanizar yang

senantiasa memberikan semangat dan do’anya kepada penulis dengan segala pengorbanan dan kasih sayang yang tidak ternilai harganya.

(5)

7. Kepada Mitra Gustinur Rahma AP, S.KG sebagai orang yang selalu memberikan motivasi, dukungan dan do’a bagi penulis.

8. Kepada sahabat penulis Ranzyskhar, Ricky Mahyuddin, Rhobby Maulana, Oki Januri, Arifin, Irsyad, Agustinus Ginting, Acmerian, Aweluddin. 9. Teman – teman di Teknik Elektro FT-USU, terkhusus angkatan 2010

Zulfahmi dhuha, Deny Destian H, Jaka Cindy Djamin, Hamdan Siregar, Fatih, Rio Gultum, Fontes Marpaung, Puti Mayang sari, Muhammad mulia, atas dukungan, do’a bagi penulis.

10. Seluruh senior dan junior angkatan 2011 dan 2012 di Departemen Teknik Elektro, atas dukungan dan bantuan yang diberikan kepada penulis.

11. Keluarga Besar MME-GS yang telah memberikan banyak sekali pembelajaran.

12. Semua orang yang pernah mengisi setiap detik waktu yang telah dilalui bersama penulis yang tidak dapat disebutkan satu per satu. Tanpa mereka, pengalaman penulis tidaklah lengkap.

Penulis menyadari bahwa Tugas Akhir ini masih banyak kekurangannya. Kritik dan saran dari pembaca untuk menyempurnakan Tugas Akhir ini sangat penulis harapkan.

Kiranya Tugas Akhir ini dapat bermanfaat bagi kita semua.Terimakasih.

Medan, 9September 2015 Penulis

(6)

DAFTAR ISI

ABSTRAK ... i

KATA PENGANTAR ... ii

DAFTAR ISI ... iv

DAFTAR GAMBAR ... vii

DAFTAR TABEL ... viii

I. PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Perumusan Masalah ... 2

1.3 Tujuan Penelitian ... 2

1.4 Batasan Masalah... 3

1.5 Metode Penelitian... 3

1.6 Sistematika Penulisan... 4

II. DASAR TEORI ... 6

2.1 Suara (speaker) ... 6

2.2 Pengolahan Suara ... 8

2.2.1 Produksi Pengolahan Ucapan... 9

2.2.2 Sifat ucapan manusia... . 10

2.3 Mel frequency Cepstrum Coefficients (MFCC) ... 11

2.4 Frame Blocking... ... 12

2.5 Windowing... ... 12

2.6 Fast Fourier Transform (FFT) ... 14

2.7 Mel Frequency Wrapping... 15

(7)

III. PERANCANGAN SISTEM PENGENALAN PEMBICARA ... 18

3.1 Pendahuluan ... 18

3.2 Block diagram Perancangan sistem... 18

3.3 Algoritma Sistem Pengenalan pembicara ... 22

IV. HASIL DAN PENGUJIAN SISTEM ... 36

4.1 Gambaran umum pengujian sistem pengenalan pembicara ... 36

4.2 Persiapan perangkat pendukung pengujian sistem ... 37

4.3 Pengujian sistem terhadap file suara ... 38

V. PENUTUP ... 43

5.1 Kesimpulan ... 43

5.2 Saran ... 43

DAFTAR PUSTAKA ... 44

(8)

DAFTAR GAMBAR

Gambar 2.1Lingkaran komunikasi suara ... 7

Gambar 2.2Contoh sinyal suara... 7

Gambar 2.3Mekanisme vocal manusia ... 9

Gambar2.4 Blok diagram proses MFCC ... 11

Gambar 2.5 Contoh Mel spasi filterbank ... 15

Gambar 3.1 Blok diagram perancangan sistem pengenalan pembicara ... 19

Gambar 3.2 Bagan alir algoritma program perancangan sistem pengenalan pengenalan pembicara ... 23

Gambar 3.3 Tampilan program Matlab ... 25

Gambar 3.4 Contoh sampel suara “MAKAN” ... 27

Gambar 3.5 Diagram blok proses penentuan frame blocking ... 29

Gambar 3.6 Pengaruh sinyal yang diakibatkan Hamming window ... 30

Gambar 4.1 Grafik perbandingan koefisien untuk N = 256 & M = 100 ... 39

BAB I