METODE PENELITIAN

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Penelitian ini dilakukan dengan beberapa tahapan, yaitu pengambilan data, pemodelan (feature extraction), dan pengenalan (feature matching). Feature extraction merupakan proses mengekstraksi data hasil akuisisi sehingga dihasilkan data yang berdimensi lebih kecil. Feature matching merupakan prosedur aktual mencocokkan pola dan membandingkan fitur ekstraksi suara yang dimasukkan dengan salah satu dari himpunan pembicara (Agustini 2006). Proses pengenalan fonem dapat dilihat pada Gambar 4.

Gambar 4 Proses pengenalan fonem.

Pengambilan Data

Data yang digunakan dalam penelitian ini adalah data dari sebelas kata (coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat). Pemilihan kata dilakukan untuk memenuhi jumlah keseluruhan fonem yaitu sebanyak 26 fonem.

Letak fonem dalam suatu kata tidak

berpengaruh terhadap error rate yang

dihasilkan. Letak fonem pada awal kata tidak selalu memberikan nilai error rate yang kecil, begitupun pada fonem yang terletak pada tengah maupun akhir kata (Resmiwati 2009). Daftar fonem dari kata yang digunakan dalam penelitian ini dapat dilihat pada Tabel 2. Tabel 2 Daftar fonem dalam penelitian.

Kelompok fonem Asal kata

/a/, /j/, /y/ Jaya

/b/, /c/, /o/ Coba /d/, /e/, /w/ Weda /f/ fana /g/, /h/ Gajah /i/, /v/, /s/ Visa /k/, /z/ Zakat /l/, /m/, /u/ Malu /n/, /r/, /q/ Quran

ciri, µ adalah nilai rata-ratadari data latih dan merupakan nilai matriks kovarian dari data latih.

Matriks kovarian didapat dengan

menghitung nilai rata-rata dari data latih. Nilai rata-rata yang didapat selanjutnya dikurangi dengan matriks awal, dikali dengan matriks transform hasil pengurangan dan dibagi dengan banyak data. Misalkan, matriks data latih dengan banyak data 3, berukuran

mxn dengan m = 3 (banyaknya baris) dan n = 2 (banyaknya kolom), maka matriks kovarian yang dihasilkan berukuran 2x2. Berikut Langkah - langkah menghitung matriks kovarian dan rata-rata dari matriks A: 1. Menghitung nilai rata-rata dari matriks A

untuk menghasilkan matriks B. ✂✁

✄✆☎✞✝✠✟☛✡

☞✞✌✠✍☛✎

✏✒✑✔✓✖✕✘✗

, ✙✛✚✢✜✣✥✤✧✦✩★✫✪

2. Mengurangi matriks rata-rata dengan matriks A ✬✮✭✰✯✲✱✳✵✴✷✶✹✸✻✺ ✼✩✽✿✾✹❀✻❁✒❂ ❃❅❄❇❆❈✵❉✷❊●❋✻❍ ■✩❏✿❑●▲☛▼❖◆ P❘◗❇❙❚✵❯❲❱✹❳✒❨ ❩✩❬❪❭✹❫❵❴✫❛

3. Menghitung nilai kovarian

❜✘❝❖❞❢❡✫❣❖❤✐❡❖❥❧❦❧♠✮♥❵♦q♣✮r❖s✩t✈✉✩✇✻①③②⑤④❘⑥❢⑦⑨⑧✵⑩

❶❢❷✫❸☛❹⑨❷❢❺❼❻✘❽❢❾❿❽

Dalam hal ini, A1t merupakan transform

dari matriks A1, Bt merupakan transform

dari matriks B, dan Ct merupakan

transform dari matriks C.

METODE PENELITIAN

Gambar 4 Proses pengenalan fonem.

Pengambilan Data

Letak fonem dalam suatu kata tidak

berpengaruh terhadap error rate yang

Kelompok fonem Asal kata

/a/, /j/, /y/ Jaya

/b/, /c/, /o/ Coba /d/, /e/, /w/ Weda /f/ fana /g/, /h/ Gajah /i/, /v/, /s/ Visa /k/, /z/ Zakat /l/, /m/, /u/ Malu /n/, /r/, /q/ Quran

Kelompok fonem Asal kat

/p/ Pacu

/t/, /x/ Tip-x

Data berasal dari satu pemb masing kata direkam seban pengulangan sehingga data yan sebanyak 520 data suara. Pen dilakukan dengan mengguna (banyaknya bit yang diproses pe sebesar 16 bit sampling rate seb dan disimpan dalam file bere Proses perekaman dilakukan di untuk mengurangi noise dari lin

Praproses

Pengenalan 26 fonem pada dilakukan beberapa tahapan yai 1. Penghapusan silent dan norm

Penghapusan silent d suara yang disimpan hanya rekaman suara. Normalisa dengan membagi nilai se sinyal dengan absolute m sebuah frekuensi sinyal

normalisasi untuk

amplitudo maksimum dan m normal yaitu satu dan sehingga dapat menorm kekerasan suara.

2. Segmentasi sinyal

Data hasil penghapusa normalisasi dilakukan segm manual sehingga dihasilkan sebelas kata yang direkam sebanyak 20 kali pengula demikian jumlah total dat dihasilkan sebanyak 520 da fonem.

Pembagian Data

Pembagian data dibagi bagian, yaitu data pelatihan dengan proporsi 75% untuk 25% untuk data uji. Menurut dengan menggunakan metode HMM pembagian data den 75%:25% lebih baik dibuat dengan 50%:50% dan 25%:75%

Ekstraksi Ciri Sinyal

Data fonem hasil segmenta dilakukan ekstraksi ciri deng

transformasi Fourier dan

Wavelet Daubechies (db4) p Ekstraksi ciri dilakukan untu

ata

mbicara, masing- anyak 20 kali ang dikumpulkan engambilan data nakan bit rate

per satuan waktu) sebesar 12000 Hz erekstensi WAV. di tempat hening lingkungan. da penelitian ini aitu: ormalisasi dilakukan agar ya yang terdapat isasi dilakukan setiap frekuensi maksimum dari l suara. Tujuan menghasilkan n minimum yang n minus satu, malkan tingkat

san silent dan gmentasi secara an 26 fonem dari masing-masing langan. Dengan ata fonem yang data dari seluruh

i menjadi dua n dan pengujian data latih dan ut Buono (2009) de MFCC dan engan proporsi at perbandingan 5%. ntasi selanjutnya ngan pemodelan n transformasi pada level 1. tuk menentukan

nilai vektor yang digunakan seba dengan dimensi yang lebih kecil d

frame-nya sehingga diharapk mempercepat waktu pengenalan fo Dalam penggunaannya, fungsi

Wavelet memerlukan beberapa para 1. Input, merupakan sinyal tanpa

yang akan dianalisis ekstraksi ci 2. Sampling rate yaitu banyakny akan diambil dalam satu detik. 3. Time frame lamanya waktu yan dalam satu frame dalam miliseko 4. Overlap yaitu overlapping yan

antara satu frame dan frame sela 5. Cepstral coeffisient yaitu

koefisien cepstrum yang diingin

output.

6. Level yaitu banyaknya tahapan yang digunakan pada fungsi DW MFCC yang diimplementasi

sistem ini merupakan fun

dikembangkan oleh Stanley pada Alur proses MFCC dan Wavelet

pada Gambar 5.

Penjelasan tahapan dari ek MFCC dan DWT yaitu:

a) Frame Blocking dan Windowin

Penelitian ini menggunakan pa pada lebar waktu 30 ms dan menyimpan data sebanyak 360 d antar frame 50%. Windowing m Hamming window dengan panja sama dengan panjang frame yaitu

Gambar 5 Diagram proses ekst MFCC dan Wavelet.

b) Transformasi Wavelet Daubec

Data yang terbagi dalam be hasil dari frame blocking dan wind

setiap fonem dilakukan proses d dengan menggunakan transforma

bagai penciri, l dalam setiap pkan dapat fonem. si MFCC dan arameter yaitu: pa noise suara cirinya. nya data yang ang diinginkan ekon. ang diinginkan elanjutnya. u banyaknya ginkan sebagai n dekomposisi WT. asikan dalam fungsi yang a tahun 1998. dapat dilihat ekstraksi ciri ing panjang frame n tiap frame data, overlap menggunakan njang window tu 360 sample. straksi ciri echies bentuk frame ndowing pada dekomposisi masi Wavelet.

Hasil dekomposisi menghasil koefisien (koefisien detail dan p Algoritme 1 adalah untuk me detail dan perkiraan pada p dekomposisi (Agustini 2006). Algoritme 1: Proses multiple dek

Input: sinyal yang akan di-filt

Tahap 1: Pilih filter yang a sebagai low-pass f pass filter.

Tahap 2: Sinyal input di-fi low-pass filter filter.

Tahap 3: Hasil Low-pass high-pass frekuens selanjutnya dila

downsampling.

Tahap 4: Low-pass frekuens selanjutnya kemba Tahap 5: Dilakukan terus

berhenti pada diharapkan.

Output: Low-pass frekuensi p ditentukan.

Analisis data transform dilakukan dengan mendekomp

sinyal ke dalam kompo

frekuensi yang berbeda-beda masing-masing komponen frek dapat dianalisis sesuai d resolusinya atau level dekom ini seperti proses filtering, domain waktu dilewatkan ke d

filter dan low pass filter untu komponen frekuensi tinggi rendah.

Proses dekomposisi berda Nyquist. Aturan Nyquist mengatakan bahwa frekuen

sample harus kurang atau setengah dari frekuensi samplin

itu maka, diambil frekuensi sa

frekuensi sampling dalam sub

pada dekomposisi Wavelet.

c) Mel -Frequency Wrapping

Dengan menggunakan al disarankan oleh Davis dan Me untuk membentuk M filter. Dar sudah dibentuk, selanjutny

wrapping terhadap sinyal. N

yang diharapkan didapat

transformasi kosinus. silkan koefisien- n perkiraan). encari koefisien proses multiple ekomposisi. filter akan digunakan

s filter dan high- filter ke dalam dan high-pass s frekuensi dan nsi pada tahap 2, ilakukan proses nsi hasil tahap 3 bali ke tahap 2. s menerus dan

level yang si pada level yang rmasi Wavelet posisikan suatu ponen-komponen da. Selanjutnya rekuensi tersebut dengan skala mposisinya. Hal , sinyal dalam dalam high pass

tuk memisahkan i dan frekuensi dasarkan aturan salah satunya ensi komponen sama dengan

ling. Oleh sebab

sample /2 dari

subsample oleh 2

algoritme yang ermelstein 1980 ari M filter yang tnya dilakukan Nilai koefisien t dari hasil

Pemodelan

Hasil ekstraksi ciri satu sinyal d hasil berupa matrikss ciri n×k, n ad

frame dan k adalah koefisien. dilakukan perata-rataan koefisien baris, sehingga setiap satu data siny matriks berukuran 1×k. Jumlah dat satu fonem ada 15 data, maka matriks berukuran 15×k, dengan k

koefisien. Matriks 15×k yang dih satu fonem kemudian dihitung nila

sigma untuk fonem tersebut. Kum

mean dan sigma dari fonem /a/ inilah yang digunakan sebagai m

tahap pencocokan. Contoh a

pemodelan untuk menghitung nila

sigma dari satu fonem dapat d Gambar 6.

Gambar 6 Diagram proses pem Variabel n pada Gambar 6 m banyaknya frame yang dihas masing-masing sinyal. Banyak jum

dihasilkan pada proses eks

bergantung pada panjang pende hasil segmentasi. Variabel x da koefisien nilai hasil penggabung yang diperoleh dari hasil rata-rata.

Pencocokan Model

Model yang dihasilkan p

pemodelan selanjutnya

pencocokan. Pencocokan dilaku data uji yang telah disiapkan s

Penerapan Distribusi Norma

multivariate N( , ) digunak pencocokan model. l data memiliki adalah jumlah . Kemudian n pada setiap nyal dihasilkan ata latih untuk ka dihasilkan

k banyaknya ihasilkan dari ilai mean dan umpulan Nilai /a/ sampai /z/ model untuk alur proses ilai mean dan dilihat pada emodelan. menunjukkan asilkan pada jumlah n yang kstraksi ciri deknya sinyal dan y adalah ngan matriks ta. pada tahap dilakukan kukan dengan sebelumnya. al (Gauss) akan sebagai

Pengujian

Pengujian dilakukan pada data uji yang telah dipersiapkan. Setiap data uji dilihat apakah data tersebut terindentifikasi pada fonem yang semestinya. Presentase tingkat akurasi dihitung dengan fungsi berikut:

➀☛➁q➂✒➃✆➄✩➅➇➆➉➈➋➊③➌➥➉➦➋➧③➨➍➏➎✘➐✖➑➓➒❵➔➣→❼↔❵↕➛➙✖➜✵➝➟➞➣➠➢➡➛➤➩➏➫✘➭✖➯➓➲❵➳➣➵❼➸❵➺➛➻✖➼✥➽➋➾➚✖➪➶➾ ➹➴➘❖➷❢➷❢➬ (16)

HASIL DAN PEMBAHASAN

Dalam dokumen Perbandingan Wavelet Daubechies dan MFCC sebagai ekstraksi ciri pada pengenalan fonem berdasarkan distribusi normal (Halaman 30-34)