FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
METODE PENELITIAN
Penelitian ini dilakukan dengan beberapa tahapan, yaitu pengambilan data, pemodelan (feature extraction), dan pengenalan (feature matching). Feature extraction merupakan proses mengekstraksi data hasil akuisisi sehingga dihasilkan data yang berdimensi lebih kecil. Feature matching merupakan prosedur aktual mencocokkan pola dan membandingkan fitur ekstraksi suara yang dimasukkan dengan salah satu dari himpunan pembicara (Agustini 2006). Proses pengenalan fonem dapat dilihat pada Gambar 4.
Gambar 4 Proses pengenalan fonem.
Pengambilan Data
Data yang digunakan dalam penelitian ini adalah data dari sebelas kata (coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat). Pemilihan kata dilakukan untuk memenuhi jumlah keseluruhan fonem yaitu sebanyak 26 fonem.
Letak fonem dalam suatu kata tidak
berpengaruh terhadap error rate yang
dihasilkan. Letak fonem pada awal kata tidak selalu memberikan nilai error rate yang kecil, begitupun pada fonem yang terletak pada tengah maupun akhir kata (Resmiwati 2009). Daftar fonem dari kata yang digunakan dalam penelitian ini dapat dilihat pada Tabel 2. Tabel 2 Daftar fonem dalam penelitian.
Kelompok fonem Asal kata
/a/, /j/, /y/ Jaya
/b/, /c/, /o/ Coba /d/, /e/, /w/ Weda /f/ fana /g/, /h/ Gajah /i/, /v/, /s/ Visa /k/, /z/ Zakat /l/, /m/, /u/ Malu /n/, /r/, /q/ Quran
ciri, µ adalah nilai rata-ratadari data latih dan merupakan nilai matriks kovarian dari data latih.
Matriks kovarian didapat dengan
menghitung nilai rata-rata dari data latih. Nilai rata-rata yang didapat selanjutnya dikurangi dengan matriks awal, dikali dengan matriks transform hasil pengurangan dan dibagi dengan banyak data. Misalkan, matriks data latih dengan banyak data 3, berukuran
mxn dengan m = 3 (banyaknya baris) dan n = 2 (banyaknya kolom), maka matriks kovarian yang dihasilkan berukuran 2x2. Berikut Langkah - langkah menghitung matriks kovarian dan rata-rata dari matriks A: 1. Menghitung nilai rata-rata dari matriks A
untuk menghasilkan matriks B. ✂✁
✄✆☎✞✝✠✟☛✡
☞✞✌✠✍☛✎
✏✒✑✔✓✖✕✘✗
, ✙✛✚✢✜✣✥✤✧✦✩★✫✪
2. Mengurangi matriks rata-rata dengan matriks A ✬✮✭✰✯✲✱✳✵✴✷✶✹✸✻✺ ✼✩✽✿✾✹❀✻❁✒❂ ❃❅❄❇❆❈✵❉✷❊●❋✻❍ ■✩❏✿❑●▲☛▼❖◆ P❘◗❇❙❚✵❯❲❱✹❳✒❨ ❩✩❬❪❭✹❫❵❴✫❛
3. Menghitung nilai kovarian
❜✘❝❖❞❢❡✫❣❖❤✐❡❖❥❧❦❧♠✮♥❵♦q♣✮r❖s✩t✈✉✩✇✻①③②⑤④❘⑥❢⑦⑨⑧✵⑩
❶❢❷✫❸☛❹⑨❷❢❺❼❻✘❽❢❾❿❽
Dalam hal ini, A1t merupakan transform
dari matriks A1, Bt merupakan transform
dari matriks B, dan Ct merupakan
transform dari matriks C.
METODE PENELITIAN
Penelitian ini dilakukan dengan beberapa tahapan, yaitu pengambilan data, pemodelan (feature extraction), dan pengenalan (feature matching). Feature extraction merupakan proses mengekstraksi data hasil akuisisi sehingga dihasilkan data yang berdimensi lebih kecil. Feature matching merupakan prosedur aktual mencocokkan pola dan membandingkan fitur ekstraksi suara yang dimasukkan dengan salah satu dari himpunan pembicara (Agustini 2006). Proses pengenalan fonem dapat dilihat pada Gambar 4.
Gambar 4 Proses pengenalan fonem.
Pengambilan Data
Data yang digunakan dalam penelitian ini adalah data dari sebelas kata (coba, fana, gajah, jaya, malu, pacu, quran, tip-x, visa, weda, dan zakat). Pemilihan kata dilakukan untuk memenuhi jumlah keseluruhan fonem yaitu sebanyak 26 fonem.
Letak fonem dalam suatu kata tidak
berpengaruh terhadap error rate yang
dihasilkan. Letak fonem pada awal kata tidak selalu memberikan nilai error rate yang kecil, begitupun pada fonem yang terletak pada tengah maupun akhir kata (Resmiwati 2009). Daftar fonem dari kata yang digunakan dalam penelitian ini dapat dilihat pada Tabel 2. Tabel 2 Daftar fonem dalam penelitian.
Kelompok fonem Asal kata
/a/, /j/, /y/ Jaya
/b/, /c/, /o/ Coba /d/, /e/, /w/ Weda /f/ fana /g/, /h/ Gajah /i/, /v/, /s/ Visa /k/, /z/ Zakat /l/, /m/, /u/ Malu /n/, /r/, /q/ Quran
Kelompok fonem Asal kat
/p/ Pacu
/t/, /x/ Tip-x
Data berasal dari satu pemb masing kata direkam seban pengulangan sehingga data yan sebanyak 520 data suara. Pen dilakukan dengan mengguna (banyaknya bit yang diproses pe sebesar 16 bit sampling rate seb dan disimpan dalam file bere Proses perekaman dilakukan di untuk mengurangi noise dari lin
Praproses
Pengenalan 26 fonem pada dilakukan beberapa tahapan yai 1. Penghapusan silent dan norm
Penghapusan silent d suara yang disimpan hanya rekaman suara. Normalisa dengan membagi nilai se sinyal dengan absolute m sebuah frekuensi sinyal
normalisasi untuk
amplitudo maksimum dan m normal yaitu satu dan sehingga dapat menorm kekerasan suara.
2. Segmentasi sinyal
Data hasil penghapusa normalisasi dilakukan segm manual sehingga dihasilkan sebelas kata yang direkam sebanyak 20 kali pengula demikian jumlah total dat dihasilkan sebanyak 520 da fonem.
Pembagian Data
Pembagian data dibagi bagian, yaitu data pelatihan dengan proporsi 75% untuk 25% untuk data uji. Menurut dengan menggunakan metode HMM pembagian data den 75%:25% lebih baik dibuat dengan 50%:50% dan 25%:75%
Ekstraksi Ciri Sinyal
Data fonem hasil segmenta dilakukan ekstraksi ciri deng
transformasi Fourier dan
Wavelet Daubechies (db4) p Ekstraksi ciri dilakukan untu
ata
mbicara, masing- anyak 20 kali ang dikumpulkan engambilan data nakan bit rate
per satuan waktu) sebesar 12000 Hz erekstensi WAV. di tempat hening lingkungan. da penelitian ini aitu: ormalisasi dilakukan agar ya yang terdapat isasi dilakukan setiap frekuensi maksimum dari l suara. Tujuan menghasilkan n minimum yang n minus satu, malkan tingkat
san silent dan gmentasi secara an 26 fonem dari masing-masing langan. Dengan ata fonem yang data dari seluruh
i menjadi dua n dan pengujian data latih dan ut Buono (2009) de MFCC dan engan proporsi at perbandingan 5%. ntasi selanjutnya ngan pemodelan n transformasi pada level 1. tuk menentukan
nilai vektor yang digunakan seba dengan dimensi yang lebih kecil d
frame-nya sehingga diharapk mempercepat waktu pengenalan fo Dalam penggunaannya, fungsi
Wavelet memerlukan beberapa para 1. Input, merupakan sinyal tanpa
yang akan dianalisis ekstraksi ci 2. Sampling rate yaitu banyakny akan diambil dalam satu detik. 3. Time frame lamanya waktu yan dalam satu frame dalam miliseko 4. Overlap yaitu overlapping yan
antara satu frame dan frame sela 5. Cepstral coeffisient yaitu
koefisien cepstrum yang diingin
output.
6. Level yaitu banyaknya tahapan yang digunakan pada fungsi DW MFCC yang diimplementasi
sistem ini merupakan fun
dikembangkan oleh Stanley pada Alur proses MFCC dan Wavelet
pada Gambar 5.
Penjelasan tahapan dari ek MFCC dan DWT yaitu:
a) Frame Blocking dan Windowin
Penelitian ini menggunakan pa pada lebar waktu 30 ms dan menyimpan data sebanyak 360 d antar frame 50%. Windowing m Hamming window dengan panja sama dengan panjang frame yaitu
Gambar 5 Diagram proses ekst MFCC dan Wavelet.
b) Transformasi Wavelet Daubec
Data yang terbagi dalam be hasil dari frame blocking dan wind
setiap fonem dilakukan proses d dengan menggunakan transforma
bagai penciri, l dalam setiap pkan dapat fonem. si MFCC dan arameter yaitu: pa noise suara cirinya. nya data yang ang diinginkan ekon. ang diinginkan elanjutnya. u banyaknya ginkan sebagai n dekomposisi WT. asikan dalam fungsi yang a tahun 1998. dapat dilihat ekstraksi ciri ing panjang frame n tiap frame data, overlap menggunakan njang window tu 360 sample. straksi ciri echies bentuk frame ndowing pada dekomposisi masi Wavelet.
Hasil dekomposisi menghasil koefisien (koefisien detail dan p Algoritme 1 adalah untuk me detail dan perkiraan pada p dekomposisi (Agustini 2006). Algoritme 1: Proses multiple dek
Input: sinyal yang akan di-filt
Tahap 1: Pilih filter yang a sebagai low-pass f pass filter.
Tahap 2: Sinyal input di-fi low-pass filter filter.
Tahap 3: Hasil Low-pass high-pass frekuens selanjutnya dila
downsampling.
Tahap 4: Low-pass frekuens selanjutnya kemba Tahap 5: Dilakukan terus
berhenti pada diharapkan.
Output: Low-pass frekuensi p ditentukan.
Analisis data transform dilakukan dengan mendekomp
sinyal ke dalam kompo
frekuensi yang berbeda-beda masing-masing komponen frek dapat dianalisis sesuai d resolusinya atau level dekom ini seperti proses filtering, domain waktu dilewatkan ke d
filter dan low pass filter untu komponen frekuensi tinggi rendah.
Proses dekomposisi berda Nyquist. Aturan Nyquist mengatakan bahwa frekuen
sample harus kurang atau setengah dari frekuensi samplin
itu maka, diambil frekuensi sa
frekuensi sampling dalam sub
pada dekomposisi Wavelet.
c) Mel -Frequency Wrapping
Dengan menggunakan al disarankan oleh Davis dan Me untuk membentuk M filter. Dar sudah dibentuk, selanjutny
wrapping terhadap sinyal. N
yang diharapkan didapat
transformasi kosinus. silkan koefisien- n perkiraan). encari koefisien proses multiple ekomposisi. filter akan digunakan
s filter dan high- filter ke dalam dan high-pass s frekuensi dan nsi pada tahap 2, ilakukan proses nsi hasil tahap 3 bali ke tahap 2. s menerus dan
level yang si pada level yang rmasi Wavelet posisikan suatu ponen-komponen da. Selanjutnya rekuensi tersebut dengan skala mposisinya. Hal , sinyal dalam dalam high pass
tuk memisahkan i dan frekuensi dasarkan aturan salah satunya ensi komponen sama dengan
ling. Oleh sebab
sample /2 dari
subsample oleh 2
algoritme yang ermelstein 1980 ari M filter yang tnya dilakukan Nilai koefisien t dari hasil
Pemodelan
Hasil ekstraksi ciri satu sinyal d hasil berupa matrikss ciri n×k, n ad
frame dan k adalah koefisien. dilakukan perata-rataan koefisien baris, sehingga setiap satu data siny matriks berukuran 1×k. Jumlah dat satu fonem ada 15 data, maka matriks berukuran 15×k, dengan k
koefisien. Matriks 15×k yang dih satu fonem kemudian dihitung nila
sigma untuk fonem tersebut. Kum
mean dan sigma dari fonem /a/ inilah yang digunakan sebagai m
tahap pencocokan. Contoh a
pemodelan untuk menghitung nila
sigma dari satu fonem dapat d Gambar 6.
Gambar 6 Diagram proses pem Variabel n pada Gambar 6 m banyaknya frame yang dihas masing-masing sinyal. Banyak jum
dihasilkan pada proses eks
bergantung pada panjang pende hasil segmentasi. Variabel x da koefisien nilai hasil penggabung yang diperoleh dari hasil rata-rata.
Pencocokan Model
Model yang dihasilkan p
pemodelan selanjutnya
pencocokan. Pencocokan dilaku data uji yang telah disiapkan s
Penerapan Distribusi Norma
multivariate N( , ) digunak pencocokan model. l data memiliki adalah jumlah . Kemudian n pada setiap nyal dihasilkan ata latih untuk ka dihasilkan
k banyaknya ihasilkan dari ilai mean dan umpulan Nilai /a/ sampai /z/ model untuk alur proses ilai mean dan dilihat pada emodelan. menunjukkan asilkan pada jumlah n yang kstraksi ciri deknya sinyal dan y adalah ngan matriks ta. pada tahap dilakukan kukan dengan sebelumnya. al (Gauss) akan sebagai
Pengujian
Pengujian dilakukan pada data uji yang telah dipersiapkan. Setiap data uji dilihat apakah data tersebut terindentifikasi pada fonem yang semestinya. Presentase tingkat akurasi dihitung dengan fungsi berikut:
➀☛➁q➂✒➃✆➄✩➅➇➆➉➈➋➊③➌➥➉➦➋➧③➨➍➏➎✘➐✖➑➓➒❵➔➣→❼↔❵↕➛➙✖➜✵➝➟➞➣➠➢➡➛➤➩➏➫✘➭✖➯➓➲❵➳➣➵❼➸❵➺➛➻✖➼✥➽➋➾➚✖➪➶➾ ➹➴➘❖➷❢➷❢➬ (16)
HASIL DAN PEMBAHASAN