• Tidak ada hasil yang ditemukan

frekuensi 12000Hz diperoleh sebanyak 176 kata untuk selanjutnya dilakukan penghapusan silent. Proses ini bertujuan untuk menghilangkan bagian silent yang terdapat pada awal dan akhir dari suara. Penghapusan silent dapat dilihat pada Gambar 11.

Data suara yang sudah dibersihkan disegmentasi per fonem tunggal. Semua fonem dikelompokkan per huruf agar lebih mudah diproses. Jumlah dari tiap fonem dapat dilihat pada Tabel 2.

Gambar 11 Penghapusan Silent

Pembersihan data suara

Ekstraksi Ciri (Wavelet dan MFCC)

Ekstraksi ciri merupakan proses untuk menentukan satu nilai atau vektor yang dipergunakan sebagai penciri objek. Tujuan utamanya adalah mereduksi ukuran data tanpa mengubah karakteristik dari sinyal suara. Ciri yang biasa dipergunakan adalah nilai koefisien

cepstral dari sebuah frame. Tahapan dari proses ini yaitu framing, windowing, fast fourier transform dan transformasi wavelet daubechies, mel-frequency wrapping, dan cepstrum.

Data suara yang telah disegmentasi selanjutnya dilakukan proses framing. Tiap

frame berukuran 30 ms, overlap 50%, dan 13 koefisien mel cepstrum. Pada transformasi

wavelet pengenalan fonem yang diproses akan mengalami penurunan fitur. Wavelet yang digunakan adalah Wavelet Daubechies (db4) satu level. Hasil dari matriks ekstraksi ciri ini merupakan masukan untuk pembelajaran pada PNN.

Perata-rataan Hasil MFCC dan Wavelet Proses ini bertujuan untuk menyamakan ukuran matriks untuk tiap suara pada masing-masing baris sehingga terbentuk ukuran matriks n×1. Hasil dari ekstraksi ciri MFCC dan wavelet

yaitu matriks ciri n×k, n adalah koefisien dan k adalah jumlah frame.

Pemodelan PNN

Hasil dari perata-rataan MFCC dan wavelet

selanjutnya dapat digunakan untuk membangun pemodelan PNN. Input data yang digunakan pada proses ini mempunyai ukuran matriks 13xN. Input data tersebut diidentifikasikan dengan pattern layer pada Persamaan 30. Parameter h pada Persamaan 30 digunakan nilai 1,14 × (simpangan baku) × n-1/5. Nilai UA ; ialah nilai hasil pattern layer ke i, dimana i=1, 2 sampai banyaknya observasi pada satu kelas. Setelah memperoleh selisih jarak antara nilai data input dengan data pada pattern layer, maka nilai tersebut dibagi dengan nilai smoothing parameter. Nilai smoothing $> didapat dari simpangan baku data setiap pattern ke j=1, 2 sampai jumlah koefisien yang digunakan. Pengujian Model PNN

Pengujian model PNN ini dilakukan dengan cara memasukkan data uji (matriks1) ke dalam tiap kelas untuk mendapatkan nilai peluang. Perhitungan pada pengujian setiap kelas menggunakan Persamaan 31, sehingga nilai peluang p(x) diperoleh dari setiap kelas pada pengujian model PNN. Nilai peluang terbesar dari satu kelas merupakan hasil akhir

dari tahapan ini. Perbandingan data latih dan data uji adalah 75% : 25%.

Perhitungan Nilai Akurasi

Perhitungan nilai akurasi bertujuan untuk mengetahui hasil tingkat akurasi dari pengujian model PNN pada pengenalan fonem. Pada tahap ini kita bisa melihat fonem-fonem mana saja yang berhasil dikenali dengan baik dan fonem-fonem yang mungkin tidak bisa dikenali sama sekali. Selain itu kita juga bisa mengetahui metode mana yang lebih tinggi akurasinya. Perhitungan tingkat akurasi dapat dilihat pada persamaan berikut :

(33)

Lingkup Pengembangan Sistem

Perangkat keras yang digunakan pada penelitian ini berupa komputer notebook dengan spesifikasi:

• Intel Core2 Duo processor 1,3 GHz

• Memori DDR3 4 GB

Harddisk 320 GB

Perangkat lunak yang digunakan yaitu :

• Sistem Operasi : Microsoft Xp

• Matlab 7.1

• Audacity 1.3

HASIL DAN PEMBAHASAN Data suara yang telah direkam pada frekuensi 12000Hz diperoleh sebanyak 176 kata untuk selanjutnya dilakukan penghapusan silent. Proses ini bertujuan untuk menghilangkan bagian silent yang terdapat pada awal dan akhir dari suara. Penghapusan silent dapat dilihat pada Gambar 11.

Data suara yang sudah dibersihkan disegmentasi per fonem tunggal. Semua fonem dikelompokkan per huruf agar lebih mudah diproses. Jumlah dari tiap fonem dapat dilihat pada Tabel 2.

Gambar 11 Penghapusan Silent

Pembersihan data suara

Tabel 2 Jumlah Tiap Fonem

Fonem Jumlah Fonem Jumlah

/a/ 224 /n/ 32 /b/ 16 /o/ 16 /c/ 32 /p/ 32 /d/ 16 /q/ 16 /e/ 16 /r/ 16 /f/ 16 /s/ 16 /g/ 16 /t/ 32 /h/ 16 /u/ 48 /i/ 32 /v/ 16 /j/ 32 /w/ 16 /k/ 16 /x/ 16 /l/ 16 /y/ 16 /m/ 16 /z/ 16

Akan tetapi penelitian ini hanya memilih 16 fonem dari jumlah masing-masing fonem yang ada. Hal ini dikarenakan jumlah fonem /a/ yang terlalu banyak yang menyebabkan fonem /a/ akan dominan untuk dikenali. Setelah didapat 16 fonem kemudian data tersebut dibagi menjadi data latih dan data uji dengan proporsi 75% : 25% untuk selanjutnya diekstraksi ciri dan dimodelkan menggunakan PNN.

Struktur PNN pada penelitian ini dapat dilihat pada Gambar 12. Input layer merupakan

input data yang berjumlah 13 sesuai banyaknya jumlah koefisien yang digunakan. Masing-masing kelas pada pattern layer berjumlah 12 sesuai banyaknya observasi yang digunakan. Pada layer ini dihitung jarak antara nilai input data dengan nilai pola dari tiap anggota kelas. Hasil dari pattern layer ini akan dijumlahkan dengan hasil dari pattern layer lainnya yang satu kelas. Proses ini terjadi pada summation layer. Pada summation layer diperoleh nilai terbesar untuk suatu kelas. Summation layer berjumlah 26 kelas sesuai jumlah kelas yang ada. Hasil dari summation layer tiap-tiap kelas dibandingkan pada decision layer berdasarkan nilai peluang terbesar sehingga input data dapat dikenali sebagai kelas tertentu.

Gambar 12 Implementasi Struktur PNN Pengujian yang dilakukan meliputi data uji asli (tanpa penambahan noise) dan data uji yang ditambahkan noise 30dB, 20dB, dan 10dB. Untuk mendapatkan hasil akurasi yang baik pengujian dilakukan secara berulang kali dengan mengombinasikan data latih dan data uji dari masing-masing fonem. Data uji tanpa penambahan noise dan data uji yang ditambahkan noise 30dB, 20dB, dan 10dB untuk fonem /a/ dapat dilihat secara berturut-turut pada Gambar 13, Gambar 14, Gambar 15, dan Gambar 16.

Gambar 14 Data Uji yang Ditambahkan Noise

30dB

Gambar 15 Data Uji yang Ditambahkan Noise 20dB

Gambar 16 Data Uji yang Ditambahkan Noise

10dB

Penambahan noise yang dilakukan mengakibatkan sinyal suara asli tertimpa oleh besarnya noise yang ditambahkan. Terlihat bahwa penambahan noise 10dB memberikan pengaruh yang besar terhadap sinyal suara dibandingkan dengan penambahan noise 20dB dan 30dB. Ini mengakibatkan sinyal suara akan sulit dikenali sesuai besarnya noise yang ditambahkan.

Sinyal Suara Asli (Tanpa Penambahan Noise)

Penelitian sinyal suara asli dilakukan dengan dua proses ekstraksi ciri yaitu wavelet dan MFCC. Induk wavelet yang digunakan adalah

Wavelet Daubechies orde 4 (db4). Wavelet Daubechies Orde 4 (db4)

Pengujian dengan ekstraksi ciri Wavelet

Daubechies memperoleh akurasi sebesar

32.69% untuk keseluruhan fonem. Grafik tingkat akurasi suara asli dengan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 17. Dapat dilihat bahwa akurasi yang dihasilkan belum memuaskan dimana masih terdapat fonem-fonem yang belum bisa dikenali. Fonem yang belum bisa dikenali di antaranya fonem /d/, /j/, /l/, /n/, /r/, /s/, /v/, /w/ dan /x/. Selain itu juga terdapat dua fonem yang dikenali cukup baik dengan akurasi di atas 70%, yaitu fonem /e/, /o/, /p/, /q/, /u/ dan /z/. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dan matriks

confusion dapat dilihat pada Lampiran 1 dan Lampiran 2. Fonem yang paling dominan terdeteksi pada metode wavelet daubechies

menggunakan data asli adalah fonem /e/.

Gambar 17 Grafik Tingkat Akurasi Suara Asli dengan Wavelet Daubechies Masing-Masing

Fonem MFCC

Pengujian dengan ekstraksi ciri MFCC memperoleh akurasi cukup baik yaitu sebesar 92.3% untuk keseluruhan fonem. Grafik tingkat akurasi suara asli dengan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 18. Hampir semua fonem dikenali dengan akurasi di atas 70% dan hanya dua fonem yang memperoleh akurasi 50% pada penelitian ini.

Gambar 18 Grafik Tingkat Akurasi Suara Asli dengan MFCC Masing-Masing Fonem Fonem yang memperoleh tingkat akurasi 100% sebanyak 20 fonem yaitu /b/, /d/, /e/, /f/, /g/, /h/, /j/, /l/, /m/, /n/, /o/, /p/, /r/, /s/, /u/, /v/, /w/, /x/, /y/, dan /z/. Fonem yang memperoleh tingkat akurasi 75% berturut-turut yaitu berturut-turut yaitu /a/, /c/, /i/, dan /q/. Fonem yang memperoleh tingkat akurasi 50 yaitu fonem /k/ dan /t/. Hasil pendeteksian masing-masing fonem untuk MFCC dan matriks

confusion dapat dilihat pada Lampiran 3 dan Lampiran 4.

Perbandingan Wavelet Daubechies Orde 4 (Db4) dengan MFCC pada Suara Asli

Perbandingan Wavelet Daubechies dan MFCC untuk semua fonem dapat dilihat pada Gambar 19. Terdapat empat fonem yang tidak dikenali pada pengujian yang menggunakan ekstraksi ciri Wavelet Daubechies sedangkan jika menggunakan MFCC fonem-fonem tersebut dapat dikenali semua.

Gambar 19 Grafik Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies

dan MFCC Masing-Masing Fonem Gambar 20 menunjukkan perbandingan

Wavelet Daubechies dan MFCC secara

keseluruhan. Terlihat bahwa ekstraksi ciri menggunakan MFCC memperoleh akurasi yang cukup baik sebesar 92.3% dengan selisih mencapai 59.61% jika dibandingkan dengan

Wavelet Daubechies.

Gambar 20 Perbandingan Tingkat Akurasi Suara Asli dengan Wavelet Daubechies dan

MFCC

Sinyal Suara dengan Penambahan Noise

Noise yang ditambahkan pada penelitian ini adalah noise 30dB, 20dB, dan 10dB dengan ekstraksi ciri Wavelet Daubechies dan MFCC. Daubechies Orde 4 (db4) dengan Penambahan Noise 30dB

Grafik tingkat akurasi suara dengan noise

30dB menggunakan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 21. Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri Wavelet

Daubechies untuk penambahan noise 30dB

adalah 24.03% untuk keseluruhan fonem. Akurasi dengan penambahan noise 30dB menurun sebesar 8.66% dibandingkan dengan suara asli. Pada pengujian dengan penambahan

noise 30dB terdapat tiga fonem yang

mempunyai akurasi di atas 70% yaitu fonem /e/, /o/ dengan akurasi 75% dan fonem /p/ dengan akurasi 100%. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies

dengan penambahan noise 30dB dan matriks

confusion dapat dilihat pada Lampiran 5 dan Lampiran 6. Fonem yang paling dominan terdeteksi pada penambahan noise 30dB yaitu fonem /e/.

Gambar 21 Grafik Tingkat Akurasi Suara dengan Noise 30 dB Menggunakan Wavelet

Wavelet Daubechies Orde 4 (db4) dengan Penambahan Noise 20dB

Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri Wavelet

Daubechies untuk penambahan noise 20dB

adalah 12.5% untuk keseluruhan fonem. Akurasi dengan penambahan noise 20dB menurun sebesar 11.53% dari penambahan

noise 30dB dan 20.19% dari suara asli. Pada penambahan noise 20dB masih terdapat fonem-fonem yang belum dikenali yaitu fonem-fonem /a/, /b/, /d/, /f/, /g/, /h/, /j/, /k/, /n, /q/, /r/, /s/, /t/, /v/, /w/, /x/, /y/, dan /z/ sedangkan fonem yang memperoleh akurasi 100% hanya hanya fonem /p/.

Grafik tingkat akurasi suara dengan noise

20dB menggunakan Wavelet Daubechies untuk masing-masing fonem dapat dilihat pada Gambar 22. Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dengan penambahan noise 20dB dan matriks confusion

dapat dilihat pada Lampiran 7 dan Lampiran 8. Fonem yang paling dominan terdeteksi pada penambahan noise 20dB yaitu fonem /l/.

Gambar 22 Grafik Tingkat Akurasi Suara dengan Noise 20dB Menggunakan Wavelet

Daubechies Masing-Masing Fonem

Wavelet Daubechies orde 4 (db4) dengan Penambahan Noise 10dB

Pengujian dengan ekstraksi ciri Wavelet

Daubechies untuk penambahan noise 10dB

memperoleh akurasi sebesar 3.84% untuk keseluruhan fonem. Grafik tingkat akurasi suara dengan noise 10dB menggunakan

Wavelet Daubechies untuk masing-masing

fonem dapat dilihat pada Gambar 23. Akurasi dengan penambahan noise 10dB menurun sebesar 20.19% dari penambahan noise 30dB, 8.66% dari penambahan noise 20%, dan 28.85% dari suara asli.

Hasil pendeteksian masing-masing fonem untuk Wavelet Daubechies dengan penambahan

noise 10dB dan matriks confusion dapat dilihat pada Lampiran 9 dan Lampiran 10. Fonem yang paling dominan terdeteksi pada penambahan

noise 10dB yaitu fonem /o/. Ini dikarenakan

dengan penambahan noise 10dB membuat fonem-fonem yang diujikan menyerupai fonem /p/.

Gambar 23 Grafik Tingkat Akurasi Suara dengan Noise 10dB Menggunakan Wavelet

Daubechies Masing-Masing Fonem

Perbandingan Wavelet Daubechies dengan Penambahan Noise 30dB, 20dB, 10dB

Tingkat akurasi perbandingan noise pada ekstraksi ciri Wavelet Daubechies dapat dilihat pada Gambar 24. Tingkat akurasi pada data suara asli lebih bagus dibandingkan dengan data suara dengan penambahan noise. Penambahan

noise pada penggunaan ekstraksi ciri Wavelet

Daubechies tidak terlalu berpengaruh

dibandingkan dengan suara asli (tanpa noise). Ini disebabkan wavelet dapat digunakan untuk mengurangi noise yang ditambahkan. Pada Gambar 24 terlihat semakin kecil noise yang ditambahkan semakin kecil tingkat akurasi pengenalan fonem, sedangkan jika semakin besar noise yang ditambahkan, akan semakin besar tingkat akurasi pengenalan fonemnya.

Gambar 24 Grafik Perbandingan Tingkat Akurasi Menggunakan Wavelet Daubechies

terhadap Suara Asli dan Suara dengan Penambahan Noise 30dB, 20dB, dan 10dB MFCC dengan Penambahan Noise 30dB

Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri MFCC untuk penambahan noise 30dB adalah 50.96% untuk keseluruhan fonem. Akurasi dengan penambahan noise 30dB menurun sebesar 41.34% dibandingkan dengan suara asli. Grafik tingkat akurasi suara dengan noise 30dB

menggunakan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 25. Fonem yang paling dominan terdeteksi pada penambahan noise 30dB yaitu fonem /l/.

Gambar 25 Grafik Tingkat Akurasi Suara dengan Noise 30dB Menggunakan MFCC

Masing-Masing Fonem

Hal ini membuktikan penambahan noise

30dB jauh lebih baik dari pada penambahan

noise 20dB dan 10dB. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise dan matriks confusion dapat dilihat pada Lampiran 11 dan Lampiran 12. MFCC dengan Penambahan Noise 20dB

Akurasi yang diperoleh dengan pengujian menggunakan ekstraksi ciri MFCC untuk penambahan noise 20dB hanya mencapai 26.92% untuk keseluruhan fonem. Akurasi dengan penambahan noise 20dB menurun sebesar 24.04% dibandingkan dengan penambahan noise 30dB dan 65.38% jika dibandingkan dengan suara asli. Pada penambahan noise 20dB terdapat lima fonem yang memperoleh akurasi 100% yaitu fonem /a/, /d/, /l/, /m/, dan /s /. Fonem yang paling dominan terdeteksi pada penambahan noise

10dB yaitu fonem /l/. Grafik tingkat akurasi suara dengan noise 20dB menggunakan MFCC untuk masing-masing fonem dapat dilihat pada Gambar 26. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise

20dB dan matriks confusion dapat dilihat pada Lampiran 13 dan Lampiran 14.

Gambar 26 Grafik Tingkat Akurasi Suara dengan Noise 20dB Menggunakan MFCC

Masing-Masing Fonem

MFCC dengan Penambahan Noise 10dB Pengujian dengan ekstraksi ciri MFCC untuk penambahan noise 10dB memperoleh akurasi sebesar 19.23% untuk keseluruhan fonem. Grafik tingkat akurasi suara dengan

noise 10dB menggunakan MFCC untuk

masing-masing fonem dapat dilihat pada Gambar 27.

Gambar 27 Grafik Tingkat Akurasi Suara dengan Noise 10dB Menggunakan MFCC

Masing-Masing Fonem

Pada Gambar 27 terlihat hanya delapan fonem yang dapat dikenali. Fonem tersebut di antaranya fonem /a/, /d/,/m/ dengan akurasi 100%, /l/, /p/, /s/ dengan akurasi 50%, dan /i/, /j/ dengan akurasi 25%. Hasil pendeteksian masing-masing fonem untuk MFCC dengan penambahan noise 10dB dan matriks confusion

dapat dilihat pada Lampiran 15 dan Lampiran 16. Fonem yang paling dominan terdeteksi pada penambahan noise 10dB yaitu fonem /a/. Perbandingan MFCC dengan Penambahan Noise 30dB, 20dB, 10dB

Tingkat akurasi perbandingan noise pada ekstraksi ciri MFCC dapat dilihat pada Gambar 28.

Gambar 28 Grafik Perbandingan Tingkat Akurasi Menggunakan MFCC terhadap Suara

Asli dan Suara dengan Penambahan Noise

30dB, 20dB, dan 10dB

Pada data suara asli tingkat akurasinya jauh lebih bagus dibandingkan dengan data suara dengan penambahan noise. Selisih antara data asli dengan penambahan noise 30dB ialah

41.34% , 65.38% jika dibandingkan dengan penambahan noise 20dB dan mencapai 73.07% jika dengan penambahan noise 10dB.

Perbandingan Wavelet Daubechies dan MFCC antara Data Asli dan Data dengan Penambahan Noise 30dB, 20dB, 10dB

Tingkat akurasi perbandingan Wavelet Daubechies dan MFCC antara data asli dan data dengan penambahan noise 30dB, 20dB, dan 10dB dapat dilihat pada Gambar 29.

Gambar 29 Grafik Perbandingan Tingkat Akurasi Wavelet Daubechies dan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 30dB, 20dB, dan 10dB

Akurasi menggunakan MFCC lebih tinggi dibandingkan dengan menggunakan Wavelet Daubechies yaitu sebesar 92.3%. Pada Gambar 29 dapat dilihat ekstraksi ciri menggunakan

Wavelet Daubechies memperoleh akurasi

kurang dari 50%. Hal ini menunjukkan ekstraksi ciri dengan Wavelet Daubechies tidak jauh lebih baik dari pada ekstraksi ciri dengan MFCC.

KESIMPULAN DAN SARAN Kesimpulan

Berdasarkan penelitian yang dilakukan, didapatkan kesimpulan sebagai berikut : 1. Ekstraksi ciri menggunakan MFCC pada

pengenalan fonem jauh lebih baik dibandingkan dengan menggunakan Wavelet

Daubechies. Pada data asli (tanpa

penambahan noise) diperoleh akurasi sebesar 92.3% dan pada data yang ditambahkan noise 30dB, 20dB, dan 10dB akurasi yang diperoleh secara berturut-turut adalah 50.96%, 26.92%, dan 19.23%. 2. Akurasi data suara yang ditambahkan noise

30dB lebih tinggi dari pada akurasi data suara yang ditambahkan noise 20dB dan

noise 10dB. Ini mengakibatkan adanya

kemunduran tingkat akurasi. Oleh karena

itu, dapat disimpulkan jika semakin kecil

noise yang ditambahkan pada fonem maka akan semakin banyak jumlah fonem yang dapat dikenali (akurasi tinggi). Jika semakin besar noise yang ditambahkan pada fonem maka akan semakin sedikit jumlah fonem yang dapat dikenali (akurasi rendah). Saran

Penelitian ini masih banyak kekurangan yang memungkinkan dilakukan pengembangan lebih lanjut. Beberapa saran yang dapat ditambahkan diantaranya :

1. Penelitian ini dapat dikembangkan ke arah pengenalan kata atau bahkan pengenalan kalimat.

2. Penggunaan kata yang lebih bervariasi serta menambah jumlah kata yang digunakan untuk data uji dan data latih.

3. Penambahan jumlah pembicara dan menggunakan dua atau lebih dalam pengucapan.

4. Segmentasi yang dilakukan tidak lagi secara manual (auto-correlation ).

DAFTAR PUSTAKA

Agustini K. 2006. Perbandingan Metode Transformasi Wavelet Sebagai Praproses Pada Sistem Identifikasi Pembicara. [Tesis]. Bogor : Sekolah Pasca Sarjana, Institut Pertanian Bogor.

Al-Akaidi M. 2004. Fractal Speech Processing. Cambridge University Press. Buono A. 2009. Representasi Nilai HOS dan

Model MFCC Sebagai Ekstraksi Ciri Pada

Sistem Identifikasi Pembicara di

Lingkungan Ber-Noise Menggunakan HMM.

[Disertasi]. Depok: Program Pascasarjana, Universitas Indonesia.

Burrus C.S, Gopinath RA, & Gou H. (1998).

Introduction to Wavelets and Wavelet Transforms A Primer. International Edition, Prentice-Hall International, Inc.

Donadio MB. 1992. How To Geberate White Gaussian Noise. http://www.dspguru.com/ds p/howtos/how-to-generate-white-gaussian-noise [diakses 12 Maret 2011].

Donoho DL, et al. 2003. Locally Stationary Covariance And Signal Estimation With Macrotiles. [Jurnal]. IEE Transaction On Signal Processing, Vol. 51 No. 3.

Ganchev TD. 2005. Speaker Recognition. [Disertasi].Yunani : Wire Communications

41.34% , 65.38% jika dibandingkan dengan penambahan noise 20dB dan mencapai 73.07% jika dengan penambahan noise 10dB.

Perbandingan Wavelet Daubechies dan MFCC antara Data Asli dan Data dengan Penambahan Noise 30dB, 20dB, 10dB

Tingkat akurasi perbandingan Wavelet Daubechies dan MFCC antara data asli dan data dengan penambahan noise 30dB, 20dB, dan 10dB dapat dilihat pada Gambar 29.

Gambar 29 Grafik Perbandingan Tingkat Akurasi Wavelet Daubechies dan MFCC terhadap Suara Asli dan Suara dengan Penambahan Noise 30dB, 20dB, dan 10dB

Akurasi menggunakan MFCC lebih tinggi dibandingkan dengan menggunakan Wavelet Daubechies yaitu sebesar 92.3%. Pada Gambar 29 dapat dilihat ekstraksi ciri menggunakan

Wavelet Daubechies memperoleh akurasi

kurang dari 50%. Hal ini menunjukkan ekstraksi ciri dengan Wavelet Daubechies tidak jauh lebih baik dari pada ekstraksi ciri dengan MFCC.

KESIMPULAN DAN SARAN Kesimpulan

Berdasarkan penelitian yang dilakukan, didapatkan kesimpulan sebagai berikut : 1. Ekstraksi ciri menggunakan MFCC pada

pengenalan fonem jauh lebih baik dibandingkan dengan menggunakan Wavelet

Daubechies. Pada data asli (tanpa

penambahan noise) diperoleh akurasi sebesar 92.3% dan pada data yang ditambahkan noise 30dB, 20dB, dan 10dB akurasi yang diperoleh secara berturut-turut adalah 50.96%, 26.92%, dan 19.23%. 2. Akurasi data suara yang ditambahkan noise

30dB lebih tinggi dari pada akurasi data suara yang ditambahkan noise 20dB dan

noise 10dB. Ini mengakibatkan adanya

kemunduran tingkat akurasi. Oleh karena

itu, dapat disimpulkan jika semakin kecil

noise yang ditambahkan pada fonem maka akan semakin banyak jumlah fonem yang dapat dikenali (akurasi tinggi). Jika semakin besar noise yang ditambahkan pada fonem maka akan semakin sedikit jumlah fonem yang dapat dikenali (akurasi rendah). Saran

Penelitian ini masih banyak kekurangan yang memungkinkan dilakukan pengembangan lebih lanjut. Beberapa saran yang dapat ditambahkan diantaranya :

1. Penelitian ini dapat dikembangkan ke arah pengenalan kata atau bahkan pengenalan kalimat.

2. Penggunaan kata yang lebih bervariasi serta menambah jumlah kata yang digunakan untuk data uji dan data latih.

3. Penambahan jumlah pembicara dan menggunakan dua atau lebih dalam pengucapan.

4. Segmentasi yang dilakukan tidak lagi secara manual (auto-correlation ).

DAFTAR PUSTAKA

Agustini K. 2006. Perbandingan Metode Transformasi Wavelet Sebagai Praproses Pada Sistem Identifikasi Pembicara. [Tesis]. Bogor : Sekolah Pasca Sarjana, Institut Pertanian Bogor.

Al-Akaidi M. 2004. Fractal Speech Processing. Cambridge University Press. Buono A. 2009. Representasi Nilai HOS dan

Model MFCC Sebagai Ekstraksi Ciri Pada

Sistem Identifikasi Pembicara di

Lingkungan Ber-Noise Menggunakan HMM.

[Disertasi]. Depok: Program Pascasarjana, Universitas Indonesia.

Burrus C.S, Gopinath RA, & Gou H. (1998).

Introduction to Wavelets and Wavelet Transforms A Primer. International Edition, Prentice-Hall International, Inc.

Donadio MB. 1992. How To Geberate White Gaussian Noise. http://www.dspguru.com/ds p/howtos/how-to-generate-white-gaussian-noise [diakses 12 Maret 2011].

Donoho DL, et al. 2003. Locally Stationary Covariance And Signal Estimation With Macrotiles. [Jurnal]. IEE Transaction On Signal Processing, Vol. 51 No. 3.

Ganchev TD. 2005. Speaker Recognition. [Disertasi].Yunani : Wire Communications

Dokumen terkait