• Tidak ada hasil yang ditemukan

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

HASIL DAN PEMBAHASAN Praproses

Penelitian ini, data yang digunakan sebanyak 390 data latih dan 130 data uji. Data tersebut selanjutnya dilakukan praproses yaitu penghapusan silent, normalisasi, dan segmentasi manual. Dengan demikian, tahap praproses menghasilkan 26 fonem dari fonem /a/ sampai /z/. Masing-masing fonem memiliki 15 data latih dan 5 data uji. Setelah dilakukan praproses, dilanjutkan dengan proses ekstraksi ciri pada semua data dengan menerapkan MFCC dan

Wavelet Daubechies.

Pada proses ekstraksi ciri dengan MFCC terdapat beberapa parameter yaitu, input suara,

sampling rate, time frame, overlap, cepstral coefficient. Parameter ekstraksi ciri Wavelet

Daubechies sama dengan parameter pada MFCC hanya ditambah satu parameter lagi yaitu level. Data latih merupakan data hasil praproses dan ekstraksi ciri yang sudah dibuatkan model terlebih dulu. Pemodelan dilakukan dengan menghitung nilai mean dan

sigma dari masing-masing fonem dengan 13 koefisien.

Karena keterbatasan data latih yang digunakan penelitian ini menerapkan 13 koefisien. Jika koefisien yang digunakan lebih dari 13 maka nilai sigma ( ) yang dihasilkan mendekati singular. Hal ini terjadi karena memiliki nilai determinan yang sangat kecil hingga mencapai 1e-128, oleh sistem dianggap sama dengan nol. Dengan demikian, akan

mengakibatkan Distribusi Normal yang

diperoleh bernilai infinitif atau NaN (not a number).

Jumlah data latih yang digunakan

mempunyai bobot yang sama untuk setiap kelasnya. Hal ini dilakukan, karena jika salah satu ada yang dominan akan berpengaruh terhadap nilai akurasi. Karena kelas yang dominan akan selalu mendominasi.

Hasil Pengujian dengan MFCC

Hasil pengujian fonem dengan ekstraksi ciri MFCC dan Distribusi Normal terhadap masing- masing fonem dapat dilihat pada Gambar 7. Pada grafik terlihat bahwa fonem yang dapat dikenali dengan baik oleh sistem ada 17 fonem. Fonem /a/,/b/, /d/, /e/, /g/, /h/, /i/, /j/, /l/, /m/, /n/, /o/, /s/, /t/, /w/, /x/, dan /z/ mencapai 100%. Akan tetapi, fonem /f/, /p/, /r/, /v/ kurang baik dikenali karena akurasinya hanya mencapai 60%. Namun demikian, untuk fonem /c/, /k/, /q/, /u/, dan /y/ lumayan baik dapat dikenali dengan akurasinya mencapai 80%.

Gambar 7 Grafik hasil pengujian dengan ekstraksi ciri MFCC.

Hasil Pengujian dengan Wavelet

Daubechies

Hasil pengujian fonem dengan ekstraksi ciri

Wavelet Daubechies terhadap masing-masing fonem dapat dilihat pada Gambar 8. Pada grafik terlihat bahwa fonem kurang dapat dikenali dengan baik oleh sistem. Fonem /a/, /b/, /c/, /g/, /h/, /j/, /k/, /n/, /o/, /p/, /q/, /y/ dapat dikenali di atas 50% dan untuk fonem lainnya hanya bisa dikenali kurang dari 50%.

Gambar 8 Grafik hasil pengujian dengan ekstraksi ciri Wavelet.

Pada Gambar 9 terlihat bahwa pengujian fonem dengan ekstraksi ciri MFCC memiliki

0% 20% 40% 60% 80% 100% a b c d e f g h i j k l m n o p q r s t u v w x y z N il a i A k u ra si Fonem 0% 20% 40% 60% 80% 100% a b c d e f g h i j k l m n o p q r s t u v w x y z Fonem N il a i A k ur a si

Pengujian

Pengujian dilakukan pada data uji yang telah dipersiapkan. Setiap data uji dilihat apakah data tersebut terindentifikasi pada fonem yang semestinya. Presentase tingkat akurasi dihitung dengan fungsi berikut:

➀☛➁q➂✒➃✆➄✩➅➇➆➉➈➋➊③➌➥➉➦➋➧③➨➍➏➎✘➐✖➑➓➒❵➔➣→❼↔❵↕➛➙✖➜✵➝➟➞➣➠➢➡➛➤➩➏➫✘➭✖➯➓➲❵➳➣➵❼➸❵➺➛➻✖➼✥➽➋➾➚✖➪➶➾ ➹➴➘❖➷❢➷❢➬ (16)

HASIL DAN PEMBAHASAN Praproses

Penelitian ini, data yang digunakan sebanyak 390 data latih dan 130 data uji. Data tersebut selanjutnya dilakukan praproses yaitu penghapusan silent, normalisasi, dan segmentasi manual. Dengan demikian, tahap praproses menghasilkan 26 fonem dari fonem /a/ sampai /z/. Masing-masing fonem memiliki 15 data latih dan 5 data uji. Setelah dilakukan praproses, dilanjutkan dengan proses ekstraksi ciri pada semua data dengan menerapkan MFCC dan

Wavelet Daubechies.

Pada proses ekstraksi ciri dengan MFCC terdapat beberapa parameter yaitu, input suara,

sampling rate, time frame, overlap, cepstral coefficient. Parameter ekstraksi ciri Wavelet

Daubechies sama dengan parameter pada MFCC hanya ditambah satu parameter lagi yaitu level. Data latih merupakan data hasil praproses dan ekstraksi ciri yang sudah dibuatkan model terlebih dulu. Pemodelan dilakukan dengan menghitung nilai mean dan

sigma dari masing-masing fonem dengan 13 koefisien.

Karena keterbatasan data latih yang digunakan penelitian ini menerapkan 13 koefisien. Jika koefisien yang digunakan lebih dari 13 maka nilai sigma ( ) yang dihasilkan mendekati singular. Hal ini terjadi karena memiliki nilai determinan yang sangat kecil hingga mencapai 1e-128, oleh sistem dianggap sama dengan nol. Dengan demikian, akan

mengakibatkan Distribusi Normal yang

diperoleh bernilai infinitif atau NaN (not a number).

Jumlah data latih yang digunakan

mempunyai bobot yang sama untuk setiap kelasnya. Hal ini dilakukan, karena jika salah satu ada yang dominan akan berpengaruh terhadap nilai akurasi. Karena kelas yang dominan akan selalu mendominasi.

Hasil Pengujian dengan MFCC

Hasil pengujian fonem dengan ekstraksi ciri MFCC dan Distribusi Normal terhadap masing- masing fonem dapat dilihat pada Gambar 7. Pada grafik terlihat bahwa fonem yang dapat dikenali dengan baik oleh sistem ada 17 fonem. Fonem /a/,/b/, /d/, /e/, /g/, /h/, /i/, /j/, /l/, /m/, /n/, /o/, /s/, /t/, /w/, /x/, dan /z/ mencapai 100%. Akan tetapi, fonem /f/, /p/, /r/, /v/ kurang baik dikenali karena akurasinya hanya mencapai 60%. Namun demikian, untuk fonem /c/, /k/, /q/, /u/, dan /y/ lumayan baik dapat dikenali dengan akurasinya mencapai 80%.

Gambar 7 Grafik hasil pengujian dengan ekstraksi ciri MFCC.

Hasil Pengujian dengan Wavelet

Daubechies

Hasil pengujian fonem dengan ekstraksi ciri

Wavelet Daubechies terhadap masing-masing fonem dapat dilihat pada Gambar 8. Pada grafik terlihat bahwa fonem kurang dapat dikenali dengan baik oleh sistem. Fonem /a/, /b/, /c/, /g/, /h/, /j/, /k/, /n/, /o/, /p/, /q/, /y/ dapat dikenali di atas 50% dan untuk fonem lainnya hanya bisa dikenali kurang dari 50%.

Gambar 8 Grafik hasil pengujian dengan ekstraksi ciri Wavelet.

Pada Gambar 9 terlihat bahwa pengujian fonem dengan ekstraksi ciri MFCC memiliki

0% 20% 40% 60% 80% 100% a b c d e f g h i j k l m n o p q r s t u v w x y z N il a i A k u ra si Fonem 0% 20% 40% 60% 80% 100% a b c d e f g h i j k l m n o p q r s t u v w x y z Fonem N il a i A k ur a si

kinerja yang cukup baik dibandingkan dengan ekstraksi ciri Wavelet. Hal ini, pada grafik terlihat bahwa dengan MFCC terdapat 25 fonem nilai akurasinya berada di atas grafik Wavelet. Akan tetapi, dari 26 fonem kecuali untuk fonem /p/ nilai akurasi MFCC berada di bawah

Wavelet. Nilai akurasi untuk fonem /p/ dengan MFCC sebesar 60%, sedangkan pada Wavelet

mencapai 80%. Jadi Wavelet di atas MFCC sebesar 20% hanya untuk fonem /p/.

Gambar 9 Grafik hasil pengujian dengan ekstraksi ciri MFCC danWavelet.

Gambar 10 Grafik hasil pengujian data uji. Berdasarkan Tabel 3 dan Gambar 10 terlihat bahwa akurasi nilai perbandingan antara MFCC dan Wavelet menunjukkan perbedaan yang sangat signifikan. Rata-rata nilai akurasi MFCC memiliki keunggulan dibandingkan dengan

Wavelet sebesar 43,08% dari seluruh fonem. Untuk MFCC akurasi rata-rata sebesar 90% sedangkan Wavelet jauh di bawah MFCC dengan rata-rata akurasinya hanya mencapai 46,92%.

Tabel 3 Akurasi nilai perbandingan MFCC dan

Wavelet. Fonem MFCC Wavelet A 100% 80% B 100% 60% Fonem MFCC Wavelet C 80% 60% D 100% 20% E 100% 40% F 60% 20% G 100% 60% H 100% 60% I 100% 40% J 100% 60% K 80% 60% L 100% 40% M 100% 40% N 100% 60% O 100% 80% P 60% 80% Q 80% 80% R 60% 20% S 100% 20% T 100% 20% U 80% 20% V 60% 40% W 100% 20% X 100% 20% Y 80% 80% Z 100% 40%

Berdasarkan Gambar 11 terlihat bahwa hasil pengujian sangat baik, ketika menggunakan data latih sebagai data uji. Hal ini terlihat pada grafik bahwa, rata-rata nilai akurasi MFCC dan

Wavelet cukup tinggi dengan rata-rata akurasi 100% untuk MFCC dan 99,74% untuk

Wavelet. Jadi, pengujian dengan data latih MFCC lebih baik dibanding dengan Wavelet

dengan selisih sebesar 0,26%.

Gambar 11 Grafik hasil pengujian data latih. 0% 20% 40% 60% 80% 100% a b c d e f g h i j k l m n o p q r s t u v w x y z Fonem MFCC WAVELET N il a i A k ur a si 90.00% 46.92% 0% 20% 40% 60% 80% 100% MFCC WAVELET N il a i A k ur a si Ekstraksi Ciri 100.00% 99.74% 0% 20% 40% 60% 80% 100% MFCC WAVELET N il a i A k ur a si Ekstraksi Ciri

Hasil pengujiaan akan mengalami penurunan, jika menggunakan data uji dan

Wavelet sebagai ekstrasi ciri. Hal ini dijelaskan dari perbedaan selisih nilai akurasi pengujian dengan data uji mengalami peningkatan yang cukup signifikan. Nilai awal selisih antara MFCC dan Wavelet 0,26% dengan data latih dan meningkat menjadi 43,08% dengan data uji. Maka berdasarkan selisih nilai akurasi, MFCC lebih baik dibanding dengan Wavelet dalam pengenalan fonem untuk sinyal tanpa gangguan.

Penerapan ekstraksi ciri Wavelet baik, jika masih dalam ruang lingkup data latih yang diujikan untuk pengenalan fonem. Hasil akurasi pengenalan fonem kurang baik, ketika menggunakan data uji yang baru. Terlihat dari rata-rata pengujian dengan data uji pada

Wavelet hanya mencapai 46,92% dan meningkat 99,74% dengan data latih.

Hasil Pengujian MFCC dan Wavelet dengan

Noise

Penelitian ini dicoba dengan menambahkan

noise pada data uji sebesar 10 dB, 20 dB, dan 30 dB. Pemilihan noise 10 dB, 20 dB, dan 30 dB karena berdasarkan fakta empiris, bahwa

noise 20 dB mulai terasa pengaruhnya terhadap sinyal suara (Buono 2009). Oleh karena itu, digunakan noise di bawah dan di atas 20 dB untuk mengetahui kehandalan model yang sudah dibuat, jika sinyal uji diberi gangguan. Sinyal noise yang digunakan bersifat gaussian dengan menggunakan paket Matlab melalui instruksi AWGN(sinyal asli,level noise).

Tabel 4 Pengujian data uji dengan noise. Sinyal MFCC Wavelet

Asli 90,0% 46,9%

noise 30 35,4% 26,9%

noise 20 13,8% 11,5%

noise 10 6,2% 5,4%

Berdasarkan Tabel 4 dapat disimpulkan,

bahwa model yang dibangun dengan

menerapkan MFCC sebagai ekstraksi ciri, jika data uji ditambah noise, maka tidak dapat mengenali dengan baik dan hasil akurasinya mengalami penurunan. Namun demikian, nilai akurasi MFCC mengalami penurunan, akan tetapi akurasi MFCC selalu berada di atas

Wavelet. Lebih jelasnya hasil akurasi yang didapat dapat dilihat pada Gambar 12. Pada grafik terlihat bahwa baik MFCC maupun

Wavelet dengan menambahkan noise hasil akurasi mengalami penurunan.

Gambar 12 Grafik hasil pengujian data uji dengan noise.

Perbedaan hasil pengujian yang sangat signifikan antara MFCC dan Wavelet, mungkin disebabkan oleh MFCC dalam mengekstraksi sinyal suara bersifat low noise sehingga teknik MFCC relatif lebih baik untuk sinyal tanpa

noise. Selain itu, MFCC juga didasarkan pada perbedaan frekuensi yang dapat ditangkap oleh

telinga manusia sehingga mampu

merepresentasikan sinyal suara sebagaimana manusia merepresentasikan.

Dokumen terkait