PENGENALAN KATA BERBASISKAN FONEM DENGAN
PEMODELAN RESILIENT BACKPROPAGATION
PRAMESWARI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
PENGENALAN KATA BERBASISKAN FONEM DENGAN
PEMODELAN RESILIENT BACKPROPAGATION
PRAMESWARI
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011
ABSTRACT
PRAMESWARI. Words Recognition based on Phonemes with Resilient Backpropagation Models. Under the direction of AGUS BUONO.
The aim of this research is to know the performance of Neural Network as a model for word recognition. The research uses Resilient Backpropagation for modeling and Mel-Frequency Cepstral Coefficient (MFCC) for feature extraction. The voice data used comes from one speaker. Total words used are 70 words that consist of 50 words as a dictionary of words and 20 words, that each word repeated 10 times. Dictionary words consist of 50 words from a combination of phonemes used in the research. Phonemes used in this research are 10 phonemes consist of 4 vowels and 6 consonants phonemes. From the 20 words, each word is repeated 10 times, 7 times used as training data and 3 times are used as test data. The output from testing process are word transcription. The convertion process from the word transcription into word is done manually by 5 person. This research produces two models. Average accuracy obtained from model with 100 hidden neuron is 75% for test data and 61% for the dictionary of words. The best average accuracy obtained is 93% for test data and 62 % for the dictionary of words generated by testing the model with 1000 hidden neurons. Overfitting occurs in the second model with 1000 hidden neurons. It causes the model can only produce good output for data that has been trained.
Keywords: word recognition, phoneme, Neural Networks, Resilient Backpropagation, Mel-Frequency Cepstral Coefficient, overfitting.
Judul : Pengenalan Kata Berbasiskan Fonem dengan Pemodelan Resilient Backpropagation Nama : Prameswari
NIM : G64061471
Menyetujui : Pembimbing
Dr. Ir. Agus Buono, M.Si., M.Kom NIP 19660702 199302 1 001
Mengetahui :
Ketua Departemen Ilmu Komputer
Dr. Ir. Sri Nurdiati, M.Sc NIP. 19601126 198601 2 001
Tanggal Lulus :
PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas akhir ini.
Terima kasih penulis ucapkan kepada pihak yang telah membantu penyelesaian tulisan akhir ini, antara lain kepada Bapak Dr. Ir. Agus Buono, M.Si., M.Kom., selaku pembimbing atas bimbingan dan arahannya selama pengerjaan tugas akhir ini, serta Ibu Dr. Ir. Sri Nurdiati, M.Sc., dan Bapak Mushthofa, S.Kom., M.Sc., selaku penguji tugas akhir ini. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga atas doa dan dukungannya. Terima kasih juga kepada Merlinda, Charisna, Karomatul, Utari, Indyastari serta teman-teman Ilkomerz 43 yang telah memberikan semangat dan dukungannya. Penulis menyadari bahwa masih terdapat kekurangan dalam penelitian ini. Semoga tulisan ini dapat bermanfaat.
Bogor, November 2010
RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 14 Juli 1988 di Jakarta sebagai anak pertama dari tiga bersaudara dari pasangan Yadiono dan Rosmiati. Pada tahun 2006 penulis lulus dari SMA Negeri 2 Bekasi dan diterima sebagai mahasiswa Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) pada tahun yang sama. Pada tahun 2007, penulis diterima sebagai mahasiswa di Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA), IPB.
Selama mengikuti kegiatan perkuliahan, penulis pernah menjadi asisten praktikum Penerapan Komputer. Penulis juga aktif dalam kegiatan HIMALKOM 2008/2009 sebagai sekretaris Divisi Kreatif HIMALKOM. Selain itu, penulis juga pernah menjadi bendahara Komisi II Internal Dewan Perwakilan Mahasiswa (DPM) FMIPA 2009/2010. Pada tahun 2009, penulis melaksanakan praktik kerja lapangan di Pusat Penelitian dan Pengembangan Ilmu Pengetahuan dan Teknologi Lembaga Ilmu Pengetahuan Indonesia (PAPPIPTEK LIPI).
iv
DAFTAR ISI Halaman DAFTAR TABEL ... v DAFTAR GAMBAR ... v DAFTAR LAMPIRAN ... v PENDAHULUAN ... 1 Latar Belakang ... 1 Tujuan Penelitian ... 1 Ruang Lingkup ... 1 Manfaat ... 1 TINJAUAN PUSTAKA ... 2 Pengenalan Suara ... 2Representasi Gelombang Sinyal ... 2
Fonem ... 2
Pemrosesan Suara ... 3
Konversi Sinyal Analog ke Sinyal Digital ... 3
Ekstrasi Ciri ... 4
Jaringan Syaraf Tiruan ... 5
Inisialisasi Bobot dan Bias ... 7
Resilient Backpropagation ... 7
METODE PENELITIAN ... 8
Studi Pustaka ... 8
Pengambilan Data Suara ... 8
Praproses ... 9
Arsitektur JST Resilient Backpropagation ... 9
Pelatihan Sistem ... 10
Pengujian ... 10
Penghitungan Akurasi ... 10
Lingkungan Pengembangan ... 10
HASIL DAN PEMBAHASAN... 10
Hasil Pengambilan Data ... 10
Pelatihan dan Pengujian ... 11
Akurasi Pengujian ... 11
KESIMPULAN DAN SARAN... 13
Kesimpulan ... 13
Saran ... 13
DAFTAR PUSTAKA ... 13
v
DAFTAR TABEL
Halaman
1. Daftar 20 kata sebagai data latih ... 8
2. Daftar 50 kata di luar data latih ... 9
3. Struktur JST RPROP ... 9
4. Definisi target JST untuk 10 fonem... 10
DAFTAR GAMBAR 1. Bentuk gelombang dari kata ‘test’ (Al-Kaidi 2007). ... 2
2. Empat suara dari kata ‘test’ : ‘t’, ‘e’, ‘s’, ‘t’ (Al-Kaidi 2007). ... 2
3. Proses transformasi sinyal analog menjadi informasi (Buono 2009). ... 3
4. Ilustrasi proses konversi sinyal analog menjadi sinyal waktu diskret. ... 3
5. Diagram blok proses MFCC (Do 1994). ... 4
6. Arsitektur jaringan single layer (Kusumadewi 2003). ... 5
7. Arsitektur jaringan multi layer (Kusumadewi 2003). ... 6
8. Arsitektur jaringan competitive layer. ... 6
9. Metode penelitian. ... 8
10. Pemotongan data suara. ... 9
11. Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang dilatih dengan Model Pertama. . 12
12. Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang dilatih dengan Model Kedua... 12
13. Grafik perbandingan akurasi keseluruhan kata dari 2 model RPROP ... 13
DAFTAR LAMPIRAN 1. Algoritme Pelatihan JST RPROP (Sumber : Riedmiller dan Braun 1992, diacu dalam Engelbrecht 2007) ... 16
2. Kuesioner model pertama dengan 100 hidden neuron... 17
3. Kuesioner model kedua dengan 1000 hidden neuron ... 19
4. Kuesioner untuk 50 kata di luar data latih dengan 100 hidden neuron ... 21
5. Kuesioner untuk 50 kata di luar data latih dengan 1000 hidden neuron ... 23
6. Hasil prediksi kata sinyal suara dari 20 kata yang dimodelkan dengan 100 hidden neuron ... 25
7. Hasil prediksi kata sinyal suara dari 20 kata yang dimodelkan dengan 1000 hidden neuron ... 26
8. Hasil prediksi 50 kata sinyal suara di luar data latih dengan 100 hidden neuron ... 27
1
PENDAHULUAN Latar Belakang
Perkembangan teknologi yang sudah semakin maju saat ini menyebabkan bentuk informasi yang dikirimkan bukan hanya dalam bentuk teks tetapi juga dalam bentuk suara. Hal ini menyebabkan banyaknya penelitian yang berhubungan dengan pengembangan sistem dalam bidang pemrosesan suara.
Kemampuan untuk dapat bicara dengan komputer pribadi dan dapat membuat komputer tersebut mengenali serta mengerti apa yang dikatakan, akan menimbulkan kenyamanan dalam berkomunikasi (Peacock 1999). Untuk mengembangkan suatu sistem yang dapat mengenali kata atau suara tidaklah mudah, berbeda dengan manusia yang dapat dengan mudah menginterpretasikan kata ataupun suara yang didengar.
Perkembangan teknologi pengenalan suara yang kontinu memungkinkan manusia untuk dapat berkomunikasi dengan komputer menggunakan bahasa sehari-hari. Beberapa penelitian mengenai pengenalan suara dalam bahasa Indonesia telah banyak dilakukan. Seperti penelitian yang dilakukan oleh Ruvinna (2008) tentang pengenalan kata berbahasa Indonesia dengan Hidden Markov Models atau HMM, Resmiwati (2009) tentang pengenalan kata berbahasa Indonesia dengan HMM berbasiskan fonem, dan Danuriati (2010) yang meneliti tentang konversi suara ke teks yang berbasiskan fonem dengan HMM. Dengan demikian, pada penelitian ini akan dikembangkan suatu pengenalan kata berbasiskan fonem dengan Jaringan Syaraf Tiruan (JST).
JST merupakan salah satu metode yang dapat digunakan untuk mengenali pola (huruf, angka, suara atau tanda tangan) yang sudah sedikit berubah. JST dapat mengenali sinyal input yang agak berbeda dari yang pernah diterima sebelumnya. Selain itu JST juga bersifat adaptif karena mampu belajar dari data sebelumnya dan dapat mengenal pola data yang selalu berubah. Terdapat banyak metode dalam JST, salah satunya adalah Backpropagation. Metode Backpropagation merupakan suatu teknik supervised learning yang banyak digunakan untuk pengenalan pola-pola yang kompleks. Backpropagation dapat melatih jaringan untuk memperoleh keseimbangan antara kemampuan jaringan dalam mengenali pola yang dipakai dalam pelatihan dan kemampuan jaringan dalam memberikan
respon yang benar untuk pola input yang serupa tapi tidak identik dengan pola yang digunakan selama pelatihan (Fausett 1994).
Metode standar Backpropagation seringkali terlalu lambat untuk keperluan praktis sehingga beberapa modifikasi dilakukan pada Backpropagation dengan mengganti fungsi pelatihannya. Salah satu modifikasi yang dikembangkan adalah Resilient Backpropagation. Martin Riedmiller dan Heinrich Braun telah mengembangkan metode Resilient Backpropagation untuk menambah kecepatan pembelajaran (Susanto 2007).
Tujuan Penelitian
Penelitian ini bertujuan untuk mengetahui kinerja dari pemodelan dengan metode Resilient
Backpropagation dalam mengenali kata
berbasiskan fonem.
Ruang Lingkup
Ruang lingkup penelitian ini adalah : 1. Pengenalan kata bersifat isolated word. Kata
yang dikenali adalah kata yang saling terpisah oleh jeda yang pendek.
2. Sistem yang dikembangkan termasuk dalam
small vocabulary karena kata yang
digunakan dalam pemodelan terdiri atas 20 kata. Suatu sistem dikatakan bersifat large vocabulary jika kata yang terdapat dalam kamus kata berjumlah lebih dari 1000 kata (Jurafsky 2007).
3. Pemodelan menggunakan 20 kata dalam bahasa Indonesia yang mengandung 10 fonem asli. Fonem yang digunakan terdiri atas 4 fonem vokal dan 6 fonem konsonan. 4. Sistem ini bersifat speaker dependent
sehingga sistem hanya dapat mengenali suara orang yang telah dilatih sebelumnya (Jurafsky 2007). Dalam penelitian ini, suara yang dilatih berasal dari satu pembicara. 5. Sistem ini memberikan hasil berupa sinyal
kata, sehingga perhitungan akurasinya diambil dari hasil kuesioner yang diberikan kepada 5 orang yang memprediksi kata yang diinginkan dari sinyal kata yang dihasilkan oleh sistem.
Manfaat
Diharapkan penelitian ini dapat dijadikan langkah awal dalam membangun sistem pengenalan kata berbasis fonem dalam bahasa Indonesia yang lebih sempurna dan menyeluruh. Selain itu, diharapkan pemodelan yang digunakan dapat memberikan informasi mengenai kinerja dari metode Resilient Backpropagation dalam pemodelan kata.
2
TINJAUAN PUSTAKA Pengenalan Suara
Menurut Peacock (1990), pengenalan suara merupakan kemampuan untuk mengidentifikasi kata-kata yang diucapkan. Terdapat 5 faktor yang dapat mengontrol dan menyederhanakan sistem pengenalan suara, yaitu:
Isolated Word. Suara yang memiliki unsur isolated word (jeda yang pendek di antara kata) akan lebih mudah untuk dikenali daripada continous speech karena sulit untuk menemukan batasan dari sebuah kata pada continous speech.
Single speaker. Suara dari satu pembicara akan lebih mudah dikenali daripada suara dari banyak pembicara karena akan lebih banyak parameter untuk merepresentasikan suara dari pembicara tertentu.
Vocabulary size. Ukuran kosakata dari suara yang ingin dikenali memiliki pengaruh yang sangat kuat dalam menentukan akurasi dari suatu sistem. Grammar. Urutan dari kata-kata yang
diperbolehkan sistem bergantung pada
grammar dari wilayah pengenalan.
Banyaknya pembatasan pada pemilihan kata dimaksud untuk mengurangi kekacauan dari grammar.
Lingkungan. Latar belakang noise, perubahan dalam karakteristik mikrofon dan kekerasan suara bisa memengaruhi akurasi dari sebuah sistem.
Representasi Gelombang Sinyal
Sinyal suara dapat direpresentasikan sebagai bentuk gelombang. Pada Gambar 1 ditunjukkan bentuk gelombang yang ditandai dengan beberapa fitur, yaitu sampling frequency sebesar 11025 Hz, resolusi 8 bit (256 level kuantisasi), panjang (L) dari file adalah 7000 sample. Dari Gambar 1, bentuk gelombang yang pertama memiliki garis horizontal yang menunjukkan banyaknya sample sedangkan gelombang yang kedua menunjukkan garis horizontal sebagai variabel waktu.
Gambar 1 Bentuk gelombang dari kata ‘test’ (Al-Kaidi 2007).
Pada Gambar 1 telah ditunjukkan bentuk gelombang dari kata ‘test’. Kata ‘test’ ini terdiri atas 4 suara, yaitu ‘t’, ‘e’, ‘s’, ‘t’. Untuk mengenali sela kecil sebelum huruf ‘t’ yang terakhir dimungkinkan karena kata tersebut diucapkan dengan berbeda dan pelan. Jika diperhatikan, bentuk gelombang tersebut dapat dilihat perbedaannya secara visual. Dengan demikian, didapat 4 suara independent dari gelombang ini yang ditunjukkan Gambar 2.
Gambar 2 Empat suara dari kata ‘test’ : ‘t’, ‘e’, ‘s’, ‘t’ (Al-Kaidi 2007).
Berdasarkan Gambar 2, dapat disimpulkan bahwa dengan memeriksa bentuk gelombang dapat diketahui bentuk-bentuk suara, yaitu (Al-Kaidi 2007) :
1. Huruf konsonan biasanya memiliki struktur noisy, sedangkan huruf vokal memiliki bentuk periodik yang alami.
2. Bentuk gelombang suara ‘t’ di awal dan di akhir adalah sama dan keduanya memiliki karakter yang explosive.
3. Huruf ‘s’ terlihat seperti white noise.
Fonem
Menurut Kamus Besar Bahasa Indonesia
(KBBI) fonem merupakan satuan bunyi terkecil yang mampu menunjukkan kontras makna. Misal /h/ adalah fonem karena membedakan makna kata harus dan arus, sedangkan /b/ dan /p/ adalah dua fonem yg berbeda karena bara dan para memiliki makna yang berbeda.
3
Pemrosesan Suara
Sinyal suara merupakan gelombang longitudinal yang tercipta dari tekanan udara yang berasal dari paru-paru yang berjalan melewati lintasan suara menuju mulut dan rongga hidung dengan bentuk artikulator yang senantiasa berubah (Al-Kaidi 2007, diacu dalam Buono 2009).
Secara umum sinyal dapat diklasifikasikan dalam beberapa jenis yaitu : sinyal waktu kontinu, sinyal waktu diskret, sinyal nilai kontinu, sinyal nilai diskret, sinyal random dan sinyal non-random. Sinyal waktu kontinu atau sinyal analog merupakan sinyal yang belum melalui proses apapun sedangkan sinyal nilai diskret merupakan sinyal analog yang telah melalui proses sampling, kuantisasi, dan coding (Proakis & Manolakis 1996).
Pemrosesan suara merupakan teknik menransformasi gelombang longitudinal menjadi informasi berarti yang diinginkan (Buono 2009). Proses transformasi terdiri atas beberapa tahap yaitu digitalisasi sinyal analog, ekstrasi ciri dan pengenalan pola untuk klasifikasi seperti diilustrasikan pada Gambar 3.
Gambar 3 Proses transformasi sinyal analog menjadi informasi (Buono 2009).
Di dalam proses digitalisasi sinyal analog terdapat dua teknik yaitu sampling dan kuantisasi. Sampling merupakan proses mengambil nilai-nilai sinyal pada titik- titik diskret sepanjang variabel waktu dari sinyal
waktu kontinu (sinyal analog) sehingga didapat sinyal waktu diskret. Jumlah titik- titik yang diambil setiap detik disebut sampling rate. Misalkan sinyal analog di-sampling dengan sampling rate sebesar 11000Hz, ini berarti setiap detik di-sampling sebanyak 11000 kali. Dalam proses sampling, untuk menghindari aliasing maka perlu diperhatikan kriteria Nyquist rate yang menyatakan bahwa sebuah sinyal harus memiliki sampling rate yang lebih besar dari 2Fmax. Komponen frekuensi untuk kelompok sinyal suara berada di bawah 3000 Hz, sedangkan untuk kelompok sinyal radio frekuensinya mencapai 5MHz (Proakis & Manolakis 1996).
Kuantitasi adalah proses memetakan nilai- nilai dari nilai sinyal kontinu menjadi nilai- nilai yang diskret sehingga didapatkan sinyal nilai diskret. Kuantisasi dilakukan dengan cara membulatkan nilai hasil sampling ke nilai terdekat (rounding) sehingga menghasilkan sinyal suara digital. Ekstrasi ciri merupakan proses untuk menentukan penciri dari sebuah objek. Pengenalan pola untuk klasifikasi dapat dilakukan dengan beberapa metode pengklasifikasian yang ada.
Konversi Sinyal Analog ke Sinyal Digital
Langkah- langkah proses konversi dari sinyal analog ke sinyal digital, yaitu (Proakis & Manolakis 1996) :
1. Sampling
Sampling merupakan konversi dari sinyal waktu kontinu ke sinyal waktu diskret yang didapat dengan mengambil samples dari sinyal waktu kontinu pada waktu diskret seketika itu juga. Dengan demikian, jika xa
(t) adalah input untuk sampler, maka output–nya adalah
xa(nT) = x (n) -∞<n<∞ ,
dengan x(n) adalah sinyal waktu diskret yang diperoleh dengan mengambil sample dari sinyal analog setiap T sekon dan T adalah sampling interval. Ilustrasi proses konversi ditunjukkan oleh Gambar 4.
xa (t) x (n)= xa(nT)
Gambar 4 Ilustrasi proses konversi sinyal analog menjadi sinyal waktu diskret.
Fs = 1/T sampler Sinyal analog Sinyal waktu diskret
4 2. Kuantisasi
Dalam kuantisasi terjadi proses konversi dari waktu diskret (sinyal nilai kontinu) ke waktu diskret (sinyal nilai diskret). Sinyal waktu diskret yang memiliki nilai bersifat diskret disebut sebagai sinyal digital. Nilai dari setiap sample sinyal oleh nilai yang diperoleh dari finite set dari nilai yang mungkin. Perbedaan antara sample yang tak terkuantisasi x(n) dengan output yang terkuantisasi xq (n) disebut dengan error
kuantisasi. 3. Coding
Dalam proses coding, setiap nilai diskret xq
(n) direpresentasikan oleh rangkaian b- bit biner.
Ekstrasi Ciri
Ekstrasi ciri merupakan proses untuk menentukan suatu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu. Di dalam pemrosesan suara, ciri yang biasa dipergunakan adalah nilai koefisien cepstral dari sebuah frame. Salah satu teknik ekstrasi ciri sinyal suara dengan kinerja yang baik adalah Mel-Frequency Cepstral Coefficient (MFCC). MFCC didasarkan pada variasi frekuensi batas pendengaran manusia yaitu 20Hz sampai 20000Hz. Diagram blok proses MFCC dalam mengekstrak sinyal suara dapat dilihat pada Gambar 5
Gambar 5 Diagram blok proses MFCC (Do 1994).
Berikut ini adalah proses MFCC (Do 1994) : Frame blocking
Setelah sinyal analog didigitalkan dengan sampling dan kuantisasi, dilakukan proses frame blocking pada sinyal digital. Dalam proses ini sinyal suara dibagi ke dalam beberapa frame dengan lebar tertentu yang saling tumpang tindih (overlap). Keadaan overlap antar frame ini ditujukan agar tidak ada sedikitpun sinyal yang hilang.
Windowing
Pada setiap frame dari hasil frame blocking dilakukan windowing. Proses windowing dilakukan dengan mengalikan sinyal digital dengan fungsi window tertentu yang berukuran sama dengan ukuran frame. Tujuan proses ini adalah untuk meminimalisasi distorsi (ketidakberlanjutan sinyal) antar frame. Salah satu fungsi window yang memiliki formula yang sederhana adalah window Hamming. Window Hamming didefinisikan dalam persamaan berikut:
W(n) = 0,54-0,46cos , 0 ≤ n ≤ N-1 , dengan N adalah panjang window.
Fast Fourier Transform (FFT)
FFT merupakan salah algoritme Discrete Fourier Transform (DFT) yang berguna untuk mengonversi sinyal dari domain waktu menjadi domain frekuensi. Fungsi FFT didefinisikan sebagai berikut:
xn =
∑
.
. . . ,dengan n = 0,1,2…, N-1
Hasil akhir dari proses ini seringkali ditujukan sebagai spectrum atau periodogram.
Mel-Frequency Wrapping,
Setiap orang memiliki persepsi yang berbeda terhadap penerimaan suara sehingga tidak dapat diukur dalam skala linear pada frekuensi di atas 1000Hz. Penerimaan untuk frekuensi rendah, filter yang digunakan menggunakan skala linear, sedangkan untuk frekuensi tinggi (>1000Hz), filter dibentuk dengan skala logaritma. Persamaan berikut menunjukkan hubungan antara skala mel dengan frekuensi dalam Hz.
Proses wrapping terhadap sinyal dalam domain frekuensi dilakukan menggunakan persamaan berikut:
dengan i = 1, 2, 3,… M (jumlah filter segitiga) dan Hi(k) adalah nilai filter segitiga ke I untuk
frekuensi akustik sebesar k. Mel-frequency wrapping Cepstrum mel spectrum FFT speech Windowing frame continous Frame blocking sp e ct ru m mel spectrum Fmel =
,
5 Cepstrum
Langkah terakhir adalah mengonversi mel spectrum kembali ke domain waktu. Hasilnya disebut mel frequency cepstrum coefficients (MFCC). Karena koefisien mel cepstrum adalah nilai real maka dapat dikonversi ke dalam domain waktu dengan Discrete Cosine Transform (DCT). Nilai koefisien MFCC dapat diperoleh menggunakan transformasi kosinus dengan persamaan sebagai berikut :
dengan j= 1, 2, 3,…, K.
K merupakan jumlah koefisien MFCC yang diinginkan dan M adalah jumlah filter.
Jaringan Syaraf Tiruan
Menurut Fausset (1994), jaringan syaraf tiruan (JST) adalah sistem pemroses informasi yang memiliki karakteristik mirip dengan jaringan syaraf biologis. Neural Network merupakan sistem adaptif yang dapat mengubah strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun internal yang mengalir melalui jaringan tersebut. Pemodelan secara matematisnya didasarkan pada beberapa asumsi, yaitu (Fausset 1994) :
1. Pemrosesan informasi terjadi pada banyak elemen sederhana yang disebut neuron 2. Sinyal-sinyal dikirimkan di antara
neuron-neuron melalui penghubung.
3. Setiap penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal.
4. Setiap neuron menggunakan fungsi aktivasi (biasanya bukan fungsi linear) ke jaringan input untuk menentukan sinyal output. JST ditentukan oleh 3 hal, yaitu pola hubungan antar neuron (disebut arsitektur jaringan), metode untuk menentukan bobot penghubung (disebut metode training/ learning) dan fungsi aktivasi (Siang 2005).
Arsitektur JST
JST memiliki beberapa arsitektur jaringan yang sering digunakan dalam berbagai aplikasi. Jaringan single layer dan jaringan multi layer yang dapat dilihat pada Gambar 3 dan 4, merupakan contoh dari jaringan feedforward. Jaringan ini disebut sebagai jaringan feedforward karena sinyal mengalir dari unit input ke unit output dalam arah maju.
Sementara itu, jaringan kompetitif pada Gambar 5 merupakan contoh dari jaringan recurrent, dimana ada neuron output yang memberikan sinyal pada unit input. Berikut beberapa arsitektur jaringan yang sering digunakan dalam JST, antara lain :
1. Jaringan Single Layer
Jaringan single layer terdiri atas satu lapisan input dan satu lapisan output dengan setiap neuron yang saling terhubung. Dalam jaringan ini, semua unit input dihubungkan dengan semua unit output dengan bobot yang berbeda- beda. Tidak ada unit input yang dihubungkan dengan unit input lainnya. Demikian pula dengan unit output, tidak ada unit output yang terhubung dengan unit output yang lain (Fausett 1994). Selama proses pelatihan, bobot tersebut dimodifikasi untuk meningkatkan keakuratan hasil. Arsitektur jaringan single layer dapat dilihat pada Gambar 6.
Gambar 6 Arsitektur jaringan single layer (Kusumadewi 2003).
2. Jaringan Multi Layer
Jaringan multi layer merupakan perluasan dari jaringan single layer. Selain terdapat lapisan input dan output, pada jaringan ini juga terdapat hidden layer. Pada lapisan ini, dimungkinkan pula ada beberapa hidden layer (Siang 2005). Jaringan multi layer dapat menyelesaikan masalah yang lebih kompleks dibandingkan dengan jaringan single layer, tetapi proses pelatihan menjadi lebih sulit (Fausett 1994). Arsitektur jaringan multi layer dapat dilihat pada Gambar 7.
,
Nilai output Lapisan output Matriks bobot Lapisan input Nilai input X1 X2 X3 Y1 Y26 Gambar 7 Arsitektur jaringan multi layer
(Kusumadewi 2003).
3. Jaringan Competitive Layer
Jaringan ini merupakan salah satu model jaringan tanpa supervisi. Dalam model ini, neuron dipaksa untuk berkompetisi sehingga hanya satu di antaranya yang menjadi aktif (Siang 2005). Prinsip ini sering disebut winner takes all. Salah satu model yang menggunakan dasar kompetisi adalah MaxNet. Jaringan ini terdiri atasm titik yang semuanya saling berhubungan dengan bobot simetris. Bobot antar titik berbeda adalah -ɛ. Bobot suatu titik ke dirinya sendiri = 1 (Fausett 1994). Arsitektur jaringan competitive layer dapat dilihat pada Gambar 8.
Gambar 8 Arsitektur jaringan competitive layer.
Metode Pelatihan
Berdasarkan cara memodifikasi bobotnya, model jaringan dibagi menjadi 2, yaitu (Fausett 1994) :
1. Pelatihan dengan Supervisi
Dalam pelatihan ini, terdapat sejumlah pasangan data yaitu input dan target output yang dipakai untuk melatih jaringan sampai diperoleh bobot yang diinginkan (Siang 2005). Contoh model yang masuk dalam kategori ini adalah model Hebbian, Perceptron, ADALINE, Boltzman, Hopfield, Backpropagation, dan lain- lain.
2. Pelatihan tanpa Supervisi
Pada pelatihan ini, rangkaian dari vektor input disediakan, tetapi vektor target tidak ditentukan (Fausett 1994). Dengan kata lain, tidak ada guru yang mengarahkan dalam proses pelatihan. Jaringan memodifikasi bobot, sehingga vektor input yang paling serupa akan Dengan demikian, perubahan bobot jaringan dilakukan berdasarkan parameter tertentu dan jaringan dilakukan berdasarkan parameter tertentu. Contoh model yang masuk dalam kategori ini adalah model Competitive, Hebbian, Kohonen, LVQ, dan lain- lain.
Fungsi Aktivasi
Dalam Backpropagation, fungsi aktivasi yang digunakan harus memenuhi beberapa syarat yaitu : kontinu, terdeferensiasi dengan mudah dan merupakan fungsi yang tidak turun. Fungsi aktivasi yang sering digunakan adalah fungsi sigmoid biner dan fungsi sigmoid bipolar. Fungsi sigmoid biner memiliki range (0,1) sedangkan fungsi sigmoid bipolar memiliki range (-1,1).
Fungsi Sigmoid Biner f (x) =
( )
dengan turunannya f ’ (x) = f (x)[1 - f (x)] Fungsi Sigmoid Bipolar
f (x) = ( ) ( ) dengan turunannya f ’ (x) = [1 + f (x)][1 - f (x)] Nilai output Lapisan output Matriks bobot kedua Lapisan tersembunyi Matriks bobot Lapisan input Nilai input X1 X2 X3 Z1 Z2 Y
7
Inisialisasi Bobot dan Bias
Bobot awal akan memengaruhi apakah jaringan mencapai titik minimum lokal atau global, dan seberapa cepat konvergensinya. Nilai bobot awal tidak boleh terlalu besar karena nilai turunan fungsi aktivasinya akan menjadi kecil. Nguyen dan Widrow mengusulkan cara membuat inisialisasi bobot dan bias ke unit tersembunyi sehingga menghasilkan iterasi yang lebih cepat.
Algoritme inisialisasi Nguyen-Widrow adalah sebagai berikut :
- Hitung harga faktor penskalaan = 0.7 p1/n
dengan:
= faktor skala
n = jumlah neuron lapisan input p = jumlah neuron lapisan tersembunyi - Inisialisasi semua bobot (v ji (lama) dengan
bilangan acak dalam interval [-0.5, 0.5] - Bobot yang dipakai sebagai inisialisasi
) ( ) ( ) ( lama v lama v baru v j ji ji
- Bias yang dipakai sebagai inisialisasi vj0 = bilangan acak antara - dan .
Resilient Backpropagation
Metode standar Backpropagation seringkali terlalu lambat untuk keperluan praktis, sehingga dilakukan beberapa modifikasi terhadap standar Backpropagation dengan cara mengganti fungsi pelatihannya. Secara umum, terdapat 2 kategori dalam modifikasi. Kategori pertama adalah metode dengan menggunakan teknik heuristik yang dikembangkan dari metode penurunan tercepat yang dipakai dalam standar Backpropagation. Beberapa modifikasi yang termasuk dalam kategori pertama adalah Backpropagation dengan momentum, variabel laju pemahaman, dan resilient
Backpropagation. Kategori kedua adalah
menggunakan metode optimasi numerik selain penurunan tercepat. Beberapa metode untuk modifikasi kategori kedua ini adalah metode gradien conjugate, quasi Newton, dan lain- lain (Siang 2005).
Resilient Backpropagation atau biasa
disebut RPROP merupakan salah satu modifikasi dalam Backpropagation untuk
mempercepat laju pembelajaran. RPROP dengan melakukan adaptasi langsung terhadap nilai bobot berdasarkan informasi dari gradien lokalnya (Riedmiller & Brown 1992, diacu dalam Engelbrecht 2007).
Penentuan bobot diimplementasikan dalam bentuk reward atau punishment, sebagai berikut : jika turunan parsial (atau ) dari bobot (atau ) berubah tanda, nilai update bobot Δ (Δ ) berkurang dengan faktor . Alasan untuk penalty ini karena update nilai bobot terakhir terlalu besar, sehingga menyebabkan algoritme melompat ke minimum lokal. Dengan kata lain, jika turunan dapat mempertahankan tanda, nilai update akan bertambah atau meningkat dengan faktor untuk mempercepat konvergensi. (Riedmiller dan Brown 1993, diacu dalam Engelbrecht 2007). Untuk lebih jelasnya algoritme pelatihan RPROP dapat dilihat pada Lampiran 1.
Nilai dari ∆ menunjukkan bobot awal untuk itu dipilih nilai yang kecil, misal ∆ = 0,1. Kinerja dari RPROP tidak sensitif terhadap nilai ∆ (Riedmiller dan Brown, 1993 diacu dalam Engelbrecht 2007). Parameter ∆ dan ∆ berturut- turut menentukan batas atas dan batas bawah pada saat peng-update-an. Riedmiller dan Braun menyarankan nilai untuk faktor turun = 0.5, dan = 1.2 (Engelbrecht 2007).
8
METODE PENELITIAN
Penelitian ini dilakukan dalam beberapa tahap. Tahap-tahap tersebut dapat dilihat pada Gambar 9.
Gambar 9 Metode penelitian.
Studi Pustaka
Dalam tahap ini, kegiatan yang dilakukan adalah mengumpulkan informasi dan literatur yang terkait dengan penelitian. Informasi tersebut didapatkan dari jurnal, internet, buku, dan penelitian lain.
Pengambilan Data Suara
Pengambilan data suara dilakukan dengan frekuensi sample (Fs) 11 KHz selama 3 detik untuk setiap kata. Data berasal dari satu pembicara. Total kata yang digunakan ada 70 kata yang terdiri atas 50 kata sebagai daftar kata dan 20 kata yang masing-masing diulang sebanyak 10 ulangan. Kamus kata yang terdiri
atas 50 kata diambil dari kombinasi fonem yang digunakan dalam penelitian. Fonem yang digunakan ada 10 fonem yang terdiri atas 4 fonem vokal dan 6 fonem konsonan. Fonem vokal yang digunakan yaitu a, i, u, dan e. Fonem konsonan yang digunakan yaitu j, k, l, m, n, dan s.
Tabel 1 Daftar 20 kata sebagai data latih
No Kata Fonem Vokal Fonem Konsonan 1 ALAM /a/ /l/, /m/ 2 AMAL /a/ /l/, /m/
3 JANJI /a/, /i/ /j/, /n/ 4 JENIS /e/, /i/ /j/, /n/, /s/ 5 JINAK /a/, /i/ /j/, /k/, /n/ 6 KAJI /a/, /i/ /j/, /k/ 7 KAKI /a/, /i/ /k/ 8 KAKU /a/, /u/ /k/ 9 KENA /a/, /e/ /k/, /n/ 10 LUSA /a/, /u/ /l/, /s/ 11 MAKAN /a/ /k/, /m/, /n/ 12 MILIK /i/ /k/, /l/, /m/ 13 MINUM /i/, /u/ /m/, /n/ 14 MUSIM /i/, /u/ /m/, /s/ 15 NENEK /e/ /k/, /n/ 16 NUSA /a/, /u/ /n/, /s/ 17 SEMAK /a/, /e/ /k/, /m/, /s/ 18 SENAM /a/, /e/ /m/, /n/, /s/ 19 SUKA /a/, /u/ /k/, /s/ 20 SULAM /a/, /u/ /l/, /m/, /s/
Berdasarkan Tabel 1 dapat dilihat bahwa fonem yang digunakan untuk pemodelan sebanyak 10 fonem asli yang terdiri atas 4 fonem vokal dan 6 fonem konsonan. Dari 20 kata pada Tabel 1 diperoleh 200 kata sinyal suara. Sebanyak 140 kata sinyal suara tersebut digunakan sebagai data latih sedangkan 60 kata sinyal suara yang lain digunakan sebagai data uji.
Selain 20 kata yang digunakan untuk pemodelan, dibuat juga 50 kata lain di luar kata yang dimodelkan yang merupakan kombinasi dari fonem-fonem yang digunakan dalam pemodelan. Pada 50 kata lain di luar kata yang dimodelkan ini juga dilakukan pengujian untuk melihat kinerja dari RPROP dalam mengenali pola input yang serupa tapi tidak identik dengan pola yang digunakan selama pelatihan. Berikut daftar 50 kata di luar data latih dapat dilihat pada Tabel 2. RPROP Cut silent Pemodelan JST Praproses Data Latih Mulai Studi Pustaka Pengambilan Data Data Uji Daftar Kata Pengujian Hasil Penghitungan Akurasi Dokumentasi Selesai Transkripsi kata kata
9 Tabel 2 Daftar 50 kata di luar data latih
Kata AKAN LUKA ANAK MAKA ASAM MALAM ENAK MALAS IKAN MANIS JAM MASA JAMU MAU JAS MEJA JASA MIMIK JENAKA MUSIK JIKA NAIK JUAL NAKAL KAIN SAJI KAKAK SAKA KAMI SAKAU KASA SAMA KAU SAUS KELAS SEKSI KINA SELAM KUAS SELUK KUMAN SEMI LAJU SENI LAKU SUKMA LEMAS SUSUK LIKU SUSUN Praproses
Data suara yang diambil masih berupa data suara kotor karena terdapat jeda di awal dan akhir suara sehingga dilakukan proses pemotongan data suara (cutting silent) terlebih dahulu seperti diilustrasikan pada Gambar 10.
Gambar 10 Pemotongan data suara.
Tahap praproses selanjutnya adalah mengubah data suara yang telah dibersihkan tersebut ke dalam bentuk vektor. Kemudian dilakukan ekstrasi ciri dengan metode MFCC untuk mendapatkan vektor penciri dari sinyal suara. Terdapat 5 parameter yang digunakan dalam proses ekstrasi ciri menggunakan metode MFCC yaitu input, sampling rate, time frame, overlap, dan koefisien cepstral. Pada penelitian ini digunakan sampling rate sebesar 11000Hz. Menurut Do (1994), input suara sebaiknya direkam dengan sampling rate di atas 10000 untuk meminimalkan efek aliasing saat proses konversi dari sinyal analog ke sinyal digital. Efek aliasing merupakan suatu efek yang menimbulkan bentuk suara yang sama apabila
dibangkitkan dengan frekuensi pembangkitan berbeda. Parameter lain yaitu time frame 30 ms, dimana terjadi overlap 50%, koefisien cepstral yang digunakan adalah 13 sehingga masing-masing frame akan menghasilkan vektor ciri Ot yang terdiri atas 13 koefisien cepstral.
Setelah didapatkan hasil ekstrasi, langkah berikutnya adalah melakukan segmentasi vektor ciri sesuai dengan fonem pada setiap kata kemudian menggabungkan vektor-vektor tersebut berdasarkan fonemnya.
Arsitektur JST Resilient Backpropagation
Tabel 3 Struktur JST RPROP Karakteristik Spesifikasi Arsitektur 1 hidden layer Jumlah input neuron Dimensi hasil
MFCC Jumlah hidden neuron 100, 1000 Jumlah output neuron 10 (definisi target) Inisialisasi bobot Nguyen-Widrow Fungsi pembelajaran RPROP
Fungsi aktivasi Sigmoid biner Toleransi galat 0.0001
Learning rate 0.01
Maksimum epoch 5000
Pada RPROP ada banyak parameter yang dapat diatur, tetapi sebagian besar dari parameter-parameter tersebut dapat digunakan dengan nilai yang diatur secara default. Berdasarkan hasil penelitian (Riedmiller & Braun 1993, diacu dalam Susanto 2007) bahwa parameter- parameter tersebut tidak memengaruhi waktu pelatihan, sehingga pada penelitian ini digunakan nilai default pada parameter-parameter yang diperlukan. Nilai ∆ yang digunakan adalah 0,1. Nilai ∆ dan ∆ masing-masing sebesar 50 dan 0,1. Untuk parameter dan digunakan nilai 1,2 dan 0,5.
Target didefinisikan pada Tabel 4. Nilai 1 merepresentasikan fonem yang dikenali. Misal, untuk target dengan nilai elemen pertama 1 dan elemen yang lainnya 0 (1000000000) maka target tersebut menunjukkan fonem A.
10 Tabel 4 Definisi target JST untuk 10 fonem
No Target Representasi Fonem 1 1 0 0 0 0 0 0 0 0 0 Fonem A 2 0 1 0 0 0 0 0 0 0 0 Fonem I 3 0 0 1 0 0 0 0 0 0 0 Fonem U 4 0 0 0 1 0 0 0 0 0 0 Fonem E 5 0 0 0 0 1 0 0 0 0 0 Fonem J 6 0 0 0 0 0 1 0 0 0 0 Fonem K 7 0 0 0 0 0 0 1 0 0 0 Fonem L 8 0 0 0 0 0 0 0 1 0 0 Fonem M 9 0 0 0 0 0 0 0 0 1 0 Fonem N 10 0 0 0 0 0 0 0 0 0 1 Fonem S Pelatihan Sistem
JST dimodelkan dengan menggunakan metode pelatihan Resilient Backpropagation dengan parameter yang telah dijelaskan sebelumnya. Pelatihan dilakukan dengan 2 model, model pertama dengan hidden neuron sebanyak 100 dan model kedua dengan hidden neuron sebanyak 1000. Banyaknya neuron pada output layer dibuat 10 untuk merepresentasikan fonem yang akan dimodelkan. Learning rate (laju pemahaman) dipilih 0.01 yang merupakan nilai default. Semakin besar nilai learning rate, semakin cepat pula proses pelatihan. Akan tetapi jika α terlalu besar, maka algoritme menjadi tidak stabil dan mencapai titik minimum lokal (Siang 2005). Toleransi galat yang digunakan adalah 0.0001. Jika besar kesalahan (error) yang dihitung dengan mean square error (mse) lebih kecil dari toleransi yang telah ditentukan maka iterasi dihentikan. Umumnya pelatihan dengan Backpropagation tidak akan menghasilkan mse = 0 apalagi jika data pelatihan yang digunakan sangat banyak. Pelatihan akan dihentikan jika besar mse lebih kecil dari toleransi yang telah ditentukan atau jika jumlah epoch pelatihan sudah mencapai epoch maksimum.
Pengujian
Setelah pelatihan selesai, kemudian dilakukan pengenalan pola. Dalam hal ini, hanya propagasi maju yang digunakan untuk menentukan keluaran jaringan. Pengujian dari model yang telah dibangun dilakukan dengan menggunakan data uji dan 50 kata di luar kata yang digunakan dalam pelatihan. Hasil dari pengujian berupa transkripsi kata. Dengan demikian, untuk mengubah transkripsi kata menjadi kata yang diinginkan dilakukan secara manual oleh 5 orang penguji.
Metode pengujian yang dilakukan dengan memberikan kuesioner hasil transkripsi kata kepada masing-masing penguji. Kemudian para penguji tersebut menentukan kata yang tepat untuk masing-masing transkripsi kata yang ada. Sebelumnya penguji diberikan kamus kata sebanyak 70 kata yang merupakan kata- kata yang diinginkan dari transkripsi kata yang diberikan kepada para penguji. Hasil dari pengujian manual ini yang akan diambil untuk menghitung akurasi dari masing- masing kata tersebut.
Penghitungan Akurasi
Akurasi dari masing-masing kata dari dua buah model yang dibangun, dihitung dari hasil prediksi kata dari 5 orang penguji melalui kuesioner.
Lingkungan Pengembangan
Sistem dibangun dan diuji menggunakan
perangkat lunak dan perangkat keras dengan spesifikasi :
1. Perangkat keras
Prosesor AMD Turion 1.8GHz RAM 2.5 GB
Kapasitas Harddisk 80 GB
Headset
2. Perangkat lunak
Sistem operasi Windows 7 Microsoft Excel 2007 MATLAB versi 7.7.0
HASIL DAN PEMBAHASAN Hasil Pengambilan Data
Data suara yang digunakan berjumlah 250 kata yang terdiri atas 70 kata yaitu 200 kata sinyal suara yang dilatih sebelumnya dan 50 kata sinyal suara yang tidak dilatih sebelumnya. Data tersebut disimpan dalam bentuk .wav. Pada data tersebut masih terdapat jeda sehingga dilakukan pemotongan data suara terlebih dahulu. Untuk 20 kata direkam dengan pengulangan 10 kali untuk masing-masing kata sehingga menghasilkan 200 kata sinyal suara. Kemudian 200 kata sinyal suara ini digunakan sebagai data latih dan data uji dengan perbandingan 70 % dan 30 %. Dengan demikian, 140 kata sinyal suara digunakan untuk pemodelan dan 60 kata sinyal suara yang lain digunakan untuk pengujian. Untuk 50 kata sinyal suara yang lain hanya direkam satu kali untuk masing-masing kata dan selanjutnya digunakan untuk menguji model lebih lanjut. Pengujian lebih lanjut dengan 50 kata sinyal
11 suara di luar dari kata yang sudah dilatih
dimaksudkan untuk melihat kinerja dari model yang dihasilkan jika diberikan kata di luar dari data latih.
Sebelum dilakukan pemodelan dengan Resilient Backpropagation, 140 kata sinyal suara tersebut diekstrasi dengan metode MFCC yang dimplementasikan menggunakan fungsi yang sudah tersedia yang dikembangkan oleh Slanley pada tahun 1998. Seperti yang telah dijelaskan sebelumnya, frame yang digunakan sebesar 30 ms dimana terjadi overlap antar frame sebesar 50 % dan koefisien cepstral yang digunakan adalah 13 untuk tiap frame.
Pelatihan dan Pengujian
Data hasil praproses 140 kata sinyal suara berupa matriks dengan ukuran 13 x n karena koefisien cepstral yang digunakan dalam proses MFCC adalah 13. Sebelum data praproses tersebut digunakan untuk pelatihan, data tersebut disegmentasi terlebih dahulu kemudian dikelompokkan berdasarkan fonem yang digunakan. Dengan demikian, data menjadi 10 kelompok fonem. Hal ini dilakukan untuk memudahkan dalam proses memasangkan data pelatihan dengan target yang ingin dicapai. Pelatihan dilakukan dengan parameter- parameter yang telah dijelaskan sebelumnya sehingga didapatkan 2 model JST RPROP.
Data yang digunakan untuk pengujian adalah 60 kata sinyal suara yang merupakan 30% dari sinyal kata untuk pemodelan. Selain itu untuk melihat lebih jauh kinerja dari RPROP, pengujian juga dilakukan dengan 50 kata lain yang merupakan sinyal kata di luar kata yang dilatih. Pengujian dilakukan dengan 2 model yang telah didapat dari proses pelatihan Resilient Backpropagation. Output dari sistem berupa sequence dari nilai- nilai target yang merepresentasikan fonem. Ilustrasi dari output sistem sebagai berikut :
Rangkaian fonem-fonem tersebut disebut transkripsi kata. Proses transformasi dari transkripsi kata menjadi sebuah kata dilakukan secara manual oleh 5 orang penguji yang terdiri atas 2 orang wanita dan 3 orang pria. Ilustrasi transformasi dari transkripsi kata menjadi kata sebagai berikut
Tidak semua transkripsi kata yang dihasilkan memiliki pola yang tepat seperti ilustrasi berikut :
AAALLLLLLLLAAAAAEAAAAASMMM
Oleh karena itu proses pengenalan kata dari transkripsi kata yang dihasilkan, masih dilakukan secara manual melalui kuesioner yang diberikan kepada 5 orang. Bentuk kuesioner yang diberikan kepada 5 penguji dapat dilihat pada Lampiran 2, 3, 4, dan Lampiran 5.
Di dalam kuesioner terdapat 60 kata sinyal suara, kemudian kelima orang penguji memberikan prediksi kata yang sesuai dengan siyal kata yang dihasilkan. Prediksi kata yang dilakukan oleh 5 orang penguji tersebut dapat dilihat pada Lampiran 6, 7, dan 8. Perbandingan akurasi yang didapat dari dua model RPROP tersebut dapat memperlihatkan bagaimana kinerja RPROP dalam mengenali pola kata yang dipakai dalam pelatihan dan memberikan respon yang benar untuk pola input yang serupa tapi tidak identik dengan pola yang digunakan selama pelatihan. Dalam hal hal ini pola input serupa maksudnya adalah pola dari 50 kata lain di luar kata yang dilatih. Karena kata lain yang terdiri atas 50 kata ini merupakan kata- kata yang berasal dari kombinasi fonem yang ada pada kata- kata untuk pelatihan.
Akurasi Pengujian
Grafik akurasi yang didapat dari model pertama yaitu dengan 100 hidden neuron dapat
dilihat pada Gambar 11.
MMMAALLLAAAMMM
MALAM 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 MMMMAA
12 Gambar 11 Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang dilatih dengan Model Pertama.
Dari model RPROP dengan 100 hidden neuron didapat rata-rata akurasi seluruh kata untuk kata yang dilatih 75%.
Grafik akurasi rata-rata yang didapat dari model kedua yaitu dengan 1000 hidden neuron dapat dilihat pada Gambar 12.
Gambar 12 Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang dilatih dengan Model Kedua.
Dari model RPROP dengan 1000 hidden neuron didapat rata- rata akurasi seluruh kata untuk kata yang dilatih sebesar 93%. Akurasi rata-rata dari kata yang digunakan sebagai data latih dengan model RPROP 1000 hidden neuron lebih tinggi dibandingkan dengan model RPROP 100 hidden neuron.
Penghitungan akurasi rata-rata juga dilakukan terhadap 50 kata di luar kata yang dimodelkan. Hasil dari kuesioner untuk 50 kata di luar kata yang dilatih ini dapat dilihat pada Lampiran 7 dan 8. Masing-masing untuk model pertama dan model kedua. Dari hasil kuesioner tersebut, dihitung akurasi rata-rata dari 50 kata tersebut. Akurasi rata-rata dari 50 kata untuk
0% 20% 40% 60% 80% 100% 120%
Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang digunakan dalam pemodelan
0% 20% 40% 60% 80% 100% 120%
Akurasi rata-rata setiap kata dari 5 penguji untuk 20 kata yang digunakan dalam pemodelan
13 model 1 mencapai 61% dan untuk model kedua
mencapai 62%. Akurasi antara dua model yang dibuat perbedaannya tidak signifikan untuk 50 kata di luar kata yang dilatih ini. Perbandingan akurasi rata-rata antara dua model RPROP tersebut dapat dilihat pada Gambar 13.
Gambar 13 Grafik perbandingan akurasi keseluruhan kata dari 2 model RPROP
Dari Gambar 13 dapat dilihat bahwa akurasi rata-rata keseluruhan kata yang dilatih dengan dua model RPROP tersebut memiliki perbedaan yang signifikan sebesar 18%. Sedangkan untuk kata lain di luar kata yang dilatih, selisih akurasi keseluruhan dari dua model hanya 1 %. Hal ini berarti telah terjadi overfitting pada model dengan 1000 hidden neuron. Pada model RPROP yang kedua ini, akurasi untuk kata yang dilatih sangat tinggi mencapai 93%, namun untuk kata lain di luar kata yang dilatih, hanya 62%. Kejadian overfitting ini menyebabkan model kedua ini terlalu ekslusif untuk data yang dilatih sehingga kemampuan generalisasi untuk data di luar data latih menjadi kurang baik.
KESIMPULAN DAN SARAN Kesimpulan
Dari penelitian ini, akurasi rata-rata keseluruhan kata yang telah dilatih mencapai lebih dari 70%. Untuk model pertama dengan 100 hidden neuron akurasi rata-rata keseluruhan kata adalah 75%, sedangkan model kedua dengan 1000 hidden neuron, akurasi rata-rata keseluruhan katanya mencapai 93%. Hal ini berarti kedua model JST yang dihasilkan memiliki kemampuan memorisasi yang tinggi. Untuk 50 kata lain di luar kata- kata yang digunakan dalam pelatihan, akurasi rata-rata dari model pertama dengan 100 hidden neuron adalah 61% dan untuk model kedua, akurasi rata-rata keseluruhan kata tersebut adalah 62%. Hal ini berarti, kemampuan generalisasi atau kemampuan untuk mengenali pola dari data di luar data yang dilatih dari kedua model tersebut tidak berbeda jauh.
Pada model kedua dengan JST RPROP 1000 hidden neuron, akurasi rata-rata keseluruhan kata yang digunakan untuk pelatihan sangat tinggi, yaitu 93%. Namun, kemampuan yang terlalu akurat untuk data yang dilatih menyebabkan model tersebut terlalu ekslusif sehingga akan menghasilkan output yang baik untuk data yang telah dilatih saja. Kejadian inilah yang disebut overfitting, yang merupakan suatu masalah dalam JST karena hal yang ingin dicapai dari JST bukan hanya dalam mengenali pola yang dilatih sebelumnya tetapi juga untuk mengenali pola yang serupa di luar pola yang sudah dilatih. Terjadinya overfitting pada model kedua disebabkan model terlalu besar (dengan 1000 hidden neuron). Penggunaan hidden neuron yang terlalu besar belum tentu akan memberikan hasil yang lebih baik dari hidden neuron yang lebih sedikit.
Saran
Penelitian ini masih perlu untuk dikembangkan karena terdapat keterbatasan yang membuat sistem yang dihasilkan belum memungkinkan untuk digunakan dalam kondisi nyata. Beberapa saran untuk penelitian selanjutnya adalah :
1. Pada penelitian ini, kata-kata yang digunakan masih terbatas pada kombinasi 10 fonem, sehingga dapat ditambahkan fonem-fonem bahasa Indonesia yang lain sehingga pengenalan kata menjadi lebih luas.
2. Fonem yang digunakan bukan hanya fonem asli, tetapi juga fonem transisi.
3. Untuk fonem yang memiliki lebih dari satu cara pengucapan, sebaiknya fonemnya dikelompokkan berbeda. Seperti fonem /e/, memiliki dua cara pengucapan yang terlihat dari kata ‘nenek’ dan ‘selam’.
4. Agar pemodelan memberikan hasil yang lebih baik, sebaiknya jenis suara yang digunakan lebih banyak. Pengambilan suara dapat dilakukan dengan pembicara yang lebih banyak dan jenis kelamin yang berbeda sehingga pengenalan kata menjadi lebih variatif.
DAFTAR PUSTAKA
Buono, A. 2009. Representasi Nilai HOS dan Model MFCC sebagai Ekstrasi Ciri pada Sistem Identifikasi Pembicara di Lingkungan Ber-noise Menggunakan HMM. [Disertasi]. Depok: Program Studi Ilmu Komputer Universitas Indonesia.
0% 20% 40% 60% 80% 100% kata yang dilatih kata lain Model 1 Model 2 93% 75% 62% 61%
14 Do, MN. 1994. DSP Mini-Project: An
Automatic Speaker Recognition Sistem. Engelbrecht, AP. 2007. Computational
Intelligence : An Introduction. England: Wiley.
Fausett, L. 1994. Fundamentals of Neural Networks. New Jersey: Prentice Hall Inc. Jurafsky, D. dan Martin JH. 2007. Speech and
Language Processing: An Introduction to
Natural Language Processing,
Computational Linguistic, and Speech Recognition. New Jersey: Prentice Hall. Kusumadewi, Sri. 2003. Artificial Intellegence
(Teknik dan Aplikasinya). Yogyakarta: Graha Ilmu.
Al-Kaidi, M. 2007. Fractal Speech Processing. Cambridge University Press.
Proakis, JG. dan Manolakis, DG. 1996. Digital Signal Processing : Principles, Algorithms, and Applications, New Jersey: Prentice- Hall International, Inc.
Resmiwati, NUE. 2009. Pengenalan Kata Berbahasa Indonesia dengan Menggunakan Hidden Markov Model Berbasiskan Fonem. [Skripsi]. Institut Pertanian Bogor, Fakultas Matematika dan Ilmu Pengetahuan Alam, Bogor.
Riedmiller, M. dan Braun, H. 1992. RPROP – A Fast Adaptive Learning Algorithm. In Proceedings of the Seventh International Symposium on Computer and Information Sciences, pages 279-285.
Riedmiller, M. dan Braun, H. 1993. A Direct Adaptive Methode for Easter Backpropagation Learning : The RPROP Algorithm. In Proceedings of the IEEE
International Conference on Neural
Networks, pages 586-591.
Siang, JJ. 2004. Jaringan Syaraf Tiruan dan Pemrogramannya Menggunakan Matlab. Yogyakarta: Andi.
Susanto, N. 2007. Pengembangan Model Jaringan Syaraf Tiruan Resilient
Backpropagation Untuk Identifikasi
Pembicara dengan Praproses MFCC. [Skripsi]. Institut Pertanian Bogor, Fakultas Matematika dan Ilmu Pengetahuan Alam, Bogor.
16 Lampiran 1 Algoritme Pelatihan JST RPROP (Sumber : Riedmiller dan Braun 1992, diacu dalam Engelbrecht 2007)
Initialize NN weights to small random values
Set ∆ = ∆ = ∆ , ∀ =1,…, I + 1, ∀ = 1,… J + 1, ∀ = 1,…, K; Let t = 0;
While stopping condition(s) not true do for each , j = 1,…, J + 1, k = 1,…, K do if (t - 1) (t) > 0 then ∆ (t) = min{∆ (t - 1) , ∆ }; ∆ (t) = -sign
(
(t))
∆ (t) ; (t + 1) = (t) + ∆ (t) ; else if (t - 1) ) (t) < 0 then ∆ (t) = max{∆ (t - 1) , ∆ }; ∆ (t + 1) = (t) - ∆ (t - 1); = 0; else if (t - 1) ) (t) = 0 then ∆ (t) = -sign(
(t))
∆ (t) ; (t + 1) = (t) + ∆ (t) ; endRepeat the above for each weight, j = 1,…J, i = 1,…, I + 1;
17 Lampiran 2 Kuesioner model pertama dengan 100 hidden neuron
Kata Sinyal Suara Prediksi
Kata 1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLLLAAAAAAAAAAAAMMMMM MMMMMMMMMMIKN ALAM 2 SMNMMMMNIIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNSUUUUUUUUUMMMNMMMMNMMMI N MINUM 3 SIJJJJEEEEEEEEEEEEEEEEEEEEEENNNNNNNIIIIIIIIIIIIISSSSSSSSSSSSSSSS JENIS 4 SKEEAAAAAAAAAAAAAAAAAAEKKJINNNJMJJJJJJJJJJJJIIIIIIIIIIIIIININ KAJI 5 NNNMUUUUUUUUUUUUUUUUUUNUJSSSSSKSSSSSSSSSSSAAAAAAAAAAAAAAA AAAAA NUSA 6 JJIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNAAAAAAAAA JINAK 7 AAAAAAAAAAAAAAAAAAAAAAAAAAAMMMMMMMULAAAAAAAAAAAALLLLL LLLLULLLL AMAL 8 SIIIJEEEEEEEEEEEEEEEEEEEEEENNNNNNNIIIIIIIIIIISSSSSSSSSSI JENIS 9 SJJIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNAAAAAAAAA JINAK 10 AAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLLLLLAAAAAAAAAALAMMMMM MMMMMMNMJKKKKKKKKKKKKN ALAM 11 SJIIIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNAAAAAAAAA JINAK 12 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLLLLLLAAAAAAAAAAEMMM MMMMMNMMMMMKKKKKM ALAM 13 SUKAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEEAAIINNNNJJSKSSSJJII IIIIIIIIIIIIIIIIIJIIIKKKKKN KAJI 14 SLLLUUUUUUUUUUUUUUUUUUUASSSSSSSSSSSSSSSSSEAAAAAAAAAAAAAAAA AAAN LUSA 15 MMUUAAAAAAAAAAAAAAAAAAMKKKKKKKKKKKKKKASEAAAAAAAAAAAAA ENNMMMMMMMMMMMMMMMM MAKAN 16 SJJJJIJJEEEEEEEEEEEEEEEEEEEEEEEEJNNNNNNNMIIIIIIIIIIISSSSSSSSSSSJ JENIS 17 SKKAAAAAAAAAAAAAAAAAAAASKAIINJJJJIKKJIIJJSJIIIIIIIIIIIKKIIIIKKK KAJI 18 SKUEEEEEEEEEEEEEEEEEEEEEEEEEEEESNNNNNNNAAAAAAAAAAAA KENA 19 NMMNSUUUUUUUUUUUUUUUUUUUUUSSSSSSSSSSSSSSSIIIIIIIIIKMMMMMMMM MMNN MUSIM 20 SSSSSEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEUNNNMMMMMLAAAAAAAA SEMAK 21 SNLEEEEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNAAAAAAAAAAAAA KENA 22 NMMNNIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNSUUUUUUUUUUUMNNMMIMMMMM MINUM 23 NNNNNEEEEEEEEEEEEEEEEEEEEEEEENNNNNNAEEEEEEEEE NENEK 24 SSSSSSSSSSSSSSSUUUUUUUUUUUUUUUUUUUUNKKKKKKKKKKKKKSSSAAAAA AAAAAAAAAAAAAAM SUKA 25 AAAAAAAAAAAAAAAAAAAAAAAAAAALMMMMMMMMLAAAAAAAAAALLLLLL LLLLLLLLLLLLN AMAL 26 SSSEEEEEEEEEEEEEEEEEEEEEEEEEEUUUMMMMMUAAAAAAAA SEMAK 27 LLLIIULUUUUUUUUUUUUUUUUUUISSKSSSSSSSSSSSSSEAAAAAAAAAAAAAAAA MN LUSA 28 MMULAAAAAAAAAAAAAAAAAAAAAAAAAAMKKKKKKKKKKASAAAAAAAAAA AINNNMNINNINIJII MAKAN 29 ULLLUUUUUUUUUUUUUUUUUUUUSSSSSSSSSSSSSSSSSEAAAAAAAAAAAAAAAA AA LUSA 30 AAAAAAAAAAAAAAAAAAAAAAAAAAALMMMMMMMMAAAAAAAAAAALLLLLL LLLLLLLULLKM AMAL 31 NMMMMNNIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNUUUUUUUUUUUMMMMMMMMMMMM MMM MINUM 32 NMMMMUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAANKKKKKKKKKKKKSSAA AAAAAAAASNNNNNMMNMNMMMNNA MAKAN 33 NMMMMMNUUUUUUUUUUUUUUUUUUUIUUSSSSSSSSSSSSSSSIIIIIIIIJMMMMMM MMMMMMM MUSIM 34 SIEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNAAAAAAAAA KENA 35 NNNNNAEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNEEEEEEEEEI NENEK
18 Lampiran 2 Lanjutan
Kata Sinyal Suara Prediksi
Kata 36 NNNNNNNNNUUUUUUUUUNJIASSSSSSSSSSSSSSSUAAAAAAAAAAAAAAAAAAAAAA M NUSA 37 MMNNMMNNNMKKIIIIIIIIIKIKKKIKIIKIIIIIIIIUJKIUKUUKKIKIIIIN MILIK 38 NNNNNNEEEEEEEEEEEEEEEEEEEEEEKNNNNNNNEEEEEEEEI NENEK 39 SSSSSSSSEEEEEEEEEEEEEEEEEEEEEEEEEEEUUMMNMMMMUAAAAAAAAU SEMAK 40 JIJJEJJEKKAAAAAAASSSSIINMNNNNNMNIKKJJIIIIIIIIIIIIIIN JANJI 41 SEEEEEEEEEEEEEEEEEEEEENNNNNNNNAAAAAAAAAAAMMMMMMM SENAM 42 NMNNIUUUUUUUUUUUUUUUUUUUUUEUUUSSSSSSSSSSSSSSSIIIIIIIIESMMMMMMM MMNMN MUSIM 43 SSSSSSUUUUUUUUUUUUUUUUUUUUUUUUUULLLAAAAAAAAALMIMNMMA SULAM 44 USEAAAAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKLKUUUUUUUUUUUUU UUUUUUMNKKKN KAKU 45 SSSSAAAAAAAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKKKKKJSKKIIIIIIIIII IIIIIIIIIIIKKU KAKI 46 SJKKEESAAAAAAAAAAAAAAEESINNNNNNNNNNMNNJJJJJIIIIIIIIIIIIIIIIIIIIIIIIMIIIKU JANJI 47 SKSKSSSSSSSSSNUUUUUUUUUUUUUUUUKKKKKKKKKKKKKKSSAAAAAAAAAAAAA AAAAAAN SUKA 48 SSSSSSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEENNNNNNNNAAAAAAAAAAAMMMMM MMU SENAM 49 NMMNIKIIIIIKIIKIIKIIIIIIIIENKKKKKKKKIIIIII MILIK 50 SSSSSSSSSSSSSSUUUUUSUUUUUUUUUUUUUUUUULULLAAAAAAAAAAMMMMM SULAM 51 SSSSSSSSSSUUUUUUUUUUUUUUUUUUUKKKKKKKKKKKKKKSSAAAAAAAAAAAAA N SUKA 52 SJJJJSAAAAAAAAAAAASSSSINNNNNNNNNNNMNNJNKJJJIIIIIIIIIIIIIIIIIIINMM JANJI 53 KSKAAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKUUKUUUUUUUUUUUUUUUUU UUUUINMU KAKU 54 NMMMNUUUUUUUUUUUUUUUUUIISSSSSSSSSSSSSSSKSAAAAAAAAAAAAAAAA NUSA 55 SSSSSSSSSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEENNNNNNNNAAAAAAAAAAAAMM MMMN SENAM 56 SSSSSASSSUUUUUUUUUUUUUUUUUUUUUUUULLLLLAAAAAAAAAMMMMMMMMM MN SULAM 57 SSSAAAAAAAAAAAAAAAAAAAAAAAAAAAMKKKKKKKKKKKKKSKKKIIIIIIIIIIIIIIIIIII IIIIIIJKN KAKI 58 NNMMMMNIIKKKIKKIKIKIIIIIIIIKEKKKKKKKJIIIII MILIK 59 KKKAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKUUKUUUUUUUUUUUUUUUUU UUUMSSSKKKKKU KAKU 60 SSSAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAANKKKKKKKKKKKKKK KSSKIIIIIIIIIIIIIIIIIIIIIMIIKMKK KAKI Keterangan :
19 Lampiran 3 Kuesioner model kedua dengan 1000 hidden neuron
Kata Sinyal Suara Prediksi
Kata 1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLLLLLAAAAAAAAAAASMMMM MMMMMMMMIJKKKKKKKKKKKKN ALAM 2 KSKAAAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKKJKUUUUUUUUUU UUUUUUUUUNNKKKN KAKU 3 MNNNNNEEEEEEEEEEEEEEEEEEEEEEENNNNNNNEEEEEEEKI NENEK 4 NNNNNNNMMMMMMMMULNNANKSSSSSSSSSSSSSSNUAAAAAAAAAAAAAAAA AAAAAAA NUSA 5 SSSSSSSSSSSSSSSUSUUUUUUUUUUUUUUUUUUUKKKKKKKKKKKKAKSSAAAA AAAAAAAAAAAAAAAA SUKA 6 JIJJAJJJAAAAAAAAAASSANINMNMNNNMJIKKJJJIIIIIIIIIIIIIN JANJI 7 AAAAAAAAAAAAAAAAAAAAAAAAAAAAMMMMMMMMAAAAAAAAAAAALLL ALLLLLLLLLLLKM AMAL 8 SJIIIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNAAAAAAAAA JINAK 9 SJJJJJJJEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNMIIIIIIAIIIISSSSSSSSSSSS JENIS 10 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLAAAAAAAAAAASMMMM MMMMMMMMMMMJKN ALAM 11 JJJJIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNAAAAAAAAA JINAK 12 KSUEEEEEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNAAAAAAAAAAKA KENA 13 AAAAAAAAAAAAAAAAAAAAAAAAAAALMMMMMMMMLAAAAAAAAAAALLL LLLLLLLLLLLLLLA AMAL 14 AIKKAAAAAAAAAAAAAAAAAAAEAAANJJJJJJJJJKJJJJJJIIIIIIIIIIIIIIIIN KAJI 15 JIJJJJJEEEEEEEEEEEEEEEEEEEEENNNNNNNIIIIIIIIIIIISSSSSSSSSSSSSSSSS JENIS 16 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAALLLLLLLLLAAAAAAAAAAEMM MMMMMMNNMMNMJMLKKA ALAM 17 LJLLLLLUUUUUUUUUUUUUUUUUSSSSSSSSSSSSSSSSSSAAAAAAAAAAAAAAAA AA LUSA 18 KNUEEEEEESEEEEEEEEEEEEEEEEEEEEENNNNNNNAAAAAAAAAAAAA KENA 19 JJIIIIIIIIIIIIIIIIIIIIKISNNNNNNNNEAAAAAAAA JINAK 20 SJIIEEEEEEEEEEEEEEEEEEEEEEENNNNNNNIIIIIIIIIIISSSSSSSSSSI JENIS 21 LLLLLLLUUUUUUUUUUUUUUUUUUUSKKSSSSSSSSSSSSSSAAAAAAAAAAAAAA AAMM LUSA 22 NNNNNEEEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNEEEEEEEMKK NENEK 23 AAAAAAAAAAAAAAAAAAAAAAAAAAAMMMMMMMUMAAAAAAAAAAAALLL LLLLLLLLLLU AMAL 24 MMMNMMIIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNUUUUUUUUUUUMMMMMMMMMMMM MMM MINUM 25 KKSKAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAKAEAAJUNNNJJJJKJSSJJ IIIIIIIIIIIIIIIIIIIIIIIKKKKKN KAJI 26 JJJJJJJAAAAAAAAAAASASSNNNNNNNNNNNNMNJJKKJJJIIIIIIIIIIIIIIIIINJNJK JANJI 27 MMMMMUAAAAAAAAAAAAAAAAAAAAAAAAAAAAKNAKKKKKKKKKKKKSK KAAAAAAAAASNNNNNNNNMNMMNNNM MAKAN 28 KKKKKAAAAAAAAAAAAAAAAAASAAIINJKJJIJNJIJJJJJIJIIIIIIIIIIKIIILUSK KAJI 29 NMNNKUUUUUUUUUUUUUUUUUUUUUKUUUJSSSSSSSSSSSSSSIIIIIIIIIMMMMM MMMMMNMN MUSIM 30 LLLLLLULLUUUSUUUUUUUUUUUSSASSSSSSSSSSSSSSSLAAAAAAAAAAAAAAA AAAN LUSA 31 KMNMMMMUIIIIIIIIIIIIIIIIIIIIIIIIINMNNNNNNEUUUUUUUUUMMMMMMMMNMM MIU MINUM 32 KUEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEMMNNNNNAAAAAAAAA KENA 33 SSSNEEEEEEEEEEEEEEEEEEEEEEEEEEEUMMMMMUAAAAAAAA SEMAK 34 NMMNUUUUUUUUUUUUUUUUUUUUUUISSSUSSSSSSSSSSIIIIIIIIIMMMMMMMM MMMNN MUSIM 35 MMULAAAAAAAAAAAAAAAAAAMLKKKKKKKKKKKKKKKKAAAAAAAAAAAA AENNMMMMMMNMMMMMJMMA MAKAN
20 Lampiran 3 Lanjutan
Kata Sinyal Suara Prediksi
Kata 36 MMMMNUUUUUUUUUUUUUUUUUUSSSSSSSSSSSSSSSSSSSAAAAAAAAAAAAAA A NUSA 37 MMMMMMNUUUUUUUUUUUUUUUUUUUUUESSSSSSSSSSSSSSSNIIIIIIINMMMM MMMMMMMMM MUSIM 38 NMMNNIIIIIIIIIIIIIIIIIIIIIIIINNNNNNNNSUUUUUUUUUUUMMNMMMMMMMM MINUM 39 NNNNNEEEEEEEEEEEEEEEEEEEEEEEENNNNNNEEEEEEEEEE NENEK 40 NNNMNUUUUUUUUUUUUUUUUUUUMSSSSSKSSSSSSSJSSSAAAAAAAAAAAAAA AAAMKA NUSA 41 MMMAAAAAAAAAAAAAAAAAAAAAAAAAAANKKKKKKKKKKKKAAAAAAAAA AANNNMMNMMNIIIIII MAKAN 42 JJILKKKAAAAAAAAAAAAAAEEEANNANNNNNMNNNNJJJJJJJJIIIIIIIIIIIIIIIIIIIIMMI IIKM JANJI 43 SSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEEEEEUMMMMMMMAAAAAAAAAU SEMAK 44 SSSSSSSSSSSSSUUUUUULUUUUUUUUULLLUUUUULLLLAAAAAAAAAEMMMMM SULAM 45 SSSSSSSSSSUUUUUUUUUUUUUUUUUUUKKKKKKKKKKKJKKSKKAAAAAAAAA AAAN SUKA 46 SSSSSSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEENNNNNNNNSAAAAAAAAAAMMM MMMMU SENAM 47 MNJKMMNMMMNKIIKIIIIKIKKKKKIKKKKIKKKIIKJUULUNULLLLILIIIIN MILIK 48 KSKKAAAAAAAAAAAAAAAAAAAAAAAAAAMKKKKKKKKKKKKKKKKKIIIIIIIIII IIIIIIIIIIIIIIIJJI KAKI 49 SSSSSSSSSSSSESSUUUUUUUUUUUUUUUKKLKKKKKKKKKKKKKAAAAAAAAAA AAAAAAAAAN SUKA 50 SSSSSSSSSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEENNNNNNNNAAAAAAAAAAAL MMMMMA SENAM 51 SSSSSSSSSSUUUUUUUUUUUUUUUUUUUUUUUULLLAAAAAAAAAAMMMMMM MMMMK SULAM 52 KKKAAAAAAAAAAAAAAAAAAAASAAKKKKKKKKKKKLKUUUUUUUUUUUUUU UUUUUUUIJKU KAKU 53 KSKKAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAKNKKKKKKKKKKK KKKKSKKIIKIIIIIIIIIIIIIIIIIIMIIMMKK KAKI 54 MMMMMMNKKKKKKKKKKIKKKIIIIIKKEALKKKKLKIIIKI MILIK 55 KKKSAAAAAAAAAAAAAAAAAAAAAKAKKKKKKKKKMKKUUUUUUUUUUUUU UUUUUUUUSJKKKKKKI KAKU 56 SSSSSEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEUNNNMMMMMIAAAAAAAM SEMAK 57 ELEEEEEEEEEEEEEEEEEEEENNNNNNNEAAAAAAAAAAAMMMMMMM SENAM 58 MKMNIKIIKIKKKKKKIKIIIIIIIKNIKLLKKKKKIIIIII MILIK 59 SSSKKKAAAAAAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKKKKKJSKKII IIIIIIIIIIIIIIIIIIIKKI KAKI 60 SSSSSSUUUUUUUUUUUUUUUUUUUUUUUULLLLLAAAAAAAAAEMKMMMMM SULAM Keterangan :
21 Lampiran 4 Kuesioner untuk 50 kata di luar data latih dengan 100 hidden neuron
Kata Sinyal Suara Prediksi
Kata 1 AAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKAAAAAAAAAAAANNNNNNNMMN NNMU AKAN 2 AAAAAAAAAAAAAAAAAAAAAAAAAAAAANNNNNNNNAAAAAAAAK ANAK 3 AAAAAAAAAAAAAAAAAAAAAAAAAASSSSSSSSSSSSSUAAAAAAAAAALUMMMMM ASAM 4 EEEEEEEEEEEEEEEEEEEEEEEANNNNNNAAAAAAAAAAA ENAK 5 IIIIIIIIIIIIIIIKKKKKKKKKKKAEEAAAAAAAAAAASNNNNNNNNNNNNNNN IKAN 6 KIIIIIIIUSEEUEEUUUUUUUUUUUUUNMMMNNNNUUUUUUUUUUUUUUUJN ILMU 7 SIIJJJJAAAAAAAAAAAAAAAAAAAAAALLLMMMMMMMNNNUUUUUUUUUUUUUUUUK KJN JAMU 8 SIJJJJJAAAAAAAAASSSSSSSSSSSSSSSSSSSSSSSSSSSSSK JAS 9 SJJJJJJJJSAAAAAAAAAAAAAAAAAAAAAAAAASSSSSSSSSSSSSSSUAAAAAAAAAAAAAA AAAAN JASA 10 MNNJJJIJIJJEEEEEEEEEEEEEEEEEEESNNNMUNNAAAAAAAAAAAAAAAAAAAKKKKKKK KKKKKASLAAAAAAAAAAAAM JENAKA 11 NNNNNNMJJJJJIIIIIIIIIIIIIIIIIIIIIKKKKKKKKKSSAKEEAAAAAAAAAAAAAAAAAAAN JIKA 12 JIIIIINNNUMMMUUUUUUUUUUUUUUUUUULALAAAAAAALLLLLULLLL JUAL 13 SKKSAAAAAAAAAAAAAAAAAAAAAAAAAAASSIIIIIIIIIINNMNMMMMMNMMMNJN KAIN 14 SAAAAAAAAAAAAAAAAAAAAAAAANKKKKKKKKKKKKAAAAAAAAAAA KAKAK 15 SKSSAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAANMMMMMMUMNIIIIIIIIIIIIIII MIJ KAMI 16 SSAAAAAAAAAAAAAAAAAAAAAAAAAAAANNNNNNNNNAAAAAAAAAAALLLLLLLLL LUUUUKJM KANAL 17 ASAAAAAAAAAAAAAAAAAAAAAASSSSSSSSSSSSSSSSSSLAAAAAAAAAAAAAM KASA 18 ASSAAAAAAAAAAAAAAAUUUUUUUUUUUUN KAU 19 KSEEEEEEEEEEEEEEEEEEEEEEEEELLLLLAAAAAAAAAAAASSSSSSSSSSSSSSSJ KELAS 20 SKSIIKKKKKKKKKKKKKKKKKKKKKKKUUNMNMNNNNNAAAAAAAAAAAAAAN KINA 21 LUUUUUUUUUUUUUUUUUUUUUUUUUUULLAAAAAAAASSS KUAS 22 LKKUUUUUUUUUUUUUUUUUUUUUUNMNMMMNMMAAAAAAAAAAANMNMMMMMM M KUMAN 23 AAUUUUUUUUUUUUUUUUUUUUUUUUSKUUNUUIIIIIIIIIIJIJJS KUMIS 24 SLLLAAAAAAAAAAAAAAAAAAAAAAAASSIINMNMNNJJIJSSJSISSSSSSSSSSSSSSSSUN LAJU 25 SLLULLAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKKKUUUUUUUUUUUUUU LAKU 26 SSESUEEELEEEEEEEEEELEEELUUUMNMMMMMMUAAAAAAAAAAAJSSSSSSSSSSSSSSSS S LEMAS 27 ULLLIJKIIIIIIIIIIIIIIIIKKKKKKKKKKKKUUUUUUUUUUUUUUUUUUUUU LIKU 28 SLLKLULUUUUUUUUUUUUUUUKKKKKKKKKKKKKSKEAAAAAAAAAAAAAAAAAAAI LUKA 29 NMMMMUUAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKSAAAAAAAAAAAAAAAAAA MAKA 30 NNMMLAAAAAAAAAAAAAAAAAAAAAAAAALLLLLAAAAAAAALMMMMMMMMMNNN MALAM 31 MMMLAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAJSSSSSSSSSSSSSSI MALAS 32 NMMMUAAAAAAAAAAAAAAAAAAAAAAAAAANNNNNNIKKIIIIIIIJSSSSSSSSSSSSSSSSSS SS MANIS 33 MMMMLAAAAAAAAAAAAAAAAAAAAAAAAANJSSSSSKSSSSSSSSULAAAAAAAAAAAA AAAA MASA 34 NMMMUAAAAAAAAAAAAAAAAAAAAAAAAAAUUUUUUUUUUUUUUUUUUUUUNIN MAU 35 MMMMSKKKKKKKIKKKKKKIIIIINNNNNMJJJJIJJAJKKLLAAAAAAAAAAAA MEJA
22 Lampiran 4 Lanjutan
Kata Sinyal Suara Prediksi
Kata 36 NMMMMMIKKKKKKKKKKIKKIIIIIIIINNMMMMMUNIIIII MIMIK 37 NNMMMUUUUUUUUUUUUUUUUUUUEUUSSSSSSSSSSSSSJIIII MUSIK 38 NNNNNAAAAAAAAAAAAAAAAAAAAAAAAAAEEEKKIIII NAIK 39 NNNAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKAAAAAAAAAAALLLLLLLLLULLLU U NAKAL 40 SSSSSSSSSSSASSSUEAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAKKAIMNNNNJJJJJIIIIII IIIIIIIIIIIIIIIIJJ SAJI 41 SSSSEEAAAAAAAAAAAAAAAAAAAAAKKKKKKKKKKKKKKAEAAAAAAAAAAAAAAAA AAN SAKA 42 SSSSSSAAAAAAAAAAAAAAAAAAAKKKKKKKKKKAAAAAAAAAAAAAAUUUUUUUUUU UUUUU SAKAU 43 SSSSSSAAAAAAAAAAAAAAAAAAAAAALMMMMMMMMMAAAAAAAAAAAAAAAAAAA MA SAMA 44 SSSSSSSSSSSSSEEKKEEEEKIIIKKKKKKUSSSSSSSSSSSSSIIIIIIIIIIIIIIIII SEKSI 45 SSSSUEEEEEEEEEEEEEEEEEEEEEEUUUUUUULLAAAAAAAAAALMMMMMMN SELAM 46 SSSSSSSSSSSSEEEEEEEEEEEEEEEEEEEEUUMMMNNNNNMKIIIIIIIIIIIIIIIIIIII SEMI 47 SSSSSSSSSSEEEEEEEEEEEEEEEEEEEEEEEENNNNNNNIIIIIIIIISIIINNUUUU SENI 48 SSSSSSSSSSSSSSSSSUUUUUUUUKKKKKKKKKKKKKKKKKKMMMMNMAAAAAAAAAAA AAAAM SUKMA 49 SSSSSSSUUUUUUUUUUUUUUUUUISSSSSSSSSSSSUUUUUUM SUSUK 50 SJSSSSSSSSSLUUUUUUUUUUUUUUUSSSSSSSSSSSSSSSSSUUUUUUEENMNNNNNNNNNM NMNNN SUSUN Keterangan :