Mel-Frequency Cepstrum Coefficients

Top PDF Mel-Frequency Cepstrum Coefficients:

IDENTIFIKASI PENUTUR MENGGUNAKAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENTS (MFCC) DAN JARINGAN SYARAF TIRUAN MODEL MADALINE Speaker Identification using Mel Frequency Cepstrum Coefficients (MFCC) and Madaline Neural Network

IDENTIFIKASI PENUTUR MENGGUNAKAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENTS (MFCC) DAN JARINGAN SYARAF TIRUAN MODEL MADALINE Speaker Identification using Mel Frequency Cepstrum Coefficients (MFCC) and Madaline Neural Network

Pengenalan penutur merupakan salah satu bentuk aplikasi dari pengolahan sinyal digital dengan memanfaatkan pola suara pada manusia. Dengan berkembangnya teknologi tersebut memungkinkan interaksi manusia dengan komputer akan semakin mudah. Terdapat dua tahap dalam proses pengenalan penutur yaitu tahap pengambilan atau ekstraksi ciri suara dan tahap pengenalan pola suara penutur berdasar ciri suara dari masing-masing penutur. Pada tahap ekstraksi suara digunakan mel frequency cepstrum coefficients (MFCC) dengan koeffisien ciri berjumlah 13. Sedangkan pada tahap pengenalan pola suara penutur menggunakan jaringan syaraf tiruan (JST) model madaline (many Adaline/ yang merupakan bentuk jamak dari Adaline) untuk membandingkan ciri suara uji dengan ciri suara latih yang sudah diinput sebagai data latih. Hasil yang didapat dari penelitian membuktikan bahwa jaringan syaraf tiruan model madaline tidak disarankan digunakan pada penelitian jenis identifikasi. Hal tersebut didasarkan pada hasil penelitian yang menghasilkan presentase pengenalan hanya 61% untuk 10 kali pengujian dalam database. Adapun pengujian di luar database berhasil melakukan penolakan hanya sebesar 14% dan 84% penolakan untuk pengujian diluar database dengan kata yang berbeda dengan data latih.
Baca lebih lanjut

12 Baca lebih lajut

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

[3] Setiawan Angga, Achmad Hidayanto, R. Rizal Isnanto “Aplikasi pengenalan ucapan dengan ekstraksi Mel Frequency Cepstrum Coefficients (MFCC) melalui jaringan syaraf tiruan (JST) Learning Vektor Quantization (LVQ) untuk mengoperasikan kursor komputer”, ejournal.undip.ac.id, 2011.

1 Baca lebih lajut

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Mel Frequency Cepstrum Coefficients (MFCC) merupakan satu metode yang banyak dipakai dalam bidang speech recognition. Metode ini digunakan untuk melakukan feature extraction, sebuah proses yang mengkonversikan sinyal suara menjadi beberapa parameter. Masukan suara biasanya direkam pada sampling rate diatas 10000 Hz. Frekuensi sampling ini dipilih untuk meminimalkan atau mengkonversi efek aliasing dari analog ke digital. Sinyal- sinyal ini dapat menangkap semua frekuensi sampai dengan 5 Hz, yang meliputi sebagian besar energi suara yang dihasilkan oleh manusia. Seperti yang telah dibahas sebelumnya, tujuan utama dari proses MFCC adalah untuk mengikuti perilaku telinga manusia. Lihat Gambar 2.4 [2].
Baca lebih lanjut

65 Baca lebih lajut

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Mel Frequency Cepstrum Coefficients (MFCC) merupakan satu metode yang banyak dipakai dalam bidang speech recognition. Metode ini digunakan untuk melakukan feature extraction, sebuah proses yang mengkonversikan sinyal suara menjadi beberapa parameter. Masukan suara biasanya direkam pada sampling rate diatas 10000 Hz. Frekuensi sampling ini dipilih untuk meminimalkan atau mengkonversi efek aliasing dari analog ke digital. Sinyal- sinyal ini dapat menangkap semua frekuensi sampai dengan 5 Hz, yang meliputi sebagian besar energi suara yang dihasilkan oleh manusia. Seperti yang telah dibahas sebelumnya, tujuan utama dari proses MFCC adalah untuk mengikuti perilaku telinga manusia. Lihat Gambar 2.4 [2].
Baca lebih lanjut

12 Baca lebih lajut

Metoda Mel Frequency Cepstrum Coefficients (MFCC) untuk Mengenali Ucapan pada Bahasa Indonesia

Metoda Mel Frequency Cepstrum Coefficients (MFCC) untuk Mengenali Ucapan pada Bahasa Indonesia

Sampai saat ini belum ada suatu aplikasi yang dapat digunakan untuk mengubah ucapan dalam bahasa Indonesia menjadi tulisan yang memenuhi kaidah penulisan bahasa Indonesia. Kajian untuk mengubah ucapan menjadi tulisan, setakat ini baru berada pada pengubahan ucapan abjad untuk diterjemahkan menjadi huruf. Sementara, jika ucapan melalui bahasa Indonesia dapat di ubah ke dalam tulisan akan dapat menambah pola penyebaran informasi di kalangan akademis, pemerintahan dan masyarakat secara luas dan adaptif. Di dalam pertemuan ilmiah, non ilmiah, interogasi, dan pidato politik yang umumnya tidak menggunakan teks book sebagai media penyampai secara baku. Audien yang disasar oleh informasi yang diciptakan oleh pertemuan tersebut akan lebih merata, luas, dan seluruh strata. Walau suara dapat menjadi media penyampai informasi namun keberagaman kemasan yang dibuat dapat meningkatkan penetrasi informasi pada seluruh lapisan strata masyarakat. Konstruksi perangkat lunak dibuat dengan menggunakan metode MFCC (Mel Frequency Sepstrum Coefficients) feature extraction dan di dukung dengan K-Means clustering. MFCC feature extraction mengekstrak signal suara ke dalam beberapa vektor data. Hasil dari MFCC feature extraction mempunyai ukuran yang sangat besar, sehingga digunakanlah K-Means clustring untuk membuat beberapa vektor pusat sebagai wakil dari keseluruhan vektor data yang ada untuk digunakan dalam proses pengenalan sehingga mempersingkat waktu. Penelitian ini akan menghasilkan teknologi berupa aplikasi yang dapat di gunakan dengan baik serta diberi keleluasaan untuk dikembangkan pada seluruh bagian sehingga lebih adaptif dan inovatif.
Baca lebih lanjut

10 Baca lebih lajut

Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara menggunakan Metode Mel Frequency Cepstrum Coefficients (MFCC)

Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara menggunakan Metode Mel Frequency Cepstrum Coefficients (MFCC)

Studi pustaka adalah pencarian referensi – referensi yang berhubungan dengan penyusunan tugas akhir, baik melalui internet ataupun buku – buku referensi yang meliputi speech recognation, maupun voice command. Berdasarkan referensi yang telah terkumpul, dapat diambil kesimpulan mengenai perancangan sistem, teknik pengerjaan, maupun metode – metode apa saja yang akan digunakan dalam penyelesaian tugas akhir ini. Pada tahap ini dilakukan pendalaman buku- buku literature yang berhubungan dengan sinyal suara, Mel frequency Cepstrum Coefficients (MFCC). Serta berbagai macam materi tentang konsep pemrograman Microsoft Visual Basic 6.
Baca lebih lanjut

138 Baca lebih lajut

Penerapan Mel Frequency Cepstrum Coefficients (MFCC) sebagai ekstraksi ciri pada pengenalan fonem dengan Probabilistic Neural Network (PNN) sebagai classifier

Penerapan Mel Frequency Cepstrum Coefficients (MFCC) sebagai ekstraksi ciri pada pengenalan fonem dengan Probabilistic Neural Network (PNN) sebagai classifier

Voice recognition (speech recognition) is one field of study in voice processing. This technology can convert voice signals into a form of written information (text). With this technology, people can interact with a computer. MFCC feature extraction computes the cepstral coefficients by considering the human hearing. This research is a phoneme recognition using feature extraction MFCC and PNN as feature matching model. This study compares the coefficient, overlap, and the test data without noise and with noise. MFCC is used with 13, 20, 26 coefficients and 0%, 25%, 50% overlap. Noise is added by 30 dB, 20 dB and 10 dB. From the comparison of the three overlaps, produced the best accuracy at 50% overlap with an accuracy of 94,71%. From comparing the three coefficients, better accuracy resulting in coefficients of 20 and 26 with an accuracy of 97,12% at 50% overlap. After comparing between the coefficients of 20 and 26 with overlap of 25% then the coefficient 26 is obtained that better accuracy of 94,23%. This shows that in this study the coefficient 26 is the best. In this research, there are three noise variables. The variables are 10 dB, 20 dB, and 30 dB. The best accuracy reached when the noise variable is 30 dB rather than 10 dB or 20 dB because the accuracy has the closest accuracy compared by the accuracy when noise was not added into the data. When the noise variable is 30 dB, the percentage of accuracy is 85,3%.
Baca lebih lanjut

48 Baca lebih lajut

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Pengenalan Karakteristik Suara Menggunakan Mel Frequency Cepstrum Coefficients (Mfcc) Pada Sistem Pengenalan Pembicara (Speaker Recognition Sistem)

Pengenalan pembicara (Speaker recognition) memungkinkan untuk menggunakan suara untuk mengontrol atau memverifikasi identitas sumber suara, Sistem tersebut mampu mengontrol keamanan untuk daerah informasi rahasia, dan remote akses layanan informasi. Sinyal suara memiliki banyak parameter yang sangat rumit. Hal ini menjadi alasan penulis menggunakan teknik ekstraksi sinyal suara yang sangat kompleks. Metode ekstraksi suara MFCC (Mel Frequency Cepstrurm Coefficient) dapat menjadi alternatif untuk menyelesaikan masalah yang diakibatkan karena terjadinya kebocoran spektral atau aliasing pada sinyal suara.
Baca lebih lanjut

5 Baca lebih lajut

Implementasi Metode Mel-Frequency Cepstrum Coefficients (MFCC) Dalam IDentifikasi jenis Suara Burung Berkicau

Implementasi Metode Mel-Frequency Cepstrum Coefficients (MFCC) Dalam IDentifikasi jenis Suara Burung Berkicau

Dalam penelitian ini metode yang akan digunakan untuk membangun sistem identifikasi jenis burung yaitu menggunakan metode Mel Frequency Cepstrum Coefficients (MFCC) untuk ekstraksi sinyal suara dan untuk identifikasi dibantu dengan menggunakan metode klasifikasi Jaringan Syaraf Tiruan Self Organizing Maps. Metode Mel Frequency Cepstrum Coefficients digunakan karena memiliki beberapa kelebihan diantaranya mampu menangkap informasi penting dalam sinyal suara, menghasilkan data seminimal mungkin tanpa menghilangkan informasi- informasi yang ada dan mereplikasikan organ pendengaran manusia dalam melakukan persepsi terhadap sinyal suara [3]. Hal ini dibuktikan pada penelitian sebelumnya untuk verifikasi suara orang dengan menggunakan metode MFCC didapatkan akurasi paling tinggi yaitu sekitar 93,254% [4].
Baca lebih lanjut

61 Baca lebih lajut

View of Penerapan Hidden Markov Model (HMM) pada Pengenalan Penutur

View of Penerapan Hidden Markov Model (HMM) pada Pengenalan Penutur

Human voice depends on the position or shape of the cavity owned, so the character of the sound that each person is unique and became his identity. Identification of speakers (speaker recognition) is the process of identifying who is talking on the information contained in the speech wave. Identification of speakers can be used as attendance systems, security, and so on. Speaker recognition system in this study formed through two main processes of training (training) and recognition (recognition), where Mel Frequency Cepstrum Coefficients (MFCC) are used for feature extraction, then the model is formed based Hidden Markov sound model (HMM). The results showed that the test in real time using a microphone accuracy rate of 30%. While testing of the recording file 100%. The level of accuracy depends heavily on the ability of clustering and classification.
Baca lebih lanjut

12 Baca lebih lajut

Aplikasi Pengenalan Ucapan Huruf Hijaiyah Berbasis Android untuk Refreshable Braille Display Menggunakan Mel-Frequency Cepstrum Coefficients dan Neural Network - ITS Repository

Aplikasi Pengenalan Ucapan Huruf Hijaiyah Berbasis Android untuk Refreshable Braille Display Menggunakan Mel-Frequency Cepstrum Coefficients dan Neural Network - ITS Repository

6. Discrete Cosine Transform (DCT) untuk mendapatkan mel cepstrum. DCT merupakan langkah terakhir dari proses utama MFCC yang dihitung menggunakan Persamaan (2.7). Konsep dasar dari DCT adalah mendekorelasikan mel spectrum sehingga menghasilkan representasi yang baik dari fitur spektral lokal. Sesuai dengan nilai yang diperoleh pada tahap filterbank, pada bagian ini juga diperoleh 24 nilai untuk setiap frame sinyal. Akan tetapi, semakin besar nilai DCT yang diambil, maka dapat menurunkan performa pengenalan suara. Nilai DCT kemudian dikalikan dengan log dari proses filterbank sehingga didapatkan nilai fitur dari MFCC. Pada umumnya, nilai yang diambil sebagai hasil fitur dari MFCC adalah sebanyak 2-13. Pada Tugas Akhir ini, diambil fitur sebanyak 13 koefisien MFCC.
Baca lebih lanjut

146 Baca lebih lajut

VERIFIKASI SUARA MENGGUNAKAN JARINGAN SYARAF TIRUAN DAN EKSTRAKSI CIRI MEL FREQUENCY CEPSTRAL COEFFICIENT - Diponegoro University | Institutional Repository (UNDIP-IR)

VERIFIKASI SUARA MENGGUNAKAN JARINGAN SYARAF TIRUAN DAN EKSTRAKSI CIRI MEL FREQUENCY CEPSTRAL COEFFICIENT - Diponegoro University | Institutional Repository (UNDIP-IR)

2. Penggabungan metode ekstraksi ciri MFCC (Mel Frequency Cepstral Coefficients) dan Jaringan Saraf Tiruan Perambatan Balik mempunyai tingkat akurasi paling tinggi yaitu sebanyak 96% yang dicapai dengan kondisi epoch 3000, 25 layer tersembunyi dan 17 Koefisien MFCC.

Baca lebih lajut

SIMULASI DAN ANALISIS SPEAKER RECOGNITION MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN GAUSSIAN MIXTURE MODEL (GMM) SPEAKER RECOGNITION SIMULATION AND ANALYSIS USING MEL FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN GAUSSIAN MIXTURE MODEL

SIMULASI DAN ANALISIS SPEAKER RECOGNITION MENGGUNAKAN METODE MEL FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN GAUSSIAN MIXTURE MODEL (GMM) SPEAKER RECOGNITION SIMULATION AND ANALYSIS USING MEL FREQUENCY CEPSTRUM COEFFICIENT (MFCC) DAN GAUSSIAN MIXTURE MODEL

This essay discusses about speaker recognition, a system that recognize subject identity by their voice. First, subject’s voice features are extr acted using MFCC (Mel-Frequency Cepstrum Coefficients) method. Steps in the MFCC are pre-emphasis, framing, windowing, FFT (Fast Fourier Transform), mel scaling and DCT (Discrete Cosine Transform), which produce feature vector called cepstrums. These cepstrums are then modelled using GMM (Gaussian Mixture Model). Steps in th GMM are Expectation-step and Maximization-step, which produce gaussian distribution along with its parameters, mean (µ) and variance ( ) which are different for every subjects. Classification step is done by comparing between training data parameters and testing data parameters. If the comparation gets high score, it means two datas are match, vice versa.
Baca lebih lanjut

7 Baca lebih lajut

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

Abstrak—Indonesia merupakan salah satu negara agraris yang memproduksi hasil pertanian. Namun, Indonesia masih mengimpor beras dari negara lain dikarenakan penurunan hasil panen. Salah satu faktor menurunnya produksi beras Indonesia adalah akibat serangan hama burung. Ekosistem sawah mengandung berbagai macam spesies burung, baik hama maupun non-hama. Burung non-hama menolong petani melawan hama serangga. Petani menggunakan metode tradisional untuk mengusir hama burung. Pada penelitian ini telah dirancang perangkat lunak untuk mengenali jenis burung berdasarkan kicauannya. Voice Activity Detection (VAD) digunakan untuk mendeteksi adanya kicau burung. Metode ekstraksi ciri suara dari kicau burung menggunakan Mel Frequency Cepstrum Coefficient (MFCC) dan Fast Fourier Transform (FFT). Jaringan Syaraf Tiruan digunakan untuk mengenali pola hasil ekstraksi. Selanjutnya, audiosonic bird repeller digunakan sebagai metode pengusiran hama burung. Hasil identifikasi offline dengan menggunakan MFCC didapatkan tingkat keberhasilan mencapai 90% untuk variasi kicauan dan jenis burung, sedangkan dengan FFT mencapai 68%. Hasil identifikasi online untuk spesimen burung bondol didapatkan tingkat keberhasilan 70% dengan menggunakan MFCC, dan 30% dengan FFT. Selain itu, suara tembakan merupakan suara yang paling baik digunakan untuk mengusir hama burung. Tingkat keberhasilan pengenalan suara burung menggunakan ekstraksi ciri MFCC lebih tinggi jika dibandingkan dengan ekstraksi ciri dengan menggunakan FFT.
Baca lebih lanjut

Baca lebih lajut

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

Pendekatan teknologi ini menggunakan metode pengenalan suara katak dengan menerapkan algoritma Mel Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ). Suara katak dijadikan parameter keberadaan katak di kolam pembenihan karena katak jantan yang akan berkembang biak menarik perhatian katak betina dengan bernyanyi. Katak yang berkembang biak di kolam pembenihan ikan merupakan masalah utama pembudidaya sehingga menjadikan pola suara katak yang akan berkembang biak sebagai parameter keberadaan kotak di kolam pembenihan ikan dirasa tepat.

Baca lebih lajut

Penerapan Learning Vector Quantization (LVQ) dan Ekstraksi Ciri Menggunakan Mel-Frequency Cepstrum Coeffecients (MFCC) untuk Transkripsi Suara ke Teks

Penerapan Learning Vector Quantization (LVQ) dan Ekstraksi Ciri Menggunakan Mel-Frequency Cepstrum Coeffecients (MFCC) untuk Transkripsi Suara ke Teks

Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan Learning Vector Quantization (LVQ) dan Ekstraksi Ciri Menggunakan Mel-Frequency Cepstrum Coeffecients (MFCC) untuk Transkripsi Suara ke Teks adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Baca lebih lanjut

28 Baca lebih lajut

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

Langkah awal pada tahapan ini yaitu membuat filterbank dengan mengubah frekuensi linear menjadi mel-frequency. Filterbank adalah susunan filter yang digunakan untuk memfilter frekuensi sinyal suara menjadi mel-spectrum. Mel- frequency adalah skala frekuensi linear yang memiliki besaran nilai dibawah 1000 Hz dan besaran skala logaritmik diatas 1000 Hz. Satuan mel-frequency tidak lagi Hz melainkan mel. Sebelum diubah ke dalam skala mel, harus ditentukan terlebih dahulu frekuensi terendah dan tertinggi yang dimiliki suatu frekuensi linear. Kemudian ubah kedua frekuensi tersebut dengan menggunakan Persamaan 2.5. Mel-frequecy tersebut dipecah kedalam N jumlah filter dimana tiap mel-frequency memiliki selisih besaran yang sama berasarkan nilai mel-frequency terendah dan tertinggi.
Baca lebih lanjut

Baca lebih lajut

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

Pendeteksian Suara Katak Pada Pengedalian Populasi Katak Sebagai Hama Menggunakan Algoritma Mel-Frequency Cepstral Coefficients-Vector Quantization (MFCC-VQ)

ditangkap melalui microphone akan diekstraksi cirinya menggunakan algoritma Mel Frequency Cepstral Coefficients (MFCC). Sinyal suara yang sudah diekstraksi kemudian diidentifikasi apakah suara tersebut suara katak atau bukan menggunakan algoritma Vector Quantization (VQ). Hasil identifikasi kemudian dikirimkan ke smartphone dan ditampilkan ke pembudidaya dalam bentuk notifikasi. Hasil dari penelitian ini berupa kesimpulan bahwa semakin jauh jarak microphone dari sumber suara, semakin kecil intensitas suaranya dan semakin berisik keadaan lingkungan pada proses pendeteksian maka persentase akurasi yang dihasilkan semakin kecil dengan akurasi tertinggi sebesar 99.6 % pada jarak 1 m dan radius yang dapat dideteksi secara baik pada jarak 11 m dengan akurasi sebesar 83.2 % pada keadaan normal. Melalui uji performa juga didapatkan kesimpulan bahwa persentase spesifisitas dan sensitivitas berbanding lurus dengan persentase akurasi serta kecepatan pemrosesannya semakin lambat meskipun selisih kecepatan tiap meternya tidak terlalu signifikan.
Baca lebih lanjut

Baca lebih lajut

Publication Repository yessi

Publication Repository yessi

sound of an infant's cry. Also with paper [1] does the same but different with the previous study, this study classifies two kinds of infant’s cry that is physiological status and medical disease. Paper [4], it does identification of infant's “cry” and “no cry” which more than 3 features is used. This research only observes limits the values of features of infant's cry. Paper [8], it does classification of infant’s cry into 3 kinds that consist of normal, hypoacoustic and asphyxia. The research uses acoustic characteristics extraction techniques like Linear Prediction Coefficients (LPC) and MFCC as a feature with samples of 1 second, with 16 coefficients for every 50 ms/frame and Adaptive Backpropagation Neural Network as a classifier. The results obtained, of up to 98.67%.
Baca lebih lanjut

Baca lebih lajut

Penerapan Model Codebook untuk Transkripsi Suara ke Teks dengan Ekstraksi Ciri Mel-Frequency Cepstrum Coefficients (MFCC)

Penerapan Model Codebook untuk Transkripsi Suara ke Teks dengan Ekstraksi Ciri Mel-Frequency Cepstrum Coefficients (MFCC)

The advancement of information technology has triggered various demands in utilizing computer. One of them is to make computers able to communicate naturally with humans. This study uses MFCC as a feature extraction method and codebook as a pattern recognition method for voice-to-text transcription. The clustering technique used in this study is k-means. Data obtained from MFCC are clustered using the k-means method, and the model for classification is constructed using the codebook method. The utilized MFCC parameters are sampling frequency 11 000 Hz, time frame 23.27 ms, overlapping 39%. 300 voice data in WAV files with 5 seconds of duration each, are used as the training data and test data to determine the number of cepstral coefficients and the number of cluster that can produce the highest accurancy. The experiment is conducted by recognizing each syllable in 60 the test data with 240 training data. Simulation result shows that the maximum accurancy obtained is 98.3% at 26 cepstral coefficients and 12 clusters.
Baca lebih lanjut

24 Baca lebih lajut

Show all 3587 documents...