PERBANDINGAN METODA EKSTRAKSI CIRI FAST
FOURIER TRANSFORM (FFT) DAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) PADA LOGIKA FUZZY UNTUK
IDENTIFIKASI PENUTUR
Fitrilina1
Hendra Suryana Putra2
ABSTRACT
Identification of speakers is one of the emerging technologies in the processing of sound that aims to recognize and identify the source of the human voice (speakers). In this research, speaker identification system established by the stages of extraction parameters of sound speakers and the formation of fuzzy rule for each speaker. This study compared two speaker identification system that uses two different parameter extraction methods, namely the Fast Fourier Transform (FFT) and Mel Frequency Cepstral Coefficients (MFCC). Each parameter used as the extraction of data to form a fuzzy rule in each system.
This study identifies five speakers. In this study the accuracy of the system in identifying speakers reached 93.33% for FFT-Fuzzy method and 96% for MFCC- fuzzy method. In the fuzzy logic system for speaker identification, usage MFCC parameter extraction has better accuracy than the FFT parameter extraction.
Keywords: speaker identification, fuzzy logic, Mel-Frequency Cepstral Coefficients (MFCC), FFT
INTISARI
Identifikasi penutur merupakan salah satu teknologi yang berkembang dalam pengolahan suara yang bertujuan untuk mengenali dan mengidentifikasi sumber suara manusia (penutur). Pada penelitian ini sistem identifikasi penutur dibentuk dengan tahapan yaitu ekstraksi parameter dari suara penutur dan pembentukan rule fuzzy untuk setiap penutur. Penelitian ini membandingkan dua buah sistem identifikasi penutur yang menggunakan dua metoda ekstraksi parameter yang berbeda, yaitu Fast Fourier Transform (FFT) dan Mel Frequency Cepstral Coefficients (MFCC). Masing-masing hasil ekstraksi parameter dijadikan data untuk membentuk rule fuzzy pada masing-masing sistem. Penelitian ini mengidentifikasi lima orang penutur. Pada penelitian ini akurasi sistem dalam mengidentifikasi penutur mencapai 93,33% untuk metoda FFT-Fuzzy dan 96%
untuk metoda MFCC-fuzzy. Pada sistem logika fuzzy untuk identifikasi penutur, penggunanaan ekstraksi parameter MFCC memiliki akurasi yang lebih baik dibandingkan ekstraksi parameter FFT.
Kata Kunci : Identifikasi penutur, logika fuzzy, Mel-Frequency Cepstral Coefficients (MFCC),FFT.
1 Dosen Jurusan TeknikElektro Universitas Andalas
2 Mahasiswa Jurusan Teknik Elektro Universitas Andalas
PENDAHULUAN
Sinyal suara mengandung dua informasi yaitu identitas sumber suara dan informasi ucapan dari suara tersebut. Teknologi pengenalan suara dibagi atas dua jenis, yaitu speech recognition untuk mengenali ucapan dan speaker recognition untuk mengenali identitas sumber suara (penutur).
Teknologi speaker recognition umumnya berkembang ke arah security atau keamanan, seperti password dengan suara, selain itu dapat diaplikasikan pada sistem absensi dengan suara. Pada prisnsipnya Teknologi speaker recognition bekerja dengan cara identify dan verification sehingga hanya orang tertentu yang diizinkan atau bisa memiliki akses ke peralatan yang menggunakan sistem tersebut. Tahapan awal yang harus dilakukan dalam pembentukan sistem identifikasi penutur adalah mengekstrak ciri-ciri atau parameter yang dapat mewakili karakter suara dari penutur. Berbagai metoda dikembangkan untuk mendapatkan parameter yang optimal seperti Fast Fourier Transform (FFT), Mel Frequency Cepstrum Coefficients (MFCC), linear predicttive coeficient (LPC). Tahap berikutnya adalah membentuk pola suara.
Pembentukan pola suara dapat berupa codebook, HMM, rule fuzzy, jaringan saraf tiruan, dan lain-lain.
Pada penelitian ini digunakan logika fuzzy, karena logika fuzzy merupakan suatu sistem yang bisa memberikan suatu keputusan yang baik untuk kondisi yang tidak pasti (mutlak) seperti sinyal suara yang memiliki pola berbeda-beda satu sama lain. Proses pembuatan sistem dengan logika fuzzy cenderung lebih sederhana tetapi dapat mengambil keputusan yang akurat sehingga dapat digunakan dalam sistem voice recognition seperti penelitian [5][6][7]. Semakin baik kualitas parameter hasil ekstraksi maka
semakin baik parameter tersebut dalam mewakili karakter si penutur sehingga diharapkan akan memberi
kemudahan bagi sistem
pembentukan pola yaitu logika fuzzy untuk membuat pola suara yang mampu mewakili identitas penutur.
Oleh karena itu pada penelitian ini dilakukan perbandingan antara dua ekstraksi ciri suara yaitu FFT dan MFCC dengan pembentukan pola suara menggunakan logika fuzzy.
Ruang lingkup penelitian yaitu dirancang dengan menggunakan perangkat lunak Matlab R2010a dengan input masukan adalah suara manusia berformat “.wav”. Sinyal diasumsikan ideal, yaitu tidak memperhitungkan noise. Sistem akan mengidentifikasi (mengenal) suara dari lima orang penutur dan menolak (tidak mengenali) suara dari selain dari lima penutur tersebut.
PENDEKATAN PEMECAHAN
MASALAH
Ekstraksi Parameter
Ekstraksi parameter adalah proses yang dilakukan untuk mengambil informasi atau ciri suara yang akan dibutuhkan untuk pemrosesan selnajutnya. Jika akan diproses untuk pengenalan ucapan (Speech Recognition) maka diambil informasi kata yang diucapkan. Jika akan diproses untuk pengenalan penutur maka diambil informasi karakter suara penutur. Pada penelitian ini dibandingkan 2 metoda ekstraksi yaitu MFCC dan FFT. Ada pun proses pengolahan sinyal pada ekstraksi ciri menggunakan MFCC dapat dilihat pada gambar 1[14].
Gambar 1. Diagram Blok MFCC Pre-emphasis : Pada langkah ini, cuplikan sinyal dalam bentuk digital ditapis dengan menggunakan FIR filter orde satu untuk meratakan spektral sinyal suara tersebut.[14]
Frame blocking : Tahap awal suara masukan diblok menjadi frame. Frame dibentuk dalam ukuran yang kecil dengan tujuan membuat sinyal menjadi stasioner sehingga dapat diasumsikan spektrum konstan[14]. Untuk frame pertama dimulai dari N cuplikan, dan frame kedua dimulai setalah M cuplikan dari frame pertama, terjadi overlap sebesar N – M cuplikan.
Windowing : Windowing dilakukan pada setiap frame untuk meminimalisasi ketidak kontinuan atau mengurangi distorsi spektrum pada awal dan akhir frame, sehingga diujung-ujungnya mendekati nol.
Window yang digunakan adalah Hamming window dengan bentuk seperti pada persamaan 1[14].
1
cos 2 46 , 0 54 , 0 )
( N
n n
w ;
1
0
n N (1) y1(n) = x1(n).w(n), 0 ≤ n ≤ N-1 (2) dimana: w(n) = window yangdigunakan;
y(n) = sinyal hasil windowing x1(n) = sinyal input.
N = jumlah cuplikan/sample dalam masing-masing frame
Fast Fourier Transform : mengubah masing-masing frame N sampel dari domain waktu menjadi domain frekuensi. FFT menguraikan sinyal kedalam suatu fungsi eksponesial pada frekuensi sesuai dengan persamaan ditunjukan oleh
persamaan 3
1
0
X(k) = ( ) exp 2 /
N
n
X n j nk N
(3)dimana : X(n) = Fungsi dalam domain waktu
X(k) = Fungsi dalam domain frekuensi
N = Jumlah titik(sampel) k = 0,1,2,……,N-1 Mel-Frequency Wrapping
Bentuk grafik dari skala mel tersebut dapat dilihat pada gambar 2 [9]:
Frekuensi (Hz)
Pitch (mels)
1000 2000 3000
100 500 1000
Gambar 2. Grafik skala mel
Skala frekuensi mel merupakan suatu skala yang bersifat linier untuk spectrum
mel spectrum
frame Frame
Blocking Windowing
FFT(Fast Fourr Transform)
Mel Frequency
Wrapping DCT
mel cepstrum Pre-emphasis
frekuensi di bawah 1000 Hz dan logaritmis pada frekuensi diatas 1000 Hz. Untuk mendapatkan koefisien mel maka digunakan mel filter bank. Mel filter bank adalah filter bank berbentuk segitiga seperti pada gambar 3
magnitude
frekwensi
1
ki
ki ki+1
Gambar 3. Filter Bank Segitiga
Secara matematis filter bank segitiga dapat didefenisikan dalam bentuk hubungan seperti persamaan 4
\
+
0
) /(
) (
1
) /(
) (
0 )
, (
1 1
1 1
i i i
i i i
k k k k
k k k k k i
F
1 1 1
1
+ +
i i i
i i i
i
k k
k k k
k k
k k k
k k
(4)
Dimana: F(i,k)= frekuensi dalam filter bank
k = frekuensi yang bernilai 1000 Hertz.
Cepstrum : Untuk
mendapatkan koefisien cepstrum maka koefisien mel diproses dengan menggunakan tranformasi kosinus diskrit (Discrete cosinus transform/DCT). Jika koefisien spektrum mel hasilnya adalah , k=1,2,..,K , sehingga MFCC dapat dihitung . Secara matematis hal ini dapat dinyatakan dengan persamaan 5.
2 2
cos 1 ) (log
1
~
~
k n s c
k
k
n n =
1,2,...,k (5) Dimana: = nilai cepstrum LOGIKA FUZZY
Logika Fuzzy pertama kali dikembangkan tahun 1965 oleh Prof.
Lotfi Zadeh dari University of California [12]. Ide dari logika fuzzy adalah bahwa di alam ini tidak ada sesuatu yang mutlak „benar‟ atau mutlak “salah‟. Antara “benar’ dan
‘salah’ ada suatu perubahan sehingga suatu kejadian bisa dinyatakan sebagai sebagian ‘benar’
dan sebagian ‘salah’ secara bersamaan. Logika fuzzy merupakan suatu konsep dari “ketidakpastian”.
Hal inilah yang membedakan logika fuzzy dari logika Boolean. Perbedaan atara logika Boolean dan Logika Fuzzy dapat dilihat pada gambar 4.
berikut.
Logika Boolean
Logika Fuzzy
Gambar 4. Logika Boolean dan Logika Fuzzy
Metode fuzzy menggunakan pernyataan-pernyataan jika-maka (if- then) untuk menyatakan hubungan antara input dengan output sistem[13]. Pernyataan-pernyataan ini dibangun berdasarkan pengalaman, pengetahuan ataupun intuisi (common sense) dari seorang pakar. Pengetahuan yang didapat bisa berasal dari percobaan- percobaan yang dilakukan untuk mengenali tingkah laku (behaviour) dari proses. memetakan masukan ke keluaran yang mungkin untuk model sistem tak linear, bahkan komplek. Ini adalah keunggulan utama fuzzy logik.
Sistem ini juga dapat beradaptasi dengan baik pada sistem yang berbeda, karena sistem Fuzzy Logik
bersifat toleran terhadap data yang tidak tepat. Konsep dari logika fuzzy dapat dilihat pada gambar 5.
Gambar 5. Konsep dari logika Fuzzy Pernyataan-pernyataan ‘if- then’ pada logika fuzzy disebut rules[13]. Pernyataan ‘if’ digunakan untuk menggambarkan kondisi sistem yang terjadi. Pernyataan
„then’ digunakan untuk menggunakan aksi yang dilakukan oleh sistem. Logika fuzzy menyatakan perubahan secara gradual sehingga setiap kondisi mempunyai derajat yang disebut sebagai Derajat Keanggotaan (Degree of membership). Fungsi yang menyatakan hubungan antara suatu kondisi dengan derajatnya disebut sebagai Fungsi Keanggotaan (Membership Function). Fungsi Keanggotaan ini bisa berbentuk segitiga, trapesium, singleton, maupun kurva.
Bagian-bagian dari Fungsi Keanggotaan dapat dilihat pada gambar 6 berikut :
Gambar 6 Bagian-bagian Fungsi Keanggotaan
a. Label : Merupakan deskripsi dari nama yang digunakan untuk mengidentifikasi membership function. Label- label ini menunjukkan suatu keadaan misalnya very low, low,medium, high, very high.
b. Derajat Keanggotaan (Degree of Membership) : Menyatakan derajat keanggotaan dari crisp input yang sesuai dengan membership function dengan nilai antara 0 sampai dengan 1.
Juga disebut sebagai membersip grade, truth value, atau fuzzy input.
c. Masukan Crisp (Crisp input) : Merupakan nilai input dari proses fuzzy yang merupakan besaran suatu kondisi nyata.
d. Fungsi Keanggotaan (Membership Function) : Mendefenisikan fuzzy set dengan memetakan crisp input dari nilai domainnya kedalam derajat keanggotaan
e. Semesta Pembicaraan (Universal of Discourse) : range dari semua nilai yang mungkin dipakai dalam variabel sistem, merupakan semesta dari himpunan input.
Fuzzifikasi
Proses fuzzifikasi adalah proses pengubahan masukan crisp menjadi masukan fuzzy dengan kata lain memetakan angka-angka masukan crisp ke dalam himpunan
Fuzzy Logik. Untuk mentransformasikan masukan crisp menjadi masukan fuzzy, diperlukan Fungsi Keanggotaan untuk setiap input. Proses fuzzifikasi mengambil nilai masukan crisp dan membandingkannya dengan Fungsi Keanggotaan yang telah ada untuk menghasilkan harga masukan fuzzy.
Dalam proses fuzzifikasi dapat diolah lebih dari satu macam masukan crisp. Fungsi Keanggot dari masukan fuzzy dapat dilihat pada gambar 7
Gambar 7 Contoh Fungsi Keanggotaan Evaluasi Rule
Pada evaluasi rule ini, fuzzy menggunakan rules yang telah dibuat untuk menentukan aksi yang harus dilakukan. Pada tahap ini dilakukan evaluasi tiap rule dengan input yang dihasilkan dari proses fuzzifikasi. Proses selanjutnya adalah menentukan keluaran fuzzy dengan cara membandingkan rule strength dari rule yang mempunyai label consequent sama.
Defuzzifikasi
Pada proses defuzzifikasi, semua nilai keluaran fuzzy yang dihasilkan pada proses evaluasi rule dikombinasikan dengan Fungsi Keanggotaan keluaran untuk mendapatkan keluaran sesuai sistem yang diinginkan. Ada beberapa metode dalam proses defuzzifikasi yaitu :
1. Metode Maximizer
Metode ini mengambil lokasi dari nilai tertinggi pada fuzzy output sebagai hasil akhrinya.
2. Metode Centroid (Center of Gravity)
Pada metode ini setiap fungsi keanggotaan output yang mempunyai nilai diatas nilai fuzzy output akan dipotong. Pemotongan ini disebut lambda cut. Hasilnya (fungsi keanggotaan yang telah terpotong) digabungkan lalu baru
dihitung Center of Gravity keseluruhannya.
Pada penelitian ini dilakukan atas dua tahap yaitu tahapan pelatihan dan tahap pengujian.
Tahap pelatihan bertujuan untuk membentuk polaatau rule fuzzy yang dapat mewakili karakter suara untuk setiap penutur yang akan diiedntifikasi. Tahapan pelatihan dapat dilihat pada gambar 8. Tahap pengujian bertujuan untuk melihat kinerja dari sistem yang telah dirancang, dan prosesnya dapat dilihat pada gambar 9
Gambar 8. Proses pelatihan untuk membentuk rule fuzzy
Gambar 9. proses pengujian sistem (Evaluasi Rule)
Data Penelitian berupa sinyal suara penutur yang direkam dengan menggunakan mikropon yang terhubung dengan komputer.
Perekaman suara dilakukan dengan bantuan program aksesoris windows yaitu sound recorder dengan frekuensi sampling 12.000Hz, 8 bit, mono. Kemudian suara tersebut disimpan dalam bentuk file yang bereksitensi “.wav”. Suara yang akan diproses pada penelitian ini dan dijadikan referensi dalam pembentukan sistem identifikasi penutur diambil dari lima orang sumber penutur yang berbeda.
Masing-masing penutur
mengucapkan sebuah kalimat yang
sama yaitu “Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas” dengan perulangan sebanyak 10 (sepuluh) kali oleh setiap penutur.
Pengujian : Ada 3 (tiga) jenis pengujian yang akan diujikan ke dalam sistem, yaitu :
1. Pengujian terhadap penutur yang menjadi filebase dalam pembuatan sistem. Kalimat yang diucapkan adalah kalimat yang sama yang digunakan dalam pembuatan sistem rule fuzzy yaitu
“Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”.
2. Pengujian terhadap setiap penutur yang menjadi filebase dalam pembuatan sistem. Tetapi kalimat yang diucapkan adalah kalimat yang berbeda dengan yang digunakan dalam pembuatan sistem rule fuzzy. Kalimat-kalimat tersebut yaitu :
a. Laboratorium Telekomunikasi Universitas Andalas Fakultas Teknik Jurusan Teknik Elektro.
b. Laboratorium Dasar Teknik Elektro Jurusan Teknik Elektro Universitas Andalas.
c. Laboratorium Tegangan Tinggi Jurusan Teknik Elektro Universitas Andalas.
d. Laboratorium Konversi Energi Fakultas Teknik Jurusan Teknik Elektro.
e. Laboratorium Elektronika Industri Jurusan Teknik Elektro Universitas Andalas.
3. Pengujian terhadap penutur diluar penutur pada filebase sistem.
Kalimat yang diucapkan adalah kalimat yang sama yang diucapkan oleh penutur filebase dalam pembuatan rule fuzzy yaitu
“Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”.
HASIL DAN PEMBAHASAN
Hasil Pembentukan Rule untuk Segmentasi FFT - Fuzzy
Proses pembentukan rule fuzzy untuk masing-masing penutur menggunakan metode Fuzzy Inference System (FIS) tipe Sugeno Orde Nol. Proses dalam FIS ini dimulai dengan pembentukan membership function masukan dan membership function keluaran, pembentukan rule, dan penentuan metoda defuzzifikasi yang akan digunakan dalam evaluasi FIS.
Membership function Sistem Segmentasi FFT - Fuzzy
Pembentukan Membership Function terbagi dua yaitu membership function masukan dan membership function keluaran.
Untuk membership function masukan, terdapat 5 (lima) variabel input yaitu variabel segment1, segment2, segment3, segment4, dan segment5. Untuk variabel keluaran terdapat 5 (lima) Membership Function yaitu speaker
“Putra”, “Rahman”, “Budi”,
“Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada gambar 10 sampai gambar 14. dan membership function keluaran pada gambar 15.
Gambar 10. Variabel input Segment1- FFT
Gambar 11Variabel input segment2
Gambar 12 Variabel input segment3- FFT
Gambar 13 Variabel input segment4-FFT
Gambar 14 Variabel input Segment5-FFT
Gambar 15. Variabel output spekaer Rule Fuzzy Sistem Segmentasi FFT - Fuzzy
Rule fuzzy dibentuk dari analisa terhadap keseluruhan hasil segmentasi FFT yang diperoleh dari proses ekstraksi parameter setiap penutur filebase. Data-data hasil segmentasi tersebut kemudian dibandingkan dengan membership
function setiap segmen yang telah terbentuk. Hasil perbandingan ini akan menentukan pada magnitudo mana data tersebut berada dari ketujuh magnitudo yang ada pada setiap segmen yaitu; lowest, very low, low, medium, high, very high, dan highest. Jumlah rule yang terdapat pada sistem ini berjumlah 10 (sepuluh) rule dimana setiap penutur memiliki dua buah rule. Masing- masing rule untuk setiap penutur dapat dilihat pada tabel 1.
Tabel 1 Rule Fuzzy Sistem Identifikasi Penutur Segmentasi FFT Pengujian dilakukan dengan 3
variasi yaitu indetifikasi sumber yang ada dalam data base dengan mengucapkan kalimat yang sama dengan pelatihan (pengujian 1), identifikasi sumber yang ada dalam data base tetapi dengan kalimat yang berbeda dengan kalimat pelatihan (pengujian 2) dan menolak atau menyatakan tidak mengenal penutur yang tidak ada didalam data base. Pengujian 1 dapat dilihat pada tabel 2. Pengujian 2 dapat dilihat pada tabel 3 dan pengujian 3 dapat dilihat pada tabel 4
Speaker
Rule yang Digunakan (menggunakan operator AND) Segmen
1
Segmen 2 Segmen 3 Segmen 4 Segmen 5
Putra Lowest Medium Very Low Very High Low
Lowest Medium Low Lowest Low
Rahman Low Medium High Medium High
Low Very Low Very High Low High
Budi Lowest Lowest Low Very Low Very Low
Lowest Lowest Low Lowest Very Low
Chandra
Very
Low Low High Low Medium
Lowest Low Medium Low Lowest
Rio Lowest Medium Lowest Very High Lowest
Lowest Lowest Lowest Lowest Lowest
Tabel 2 Hasil Pengujian Penutur sebagai filebase dengan kalimat yang sama metodaSegmentasi FFT
Speaker Jumlah Pengucapan
Penutur yang dikenali
Kesalahan pada identifikasi
penutur
Jumlah % Jumlah %
Putra 10 10 100% 0 0%
Rahman 10 9 90% 1 10%
Budi 10 8 80% 2 20%
Chandra 10 9 90% 1 10%
Rio 10 10 100% 0 0%
Total Jumlah &
Persentase 46 92% 4 8%
Tabel 3 Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule metodaSegmentasi FFT
Speaker
Jumlah Penguca
pan
Penutur yang dikenali Kesalahan pada identifikasi penutur Jumlah Persentas
e Jumlah Persentas e
Putra 10 9 90% 1 10%
Rahman 10 9 90% 1 10%
Budi 10 8 80% 2 20%
Chandra 10 10 100% 0 0%
Rio 10 8 80% 2 20%
Jumlah & Persentase
keseluruhan 44 88% 6 12%
Tabel 4. Hasil pengujian penutur yang bukan merupakan filebase sistem segmentasi FFT
Speaker
Jumlah Pengucap
an
Pengenalan penutur tidak dikenali
Kesalahan Pengenalan penutur Jumlah Persenta
se Jumlah Persentase
Bari 5 5 100% 0 0%
Tika 5 5 100% 0 0%
Icha 5 5 100% 0 0%
Jumlah & Persentase
keseluruhan 15 100% 0 0%
Berdasarkan tabel 2 dan tabel 3 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 90
%. Berdasarkan tabel 3 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain sistem memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Hal ini dikarenakan dalam sistem fuzzy digunakan logika “AND” untuk masing-masing rule. Sehingga apabila salah satu rule segmen tidak terpenuhi, maka input akan langsung tidak dikenali oleh sistem. Oleh karena itu sistem ini sangat baik dalam mengidentifikasi penutur yang bukan berasal dari filebase sistem.
Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 93,33%
Hasil dan Pembahasan Identifikasi Penutur MFCC – Fuzzy
Untuk Membership Function masukan, terdapat 5 (lima) variabel input yaitu variabel meanMFCC1, meanMFCC2, meanMFCC3, meanMFCC4, dan meanMFCC5.
Untuk variabel keluaran terdapat 5 (lima) membership function yaitu speaker “Putra”, “Rahman”, “Budi”,
“Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada Gambar 16 sampai Gambar 20
Gambar 16 Variabel input meanMFCC1
Gambar 17 Variabel input meanMFCC2
Gambar 18 Variabel input meanMFCC3
Gambar 19. Variabel input meanMFCC4
Gambar 20. Variabel input meanMFCC5
Rule Fuzzy Sistem MFCC – fuzzy Karena penelitian ini bertujuan untuk membandingkan dua metoda ekstraksi ciri yang berbeda dalam sistem identifikasi penutur, maka digunakan data masukan yang sama dalam pembentukan dan pengujian sistem fuzzy. Dalam sistem MFCC – Fuzzy ini, karakter suara masing- masing penutur diwakili oleh 5 (lima) buah data berupa nilai rata-rata koefisien cepstrum (meanMFCC) hasil ekstraksi parameter MFCC yang telah dibagi menjadi 5 (lima) segmen. Data-data tersebut kemudian dibandingkan kembali dengan membership function setiap meanMFCC yang telah terbentuk.
Hasil perbandingan ini akan menentukan pada rentang nilai mana data tersebut berada dalam ketujuh rentang nilai dalam setiap meanMFCC yaitu : lowest, very low, low, medium, high, very high, highest. Jumlah rule yang terdapat pada sistem ini berjumlah 5 (lima) buah rule dimana setiap penutur memiliki satu buah rule. Masing- masing rule untuk setiap speaker atau penutur dapat dilihat pada tabel 5.8.
Tabel 5. Rule Fuzzy Sistem Identifikasi Penutur MFCC – Fuzzy
Analisa Hasil Pengujian Sistem MFCC – Fuzzy
Suara yang diujikan pada sistem MFCC-Fuzzy sama dengan pengujian FFT-Fuzzy. Pengujian pertama untuk suara penutur yang telah dijadikan filebase. Pengujian kedua yaitu juga suara penutur yang dijadikan filebase tetapi mengucapkan kalimat yang berbeda dengan pelatihan. Pengujian terakhir yaitu pengujian terhadap suara penutur yang bukan berasal dari penutur filebase sistem.
Speaker
Rule yang Digunakan (menggunakan operator AND) meanMF
CC1
meanMFCC2 meanMFCC3 meanMFCC4 meanMFCC5
Putra Lowest Lowest Lowest Lowest Lowest
Rahman Highest Highest Highest Highest Highest
Budi Medium Medium Medium Medium Medium
Chandra High High High High High
Rio Low Low Low Low Low
Tabel 6 Hasil Pengujian Penutur sebagai filebase (Jenis pengujian 1) metodaMFCC
Speaker Jumlah Pengucapan
Penutur yang dikenali
Kesalahan pada identifikasi
penutur Jumlah % Jumlah %
Putra 10 9 90% 1 10%
Rahman 10 10 100% 0 0%
Budi 10 9 90% 1 10%
Chandra 10 10 100% 0 0%
Rio 10 10 100% 0 0%
Jumlah & Persentase
keseluruhan 48 96% 2 4%
Tabel 7. Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule (pengujian 2) metoda MFCC
Speaker Jumlah Pengucapan
Penutur yang dikenali
Kesalahan pada identifikasi
penutur Jumlah % Jumlah %
Putra 10 9 90% 1 10%
Rahman 10 10 100% 0 0%
Budi 10 8 90% 2 10%
Chandra 10 9 100% 1 0%
Rio 10 10 100% 0 0%
Jumlah & Persentase
keseluruhan 46 92% 4 8%
Tabel 8. Hasil pengujian penutur yang bukan merupakan filebase MFCC
Speaker Jumlah Pengucapan
Pengenalan penutur tidak
dikenali
Kesalahan Pengenalan
penutur
Jumlah % Jumlah %
Bari 5 5 100% 0 0%
Tika 5 5 100% 0 0%
Icha 5 5 100% 0 0%
Berdasarkan tabel 6 dan tabel 7 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 94 %.
Berdasarkan tabel 8 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 96%
Analisa Perbandingan Hasil Ekstraksi Parameter
Berdasarkan hasil yang didapat, kedua metoda ekstraksi parameter tersebut dapat digunakan dalam sistem pengenalan identifikasi penutur menggunakan logika fuzzy.
Hal ini dikarenakan akurasi yang dicapai untuk masing-masing metoda dalam identifikasi penutur cukup baik meskipun terdapat perbedaan yang signifikan dalam hal akurasi sistem. MFCC-Fuzzy memiliki akurasi 96 % sedangkan FFT-fuzzy memiliki akurasi 93,33%
Dalam hal ini proses ekstraksi parameter memegang peranan cukup penting dalam mendesain sistem identifikasi penutur yang baik dan akurat. Metoda segmentasi FFT – fuzzy memiliki akurasi yang lebih rendah karena data ekstraksi ciri hasil segmentasi FFT lebih bervariasi dan memiliki range atau rentang yang cukup lebar dalam mengekstrak beberapa suara penutur yang sama. Hal ini juga berpengaruh kepada pembentukan rule fuzzy. Rentang yang cukup lebar tersebut membuat sistem mengenali penutur terkadang sebagai penutur lain, karena pada proses pengidentifikasian ada
beberapa membership function (dalam hal ini berupa segmen- segmen input) penutur yang bernilai sama dengan penutur lain.
Sedangkan dalam metoda MFCC - fuzzy, hampir seluruh penutur memiliki data hasil ekststraksi parameter yang berbeda secara signifikan untuk setiap penutur.
Sehingga hal ini berpengaruh kepada kemudahan pembentukan rule dan akurasi yang bisa dicapai oleh sistem fuzzy dalam pengidentifikasian.
Perbedaan akurasi yang disebabkan oleh ekstraksi parameter tersebut merujuk kepada tahapan ekstraksi pada kedua metoda.
Sistem dengan ekstraksi parameter menggunakan MFCC memiliki akurasi lebih tinggi dikarenakan proses ekstraksi lebih mendekati sistem pendengaran manusia.
Dimana setelah dilakukan proses transformasi ke dalam domain frekuensi menggunakan FFT, sinyal suara diolah lagi dengan cara memetakan frekuensi sinyal tersebut ke dalam frekuensi mel untuk mendapatkan hasil yang lebih merepresentasikan bagaimana sinyal suara tersebut dipersepsikan oleh telinga manusia. Proses
dilanjutkan dengan
mentransformasikan spektrum mel ke bentuk koefisien cepstral yang bisa mewakili karakter suara dari setiap penutur. Sedangkan pada ekstraksi parameter FFT proses ekstraksi hanya sampai pentransformasian sinyal dari domain waktu ke domain frekuensi dengan menggunakan FFT.
Kemudian sinyal disegmentasi dan dimodelkan oleh fuzzy sehingga hasil ekstraksi parameter kurang akurat dalam mewakili informasi karakter suara setiap penutur jika dibandingkan dengan MFCC, tetapi masih cukup baik jika digunakan dalam sistem identifikasi penutur dengan menggunakan logika fuzzy.
KESIMPULAN
Dari penelitian yang telah dilakukan, dapat disimpulkan bahwa :
1. Kualitas hasil ekstraksi parameter sangat mempengaruhi kinerja sistem dalam mengidentifikasi penutur.
2. Pengujian sistem identifikasi penutur segmentsi FFT – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 92% untuk kalimat yang sama, 88% untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata-rata akurasi 93,33%
3. Pengujian sistem identifikasi penutur MFCC – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 96%
untuk kalimat yang sama, 92%
untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata2 keberhasilan 96 % 4. Kedua metoda identifikasi
penutur memiliki akurasi yang
cukup baik dalam
mengidentifikasi penutur. Tetapi dalam hal ini sistem MFCC – fuzzy memiliki akurasi yang lebih tinggi.
DAFTAR PUSTAKA
[1] Buono, Agus, Wisnu Jatmiko, dan Benyamin Kusumoputro.
Perluasan Metode MFCC 1D ke 2D Sebagai Esktraksi Ciri pada Sistem Identifikasi Pembicara Menggunakan Hidden Markov Model (HMM). Makara, Sains, Vol. 13, No. 1, April 2009: 87- 93. Bogor : IPB. Depok : UI [2] Balentine,, Bruce . Speker
Identification And Verification.
Enterprise Integration Group.
http://www.w3.org/2008/08/siv/P apers/EIG/SIV-Workshop2009- Balentine-v0.04.pdf diakses pada tanggal 15 Agustus pukul 01.49 WIB.
[3] Chornas, Christian & Urs Hunkeler. Digital Signal Processing Mini-Project: An Automatic Speaker Recognition.
Ecole Polythecnique Federale De Lausanne.
[4] Devi, Harlin Fristianti.2009.
Aplikasi Voice Recognition pada Sistem Keamanan File Pribadi.
Proyek Akhir. Surabaya: PNES ITS.
[5] Herlim, Lukman. 2002.
Pengenalan Kata Dengan Menggunakan Fuzzy Logic Untuk Menggerakkan Robot Mobil. Surabaya : Universitas Kristen Petra.
[6] Lee, Ki Young. Local fuzzy PCA based GMM with dimension reduction. School of Electronic Engineering, Soong Sil University.
http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.109.60 78&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.56 WIB.
[7] Lien, Nguyen T. H. A Speaker Recognition Method Based on Personal Identification Voice and Trapezoidal Fuzzy Similarity. 1Department of Computational Intelligence and Systems Science, Tokyo Institute of Technology.
http://www.cit.iit.bas.bg/CIT_08/
v8-4/40-56.pdf diakses pada tanggal 15 Agustus pukul 01.45 WIB.”
[8] Manunggal, Heri Sugianto.2005.
Perancangan dan Pembuatan Perangkat Lunak Pengenalan Suara Pembicara dengan Menggunakan Analisis MFCC Feature Extraction. Surabaya : Universitas Kristen Petra.
[9] Mustofa, Ali.2007. Sistem Pengenalan Penutur dengan Metode Mel-frequency Wrapping. Jurnal Teknik Elektro Vol. 7, No. 2, September 2007: 88 – 96. Malang : Universitas Brawijaya.
[10] Prihadi. 2010. Perancangan dan Implementasi sistem Pengenalan Ucapan Jenis Digit Speech Recognition dengan menggunakan Logika Fuzzy.
Tugas Akhir. Padang: Teknik Elektro Univeritas Andalas [11] Tran , Dat dan Michael Wagner.
Fuzzy Nearest Prototype Classifier Applied to Speaker Identification. University of Tasmania.
http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.126.42 98&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.44 WIB.
[12] Tran, Dat Tat. Fuzzy Approaches to speech and speaker recognation. University
of Canberra.
http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.117.68 04&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.49 WIB.
[13] Hellman, Martin. 2001. Fuzzy logic Introduction
[14] Ishibuchi,Hisao;Tadahiko
Murata, and Mitsuo Gen.
Performance Evaluation of
Fuzzy Rule-Based
Classification Systems Obtained by Multi-Objective Genetic Algorithms.1998
[15] Prateek Srivastava, Reena Panda, A Novel, Robust, Hierarchical, Text-Independent Speaker