JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 5 NO. 2 SEPTEMBER 2012

(1)

PERBANDINGAN METODA EKSTRAKSI CIRI FAST

FOURIER TRANSFORM (FFT) DAN MEL-FREQUENCY CEPSTRUM COEFFICIENTS (MFCC) PADA LOGIKA FUZZY UNTUK

IDENTIFIKASI PENUTUR

Fitrilina¹

Hendra Suryana Putra²

ABSTRACT

Identification of speakers is one of the emerging technologies in the processing of sound that aims to recognize and identify the source of the human voice (speakers). In this research, speaker identification system established by the stages of extraction parameters of sound speakers and the formation of fuzzy rule for each speaker. This study compared two speaker identification system that uses two different parameter extraction methods, namely the Fast Fourier Transform (FFT) and Mel Frequency Cepstral Coefficients (MFCC). Each parameter used as the extraction of data to form a fuzzy rule in each system.

This study identifies five speakers. In this study the accuracy of the system in identifying speakers reached 93.33% for FFT-Fuzzy method and 96% for MFCC- fuzzy method. In the fuzzy logic system for speaker identification, usage MFCC parameter extraction has better accuracy than the FFT parameter extraction.

Keywords: speaker identification, fuzzy logic, Mel-Frequency Cepstral Coefficients (MFCC), FFT

INTISARI

Identifikasi penutur merupakan salah satu teknologi yang berkembang dalam pengolahan suara yang bertujuan untuk mengenali dan mengidentifikasi sumber suara manusia (penutur). Pada penelitian ini sistem identifikasi penutur dibentuk dengan tahapan yaitu ekstraksi parameter dari suara penutur dan pembentukan rule fuzzy untuk setiap penutur. Penelitian ini membandingkan dua buah sistem identifikasi penutur yang menggunakan dua metoda ekstraksi parameter yang berbeda, yaitu Fast Fourier Transform (FFT) dan Mel Frequency Cepstral Coefficients (MFCC). Masing-masing hasil ekstraksi parameter dijadikan data untuk membentuk rule fuzzy pada masing-masing sistem. Penelitian ini mengidentifikasi lima orang penutur. Pada penelitian ini akurasi sistem dalam mengidentifikasi penutur mencapai 93,33% untuk metoda FFT-Fuzzy dan 96%

untuk metoda MFCC-fuzzy. Pada sistem logika fuzzy untuk identifikasi penutur, penggunanaan ekstraksi parameter MFCC memiliki akurasi yang lebih baik dibandingkan ekstraksi parameter FFT.

Kata Kunci : Identifikasi penutur, logika fuzzy, Mel-Frequency Cepstral Coefficients (MFCC),FFT.

1 Dosen Jurusan TeknikElektro Universitas Andalas

2 Mahasiswa Jurusan Teknik Elektro Universitas Andalas

(2)

PENDAHULUAN

Sinyal suara mengandung dua informasi yaitu identitas sumber suara dan informasi ucapan dari suara tersebut. Teknologi pengenalan suara dibagi atas dua jenis, yaitu speech recognition untuk mengenali ucapan dan speaker recognition untuk mengenali identitas sumber suara (penutur).

Teknologi speaker recognition umumnya berkembang ke arah security atau keamanan, seperti password dengan suara, selain itu dapat diaplikasikan pada sistem absensi dengan suara. Pada prisnsipnya Teknologi speaker recognition bekerja dengan cara identify dan verification sehingga hanya orang tertentu yang diizinkan atau bisa memiliki akses ke peralatan yang menggunakan sistem tersebut. Tahapan awal yang harus dilakukan dalam pembentukan sistem identifikasi penutur adalah mengekstrak ciri-ciri atau parameter yang dapat mewakili karakter suara dari penutur. Berbagai metoda dikembangkan untuk mendapatkan parameter yang optimal seperti Fast Fourier Transform (FFT), Mel Frequency Cepstrum Coefficients (MFCC), linear predicttive coeficient (LPC). Tahap berikutnya adalah membentuk pola suara.

Pembentukan pola suara dapat berupa codebook, HMM, rule fuzzy, jaringan saraf tiruan, dan lain-lain.

Pada penelitian ini digunakan logika fuzzy, karena logika fuzzy merupakan suatu sistem yang bisa memberikan suatu keputusan yang baik untuk kondisi yang tidak pasti (mutlak) seperti sinyal suara yang memiliki pola berbeda-beda satu sama lain. Proses pembuatan sistem dengan logika fuzzy cenderung lebih sederhana tetapi dapat mengambil keputusan yang akurat sehingga dapat digunakan dalam sistem voice recognition seperti penelitian [5][6][7]. Semakin baik kualitas parameter hasil ekstraksi maka

semakin baik parameter tersebut dalam mewakili karakter si penutur sehingga diharapkan akan memberi

kemudahan bagi sistem

pembentukan pola yaitu logika fuzzy untuk membuat pola suara yang mampu mewakili identitas penutur.

Oleh karena itu pada penelitian ini dilakukan perbandingan antara dua ekstraksi ciri suara yaitu FFT dan MFCC dengan pembentukan pola suara menggunakan logika fuzzy.

Ruang lingkup penelitian yaitu dirancang dengan menggunakan perangkat lunak Matlab R2010a dengan input masukan adalah suara manusia berformat “.wav”. Sinyal diasumsikan ideal, yaitu tidak memperhitungkan noise. Sistem akan mengidentifikasi (mengenal) suara dari lima orang penutur dan menolak (tidak mengenali) suara dari selain dari lima penutur tersebut.

PENDEKATAN PEMECAHAN

MASALAH

Ekstraksi Parameter

Ekstraksi parameter adalah proses yang dilakukan untuk mengambil informasi atau ciri suara yang akan dibutuhkan untuk pemrosesan selnajutnya. Jika akan diproses untuk pengenalan ucapan (Speech Recognition) maka diambil informasi kata yang diucapkan. Jika akan diproses untuk pengenalan penutur maka diambil informasi karakter suara penutur. Pada penelitian ini dibandingkan 2 metoda ekstraksi yaitu MFCC dan FFT. Ada pun proses pengolahan sinyal pada ekstraksi ciri menggunakan MFCC dapat dilihat pada gambar 1[14].

(3)

Gambar 1. Diagram Blok MFCC Pre-emphasis : Pada langkah ini, cuplikan sinyal dalam bentuk digital ditapis dengan menggunakan FIR filter orde satu untuk meratakan spektral sinyal suara tersebut.[14]

Frame blocking : Tahap awal suara masukan diblok menjadi frame. Frame dibentuk dalam ukuran yang kecil dengan tujuan membuat sinyal menjadi stasioner sehingga dapat diasumsikan spektrum konstan[14]. Untuk frame pertama dimulai dari N cuplikan, dan frame kedua dimulai setalah M cuplikan dari frame pertama, terjadi overlap sebesar N – M cuplikan.

Windowing : Windowing dilakukan pada setiap frame untuk meminimalisasi ketidak kontinuan atau mengurangi distorsi spektrum pada awal dan akhir frame, sehingga diujung-ujungnya mendekati nol.

Window yang digunakan adalah Hamming window dengan bentuk seperti pada persamaan 1[14].



 





 

 1

cos 2 46 , 0 54 , 0 )

( N

n n

w  ;

1

0

n N (1) y₁(n) = x₁(n).w(n), 0 ≤ n ≤ N-1 (2) dimana: w(n) = window yang

digunakan;

y(n) = sinyal hasil windowing x1(n) = sinyal input.

N = jumlah cuplikan/sample dalam masing-masing frame

Fast Fourier Transform : mengubah masing-masing frame N sampel dari domain waktu menjadi domain frekuensi. FFT menguraikan sinyal kedalam suatu fungsi eksponesial pada frekuensi sesuai dengan persamaan ditunjukan oleh

persamaan 3

 

1

0

X(k) = ( ) exp 2 /

N

n

X n j nk N







 (3)

dimana : X(n) = Fungsi dalam domain waktu

X(k) = Fungsi dalam domain frekuensi

N = Jumlah titik(sampel) k = 0,1,2,……,N-1 Mel-Frequency Wrapping

Bentuk grafik dari skala mel tersebut dapat dilihat pada gambar 2 [9]:

Frekuensi (Hz)

Pitch (mels)

1000 2000 3000

100 500 1000

Gambar 2. Grafik skala mel

Skala frekuensi mel merupakan suatu skala yang bersifat linier untuk spectrum

mel spectrum

frame Frame

Blocking Windowing

FFT(Fast Fourr Transform)

Mel Frequency

Wrapping DCT

mel cepstrum Pre-emphasis

(4)

frekuensi di bawah 1000 Hz dan logaritmis pada frekuensi diatas 1000 Hz. Untuk mendapatkan koefisien mel maka digunakan mel filter bank. Mel filter bank adalah filter bank berbentuk segitiga seperti pada gambar 3

magnitude

frekwensi

1

ki

ki k_i₊₁

Gambar 3. Filter Bank Segitiga

Secara matematis filter bank segitiga dapat didefenisikan dalam bentuk hubungan seperti persamaan 4

\

















+



0

) /(

) (

1

) /(

) (

0 )

, (

1 1

i i i

k k k k

k k k k k i

F

1 1 1

1

+ +













i i i

i

k k

k k k

k k

k k k

k k

(4)

Dimana: F(i,k)= frekuensi dalam filter bank

k = frekuensi yang bernilai 1000 Hertz.

 Cepstrum : Untuk

mendapatkan koefisien cepstrum maka koefisien mel diproses dengan menggunakan tranformasi kosinus diskrit (Discrete cosinus transform/DCT). Jika koefisien spektrum mel hasilnya adalah , k=1,2,..,K , sehingga MFCC dapat dihitung . Secara matematis hal ini dapat dinyatakan dengan persamaan 5.



 











 







2 2

cos 1 ) (log

1

~



k n s c

k

n n =

1,2,...,k (5) Dimana: = nilai cepstrum LOGIKA FUZZY

Logika Fuzzy pertama kali dikembangkan tahun 1965 oleh Prof.

Lotfi Zadeh dari University of California [12]. Ide dari logika fuzzy adalah bahwa di alam ini tidak ada sesuatu yang mutlak „benar‟ atau mutlak “salah‟. Antara “benar’ dan

‘salah’ ada suatu perubahan sehingga suatu kejadian bisa dinyatakan sebagai sebagian ‘benar’

dan sebagian ‘salah’ secara bersamaan. Logika fuzzy merupakan suatu konsep dari “ketidakpastian”.

Hal inilah yang membedakan logika fuzzy dari logika Boolean. Perbedaan atara logika Boolean dan Logika Fuzzy dapat dilihat pada gambar 4.

berikut.

Logika Boolean

Logika Fuzzy

Gambar 4. Logika Boolean dan Logika Fuzzy

Metode fuzzy menggunakan pernyataan-pernyataan jika-maka (if- then) untuk menyatakan hubungan antara input dengan output sistem[13]. Pernyataan-pernyataan ini dibangun berdasarkan pengalaman, pengetahuan ataupun intuisi (common sense) dari seorang pakar. Pengetahuan yang didapat bisa berasal dari percobaan- percobaan yang dilakukan untuk mengenali tingkah laku (behaviour) dari proses. memetakan masukan ke keluaran yang mungkin untuk model sistem tak linear, bahkan komplek. Ini adalah keunggulan utama fuzzy logik.

Sistem ini juga dapat beradaptasi dengan baik pada sistem yang berbeda, karena sistem Fuzzy Logik

(5)

bersifat toleran terhadap data yang tidak tepat. Konsep dari logika fuzzy dapat dilihat pada gambar 5.

Gambar 5. Konsep dari logika Fuzzy Pernyataan-pernyataan ‘if- then’ pada logika fuzzy disebut rules[13]. Pernyataan ‘if’ digunakan untuk menggambarkan kondisi sistem yang terjadi. Pernyataan

„then’ digunakan untuk menggunakan aksi yang dilakukan oleh sistem. Logika fuzzy menyatakan perubahan secara gradual sehingga setiap kondisi mempunyai derajat yang disebut sebagai Derajat Keanggotaan (Degree of membership). Fungsi yang menyatakan hubungan antara suatu kondisi dengan derajatnya disebut sebagai Fungsi Keanggotaan (Membership Function). Fungsi Keanggotaan ini bisa berbentuk segitiga, trapesium, singleton, maupun kurva.

Bagian-bagian dari Fungsi Keanggotaan dapat dilihat pada gambar 6 berikut :

Gambar 6 Bagian-bagian Fungsi Keanggotaan

a. Label : Merupakan deskripsi dari nama yang digunakan untuk mengidentifikasi membership function. Label- label ini menunjukkan suatu keadaan misalnya very low, low,medium, high, very high.

b. Derajat Keanggotaan (Degree of Membership) : Menyatakan derajat keanggotaan dari crisp input yang sesuai dengan membership function dengan nilai antara 0 sampai dengan 1.

Juga disebut sebagai membersip grade, truth value, atau fuzzy input.

c. Masukan Crisp (Crisp input) : Merupakan nilai input dari proses fuzzy yang merupakan besaran suatu kondisi nyata.

d. Fungsi Keanggotaan (Membership Function) : Mendefenisikan fuzzy set dengan memetakan crisp input dari nilai domainnya kedalam derajat keanggotaan

e. Semesta Pembicaraan (Universal of Discourse) : range dari semua nilai yang mungkin dipakai dalam variabel sistem, merupakan semesta dari himpunan input.

Fuzzifikasi

Proses fuzzifikasi adalah proses pengubahan masukan crisp menjadi masukan fuzzy dengan kata lain memetakan angka-angka masukan crisp ke dalam himpunan

(6)

Fuzzy Logik. Untuk mentransformasikan masukan crisp menjadi masukan fuzzy, diperlukan Fungsi Keanggotaan untuk setiap input. Proses fuzzifikasi mengambil nilai masukan crisp dan membandingkannya dengan Fungsi Keanggotaan yang telah ada untuk menghasilkan harga masukan fuzzy.

Dalam proses fuzzifikasi dapat diolah lebih dari satu macam masukan crisp. Fungsi Keanggot dari masukan fuzzy dapat dilihat pada gambar 7

Gambar 7 Contoh Fungsi Keanggotaan Evaluasi Rule

Pada evaluasi rule ini, fuzzy menggunakan rules yang telah dibuat untuk menentukan aksi yang harus dilakukan. Pada tahap ini dilakukan evaluasi tiap rule dengan input yang dihasilkan dari proses fuzzifikasi. Proses selanjutnya adalah menentukan keluaran fuzzy dengan cara membandingkan rule strength dari rule yang mempunyai label consequent sama.

Defuzzifikasi

Pada proses defuzzifikasi, semua nilai keluaran fuzzy yang dihasilkan pada proses evaluasi rule dikombinasikan dengan Fungsi Keanggotaan keluaran untuk mendapatkan keluaran sesuai sistem yang diinginkan. Ada beberapa metode dalam proses defuzzifikasi yaitu :

1. Metode Maximizer

Metode ini mengambil lokasi dari nilai tertinggi pada fuzzy output sebagai hasil akhrinya.

2. Metode Centroid (Center of Gravity)

Pada metode ini setiap fungsi keanggotaan output yang mempunyai nilai diatas nilai fuzzy output akan dipotong. Pemotongan ini disebut lambda cut. Hasilnya (fungsi keanggotaan yang telah terpotong) digabungkan lalu baru

dihitung Center of Gravity keseluruhannya.

Pada penelitian ini dilakukan atas dua tahap yaitu tahapan pelatihan dan tahap pengujian.

Tahap pelatihan bertujuan untuk membentuk polaatau rule fuzzy yang dapat mewakili karakter suara untuk setiap penutur yang akan diiedntifikasi. Tahapan pelatihan dapat dilihat pada gambar 8. Tahap pengujian bertujuan untuk melihat kinerja dari sistem yang telah dirancang, dan prosesnya dapat dilihat pada gambar 9

Gambar 8. Proses pelatihan untuk membentuk rule fuzzy

(7)

Gambar 9. proses pengujian sistem (Evaluasi Rule)

Data Penelitian berupa sinyal suara penutur yang direkam dengan menggunakan mikropon yang terhubung dengan komputer.

Perekaman suara dilakukan dengan bantuan program aksesoris windows yaitu sound recorder dengan frekuensi sampling 12.000Hz, 8 bit, mono. Kemudian suara tersebut disimpan dalam bentuk file yang bereksitensi “.wav”. Suara yang akan diproses pada penelitian ini dan dijadikan referensi dalam pembentukan sistem identifikasi penutur diambil dari lima orang sumber penutur yang berbeda.

Masing-masing penutur

mengucapkan sebuah kalimat yang

sama yaitu “Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas” dengan perulangan sebanyak 10 (sepuluh) kali oleh setiap penutur.

Pengujian : Ada 3 (tiga) jenis pengujian yang akan diujikan ke dalam sistem, yaitu :

1. Pengujian terhadap penutur yang menjadi filebase dalam pembuatan sistem. Kalimat yang diucapkan adalah kalimat yang sama yang digunakan dalam pembuatan sistem rule fuzzy yaitu

“Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”.

2. Pengujian terhadap setiap penutur yang menjadi filebase dalam pembuatan sistem. Tetapi kalimat yang diucapkan adalah kalimat yang berbeda dengan yang digunakan dalam pembuatan sistem rule fuzzy. Kalimat-kalimat tersebut yaitu :

a. Laboratorium Telekomunikasi Universitas Andalas Fakultas Teknik Jurusan Teknik Elektro.

b. Laboratorium Dasar Teknik Elektro Jurusan Teknik Elektro Universitas Andalas.

c. Laboratorium Tegangan Tinggi Jurusan Teknik Elektro Universitas Andalas.

d. Laboratorium Konversi Energi Fakultas Teknik Jurusan Teknik Elektro.

e. Laboratorium Elektronika Industri Jurusan Teknik Elektro Universitas Andalas.

3. Pengujian terhadap penutur diluar penutur pada filebase sistem.

Kalimat yang diucapkan adalah kalimat yang sama yang diucapkan oleh penutur filebase dalam pembuatan rule fuzzy yaitu

“Laboratorium Kontrol Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas”.

(8)

HASIL DAN PEMBAHASAN

Hasil Pembentukan Rule untuk Segmentasi FFT - Fuzzy

Proses pembentukan rule fuzzy untuk masing-masing penutur menggunakan metode Fuzzy Inference System (FIS) tipe Sugeno Orde Nol. Proses dalam FIS ini dimulai dengan pembentukan membership function masukan dan membership function keluaran, pembentukan rule, dan penentuan metoda defuzzifikasi yang akan digunakan dalam evaluasi FIS.

Membership function Sistem Segmentasi FFT - Fuzzy

Pembentukan Membership Function terbagi dua yaitu membership function masukan dan membership function keluaran.

Untuk membership function masukan, terdapat 5 (lima) variabel input yaitu variabel segment1, segment2, segment3, segment4, dan segment5. Untuk variabel keluaran terdapat 5 (lima) Membership Function yaitu speaker

“Putra”, “Rahman”, “Budi”,

“Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada gambar 10 sampai gambar 14. dan membership function keluaran pada gambar 15.

Gambar 10. Variabel input Segment1- FFT

Gambar 11Variabel input segment2

Gambar 12 Variabel input segment3- FFT

Gambar 13 Variabel input segment4-FFT

Gambar 14 Variabel input Segment5-FFT

(9)

Gambar 15. Variabel output spekaer Rule Fuzzy Sistem Segmentasi FFT - Fuzzy

Rule fuzzy dibentuk dari analisa terhadap keseluruhan hasil segmentasi FFT yang diperoleh dari proses ekstraksi parameter setiap penutur filebase. Data-data hasil segmentasi tersebut kemudian dibandingkan dengan membership

function setiap segmen yang telah terbentuk. Hasil perbandingan ini akan menentukan pada magnitudo mana data tersebut berada dari ketujuh magnitudo yang ada pada setiap segmen yaitu; lowest, very low, low, medium, high, very high, dan highest. Jumlah rule yang terdapat pada sistem ini berjumlah 10 (sepuluh) rule dimana setiap penutur memiliki dua buah rule. Masing- masing rule untuk setiap penutur dapat dilihat pada tabel 1.

Tabel 1 Rule Fuzzy Sistem Identifikasi Penutur Segmentasi FFT Pengujian dilakukan dengan 3

variasi yaitu indetifikasi sumber yang ada dalam data base dengan mengucapkan kalimat yang sama dengan pelatihan (pengujian 1), identifikasi sumber yang ada dalam data base tetapi dengan kalimat yang berbeda dengan kalimat pelatihan (pengujian 2) dan menolak atau menyatakan tidak mengenal penutur yang tidak ada didalam data base. Pengujian 1 dapat dilihat pada tabel 2. Pengujian 2 dapat dilihat pada tabel 3 dan pengujian 3 dapat dilihat pada tabel 4

Speaker

Rule yang Digunakan (menggunakan operator AND) Segmen

1

Segmen 2 Segmen 3 Segmen 4 Segmen 5

Putra Lowest Medium Very Low Very High Low

Lowest Medium Low Lowest Low

Rahman Low Medium High Medium High

Low Very Low Very High Low High

Budi Lowest Lowest Low Very Low Very Low

Lowest Lowest Low Lowest Very Low

Chandra

Very

Low Low High Low Medium

Lowest Low Medium Low Lowest

Rio Lowest Medium Lowest Very High Lowest

Lowest Lowest Lowest Lowest Lowest

(10)

Tabel 2 Hasil Pengujian Penutur sebagai filebase dengan kalimat yang sama metodaSegmentasi FFT

Speaker Jumlah Pengucapan

Penutur yang dikenali

Kesalahan pada identifikasi

penutur

Jumlah % Jumlah %

Putra 10 10 100% 0 0%

Rahman 10 9 90% 1 10%

Budi 10 8 80% 2 20%

Chandra 10 9 90% 1 10%

Rio 10 10 100% 0 0%

Total Jumlah &

Persentase 46 92% 4 8%

Tabel 3 Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule metodaSegmentasi FFT

Speaker

Jumlah Penguca

pan

Penutur yang dikenali Kesalahan pada identifikasi penutur Jumlah Persentas

e Jumlah Persentas e

Putra 10 9 90% 1 10%

Rahman 10 9 90% 1 10%

Budi 10 8 80% 2 20%

Chandra 10 10 100% 0 0%

Rio 10 8 80% 2 20%

Jumlah & Persentase

keseluruhan 44 88% 6 12%

Tabel 4. Hasil pengujian penutur yang bukan merupakan filebase sistem segmentasi FFT

Speaker

Jumlah Pengucap

an

Pengenalan penutur tidak dikenali

Kesalahan Pengenalan penutur Jumlah Persenta

se Jumlah Persentase

Bari 5 5 100% 0 0%

Tika 5 5 100% 0 0%

Icha 5 5 100% 0 0%

Jumlah & Persentase

(11)

Berdasarkan tabel 2 dan tabel 3 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 90

%. Berdasarkan tabel 3 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain sistem memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Hal ini dikarenakan dalam sistem fuzzy digunakan logika “AND” untuk masing-masing rule. Sehingga apabila salah satu rule segmen tidak terpenuhi, maka input akan langsung tidak dikenali oleh sistem. Oleh karena itu sistem ini sangat baik dalam mengidentifikasi penutur yang bukan berasal dari filebase sistem.

Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 93,33%

Hasil dan Pembahasan Identifikasi Penutur MFCC – Fuzzy

Untuk Membership Function masukan, terdapat 5 (lima) variabel input yaitu variabel meanMFCC1, meanMFCC2, meanMFCC3, meanMFCC4, dan meanMFCC5.

Untuk variabel keluaran terdapat 5 (lima) membership function yaitu speaker “Putra”, “Rahman”, “Budi”,

“Chandra”, dan “Rio”. Pada membership function keluaran hanya berupa singleton karena sistem inferensi fuzzy yang digunakan adalah FIS Sugeno Orde Nol. Untuk membership function masukan dapat dilihat pada Gambar 16 sampai Gambar 20

Gambar 16 Variabel input meanMFCC1

Gambar 19. Variabel input meanMFCC4

(12)

Gambar 20. Variabel input meanMFCC5

Rule Fuzzy Sistem MFCC – fuzzy Karena penelitian ini bertujuan untuk membandingkan dua metoda ekstraksi ciri yang berbeda dalam sistem identifikasi penutur, maka digunakan data masukan yang sama dalam pembentukan dan pengujian sistem fuzzy. Dalam sistem MFCC – Fuzzy ini, karakter suara masing- masing penutur diwakili oleh 5 (lima) buah data berupa nilai rata-rata koefisien cepstrum (meanMFCC) hasil ekstraksi parameter MFCC yang telah dibagi menjadi 5 (lima) segmen. Data-data tersebut kemudian dibandingkan kembali dengan membership function setiap meanMFCC yang telah terbentuk.

Hasil perbandingan ini akan menentukan pada rentang nilai mana data tersebut berada dalam ketujuh rentang nilai dalam setiap meanMFCC yaitu : lowest, very low, low, medium, high, very high, highest. Jumlah rule yang terdapat pada sistem ini berjumlah 5 (lima) buah rule dimana setiap penutur memiliki satu buah rule. Masing- masing rule untuk setiap speaker atau penutur dapat dilihat pada tabel 5.8.

(13)

Tabel 5. Rule Fuzzy Sistem Identifikasi Penutur MFCC – Fuzzy

Analisa Hasil Pengujian Sistem MFCC – Fuzzy

Suara yang diujikan pada sistem MFCC-Fuzzy sama dengan pengujian FFT-Fuzzy. Pengujian pertama untuk suara penutur yang telah dijadikan filebase. Pengujian kedua yaitu juga suara penutur yang dijadikan filebase tetapi mengucapkan kalimat yang berbeda dengan pelatihan. Pengujian terakhir yaitu pengujian terhadap suara penutur yang bukan berasal dari penutur filebase sistem.

Speaker

Rule yang Digunakan (menggunakan operator AND) meanMF

CC1

meanMFCC2 meanMFCC3 meanMFCC4 meanMFCC5

Putra Lowest Lowest Lowest Lowest Lowest

Rahman Highest Highest Highest Highest Highest

Budi Medium Medium Medium Medium Medium

Chandra High High High High High

Rio Low Low Low Low Low

(14)

Tabel 6 Hasil Pengujian Penutur sebagai filebase (Jenis pengujian 1) metodaMFCC

penutur Jumlah % Jumlah %

Putra 10 9 90% 1 10%

Rahman 10 10 100% 0 0%

Budi 10 9 90% 1 10%

Chandra 10 10 100% 0 0%

Rio 10 10 100% 0 0%

Jumlah & Persentase

Tabel 7. Hasil Pengujian Penutur dalam filebase dengan kalimat yang berbeda dengan kalimat pembentukan rule (pengujian 2) metoda MFCC

penutur Jumlah % Jumlah %

Putra 10 9 90% 1 10%

Rahman 10 10 100% 0 0%

Budi 10 8 90% 2 10%

Chandra 10 9 100% 1 0%

Rio 10 10 100% 0 0%

Jumlah & Persentase

Tabel 8. Hasil pengujian penutur yang bukan merupakan filebase MFCC

Pengenalan penutur tidak

dikenali

Kesalahan Pengenalan

penutur

Jumlah % Jumlah %

Bari 5 5 100% 0 0%

Tika 5 5 100% 0 0%

Icha 5 5 100% 0 0%

(15)

Berdasarkan tabel 6 dan tabel 7 dapat dinyatakan bahwa sistem mampu mengidentifikasi penutur yang ada dalam data base baik megucapkan kalimat yang sama maupun berbeda dengan kalimat pelatihan, dengan akurasi 94 %.

Berdasarkan tabel 8 dapat dinyatakan bahwa sistem mampu menolak atau tidak mengenali penutur yang tidak terdapat dalam data base dengan kata lain memiliki respon yang sangat baik dalam mengidentifikasi penutur yang tidak memenuhi rule fuzzy dalam sistem identifikasi ini. Berdasarkan tabel 2,3,4 didapatkan akurasi rata-rata sistem identifikasi penutur dengan metoda FFT-fuzzy mencapai 96%

Analisa Perbandingan Hasil Ekstraksi Parameter

Berdasarkan hasil yang didapat, kedua metoda ekstraksi parameter tersebut dapat digunakan dalam sistem pengenalan identifikasi penutur menggunakan logika fuzzy.

Hal ini dikarenakan akurasi yang dicapai untuk masing-masing metoda dalam identifikasi penutur cukup baik meskipun terdapat perbedaan yang signifikan dalam hal akurasi sistem. MFCC-Fuzzy memiliki akurasi 96 % sedangkan FFT-fuzzy memiliki akurasi 93,33%

Dalam hal ini proses ekstraksi parameter memegang peranan cukup penting dalam mendesain sistem identifikasi penutur yang baik dan akurat. Metoda segmentasi FFT – fuzzy memiliki akurasi yang lebih rendah karena data ekstraksi ciri hasil segmentasi FFT lebih bervariasi dan memiliki range atau rentang yang cukup lebar dalam mengekstrak beberapa suara penutur yang sama. Hal ini juga berpengaruh kepada pembentukan rule fuzzy. Rentang yang cukup lebar tersebut membuat sistem mengenali penutur terkadang sebagai penutur lain, karena pada proses pengidentifikasian ada

beberapa membership function (dalam hal ini berupa segmen- segmen input) penutur yang bernilai sama dengan penutur lain.

Sedangkan dalam metoda MFCC - fuzzy, hampir seluruh penutur memiliki data hasil ekststraksi parameter yang berbeda secara signifikan untuk setiap penutur.

Sehingga hal ini berpengaruh kepada kemudahan pembentukan rule dan akurasi yang bisa dicapai oleh sistem fuzzy dalam pengidentifikasian.

Perbedaan akurasi yang disebabkan oleh ekstraksi parameter tersebut merujuk kepada tahapan ekstraksi pada kedua metoda.

Sistem dengan ekstraksi parameter menggunakan MFCC memiliki akurasi lebih tinggi dikarenakan proses ekstraksi lebih mendekati sistem pendengaran manusia.

Dimana setelah dilakukan proses transformasi ke dalam domain frekuensi menggunakan FFT, sinyal suara diolah lagi dengan cara memetakan frekuensi sinyal tersebut ke dalam frekuensi mel untuk mendapatkan hasil yang lebih merepresentasikan bagaimana sinyal suara tersebut dipersepsikan oleh telinga manusia. Proses

dilanjutkan dengan

mentransformasikan spektrum mel ke bentuk koefisien cepstral yang bisa mewakili karakter suara dari setiap penutur. Sedangkan pada ekstraksi parameter FFT proses ekstraksi hanya sampai pentransformasian sinyal dari domain waktu ke domain frekuensi dengan menggunakan FFT.

Kemudian sinyal disegmentasi dan dimodelkan oleh fuzzy sehingga hasil ekstraksi parameter kurang akurat dalam mewakili informasi karakter suara setiap penutur jika dibandingkan dengan MFCC, tetapi masih cukup baik jika digunakan dalam sistem identifikasi penutur dengan menggunakan logika fuzzy.

(16)

KESIMPULAN

Dari penelitian yang telah dilakukan, dapat disimpulkan bahwa :

1. Kualitas hasil ekstraksi parameter sangat mempengaruhi kinerja sistem dalam mengidentifikasi penutur.

2. Pengujian sistem identifikasi penutur segmentsi FFT – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 92% untuk kalimat yang sama, 88% untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata-rata akurasi 93,33%

3. Pengujian sistem identifikasi penutur MFCC – fuzzy dalam mengidentifikasi penutur filebase mencapai akurasi sebesar 96%

untuk kalimat yang sama, 92%

untuk kalimat yang berbeda, dan 100% untuk penutur diluar filebase, rata2 keberhasilan 96 % 4. Kedua metoda identifikasi

penutur memiliki akurasi yang

cukup baik dalam

mengidentifikasi penutur. Tetapi dalam hal ini sistem MFCC – fuzzy memiliki akurasi yang lebih tinggi.

DAFTAR PUSTAKA

[1] Buono, Agus, Wisnu Jatmiko, dan Benyamin Kusumoputro.

Perluasan Metode MFCC 1D ke 2D Sebagai Esktraksi Ciri pada Sistem Identifikasi Pembicara Menggunakan Hidden Markov Model (HMM). Makara, Sains, Vol. 13, No. 1, April 2009: 87- 93. Bogor : IPB. Depok : UI [2] Balentine,, Bruce . Speker

Identification And Verification.

Enterprise Integration Group.

http://www.w3.org/2008/08/siv/P apers/EIG/SIV-Workshop2009- Balentine-v0.04.pdf diakses pada tanggal 15 Agustus pukul 01.49 WIB.

[3] Chornas, Christian & Urs Hunkeler. Digital Signal Processing Mini-Project: An Automatic Speaker Recognition.

Ecole Polythecnique Federale De Lausanne.

[4] Devi, Harlin Fristianti.2009.

Aplikasi Voice Recognition pada Sistem Keamanan File Pribadi.

Proyek Akhir. Surabaya: PNES ITS.

[5] Herlim, Lukman. 2002.

Pengenalan Kata Dengan Menggunakan Fuzzy Logic Untuk Menggerakkan Robot Mobil. Surabaya : Universitas Kristen Petra.

[6] Lee, Ki Young. Local fuzzy PCA based GMM with dimension reduction. School of Electronic Engineering, Soong Sil University.

http://citeseerx.ist.psu.edu/viewd oc/download?doi=10.1.1.109.60 78&rep=rep1&type=pdf diakses pada tanggal 15 Agustus pukul 01.56 WIB.

[7] Lien, Nguyen T. H. A Speaker Recognition Method Based on Personal Identification Voice and Trapezoidal Fuzzy Similarity. 1Department of Computational Intelligence and Systems Science, Tokyo Institute of Technology.

http://www.cit.iit.bas.bg/CIT_08/

v8-4/40-56.pdf diakses pada tanggal 15 Agustus pukul 01.45 WIB.”

[8] Manunggal, Heri Sugianto.2005.

Perancangan dan Pembuatan Perangkat Lunak Pengenalan Suara Pembicara dengan Menggunakan Analisis MFCC Feature Extraction. Surabaya : Universitas Kristen Petra.

(17)

[9] Mustofa, Ali.2007. Sistem Pengenalan Penutur dengan Metode Mel-frequency Wrapping. Jurnal Teknik Elektro Vol. 7, No. 2, September 2007: 88 – 96. Malang : Universitas Brawijaya.

[10] Prihadi. 2010. Perancangan dan Implementasi sistem Pengenalan Ucapan Jenis Digit Speech Recognition dengan menggunakan Logika Fuzzy.

Tugas Akhir. Padang: Teknik Elektro Univeritas Andalas [11] Tran , Dat dan Michael Wagner.

Fuzzy Nearest Prototype Classifier Applied to Speaker Identification. University of Tasmania.

[12] Tran, Dat Tat. Fuzzy Approaches to speech and speaker recognation. University

of Canberra.

[13] Hellman, Martin. 2001. Fuzzy logic Introduction

[14] Ishibuchi,Hisao;Tadahiko

Murata, and Mitsuo Gen.

Performance Evaluation of

Fuzzy Rule-Based

Classification Systems Obtained by Multi-Objective Genetic Algorithms.1998

[15] Prateek Srivastava, Reena Panda, A Novel, Robust, Hierarchical, Text-Independent Speaker