• Tidak ada hasil yang ditemukan

SPEAKER RECOGNITION MENGGUNAKAN OVERLAP DEKOMPOSISI PAKET WAPELET DAN JARINGAN SYARAF TIRUAN ART2 (ADAPTIVE RESONANCE THEORY2)

N/A
N/A
Protected

Academic year: 2021

Membagikan "SPEAKER RECOGNITION MENGGUNAKAN OVERLAP DEKOMPOSISI PAKET WAPELET DAN JARINGAN SYARAF TIRUAN ART2 (ADAPTIVE RESONANCE THEORY2)"

Copied!
8
0
0

Teks penuh

(1)

SPEAKER RECOGNITION MENGGUNAKAN OVERLAP DEKOMPOSISI PAKET WAPELET DAN JARINGAN SYARAF TIRUAN ART2 (ADAPTIVE RESONANCE

THEORY2)

Wahyudi¹, Achmad Rizal², Jangkung Raharjo ³

¹Teknik Telekomunikasi, Fakultas Teknik Elektro, Universitas Telkom

Abstrak Kata Kunci : -Abstract Keywords :

(2)

-Bab I Pendahuluan 1

BAB I

PENDAHULUAN

1.1Latar Belakang

Meskipun banyak pengolahan suara seperti speech and speaker recognition yang dicapai dengan level performansi tertentu dan meskipun sudah banyak produk yang dikeluarkan pada saat ini, ternyata masih belum didapatkan solusi yang sempurna, sehingga banyak riset dilakukan. Misalnya masalah didalam mendapatkan parameter yang paling tepat dan memuaskan dari sebuah sinyal suara pada speaker recognition.

Mel-Frequency Cepstral Coefisien (MFCC) adalah fitur suara yang sering dipakai

untuk proses speaker recognition pada akhir-akhir ini, karena dianggap mempunyai performansi yang lebih baik dibandig fitur lain [1]. Tujuan speaker recognition adalah untuk membedakan suara manusia dengan mengolah informasi pada spektral suara manusia, semakin detil informasi yang didapat maka pembedaan suara akan semakin baik. Pada dasarnya transformasi wavelet merupakan subuah teknik pemrosesan sinyal beresolusi ragam. Dengan sifat penskalaanya, wavelet dapat memilah-milah suatu sinyal data berdasarkan komponen frekuensi yang berbeda-beda. Dengan demikian masing-masing bagian dapat dipelajari berdasarkan skala resolusi yang sesuai. Sehingga diperoleh gambaran data secara keseluruhan dan lebih detil. Discrete Wavelet Packet

Transform (DWPT) merupakan kondisi khusus dari Overlapping Discrete Wavelet Packet Transform (ODWPT). Penggunaan ODWPT sebagai alternatif untuk ekstraksi

fitur suara akan digunakan pada speaker recognition sehingga diharapkan dapat memperoleh hasil pembedaan suara yang lebih baik hingga didapatkan tingkat keberhasilan sistem hingga 85%.

Sebuah sistem aplikasi memerlukan sebuah sistem keamanan. Speaker

recognition dapat digunakan untuk pasword suara pada subuah sistem aplikasi komputer.

Sehingga hanya orang tertentu dengan suara yang cocok yang dapat menjalankan sistem aplikasi.

1.2Tujuan dan Manfaat 1.2.1 Tujuan

Tujuan dari penelitian yang akan dilakukan yaitu meliputi :

Tugas Akhir - 2007

(3)

Bab I Pendahuluan 2

1. Mengetahui parameter-parameter/ciri khas suara manusia sehingga dapat dilakukan pembedaan suara antara orang satu dengan yang lain.

2. Membuat fitur suara manusia baru yang lebih baik dan diharapkan mendapatkan tingkat keberhasilan sistem mencapai 85%.

3. Memberikan pasword suara (speaker recognition) pada sebuah sistem aplikasi sehingga lebih aman dan nyaman.

4. Merekayasa proses ekstraksi dan atau klasifikasi fitur suara sehingga sistem yang ada dapat digunakan untuk jangka waktu yang lebih panjang.

1.2.2 Manfaat

Manfaat dari penelitian tugas akhir ini yaitu :

1. Untuk menambah wawasan dan pengetahuan tentang teknologi speech

proccessing.

2. Sebagai bahan masukan bagi para operator selular dan industri telekomunikasi atau informasi di Indonesia dalam usaha untuk menambah fasilitas kemanan dengan speaker recognition untuk membuka suatu sistem aplikasi.

3. Dapat dijadikan referensi sebagai sistem pengolahan suara khususnya speech dan

speaker recognition.

1.3 Rumusan Masalah

Blok diagram dalam penelitian ini secara garis besar adalah seperti pada Gambar 1.1 berikut :

Gambar 1.1. Blok diagram umum simulasi

Masalah yang akan diteliti dalam Tugas Akhir ini yaitu bagaimana caranya melakukan proses speaker recognition dengan pertimbangan :

1. Ejaan bahasa mana yang digunakan saat pengucapan suara.

2. Berapa banyak jumlah suara test (fitur tes) dan berapa jumlah database suara (fitur model) yang dibutuhkan untuk simulasi ini.

(4)

Bab I Pendahuluan 3

3. Berapa lama dilakukan perekaman suara.

4. Bagaimana spesifikasi PC (komputer) yang digunakan untuk mengeksekusi proses speaker recognition.

5. Mother wavelet apa yang digunakan pada ekstraksi fitur suara ini.

6. Metode apa yang digunakan untuk proses klasifikasi fitur suara. 7. Tools apa yang digunakan dalam simulasi ini.

1.4Batasan Masalah

Batasan masalah yang digunakan dalam Tugas Akhir ini adalah:

1. Ejaan bahasa yang digunakan saat pengucapan suara adalah Bahasa Indonesia.

2. Jumlah suara test (fitur tes) yang digunakan adalah 20 suara wanita dan 20 suara pria. Jumlah database suara (fitur model) yang dibutuhkan untuk simulasi ini adalah 5 suara pria dan 5 suara wanita.

3. Lama perekaman suara tergantung lamanya pengucapan satu kata.

4. Spesifikasi PC (komputer) yang digunakan untuk mengeksekusi proses

speaker recognition adalah sebagai berikut : Intel Pentium 4 CPU 1.80GHz,

Memory 225MB RAM.

5. Mother wavelet yang digunakan pada ekstraksi fitur suara ini adalah

Daubechies 4.

6. Metode yang digunakan untuk proses klasifikasi fitur suara adalah Jaringan Syaraf Tiruan Adaptive Resonance Theory2 (JST ART2).

7. Tools yang digunakan dalam simulasi ini adalah Software Matlab 7.0.

1.5Hipotesis

Rumusan hipotesis awal tugas akhir ini adalah:

1. Dengan ODWPT akan diperoleh fitur suara manusia dengan kinerja yang lebih baik dengan tingkat keberhasilan sistem mencapai 85%.

2. ODWPT adalah fitur yang cocok untuk proses speaker recognition pada suara yang direkam secara langsung.

1.6Metodologi Penelitian

Metodologi penelitian yang digunakan dalam tugas akhir ini adalah: 1. Studi literatur

Tugas Akhir - 2007

(5)

Bab I Pendahuluan 4

Mempelajari berbagai referensi tentang ODWPT, JST ART2, dan teori pendukung lainnya.

Diskusi dan konsultasi dengan dosen pembimbing 2. Analisa masalah.

3. Desain dan perancangan. 4. Simulasi.

1.7 Sistematika Penulisan

BAB I PENDAHULUAN

Berisi latar belakang masalah, perumusan masalah, tujuan penulisan, batasan masalah, metodologi penelitian, dan sistematika penulisan

BAB II DASAR TEORI

Menjelaskan prinsip speaker recognition yang didasarkan oleh proses ekstraksi fitur ODWPT dan proses klasifikasi fitur JST ART2.

BAB III PERANCANGAN DAN IMPLEMENTASI SISTEM

Membahas proses perancangan spesifikasi teknis, diagram blok sistem

speaker recognition, skenario yang dibuat untuk simulasi, dan

parameter-parameter yang akan diuji dan dianalisa.

BAB IV PENGUJIAN DAN ANALISIS SISTEM

Menganalisa secara umum parameter-parameter fitur suara ODWPT serta kinerjanya dibandingkan dengan fitur-fitur yang sudah ada sebelumnya

BAB V KESIMPULAN DAN SARAN

Berisi kesimpulan dari hasil simulasi serta saran-saran yang dapat digunakan untuk penelitian berikutnya.

(6)

Bab V Kesimpulan dan Saran 67

BAB V

KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan dari seluruh penelitian yang sudah dilakukan dan berikutnya ada beberapa saran untuk pengembangan lebih lanjut dari hasil-hasil maupun metode yang sudah dibahas.

5.1Kesimpulan

Dari seluruh penelitian yang sudah dikerjakan didapatkan beberapa kesimpulan sebagai berikut:

1. Fitur yang menjadi ciri dari suara manusia adalah energi dari tiap subband dari dekomposisi yang dirancang tetapi sudah dikompres dengan Logarithmic

Compression dan Descrete cosine Transform.

2. Dari penelitian yang sudah dilakukan, parameter JST ART2 dan mother wavelet yang paling optimal pada desain ke-1 (speaker recognition untuk all task) secara berturut-turut adalah sebagai berikut. a = 10, b = 0.1, c = 0.1, d = 0.5, ?=0.999, ? = 0.01, a = 0.9, iterasi = 3, dan mother wavelet=Daubechies6, sedangkan untuk desain ke-2 pada speaker recognition untuk password aplikasi komputer (specific

task) adalah a = 10, b = 1, c = 2, d = 0.98, ?= 0.999, ? = 0.000000002, a = 0.07,

iterasi = 3, dan mother wavelet=Daubechies6.

3. Pada desain ke-1, sistem yang dirancang adalah untuk seluruh kata (speaker

recognition untuk all task) sehingga subband yang digunakan adalah seluruhnya.

Akurasi yang didapatkan pada desain ke-1 ini mencapai 86,1% dan waktu komputasi kurang lebih 5,5 menit.

4. Pada desain ke-2, sistem yang dibuat digunakan untuk tujuan yang lebih spesifik yaitu untuk password suatu aplikasi komputer. Dari skenario perancangan didapatkan hasil akurasi hingga mencapai 88,64% dan waktu komputasi adalah kurang lebih 6,5 menit.

5. Pola suara manusia yang dapat dikenali pada desain ke-2 lebih detil dibandingkan desain ke-1 karena desain ke-2 memiliki tingkat akurasi yang lebih tinggi, tetapi waktu komputasi pada desain ke-2 lebih lama dibandingkan dengan desain ke-1.

Tugas Akhir - 2007

(7)

6. Ekstraksi fitur dengan menggunakan metode ini mempunyai beberapa kelebihan, diantaranya adalah sistem bersifat time invariant. Metode ini tidak tergantung pada perbedaan lama waktu perekaman atau pengambilan data suara. Data yang panjang maupun pendek akan dapat langsung masuk sistem. Kelebihan lain juga terletak pada sifat yang dimiliki oleh metode ODWP yang tidak mengharuskan data yang diproses memiliki jumlah vektor kelipatan 2jo. Hal ini jelas berbeda apabila metode yang digunakan adalah LPC yang mengharuskan data inputan memiliki panjang vektor yang sama, atau metode DPW yang mengharuskan data inputan memiliki jumlah vektor kelipatan 2jo. Pada metode ODPW disini, pembagian subband-subband yang diinginkan juga cukup mudah sesuai yang diinginkan dan proses komputasi yang dilakukan juga mudah untuk diimplementasikan ke dalam perangkat lunak, karena dekomposisi yang dilakukan adalah menghitung koefisien seperti pada penggunaan filter biasa

7. Hasil perancangan yang didapat sesuai dengan hipotesis yang diajukan bahwa suara manusia dapat dikenali dari spektral frekuensinya, sehingga metode dekomposisi ODPW yang dirancang dan JST ART2 terbukti mampu mengenali suara manusia yang diujikan dengan akurasi mencapai 88,64%.

8. Kelemahan dari sistem ini adalah lama waktu komputasi yang tergolong cukup lama sehingga perlu dipertimbangkan kembali algoritma yang digunakan dalam program.

5.2Saran

Adapun beberapa saran untuk pengembangan pada penelitian berikutnya adalah sebagai berikut:

1. Harus dicoba dengan Jaringan Syaraf Tiruan yang lain seperti back propagation atau JST supervised learning yang lain agar didapatkan sistem yang paling optimal dan paling handal dari segi akurasi dan lama waktu komputasinya.

2. Untuk mendapatkan tingkat akurasi yang lebih aktual dapat dilakukan dengan menambah data suara latih (data untuk mendefinisikan neuron) dan juga menambah data tes (data untuk pegetesan).

3. Untuk mengurangi waktu komputasi dapat dilakukan dengan lebih menspesifik-kan tujuan sistem sehingga hanya subband-subband tertentu yang dikomputasi.

(8)

Bab V Kesimpulan dan Saran 69

4. Dapat ditambahkan kata lain ataupun kalimat yang lebih panjang untuk aplikasi tertentu yang diinginkan, yang pastinya memperhatikan jumlah sampel pada frame yang diambil dan subband pada pohon wavelet yang digunakan.

5. Algoritma metode yang dilakukan disini sudah dalam operasi matriks yang tidak begitu rumit sehingga memungkinkan untuk ditanamkan pada embeded system sehingga password untuk banyak aplikasi yang lebih riil dapat dilakukan (seperti: buka-tutup pintu, nyala mati lampu, atau yang lainnya).

6. Dengan inputan kata yang lebih panjang memungkinkan untuk mendesain sebuah perangkat lunak yang dapat digunakan untuk keperluan penyelidikan di bidang keamanan, yaitu mencari buronan yang sudah terekam suaranya.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2007

Gambar

Gambar 1.1. Blok diagram umum simulasi

Referensi

Dokumen terkait

Dalam situasi resmi atau formal sebagai warga negara yang baik seharusnya kita dapat menggunakan bahasa Indonesia dengan baik dan benar.. Setiap warga negara Indonesia wajib

Selama 1 bulan terakhir, pada pukul berapa biasanya Anda bangun tidur di.

Analisa pada L71 terjadi perbedaan panjang lengkung yang signifikan antara IMT kurang dan.

SOGO Department Store Sun Plaza Medan menawarkan produk melalui spanduk yang menarik perhatian saya.. Saya mengetahui informasi mengenai SOGO Department Store Sun

Berapa Harga Obat Sipilis No 1 Paling Manjur Di Apotik ~ Untuk harga untuk mengobati sebuah penyakit biasanya orang tidak akan memperhitungkannya,tetapi ada sebagian

5) Ujian susulan dilaksanakan paling lambat 1(satu) minggu setelah masa UAS berakhir. Waktu ujian susulan ditentukan oleh Dosen bersangkutan. 6) Naskah soal ujian susulan

Himpunan Peraturan Daerah Tahun 2014 128 Perubahan Fungsi Kawasan Hutan Seluas ± 10.878 (sepuluh ribu delapan ratus tujuh puluh delapan) Hektar dan Penunjukan Bukan

revisi dilakukan sesuai dengan saran / masukan dari dewan penguji. Berkas ujian skripsi diserahkan kepada Staf Akademik Fakultas. 7. Staf Akademik Fakultas merekap Berita Acara