TINJAUAN PUSTAKA Jenis Pengenalan Pembicara

Menurut Campbell (1997), pengenalan pembicara berdasarkan jenis aplikasinya dibagi dua, yaitu:

1. Identifikasi pembicara yaitu proses mengenali seseorang berdasarkan suaranya. Identifikasi pembicara dibagi dua, yaitu:

• Identifikasi tertutup (closed-set identification) di mana suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang telah terdaftar atau diketahui.

• Identifikasi terbuka (open-set identification) di mana suara masukan boleh tidak ada pada kumpulan suara pembicara yang telah terdaftar

2. Verifikasi pembicara yaitu proses memeriksa identitas yang diklaimkan seseorang berdasarkan suaranya.

Pengenalan pembicara berdasarkan aspek kebahasaan dibagi menjadi dua (Ganchev 2005), yaitu:

1. Pengenalan pembicara bergantung pada teks yang mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengujian. 2. Pengenalan pembicara bebas teks yang

tidak mengharuskan pembicara untuk mengucapkan kata atau kalimat yang sama baik pada pelatihan maupun pengujian. Dijitalisasi Gelombang Suara

Suara adalah gelombang longitudinal yang merambat melalui medium. Medium atau zat perantara ini dapat berupa zat padat, cair, atau gas. Manusia mendengar bunyi saat gelombang bunyi, yaitu getaran di udara atau medium lain, sampai ke gendang telinga manusia.

Gelombang suara merupakan gelombang analog, sehingga agar dapat diolah dengan peralatan elektronik, gelombang suara harus direpresentasikan dalam bentuk dijital. Proses

PENDAHULUAN

Latar Belakang

Sinyal suara dapat memberikan informasi mengenai identitas pembicara. Proses mengekstrak informasi yang diinginkan dari sinyal suara disebut speech processing. Speech processing memiliki beberapa cabang kajian. Salah satu kajian dalam speech processing adalah identifikasi pembicara. Identifikasi pembicara (speaker identification) adalah suatu proses mengenali seseorang berdasarkan suaranya (Campbell 1997).

Teknologi identifikasi pembicara telah digunakan untuk berbagai kepentingan, seperti konferensi audio dan penyelidikan polisi. Berbagai metode yang dapat digunakan untuk identifikasi pembicara, antara lain Dynamic Time Warping (DTW), Hidden Markov Model

(HMM), Vector Quantization (VQ), dan Jaringan Syaraf Tiruan seperti Multi Layer Perceptron dan Probabilistic Neural Network.

Pada penelitian ini akan dilakukan identifikasi pembicara menggunakan

Probabilistic Neural Network. Hal ini dikarenakan Probabilistic Neural Network

telah terbukti memiliki tingkat akurasi yang tinggi, yaitu 96%. (Sarimollaoglu et al. 2004).

Tujuan

Tujuan penelitian ini adalah mengembangkan model Probabilistic Neural Network untuk identifikasi pembicara. Penelitian ini juga dilakukan untuk membandingkan hasil identifikasi tanpa

threshold dan dengan threshold.

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada: 1. Identifikasi bersifat tertutup dan

bergantung pada teks yang mana suara masukan yang akan dikenali merupakan bagian dari sekumpulan suara pembicara yang terdaftar dan menggunakan kata “komputer” dalam pelatihan dan pengujian.

2. Ekstraksi ciri sinyal suara menggunakan

Mel-Frequency Cepstrum Coefficients

(MFCC).

3. Pembahasan difokuskan pada tahap pemodelan pembicara dengan

Probabilistic Neural Network, tidak pada pemrosesan sinyal analog sebagai praproses sistem.

Manfaat

Penelitian ini diharapkan dapat memberikan informasi mengenai tingkat akurasi Probabilistic Neural Network untuk identifikasi pembicara. Selain itu juga diharapkan model yang dihasilkan dapat digunakan untuk mengembangkan sistem identifikasi pembicara yang bersifat tertutup dan bergantung pada teks.

TINJAUAN PUSTAKA

Jenis Pengenalan Pembicara