• Tidak ada hasil yang ditemukan

DAFTAR LAMPIRAN

4.7 Pengaruh Parameter Pembentuk Data Cir

Untuk mel 16, overlap 40%, dan lebar waktu frame 16 ms pengujian sistem memberikan nilai akurasi 86% untuk data Pca80, 90% untuk data Pca90, 91% untuk data Pca95, dan 92% untuk data ciri vekt_mfcc. Dari ketiga nilai akurasi yang dihasilkan data Pca80, Pca90,dan Pca95, diketahui bahwa rasio nilai eigen 0,95 dapat memberikan nilai akurasi yang lebih baik dan menyamai nilai akurasi yang diberikan data ciri vekt_mfcc. Meningkatkan nilai parameter lebar waktu frame dari 16 ms menjadi 30 ms, atau 40 ms, untuk dipasangkan dengan mel 16

dan overlap 40%, memberi peningkatan nilai akurasi sistem sebesar 3% untuk data Pca80, 1% untuk data Pca90 dan Pca95, sedangkan untuk data vekt_mfcc tidak mengalami perubahan nilai akurasi, lihat Gambar 29.

Gambar 29 Perbandingan nilai akurasi kelompok data 1, 2, dan 3

Untuk mel 16, overlap 50%, dan lebar waktu frame 16 ms pengujian sistem memberikan nilai akurasi 88% untuk data Pca80, 92% untuk data Pca90, 92% untuk data Pca95, dan 94% untuk data ciri vekt_mfcc.

Meningkatkan nilai parameter lebar waktu frame dari 16 ms menjadi 40 ms, untuk dipasangkan dengan mel 16 dan overlap 50%, memberi peningkatan nilai akurasi sistem sebesar 3% untuk data Pca80, 2% untuk data Pca95. untuk data Pca90 terjadi penurunan sebesar 1%, sedangkan untuk data vekt_mfcc tidak terjadi perubahan nilai akurasi.

Dari ketiga nilai akurasi yang dihasilkan Pca80, Pca90, dan Pca95 diketahui bahwa rasio nilai eigen 0,95, memberikan nilai akurasi yang lebih baik dibandingkan nilai akurasi yang diberikan data dengan rasio nilai eigen 0,80, dan 0,90. Nilai akurasi data Pca95 mampu menyamai nilai akurasi yang diberikan data vekt_mfcc, lihat Gambar 30.

Untuk mel 16, peningkatan nilai parameter overlap dari 40% menjadi 50%, mampu meningkatkan nilai akurasi sistem hingga 2,13%, yaitu dari 92% menjadi 94%, untuk data Pca95 pada lebar frame 40 ms.

Gambar 30 Perbandingan nilai akurasi kelompok data 4, 5, dan 6

Untuk mel 20, overlap 50%, dan lebar waktu frame 16 ms pengujian sistem memberikan nilai akurasi 90% untuk data Pca80, 94% untuk data Pca90, 93% untuk data Pca95, dan 94% untuk data ciri vekt_mfcc.

Meningkatkan nilai parameter lebar waktu frame dari 16 ms menjadi 30 ms, untuk dipasangkan dengan mel 20 dan overlap 50%, memberi peningkatan nilai akurasi sistem sebesar 1% untuk data Pca80 dan vekt_mfcc, 2% untuk data Pca95, untuk data Pca90 terjadi penurunan sebesar 1%. Sedangkan meningkatkan nilai lebar frame dari 16 ms menjadi 40 ms, memberi peningkatan nilai akurasi sebesar 2% untuk data Pca80 dan data vekt_mfcc, 3% untuk data Pca95, dan tidak terjadi perubahan nilai akurasi untuk data Pca90, lihat Gambar 31. Dengan waktu komputasi yang lebih baik, data Pca95 mampu menyamai nilai akurasi yang diberikan data vekt_mfcc pada lebar frame 30 ms dan 40 ms

Dari ketiga nilai akurasi yang dihasilkan Pca80, Pca90, dan Pca95, sekali lagi rasio nilai eigen 0,95, mampu memberikan nilai akurasi yang lebih baik dibandingkan nilai akurasi yang diberikan data dengan rasio nilai eigen 0,80, dan

0,90. Untuk overlap 50%, peningkatan nilai koefisien mel dari 16 menjadi 20 mampu meningkatkan nilai akurasi sistem hingga 2,13%, yaitu dari 94% menjadi 96%, untuk data Pca95 pada lebar frame 40 ms.

Gambar 31 Perbandingan nilai akurasi kelompok data 10, 11, dan 12.

Keberhasilan data penelitian dalam mendukung kerja sitem tidak lepas dari peran pasangan nilai parameter. Dari 3 nilai parameter lebar waktu frame, 2 nilai parameter overlap, dan 2 nilai parameter koefisien mel, terbentuk 12 kelompok data penelitian. Dari ke 12 kelompok data penelitian, data vekt_mfcc dan Pca95 yang dibentuk menggunakan nilai koefisien mel 20, lebar frame 40 ms dan overlap 50% (kelompok data 12) memberikan nilai akurasi sebesar 96%, dan merupakan nilai akurasi tertinggi, ditinjau dari penggunaan waktu komputasi, penggunaan data ciri Pca95 lebih baik dibandingkan penggunaan data vekt_mfcc, lihat Gambar 27.

5.1 Simpulan

Dari hasil penelitian yang diperoleh, dapat disimpulkan bahwa:

Pada proses ekstraksi ciri, penerapan kombinasi metode PCA dengan metode MFCC dapat mereduksi dimensi vektor suara hingga 99%, sedangkan penerapan metode MFCC tanpa metode PCA hanya dapat mereduksi vektor suara hingga 92%.

Data Pca95 (20.40.50), yaitu data ciri yang dihasilkan proses ekstraksi ciri dengan parameter koefisien mel 20, lebar waktu frame 40 ms, lebar overlap 50%, dan rasio nilai eigen 95%, dapat memberikan nilai akurasi sebesar 96% dengan waktu komputasi 90% lebih baik dibandingkan data ciri vekt_mfcc (20.40.50).

Pengaruh white gaussian noise sebesar 40 desibel pada sinyal suara dapat menyebabkan penurunan nilai akurasi rata – rata hingga 7%, sedangkan pengaruh noise sebesar 30 desibel menyebabkan penurunan nilai akurasi rata – rata hingga 22%.

5.2 Saran

Penelitian ini masih jauh dari sempurna, sehingga perlu dilakukan kajian lebih lanjut dalam hal:

1 Pengembangan teknik yang lebih baik untuk mendapatkan sistem identifikasi pembicara yang lebih handal terhadap data penelitian yang terkontaminasi noise.

2 Penggunaan data penelitian yang lebih besar dan bervariasi, sehingga dapat dibuktikan apakah kinerja sistem yang dikembangkan benar memberi nilai postif (kepuasan) bagi pemakai.

Bolat B, Yildirim T. 2003. Performance increasing methods for probabilistic Neural Networks. Pakistan Journal of Information and Technology 2(3):250-255.

Campbell, J.P., 1997, Speaker Recognition: A Tutorial, Proceedings of the IEEE, Vol. 85, No. 9.

Furui S. 1997. Recent advances in speaker recognition. Pattern Recognition Letters 18: 859 – 872.

Ganchev T, Tsopanoglou A, Fakotakis N, Kokkinakis G. 2002a. Probabilistic Neural Networks Combined with GMMs for Speaker Recognition over Telephone Channels. 14th Int. Conf. On Digital Signal Processing, 2:1081- 1084.

Ganchev T, Fakotakis N, Kokkinakis G. 2002b. Speaker Verification System Based On Probabilistic Neural Neworks. NIST Speaker Recognition Evaluation Workshop, Virginia, USA.

Ganchev T. 2005 Speaker Recognition. Department of Computer and Electrical Engineering, University of Patras, Greece. [disertasi]

http://www.wcl.ee.upatras.gr/ai/papers/Ganchev_PhDThesis.PDF [7 Mei 2007]

Johnson R. A, Wichern R.E. 1998. Applied Multivariate Statistical Analysis. New Jersey, USA: Printice Hall, Inc.

Kantardzic, M. 2003. Data Mining: Concepts, Models, Methods, and Algorithms. New Jersey, USA: John Wiley & Sons, Inc.

Karpov E. 2003. Real-Time Speaker Identification [tesis]. Joensuu: department of Computer Science, Unversity of Joensuu.

Kusumadewi S. 2003. Artificial Intelligence (Teknik dan Aplikasinya). Yogyakarta: Graha Ilmu.

Li Min Fu. 1994. Neural Networks in Computer Intelligence. New York: The McGraw-Hill, Inc.

Low R, Togneri R. 1998. Speech Recognition Using the Probabilistic Neural Network. http://www.ee.uwa.edu/~roberto/research/speech/local/papers/- tr98-01.pdf [19 September 2005]

Porat B. 1997. A Course in Digital Signal Processing. New York: John Wiley & Sons, Inc.

Pressman, R.S. 1997. Software Engineering : A Practitioner’s Approach. New York: The McGraw-Hill, Inc.

Rabah Y. 2004, VoiceXML – Speech Recognition.

Rabiner L, Juang BH. 1993. Fundamental of Speech Recognition. New Jersey: PTR Prentice-Hall, Inc.

Reynolds D.A. 2002. An Overview of Automatic Speaker Recognition Technology. ICASSP: 4072 – 4075.

Russel SJ. Norvig P. 2003. Artificial Intelligence A Modern Approach. New Jersey: Prentice-Hall, Inc.

Shiavi R. 1991. Introduction to Applied Statistical Signal Analysis. USA: R.D. Irwin, Inc.

Specht D F. 1990. Probabilistic Neural Networks and Polynomial Adaline as Complementary Techniques for Classification. IEEE Transaction on Neural Networks 1(1):111-121.

__________1992. Enhancements to Probabilistic Neural Networks. IEEE Transaction on Neural Networks 3(1):761-768

Specht D F, Shapiro P D. 1991. Generalization Accuracy of Probabilistic Neural Networks Compared with Back-Propagation Networks. IEEE Transaction on Neural Networks 1:887-892

The Mathworks, Inc., 2004, Signal Processing Blockset, User’s Guide, Versi 6,

www.mathworks.com, [19 September 2005]

Zaknich A. 1995. A Modified Probabilistic Neural Networks for Signal Processing and Pattern Recognition [disertasi]. Western Australia: Department of Electrical and Electronic Engineering, The University of Western Australia.

Lampiran 1 Bentuk sinyal suara

Anta (asli)

Anta (noise 20 desibel)

Lanjutan

Aziz (asli)

Aziz (noise 20 desibel)

Lanjutan

Citra (asli)

Citra (noise 20 desibel)

Lanjutan

Didit (asli)

Didit (noise 20 desibel)

Lanjutan

Fitri (asli)

Fitri (noise 20 desibel)

Lanjutan

Intan (asli)

Intan (noise 20 desibel)

Lanjutan

Mijo (asli)

Mijo (noise 20 desibel)

Lanjutan

Sumrah (asli)

Sumrah (noise 20 desibel)

Lanjutan

Titin (asli)

Titin (noise 20 desibel)

Lanjutan

Wiwie (asli)

Wiwie (noise 20 desibel)

Dokumen terkait