• Tidak ada hasil yang ditemukan

Analisis Data Sinyal Wicara (Speech) Perekaman Dalam Ruangan Tertutup Dan Di Luar Ruangan Terbuka

N/A
N/A
Protected

Academic year: 2021

Membagikan "Analisis Data Sinyal Wicara (Speech) Perekaman Dalam Ruangan Tertutup Dan Di Luar Ruangan Terbuka"

Copied!
5
0
0

Teks penuh

(1)

45

Analisis Data Sinyal Wicara (Speech)

Perekaman Dalam Ruangan Tertutup Dan Di

Luar Ruangan Terbuka

Muhammad Zainal Altim

¹

Sriwijanaka Yudi Hartono

²

Bayu Adrian Ashad

³

1,2,3,Staf Pengajar, Jurusan Teknik Elektro Fakultas Teknik Universitas Muslim Indonesia, Jln. Urip Sumoharjo 90231INDONESIA

(telp: 0411-443685; fax: 0411-443685); e-mail: enal_altim191@yahoo.co.id, wijanaka2510@gmail.com, bayuadrianashad@umi.ac.id

ABSTRACT

Along with develop multimedia computer technology from various aspects, especially in the field of information technology and telecommunications to be able to get information by processing digital signals, especially speech signal processing. But to carry out speech signal transformation in signal processing requires apply the use of advanced multi-media computer sophistication. So that speech signal processing can be done by using computer software such as Matlab, C Language, Snack, wave surver and other sophisticated computer software that makes it easy for other applications. In this study the analysis of speech signal data (speech) results of recording in a closed room and outdoors with the help of Matlab software. Signal data recording is taken by recording sound data in an enclosed space and outdoors. The speech signal data extend .wav to facilitate the computation process. Based on the analysis of the results of the speech signal recording process, it turns out that the speech signal has a special feature in a particular region. Voice signal is a time-dependent function that makes it easy to analyze. Human speech signals have acoustic and non acoustic characteristics which consist of voice, anvoice and silent and have different pitches. The difference in speech signals when recording indoors and outdoors. The recorded speech signal results in a large amount of amplitude in an open room will be greater than the peak of the speech signal recorded in a closed room and outdoors. This is caused by the presence of other sounds coming in when recording in the form of other noise signals or interference that causes poor signal quality.

Keywords: speech signal, analysis, room

ABSTRAK

Seiring dengan perkembangan teknologi komputer multimedia dari berbagai aspek terutama dibidang teknologi informasi.dan telekomunikasi dalam rangka untuk dapat memperoleh informasi dengan proses pengolahan sinyal digital, khususnya pengolahan sinyal wicara (speech). Namun untuk melakukan trasnformasi sinyal wicara dalam pengolahan sinyal dibutuhkan suatu aplikasi dengan pemanfaatan kecanggihan komputer yang serba multi media. Sehingga pengolahan sinyal wicara dapat dilakukan dengan pemanfaatan software komputer seperti Matlab, Bahasa C, Snack, wave surver dan kecanggihan software komputer lainnya yang memudahkan untuk aplikasi lainnya. Dalam penelitian ini dilakukan analisis data sinyal wicara (speech) hasil perekaman di dalam ruangan tertutup dan di luar ruangan terbuka dengan bantuan software Matlab. Data rekaman sinyal yang diambil dengan perekaman data suara pada ruangan tertutup dan di luar ruangan terbuka . Data sinyal wicara tersebut berekstensi .wav untuk memudahkan proses komputasi. Berdasarkan dari analisis hasil proses perekaman sinyal wicara, ternyata sinyal wicara memiliki suatu cirri yang istimewa pada suatu kawasan tertentu. Sinyal suara merupakan suatu fungsi yang bergantung pada waktu (time invariant) sehingga memudahkan untuk analisis. Sinyal wicara manusia memiliki karakteristik akustik dan non akustik yang terdiri atas voice, anvoice dan silent serta mempunyai pitch yang berbeda-beda. Perbedaan sinyal wicara pada perekaman di dalam ruangan tertutup dan di luar ruangan terbuka. Sinyal wicara hasil perekaman tersebut terlihat jumlah amplitudo yang besar pada ruangan terbuka akan lebih besar daripada puncak sinyal wicara yang direkam di dalam runagan tertutup dan di luar ruangan terbuka. Hal ini diakibatkan adanya suara-suara yang lain masuk pada saat merekam berupa sinyal noise tambahan atau gangguan yang menyebabkan kualitas sinyal kurang baik.

Kata kunci : sinyal wicara, analisis, ruangan

I. PENDAHULUAN

Manusia di dunia ini untuk saling berinteraksi untuk saling berkomunikasi dan sebagainya adalah dengan menggunakan bahasa. Bahasa hakikatnya adalah udara yang dihembuskan mengalami hambatan maka terciptalah rangkaian bunyi yang ciri akustiknya

ditentukan oleh aliran nada. Oleh karena itu, bahasa tidak mugkin dapat dipisahkan dari semua kegiatan, tindakan dan aktivitas manusia di dalam segala segi kehidupan. Bahasa sebagai alat komunikasi merupakan kompetensi dasar kehidupan. Komunikasi tersebut dapat dilakukan dalam bentuk lisan atau

(2)

46 tulisan. Dengan kata lain melalui bahasa,

komunikasi dapat dilakukan kepada lawan berkomunikasi (V.R.C. Putri, 2014).

Seiring dengan perkembangn teknologi multimedia untuk menghasilkan rekaman suara yang menghasilkan suara yang jernih, dubber dan ekstraksi / transformasi suara lainnya untuk media pembelajaran. Melalui teknologi informasi saat ini, proses transformasi suara manusia (sinyal wicara) dapat dilakukan dengan melalui komputasi. Namun untuk melakukan transformasi sinyal wicara dibutuhkan suatu aplikasi yang dikembangkan secara khusus. i komputer. Dengan Input yang berupa sinyal wicara (speech) yang diolah dengan komputasi untuk

ekstraksi pitch (frekuensi dasar) guna untuk transformasi sinyal wicara untuk pengolahan selanjutnya yang dikenal ekstraksi cirri sinyal wicara (Ahmad, 2000).

Beberapa peneliti telah berhasil melakukan penelitian yang terkait dengan pengolahan sinyal wicara melalui komputasi teknologi informasi. Penelitian yang dilakukan oleh Dimple Garg,

Liljenctrant Fant, Sukhvinder yang menjelaskan bahwa untuk proses pengenalan sinyal wicara manusia ada beberapa parameter yang penting yaitu Cepstrum, Pitch dan Formant.

Penelitian yang akan dilakukan saat adalah menganalisis sinyal wicara (speech) hasil rekaman yang dilakukan di dalam ruangan tertutup dan di luar ruangan terbuka. Dengaa analisis tersebut dapat diamati pitch dan formant serta spektogram dari sinyal hasil rekaman. Data hasil rekaman tersebut juga dapat di transformasi sinyal wicara ke aplikasi selanjutnya sesuai kebutuhan seperti; dasar pembuatan peralatan alat komunikasi, dubbing dalam pembuatan film, suara robotik dan audio recorder.

II. LANDASAN TEORI

A. Sinyal Wicara (Speech)

Waktu berbicara, manusia menggunakan sekat rongga antara dada dan perut (diafragma) untuk mengalirkan udara ke paru-paru. Selanjutnya udara akan turun naik melalui saluran tenggorokan, lalu mengenai pita suara ehingga pita suara bergetar dan menghasilkan suara. Pita suara adalah jaringan otot yang mirip gendang yang robek separuh pada bagaian tengahnya. Sehingga getaran yang diproduksi pita suara akan menuju dua arah yaitu melalui lobang tenggorokan kemudian keluar melalui hidung dan mengalir dari tenggorokan lewat mulut. Didalam mulut gigi dan lidah menjadi filter sekaligus resonator (Childres, 2000, Quateri, 2014).

Sinyal wicara adalah sinyal yang dihasilkan oleh suara manusia dan biasanya mempunyai frekuensi kerja antara 0 – 5000 Hz. Sinyal wicara atau sinyal suara ucapan dapat dianggap sebagai sinyal yang secara berubah lambat (Slowly time varying signal), Pada selang waktu yang sangat singkat, yaitu pada 20 – 40 mdetik. Pada selang waktu tersebut , maka karakteristik sinyal wicara dapat dianggap stasioner

dan untuk selang waktu yang lebih lama atau sekitar 0,2 detik atau lebih, maka karakteristikdari sinyal tersebut tidak dapat dianggap stasioner. Sinyal wicara mempunyai sifat quasi periodic dan mempunyai unsure bunyi yang terkecil yang disebut pitch. Pitch manusia berbeda satu sama lainnya terutama berdasarkan jenis kelamin (Titon,2005,Sriwijanaka, 2007).

B. Karakteristik Sinyal Wicara (Speech)

Pada dasarnya bunyi merupakan hasil dari perbedaan dan variasi tekanan di udara yang diterima oleh permukaan gendang telinga. Bunyi dapat dihasilkan oleh getaran mekanis, gerakan sebuah benda yang melalui suatu media atau juga disebabkan terjadinya turbulensi fluida.

Untuk berkomunikasi, seseorang harus menghasilkan sinyal wicara berbentuk bunyi

gelombang tekanan udara. Gelombang tersebut kemudian dihantarkan melalui medium dari mulut pembicara ke telinga pendengar. Suara tersebut berasal dari gelombang tekanan udara pada tenggorokan, hidung dan mulut (Fant, 2004).

Sinyal wicara adalah merupakan komposisi dari rangkaian bunyi yang berperan sebagai representasi secara simbolis dari pikiran pembicara yang ingin disampaikan kepada yang mendengarkan. Susunan bunyi ditentukan oleh suatu aturan-aturan yang disebut bahasa atau dialek. Pembelajaran dan tata cara yang mempelajarinya disebut linguistik, sedangkan ilmu yang mempelajari tentang karakteristik produksi suara manusia terutama untuk kegunaan deskripsi, klarifikasi, maupun penerjemahan disebut fonetik.

Suara manusia adalah suatu bentuk gelombang bunyi yang kontinyu dengan frekuensi dasar berkisar antara 100 - 400 Hz, dimana di dalamnya terjadi serangkaian perubahan yang harmonik pada frekuensi dasar yang disebut formant, yang ditentukan oleh karakteristik frekuensi resonansi sistem wicara atau pita suara. Formant tersebut yang merupakan penentu berbagai variasi pengucapan vocal dan pergeseran diantaranya. Sedangkan suara konsonan yang lebih bising muncul pada frekuensi 2 KHz - 9 KHz.

Daya suara pada wicara dibawa oleh vokal yang mempunyai durasi berkisar antara 30 - 300 millidetik. Kejelasan utamanya diberikan oleh konsonan yang durasinya berkisar antara 10 - 100 millidetik dengan nilai 27 dB yang lebih rendah dibandingkan dengan vokal. Kekuatan sinyal wicara akan bervariasi dalam segala hal, sedangkan kekuatan frekuensi pembicaraan adalah merupakan individual yang bergantung pada kemampuan manusia lain menerima adanya perubahan formant. Dengan bentuk karakteristik seperti yang dijelaskan diatas pembicaraan memerlukan kebutuhan yang lebih ketat dan baik bila dibandingkan dengan aplikasi untuk music (Sriwijanaka, 2007).

C. Sinyal Wicara Bergetar (Voiced) Spektrum yang paling rendah pada sinyal

(3)

47 formant pertama. Pada frekuensi yang lebih tinggi

pada kanal suara (4 kHz) terdapat frekuensi formant yang kedua, ketiga dan keempat. Sinyal yang tidak bergetar memiliki spektra frekuensi dari nol sampai dengan tak terhingga, seperti spektra sinyal derau. Sinyal ini lebih sulit dianalisa mengingat karakteristiknya yang mirip sinyal derau. Sinyal bergetar relatif lebih mudah dianalisis dan mengandung unsur-unsur redundant. Bentuk satu periode pitch antara yang satu dengan yang lain memiliki bentuk yang mirip. Dengan kemiripan bentuk tiap perioda pitch , maka dapat dilakukan peroses peringkasan deretan sinyal dengan mengacu pada bentuk satu perioda yang paling mewakili bentuk-bentuk disekitarnya (Ahmad, 2000, Quateri, 2002).

III. METODE PENELITIAN

A. Bahan atau Materi Penelitian

Bahan yang digunakan dalam penelitian ini adalah suara manusia dewasa yang direkam menggunakan software MATLAB dengan frekuensi sampling 12 KHz,16 bit, mono yang menghasilkan file berformat “.Wav”. Data suara yang direkam tersebut adalah rangkaian kata-kata/ kalimat dalam bahasa Indonesia EYD yang diucapkan oleh pengucap tunggal dengan tekanan/ intonasi normal, tidak berbisik, berteriak dan suara yang dibuat-buat sebagai data base. Database hasil rekaman berupa file PCM yang berformat .wav . perekaman dilakukan di dalam ruangan dan d iluar ruangan terbuka.

B. Alat Yang Dipakai

Didalam melakukan penelitian dan pengambilan data serta proses perhitungan digunakan komputer dengan spesifikasi sebagai berikut :

PC Lenove intel core . Memory fisik 2500 Gbyte. Windows.

MATLAB sebagai bahasa pemrograman. Sound device.

Mikropon type dinamik .

C. Jalannya Penelitian

Dalam penelitian ini, langkah-langkah yang dilakukan adalah sebagai berikut :

1) Studi Kepustakaan

Studi kepustakaan dilakukan sebagai tahap pertama yakni melakukan pendalaman teori system sinyal wicara, representasi sinyal wicara melalui beberapa referensi berupa buku, tutorial, paper/proseding. Maka mulailah dicari kepustakaan yang mendukung pemencahan permasalahan ini termasuk penyusunan prosposal ini serta pustaka-pustaka yang mendukung lebih lanjut.

2) Pengambilan Data dan Analisis Pengambilan data dilakukan dengan cara melakukan merekam suara manusia yang direkam

sebagai database dalam data file yang berformat “.wav” tersebut kemudian dilakukan proses pengolahan digital yakni analisis dari data sinyal wicara tersebut.

Pertama-tama sinyal wicara hasil perekaman yang berformat .wav yang direkam di dalam ruangan dan di luar ruangan terbuka. Analisis dilakukan untuk mengamati perbedaan sinyal suara yang dihasilkan karena ada faktor-faktor lain yang mempengaruhi seperti noise. Hasil rekaman tersebut sebagai data sinyal wicara data base. Selanjutnya mengalami proses pengolahan sinyal digital (DSP) yaitu dimana sinyal wicara dilakukan proses sampling pada frekuensi sampling 12kHz. Proses selanjutnya adalah Mengamati keluaran dengan menganalisis bentuk sinyal wicara dengan implementasi kedua algoritma tersebut.

IV. HASIL DAN PEMBAHASAN

Data input merupakan data sinyal wicara (speech) yang diperoleh dengan cara merekam suara dengan memanfaatkan perangkat mikrofon kondenser, soundcard, laptop dan software matlab yang saling terintegrasikan. Data suara wicara yang direkam adalah penuturan kata-kata / kalimat dalam Bahasa Indonesia baku seperti saat berbicara biasa.

Teknik perekaman data dilakukan mulai jarak mikrofon dengan penutur/pengucap yang diusahakan sedekat ungkin, frekuensi sampling sebesar 12 kHz, penggunaan frekuensi ini adalah bertujuan agar hasil rekaman lebih halus dan jenis kanal yang digunakan adalah mono pada tingkat 16 bit. Kemudian selanjutnya hasil rekaman sebagai data base sinyal wicara (speech) di berikan ekstensi (format) Waveform Audio File Format (WAV).

Sinyal wicara yang berformat . WAV sebagai database sinyal suara adalah penuturan/ pengucapan kata-kata/ kalimat dalam Bahasa Indonesia Baku yang dilakukan di dalam ruangan tertutup dan di luar ruangan terbuka.

Simulasi yang dilakukan dengan cara mengambil data sinyal wicara secara real time yang tersimpan dalam database yang berformat WAV. Selanjutnya dilakukan proses pengujian dilakukan untuk mengamati apakah proses uji coba untuk implementasi pada data sinyal wcara (speech) dapat berjalan dengan baik.

Berikut ini hasil ditampilkan salah satu sampel hasil pengujian data sinyal wicara yang tersimpan di dalam database sinyal dengan penuturan kata/ kalimat “ / bukan lewat lagu/”.

Pada gambar 1 di bawah ini adalah bentuk sinyal wicara hasil perekaman yang dilakukan di dalam ruangan tertutup .

(4)

48 0.08 0.06 0.04 0.02 A m p lit u d o 0 -0.02 -0.04 -0.06 -0.080 0.5 1 1.5 2 2.5 Waktu (detik) 4 x 10 Gbr 1. Data Sinyal wicara perekaman di dalam ruangan tertutup

Sedangkan pada gambar 2 berikut ini adalah hasil perekaman yang dilakukan pada di luar ruangan terbuka. 0.05 0.04 0.03 0.02 Amp lit u d o 0.01 0 -0.01 -0.02 -0.03 -0.04 -0.050 0.5 1 1.5 2 2.5 3 3.5 4 Waktu (detik) 4 x 10 Gbr 2. Data Sinyal wicara perekaman di luar ruangan terbuka

Pada gambar 3 berikut ini adalah hasil analisis speech dari data sinyal wicara hasil perekaman di dalam ruangan tertutup . dapat dilihat frekuensi dasar (pitch), formant dan spectrogram dari sinyal tersebut.

Gbr 3. Hasil Analisis speech data sinyal wicara perekaman di dalam ruangan tertutup

Sedangkan hasil analisis speech dari hasil perekaman di luar ruangan terbuka dapat dilihat pada gambar 4 di bawah ini :

Gbr 4. Hasil perekaman di luar ruangan terbuka

Berdasarkan dari hasil perekaman dapat dilihat perbedaan sinyal wicara pada perekaman di dalam ruangan tertutup dan di luar ruangan terbuka Sinyal wicara hasil perekaman tersebut terlihat jumlah amplitudo yang besar pada ruangan terbuka akan lebih besar daripada puncak sinyal wicara yang direkam di dalam runagan tertutup dan di luar rungan terbuka. Hal ini diakibatkan adanya suara-suara yang lain masuk pada saat merekam berupa sinyal noise tambahan atau gangguan yang menyebabkan kualitas sinyal kurang baik. Sedangkan sinyal yang direkam dalam ruangan tertutup suara sangat jernih dan lebih jelas..

V. KESIMPULAN

Berdasarkan dari hasil penelitian yang dilakukan diperoleh kesimpulan :

1. Sinyal yang tidak bergetar memiliki spektra frekuensi dari nol sampai dengan tak terhingga, seperti spektra sinyal derau. Sinyal ini lebih sulit dianalisa mengingat karakteristiknya yang mirip sinyal derau. Sinyal bergetar relatif lebih mudah dianalisis dan mengandung unsur-unsur redundant. Bentuk satu periode pitch antara yang satu dengan yang lain memiliki bentuk yang mirip. Dengan kemiripan bentuk tiap perioda pitch , maka dapat dilakukan peroses peringkasan deretan sinyal dengan mengacu pada bentuk satu perioda yang paling mewakili bentuk-bentuk disekitarnya.

2. Berdasarkan dari hasil perekaman dapat dilihat perbedaan sinyal wicara pada perekaman di dalam ruangan tertutup dan di luar ruangan terbuka Sinyal wicara hasil perekaman tersebut terlihat jumlah amplitudo yang besar pada

(5)

49 ruangan terbuka akan lebih besar daripada

puncak sinyal wicara yang direkam di dalam runagan tertutup dan di luar rungan terbuka.

REFERENSI

[1] Akhmad Arman, dan Eric, T.,Pengembangan Speech

Synthesizer Concatentation Untuk Bahasa Indonesia”,

Prosiding Seminar Multimedia Dan Networking , ITB, Bandung, hal.213-216, 2000

[2] Childers Donald, G., Speech Processing And Synthesis

Toolboxes , John Wiley And Sons Inc, New York, 2000

[3] Dinar Mutiara, Titik Nurhayati,” Penentuan Pitch Sinyal

Ucapan Huruf Vokal Pria dan Wanita Dalam Bahasa Indonesia”., Jurnal Pengembangan dan Teknik Volume II No. 2 ISSN 1410-9840, 2009

[4] Fant Gunnar, Speech Acoustics And Phonetic, Kluwer

Academic Publishers, Dordrecht / Boston / London, 2004

[5] Inung Wijayanto, Reni Dwifebrianti, “Jenis Jangkauan Suara

Pada Pria dan Wanita Menggunakan Metode Mel-Frequency Cepstral Coefficient dan Jaringan Saraf Tiruan Back Propagation”., Konferensi Nasional Sistem dan Informatika, ITT, Bandung, 2013

[6] Quatieri F. Thomas, Discrete-Time Speech Signal

Processing : Principles and Practice, Prince Hall PTR,

Referensi

Dokumen terkait

Untuk membuat objek pada WebGL, yang pertama kali dilakukan adalah dengan menentukan vertex dari objek dan disimpan pada sebuah array. Lalu dengan menggunakan

Dengan keyakinan bahwa semua anak dilahirkan sama, kesimpulan dari hasil ini adalah yang diajarkan di Indonesia berbeda dengan yang diujikan [yang distandarkan]

Orang Kelantan, walau pun yang berkelulusan PhD dari universiti di Eropah (dengan biasiswa Kerajaan Persekutuan) dan menjawat jawatan tinggi di Kementerian atau di Institusi

Keterkaitan langsung dan tidak langsung ke belakang menunjukkan akibat dari suatu sektor tertentu terhadap sektor-sektor yang menyediakan input antara bagi sektor tersebut baik

Pengembangan manajemen SDM dan peningkatan mutu di lembaga pendidikan merupakan hal yang penting dalam menentukan kualitas pendidikan, maka diperlukan langkah dan upaya

Penyajian data dilakukan dengan mendeskripsikan hasil temuan dalam wawancara, melampirkan foto-foto hasil observasi sebagai bukti dari hasil temuan di lokasi penelitian,

Berdasarkan kajian yang dilakukan oleh Kelloway, Turner, Barling dan Loughlin (2012) yang membuat penyelidikan tentang hubungan antara persepsi pekerja terhadap gaya

kesesuaian tindakan aktor yang terlibat. • Yang menunjukkan bahwa lebih berpengaruh dibandingkan variabel lainnya, yang mana menunjukkan besarnya kekuatan masyarakat dalam