BAB III METODOLOGI. dari suara tersebut dapat dilihat, sehingga dapat dibandingkan, ataupun dicocokan dengan

(1)

BAB III METODOLOGI

3.1 Metodologi Penelitian

Penelitian ini ingin membangun sistem yang dapat melakukan langkah dasar identifikasi, yaitu melakukan ektraksi suara Gamelan Bonang, dengan ekstrasi ini, cirri dari suara tersebut dapat dilihat, sehingga dapat dibandingkan, ataupun dicocokan dengan data yang tersimpan dalam sistem. Percobaan-percobaan yang dilakukan terhadap suara, penagkapan suara menggunakan speaker yang terdapat pada laptop dibantu menggunakan perangkat lunak Audacity. Contoh seperti pada gambar berikut.

Gambar 3.1. Audacity

Suara data tersebut dipindahkan ke dalam perangkat lunak matlab. Ploting gambar akan ditampakkan, sehingga visualisasi ini memudahkan analisa sementara, tanpa mengetahui detail nilai yang sebenarnya, yang kemudianpun akan diketahui dengan metode penghitungan transformasi Fourier. Ploting suara pada domain waktu ditunjukan seperti gambar berikut.

(2)

Gambar 3.2. Plot Domain Waktu pada Matlab

Seperti yang telah dijelaskan pada BAB II, tujuan penelitian ini adalah dapatkah dibuat sebuah sistem untuk pengenal suara. Telah diketahui bahwa suara mempunyai penciri yaitu frekuensi (berupa kumpulan nilai-nilai). Ekstrasi ciri dilakukan dengan cara melakukan transformasi Fourier. Pada landasan teori telah dijelaskan bahwa transformasi Fourier merubah sinyal dari domain waktu kedalam domain frekuensi. Sehingga dengan ciri frekuensi (berdasarkan nilai-nilai) inilah penelitian berlanjut. Suara yang telah terekam tadi diproses dengan perangkat lunak Matlab. Sebelum dilakukan transformasi, suara yang berekstensi .WAV ini akan dipecah menjadi sepuluh komponen terlebih dahulu. Pemecahan ini dilakukan dengan menggunakan perangkat lunak Matlab. Berikut adalah contoh gambar pemecahan sinyal dalam domain waktu.

(3)

Gambar 3.3. Komponen Pertama

Gambar diatas dinamakan komponen 1. Komponen ini nantinya akan ditransformasikan dengan menggunakan teori Fourier (dalam penelitian ini menggunakan Fast Fourier Transform (FFT)). Berikut adalah hasil transformasi dalam bentuk gambar.

Gambar 3.4. Domain Frekuensi pada Matlab

Setelah selesai dilakukan transformasi FFT (mengubah dari domain waktu kedalam domain frekuensi) akan dilakukan langkah berikutnya yaitu menghitung Power Spectral Density (PSD). Setelah melakukan penghitungan PSD, akan dilanjuti dengan

(4)

mengkalkulasi nilai rata-rata dari keseluruhan frekuensi. Sehingga nantinya akan didapatkan satu nilai akhir pada komponen 1. Nilai inilah yang nantinya akan menjadi nilai masukan.

Apa yang akan dilakukan terhadap nilai masukan yang telah didapati? Langkah berikut yang akan dilakukan adalah memasukkan nilai ini kedalam Jaringan Syaraf Tiruan (JST) backpropagation sebagai nilai masukan. Nilai masukan ini nantinya akan ada sepuluh nilai, yang merupakan representasi dari nilai seluruh komponen.

Nilai-nilai ini akan dilatih kedalam JST. Nilai-nilai tersebut sebagai data-latih.

Gunanya melatih JST backpropagation, agar, jika ada data suara baru yang telah melewati tahap analisa seperti diatas, dapat dilakukan pencocokan ciri atau identifikasi (pengujian), yang nantinya akan memberikan suatu keluaran, apakah suara itu suara yang sama atau tidak.

Dalam membangun suatu sistem berbasis jaringan JST, pemilihan parameter yang digunakan harus memperhatikan banyaknya usaha yang diperlukan untuk mengekstrasi parameter tersebut, karena performa sistem pakar tidak hanya diperhatikan dari akurasi, namun juga kecepatan eksekusi sistem.

Data yang diujikan pada penelitian ini, meliputi data suara dari gamelan kempyang (memiliki pitch tinggi) dan data suara gamelan gong (memiliki pitch rendah) sedangkan gamelan bonang menurut landasan teori memiliki pitch yang tergolong sedang.

Diharapkan peneltian ini dapat memberikan jawaban, dimana logika dari tahap pertama hingga akhir yang diterapkan dalam sistem dapat melakukan analisa yang baik,

(5)

serta identifikasi yang mempunyai akurasi tinggi. Sehingga, menjawab pertanyaan pada penelitian ini.

Berikut adalah ringkasan urutan kerangka pikir dalam penelitian ini.

Gambar 3.5. Metode Penelitian

Kontrol kualitas pengambilan suara dapat dilakukan dengan 2 tahap, mengatur lingkungan pengambilan suara dan atau melakukan perbaikan suara pasca pengambilan suara tersebut.

Pengaturan kondisi lingkungan dapat dilakukan dalam ruangan terbatas tertutup.

Dengan pengaturan ruang tersebut, banyak tahapan pada suara yang dapat disederhanakan, seperti, pengalihan suara bising selain suara yang ingin diperoleh.

Pada pengambilan suara dengan lingkungan yang tidak terkontrol akan memberikan beban tambahan kepada sistem meliputi tahapan untuk memastikan bahwa objek yang diekstrak dari suara merupakan objek yang diinginkan atau sebaliknya.

(6)

Pemilihan metode pengambilan suara terkontrol dimaksudkan agar pengaturan mutu pengolahan suara dapat dilakukan pada tahap sedini mungkin; bila mutu suara yang direkam kedalam sistem dapat dijaga, maka kebutuhan akan pengolahan untuk penguatan kualitas suara dapat diminasi. Pengaturan lingkungan yang dapat dilakukan meliputi memilih ruangan tertutup.

3.2 Waktu dan Tempat Penelitian

Target waktu untuk melakukan penelitian ini 4 bulan. Bulan pertama mengumpulkan landasan teori yang berkaitan; berupa literature, artikel, buku, ataupun jurnal-jurnal. Pengumpulan teori ini dilakukan selama satu bulan, agar teori-teori yang dipaparkan pada landasan teori dapat mendukung keseluruhan penelitian ini. Sehingga, penelitian ini mempunyai nilai teori yang kuat, agar penelitian ini dapat dipertanggung jawabkan.

Setelah bulan pertama dilewati dan mempunyai landasan teori yang cukup kuat dalam hal mendukung penelitian, berikutnya pada bulan kedua dilakukan pengumpulan data suara. Data suara gamelan yang diambil adalah kemilikan dari Keraton Kacirebonan Cirebon yang dibuat pada pertengahan abad 17 dan abad 18. Gamelan ini biasa digunakan jika ada acara khusus dimana ada tamu spesial ataupun pada acara-acara tertentu.

Proses pengumpualan data suara termasuk meminta surat dukungan dari Bina Nusantara yang ditujukan kepada beberapa Keraton di Cirebon, yang pada akhirnya, di ijinkan oleh Keraton Kacirebonan yang memperbolehkan gamelan tersebut untuk diambil data suaranya.

(7)

Pada bulan ketiga, dibentuklah logika pemrograman pada perangkat lunak matlab, yang meliputi, pembelajaran serta menerapkan logika transformasi FFT, logika dan penerapan PSD, logika dan penerapan JST dengan backpropagation, serta membuat alur program untuk memecah satu data suara menjadi sepuluh komponen.

Parameter ukur yang dipilih merupakan parameter ukur yang diharapkan dapat menggambarkan parameter yang biasa digunakan sebagai parameter pengamatan, Parameternya yaitu frekuensi dan sampling rate.

Pada bulan terakhir setelah landasan teori terkumpul dengan baik dapat dijadikan sebagai acuan, lalu data suara telah cukup untuk melakukan penelitian ini, dan logika serta alur pemrograman perangkat lunak matlab telah dibangun, sampailah pada bulan keempat. Dalam bulan keempat ini, langkah yang dilakukan ialah memulai penulisan tesis serta melakukan percobaan.

Gambar 3.6. Bagan Waktu

(8)

3.3 Sampel

Sampel dari penelitian ini adalah data suara dari Gamelan Bonang, Gamelan

Kempyang, dan Gamelan Gong. Pengambilan suara dilakukan dengan cara memukul gamelan pada titik tengah. Percobaan ini diulang sebanyak 30 kali.

Tujuan ini dilakukan agar sewaktu melatih data dengan sample yang ada, sistem dapat mengenali suara dengan variasi cara pukul yang berbeda. Pada setiap cara pukul itu akan menghasilkan spektrum suara yang berbeda. Dalam arti, frekuensi yang dihasilkan akan berbeda. Diharapkan sistem dapat melakukan identifikasi yang sama ataupun hampir mendekati analisa indra pendengar manusia. Dengan cara melihat penciri frekuensi dari suara, sistem dapat melakukan analisa dan identifikasi dengan baik.

Langkah berikut dilakukan untuk mendapatkan standard parameter yang digunakan dalam penentuan spektrum suara.

o Sistem yang dibangun harus dapat menganalisa parameter frekuensi yang mungkin digunakan.

o Parameter terpilih diujikan dengan melihat performanya dalam analisa spektrum suara.

Yang perlu diperhatikan dalam percobaan penentuan standard adalah apakah pola data dari parameter tersebut cukup teratur untuk dapat diterapkannya standard pengamatan tersebut.

3.4 Metode Pengumpulan Data

Metode pengumpulan data yang digunakan adalah menggunakan alat perekam, yang dapat merekam suara lalu menyimpannya. Alat ini ialah laptop, dengan speaker yang secara langsung tergabung di dalamnya. Sehingga dapat digunakan untuk

(9)

pengambilan (perekaman) suara. Lalu, didukung oleh perangkat lunak penunjang dalam hal ini Audacity dan Matlab, data yang dikumpul dapat diolah lebih jauh untuk menjawab tujuan daripada penelitian ini.

Suara yang direkam akan menjadi data dalam penelitian ini, dan ekstensi dari data suara tersebut adalah .WAV. Alasan utama pemilihan .WAV pada penelitian ini dikarenakan, .WAV mudah untuk dilakukan manipulasi, serta merupakan tipe data tanpa melalui proses kompresi suara. Tidak seperti halnya Mp3. Dengan cara ini, diharapkan data yang akan diolah nantinya dapat di ektraksi dengan baik. Sehingga proses analisa dan identifikasi memiliki akurasi tinggi. Variable utama yang akan diekstraksi adalah frekuensi dari suara tersebut. Namun, tidak hanya .WAV saja sebagai penjamin bahwa data suara yang dikumpulkan dapat dibilang baik (tidak ada informasi yang hilang), namun kondisi (lingkungan) pada saat pengambilan suara pun akan mempengaruhi.

Karena, pada kondisi yang bising, data suara yang didapat, akan memiliki noise. Noise dapat menganggu keaslian suara yang ada.

Dalam pembangunan kondisi pengambilan suara yang baik, hal-hal berikut harus dapat diatasi.

o Bagaimana agar pengambilan suara dapat dilakukan kapan pun tanpa pengaruh dari lingkungan. Cara sederhana untuk mendapatkan kondisi ini adalah dengan menggunakan ruang pengambilan suara yang tidak mendapatkan pengaruh sekitar.

ruang pengambilan tersebut berupa ruang tertutup.

o Kondisi pengambilan yang memberikan hasil pengambilan optimal dapat diterapkan sebagai standard pengambilan.

(10)

Alat perekam yang digunakan merupakan gabungan dari perangkat keras dan perangkat lunak. Dimana perangkat lunak dapat melakukan kostumisasi suara yang terekam.

3.5 Metode Eksperimen

Metode eksperimen atau langkah uji coba yang akan dilakukan meliputi metode pengambilan suara, pengolahan suara, pemilihan jaringan syaraf tiruan, dan serta analisa hasil dari keluaran jaringan syaraf tiruan.

Masalah yang berkaitan dengan spektrum suara sebagian besar ditangani oleh ruang pengambilan terkontrol, seperti pemaparan hal pada metode pengumpulan data.

Hal ini untuk menghindari noise yang mungkin ikut terekam pada saat suara diambil.

Diketahui dari landasan teori bahwa analisa frekuensi pada kuping manusia berdasarkan gelombang sinus. Maka berdasarkan ini manusia dapat mengidentifikasikan suara. Konsep ini akan diterapkan pada sistem. Dimana sistem akan mengekstrasi ciri frekuensi dari gelombang suara yang merambat pada waktu. Data suara yang dimiliki dimasukan kedalam perangkat lunak Matlab, yang nantinya pada Matlab dapat dipecah menjadi sepuluh komponen dan pada setiap komponen dapat dilakukan transformasi Fourier (dalam penelitian ini FFT).

Berikut adalah contoh sample suara yang memiliki frekuensi 10 KHz berekstensi file WAV. Sinyal ini diunduh dari website www.mediacollege.com. Berikut adalah gambar ketika data WAV dibuka dengan perangkat lunak Audacity.

(11)

Gambar 3.7. Mencuplik Suara Berdurasi Satu Detik

Dapat dilihat pada gambar, pencuplikan diambil dari detik ke 1 hingga detik ke 2.

Ini adalah presentasi yang ditampakkan oleh perangkat lunak Audacity, dapat dilihat kerapatan dari sinyal seperti membentuk gelombang yang hampir tidak terlihat kerenggangannya. Setelah ini data suara akan dimasukan dalam perangkat lunak Matlab.

Berikut adalah presentasi data suara pada Matlab.

Gambar 3.8. Domain Waktu pada Matlab

Presentasi yang terlihat pada perangkat lunak Matlab pun hampir tidak memiliki kerenggangan, karena gelombang sangat rapat, menurut landasan teori, semangkin kecil jarak antara gelombang, maka akan semangkin tinggi frekuensinya.

(12)

Dari melihat gambar, hampir tidak mungkin untuk dilakukan analisa, namun dengan melakukan transformasi Fourier, sinyal ini dapat dilihat besar nilai frekuensi nya.

Sinyal suara yang dipresentasikan pada domain waktu ini, ketika ditransformasikan ke domain frekuensi, akan tampak suatu ciri yang sangat menonjol.

Transformasi ini dilakukan dengan menggunakan penghitungan Fast Fourier Transform (FFT). FFT akan mengeluarkan ciri frekuensi dengan angka yang tepat terhadap nilai frekuensi tersebut. Seperti gambar berikut.

Gambar 3.9. Domain Frekuensi f = 10KHz.

Dilihat pada gambar 3.9., ada satu garis lurus tinggi tepat pada angka 10000 pada sumbu x dimana sumbu x merupakan presentasi nilai dari frekuensi yang menggunakan satuan Hz. Sehingga frekuensi sinyal tersebut adalah 10 Khz.

Berikut adalah contoh sinyal yang mempunyai frekuensi 100 Hz. Dengan melakukan hal yang sama, ketika data suara dibuka pada perangkat lunak Audacity akan terlihat seperti gambar berikut.

(13)

Gambar 3.10. f 100 Hz pada Audacity

Jika diperhatikan, pada gelombang sinyal ini, terlihat seperti ada gerigi yang menandakan jarak periodik gelombang yang memiliki frekuensi 100 Hz lebih renggang dari jarak gelombang sinyal yang memiliki frekuensi 10 Khz. Berikut adalah presentasi gelombang pada perangkat lunak Matlab.

Gambar 3.11. Domain Waktu pada Matlab

Presentasi sinyal yang memiliki frekuensi 100 Hz dalam domain waktu yang ditunjukan hasil pengolahan perangkat lunak Matlab lebih tampak kerenggangan jarak antar gelombang jika dibandingkan sinyal yang memiliki frekuensi 10 Khz pada gambar

(14)

sebelumnya. Berikut akan coba dilihat presentasi sinyal ini dalam domain frekuensi dengan menggunakan transformasi FFT, berikut adalah gambarnya.

Gambar 3.12. Domain Frekuensi 100 Hz

Dengan cara seperti ini dapat dilihat, bahwa sinyal yang dipresentasikan dalam domain waktu, jika ditransformasikan dalam domain frekuensi dengan menggunakan FFT, akan terlihat frekuensi dari sinyal tersebut.

Setelah dilakukan transformasi Fourier dari domain waktu kedalam domain frekuensi, langkah berikutnya dilakukan penghitungan rata-rata kekuatan dari frekuensi ini berdasarkan algoritma Power Spectral Density (PSD).

Coba lihat contoh berikut yang akan dilakukan PSD (dengan menggunakan periodogram) pada sinyal 10 KHz. Jika diplot pada perangkat lunak Matlab, representasi sinyal tersebut akan terlihat seperti gambar berikut.

(15)

Gambar 3.13. Power Spectral Density 10 Khz

Langkah berikutnya dapat dilakukan penghitungan rata-rata energi yang ada pada sinyal tersebut. Dengan algoritma avgpower yang tersedia pada perangkat lunak Matlab, maka nilai yang dihasilkan untuk sinyal berfrekuensi 10 KHz ialah 0,2393.

Contoh berikutnya adalah mencari nilai yang terdapat pada sinyal berfrekuensi 100 Hz. Representasi sinyal tersebut dengan cara yang sama terhadap sinyal 10 KHz akan memiliki gambar plot seperti berikut.

Gambar 3.14. Power Spectral Density 100 Hz

Langkah berikutnya dengan menggunakan algortima yang sama pada penghitungan rata-rata akan ditemukan nilai sebesar 0,2394

(16)

Nilai rata-rata yang ada ini akan dimasukan kedalam jaringan syaraf tiruan sebagai nilai masukan pada data latih. Jaringan syaraf tiruan yang dipertimbangkan merupakan jaringan syaraf tiruan dengan bacpropagation.

Proses pencarian dilakukan dengan memasukan pola suara yang telah melalui proses transformasi ke dalam jaringan syaraf tiruan yang telah dilatih untuk mengenali pola suara yang diinginkan. Jaringan akan memberikan respon berupa nilai keluaran yang sesuai dengan input yang diterimanya. Semakin tinggi nilai keluaran maka input semangkin mirip dengan pola yang dicari.

Berdasarkan inilah maka jaringan syaraf tiruan sederhana yang dapat dipakai adalah jaringan syaraf tiruan backpropagation.