• Tidak ada hasil yang ditemukan

Penerapan SOM untuk Pengenalan Nada pada Angklung Modern

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan SOM untuk Pengenalan Nada pada Angklung Modern"

Copied!
29
0
0

Teks penuh

(1)

PENERAPAN SOM UNTUK PENGENALAN NADA PADA

ANGKLUNG MODERN

AREN AUDITA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Penerapan SOM untuk Pengenalan Nada pada Angklung Modern adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

ABSTRAK

AREN AUDITA. Penerapan SOM untuk Pengenalan Nada pada Angklung Modern. Dibimbing oleh AGUS BUONO.

Angklung merupakan warisan budaya Indonesia yang berasal dari Jawa Barat dan telah berkembang mengikuti perkembangan musik yang modern. Tujuan penelitian ini adalah menerapkan metode self-organizing maps (SOM) dan ekstraksi ciri mel-frequency cepstrum coefficients (MFCC) serta mengetahui akurasinya. Data yang digunakan sebanyak 300 nada angklung yang dimainkan dengan cara dicetok dari 12 nada diatonis yang masing-masing nadanya sebanyak 25 suara. Data nada direkam selama 3 detik dengan beberapa cetokan dalam memainkannya. Proses awal adalah membuat nada menjadi satu cetokan saja, kemudian dinormalisasi, lalu diekstraksi ciri dengan 26 koefisien cepstral MFCC. Pembagian data latih dan uji dilakukan secara acak dengan komposisi setiap nada yaitu 19 data latih dan 5 data uji. Penelitian ini melakukan tiga ulangan di radius 0, 1, dan 2 dengan data latih, data uji, dan 10 nilai parameter laju pembelajaran pada SOM yang berbeda di tiap ulangannya. Hasil clustering dengan SOM menghasilkan akurasi terbaik sebesar 98.33% di radius 1 pada ulangan 1 dan 3, serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di kedua radius yaitu 0.0090.

Kata kunci:angklung, clustering, MFCC, nada diatonis, SOM

ABSTRACT

AREN AUDITA. Application of SOM for Tones Recognition on Modern Angklung.Supervised by AGUS BUONO.

Angklung is an Indonesian cultural heritage from West Java and has been developed following the development of modern music. The purpose of this research is to recognize the tone of angklung by using self-organizing maps (SOM) and mel-frequency cepstrum coefficients (MFCC) feature extraction. The used data were 300 tones of angklung that were played by staccato of 12 diatonic tones, each tone by 25 voices. Tones data were recorded for 3 seconds with some staccato in play. The initial process was making the data into one staccato tone, normalized, and then its characteristics were extracted with 26 cepstral coefficients MFCC. Distribution of training and test data was conducted randomly by the composition of 19 training data and 5 test data for each tone. This research conducted three repetitions on radius 0, 1, and 2 with training data, test data and learning rate of 10 parameter values at different SOM in each of their repetition. The result shows that the best accuracy obtained was 98.33% at a radius of 1 in repetition 1 and 3, as well as at a radius of 2 in repetition 1 with a common learning rate in both radius, 0.0090.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer

pada

Departemen Ilmu Komputer

PENERAPAN SOM UNTUK PENGENALAN NADA PADA

ANGKLUNG MODERN

AREN AUDITA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(6)

Penguji:

(7)

Judul Skripsi : Penerapan SOM untuk Pengenalan Nada pada Angklung Modern Nama : Aren Audita

NIM : G64114016

Disetujui oleh

Dr Ir Agus Buono, MSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen

(8)
(9)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini ialah pengenalan suara, dengan judul Penerapan SOM untuk Pengenalan Nada pada Angklung Modern.

Terima kasih penulis ucapkan kepada:

1 Ayah dan seluruh keluarga atas segala doa, dukungan dan kasih sayangnya khususnya untuk ibu saat masih menemani dalam pengerjaan karya ilmiah ini. 2 Bapak Dr Ir Agus Buono, MSi MKom selaku dosen pembimbing yang telah

banyak memberi saran saat bimbingan.

3 Bapak Aziz Kustiyo, SSi MKom dan Bapak Toto Haryanto, SKom MSi selaku dosen penguji atas kesediaannya sebagai penguji.

4 Suhermanto dan Sarah dari Lises Gentra Kaheman IPB yang telah membantu selama pengumpulan data.

5 Teman-teman Ilkom alih jenis angkatan 6 khususnya teman-teman satu bimbingan yang senantiasa memberikan dukungan dan bantuan selama pengerjaan karya ilmiah ini.

Semoga karya ilmiah ini bermanfaat.

(10)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 3

Manfaat Penelitian 3

Ruang Lingkup Penelitian 3

METODE 3

Lingkungan Pengembangan 3

Studi Literatur 4

Pengambilan Data Nada Angklung 4

Praproses 5

Pembagian Data Latih dan Data Uji 8

Pemodelan SOM (Self-Organizing Maps) 8

Pengujian 9

Rancangan Percobaan 9

HASIL DAN PEMBAHASAN 10

Pengambilan Data Nada Angklung 10

Praproses 10

Pembagian Data Latih dan Data Uji 10

Struktur SOM 11

Hasil dan Analisis Percobaan 11

SIMPULAN DAN SARAN 15

Simpulan 15

Saran 16

DAFTAR PUSTAKA 16

(11)

DAFTAR TABEL

1 Nada angklung melodi 2

2 Hasil randperm data uji 10

3 Akurasi 91.67% ulangan 3 radius 0 14

4 Akurasi 91.67% ulangan 2 radius 0 15

DAFTAR GAMBAR

1 Angklung 1

2 Tahapan proses penelitian 4

3 Alur praproses 5

4 Alur ambil satu cetokan nada 6

5 Diagram alur proses MFCC 7

6 Kohonen self-organizing maps 9

7 Akurasi radius 0 11

8 Rata-rata akurasi radius 0 11

9 Akurasi radius 1 12

10 Akurasi radius 2 12

11 Akurasi radius 0, 1, dan 2 13

12 Rata-rata akurasi radius 1 13

13 Rata-rata akurasi radius 2 13

(12)

PENDAHULUAN

Latar Belakang

Angklung merupakan warisan budaya dari Indonesia yang berasal dari daerah Jawa Barat. Angklung adalah alat musik yang terdiri atas dua sampai empat tabung bambu yang digantung dalam bingkai bambu dan terikat dengan tali rotan. Pada bulan November 2010, UNESCO telah mengakui angklung sebagai warisan kebudayaan dunia dari Indonesia dengan kategori “Intangible Cultural Heritage of Humanity” (UNESCO 2010).

Angklung telah berkembang mengikuti perkembangan musik yang modern. Angklung yang awalnya hanya memiliki nada pentatonis, kini telah berkembang menjadi nada diatonis.Nama nada pada skala pentatonis yaitu C, D, E, G, dan A, sedangkan pada skala diatonis yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B. Angklung diatonis ini dikembangkan oleh Bapak Daeng Soetigna pada tahun 1938 yang kemudian diberi nama angklung Padaeng. Menurut Kemdikbud RI (tahun tidak diketahui), angklung ini dikelompokkan menjadi dua yaitu angklung melodi dan angklung akompanimen (pengiring). Jenis angklung ini dapat dilihat pada Gambar 1. Jenis angklung pada Gambar 1 dari kiri ke kanan yaitu angklung melodi 2 tabung, angklung melodi 3 tabung, angklung mayor akompanimen, dan angklung minor akompanimen. Satu set unit angklung melodi terdapat 31 angklung melodi kecil dan 11 angklung melodi besar. Nada angklung melodi kecil dapat dilihat pada Tabel 1. Cara memainkan angklung ini ada tiga yaitu:

1 Kurulung (getar)

Satu tangan memegang rangka angklung, kemudian tangan yang lainnya menggoyangkan angklung selama nada yang diinginkan.

2 Cetok (sentak)

Tabung dasar ditarik dengan cepat oleh jari ke telapak tangan, sehingga nada yang dihasilkan akan berbunyi sekali saja (staccato).

3 Tengkep

Teknik yang mirip dengan kurulung, hanya saja salah satu tabung ditahan agar tidak bergetar.

Gambar 1 Angklunga

(13)

2

Tabel 1 Nada angklung melodib

Oktaf Nada Melodi nada pada angklung ini cukuplah mudah. Akan tetapi, untuk mengenali nada pada angklung tersebut, mereka membutuhkan waktu untuk mengenalinya. Tentunya hal ini berbeda dengan seorang ahli musik yang sudah terbiasa memegang alat musik ini. Oleh karena itu, sistem pengenalan nada pada angklung dibutuhkan untuk membantu dalam mengenali nada tersebut.

Penelitian tentang pengenalan nada angklung ini masih jarang ditemukan. Penelitian yang akan dilakukan yaitu dengan mencoba menggunakan metode self-organizing maps (SOM) sebagai pengenalan pola dan mel-frequency cepstrum coefficients (MFCC) sebagai fitur ekstraksi cirinya. Pemilihan kedua metode ini

(14)

3 berdasarkan penelitian yang dilakukan oleh Zak (2011) dan Monte et al. (1996). Pada penelitian Zak (2011) menghasilkan akurasi di atas 90%, sedangkan pada penelitian Monte et al. (1996) menghasilkan akurasi 100%. Alasan lainnya adalah Davis dan Mermelstein telah membuktikan bahwa MFCC memberikan akurasi tertinggi dibandingkan dengan fitur ekstraksi lainnya (Buono et al. 2011; Ganchev 2005).

Angklung yang digunakan dalam penelitian ini adalah angklung melodi kecil 2 tabung Padaeng yang akan dimainkan dengan cara dicetok. Nada yang dipilih adalah nada diatonis dalam satu oktaf yang berada pada oktaf keempat.

Tujuan Penelitian

Tujuan dari penelitian ini ialah:

1 Menerapkan metode SOM dan teknik ekstraksi ciri MFCC dalam pengenalan nada pada angklung.

2 Mengetahui akurasi pengenalan nada pada angklung dengan menggunakan metode SOM dan teknik ekstraksi ciri MFCC.

Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan informasi mengenai akurasi penggunaan metode SOM dalam pengenalan nada pada angklung.

Ruang Lingkup Penelitian

Ruang lingkup dalam penelitian ini ialah:

1 Nada yang akan dikenali adalah nada diatonis dalam satu oktaf yang berada pada oktaf keempat.

2 Nada yang akan dikenali adalah nada angklung yang dimainkan dengan cara staccato (dicetok).

3 Jenis angklung yang dipakai adalah angklung melodi kecil 2 tabung Padaeng.

METODE

Penelitian ini dilakukan dengan beberapa tahapan proses, yaitu studi literatur, pengambilan data nada angklung, praproses, pemodelan SOM, dan pengujian. Tahapan proses penelitian ini dapat dilihat pada Gambar 2.

Lingkungan Pengembangan

Penelitian ini menggunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut:

1 Perangkat Keras

Processor Intel Core 2 Duo CPU @ 2.10 GHz.  Memori 4 GB.

(15)

4

 Monitor. 2 Perangkat Lunak

 Sistem operasi Windows XP Professional 32 bit.  Matlab 7.7.0 (R2008b).

Studi Literatur

Tahapan ini melakukan pencarian dan pembelajaran tentang apa yang dibutuhkan dalam penelitian ini. Hal-hal yang dibutuhkan antara lain tentang metode SOM dan juga MFCC. Selain itu, hal-hal yang terkait dengan pengenalan suara akan dicari dan dipelajari untuk dijadikan referensi dalam penelitian ini.

Pengambilan Data Nada Angklung

Data yang digunakan dalam penelitian ini adalah 12 jenis nada angklung yang dimainkan dengan cara dicetok kemudian direkam. Angklung yang digunakan berasal dari Lises Gentra Kaheman IPB. Dua belas jenis nada tersebut yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, dan B. Masing-masing nada tersebut direkam sebanyak 25 kali sehingga didapatkan untuk setiap nada memiliki 25 data suara. Data direkam di ruangan yang hening guna menghindari noise. Data nada direkam selama 3 detik dengan sampling rate 11 000 Hz, bit rate sebesar 16 bit,

Gambar 2 Tahapan proses penelitian Mulai

Studi Literatur

Pengambilan Data Nada Angklung

Praproses

Data Uji Data

Latih

Pemodelan SOM

Pengujian

Selesai Data Bobot

(16)

5 dan ekstensi fail WAV. Selama 3 detik itu terdapat beberapa cetokan dalam memainkannya.

Praproses

Tahapan ini membuat setiap nada yang awalnya terdapat beberapa cetokan menjadi satu cetokan saja. Alur dari tahapan ini dapat dilihat pada Gambar 3. Pada tahap silence removing di awal, data yang terdapat silent di awal akan dibuang. Setelah itu, data akan diambil satu cetokan di awal saja. Untuk membuat nada menjadi satu cetokan di awal saja, nada akan diambil dari awal dalam kondisi bersuara hingga ditemukannya kondisi nada yang silent. Dalam mendeteksi kondisi silent itu, proses ini akan menggunakan algoritma silence removal dan endpoint detection yang dilakukan oleh Saha et al. (2005). Alur dari proses ini dapat dilihat pada Gambar 4. Setelah itu, data akan dinormalisasi sehingga semua data memiliki nilai maksimum 1 atau nilai minimum -1. Kemudian, data diekstraksi ciri dengan menggunakan MFCC. Diagram alur proses MFCC dapat dilihat pada Gambar 5 (Do 1994).

Gambar 3 Alur praproses

Silence Removing

di awal

Membuat nada menjadi satu cetokan

Normalisasi

Ekstraksi ciri MFCC

(17)

6

MFCC ini sering digunakan sebagai ekstraksi ciri dalam pengenalan suara, karena dapat merepresentasikan ciri sebuah sinyal suara (Do 1994). MFCC ini mengubah sinyal suara ke dalam bentuk matriks yang berukuran jumlah koefisien dikali dengan banyaknya frame suara yang terbentuk. Beberapa parameter input dalam proses ini yaitu:

1 Input yang digunakan adalah data suara nada dengan ekstensi WAV.

2 Sampling rate yaitu nilai sinyal suara yang diambil dalam satu detik. Sampling rate yang digunakan sebesar 11 000 Hz.

3 Time frame yaitu waktu yang dipakai untuk membagi data suara menjadi beberapa bagian frame. Time frame yang digunakan sebesar 40 ms.

4 Overlapping digunakan untuk mengurangi hilangnya informasi saat proses frame blocking. Overlapping yang digunakan sebesar 50%.

5 Koefisien cepstral yaitu koefisien ciri yang diinginkan untuk output dari proses MFCC. Koefisien cepstral yang digunakan sebesar 26 karena dalam penelitian Wisnudisastra dan Buono (2010) menghasilkan akurasi 96% untuk 26 koefisien cepstral dan akurasi 91% untuk 13 koefisien cepstral.

Gambar 4 Alur ambil satu cetokan nada

tidak ya

Mulai

Baca x (i) & Hitung μ, σ x(i) = sampel nada yang ke i μ = rata-rata; σ = simpangan baku

|x(i) - μ|⁄σ > z

z = threshold

Whilex (i) <= panjang (x)

Tandai x (i) dengan 1 (Sampel bersuara) Tandai x (i) dengan 0

(Sampel tidak bersuara)

x dibagi menjadi beberapa frame

Untuk setiap frame, tandai 1 jika di dalam frame itu lebih banyak sampel bersuara dibandingkan sampel tidak bersuara dan tandai 0 jika sampel tidak bersuara yang lebih banyak

Ambil frame awal yang bersuara sampai bertemu frame yang tidak bersuara

(18)

7

Frame Blocking

Pada tahapan MFCC ini, sinyal suara akan dibagi menjadi beberapa frame dari N sampel yang direpresentasikan dalam bentuk vektor. Agar tidak ada informasi yang hilang, setiap frame yang bersebelahan dibuat menjadi saling tumpang tindih atau overlap.

Windowing

Proses frame blocking memungkinkan terjadinya diskontinuitas sinyal pada awal dan akhir setiap frame. Diskontinuitas ini akan menyebabkan terjadinya distorsi spektral. Untuk menguranginya, tiap frame dilakukan proses windowing. Metodenya yaitu dengan mengalikan tiap frame dengan fungsi window tertentu. Fungsi window yang dipakai adalah Hamming window:

w(n) = 0.54-0.46 cos(2πn/(N-1)) , 0nN-1 Keterangan:

N = jumlah sampel pada setiap frame n = frame ke-…

w = fungsi Hamming window

Fast Fourier Transform (FFT)

Proses ini mengubah setiap frame dari domain waktu ke domain frekuensi. Hal ini dilakukan untuk mempermudah dalam pemrosesan selanjutnya. Hasil dari proses ini yaitu spektrum atau periodogram. Algoritme dari FFT yaitu:

Xn= ∑Nk=0-1xkeps(-2πjkn/N) , n = 0,1,2,…,N-1

Persepsi manusia terhadap frekuensi sinyal suara tidak mengikuti skala linear. Oleh karena itu untuk setiap nada dengan frekuensi aktual f (dalam satuan Hz), nilai subjektif dari pitch diukur dengan menggunakan skala “mel”. Skala mel-frequency adalah selang frekuensi linear di bawah 1000 Hz dan selang logaritmik di atas 1000 Hz. Proses ini umumnya menggunakan filterbank. Perhitungannya adalah:

Xi = log10 ∑ |Nk=0-1 X(k)| Hi(k) , i = 1,2,3,…,M

Keterangan:

Hi (k) = nilai filter segitiga ke i

X(k) = nilai data ke k hasil proses FFT

Gambar 5 Diagram alur proses MFCC

(19)

8

M = jumlah filter N = banyaknya data

Cepstrum

Proses ini mengubah mel-frequency ke domain waktu dengan menggunakan Discrete Cosine Transform (DCT). Hasilnya disebut dengan MFCC. Proses DCT:

Cj= Xicos(j(i-1)2(π/M)) M

i=0 Keterangan:

Cj = nilai koefisien C ke j j = jumlah koefisien cepstral i = jumlah wrapping

Xi = hasil mel-frequency pada frekuensi ke i

Pembagian Data Latih dan Data Uji

Pada tahap ini, data yang telah melalui tahap praproses akan dipilih secara acak dari masing-masing nada. Pembagian data tersebut yaitu 19 data suara untuk data latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Setelah itu, data latih akan melalui tahap pemodelan SOM sebagai vektor masukan dan data bobot untuk bobot awal.

Pemodelan SOM (Self-Organizing Maps)

Metode ini merupakan salah satu model jaringan saraf tiruan. Metode ini disebut juga topology-preserving maps yang berarti struktur topologi antara unit cluster (Fausett 1994). SOM ini mempunyai bobot vektor setiap unit cluster sebagai contoh dari pola masukan yang terkait dengan cluster tersebut. Selama prosesnya, akan dipilih satu cluster sebagai pemenang dan cluster pemenang serta cluster tetangganya akan memperbaharui bobot cluster. Cluster pemenang ini ditentukan dari jarak yang terdekat dari bobotnya. Arsitektur dari model SOM menurut Fausett (1994) dapat dilihat pada Gambar 6.

Menurut Fausett (1994), algoritme dari metode SOM ini yaitu: 1 Inisialisasi

 Bobot wij

 Parameter laju pembelajaran awal (α) dan faktor penurunannya  Parameter topologi tetangga (R)

2 Selama kondisi penghentian bernilai salah, lakukan langkah 3-9 3 Untuk setiap vektor masukan x, lakukan langkah 4-6

4 Hitung D(j) =∑ (wij - xi)2 untuk semua j

5 Tentukan indeks J sehingga D(J) bernilai minimum. D(J) dilihat dari D(j) 6 Modifikasi bobot untuk setiap unit j di sekitar J berdasarkan topologi tetangga

yang telah ditentukan dan untuk seluruh i:

wij(baru) =wij(lama) + α(xi - wij(lama))

7 Modifikasi laju pembelajaran

(20)

9

Pengujian

Pengujian dilakukan dari data uji yang telah diekstraksi ciri menggunakan MFCC kemudian di-cluster dengan metode SOM menggunakan bobot dari hasil SOM data latihnya. Setiap data nada angklung yang diuji akan di-cluster-kan ke cluster yang sesuai.

Tingkat akurasi sistem akan dihitung untuk mengevaluasi hasil penelitian. Setiap data yang diuji akan dilihat apakah data tersebut akan masuk ke dalam cluster yang sesuai. Persentase tingkat akurasi dihitung dengan fungsi berikut:

Hasil= ∑nada yang benar

∑nada yang diuji × 100%

Rancangan Percobaan

Penelitian ini menggunakan data nada dengan perekaman 3 detik, sampling rate 11 000 Hz, bit rate sebesar 16 bit, ekstensi fail WAV, dan dalam 3 detik itu terdapat beberapa cetokan dalam memainkannya. Pada tahap MFCC, parameter yang digunakan adalah sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan 26 koefisien cepstral. Threshold yang digunakan pada tahap ambil satu cetokan nada sebesar 0.1.

Penelitian ini akan melakukan tiga kali ulangan dengan 10 parameter SOM berbeda di tiap ulangannya. Setiap ulangan ini mempunyai jumlah yang sama di setiap nadanya yaitu 19 data latih, 5 data uji, dan 1 data bobot tetapi ada perbedaan dalam pemilihan secara acak dari masing-masing nada yaitu untuk data latih dan data uji. Sepuluh parameter SOM yang berbeda itu terletak pada laju pembelajaran. Laju pembelajaran yang akan digunakan yaitu 0.0001, 0.0003,

Gambar 6 Kohonen self-organizing maps

Y1

X1

Yj

Xi

Ym

Xn

Wi1

Wn1 W1j

Wij

Wnj W1m

Wim

Wnm

(21)

10

0.0005, 0.0007, 0.0009, 0.0010, 0.0030, 0.0050, 0.0070, dan 0.0090. Parameter lainnya dalam pemodelan SOM yaitu 300 epoch, penurunan laju pembelajaran sebesar 0.1, radius sebesar 0, 1, dan 2, vektor masukan x diambil dari data latih, bobot awal diambil dari data bobot.

HASIL DAN PEMBAHASAN

Pengambilan Data Nada Angklung

Nada angklung diambil dengan cara direkam langsung menggunakan perangkat lunak Matlab. Nada tersebut direkam selama 3 detik dengan beberapa cetokan dalam memainkannya lalu disimpan ke dalam ekstensi fail WAV. Jumlah data yang direkam sebanyak 300 data nada angklung dari 12 nada yang masing-masing nadanya sebanyak 25 suara.

Praproses

Pada tahap awal praproses ini, data nada dibuat menjadi satu cetokan saja. Setelah itu, data akan dinormalisasi dengan cara membagi semua nilai nada dengan nilai maksimum dari absolut nilai nada. Kemudian, data diekstraksi ciri dengan menggunakan MFCC. Proses MFCC ini menggunakan fungsi auditory toolbox Matlab. Parameter MFCC yang digunakan yaitu sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan koefisien cepstral sebesar 26.

Pembagian Data Latih dan Data Uji

Setiap nada akan dibagi menjadi 3 bagian yaitu 19 data suara untuk data latih, 1 data suara untuk data bobot, dan 5 data suara untuk data uji. Tahap awal adalah menentukan data ke-25 sebagai data bobot, kemudian memilih secara acak 5 data yang akan menjadi data uji dengan menggunakan fungsi randperm pada Matlab. Sisa dari data itu akan dijadikan sebagai data latih. Hasil randperm untuk data uji dapat dilihat pada Tabel 2.

Tabel 2 Hasil randperm data uji

Ulangan 1 2 Data uji ke- 3 4 5

1 5 24 1 13 3

2 20 6 10 1 19

3 3 9 24 14 10

(22)

pembagian untuk setiap ulangan ini didapatkan sejumlah data latih sebanyak 228, data uji sebanyak 60, dan data

Struktur SOM ini memiliki 26 neuron

masukannya ialah data latih dan bobot awalnya ialah data bobot

terlihat bahwa akurasi terendah yang didapatkan sebesar 88.33% dan akurasi tertinggi sebesar 91.67%.

besar laju pembelajaran

ini dikarenakan kecepatan belajar pada jaringan SOM. Laju

besar berarti kecepatan belajarnya pun lebih cepat dan tidak terlalu detail sehingga pemetaan nadanya tidak terlalu baik.

akan menghasilkan pemetaan nada yang baik karena proses pembelajarannya akan lebih detail walaupun lama dalam kecepatan belajarnya.

Dari Gambar 8, rata

dan rata-rata akurasi terbesar terdapat di ulangan 2 yaitu 91.67%. Pada gambar ini juga dapat dilihat bahwa setiap ulangan memiliki rata

90.00%

pembagian untuk setiap ulangan ini didapatkan sejumlah data latih sebanyak 228, data uji sebanyak 60, dan data bobot sebanyak 26.

Struktur SOM

Struktur SOM ini memiliki 26 neuron input dan 12 neuron

masukannya ialah data latih dan bobot awalnya ialah data bobot digunakan yaitu 0.0001, 0.0003, 0.0005, 0.

0050, 0.0070, dan 0.0090. Parameter lainnya yaitu 300 pembelajaran sebesar 0.1, serta radius sebesar 0, 1, dan 2

Hasil dan Analisis Percobaan

menyajikan akurasi hasil percobaan tiga kali ulangan dengan meter laju pembelajaran berbeda di setiap ulangannya.

terlihat bahwa akurasi terendah yang didapatkan sebesar 88.33% dan akurasi 91.67%. Ulangan pertama dan ketiga terlihat bahwa semakin pembelajarannya, maka semakin rendah akurasi yang didapatkan. ini dikarenakan kecepatan belajar pada jaringan SOM. Laju pembelajaran besar berarti kecepatan belajarnya pun lebih cepat dan tidak terlalu detail sehingga pemetaan nadanya tidak terlalu baik. Sebaliknya, laju pembelajaran

akan menghasilkan pemetaan nada yang baik karena proses pembelajarannya akan lebih detail walaupun lama dalam kecepatan belajarnya.

Gambar 7 Akurasi radius 0

Gambar 8 Rata-rata akurasi radius 0

Dari Gambar 8, rata-rata akurasi terkecil terdapat di ulangan 1 yaitu 89% rata akurasi terbesar terdapat di ulangan 2 yaitu 91.67%. Pada gambar ini juga dapat dilihat bahwa setiap ulangan memiliki rata-rata akurasi

90.00% 88.33% 91.67% 91.67%

Ulangan 1 Ulangan 2 Ulangan 3

α = 0.0001 α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009 α = 0.0010 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090

89.00% 91.67%

Ulangan 1 Ulangan 2 Ulangan 3

11 pembagian untuk setiap ulangan ini didapatkan sejumlah data latih sebanyak 228,

dan 12 neuron output. Vektor tiap ulangannya. Di gambar ini terlihat bahwa akurasi terendah yang didapatkan sebesar 88.33% dan akurasi ga terlihat bahwa semakin nya, maka semakin rendah akurasi yang didapatkan. Hal pembelajaran yang besar berarti kecepatan belajarnya pun lebih cepat dan tidak terlalu detail sehingga pembelajaran yang kecil akan menghasilkan pemetaan nada yang baik karena proses pembelajarannya akan

(23)

berbeda-12

beda. Hal ini dikarenakan kurang baiknya dalam perekaman nada. Oleh karena itu, setiap data uji berubah, maka berubah pula akurasi yang didapatkan.

Radius 1 dan Radius 2

Saat radius 1 dan 2 ini, akurasi yang dihasilkan mengalami peningkatan akurasi. Akurasi yang dihasilkan saat radius 1

Gambar 9 dan Gambar 10. Akurasi tertinggi yang dihasilkan saa ini sama yaitu 98.33%, begitupun d

radius 1 di semua ulangan dan radius 2 di ulangan 1 dan 3

pembelajarannya maka semakin kecil pula akurasi yang dihasilkan. Hal ini berbanding terbalik saat radius 0

pada Gambar 11.

beda. Hal ini dikarenakan kurang baiknya dalam perekaman nada. Oleh karena itu, setiap data uji berubah, maka berubah pula akurasi yang didapatkan.

Saat radius 1 dan 2 ini, akurasi yang dihasilkan mengalami peningkatan kurasi. Akurasi yang dihasilkan saat radius 1 dan radius 2 dapat dilihat pada . Akurasi tertinggi yang dihasilkan saat radius 1 dan 2 98.33%, begitupun dengan akurasi terendahnya yaitu 90.00%. Pada ngan dan radius 2 di ulangan 1 dan 3, semakin kecil laju nya maka semakin kecil pula akurasi yang dihasilkan. Hal ini erbanding terbalik saat radius 0. Perbandingan ketiga radius ini dapat dilihat

Gambar 9 Akurasi radius 1

Gambar 10 Akurasi radius 2

91.67% 91.67% 93.33%

93.33% 93.33% 95.00%

96.67% 98.33%

95.00%

Ulangan 1 Ulangan 2 Ulangan 3

α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009

Ulangan 1 Ulangan 2 Ulangan 3

α = 0.0003 α = 0.0005 α = 0.0007 α = 0.0009 α = 0.0030 α = 0.0050 α = 0.0070 α = 0.0090

beda. Hal ini dikarenakan kurang baiknya dalam perekaman nada. Oleh karena itu,

(24)

Jika dilihat dari

13, radius 1 dan 2 ini yang lebih tinggi akurasinya dibandingkan dengan radius 0. dan 2 ini terletak pada ulangan 1 menghasilkan akurasi tertinggi yaitu 91

yang menghasilkan akurasi tertinggi yaitu 94.17% 2 ini sama-sama menghasilkan akurasi 92.17%.

Perbedaan

rata-Gambar 12 Rata-rata akurasi radius 1

Jika dilihat dari radius 0, 1, dan 2 yang dapat dilihat pada Gambar 8, 12 radius 1 dan 2 ini yang lebih tinggi untuk semua ulangan dalam menghasilkan akurasinya dibandingkan dengan radius 0. Perbedaan rata-rata akurasi di radius 1 dan 2 ini terletak pada ulangan 1 dan 3. Untuk ulangan 1, radius 2 yang menghasilkan akurasi tertinggi yaitu 91.67%, sedangkan untuk ulangan 3, radius 1 yang menghasilkan akurasi tertinggi yaitu 94.17%. Untuk ulangan 2, radius 1 dan

sama menghasilkan akurasi 92.17%.

Gambar 13 Rata-rata akurasi radius 2

-rata akurasi untuk tiap ulangan ini juga terjadi pada radius 1 Radius 0, 1, dan 2 ini mengalami perbedaan rata-rata akurasi untuk tiap Hal ini dapat dikatakan bahwa dalam perekaman nada pun dapat mempengaruhi hasil akurasi yang didapatkan.

0.0003 0.0005 0.0007 0.0009 0.0010 0.0030 0.0050 Laju Pemahaman

Radius 0 Ulangan 1 Radius 0 Ulangan 2 Radius 0 Ulangan 3

Radius 1 Ulangan 1 Radius 1 Ulangan 2 Radius 1 Ulangan 3

Radius 2 Ulangan 1 Radius 2 Ulangan 2 Radius 2 Ulangan 3

91.50% 92.17%

Ulangan 1 Ulangan 2 Ulangan 3

91.67% 92.17%

Ulangan 1 Ulangan 2 Ulangan 3

13

Gambar 8, 12, dan dalam menghasilkan rata akurasi di radius 1 Untuk ulangan 1, radius 2 yang .67%, sedangkan untuk ulangan 3, radius 1 Untuk ulangan 2, radius 1 dan

(25)

14

Gambar 14 Rata

Radius yang menghasilkan akurasi tertinggi berdasarkan rata ulangannya adalah radius 1 dan 2

terendah adalah radius 0 dengan akurasi sebesar 90.72%

pada Gambar 14. Dapat dikatakan bahwa radius 1 dan 2 inilah yang terbai menghasilkan akurasi.

Analisis Kesalahan Clustering

Kesalahan yang terjadi dalam penempatan kecil yaitu setengah. Contohnya adalah pada radius 0 yang akurasinya sebesar

masuk ke cluster yang salah yai

E serta 3 nada F masuk ke F#. Hal ini terjadi karena nada D# dan E ini berjarak setengah nada, begitu pun nada F dan F#.

Untuk mengatasinya, penggantian radius perlu dilakukan. Hal ini dikarenakan nada yang berpengaruh dalam penempatan

adalah nada tetangganya yang bersebelahan. Hal ini dapat dilihat dari Tabel 3 dan 4 yang semua kesalahan clustering

Penggantian radius menjadi 1 untuk ulangan 2 dengan laju

0.0090 berhasil menaikkan akurasinya dari 91.67% menjadi 95%. Lima nada F yang masuk ke cluster F#, setelah diganti radiusnya menjadi 1, kini hanya 3 nada

90.72%

Rata-rata akurasi dari 3 ulangan di 3 radius

Radius yang menghasilkan akurasi tertinggi berdasarkan rata ulangannya adalah radius 1 dan 2 dengan akurasi sebesar 92.61%, sedangkan yang terendah adalah radius 0 dengan akurasi sebesar 90.72%. Hal ini dapat dilihat

Dapat dikatakan bahwa radius 1 dan 2 inilah yang terbai

Clustering

Kesalahan yang terjadi dalam penempatan cluster ini karena jarak nada yang kecil yaitu setengah. Contohnya adalah pada percobaan di ulangan 3

nya sebesar 91.67% di Tabel 3. Disini ada 2 nada yang yang salah yaitu nada D# dan F. Dua nada D# masuk ke

E serta 3 nada F masuk ke F#. Hal ini terjadi karena nada D# dan E ini berjarak setengah nada, begitu pun nada F dan F#. Hal serupa terjadi pada

Tabel 4. Bahkan pada percobaan ini terdapat 5 nada F yang cluster yang salah yaitu F#.

Akurasi 91.67% ulangan 3 radius 0

Untuk mengatasinya, penggantian radius perlu dilakukan. Hal ini dikarenakan nada yang berpengaruh dalam penempatan cluster yang sesuai itu adalah nada tetangganya yang bersebelahan. Hal ini dapat dilihat dari Tabel 3 dan

clustering-nya ada pada jarak nada yang setengah.

Penggantian radius menjadi 1 untuk ulangan 2 dengan laju pembelajaran 0.0090 berhasil menaikkan akurasinya dari 91.67% menjadi 95%. Lima nada F

F#, setelah diganti radiusnya menjadi 1, kini hanya 3 nada

90.72% 92.61% 92.61%

Radius 0 Radius 1 Radius 2

Radius yang menghasilkan akurasi tertinggi berdasarkan rata-rata dengan akurasi sebesar 92.61%, sedangkan yang Hal ini dapat dilihat Dapat dikatakan bahwa radius 1 dan 2 inilah yang terbaik dalam

ini karena jarak nada yang percobaan di ulangan 3 dengan . Disini ada 2 nada yang tu nada D# dan F. Dua nada D# masuk ke cluster E serta 3 nada F masuk ke F#. Hal ini terjadi karena nada D# dan E ini berjarak Hal serupa terjadi pada ulangan 2 terdapat 5 nada F yang

Untuk mengatasinya, penggantian radius perlu dilakukan. Hal ini yang sesuai itu adalah nada tetangganya yang bersebelahan. Hal ini dapat dilihat dari Tabel 3 dan

nya ada pada jarak nada yang setengah. pembelajaran 0.0090 berhasil menaikkan akurasinya dari 91.67% menjadi 95%. Lima nada F F#, setelah diganti radiusnya menjadi 1, kini hanya 3 nada

92.61%

(26)

15 yang masuk ke cluster F#. Saat radius diganti menjadi 2 pun akurasinya meningkat menjadi 93.33%. Begitupun dengan nada F yang 3 nadanya masih masuk ke cluster F#. Tetapi dalam radius 2 ini, nada B yang awalnya masuk ke cluster B semua, sekarang ada 1 nada yang masuk ke cluster yang salah yaitu A#.

Tabel 4 Akurasi 91.67% ulangan 2 radius 0

Nada A A# B C C# D D# E F F# G G# A 5 0 0 0 0 0 0 0 0 0 0 0 A# 0 5 0 0 0 0 0 0 0 0 0 0 B 0 0 5 0 0 0 0 0 0 0 0 0 C 0 0 0 5 0 0 0 0 0 0 0 0 C# 0 0 0 0 5 0 0 0 0 0 0 0 D 0 0 0 0 0 5 0 0 0 0 0 0 D# 0 0 0 0 0 0 5 0 0 0 0 0 E 0 0 0 0 0 0 0 5 0 0 0 0 F 0 0 0 0 0 0 0 0 0 5 0 0 F# 0 0 0 0 0 0 0 0 0 5 0 0 G 0 0 0 0 0 0 0 0 0 0 5 0 G# 0 0 0 0 0 0 0 0 0 0 0 5

Hal ini membuktikan bahwa dengan mengganti radiusnya menjadi 1 ataupun 2, maka akan meminimalisir kesalahan clustering dan dapat meningkatkan akurasinya. Nada yang masih salah dalam clustering ini dikarenakan kurang baiknya dalam perekaman nada dan juga kurang baiknya dalam memainkan angklungnya.

SIMPULAN DAN SARAN

Simpulan

Berdasarkan penelitian yang telah dilakukan, maka dapat disimpulkan bahwa:

1 Penelitian ini telah berhasil menerapkan metode SOM dan teknik ekstraksi ciri MFCC dalam pengenalan nada angklung.

2 Akurasi tertinggi yang dihasilkan adalah 98.33% di radius 1 pada ulangan 1 dan 3 serta di radius 2 pada ulangan 1 dengan laju pembelajaran yang sama di kedua radius yaitu 0.0090. Parameter MFCC yang digunakan yaitu sampling rate sebesar 11 000 Hz, time frame sebesar 40 ms, overlapping sebesar 50%, dan 26 koefisien cepstral serta parameter SOM lainnya yaitu 300 epoch, penurunan laju pembelajaran sebesar 0.1.

(27)

16

4 Perubahan radius dari 0 menjadi 1 ataupun 2, maka akan meminimalisir kesalahan clustering dan dapat meningkatkan akurasinya.

5 Radius 1 dan 2 memiliki rata-rata akurasi tertinggi dari ulangannya yaitu sebesar 92.61%.

Saran

Saran untuk pengembangan selanjutnya yaitu:

1 Mencoba dengan data yang lebih banyak lagi untuk dibandingkan hasilnya dengan penelitian ini.

2 Mencoba memodelkan dengan metode pengenalan pola serta ekstraksi ciri yang lain untuk dibandingkan akurasinya dengan penelitian ini. Metode pengenalan pola lain misalnya LVQ, Backpropagation, Counterpropagation, dan lainnya. Metode ekstraksi ciri misalnya LPCC, LPC, RCC, dan lainnya. 3 Mencoba mengganti parameter-parameter SOM serta MFCC untuk

dibandingkan hasilnya dengan penelitian ini.

DAFTAR PUSTAKA

Buono A, Jatmiko W, Kusumoputro B. 2011. Mel-frequency cepstrum coefficients as higher order statistics representation to characterize speech signal for speaker identification system in noisy environment using hidden markov model. Di dalam: Mwasiagi JI, editor. Self Organizing Maps - Applications and Novel Algorithm Design. Rijeka (HR): Intech. hlm 189-206. doi: 10.5772/566.

Do MN. 1994. Digital signal processing mini-project: an automatic recognition system. Laussane (CH): Federal Institute of Technology.

Fausett L. 1994. Fundamentals of Neural Networks: Architectures, Algorithms, and Applications. New Jersey (US): Prentice Hall.

Ganchev TD. 2005. Speaker recognition [disertasi]. Patras (GR): University of Patras.

[Kemdikbud RI] Kementerian Pendidikan dan Kebudayaan Republik Indonesia. [tahun tidak diketahui]. Angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia pada: http://kebudayaanindonesia.net/id/culture/826/angklung#.UlgaY1NmNds. Monte E, Hernando J, Miro X, Adolf A. 1996. Text independent speaker

identification on noisy environments by means of self organizing maps. Di dalam: Bunnell HT, Idsardi W, editor. Proceedings ICSLP 96 Fourth International Conference on Spoken Language; 1996 Okt 3-6; Philadelphia, Amerika Serikat. Wilmington (US): Citation Delaware. 3(1):1084-1807. doi: 10.1109/ICSLP.1996.607980.

(28)

17 [UNESCO] United Nations Educational, Scientific and Cultural Organization.

2010. Indonesian angklung [Internet]. [diunduh 2013 Okt 3]. Tersedia pada: http://www.unesco.org/culture/ich/en/RL/00393.

Wisnudisastra E, Buono A. 2010. Pengenalan chord pada alat musik gitar menggunakan codebook dengan teknik ekstraksi ciri MFCC. Jurnal Ilmiah Ilmu Komputer. 14 (1):16-21.

(29)

18

RIWAYAT HIDUP

Penulis dilahirkan di Cirebon, Jawa Barat, Indonesia pada tanggal 16 Oktober 1990. Penulis merupakan anak kedua dari tiga bersaudara, dari pasangan H Achmad Hudaja, SEAk dan Dra Hj Sri Endang Pawukir, MA.

Penulis memulai pendidikan formal dari TK 27 Cirebon dan lulus pada tahun 1996, kemudian melanjutkan pendidikan di SDN Kebonbaru 4 Cirebon dan lulus pada tahun 2002. Pendidikan menengah diselesaikan di SMP Negeri 5 Cirebon dan lulus pada tahun 2005. Lalu, penulis melanjutkan pendidikan tingkat atas di SMAN 6 Cirebon dan lulus pada tahun 2008. Pada tahun 2008, penulis melanjutkan pendidikan di Institut Pertanian Bogor Direktorat Program Diploma, Program Keahlian Teknik Komputer melalui jalur Undangan Seleksi Masuk IPB (USMI) dan lulus pada tahun 2011.

Gambar

Gambar 1  Angklunga
Tabel 1  Nada angklung melodib
Gambar 2  Tahapan proses penelitian
Gambar 3  Alur praproses
+7

Referensi

Dokumen terkait

Suara chord gitar dapat diidentifikasi dengan mengekstrasi ciri dari setiap chord menggunakan teknik mel-frequency cepstrum coefficient (MFCC) untuk kemudian

Dengan melakukan beberapa pengujian menggunakan PCA sebagai pengambilan ciri pada citra wajah dan eucliden distance untuk mencari nilai minimum jarak antar citra data training

Tugas akhir ini akan menggunakan metode penyamaan pitch interval menganalisis sinyal melodi senandung yang diekstraksi menjadi sederatan pitch, untuk

Dari penelitian yang dilakukan dengan menggunakan data fertility yang diperoleh melalui web uci repository, kemudian data diolah menggunakan metode neural network

Proses pembuatan data terdiri dari sampling, pre-processing, ekstraksi ciri MFCC. Data dilakukan dengan pengambilan ucapan angka 0-9 dalam bentuk .wav yang kemudian diproses

Berdasarkan hasil pengujian generalisasi terhadap 60 data uji yang terdiri dari 15 data nada G, 15 data nada D, 15 data nada A, dan 15 data nada E pada learning rate 0.00025

Ciri yang dibangun menggunakan metode Freeman Chain Code yang dimodifikasi mampu mengenali citra karakter angka tulisan tangan pada pengujian menggunakan data testing form

Dalam kaitannya dengan penelitian ini, metode SOM akan digunakan untuk mengelompokkan mahasiswa berdasarkan data nilai dari beberapa matakuliah di semester berjalan1.