• Tidak ada hasil yang ditemukan

Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar"

Copied!
32
0
0

Teks penuh

(1)

PENGEMBANGAN MODEL

PROBABILISTIC NEURAL

NETWORK

UNTUK IDENTIFIKASI

CHORD

GITAR

ARVIANI RIZKI

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

ABSTRAK

ARVIANI RIZKI. Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar. Dibimbing oleh AGUS BUONO.

Pengenalan kunci gitar membutuhkan teknik ekstraksi ciri dan model pengenalan pola. Penelitian ini membangun sistem pengenalan suara gitar menggunakan teknik MFCC sebagai pengekstraksi ciri dan PNN sebagai pengenal pola. Tujuan penelitian ini adalah menemukan parameter-parameter yang menghasilkan akurasi terbaik. Parameter-parameter tersebut terkait dengan MFCC, yaitu jumlah koefisien cepstral, overlap, dan time frame. Sistem bekerja dengan membaca file suara berformat WAV, kemudian file diproses dengan teknik MFCC dan PNN untuk menghasikan keluaran kunci suara gitar berupa teks. Penelitian ini menggunakan 8 280 data suara gitar dari 24 chord yang berbeda. Hasil penelitian menunjukan bahwa koefisien cepstral 52, overlap 0.4, dan time frame 100 ms menghasilkan akurasi maksimum yaitu 96.56%.

Kata kunci: identifikasi kunci gitar, mel frequency cepstral coefficients (MFCC), pengenalan suara, probabilistic neural network

ABSTRACT

ARVIANI RIZKI. Development of Probabilistic Neural Network Model to Identify Guitar Chord. Supervised by AGUS BUONO.

Guitar chord recognition requires feature extraction techniques and pattern recognition model. This research developed a guitar chord recognition system by utilizing MFCC as the feature extraction and PNN technique as the pattern recognition. The aim of this research was to find the parameters that can produce the highest accuracy. Those parameters were related to MFCC, namely cepstral coefficients, overlap, and time frame. The system worked by reading a WAV file and then processing the guitar chord text. This research utilized 8 280 guitar sound data from 24 different guitar chords. The result showed that 52 cepstral coefficients, 0.4 overlap, and 100 ms time frame can produce the highest accuracy of 96.56%.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer

pada

Departemen Ilmu Komputer

PENGEMBANGAN MODEL

PROBABILISTIC NEURAL

NETWORK

UNTUK IDENTIFIKASI

CHORD

GITAR

ARVIANI RIZKI

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)

Penguji:

1 Mushthofa, SKom MSc

(7)
(8)

Judul Skripsi : Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar

Nama : Arviani Rizki NIM : G64104027

Disetujui oleh

Dr Ir Agus Buono, MSi MKom Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom Ketua Departemen Ilmu Komputer

(9)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wata’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2012 ini ialah ekstraksi ciri dan pengenalan pola, dengan judul Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar.

Penulis sadar bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada:

1 Bapak Dr Ir Agus Buono, MSi MKom selaku pembimbing yang telah memberikan arahan, bimbingan, dan saran selama penelitian ini berlangsung. 2 Bapak Mushthofa, SKom MSc dan Bapak Muhammad Ashyar Agmalaro, SSi

MKom selaku penguji untuk penelitian ini.

3 Orang tua tercinta Bapak Arief Suyanto, Ibu Tuti Suryati serta kakak-kakak tersayang atas segala doa dan dukungan yang tiada hentinya.

4 Teman-teman ilmu komputer Toni Haryono, Armen Marta, Yosi Nurhayati dan Ahmad Somadi terima kasih atas kerjasamanya.

Penulis menyadari bahwa masih terdapat kekurangan dalam penulisan skripsi ini. Semoga karya ilmiah ini bermanfaat.

(10)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 1

Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

METODE PENELITIAN 2

Pengambilan Data Suara Gitar 4

Normalisasi 4

Segmentasi 5

Data Latih dan Data Uji 5

Ekstraksi Ciri dengan MFCC 5

Pembuatan Modul PNN 7

Pengujian 9

HASIL DAN PEMBAHASAN 9

Pengumpulan Data 9

Segmentasi 9

Ekstraksi Ciri dengan MFCC 9

Hasil Pengujian 10

Percobaan dengan 13 koefisien cepstral 10

Percobaan dengan 26 koefisien cepstral 11

Percobaan dengan 39 koefisien cepstral 11

Percobaan dengan 52 koefisen cepstral 11

Analisis Percobaan 12

Analisis Kesalahan 12

SIMPULAN DAN SARAN 13

Simpulan 13

Saran 13

(11)

RIWAYAT HIDUP 22

DAFTAR TABEL

1 Chord mayor dan chord minor 4

2 Komposisi data 5

3 Akurasi dengan 13 koefisien cepstral 10

4 Akurasi dengan 26 koefisien cepstral 11

5 Akurasi dengan 39 koefisien cepstral 11

6 Akurasi dengan 52 koefisien cepstral 11

DAFTAR GAMBAR

1 Alur proses transformasi sinyal suara analog menjadi informasi (Buono

2009) 2

2 Diagram alur penelitian 3

3 Diagram alur teknik MFCC untuk mengekstrak sinyal 6

4 Struktur PNN (Ganchev 2005) 8

5 Pemodelan PNN identifikasi chord 10

6 Perbandingan hasil akurasi dengan 13, 26, 39, dan 52 koefisien cepstral 12

DAFTAR LAMPIRAN

(12)

1

PENDAHULUAN

Latar Belakang

Gitar merupakan alat musik yang paling umum dimainkan oleh berbagai kalangan usia. Hampir semua jenis musik menggunakan gitar sebagai instrumen. Untuk menghasilkan suara gitar yang harmonis dibutuhkan penguasaan kunci atau chord gitar. Chord merupakan satuan nada-nada yang dibunyikan secara serentak yang berfungsi sebagai pengiring dalam lagu maupun permainan musik (Wisnudisastra dan Buono 2010). Pendengaran manusia memiliki kemampuan dan kepekaan yang beragam dalam mengenali chord gitar. Seorang yang terbiasa dengan suara gitar dapat dengan mudah mengenali dan membedakan chord gitar, namun bagi orang awam hal tersebut sulit untuk dilakukan.

Penggunaan teknologi dan komputer dapat dilakukan untuk memecahkan masalah tersebut, yaitu pembuatan sistem yang dapat mengidentifikasi chord gitar. Kinerja komputer yang objektif dan konsisten dalam menjalankan setiap perintah dapat memudahkan pengguna untuk mengetahui dan membedakan suara chord gitar dengan akurat. Pengenalan suara (speech recognition) adalah teknologi yang dapat mengubah sinyal suara menjadi sebuah informasi berupa teks. Suara chord gitar dapat diidentifikasi dengan mengekstrasi ciri dari setiap chord menggunakan teknik mel-frequency cepstrum coefficient (MFCC) untuk kemudian dilakukan pengenalan pola menggunakan probabilistic neural network (PNN). PNN sebagai salah satu arsitektur jaringan saraf tiruan (JST) telah terbukti menghasilkan akurasi tinggi di beberapa penelitian sebelumnya. Penelitian yang telah dilakukan oleh Fransiswa (2010) tentang pengembangan PNN pada pengenalan kisaran usia dan jenis kelamin berbasis suara memiliki rataan akurasi 91.26%.

Penelitian identifikasi suara gitar sebelumnya dilakukan oleh Wisnudisastra (2010) menggunakan teknik MFCC dan codebook sebagai pengenalan pola. Penelitian tersebut menghasilkan rataan akurasi sebesar 91% menggunakan 13 koefisien cepstral dan 96% menggunakan 26 koefisien cepstral. Penelitian tersebut memiliki keterbatasan untuk mengenali satu jenis chord gitar sehingga belum dapat mengidentifikasi chord gitar yang kontinu.

Pada penelitian ini, identifikasi chord gitar dilakukan untuk chord gitar yang kontinu menggunakan teknik MFCC untuk ekstraksi ciri dan model PNN untuk pengenalan pola.

Tujuan Penelitian

Tujuan dari penelitian ini adalah:

1 Mengimplementasikan teknik ekstraksi ciri MFCC dan metode PNN untuk identifikasi chord gitar.

2 Mengidentifikasi suara gitar yang terdiri dari campuran chord gitar.

(13)

2

Manfaat Penelitian

Dengan adanya penelitian ini diharapkan dapat memberikan informasi tingkat akurasi pengembangan model PNN untuk identifikasi chord gitar yang kontinu.

Ruang Lingkup Penelitian

Ruang lingkup dari penelitian ini antara lain:

1 Gitar yang digunakan adalah jenis gitar akustik dengan senar string.

2 Suara gitar berupa hasil rekaman dari campuran chord mayor dan chord minor. 3 Suara gitar berupa dua campuran chord.

4 Gitar dimainkan dengan cara dipukul serentak dari atas ke bawah dalam satu posisi untuk setiap chord.

5 Gitar yang digunakan adalah standar tunning.

METODE PENELITIAN

Penelitian ini menggunakan suara gitar yang akan diproses oleh sistem menjadi suatu informasi berupa chord dari suara gitar tersebut. Untuk dapat mengubah sebuah suara menjadi suatu informasi dibutuhkan beberapa proses, alur proses tersebut dapat dilihat pada Gambar 1.

Gelombang suara yang ditangkap berupa sinyal analog, maka sinyal tersebut perlu diubah dahulu menjadi sinyal digital agar dapat diolah oleh komputer, proses ini disebut digitalisasi.

(14)

3

Proses digitalisasi suara terdiri dari dua tahap yaitu sampling dan kuantisasi (Jurafsky dan Martin 2000). Sampling adalah proses pengambilan nilai (sampling rate) dalam jangka waktu tertentu. Sampling rate adalah banyaknya nilai yang diambil setiap detik. Sampling rate yang biasa digunakan pada pengenalan suara ialah 8 000 Hz sampai dengan 16 000 Hz (Jurafsky dan Martin 2000). Hubungan antara panjang vektor data yang dihasilkan dengan sampling rate dan panjangnya data suara yang didigitalisasikan dapat dinyatakan secara sederhana sebagai berikut:

S = Fs × T Keterangan :

S = panjang vektor

Fs = sampling rate yang digunakan (Hertz) T = panjang suara (detik)

Setelah melalui proses sampling proses selanjutnya adalah kuantisasi. Kuantisasi merupakan proses mengkonversi nilai amplitudo yang bersifat kontinu pada suatu waktu tertentu menjadi sinyal digital dengan mengekspresikannya menggunakan sejumlah digit tertentu (Buono 2009).

Setelah mengubah sinyal analog menjadi sinyal digital, dilakukan pembacaan sinyal dari frame ke frame dengan lebar tertentu yang saling tumpang tindih untuk menghindari kehilangan informasi. Ekstraksi ciri dilakukan pada setiap frame untuk mendapatkan vektor ciri. Setiap vektor ciri tersebut dilakukan pengenalan pola untuk memperoleh informasi yang diinginkan.

Pembuatan sistem dibagi menjadi beberapa tahap sesuai dengan diagram alur penelitian yang ditunjukkan pada Gambar 2.

Mulai

Perumusan Masalah

Pengambilan Data Suara Gitar

Segmentasi Manual

Selesai Data

Latih Data Uji

Pembuatan Modul

PNN Parameter Modul Pengujian

Analisis & Pembahasan

Dokumentasi & Pelaporan

MFCC MFCC

Teori-teori yang terkait

Normalisasi

(15)

4

Pengambilan Data Suara Gitar

Penelitian ini menggunakan data hasil perekaman suara gitar yang telah dikonversi ke bentuk digital berformat WAV. Suara gitar merupakan hasil campuran permainan dua buah chord dari 24 chord yang ada. Chord gitar yang dimainkan terdiri dari dua jenis, yaitu chord mayor dan chord minor yang masing-masing berjumlah 12. Chord mayor dan minor seperti pada Tabel 1. Bentuk 24

chord mayor dan minor yang digunakan pada penelitian ini dapat dilihat pada Lampiran 1.

Perekaman suara gitar dilakukan menggunakan microphone yang dipasang pada gitar dan dilakukan ditempat yang hening untuk meminimalkan adanya noise. Perekaman dilakukan sebanyak 15 kali untuk setiap dua campuran chord. Data suara berjumlah 8 640 data yang berasal dari perkalian 24 chord pertama, 24 chord kedua dan 15 kali perekaman.

Suara gitar direkam menggunakan ukuran waktu tiga detik dengan sampling rate sebesar 11 000 Hz dan bit rate sebesar 16 bit. Data suara gitar berupa campuran chord C ke chord C#, chord C ke chord Cm dan seterusnya masing-masing sebanyak 15 kali. Untuk setiap campuran digunakan sepuluh kali perekaman untuk data latih dan lima kali perekaman untuk data uji. Sehingga terdapat 5 760 data latih dan 2 880 data uji.

Tabel 1 Chord mayor dan chord minor Chord dasar Mayor Minor

C C Cm

C# C# C#m

D D Dm

D# D# D#m

E E Em

F F Fm

F# F# F#m

G G Gm

G# G# G#m

A A Am

A# A# A#m

B B Bm

Normalisasi

(16)

5

Segmentasi

Tahap segmentasi merupakan tahap pemotongan jeda pada setiap sinyal suara. Pendeteksian jeda dilakukan pada sinyal untuk memisahkan dua campuran chord menjadi dua sinyal yang berbeda.

Pada pengambilan data suara, terdapat jeda pada perpindahan chord pertama dan chord kedua. Dengan demikian sinyal suara akan dipisah secara manual dengan menghapus bagian yang dianggap jeda, sehingga akan mendapatkan dua sinyal yaitu chord pertama dan chord kedua. Pemisahan dilakukan dengan mencari rentang terbesar dari setiap frame yang nilainya kurang dari rataan frame.

Data Latih dan Data Uji

Data latih merupakan data yang digunakan untuk pembelajaran sistem. Data latih diambil sebanyak 10 kali dari masing-masing dua campuran chord mayor dan chord minor. Setelah melalui tahap segmentasi, didapatkan 5 760 data latih dari hasil perkalian 24 chord pertama, 24 chord kedua dan 10 kali perekaman. Data latih kemudian diproses dengan teknik MFCC untuk mengekstraksi ciri dari setiap data latih.

Data uji merupakan data yang digunakan untuk uji coba akurasi sistem. Terdapat 2 880 data uji yang berasal dari hasil perkalian 24 chord pertama, 24 chord kedua dan 5 kali perekaman. Komposisi data chord yang dipakai dalam penelitian dapat dilihat pada pada Tabel 2.

Tabel 2 Komposisi data

Komposisi Jumlah

Jumlah chord 24

Jumlah campuran (24 x 24) 576

Data latih (576 x 10) 5760

Data uji (576 x 5) 2280

Total data (5760 + 2280) 8640

Ekstraksi Ciri dengan MFCC

Ekstraksi ciri merupakan proses untuk menentukan suatu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu (Buono 2009). Salah satu teknik ekstraksi ciri pemrosesan suara yang sering digunakan dan menunjukan kinerja yang baik adalah MFCC.

(17)

6

mendengarkan bunyi (Ganchev 2005). Skala mel dibentuk untuk mengikuti persepsi sistem pendengaran manusia.

Gambar 3 Diagram alur teknik MFCC untuk mengekstrak sinyal

Koefisien MFCC merupakan hasil transformasi cosinus dari spektrum mel tersebut dan dipilih k koefisien. Transformasi cosinus berfungsi untuk mengembalikan domain, dari domain frekuensi ke domain waktu.

Tahap-tahap proses MFCC adalah sebagai berikut (Do 1994) :

1 Frame blocking. Pada tahap frame blocking sinyal suara dibagi ke dalam n-buah frame yang terdiri dari n-sampel. Tahap ini melakukan overlapping pada

Sinyal suara frame ke t

O = O + O + …,Ot, … , OT

O = O1,O2, …, Ot, …,OT

Cepstrum Coefficients :Discrete Cosine Transform

� = ∑ �

=

� − /

Cj=nilai koefisien C ke j j= jumlah koefisien cepstral M = jumlah filter

Xi =hasil Mel Frequency Wrapping pada frekuensi ke i, i= jumlah wrapping

Windowing: yt(n)=xt(n)w(n), 0 ≤ n N-1 w(n) = 0.54 – 0.46 cos (2πn/(N-1))

� = hasil � pada frame ke dalam domain waktu

N= jumlah sampel pada setiap frame, n = frame ke-… W= formula hamming window, = nilai data ke n

Fast Fourier Transform (FFT):

Xn=∑xk N-1

k=0

e-2πjki/N

Xk=nilai-nilai sampel yang akan diproses pada domain frekuensi Xn=magnitude frekuensi

N = jumlah data pada domain frekuensi, j=bilangan imajiner, k = N/2 + 1, i = n x t

Mel Frequency Wrapping: mel(f) = 2595 * log10 (1 + f / 700) dari sini diperoleh M filter, dan dihitung spektrum Mel:

Xi=log10 ∑|X k|Hi N-1

k=0

(k) , i=1,2,3,…,M

�(k) = nilai filter segitiga ke i X k =nilai data ke k hasil proses FFT M = jumlah filter

(18)

7

frame yang satu dengan frame tetangganya untuk menghindari kehilangan informasi.

2 Windowing. Untuk meminimalkan diskontinuitas sinyal pada setiap awal dan akhir frame dilakukan proses windowing. Proses ini dilakukan dengan mengalikan antara frame dengan jenis window yang digunakan.

3 Fast Fourier Transform (FFT). Tahap FFT mengubah tiap frame dari domain waktu ke domain frekuensi.

4 Mel-frequency wrapping. Proses ini menggunakan filter yang saling overlapping untuk domain frekuensi. Rentang filter tersebut ditentukan berdasarkan hasil studi psikologi manusia dalam mendengarkan bunyi (Ganchev 2005). Oleh karena itu, untuk setiap nada dengan frekuensi aktual f, tinggi subyektifnya diukur dengan skala mel (melody). Skala mel-frequency adalah selang frekuensi di bawah 1 000 Hz dan selang logaritmik untuk frekuensi di atas 1 000 Hz (Do 1994)

5 Cepstrum coefficients. Hasil dari proses MFCC adalah mel spectrum coefficients dengan jumlah koefisien yang ditentukan terlebih dahulu. Kemudian algoritma discrete cosine transform (DCT) digunakan untuk mengkonversi mel-frequency ke dalam domain waktu.

Pembuatan Modul PNN

Probabilistic neural network (PNN) adalah suatu metode klasifikasi jaringan saraf tiruan (JST) dengan menggunakan data pelatihan. Model PNN merupakan salah satu jenis jaringan saraf tiruan yang memiliki tingkat akurasi yang cukup tinggi dalam pengklasifikasian yaitu hampir mendekati 100% (Fransiswa 2010). Dengan menggunakan pengklasifikasi Bayesian dapat ditentukan bagaimana sebuah data masukan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut. PNN memiliki struktur yang terdiri atas empat layer seperti pada Gambar 4.

1 Input layer merupakan layer untuk input data yang akan diuji.

2 Pattern layer berfungsi menghitung jarak antara nilai input data suara dengan nilai pola dari tiap anggota kelas yang dirumuskan pada Persamaan 1.

fA x =(2π)1p⁄2hp

1

m∑ exp[−

xxAi T x-xAi

h2 ]

m

i=

Keterangan:

p = dimensi vektor input m = jumlah pola pelatihan

xAi = vektor latih kelas-A urutan ke-i x = vektor input

h = smoothing parameter (α × simpangan baku ke-i×n1/5)

(19)

8

Gambar 4 Struktur PNN (Ganchev 2005)

Nilai fA(x) merupakan nilai hasil pattern layer ke-i sampai n banyaknya pattern di setiap kelas. Setelah mendapatkan selisih jarak antara data input dengan data pada pattern layer, selisih tersebut dibagi dengan nilai smoothing parameter. Pemilihan nilai smoothing parameter (h) harus diperhatikan, karena nilai ini memegang peranan yang penting terhadap ketepatan hasil pengklasifikasian yang dilakukan. Smoothing parameter yang terlalu kecil akan mengakibatkan pendekatan yang terlalu sempit, sedangkan jika terlalu besar dapat menghilangkan detil yang penting (Masters 1995).

3 Summation layer. Layer ini menghasilkan peluang untuk satu kelas. Peluang tersebut didapat dari penjumlahan pattern layer pada kelas tersebut dan hasilnya dibagi dengan (2π)d/2 hih2...hdn. Nilai hih2...hd adalah nilai smoothing dari kelas tersebut.

P x = 1

d2h1h2hdn∑( fA(x)) n

i=1

(20)

9

Pengujian

Proses pengujian dilakukan dengan membandingkan data uji dengan chord yang teridentifikasi dari 24 chord yang ada. Data uji akan diklasifikasikan ke kelas yang sesuai dengan cara menghitung peluang terbesar yang mendekati kelas chord tertentu. Hasil yang didapat akan dihitung akurasinya dengan rumus berikut ini:

Hasil = Σ Data uji yang benarΣ Data Uji x 100%

HASIL DAN PEMBAHASAN

Pengumpulan Data

Pengumpulan data suara direkam langsung menggunakan gitar melalui software MATLAB R2008b. Suara campuran 2 chord gitar direkam selama tiga detik dan disimpan ke dalam file berekstensi WAV. Setiap campuran chord dilakukan masing-masing 15 kali perekaman sehingga menghasilkan 8 640 data.

Data suara tersebut tersusun dari sinyal-sinyal yang mengandung nilai. Nilai tersebut akan menghasilkan sebuah vektor yang kemudian dilakukan proses normalisasi agar data suara lebih terstandar pada rentang minus satu sampai satu.

Segmentasi

Data hasil normalisasi disegmentasi secara manual untuk memisahkan dua campuran chord menjadi dua sinyal berbeda. Pemotongan jeda dilakukan dengan beberapa tahap, yaitu:

1 Mengabsolutkan nilai-nilai.

2 Membuat batas pada titik 1 500 sampai 30 000 3 Menghitung rata-rata pada rentang titik tersebut.

4 Menyeleksi rentang nilai chord terpanjang yang kurang dari rata-rata, dan memastikan rentang tersebut berada pada titik 5 000 sampai 20 000. 5 Rentang terpanjang dianggap jeda.

6 Mendapatkan chord pertama dan chord kedua.

Setelah mendapatkan semua data dalam bentuk vektor yang diharapkan, maka proses dilanjutkan dengan tahap MFCC.

Ekstraksi Ciri dengan MFCC

Proses MFCC menggunakan data vektor hasil segmentasi manual. Proses MFCC pada penelitian ini menggunakan fungsi pada auditory toolbox Matlab. Fungsi MFCC didapat dari Buono (2009). Proses MFCC memerlukan beberapa parameter input yaitu sampling rate, time frame, overlap, dan cepstral coefficient. Pada penelitian ini menggunakan nilai untuk sampling rate 11 000 Hz, time frame 100 ms, overlap 0.4 dan jumlah koefisien cepstral yaitu 13, 26, 39, dan 52.

(21)

10

digunakan dikali dengan banyak frame yang terbentuk. Hasil matriks tersebut menunjukan ciri spectral dari sinyal tersebut.

Pemodelan Probabilistic Neural Network

Pada model PNN digunakan data uji sebagai input data. Input data diidentifikasi dengan pattern layer. Nilai fA(x) merupakan nilai hasil pattern layer, nilai tersebut dibagi dengan nilai smoothing parameter. Nilai smoothing parameter pada Persamaan 1 digunakan nilai 1.14 untuk α. Simpangan baku didapat dari data setiap pattern ke j=1, 2 sampai n banyaknya data pattern. Sehingga didapatkan smoothing parameter 1.14 × (simpangan baku) × n-1/5. Gambar 5 menunjukan model PNN yang dibuat untuk identifikasi chord gitar.

Gambar 5 Pemodelan PNN identifikasi chord

Hasil Pengujian

Pada tahap pengujian, data akan diujikan untuk diidentifikasi sesuai dengan chord yang dimainkan. Penelitian ini menggunakan beberapa parameter yang diujicobakan yaitu:

1 Time frame sebesar 100 ms 2 Overlap 0.4

3 Jumlah koefisien cepstral 13, 26, 39, dan 52

4 Smoothing parameter yang didapat dari 1.14 × (simpangan baku) × n-1/5.

Percobaan dengan 13 koefisien cepstral

Tabel 3 Akurasi dengan 13 koefisien cepstral

Chord Akurasi Chord Akurasi Chord Akurasi

A 8.33 Cis 27.50 F 1.67

Am 5.83 Cism 37.50 Fm 55.83

Ais 52.50 D 20.83 Fis 52.50

Aism 10.00 Dm 84.17 Fism 35.83

B 13.33 Dis 44.17 G 29.17

Bm 22.50 Dism 25.83 Gm 40.83

C 8.33 E 47.50 Gis 54.17

Cm 80.00 Em 48.33 Gism 77.50

(22)

11

Hasil percobaan menggunakan 13 koefisien cepstral dapat dilihat pada Tabel 3. Akurasi terkecil terdapat pada percobaan chord F yaitu hanya 1.67% sedangkan akurasi terbesar terdapat pada percobaan chord Dm yaitu 84.17%.

Percobaan dengan 26 koefisien cepstral

Hasil percobaan menggunakan 26 koefisien cepstral dapat dilihat pada Tabel 4. Akurasi terkecil terdapat pada percobaan chord F yaitu 44.17% sedangkan akurasi terbesar terdapat pada percobaan chord Cm yaitu 97.5%.

Tabel 4 Akurasi dengan 26 koefisien cepstral

Chord Akurasi Chord Akurasi Chord Akurasi

A 81.67 Cis 60.00 F 44.17

Am 65.00 Cism 54.17 Fm 69.17

Ais 92.50 D 64.17 Fis 92.50

Aism 90.83 Dm 95.00 Fism 91.67

B 73.33 Dis 85.00 G 45.00

Bm 87.50 Dism 55.83 Gm 93.33

C 52.50 E 77.50 Gis 90.00

Cm 97.50 Em 80.83 Gism 94.17

Akurasi keseluruhan 76.39

Percobaan dengan 39 koefisien cepstral

Hasil percobaan menggunakan 39 koefisien cepstral dapat dilihat pada Tabel 5. Akurasi terkecil terdapat pada percobaan chord Dism yaitu 65% sedangkan akurasi terbesar terdapat pada percobaan chord Cm, Dis, Fis dan Fism yaitu 100%.

Tabel 5 Akurasi dengan 39 koefisien cepstral

Chord Akurasi Chord Akurasi Chord Akurasi

A 98.33 Cis 91.67 F 95.00

Am 93.33 Cism 72.50 Fm 90.83

Ais 98.33 D 85.83 Fis 100.00

Aism 98.33 Dm 97.50 Fism 100.00

B 90.00 Dis 100.00 G 78.33

Bm 91.67 Dism 65.00 Gm 100.00

C 97.50 E 97.50 Gis 100.00

Cm 100.00 Em 96.67 Gism 98.33

Akurasi keseluruhan 93.19

Percobaan dengan 52 koefisen cepstral

Tabel 6 Akurasi dengan 52 koefisien cepstral

Chord Akurasi Chord Akurasi Chord Akurasi

A 98.33 Cis 94.17 F 98.33

Am 96.67 Cism 80.83 Fm 98.33

Ais 98.33 D 92.50 Fis 99.17

Aism 100.00 Dm 93.33 Fism 100.00

B 96.67 Dis 100.00 G 93.33

Bm 93.33 Dism 89.17 Gm 100.00

C 99.17 E 99.17 Gis 98.33

Cm 100.00 Em 100.00 Gism 98.33

(23)

12

Hasil percobaan menggunakan 52 koefisien cepstral dapat dilihat pada Tabel 6. Akurasi terkecil terdapat pada percobaan chord Cism yaitu 80.83% sedangkan akurasi terbesar terdapat pada percobaan chord Aism, Cm, Dis, Em, Fism dan Gm yaitu 100%.

Analisis Percobaan

Berdasarkan hasil pengujian identifikasi chord gitar didapatkan hasil akurasi yang berbeda untuk setiap koefisien cepstral yang digunakan.

Gambar 6 Perbandingan akurasi dengan 13, 26, 39, dan 52 koefisien cepstral Koefisien cepstral yang diujikan antara lain 13, 26, 39, dan 52. Pada Gambar 6 terlihat grafik perbandingan hasil akurasi menggunakan beberapa koefisien cepstral. Pada penelitian ini menunjukan bahwa tingkat akurasi sangat bergantung pada jumlah koefisien cepstral yang digunakan. Berdasarkan penelitian ini semakin besar koefisien cepstral yang digunakan, semakin tinggi rataan akurasi yang dihasilkan. Namun hal itu tidak berlaku untuk akurasi pada masing-masing chord. Seperti pada chord Dm, chord Fis dan chord Gis yang mengalami sedikit penurunan akurasi pada koefisien 52.

Hasil akurasi tertinggi terjadi pada percobaan yang menggunakan 52 koefisien cepstral yaitu 96.56%. Rataan akurasi yang didapat dari penelitian ini sebesar 75.75%. Berdasarkan rataan akurasi tiap chord, akurasi tertinggi terdapat pada chord Cm yaitu sebesar 94.38% sedangkan rataan akurasi terendah terdapat pada chord Dism yaitu 58.96%.

Analisis Kesalahan

Pada penelitian ini, pengembangan model PNN untuk identifikasi chord gitar menghasilkan akurasi terbaik menggunakan koefisien cepstral 52.

Berdasarkan Lampiran 2, pada confusion matrix koefisien cepstral 13 kesalahan identifikasi terbanyak terdapat pada chord B yang diidentifikasi sebagai

chord Cm sebanyak 55%.

36.84

76.39

93.19 96.56

10 20 30 40 50 60 70 80 90 100

13 26 39 52

Ak

u

rasi

(%)

(24)

13

Pada penggunaan koefisien cepstral 26, kesalahan identifikasi terbanyak terdapat pada chord B yang diidentifikasi sebagai chord Bm sebanyak 24%.

Confusion matrix koefisien 26 dapat dilihat pada Lampiran 3.

Berdasarkan Lampiran 4, kesalahan identifikasi terbanyak untuk koefisien

cepstral 39 terdapat pada chord Cism yang diidentifikasi sebagai chord Cis sebanyak 22%.

Pada penggunaan koefisien cepstral 52 terjadi kesalahan terbanyak pada chord

Cism yang diidentifikasi sebagai chord Cis sebanyak 19%. Confusion matrix dengan koefisien cepstral 52 dapat dilihat pada Lampiran 5.

Berdasarkan pengamatan pada setiap pengujian yang dilakukan untuk setiap koefisien cepstral, kesalahan identifikasi terbanyak terjadi pada chord B yang diidentifikasi sebagai chord Bm dan chord Cism yang diidentifikasi sebagai chord

Cis.

SIMPULAN DAN SARAN

Simpulan

Penelitian ini telah berhasil dalam mengidentifikasi chord gitar dengan mengimplementasikan metode PNN dan teknik ekstraksi ciri MFCC. Hasil akurasi tertinggi yang dihasilkan sebesar 90.49% dengan penggunaan time frame 100 ms, overlap 40% dan 52 koefisien cepstral. Penelitian ini mampu mengidentifikasi campuran dua chord gitar menggunakan model PNN.

Identifikasi chord gitar dalam penelitian ini dilakukan dengan menggunakan empat koefisien cepstral yang berbeda, yaitu 13, 26, 39, dan 52. Hasil akurasi dengan menggunakan empat koefisien cepstral tersebut secara berurutan ialah 40.97%, 73.47%, 84.76%, dan 90.49%. Hal ini menunjukkan bahwa semakin besar nilai koefisien cepstral semakin tinggi akurasi yang didapatkan.

Saran

(25)

14

DAFTAR PUSTAKA

Buono A. 2009. Representasi nilai HOS dan model MFCC sebagai ekstraksi ciri pada sistem identifikasi pembicara di lingkungan ber-noisemenggunakan HMM [disertasi]. Depok (ID): Universitas Indonesia.

Do MN. 1994. Digital Signal Processing Mini-Project: an Automatic Recognition System. Laussane (CH): Federal Institute of Technology.

Fransiswa RR. 2010. Pengembangan model probabilistic neural network (PNN) pada pengenalan kisaran usia dan jenis kelamin berbasis suara [skripsi]. Bogor (ID): Institut Pertanian Bogor.

Ganchev T. 2005. Speaker recognition [disertasi]. Patras (GR): University of Patras.

Jurafsky D, Martin JH. 2000. Speech And Language Processing an Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey (US): Prentice Hall.

MastersT. 1995. Advanced Algorithms for Neural Networks: A C++ Sourcebook. New York (US): John Wiley.

(26)

15

(27)

16

(28)

17

ion matr

ix

ke

sa

laha

n identifika

si

chord

pa

da

Lampiran 2 Confusion matrix kesalahan identifikasi chord pada koefisien 13

Akurasi

8.33

(29)

18

on matri

x

ke

sa

laha

n

identifika

si

Lampiran 3 Confusion matrix kesalahan identifikasi chord pada koefisien 26

Akurasi

(30)

19

Confusion matrix

k

Lampiran 4 Confusion matrix kesalahan identifikasi chord pada koefisien 39

Akurasi

(31)

20

ion matr

ix

ke

sa

laha

n identifika

si

chord

pa

da

koe

fisien

52

Lampiran 5 Confusion matrix kesalahan identifikasi chord pada koefisien 52

Akurasi

(32)

21

RIWAYAT HIDUP

Gambar

Gambar 1  Alur proses transformasi sinyal suara analog menjadi informasi (Buono 2009)
Gambar 2  Diagram alur penelitian
Tabel 1  Chord mayor dan chord minor
Tabel 2  Komposisi data
+6

Referensi

Dokumen terkait

Setelah dilakukan proses pembelajaran dengan menggunakan pendekatan RME, maka akan dilakukan refleksi atau evaluasi terhadap proses pembelajaran yang telah berlangsung,

masyarakat atas bumi, air dan ruang angkasa termasuk kekayaan alam yang terkandung di dalamnya), dan TAP MPR IX/2001 tentang Pembaruan Agraria dan Pengelolaan Sumber Daya Alam

[r]

Peraturan Pemerintah ini mengatur pedoman dan syrat-syarat kerjasama PERTAMINA dan Kontraktor dalam bentuk Kontrak Bagi Hasil untuk melaksanakan usaha Eksplorasi dan Eksploitasi

Pengaruh Konsentrasi Susu Skim dan Waktu Fermentasi Terhadap Hasil Pembuatan Soyghurt.. Jurnal Ilmiah

Suatu kejadian dapat disebut DRPs apabila terdapat dua kondisi, yaitu: (a) adanya kejadian tidak diinginkan yang dialami pasien, kejadian ini dapat berupa keluhan medis,

Hasil pemantauan suhu dari setiap sensor node kemudian dikumpulkan dalam sebuah Base Stasion Controller (BSC) yang menjadi pusat pengendali dan pengolahan datanya,

Adalah nama dari versi terbaru Microsoft Windows, serangkaian sistem operasi yang diproduksi oleh Microsoft untuk digunakan pada komputer pribadi, termasuk komputer