PENGEMBANGAN MODEL
PROBABILISTIC NEURAL
NETWORK
UNTUK IDENTIFIKASI
CHORD
GITAR
ARVIANI RIZKI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
ABSTRAK
ARVIANI RIZKI. Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar. Dibimbing oleh AGUS BUONO.
Pengenalan kunci gitar membutuhkan teknik ekstraksi ciri dan model pengenalan pola. Penelitian ini membangun sistem pengenalan suara gitar menggunakan teknik MFCC sebagai pengekstraksi ciri dan PNN sebagai pengenal pola. Tujuan penelitian ini adalah menemukan parameter-parameter yang menghasilkan akurasi terbaik. Parameter-parameter tersebut terkait dengan MFCC, yaitu jumlah koefisien cepstral, overlap, dan time frame. Sistem bekerja dengan membaca file suara berformat WAV, kemudian file diproses dengan teknik MFCC dan PNN untuk menghasikan keluaran kunci suara gitar berupa teks. Penelitian ini menggunakan 8 280 data suara gitar dari 24 chord yang berbeda. Hasil penelitian menunjukan bahwa koefisien cepstral 52, overlap 0.4, dan time frame 100 ms menghasilkan akurasi maksimum yaitu 96.56%.
Kata kunci: identifikasi kunci gitar, mel frequency cepstral coefficients (MFCC), pengenalan suara, probabilistic neural network
ABSTRACT
ARVIANI RIZKI. Development of Probabilistic Neural Network Model to Identify Guitar Chord. Supervised by AGUS BUONO.
Guitar chord recognition requires feature extraction techniques and pattern recognition model. This research developed a guitar chord recognition system by utilizing MFCC as the feature extraction and PNN technique as the pattern recognition. The aim of this research was to find the parameters that can produce the highest accuracy. Those parameters were related to MFCC, namely cepstral coefficients, overlap, and time frame. The system worked by reading a WAV file and then processing the guitar chord text. This research utilized 8 280 guitar sound data from 24 different guitar chords. The result showed that 52 cepstral coefficients, 0.4 overlap, and 100 ms time frame can produce the highest accuracy of 96.56%.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer
PENGEMBANGAN MODEL
PROBABILISTIC NEURAL
NETWORK
UNTUK IDENTIFIKASI
CHORD
GITAR
ARVIANI RIZKI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Penguji:
1 Mushthofa, SKom MSc
Judul Skripsi : Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar
Nama : Arviani Rizki NIM : G64104027
Disetujui oleh
Dr Ir Agus Buono, MSi MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen Ilmu Komputer
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wata’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2012 ini ialah ekstraksi ciri dan pengenalan pola, dengan judul Pengembangan Model Probabilistic Neural Network untuk Identifikasi Chord Gitar.
Penulis sadar bahwa tugas akhir ini tidak akan terselesaikan tanpa bantuan dari berbagai pihak. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada:
1 Bapak Dr Ir Agus Buono, MSi MKom selaku pembimbing yang telah memberikan arahan, bimbingan, dan saran selama penelitian ini berlangsung. 2 Bapak Mushthofa, SKom MSc dan Bapak Muhammad Ashyar Agmalaro, SSi
MKom selaku penguji untuk penelitian ini.
3 Orang tua tercinta Bapak Arief Suyanto, Ibu Tuti Suryati serta kakak-kakak tersayang atas segala doa dan dukungan yang tiada hentinya.
4 Teman-teman ilmu komputer Toni Haryono, Armen Marta, Yosi Nurhayati dan Ahmad Somadi terima kasih atas kerjasamanya.
Penulis menyadari bahwa masih terdapat kekurangan dalam penulisan skripsi ini. Semoga karya ilmiah ini bermanfaat.
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 1
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE PENELITIAN 2
Pengambilan Data Suara Gitar 4
Normalisasi 4
Segmentasi 5
Data Latih dan Data Uji 5
Ekstraksi Ciri dengan MFCC 5
Pembuatan Modul PNN 7
Pengujian 9
HASIL DAN PEMBAHASAN 9
Pengumpulan Data 9
Segmentasi 9
Ekstraksi Ciri dengan MFCC 9
Hasil Pengujian 10
Percobaan dengan 13 koefisien cepstral 10
Percobaan dengan 26 koefisien cepstral 11
Percobaan dengan 39 koefisien cepstral 11
Percobaan dengan 52 koefisen cepstral 11
Analisis Percobaan 12
Analisis Kesalahan 12
SIMPULAN DAN SARAN 13
Simpulan 13
Saran 13
RIWAYAT HIDUP 22
DAFTAR TABEL
1 Chord mayor dan chord minor 4
2 Komposisi data 5
3 Akurasi dengan 13 koefisien cepstral 10
4 Akurasi dengan 26 koefisien cepstral 11
5 Akurasi dengan 39 koefisien cepstral 11
6 Akurasi dengan 52 koefisien cepstral 11
DAFTAR GAMBAR
1 Alur proses transformasi sinyal suara analog menjadi informasi (Buono
2009) 2
2 Diagram alur penelitian 3
3 Diagram alur teknik MFCC untuk mengekstrak sinyal 6
4 Struktur PNN (Ganchev 2005) 8
5 Pemodelan PNN identifikasi chord 10
6 Perbandingan hasil akurasi dengan 13, 26, 39, dan 52 koefisien cepstral 12
DAFTAR LAMPIRAN
1
PENDAHULUAN
Latar Belakang
Gitar merupakan alat musik yang paling umum dimainkan oleh berbagai kalangan usia. Hampir semua jenis musik menggunakan gitar sebagai instrumen. Untuk menghasilkan suara gitar yang harmonis dibutuhkan penguasaan kunci atau chord gitar. Chord merupakan satuan nada-nada yang dibunyikan secara serentak yang berfungsi sebagai pengiring dalam lagu maupun permainan musik (Wisnudisastra dan Buono 2010). Pendengaran manusia memiliki kemampuan dan kepekaan yang beragam dalam mengenali chord gitar. Seorang yang terbiasa dengan suara gitar dapat dengan mudah mengenali dan membedakan chord gitar, namun bagi orang awam hal tersebut sulit untuk dilakukan.
Penggunaan teknologi dan komputer dapat dilakukan untuk memecahkan masalah tersebut, yaitu pembuatan sistem yang dapat mengidentifikasi chord gitar. Kinerja komputer yang objektif dan konsisten dalam menjalankan setiap perintah dapat memudahkan pengguna untuk mengetahui dan membedakan suara chord gitar dengan akurat. Pengenalan suara (speech recognition) adalah teknologi yang dapat mengubah sinyal suara menjadi sebuah informasi berupa teks. Suara chord gitar dapat diidentifikasi dengan mengekstrasi ciri dari setiap chord menggunakan teknik mel-frequency cepstrum coefficient (MFCC) untuk kemudian dilakukan pengenalan pola menggunakan probabilistic neural network (PNN). PNN sebagai salah satu arsitektur jaringan saraf tiruan (JST) telah terbukti menghasilkan akurasi tinggi di beberapa penelitian sebelumnya. Penelitian yang telah dilakukan oleh Fransiswa (2010) tentang pengembangan PNN pada pengenalan kisaran usia dan jenis kelamin berbasis suara memiliki rataan akurasi 91.26%.
Penelitian identifikasi suara gitar sebelumnya dilakukan oleh Wisnudisastra (2010) menggunakan teknik MFCC dan codebook sebagai pengenalan pola. Penelitian tersebut menghasilkan rataan akurasi sebesar 91% menggunakan 13 koefisien cepstral dan 96% menggunakan 26 koefisien cepstral. Penelitian tersebut memiliki keterbatasan untuk mengenali satu jenis chord gitar sehingga belum dapat mengidentifikasi chord gitar yang kontinu.
Pada penelitian ini, identifikasi chord gitar dilakukan untuk chord gitar yang kontinu menggunakan teknik MFCC untuk ekstraksi ciri dan model PNN untuk pengenalan pola.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1 Mengimplementasikan teknik ekstraksi ciri MFCC dan metode PNN untuk identifikasi chord gitar.
2 Mengidentifikasi suara gitar yang terdiri dari campuran chord gitar.
2
Manfaat Penelitian
Dengan adanya penelitian ini diharapkan dapat memberikan informasi tingkat akurasi pengembangan model PNN untuk identifikasi chord gitar yang kontinu.
Ruang Lingkup Penelitian
Ruang lingkup dari penelitian ini antara lain:
1 Gitar yang digunakan adalah jenis gitar akustik dengan senar string.
2 Suara gitar berupa hasil rekaman dari campuran chord mayor dan chord minor. 3 Suara gitar berupa dua campuran chord.
4 Gitar dimainkan dengan cara dipukul serentak dari atas ke bawah dalam satu posisi untuk setiap chord.
5 Gitar yang digunakan adalah standar tunning.
METODE PENELITIAN
Penelitian ini menggunakan suara gitar yang akan diproses oleh sistem menjadi suatu informasi berupa chord dari suara gitar tersebut. Untuk dapat mengubah sebuah suara menjadi suatu informasi dibutuhkan beberapa proses, alur proses tersebut dapat dilihat pada Gambar 1.
Gelombang suara yang ditangkap berupa sinyal analog, maka sinyal tersebut perlu diubah dahulu menjadi sinyal digital agar dapat diolah oleh komputer, proses ini disebut digitalisasi.
3
Proses digitalisasi suara terdiri dari dua tahap yaitu sampling dan kuantisasi (Jurafsky dan Martin 2000). Sampling adalah proses pengambilan nilai (sampling rate) dalam jangka waktu tertentu. Sampling rate adalah banyaknya nilai yang diambil setiap detik. Sampling rate yang biasa digunakan pada pengenalan suara ialah 8 000 Hz sampai dengan 16 000 Hz (Jurafsky dan Martin 2000). Hubungan antara panjang vektor data yang dihasilkan dengan sampling rate dan panjangnya data suara yang didigitalisasikan dapat dinyatakan secara sederhana sebagai berikut:
S = Fs × T Keterangan :
S = panjang vektor
Fs = sampling rate yang digunakan (Hertz) T = panjang suara (detik)
Setelah melalui proses sampling proses selanjutnya adalah kuantisasi. Kuantisasi merupakan proses mengkonversi nilai amplitudo yang bersifat kontinu pada suatu waktu tertentu menjadi sinyal digital dengan mengekspresikannya menggunakan sejumlah digit tertentu (Buono 2009).
Setelah mengubah sinyal analog menjadi sinyal digital, dilakukan pembacaan sinyal dari frame ke frame dengan lebar tertentu yang saling tumpang tindih untuk menghindari kehilangan informasi. Ekstraksi ciri dilakukan pada setiap frame untuk mendapatkan vektor ciri. Setiap vektor ciri tersebut dilakukan pengenalan pola untuk memperoleh informasi yang diinginkan.
Pembuatan sistem dibagi menjadi beberapa tahap sesuai dengan diagram alur penelitian yang ditunjukkan pada Gambar 2.
Mulai
Perumusan Masalah
Pengambilan Data Suara Gitar
Segmentasi Manual
Selesai Data
Latih Data Uji
Pembuatan Modul
PNN Parameter Modul Pengujian
Analisis & Pembahasan
Dokumentasi & Pelaporan
MFCC MFCC
Teori-teori yang terkait
Normalisasi
4
Pengambilan Data Suara Gitar
Penelitian ini menggunakan data hasil perekaman suara gitar yang telah dikonversi ke bentuk digital berformat WAV. Suara gitar merupakan hasil campuran permainan dua buah chord dari 24 chord yang ada. Chord gitar yang dimainkan terdiri dari dua jenis, yaitu chord mayor dan chord minor yang masing-masing berjumlah 12. Chord mayor dan minor seperti pada Tabel 1. Bentuk 24
chord mayor dan minor yang digunakan pada penelitian ini dapat dilihat pada Lampiran 1.
Perekaman suara gitar dilakukan menggunakan microphone yang dipasang pada gitar dan dilakukan ditempat yang hening untuk meminimalkan adanya noise. Perekaman dilakukan sebanyak 15 kali untuk setiap dua campuran chord. Data suara berjumlah 8 640 data yang berasal dari perkalian 24 chord pertama, 24 chord kedua dan 15 kali perekaman.
Suara gitar direkam menggunakan ukuran waktu tiga detik dengan sampling rate sebesar 11 000 Hz dan bit rate sebesar 16 bit. Data suara gitar berupa campuran chord C ke chord C#, chord C ke chord Cm dan seterusnya masing-masing sebanyak 15 kali. Untuk setiap campuran digunakan sepuluh kali perekaman untuk data latih dan lima kali perekaman untuk data uji. Sehingga terdapat 5 760 data latih dan 2 880 data uji.
Tabel 1 Chord mayor dan chord minor Chord dasar Mayor Minor
C C Cm
C# C# C#m
D D Dm
D# D# D#m
E E Em
F F Fm
F# F# F#m
G G Gm
G# G# G#m
A A Am
A# A# A#m
B B Bm
Normalisasi
5
Segmentasi
Tahap segmentasi merupakan tahap pemotongan jeda pada setiap sinyal suara. Pendeteksian jeda dilakukan pada sinyal untuk memisahkan dua campuran chord menjadi dua sinyal yang berbeda.
Pada pengambilan data suara, terdapat jeda pada perpindahan chord pertama dan chord kedua. Dengan demikian sinyal suara akan dipisah secara manual dengan menghapus bagian yang dianggap jeda, sehingga akan mendapatkan dua sinyal yaitu chord pertama dan chord kedua. Pemisahan dilakukan dengan mencari rentang terbesar dari setiap frame yang nilainya kurang dari rataan frame.
Data Latih dan Data Uji
Data latih merupakan data yang digunakan untuk pembelajaran sistem. Data latih diambil sebanyak 10 kali dari masing-masing dua campuran chord mayor dan chord minor. Setelah melalui tahap segmentasi, didapatkan 5 760 data latih dari hasil perkalian 24 chord pertama, 24 chord kedua dan 10 kali perekaman. Data latih kemudian diproses dengan teknik MFCC untuk mengekstraksi ciri dari setiap data latih.
Data uji merupakan data yang digunakan untuk uji coba akurasi sistem. Terdapat 2 880 data uji yang berasal dari hasil perkalian 24 chord pertama, 24 chord kedua dan 5 kali perekaman. Komposisi data chord yang dipakai dalam penelitian dapat dilihat pada pada Tabel 2.
Tabel 2 Komposisi data
Komposisi Jumlah
Jumlah chord 24
Jumlah campuran (24 x 24) 576
Data latih (576 x 10) 5760
Data uji (576 x 5) 2280
Total data (5760 + 2280) 8640
Ekstraksi Ciri dengan MFCC
Ekstraksi ciri merupakan proses untuk menentukan suatu nilai atau vektor yang dapat digunakan sebagai penciri objek atau individu (Buono 2009). Salah satu teknik ekstraksi ciri pemrosesan suara yang sering digunakan dan menunjukan kinerja yang baik adalah MFCC.
6
mendengarkan bunyi (Ganchev 2005). Skala mel dibentuk untuk mengikuti persepsi sistem pendengaran manusia.
Gambar 3 Diagram alur teknik MFCC untuk mengekstrak sinyal
Koefisien MFCC merupakan hasil transformasi cosinus dari spektrum mel tersebut dan dipilih k koefisien. Transformasi cosinus berfungsi untuk mengembalikan domain, dari domain frekuensi ke domain waktu.
Tahap-tahap proses MFCC adalah sebagai berikut (Do 1994) :
1 Frame blocking. Pada tahap frame blocking sinyal suara dibagi ke dalam n-buah frame yang terdiri dari n-sampel. Tahap ini melakukan overlapping pada
Sinyal suara frame ke t
O = O + O + …,Ot, … , OT
O = O1,O2, …, Ot, …,OT
Cepstrum Coefficients :Discrete Cosine Transform
� = ∑ �
�
=
� − / ��
Cj=nilai koefisien C ke j j= jumlah koefisien cepstral M = jumlah filter
Xi =hasil Mel Frequency Wrapping pada frekuensi ke i, i= jumlah wrapping
Windowing: yt(n)=xt(n)w(n), 0 ≤ n ≤ N-1 w(n) = 0.54 – 0.46 cos (2πn/(N-1))
� = hasil � pada frame ke dalam domain waktu
N= jumlah sampel pada setiap frame, n = frame ke-… W= formula hamming window, � = nilai data ke n
Fast Fourier Transform (FFT):
Xn=∑xk N-1
k=0
e-2πjki/N
Xk=nilai-nilai sampel yang akan diproses pada domain frekuensi Xn=magnitude frekuensi
N = jumlah data pada domain frekuensi, j=bilangan imajiner, k = N/2 + 1, i = n x t
Mel Frequency Wrapping: mel(f) = 2595 * log10 (1 + f / 700) dari sini diperoleh M filter, dan dihitung spektrum Mel:
Xi=log10 ∑|X k|Hi N-1
k=0
(k) , i=1,2,3,…,M
�(k) = nilai filter segitiga ke i X k =nilai data ke k hasil proses FFT M = jumlah filter
7
frame yang satu dengan frame tetangganya untuk menghindari kehilangan informasi.
2 Windowing. Untuk meminimalkan diskontinuitas sinyal pada setiap awal dan akhir frame dilakukan proses windowing. Proses ini dilakukan dengan mengalikan antara frame dengan jenis window yang digunakan.
3 Fast Fourier Transform (FFT). Tahap FFT mengubah tiap frame dari domain waktu ke domain frekuensi.
4 Mel-frequency wrapping. Proses ini menggunakan filter yang saling overlapping untuk domain frekuensi. Rentang filter tersebut ditentukan berdasarkan hasil studi psikologi manusia dalam mendengarkan bunyi (Ganchev 2005). Oleh karena itu, untuk setiap nada dengan frekuensi aktual f, tinggi subyektifnya diukur dengan skala mel (melody). Skala mel-frequency adalah selang frekuensi di bawah 1 000 Hz dan selang logaritmik untuk frekuensi di atas 1 000 Hz (Do 1994)
5 Cepstrum coefficients. Hasil dari proses MFCC adalah mel spectrum coefficients dengan jumlah koefisien yang ditentukan terlebih dahulu. Kemudian algoritma discrete cosine transform (DCT) digunakan untuk mengkonversi mel-frequency ke dalam domain waktu.
Pembuatan Modul PNN
Probabilistic neural network (PNN) adalah suatu metode klasifikasi jaringan saraf tiruan (JST) dengan menggunakan data pelatihan. Model PNN merupakan salah satu jenis jaringan saraf tiruan yang memiliki tingkat akurasi yang cukup tinggi dalam pengklasifikasian yaitu hampir mendekati 100% (Fransiswa 2010). Dengan menggunakan pengklasifikasi Bayesian dapat ditentukan bagaimana sebuah data masukan diklasifikasi sebagai anggota suatu kelas dari beberapa kelas yang ada, yaitu yang mempunyai nilai maksimum pada kelas tersebut. PNN memiliki struktur yang terdiri atas empat layer seperti pada Gambar 4.
1 Input layer merupakan layer untuk input data yang akan diuji.
2 Pattern layer berfungsi menghitung jarak antara nilai input data suara dengan nilai pola dari tiap anggota kelas yang dirumuskan pada Persamaan 1.
fA x =(2π)1p⁄2hp
1
m∑ exp[−
x−xAi T x-xAi
h2 ]
m
i=
Keterangan:
p = dimensi vektor input m = jumlah pola pelatihan
xAi = vektor latih kelas-A urutan ke-i x = vektor input
h = smoothing parameter (α × simpangan baku ke-i×n1/5)
8
Gambar 4 Struktur PNN (Ganchev 2005)
Nilai fA(x) merupakan nilai hasil pattern layer ke-i sampai n banyaknya pattern di setiap kelas. Setelah mendapatkan selisih jarak antara data input dengan data pada pattern layer, selisih tersebut dibagi dengan nilai smoothing parameter. Pemilihan nilai smoothing parameter (h) harus diperhatikan, karena nilai ini memegang peranan yang penting terhadap ketepatan hasil pengklasifikasian yang dilakukan. Smoothing parameter yang terlalu kecil akan mengakibatkan pendekatan yang terlalu sempit, sedangkan jika terlalu besar dapat menghilangkan detil yang penting (Masters 1995).
3 Summation layer. Layer ini menghasilkan peluang untuk satu kelas. Peluang tersebut didapat dari penjumlahan pattern layer pada kelas tersebut dan hasilnya dibagi dengan (2π)d/2 hih2...hdn. Nilai hih2...hd adalah nilai smoothing dari kelas tersebut.
P x = 1
2π d2h1h2…hdn∑( fA(x)) n
i=1
9
Pengujian
Proses pengujian dilakukan dengan membandingkan data uji dengan chord yang teridentifikasi dari 24 chord yang ada. Data uji akan diklasifikasikan ke kelas yang sesuai dengan cara menghitung peluang terbesar yang mendekati kelas chord tertentu. Hasil yang didapat akan dihitung akurasinya dengan rumus berikut ini:
Hasil = Σ Data uji yang benarΣ Data Uji x 100%
HASIL DAN PEMBAHASAN
Pengumpulan Data
Pengumpulan data suara direkam langsung menggunakan gitar melalui software MATLAB R2008b. Suara campuran 2 chord gitar direkam selama tiga detik dan disimpan ke dalam file berekstensi WAV. Setiap campuran chord dilakukan masing-masing 15 kali perekaman sehingga menghasilkan 8 640 data.
Data suara tersebut tersusun dari sinyal-sinyal yang mengandung nilai. Nilai tersebut akan menghasilkan sebuah vektor yang kemudian dilakukan proses normalisasi agar data suara lebih terstandar pada rentang minus satu sampai satu.
Segmentasi
Data hasil normalisasi disegmentasi secara manual untuk memisahkan dua campuran chord menjadi dua sinyal berbeda. Pemotongan jeda dilakukan dengan beberapa tahap, yaitu:
1 Mengabsolutkan nilai-nilai.
2 Membuat batas pada titik 1 500 sampai 30 000 3 Menghitung rata-rata pada rentang titik tersebut.
4 Menyeleksi rentang nilai chord terpanjang yang kurang dari rata-rata, dan memastikan rentang tersebut berada pada titik 5 000 sampai 20 000. 5 Rentang terpanjang dianggap jeda.
6 Mendapatkan chord pertama dan chord kedua.
Setelah mendapatkan semua data dalam bentuk vektor yang diharapkan, maka proses dilanjutkan dengan tahap MFCC.
Ekstraksi Ciri dengan MFCC
Proses MFCC menggunakan data vektor hasil segmentasi manual. Proses MFCC pada penelitian ini menggunakan fungsi pada auditory toolbox Matlab. Fungsi MFCC didapat dari Buono (2009). Proses MFCC memerlukan beberapa parameter input yaitu sampling rate, time frame, overlap, dan cepstral coefficient. Pada penelitian ini menggunakan nilai untuk sampling rate 11 000 Hz, time frame 100 ms, overlap 0.4 dan jumlah koefisien cepstral yaitu 13, 26, 39, dan 52.
10
digunakan dikali dengan banyak frame yang terbentuk. Hasil matriks tersebut menunjukan ciri spectral dari sinyal tersebut.
Pemodelan Probabilistic Neural Network
Pada model PNN digunakan data uji sebagai input data. Input data diidentifikasi dengan pattern layer. Nilai fA(x) merupakan nilai hasil pattern layer, nilai tersebut dibagi dengan nilai smoothing parameter. Nilai smoothing parameter pada Persamaan 1 digunakan nilai 1.14 untuk α. Simpangan baku didapat dari data setiap pattern ke j=1, 2 sampai n banyaknya data pattern. Sehingga didapatkan smoothing parameter 1.14 × (simpangan baku) × n-1/5. Gambar 5 menunjukan model PNN yang dibuat untuk identifikasi chord gitar.
Gambar 5 Pemodelan PNN identifikasi chord
Hasil Pengujian
Pada tahap pengujian, data akan diujikan untuk diidentifikasi sesuai dengan chord yang dimainkan. Penelitian ini menggunakan beberapa parameter yang diujicobakan yaitu:
1 Time frame sebesar 100 ms 2 Overlap 0.4
3 Jumlah koefisien cepstral 13, 26, 39, dan 52
4 Smoothing parameter yang didapat dari 1.14 × (simpangan baku) × n-1/5.
Percobaan dengan 13 koefisien cepstral
Tabel 3 Akurasi dengan 13 koefisien cepstral
Chord Akurasi Chord Akurasi Chord Akurasi
A 8.33 Cis 27.50 F 1.67
Am 5.83 Cism 37.50 Fm 55.83
Ais 52.50 D 20.83 Fis 52.50
Aism 10.00 Dm 84.17 Fism 35.83
B 13.33 Dis 44.17 G 29.17
Bm 22.50 Dism 25.83 Gm 40.83
C 8.33 E 47.50 Gis 54.17
Cm 80.00 Em 48.33 Gism 77.50
11
Hasil percobaan menggunakan 13 koefisien cepstral dapat dilihat pada Tabel 3. Akurasi terkecil terdapat pada percobaan chord F yaitu hanya 1.67% sedangkan akurasi terbesar terdapat pada percobaan chord Dm yaitu 84.17%.
Percobaan dengan 26 koefisien cepstral
Hasil percobaan menggunakan 26 koefisien cepstral dapat dilihat pada Tabel 4. Akurasi terkecil terdapat pada percobaan chord F yaitu 44.17% sedangkan akurasi terbesar terdapat pada percobaan chord Cm yaitu 97.5%.
Tabel 4 Akurasi dengan 26 koefisien cepstral
Chord Akurasi Chord Akurasi Chord Akurasi
A 81.67 Cis 60.00 F 44.17
Am 65.00 Cism 54.17 Fm 69.17
Ais 92.50 D 64.17 Fis 92.50
Aism 90.83 Dm 95.00 Fism 91.67
B 73.33 Dis 85.00 G 45.00
Bm 87.50 Dism 55.83 Gm 93.33
C 52.50 E 77.50 Gis 90.00
Cm 97.50 Em 80.83 Gism 94.17
Akurasi keseluruhan 76.39
Percobaan dengan 39 koefisien cepstral
Hasil percobaan menggunakan 39 koefisien cepstral dapat dilihat pada Tabel 5. Akurasi terkecil terdapat pada percobaan chord Dism yaitu 65% sedangkan akurasi terbesar terdapat pada percobaan chord Cm, Dis, Fis dan Fism yaitu 100%.
Tabel 5 Akurasi dengan 39 koefisien cepstral
Chord Akurasi Chord Akurasi Chord Akurasi
A 98.33 Cis 91.67 F 95.00
Am 93.33 Cism 72.50 Fm 90.83
Ais 98.33 D 85.83 Fis 100.00
Aism 98.33 Dm 97.50 Fism 100.00
B 90.00 Dis 100.00 G 78.33
Bm 91.67 Dism 65.00 Gm 100.00
C 97.50 E 97.50 Gis 100.00
Cm 100.00 Em 96.67 Gism 98.33
Akurasi keseluruhan 93.19
Percobaan dengan 52 koefisen cepstral
Tabel 6 Akurasi dengan 52 koefisien cepstral
Chord Akurasi Chord Akurasi Chord Akurasi
A 98.33 Cis 94.17 F 98.33
Am 96.67 Cism 80.83 Fm 98.33
Ais 98.33 D 92.50 Fis 99.17
Aism 100.00 Dm 93.33 Fism 100.00
B 96.67 Dis 100.00 G 93.33
Bm 93.33 Dism 89.17 Gm 100.00
C 99.17 E 99.17 Gis 98.33
Cm 100.00 Em 100.00 Gism 98.33
12
Hasil percobaan menggunakan 52 koefisien cepstral dapat dilihat pada Tabel 6. Akurasi terkecil terdapat pada percobaan chord Cism yaitu 80.83% sedangkan akurasi terbesar terdapat pada percobaan chord Aism, Cm, Dis, Em, Fism dan Gm yaitu 100%.
Analisis Percobaan
Berdasarkan hasil pengujian identifikasi chord gitar didapatkan hasil akurasi yang berbeda untuk setiap koefisien cepstral yang digunakan.
Gambar 6 Perbandingan akurasi dengan 13, 26, 39, dan 52 koefisien cepstral Koefisien cepstral yang diujikan antara lain 13, 26, 39, dan 52. Pada Gambar 6 terlihat grafik perbandingan hasil akurasi menggunakan beberapa koefisien cepstral. Pada penelitian ini menunjukan bahwa tingkat akurasi sangat bergantung pada jumlah koefisien cepstral yang digunakan. Berdasarkan penelitian ini semakin besar koefisien cepstral yang digunakan, semakin tinggi rataan akurasi yang dihasilkan. Namun hal itu tidak berlaku untuk akurasi pada masing-masing chord. Seperti pada chord Dm, chord Fis dan chord Gis yang mengalami sedikit penurunan akurasi pada koefisien 52.
Hasil akurasi tertinggi terjadi pada percobaan yang menggunakan 52 koefisien cepstral yaitu 96.56%. Rataan akurasi yang didapat dari penelitian ini sebesar 75.75%. Berdasarkan rataan akurasi tiap chord, akurasi tertinggi terdapat pada chord Cm yaitu sebesar 94.38% sedangkan rataan akurasi terendah terdapat pada chord Dism yaitu 58.96%.
Analisis Kesalahan
Pada penelitian ini, pengembangan model PNN untuk identifikasi chord gitar menghasilkan akurasi terbaik menggunakan koefisien cepstral 52.
Berdasarkan Lampiran 2, pada confusion matrix koefisien cepstral 13 kesalahan identifikasi terbanyak terdapat pada chord B yang diidentifikasi sebagai
chord Cm sebanyak 55%.
36.84
76.39
93.19 96.56
10 20 30 40 50 60 70 80 90 100
13 26 39 52
Ak
u
rasi
(%)
13
Pada penggunaan koefisien cepstral 26, kesalahan identifikasi terbanyak terdapat pada chord B yang diidentifikasi sebagai chord Bm sebanyak 24%.
Confusion matrix koefisien 26 dapat dilihat pada Lampiran 3.
Berdasarkan Lampiran 4, kesalahan identifikasi terbanyak untuk koefisien
cepstral 39 terdapat pada chord Cism yang diidentifikasi sebagai chord Cis sebanyak 22%.
Pada penggunaan koefisien cepstral 52 terjadi kesalahan terbanyak pada chord
Cism yang diidentifikasi sebagai chord Cis sebanyak 19%. Confusion matrix dengan koefisien cepstral 52 dapat dilihat pada Lampiran 5.
Berdasarkan pengamatan pada setiap pengujian yang dilakukan untuk setiap koefisien cepstral, kesalahan identifikasi terbanyak terjadi pada chord B yang diidentifikasi sebagai chord Bm dan chord Cism yang diidentifikasi sebagai chord
Cis.
SIMPULAN DAN SARAN
Simpulan
Penelitian ini telah berhasil dalam mengidentifikasi chord gitar dengan mengimplementasikan metode PNN dan teknik ekstraksi ciri MFCC. Hasil akurasi tertinggi yang dihasilkan sebesar 90.49% dengan penggunaan time frame 100 ms, overlap 40% dan 52 koefisien cepstral. Penelitian ini mampu mengidentifikasi campuran dua chord gitar menggunakan model PNN.
Identifikasi chord gitar dalam penelitian ini dilakukan dengan menggunakan empat koefisien cepstral yang berbeda, yaitu 13, 26, 39, dan 52. Hasil akurasi dengan menggunakan empat koefisien cepstral tersebut secara berurutan ialah 40.97%, 73.47%, 84.76%, dan 90.49%. Hal ini menunjukkan bahwa semakin besar nilai koefisien cepstral semakin tinggi akurasi yang didapatkan.
Saran
14
DAFTAR PUSTAKA
Buono A. 2009. Representasi nilai HOS dan model MFCC sebagai ekstraksi ciri pada sistem identifikasi pembicara di lingkungan ber-noisemenggunakan HMM [disertasi]. Depok (ID): Universitas Indonesia.
Do MN. 1994. Digital Signal Processing Mini-Project: an Automatic Recognition System. Laussane (CH): Federal Institute of Technology.
Fransiswa RR. 2010. Pengembangan model probabilistic neural network (PNN) pada pengenalan kisaran usia dan jenis kelamin berbasis suara [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Ganchev T. 2005. Speaker recognition [disertasi]. Patras (GR): University of Patras.
Jurafsky D, Martin JH. 2000. Speech And Language Processing an Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition. New Jersey (US): Prentice Hall.
MastersT. 1995. Advanced Algorithms for Neural Networks: A C++ Sourcebook. New York (US): John Wiley.
15
16
17
ion matr
ix
ke
sa
laha
n identifika
si
chord
pa
da
Lampiran 2 Confusion matrix kesalahan identifikasi chord pada koefisien 13
Akurasi
8.33
18
on matri
x
ke
sa
laha
n
identifika
si
Lampiran 3 Confusion matrix kesalahan identifikasi chord pada koefisien 26
Akurasi
19
Confusion matrix
k
Lampiran 4 Confusion matrix kesalahan identifikasi chord pada koefisien 39
Akurasi
20
ion matr
ix
ke
sa
laha
n identifika
si
chord
pa
da
koe
fisien
52
Lampiran 5 Confusion matrix kesalahan identifikasi chord pada koefisien 52
Akurasi
21