• Tidak ada hasil yang ditemukan

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA

N/A
N/A
Protected

Academic year: 2022

Membagikan "PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN TEKNIK EKSTRAKSI CIRI MFCC ELGHAR WISNUDISASTRA"

Copied!
38
0
0

Teks penuh

(1)

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN

TEKNIK EKSTRAKSI CIRI MFCC

ELGHAR WISNUDISASTRA

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR

2009

(2)

PENGENALAN CHORD PADA ALAT MUSIK GITAR MENGGUNAKAN CODEBOOK DENGAN

TEKNIK EKSTRAKSI CIRI MFCC

ELGHAR WISNUDISASTRA

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR

2009

(3)

ABSTRACT

ELGHAR WISNUDISASTRA. Chord Recognition in Guitar Instrument Using Codebook with MFCC as Feature Extraction Technique. Under the supervision of AGUS BUONO.

Human auditory system is capable of extracting rich and meaningful data from complex audio signal. To recognize chord sequences that played in some kind of music is not an easy task. People need big effort to train their sense of hearing so they can recognize that kind sound of chords. This condition is also valid in a computer system. Finding the key and labeling the chords automatically from music are great use for those who want to do harmonic analysis of music. Hence automatic chord recognition has been a topic of interest in the context of Music Information Retrieval (MIR) for several years, and attempts have been made in implementing such systems using well understood signal processing and pattern recognition techniques. This research is about to recognize the sound of chord that played and recorded by guitar instrument. There are 24 major-minor chords that used in this research. MFCC is used as feature extraction and the number of coefficient cepstral that used are 13 and 26. Each chord signal that has been extracted then clustered using K-means algorithm with 8, 12, 16, 20, 24, 28, 32 k numbers to create codebook that use as a model of each chord. For the recognition process, there are two methods that used in this research, unstructured recognition and structured recognition. For the result, this research produces two kinds model of codebook that are codebook with 13 coefficients and codebook with 26 coefficients. Both types of codebook show a good result with accuracy level above 88%. The best result yielded from usage of 26 coefficient cepstral with structured recognition. It’s accuracy level reach 97%. Hence the usage of 26 coefficient cepstral is better than the usage of 13 coefficient cepstral with difference of accuration level is about 7%. This research also shows the affectation of the numbers k-means that used. An increasing accuration level shown by increasing the amount of k-cluster.

Keywords: Chord, Codebook, MFCC, K-means, Structured and Unstructured recognition

(4)

Menyetujui:

Pembimbing,

Dr. Ir. Agus Buono, M.Si., M.Kom.

NIP 196607021993021001

Mengetahui:

Ketua Departemen,

Dr. Ir. Sri Nurdiati, M.Sc.

NIP 196011261986012001

Tanggal Lulus:

Judul : Pengenalan Chord pada Alat Musik Gitar Menggunakan Codebook dengan Teknik Ekstraksi Ciri MFCC

Nama : Elghar Wisnudisastra NRP : G64052049

(5)

PRAKATA

Alhamdulillahi Rabbil ’alamin, segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan segala rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan penelitian ini. Shalawat dan salam senantiasa tercurah kepada Nabi Muhammad SAW, keluarga, sahabat, dan para pengikutnya yang tetap istiqomah dalam mengemban risalah-Nya.

Ucapan terima kasih penulis sampaikan kepada kedua orang tua beserta keluarga tercinta yang selalu memberikan dukungan dan semangat yang sangat berharga. Penghargaan dan ucapan terima kasih kepada Bapak Dr. Ir. Agus Buono, M.Si., M.Kom sebagai pembimbing yang selalu sabar dalam memberikan arahan dan saran selama penyelesaian tugas akhir ini. Terima kasih kepada Bapak Mushthofa, S.Kom., M.Sc dan Bapak Arif Ramadhan, S.Kom selaku dosen penguji yang telah memberikan saran dan kritik yang membangun kepada penulis. Terima kasih kepada Fiona Hanberia Innayah yang selalu mendampingi dan memberikan motivasi kepada penulis, Putra Aminudin beserta rekan-rekan UKM Merpati putih yang telah mengajarkan penulis arti dari persahabatan dan kekeluargaan. Penulis juga mengucapkan terima kasih kepada Damas Widyatmoko dan Dika Agus Satria beserta teman-teman Ilkom angkatan 42 yang bersedia membantu memberikan dukungan moril, dan saran dalam pengerjaan tugas akhir ini. Kemudian penulis juga mengucapkan terima kasih kepada staf dan karyawan Departemen Ilmu Komputer serta seluruh pihak lainnya yang tidak dapat disebutkan satu per satu.

Penulis menyadari bahwa dalam penelitian ini masih terdapat kekurangan, sehingga kritik dan saran yang membangun penulis harapkan dari semua pihak. Semoga penelitian ini dapat bermanfaat.

Amin.

Bogor, Desember 2009

Elghar Wisnudisastra

(6)

RIWAYAT HIDUP

Penulis lahir di Jakarta, 18 Mei 1988 yang merupakan anak kedua dari lima bersaudara dengan ayah bernama Kusmana Kartaatmadja dan ibu bernama Enah Rohaenah. Pada tahun 2005 penulis lulus dari SMA Negeri 1 Bekasi dan diterima di Institut Pertanian Bogor melalui jalur SPMB.

Pada tahun 2006 penulis diterima sebagai mahasiswa Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Penggetahuan Alam (FMIPA) dengan minor Manajemen Fungsional. Selama mengikuti perkuliahan penulis aktif dalam Unit Kegiatan Mahasiswa (UKM) Pencak Silat Merpati Putih. Pada tahun 2008, penulis melaksanakan kegiatan praktik kerja lapangan di Sekretariat Pengadilan Pajak Departemen Keuangan selama dua bulan.

(7)

1 DAFTAR ISI

Halaman

DAFTAR GAMBAR ... v

DAFTAR TABEL ... v

DAFTAR LAMPIRAN ... v

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

Ruang Lingkup ... 1

Manfaat Penelitian ... 1

TINJAUAN PUSTAKA Nada dan Chord Gitar ... 1

Hierarchical Clustering ... 3

Ekstraksi Ciri MFCC ... 4

Codebook ... 5

METODE PENELITIAN Studi Pustaka ... 5

Pengambilan Data ... 6

Pemodelan Codebook Chord ... 6

Pengujian ... 7

Dokumentasi Penelitian ... 7

Lingkungan Pengembangan ... 7

HASIL DAN PEMBAHASAN Preprocessing ... 7

Pemodelan Codebook ... 8

Pengujian ... 9

KESIMPULAN DAN SARAN Kesimpulan ... 12

Saran ... 12

DAFTAR PUSTAKA ... 13

LAMPIRAN ... 14

iv

(8)

1 DAFTAR GAMBAR

Halaman 1 Ilustrasi dari 12 fret pertama dan nada-nada yang dihasilkan dengan cara menekan senar pada

fret-fret tertentu (Vaseghi 2007) ... 3

2 Ilustrasi bentuk chord D pada posisi yang berbeda ... 3

3 Ilustrasi hierarchical clustering dari empat objek yang ditampilkan dengan dendrogram (Tan et al. 2006) ... 3

4 Diagram proses MFCC (Do 1994) ... 4

5 Ilustrasi metode codebook dengan dua pembicara (Do 1994) ... 5

6 Diagram proses pengenalan chord gitar ... 6

7 Perbandingan akurasi yang berbeda dari beberapa chord pada penggunaan 13 koefisien cepstral ... 10

8 Grafik perbandingan hasil akurasi dengan 13 dan 26 koefisien cepstral pada pengenalan tak berstruktur ... 11

9 Grafik perbandingan hasil akurasi dengan 13 dan 26 koefisien cepstral pada pengenalan berstruktur ... 11

10 Grafik kenaikkan akurasi atas pemakaian 26 koefisien cepstral ... 11

11 Grafik rataan akurasi dari pemakaian 8, 12, 16, 20, 24, 28, 32 k-cluster ... 12

DAFTAR TABEL Halaman 1 Daftar chord gitar yang digunakan ... 6

2 Chord-chord dengan 13 koefisien yang digolongkan berdasarkan cluster-nya ... 8

3 Chord-chord dengan 26 koefisien yang digolongkan berdasarkan cluster-nya ... 8

4 Rataan nilai akurasi 24 chord mayor dan minor dengan 13 koefisien cepstral ... 9

5 Rataan nilai akurasi 24 chord mayor minor dengan 26 koefisien cepstral ... 10

6 Rataan akurasi pemakaian 8, 12, 16, 20, 24, 28, 32 k-cluster ... 12

DAFTAR LAMPIRAN Halaman 1 Bentuk Chord yang digunakan pada pelatihan dan pengujian ... 15

2 Diagram proses pengenalan tak berstruktur dan berstruktur ... 17

3 Dendrogram data chord ... 19

4 Hasil percobaan dengan pengenalan tak berstruktur ... 20

5 Hasil percobaan dengan pengenalan berstruktur ... 25

6 Perbandingan hasil pengujian menggunakan 13 dan 26 koefisien cepstral ... 30

v

(9)

1 PENDAHULUAN

Latar Belakang

Sistem pendengaran manusia memiliki kemampuan yang luar biasa dalam menangkap dan mengenali sinyal suara. Dalam mengenali sebuah kata ataupun kalimat bukanlah hal yang sulit dilakukan oleh manusia. Apalagi kata tersebut merupakan bahasa utama yang dipakai sehari-hari. Lain halnya dalam mengenali serangkaian chord yang dimainkan dalam sebuah musik. Untuk seorang musisi hal ini dapat dilakukan dengan mudah. Namun untuk orang biasa ataupun pemula di bidang musik, dibutuhkan banyak waktu dan tenaga untuk mengenalinya. Pendengaran mereka harus terus dilatih agar dapat dengan mudah mengenali chord musik. Hal ini pun berlaku untuk sebuah sistem komputer.

Chord merupakan rangkaian nada yang membangun keharmonisasian pada musik. Enak tidaknya suatu musik untuk didengarkan, tergantung pada rangkaian chord yang menyusunnya. Oleh karena itu menganalisis keseluruhan struktur harmonik pada suatu musik selalu diawali dengan mengenali setiap chord yang menyusun musik tersebut. Untuk alasan inilah, pengenalan chord telah berhasil menarik banyak perhatian di dunia Music Information Retrieval (MIR). Dengan mengetahui alur chord yang ada dalam sebuah musik kita dapat mengetahui genre dari musik tersebut yang memungkinkan kita untuk mengetahui pola alur chord pada musik lain dalam genre yang sama.

Terdapat dua modul yang sangat penting dalam speaker recognition yaitu feature extraction dan feature matching (Do, 1994).

Feature extraction adalah proses mengekstraksi sejumlah data dari sinyal suara yang nantinya dapat digunakan untuk merepresentasikan sinyal suara tersebut sedangkan feature matching adalah proses mengidentifikasi suara dengan cara membandingkan setiap ciri yang telah diekstraksi dari suara yang akan diidentifikasi dengan ciri dari suara yang telah diketahui. Pada penelitian ini penulis akan menggunakan metode codebook yang merupakan salah satu teknik feature matching dalam mengenali chord pada alat musik gitar dan menggunakan teknik Mel-Frequency Cepstrum Coefficient (MFCC) untuk ekstraksi cirinya.

Tujuan

Tujuan dari penelitian ini adalah :

1. Menerapkan metode codebook dan teknik ekstraksi ciri MFCC dalam mengenali setiap chord yang dimainkan dengan alat musik gitar.

2. Mengetahui akurasi pengenalan chord pada alat musik gitar dengan menggunakan metode codebook.

3. Mengetahui pengaruh banyaknya cluster dari setiap codebook terhadap tingkat akurasi dalam mengenali setiap chord pada alat musik gitar.

Ruang Lingkup

Adapun ruang lingkup dari penelitian ini antara lain :

1. Chord yang akan dikenali hanyalah chord mayor dan minor yang diperoleh dari suara gitar yang direkam. Total terdapat 24 chord mayor/minor.

2. Chord yang akan dikenali hanya dimainkan dengan cara dipukul serentak dari atas ke bawah dalam satu posisi untuk masing-masing chord.

3. Suara chord yang dikenali hanyalah suara chord yang dimainkan dengan menggunakan jenis gitar dengan senar nylon.

Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan informasi mengenai akurasi penggunaan metode codebook dalam pengenalan chord pada alat musik gitar.

TINJAUAN PUSTAKA Nada dan Chord Gitar

Nada merupakan suatu simbol atau bunyi yang menjadi dasar dalam susunan musik.

Terdapat tujuh nada natural yang telah dibakukan dan diberi nama dengan huruf, yaitu : C, D, E, F, G, A, B. Masing-masing dari nada tersebut memiliki frekuensi yang berbeda.

Jarak antar dua nada disebut dengan interval.

Interval dari deretan nada C-D-E-F-G-A-B-C adalah 1-1-½ -1-1-1-½. Jarak sebesar 1 disebut dengan wholetone dan jarak sebesar ½ disebut semitone. Jarak enam antara dua nada yang sama disebut satu oktaf. Contohnya adalah jarak

(10)

2 antara nada C1 sampai nada C2. Nada C2

berada satu oktaf di atas nada C1.

Nada natural dapat dinaikkan maupun diturunkan sebanyak ½ nada. Nada yang dinaikkan ½ nada diberi simbol #, sedangkan nada yang diturunkan ½ nada diberi simbol b.

Misalnya nada C dinaikkan ½ nada menjadi C#.

Nada C# atau bisa disebut cis ini sama dengan nada Db. Untuk nada E bila dinaikkan ½ nada akan menjadi nada E# atau sama dengan nada F, karena interval dari kedua nada ini adalah ½.

Begitu pula pada nada B ke C. Dengan demikian, terdapat 12 nada, yaitu C, C#, D, D#, E, F, F#, G, G#, A, A#, B. Tangga nada adalah susunan nada-nada dengan sistem jarak tertentu di sepanjang kesatuan enam jarak nada atau oktaf (Solapung 1991). Terdapat tujuh nada yang dibedakan secara berurut dengan jarak nada 1 dan jarak nada ½. Terdapat dua jenis tangga nada dasar, yaitu tangga nada Do atau tangga nada mayor dan tangga nada La atau tangga nada minor.

 Tangga nada mayor memiliki susunan sebagai berikut :

Jarak nada : 1 1 ½ 1 1 1 ½ Nada nyanyi : Do Re Mi Fa Sol La Si Do

 Tangga nada minor memiliki susunan sebagai berikut :

Jarak nada : 1 ½ 1 1 ½ 1 1 Nada nyanyi : La Si Do Re Mi Fa Sol La Contohnya untuk tangga nada C = Do atau disebut juga tangga nada C mayor adalah C-D-E-F-G-A-B-C.

Chord merupakan satuan nada-nada yang dibunyikan secara serentak yang berfungsi sebagai pengiring dalam lagu maupun permainan musik (Hendro 2004).

Chord direpresentasikan dengan huruf yaitu C, D, E, F, G, A, B. Terdapat pula chord C# = Db, D# = Eb, E# = F, F# = Gb, A# = Bb, B# = C.

Terdapat banyak jenis chord berdasarkan nada yang menyusunnya, diantaranya adalah chord mayor, minor, augmented, diminished, dll.

Setiap chord memiliki bentuk dan corak yang berbeda sesuai dengan unsur-unsur yang membentuknya. Chord sangat berperan dalam keharmonisan sebuah lagu. Chord umumnya terdiri atas tiga nada, yaitu nada ke-1, nada ke-3, dan nada ke-5 dari tangga nada penyusunnya. Hal ini disebut triad. Misalnya

chord C mayor atau C dengan tangga nada C-D- E-F-G-A-B-C terdiri atas nada C, E, dan G.

Chord C minor atau Cm dengan tangga nada C- D-Eb-F-G-Ab-Bb-C terdiri atas nada C, Eb, dan G. Chord mayor memiliki jarak nada ke-1 ke nada ke-3 dan nada ke-3 ke nada ke-5 berturut- turut sebesar 2 dan 1½. Chord minor memiliki jarak nada ke-1 ke nada ke-3 dan nada ke-3 ke nada ke-5 berturut-turut sebesar 1½ dan 2.

Chord-chord yang menyusun sebuah lagu dapat ditentukan berdasarkan nada dasarnya.

Yaitu, chord yang nada penyusunnya terdapat dalam tangga nada dasar lagu tersebut. Sebagai contoh pada nada dasar D = Do dengan tangga nada D-E-F#-G-A-B-C#-D maka chord yang mungkin dimainkan adalah :

 Chord I (Tonic) atau D mayor (D-A-F#)

 Chord II (Super Tonic) atau E minor (E-A- F#)

 Chord III (Mediant) atau F# minor (F#-A- C#)

 Chord IV (Dominant) atau G mayor (G-B- D)

 Chord V (Sub Dominant) atau A mayor (A- C#-E)

 Chord VI (Sub Mediant) atau B minor (B-D- F#)

 Chord VII (Lead Tone) atau C# Half Diminished (C#-E-G)

Tonic, Dominant, dan Sub Dominant adalah chord mayor yang berfungsi sebagai chord pokok atau chord utama. Di sisi lain, Super Tonic, Mediant, dan Sub Mediant adalah chord minor yang berfungsi sebagai chord pembantu.

Setiap chord mayor memiliki hubungan paralel atau dekat dengan chord minor yang disebabkan oleh kesamaan nada-nada yang menyusun tangga nadanya, yaitu :

 Chord C dengan chord Am

 Chord C# dengan chord A#m

 Chord D dengan chord Bm

 Chord D# dengan chord Cm

 Chord E dengan chord C#m

 Chord F dengan chord Dm

 Chord F# dengan chord D#m

 Chord G dengan chord Em

 Chord G# dengan chord Fm

(11)

3

 Chord A dengan chord F#m

 Chord A# dengan chord Gm

 Chord B dengan chord G#m

Gitar merupakan alat musik yang paling banyak dikenal oleh masyarakat. Suara yang dihasilkan berasal dari senar yang dipetik atau dipukul yang ditekan pada posisi fret tertentu ataupun tidak ditekan. Pada alat musik gitar satu nada yang sama dapat dihasilkan dari posisi yang berbeda. Ilustrasi letak nada-nada yang ada pada gitar dapat dilihat pada Gambar 1.

Gambar 1 Ilustrasi dari 12 fret pertama dan nada-nada yang dihasilkan dengan cara menekan senar pada fret-fret tertentu (Vaseghi 2007)

Oleh karena itu chord pada gitar juga dapat dibentuk dengan berbagai posisi seperti terlihat pada Gambar 2.

Hierarchical Clustering

Hierarchical clustering merupakan salah satu teknik clustering yang biasa ditampilkan secara grafik menggunakan diagram tree yang disebut dendrogram seperti ditampilkan pada Gambar 3.

Hierarchical clustering membentuk struktur hierarki dengan menempatkan setiap objek sebagai suatu cluster tersendiri lalu menggabungkan masing-masing cluster yang memiliki kemiripan menjadi cluster yang lebih besar, sampai akhirnya setiap objek berada pada satu cluster.

Analog to Digital Conversion

Sinyal suara merupakan suatu sinyal waktu kontinyu atau sinyal analog, sedangkan komputer hanya dapat memroses sinyal digital.

Oleh karena itu untuk dapat memroses suatu sinyal suara maka sinyal suara tersebut harus dikonversi menjadi sinyal digital terlebih dahulu. Proses konversi ini disebut Analog to Digital Conversion (ADC). Proses ADC terbagi menjadi dua tahap, yaitu :

1. Sampling

Sampling merupakan pengamatan nilai sinyal waktu kontinyu (sinyal analog) pada suatu waktu tertentu, sehingga diperoleh sinyal waktu diskret. Banyaknya sample yang diambil tiap detiknya disebut sampling rate. Besarnya sampling rate yang digunakan minimal dua kali dari jumlah frekuensi maksimum yang dapat dihasilkan oleh sumber suara. Hal ini bertujuan untuk meminimalkan efek aliasing, yaitu suatu efek dimana sinyal yang dihasilkan memiliki frekuensi yang berbeda dengan sinyal aslinya.

2. Kuantisasi

Kuantisasi merupakan suatu proses memetakan nilai-nilai amplitudo yang bersifat kontinyu pada suatu selang tertentu Chord D

Chord D

Gambar 2 Ilustrasi bentuk chord D pada posisi yang berbeda

Gambar 3 Ilustrasi hierarchical clustering dari empat objek yang ditampilkan dengan dendrogram (Tan et al.

2006)

(12)

4 menjadi nilai-nilai yang diskret, sehingga

didapatkan sinyal nilai diskret atau sinyal digital.

Ekstraksi Ciri MFCC

Ekstraksi ciri dilakukan untuk menentukan satu nilai atau vektor yang dapat dipergunakan sebagai penciri objek atau individu. Terdapat beberapa teknik ekstraksi ciri, seperti Linear Prediction Coding, Perceptual Linear Prediction, dan Mel-Frequency Cepstrum Coefficient (MFCC). MFCC merupakan teknik yang umumnya dipakai dan memiliki kinerja yang baik.

Cara kerja MFCC didasarkan atas pendengaran manusia. Proses MFCC dapat dilihat pada Gambar 4.

Penjelasan dari masing-masing tahapan adalah : 1. Frame Blocking

Pada tahapan ini sinyal suara yang dibaca kemudian dibagi ke dalam bentuk frame.

Setiap frame memiliki N sample yang direpresentasikan dalam bentuk vektor.

Setiap frame yang bersebelahan saling tumpang tindih atau overlap. Hal ini ditujukan agar tidak ada informasi yang hilang.

2. Windowing

Setiap frame dari sinyal suara mengandung satu unit informasi. Oleh karena itu distorsi antar frame tersebut harus diminimalkan dengan teknik windowing. Proses windowing dilakukan pada setiap frame untuk meminimalkan diskontinuitas sinyal pada awal dan akhir tiap frame. Metodenya adalah dengan mengalikan tiap frame dengan fungsi window. Jika kita mendefinisikan fungsi window sebagai w,

dan x(i) sebagai sinyal digital pada frame ke i, maka hasil dari windowing pada frame ke i adalah y(i) = x(i)w, yaitu perkalian skalar antara vektor x(i) dengan w. Pada umumnya window yang digunakan adalah window Hamming dengan persamaan :

dimana N merupakan jumlah sample pada tiap frame.

3. FFT (Fast Fourier Transform)

Proses selanjutnya adalah Fast Fourier Transform yang akan mengonversi setiap frame dengan N sample dari domain waktu ke domain frekuensi. Konversi ini dilakukan karena pendengaran manusia didasarkan atas domain frekuensi. FFT merupakan fast algorithm yang mengimplementasikan Discrete Fourier Transform (DFT) yang didefinisikan pada himpunan N samples {xn} sebagai berikut :

Xn = ∑ xke-2πjkn/N , n = 0,1,2,…,N-1 ;

j digunakan untuk menunjukkan bilangan imajiner, seperti j = √-1. Secara umum Xn adalah bilangan kompleks.

4. Mel-frequecy Wrapping

Persepsi manusia dalam frekuensi sinyal suara tidak mengikuti skala linear. Untuk setiap bunyi dengan frekuensi aktual f, dalam satuan Hz, nilai subjektif dari pitch- nya diukur dengan menggunakan skala

“mel’’. Skala mel-frequency adalah selang frekuensi linear di bawah 1000 Hz dan selang logaritmik untuk frekuensi di atas 1000 Hz. Mel-Frequency Wrapping umumnya dilakukan dengan menggunakan filterbank.

5. Cepstrum

Pada tahap ini akan dikonversi mel- frequency ke dalam domain waktu dengan menggunakan Discrete Cosine Transform (DCT). Hasilnya disebut dengan mel- frequency cepstrum coefficient (MFCC).

Selanjutnya MFCC dapat dihitung sebagai cn

dengan persamaan :

1 0

1, cos 2 46 . 0 54 . 0 )

(

n N

N n n

w

N-1

k = 0

,

Gambar 4 Diagram proses MFCC (Do 1994)

Frame Blocking

Windowing FFT

continuous speech

frame

mel spectrum mel

cepstrum

cepstrum Mel-frequency

wrapping spectrum

(13)

5 dengan K adalah banyaknya koefisien

cepstral, k = 0,1,….,K-1 dan n = 0,1,…,K-1.

Codebook

Codebook adalah sekumpulan titik (vektor) yang mewakili distribusi suara dari individu maupun objek tertentu dalam ruang suara.

Titik-titik pada codebook disebut codeword.

Codebook merupakan cetakan yang dihasilkan suara setelah melalui proses training. Dalam pengenalan suara, masing-masing suara yang akan dikenali harus dibuatkan codebook-nya.

Codebook dibentuk dengan cara membentuk cluster semua vektor ciri yang dijadikan sebagai training set dengan menggunakan clustering algorithm. Algoritme clustering yang dipakai adalah algoritme K-means. Langkah pertama yang dilakukan oleh algoritme ini adalah menentukan K initial centroid, dimana K adalah parameter spesifik yang ditentukan user, yang merupakan jumlah cluster yang diinginkan. Setiap titik atau objek kemudian ditempatkan pada centroid terdekat, dan kumpulan titik atau objek pada tiap centroid disebut cluster. Centroid pada setiap cluster kemudian akan berubah berdasarkan setiap objek yang ada pada cluster. Kemudian langkah penempatan objek dan perubahan centroid diulangi sampai tidak ada objek yang berpindah cluster. Algoritme dasar dari K-means adalah (Tan et al. 2006) :

Select K points as initial centroids repeat

Form K clusters by assigning each point to its closets centroid

Recompute the centroid of each cluster until Centroids do not change

Prinsip dasar dalam penggunaan codebook adalah setiap suara yang masuk akan dihitung jaraknya ke setiap codebook dari jenis suara yang akan dikenali. Kemudian jarak setiap sinyal suara ke codebook dihitung sebagai jumlah dari jarak setiap frame sinyal suara

tersebut ke setiap codeword yang ada pada codebook. Kemudian dipilih codeword dengan jarak minimum. Setelah itu setiap sinyal suara yang masuk akan diidentifikasi berdasarkan jumlah dari jarak minimum tersebut.

Penghitungan jarak dilakukan dengan menggunakan jarak euclid yang didefinisikan sebagai berikut (Jurafsky 2007):

deuclidean(x,y) = √ ∑ (xi - yi)2

dimana x dan y adalah vektor yang ada sepanjang D.

Gambar 5 mengilustrasikan tebaran data suara dari dua pembicara di sekitar codebook- nya. Dimana VQ distortion merupakan jarak vektor suara ke codeword (centroid) terdekat pada codebook. Pembicara dengan model codebook yang memiliki nilai total VQ distortion terkecil akan diidentifikasi sebagai pembicara dari suara input.

METODE PENELITIAN

Penelitian ini dilakukan dengan beberapa tahapan proses, yaitu studi pustaka, pengambilan data, pemodelan chord, dan pengujian. Proses pengenalan chord gitar dapat dilihat pada Gambar 6.

Studi Pustaka

Pada tahap ini mulai dilakukan pencarian dan pembelajaran mengenai pustaka-pustaka yang dibutuhkan untuk penelitian ini. Pustaka- pustaka tersebut dapat berupa buku, jurnal, ataupun media yang dapat dibuktikan kebenarannya. Studi pustaka dilakukan guna

D

i = 1

Speaker 1

Speaker 1 centroid sample

Speaker 2 centroid sample

Speaker 2

VQ distortion

,

,

Gambar 5 Ilustrasi metode codebook dengan dua pembicara (Do 1994)

D

(14)

6 memahami langkah-langkah dalam metode

yang digunakan dalam penelitian ini.

Pengambilan Data

Data yang digunakan adalah suara 24 jenis chord gitar yang dimainkan dengan cara dipukul serentak dari atas ke bawah dan direkam masing-masing sebanyak 20 kali pengulangan. Dengan demikian, masing-masing chord memiliki 20 data suara. Kemudian dipilih 10 data suara secara acak dari masing-masing chord untuk dijadikan sebagai data latih dan 10

data suara lainnya sebagai data uji. Chord- chord yang dipakai adalah 24 jenis chord mayor dan minor seperti yang terlihat pada Tabel 1.

Ke-24 chord mayor dan minor tersebut hanya dimainkan pada satu posisi saja. Bentuk 24 chord mayor dan minor yang digunakan untuk proses pelatihan dan pengujian pada penelitian ini dapat dilihat pada Lampiran 1.

Tabel 1 Daftar chord gitar yang digunakan

Data direkam langsung dengan gitar melalui microphone menggunakan software audacity selama 2 detik tanpa adanya jeda kosong dan disimpan dalam file berekstensi WAV. Proses perekaman dilakukan di tempat yang hening agar data yang diperoleh bebas dari noise lingkungan. Masing-masing chord direkam dengan sampling rate sebesar 11025 Hz dan bit rate sebesar 16 bit.

Preprocessing

Pada tahap preprocessing ini akan dilakukan ekstraksi ciri pada setiap data yang dipakai dengan menggunakan metode MFCC.

Implementasi metode MFCC ini dilakukan dengan menggunakan fungsi dari Auditory Toolbox yang dikembangkan oleh Slaney pada tahun 1998. Dalam penggunaan fungsi ini, parameter yang digunakan adalah panjang frame sebesar 30 ms, overlap antar frame sebesar 40%, sampling rate sebesar 11025 Hz, dan jumlah cepstral coefficient setiap frame sebanyak 13 dan 26 koefisien.

Pemodelan Codebook Chord

Pada tahapan ini akan dibuat codebook dari setiap data latih yang nantinya akan dipakai

Chord dasar Mayor Minor

C C Cm

C# C# C#m

D D Dm

D# D# D#m

E E Em

F F Fm

F# F# F#m

G G Gm

G# G# G#m

A A Am

A# A# A#m

B B Bm

Gambar 6 Diagram proses pengenalan chord gitar Mulai

Selesai Studi Pustaka

Pengambilan data

Preprocessing

Pemodelan codebook

Dokumentasi Penelitian Pengujian

Data Latih Data Uji

Codebook chord

Hasil

(15)

7 sebagai representasi dari sinyal chord yang akan

dikenali. Codebook yang akan dibuat adalah codebook dari setiap data chord dan codebook dari cluster yang dibuat dari hasil clustering semua data chord dengan teknik hierarchical clustering. Data training chord yang telah diekstraksi pada proses sebelumnya akan di clustering dengan menggunakan hierarchical clustering sehingga dihasilkan cluster-cluster yang berisi chord-chord yang berdekatan.

Setiap cluster tersebut kemudian dibuatkan codebook-nya. Masing-masing codebook yang dibuat memiliki jumlah k cluster 8, 12, 16, 20, 24, 32.

Pengujian

Proses pengujian chord pada penelitian ini dilakukan dengan menggunakan dua metode, yaitu metode pengenalan tak berstruktur dan metode pengenalan secara berstruktur.

Pengenalan tak berstruktur dilakukan dengan membandingkan langsung setiap chord pada data uji ke setiap codebook chord yang telah dibuat. Proses pengenalan tesebut dilakukan dengan cara menghitung total jarak minimal dari setiap frame sinyal data uji pada setiap codeword dalam codebook chord yang dibuat.

Di sisi lain, metode pengenalan berstruktur dilakukan melalui dua kali proses pengenalan, yaitu proses pengenalan terhadap hasil cluster dari chord yang ada kemudian proses pengenalan terhadap chord yang berada pada cluster tersebut. Masing-masing proses pengenalan tesebut dilakukan dengan cara menghitung total jarak minimal dari setiap frame sinyal data uji pada setiap codeword dalam codebook cluster ataupun codebook chord yang dibuat. Secara lebih jelas proses pengenalan bertsruktur dan tak berstruktur dapat dilihat pada Lampiran 2.

Pengujian dilakukan pada data uji yang telah dipersiapkan. Setiap data yang diuji akan dilihat apakah data tersebut teridentifikasi pada chord yang semestinya. Persentase tingkat akurasi dihitung dengan fungsi berikut :

hasil =

Dokumentasi Penelitian

Pada tahap ini akan dilakukan penulisan dokumentasi dari penelitian yang telah dilakukan, mencakup latar belakang dan tujuan

dilakukannya penelitian ini, segala pustaka yang dijadikan sebagai acuan, metodologi yang dipakai, pembahasan hasil penelitian sampai dengan penulisan kesimpulan dan saran.

Lingkungan Pengembangan

Pada penelitian ini digunakan perangkat keras dan perangkat lunak dengan spesifikasi sebagai berikut :

a) Perangkat Keras

 Processor Intel (R) CPU T2050 @ 1.6GHz

 Memory 2.00 GB RAM

 Hardisk 80 GB

 Microphone

 Metronome b) Perangkat Lunak

 Sistem Operasi Windows Vista Ultimate

 Matlab 7.06

 Audacity

 Gitar J&D Brothers C-36

HASIL DAN PEMBAHASAN Preprocessing

Dari semua data yang telah diperoleh yaitu sebanyak 240 data latih dan 240 data uji, terlebih dahulu dilakukan ekstraksi ciri dengan menggunakan MFCC. Dalam penelitian ini, proses MFCC dilakukan dengan menggunakan fungsi yang terdapat pada auditory toolbox.

Dalam pemakaiannya terdapat lima parameter yang harus diinputkan yaitu, input suara, sampling rate, time frame, overlap, dan jumlah cepstral coefficient. Pemilihan nilai untuk time frame, dan overlap berturut-turut adalah 30 ms dan 40 %. Jumlah koefisien cepstral yang digunakan sebanyak 13 dan 26 koefisien. Proses ekstraksi ciri ini dilakukan terhadap semua data.

MFCC mengubah sinyal suara ke dalam suatu matriks yang berukuran jumlah koefisien yang digunakan dikali dengan banyaknya frame suara yang terbentuk. Matriks ini menunjukkan ciri spectral dari sinyal suara tersebut. Pada penelitian ini masing-masing data suara yang telah diproses dengan MFCC memiliki jumlah frame sebanyak 111 frame. Setiap frame terdiri atas 13 dan 26 koefisien.

jumlah chord yang diuji ar

jumlah chord yang benar x 100%

Jumlah chord yang benar jumlah chord yang benar x 100%

x 100% .

jumlah chord yang benar x 100%

(16)

8 Pemodelan Codebook

Pada proses pembuatan codebook, data yang digunakan adalah data latih yang sudah berupa ciri dari suara chord yang telah diperoleh pada tahap preprocessing. Terdapat dua jenis model codebook yang dimodelkan, yaitu codebook untuk setiap cluster dan codebook untuk setiap chord.

1. Pemodelan Codebook Cluster

Terdapat 24 jenis chord yang akan dikenali, dan dari 24 chord tersebut akan dikelompokkan menjadi beberapa cluster. Hal ini dilakukan untuk mempersempit ruang pengenalan chord.

Data suara yang akan diuji akan dikenali sebagai chord berdasarkan golongan cluster- nya. Proses pembuatan cluster ini menggunakan teknik hierarchical clustering. Masing-masing chord memiliki 10 suara data latih dimana setiap chord memiliki panjang 111 frame dan setiap frame memiliki 13 dan 26 koefisien.

Kemudian 10 suara tersebut digabungkan dan dicari nilai rata-rata masing-masing koefisien dari seluruh frame. Dengan demikian, setiap chord memiliki vektor yang berisi nilai rata-rata tiap koefisien dari 10 suara. Berdasarkan dari nilai rata-rata tersebut, kemudian dilakukan proses clustering terhadap seluruh chord yang ada. Proses tersebut menghasilkan 2 jenis dendrogram dari chord-chord dengan 13 koefisien cepstral dan chord-chord dengan 26 koefisien cepstral. Kedua dendrogram tersebut dapat dilihat pada Lampiran 3. Dari dendrogram yang dihasilkan dapat dilihat chord-chord yang memiliki kedekatan frekuensi tersusun secara terstruktur membentuk suatu tree. Masing- masing dari tree yang terbentuk dibuat lima cluster yang berisi chord-chord yag saling berdekatan. Seperti yang terlihat pada Tabel 2 dan Tabel 3.

Tabel 2 Chord-chord dengan 13 koefisien yang digolongkan berdasarkan cluster-nya

Tabel 3 Chord-chord dengan 26 koefisien yang digolongkan berdasarkan cluster-nya

Dapat dilihat dari Tabel 2 dan Tabel 3 bahwa hasil dari hierarchical clustering seluruh chord tidak sesuai dengan teori harmoni musik.

Jika kita lihat dari teori harmoninya, chord mayor dan minor yang memiliki hubungan paralel semestinya berada pada satu cluster yang sama. Seperti chord C dengan Am, D dengan Bm, dan G dengan Em yang sebenarnya sangatlah dekat karena nada penyusun chord tersebut berasal dari tangga nada yang disusun dengan nada yang sama.

Namun dari hasil clustering ini terlihat bahwa pengelompokan chord yang dilakukan adalah berdasarkan kedekatan nilai frekuensinya.

Setiap cluster yang terbentuk kemudian dimodelkan menjadi codebook yang merepresentasikan chord-chord pada cluster tersebut. Caranya adalah dengan menggabungkan semua data suara latih dari masing-masing chord yang berada pada cluster yang sama kemudian nilai masing-masing koefisien dari setiap frame pada gabungan data tersebut di-cluster dengan menggunakan algoritme K-means. Jumlah K yang digunakan adalah 8, 12, 16 ,20, 24, 28, dan 32. Dengan demikian, setiap cluster dari hasil clustering chord memiliki codebook dengan jumlah K = 8, 12, 16, 20, 24, 28, dan 32.

2. Pemodelan Codebook Chord

Pada masing-masing chord, setiap data latih digabungkan kemudian dilakukan proses clustering dengan menggunakan K-means.

Data yang diklasterkan merupakan gabungan koefisien dari setiap data uji pada tiap jenis chord. Jumlah K yang digunakan adalah 8, 12, 16, 20, 24, 28, 32. Dengan demikian, setiap chord memiliki codebook dengan 13 dan 26 Cluster Nama Chord

Cluster 1 A#, A#m Cluster 2 B, Bm, C ,Cm Cluster 3 D, Dm, D#, D#m

Cluster 4 A, Am, E, Em, C#, C#m, F#, F#m, G#, G#m

Cluster 5 F, Fm, G, Gm

Cluster Nama Chord Cluster 1 G, Gm

Cluster 2 F, Fm, F#, F#m, A#, A#m Cluster 3 A, Am, C#, C#m, G#, G#m Cluster 4 B, Bm, C, Cm, E, Em Cluster 5 D, Dm, D#, D#m

(17)

9 koefisien cepstral dimana setiap codebook

tersebut dibuat dengan k-cluster sebanyak 8, 12, 16, 20, 24, 28, 32.

Pengujian

Hasil akhir yang diperoleh setelah proses pengujian dilakukan adalah :

Percobaan dengan 13 koefisien cepstral Pada percobaan ini jumlah koefisien yang dipakai untuk setiap chord dan codebook adalah sebanyak 13 koefisien cepstral. Setiap chord pada data uji kemudian di uji dengan menggunakan dua metode pengenalan seperti yang sudah dijelaskan sebelumnya, yaitu pengenalan tak berstruktur dan pengenalan berstruktur. Rataan tingkat akurasi untuk setiap chord yang dihasilkan dari kedua proses tersebut dapat dilihat pada Tabel 4.

Nilai akurasi pada Tabel 4 didapatkan dengan merata-ratakan total dari nilai akurasi yang dihasilkan oleh setiap chord dengan jumlah k-cluster pada codebook sebesar 8, 12, 16, 20, 24, 28, 32 yang digunakan pada penelitian ini. Secara lebih jelas dapat dilihat pada Lampiran 4.

Dapat dilihat pada Tabel 4 bahwa tingkat akurasi yang dihasilkan dengan penggunaan 13 koefisien cepstral dapat dikatakan baik. Total rataan tingkat akurasi yang dihasilkan dengan pengenalan tak berstruktur adalah sebesar 91%

dan lebih tinggi dibandingkan dengan total akurasi yang dihasilkan dengan pengenalan secara berstruktur yang sebesar 88%. Hal ini menunjukkan bahwa pada percobaan ini performa yang dihasilkan pengenalan tak berstruktur lebih baik dibandingkan pengenalan secara berstruktur.

Untuk pengenalan secara tidak berstruktur, chord C, Cm, D, Dm, Em, F, Gm, A, B, dan Bm merupakan chord yang paling mudah dkenali karena memiliki rataan akurasi sebesar 100%.

Hal ini menunjukkan bahwa semua chord tersebut pada data uji dapat dikenali dengan baik oleh sistem. Chord-chord yang sulit teridentifikasi adalah chord F #, F#m, dan Am karena akurasinya yang cukup rendah yaitu di bawah 80%.

Tabel 4 Rataan nilai akurasi 24 chord mayor dan minor dengan 13 koefisien cepstral

Sama halnya dengan pengenalan tak berstruktur, pada pengenalan secara berstruktur chord C, Cm, D, Dm, Em, F, Gm, A, dan B pun dapat dikenali dengan sangat baik oleh sistem dengan rataan akurasi sebesar 100%.

Chord yang sulit teridentifikasi adalah chord F#, F#m, G#, G#m dan Am dengan akurasi di bawah 80%. Chord-chord dengan akurasi rendah tersebut berada pada cluster yang sama yaitu pada cluster 4 yang merupakan cluster dengan jumlah anggota terbanyak. Selain itu, tingkat akurasi yang rendah pada pengenalan secara berstruktur mungkin dikarenakan oleh hasil clustering yang tidak sesuai dengan teori harmoni musik yang semestinya.

Nama chord Rataan akurasi chord dengan 13 koefisien cepstral Tak

berstruktur

Berstruktur

C 100% 100%

Cm 100% 100%

C# 86% 81%

C#m 87% 87%

D 100% 100%

Dm 100% 100%

D# 99% 99%

D#m 97% 97%

E 91% 91%

Em 100% 100%

F 100% 100%

Fm 93% 85%

F# 34% 30%

F#m 74% 53%

G 96% 96%

Gm 100% 100%

G# 87% 73%

G#m 93% 70%

A 100% 100%

Am 76% 76%

A# 93% 91%

A#m 87% 89%

B 100% 100%

Bm 100% 99%

Total rataan 91% 88%

(18)

10 Performa yang lebih baik pada pengenalan

tak berstruktur terlihat jelas saat mengidentifikasi chord F#m, G#, dan G#m.

Ketiga chord tersebut memiliki rataan akurasi yang lebih tinggi dibandingkan dengan yang dihasilkan pengenalan secara berstruktur.

Selisih akurasinya mencapai 21% untuk chord F#m, 14% untuk chord G#, dan 23% untuk chord G#m. Selain chord-chord tersebut, beberapa chord lain juga yang memiliki akurasi yang lebih baik dibandingkan pada pengenalan berstruktur. Secara lebih jelas dapat dilihat pada Gambar 7.

Pada percobaan ini tingkat akurasi terendah berada pada saat mengidentifikasi chord F#

yaitu hanya berkisar 30%-34%. Hal ini menjadikan chord F# sebagai chord yang paling sulit diidentifikasi oleh sistem. Chord- chord dengan akurasi rendah umumnya teridentifikasi sebagai pasangan chord mayor minornya. Seperti pada chord F# yang cenderung teridentifikasi sebagai chord F#m.

Percobaan dengan 26 koefisien cepstral Pada percobaan ini jumlah koefisien yang digunakan ditambah menjadi 26 koefisien cepstral. Hasil dari percobaan ini dapat dilihat pada Tabel 5.

Dari Tabel 5 terlihat bahwa rataan akurasi yang dihasilkan setiap chord sangatlah bagus.

Jauh lebih baik dibandingkan pada percobaan dengan 13 koefisien cepstral. Total rataan yang dihasilkan mencapai 97%. Pada percobaan ini terlihat bahwa tingkat akurasi yang dihasilkan oleh pengenalan berstruktur adalah sebesar 97%

dan lebih baik dibandingkan dengan total rataan

akurasi yang dihasilkan oleh pengenalan tidak berstruktur yang sebesar 96% walaupun selisihnya hanya 1%. Persentase hasil pengujian dapat dilihat secara lebih jelas pada Lampiran 5.

Tabel 5 Rataan nilai akurasi 24 chord mayor minor dengan 26 koefisien cepstral

Pada percobaan ini chord-chord yang dapat teridentifikasi dengan rataan akurasi 100% jauh lebih banyak dibandingkan pada percobaan dengan menggunakan 13 koefisien cepstral.

Chord-chord yang pada percobaan dengan 13 koefisien cepstral sulit diidentifikasi seperti chord F#, F#m, G#, G#m, dan Am dengan akurasi di bawah 80% dapat dikenali dengan

Nama chord

Rataan akurasi chord dengan 26 koefisien cepstral

Tak berstruktur

Berstruktur

C 100% 100%

Cm 100% 100%

C# 94% 94%

C#m 100% 100%

D 100% 100%

Dm 100% 100%

D# 100% 100%

D#m 100% 100%

E 96% 100%

Em 100% 100%

F 100% 100%

Fm 100% 100%

F# 64% 66%

F#m 100% 100%

G 100% 100%

Gm 100% 100%

G# 91% 91%

G#m 94% 96%

A 100% 100%

Am 80% 80%

A# 100% 100%

A#m 90% 90%

B 100% 100%

Bm 100% 99%

Total rataan

96% 97%

Gambar 7 Perbandingan akurasi yang berbeda dari beberapa chord pada penggunaan 13 koefisien cepstral

(19)

11 lebih baik pada percobaan dengan 26 koefisien

cepstral bahkan rataan akurasinya ada yang mencapai 100%. Akurasi terendah berada pada chord F# yaitu sebesar 64% untuk pengenalan tidak berstruktur dan 66% untuk pengenalan secara berstruktur. Hal ini menunjukkan bahwa chord F# sulit teridentifikasi oleh sistem dengan 13 koefisien cepstral maupun dengan 26 koefisien cepstral. Beberapa chord lainnya memiliki rataan akurasi berkisar 80%-100%.

Pada Tabel 5 terlihat bahwa perbedaan nilai akurasi yang dihasilkan oleh pengenalan tak berstruktur dan pengenalan secara berstruktur tidak terlalu mencolok. Pengenalan secara berstruktur lebih baik dalam mengenali chord E, F#, G#m dengan selisih tidak lebih dari 4%.

Dalam mengidentifikasi chord Bm, pengenalan tak berstruktur sedikit lebih unggul dengan selisih hanya 1%.

Perbandingan hasil percobaan 13 koefisien cepstral dengan 26 koefisien cepstral

Dari penjelasan sebelumnya terlihat bahwa nilai akurasi tertinggi dihasilkan pada pengenalan berstruktur dengan 26 koefisien cepstral yaitu sebesar 97%. Nilai akurasi terendah dihasilkan pada pengenalan berstruktur dengan 13 koefisien cepstral yaitu sebesar 88%. Terlihat bahwa penggunaan 26 koefisien cepstral untuk pengenalan secara berstruktur maupun tak berstruktur dapat menaikkan akurasi chord yang dihasilkan pada percobaan dengan 13 koefisien cepstral. Dapat dilihat lebih jelas pada grafik yang ditampilkan Gambar 8 dan Gambar 9. Pada kedua grafik tersebut terlihat pemakaian 26 koefisien cepstral menghasilkan nilai akurasi yang lebih besar.

Gambar 9 Grafik perbandingan hasil akurasi dengan 13 dan 26 koefisien cepstral pada pengenalan berstruktur

Besarnya peningkatan akurasi yang terjadi karena pemakaian 26 koefisien cepstral cukup signifikan. Untuk pengenalan tak berstruktur peningkatan akurasi yang terjadi sebesar 5%

sedangkan untuk pengenalan secara berstruktur terjadi peningkatan akurasi sebesar 9%. Dengan demikian, rata-rata kenaikan persentase tingkat akurasi akibat pemakaian 26 koefisien cepstral adalah sebesar 7%. Seperti terlihat pada Gambar 10.

Gambar 10 Grafik kenaikkan akurasi atas pemakaian 26 koefisien cepstral Secara keseluruhan hasil perbandingan dapat dilihat pada Lampiran 6.

Tingkat akurasi dari percobaan dengan menggunakan ukuran codebook sebesar 8, 12, 16, 20, 24, 28, 32 k-cluster

Pada penelitian ini ukuran codebook yang digunakan adalah sebesar 8, 12, 16, 20, 24, 32 k-cluster. Rataan akurasi yang dihasilkan dari pemakaian sejumlah k-cluster tersebut dapat dilihat pada Tabel 6.

Gambar 8 Grafik perbandingan hasil akurasi dengan 13 dan 26 koefisien cepstral pada pengenalan tak berstruktur

(20)

12 Tabel 6 Rataan akurasi pemakaian 8, 12, 16, 20,

24, 28, 32 k-cluster

Dari Tabel 6 terlihat bahwa untuk percobaan dengan 13 koefisien cepstral rataan akurasi terendah berada pada pemakain 8 k-cluster yaitu sebesar 83% dan tertinggi pada pemakaian 32 k- cluster yaitu sebesar 91%. Untuk percobaan dengan 26 koefisien cepstral rataan akurasi terendah berada pada pemakaian 16 k-cluster yaitu sebesar 95% dan tertinggi pada pemakaian 12 dan 32 k-cluster yaitu sebesar 97%.

Grafik pada Gambar 11 memerlihatkan kecenderungan bahwa peningkatan jumlah k- cluster pada percobaan dengan 13 koefisien cepstral secara umum meningkatkan tingkat akurasi pengenalan chord. Namun pada percobaan dengan 26 koefisien cepstral pengaruh banyaknya jumlah k-cluster yang dipakai tidak begitu terlihat karena akurasi yang dihasilkan sudah sangat tinggi.

KESIMPULAN DAN SARAN Kesimpulan

Penelitian ini telah berhasil mengimplementasikan metode codebook dan teknik MFCC dalam mengenali sebuah chord dengan rataan akurasi sebesar 91% untuk percobaan menggunakan 13 koefisien cepstral dan 96% untuk percobaan menggunakan 26 koefisien cepstral. Dari penelitian ini dihasilkan beberapa model codebook yang merepresentasikan sinyal suara chord. Model codebook dengan 26 koefisien cepstral memiliki performa yang lebih baik dibandingkan codebook dengan 13 koefisien cepstral karena memiliki tingkat akurasi yang lebih tinggi dalam mengenali suatu chord.

Chord F# merupakan chord yang sulit dikenali oleh sistem dengan 13 koefisien cepstral maupun 26 koefisien cepstral.

Kecenderungan pengaruh peningkatan jumlah k-cluster terhadap peningkatan tingkat akurasi sangatlah terlihat pada percobaan dengan 13 koefisien cepstral. Namun pada percobaan dengan 26 koefisien cepstral pengaruh banyaknya jumlah k-cluster yang dipakai tidak begitu terlihat. Hal ini dikarenakan akurasi yang dihasilkan oleh 26 koefisien cepstral sudah tinggi.

Penerapan metode pengenalan secara berstruktur tidak terlihat meningkatkan akurasi pengenalan chord karena memiliki tingkat akurasi yang lebih rendah dibandingkan pengenalan tak berstruktur. Hal ini mungkin disebabkan oleh hasil clustering yang memang tidak sesuai dengan teori musik.

Saran

Pada dasarnya penelitian ini masih sederhana sehingga memungkinkan untuk dikembangkan lebih lanjut. Saran-saran yang dapat diberikan untuk pengembangan lebih lanjut adalah :

1. Pada penelitian ini chord yang dimodelkan hanya dimainkan pada satu posisi saja, sehingga bila dimasukkan chord yang sama yang dimainkan dengan posisi yang berbeda maka akan salah dikenali. Dengan demikian, disarankan untuk memodelkan Jumlah

k- cluster

Rataan akurasi chord dengan 13 kofisien ceptral

Rataan akurasi chord dengan 26 kofisien ceptral

8 87% 96%

12 90% 96%

16 89% 97%

20 89% 97%

24 92% 96%

28 92% 96%

32 92% 97%

Gambar 11 Grafik rataan akurasi dari pemakaian 8, 12, 16, 20, 24, 28, 32 k-cluster

(21)

13 semua posisi yang dapat membentuk suatu

chord.

2. Membentuk suatu metode cluster sehingga dapat ditentukan ciri suatu chord.

3. Menerapkan bagaimana cara men- treatment chord F# agar dapat dikenali lebih baik.

DAFTAR PUSTAKA

Do, MN. 1994. Digital Signal Processing Mini- Project: An Automatic Speaker Recognition System. Switzerland: Audio Visual Communications Laboratory, Swiss Federal

Institute of

Technology.http://Icavwww.epfl.ch/~minh do/asr_project.pdf [23 Agt 2007]

Jurafsky D, Martin JH. 2007. Speech and Language Processing An Introduction to Natural Language Processing.

Computational Linguistic, and Specch Recognition, New Jersey : Prentice Hall.

Hendro. 2004. Panduan Praktis Improvisasi Gitar. Penerbit Puspa Swara, Jakarta.

Tan P, Michael S. dan Vipin K. 2006.

Introduction to Data Mining. Addison Wesley

Vaseghi, Saeed V. 2007. Multimedia Signal Processing. John Wiley & Sons,Ltd.

Solapung, Kaye A. 1991. Gitar Tunggal. PT Intermasa, Jakarta.

(22)

14 LAMPIRAN

(23)

15 Lampiran 1 Bentuk Chord yang digunakan pada pelatihan dan pengujian

(24)

16 Lampiran 1 Lanjutan

(25)

17 Lampiran 2 Diagram proses pengenalan tak berstruktur dan berstruktur

a. Pengenalan tak berstruktur

Data Uji MFCC 24 Codebook

Chord

Data Ciri Chord

Min jarak model chord 1 Min jarak model

chord 2 . . . . Min jarak model

chord 24

min

Identifikasi chord

(26)

18 Lampiran 2 Lanjutan

b. Pengenalan berstruktur

Data Uji MFCC

24 Codebook Chord Data Ciri

Chord

Min jarak model chord 1 Min jarak model

chord 2 . . . . Min jarak model

chord 24 min

Min jarak model cluster 1 Min jarak model

cluster 2 . . Min jarak model

cluster 5 Codebook

cluster min Identifikasi

cluster chord Identifikasi

chord

(27)

19 Lampiran 3 Dendrogram data chord

a. Dendrogram chord dengan 13 koefisien cepstral

b. Dendrogram chord dengan 26 koefisien cepstral

(28)

20 Lampiran 4 Hasil percobaan dengan pengenalan tak berstruktur

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 90%

12 90% 90%

16 90% 90%

20 80% 100%

24 80% 100%

28 80% 90%

32 90% 100%

8 90% 100%

12 90% 100%

16 90% 100%

20 70% 100%

24 90% 100%

28 90% 100%

32 90% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(29)

21 Lampiran 4 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 80% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 100% 100%

12 90% 100%

16 90% 100%

20 90% 100%

24 90% 90%

28 90% 90%

32 90% 90%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(30)

22 Lampiran 4 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 100%

12 90% 100%

16 90% 100%

20 90% 100%

24 90% 100%

28 100% 100%

32 100% 100%

8 30% 70%

12 40% 60%

16 30% 70%

20 30% 60%

24 30% 60%

28 40% 60%

32 40% 70%

8 60% 100%

12 80% 100%

16 60% 100%

20 80% 100%

24 80% 100%

28 70% 100%

32 90% 100%

8 80% 100%

12 90% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(31)

23 Lampiran 4 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 70% 90%

12 80% 90%

16 90% 100%

20 90% 90%

24 90% 90%

28 90% 90%

32 100% 90%

8 90% 90%

12 90% 90%

16 90% 100%

20 100% 100%

24 100% 90%

28 90% 90%

32 90% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 70% 80%

12 80% 80%

16 70% 80%

20 70% 80%

24 80% 70%

28 80% 90%

32 80% 80%

(32)

24 Lampiran 4 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 90% 100%

12 90% 100%

16 90% 100%

20 90% 100%

24 100% 100%

28 100% 100%

32 90% 100%

8 100% 90%

12 100% 90%

16 90% 90%

20 80% 90%

24 80% 90%

28 80% 90%

32 80% 90%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(33)

25 Lampiran 5 Hasil percobaan dengan pengenalan berstruktur

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 80% 90%

12 80% 90%

16 80% 90%

20 80% 100%

24 80% 100%

28 80% 90%

32 90% 100%

8 90% 100%

12 90% 100%

16 90% 100%

20 70% 100%

24 90% 100%

28 90% 100%

32 90% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(34)

26 Lampiran 5 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 80% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 100% 100%

12 90% 100%

16 90% 100%

20 90% 100%

24 90% 100%

28 90% 100%

32 90% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(35)

27 Lampiran 5 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 100%

12 90% 100%

16 80% 100%

20 70% 100%

24 90% 100%

28 90% 100%

32 90% 100%

8 20% 70%

12 20% 60%

16 20% 70%

20 30% 60%

24 40% 70%

28 40% 60%

32 40% 70%

8 30% 100%

12 40% 100%

16 30% 100%

20 40% 100%

24 80% 100%

28 70% 100%

32 80% 100%

8 80% 100%

12 90% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(36)

28 Lampiran 5 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 60% 90%

12 60% 90%

16 70% 100%

20 80% 90%

24 80% 90%

28 80% 90%

32 80% 90%

8 60% 90%

12 60% 90%

16 60% 100%

20 70% 100%

24 80% 100%

28 80% 90%

32 80% 100%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 70% 80%

12 80% 80%

16 70% 80%

20 70% 80%

24 80% 70%

28 80% 90%

32 80% 80%

(37)

29 Lampiran 5 Lanjutan

Chord k cluster akurasi 13 koefisien akurasi 26 koefisien

8 80% 100%

12 90% 100%

16 90% 100%

20 90% 100%

24 100% 100%

28 100% 100%

32 90% 100%

8 90% 90%

12 90% 90%

16 90% 90%

20 90% 90%

24 90% 90%

28 90% 90%

32 80% 90%

8 100% 100%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

8 90% 90%

12 100% 100%

16 100% 100%

20 100% 100%

24 100% 100%

28 100% 100%

32 100% 100%

(38)

30 Lampiran 6 Perbandingan hasil pengujian menggunakan 13 dan 26 koefisien cepstral

Nama Chord pengenalan berstruktur pengenalan tak berstruktur

13 koefisien 26 koefisien 13 koefisien 26 koefisien

C 100% 100% 100% 100%

Cm 100% 100% 100% 100%

C# 81% 94% 86% 94%

C#m 87% 100% 87% 100%

D 100% 100% 100% 100%

Dm 100% 100% 100% 100%

D# 99% 100% 99% 100%

D#m 97% 100% 97% 100%

E 91% 100% 91% 96%

Em 100% 100% 100% 100%

F 100% 100% 100% 100%

Fm 85% 100% 93% 100%

F# 30% 66% 34% 64%

F#m 53% 100% 74% 100%

G 96% 100% 96% 100%

Gm 100% 100% 100% 100%

G# 73% 91% 87% 91%

G#m 70% 96% 93% 94%

A 100% 100% 100% 100%

Am 76% 80% 76% 80%

A# 91% 100% 93% 100%

A#m 89% 90% 87% 90%

B 100% 100% 100% 100%

Bm 99% 99% 100% 100%

Total rataan 88% 97% 91% 96%

Peningkatan akurasi 9% 5%

Rataan peningkatan akurasi 7%

Gambar

Gambar  1  Ilustrasi  dari  12  fret  pertama  dan  nada-nada  yang  dihasilkan  dengan  cara  menekan  senar  pada  fret-fret  tertentu (Vaseghi 2007)
Gambar 4 Diagram proses MFCC (Do 1994)
Gambar  5  mengilustrasikan    tebaran  data  suara  dari  dua  pembicara  di  sekitar   codebook-nya
Tabel 1 Daftar chord gitar yang digunakan
+6

Referensi

Dokumen terkait

Analisis data dilakukan untuk menguji kebenaran hipotesis yang diajukan dalam penelitian ini yaitu ada pengaruh penggunaan metode pembelajaran kooperatif melalui

menunjukkan bahwa adanya variasi penambahan konsentrasi tepung konjak dan karaginan tidak memberikan pengaruh terhadap nilai kelengketan pada permen jelly temulawak

melaksanakan proses pembelajaran memiliki skor rata-rata 111,87 dan tergolong dalam kategori sangat baik, (2) kinerja guru sesudah bersertifikasi dalam melaksanakan

Dengan menyebut nama Allah SWT yang Maha Pengasih lagi Maha Penyayang, penulis penjatkan puji dan syukur atas kehadirat-Nya yang telah melimpahkan rahmat

Keberhasilan kegiatan belajar mengajar dikelas, tidak hanya tergantung dalam penguasaan bahan ajar atau penggunaan metode pembelajaran, tetapi proses pembelajaran yang baik

Rehabilitasi Sosial dilaksanakan dalam bentuk bimbingan sosial, bimbingan fisik, bimbingan mental dan bimbingan ketrampilan (ketrampilan inti : Montir Motor,

Penelitian dan pengembangan yang telah dilaksanakan memberikan kesimpulan: (1) pengembangan modul pembelajaran IPA Fisika SMP berbasis problem based learning

Dalam kondisi tidak tersedianya harga di pasar aktif, maka entitas dapat menentukan nilai wajar dengan mempertimbangkan informasi dari berbagai sumber, di antaranya: (1) harga