Klasifikasi dan Kategorisasi Audio Menggunakan Wavelet dan Support Vector Machine.

(1)

ABSTRAK

Perkembangan multimedia saat ini sangat cepat. Dengan multimedia,

pengguna dapat menyerap informasi dengan lebih mudah, sehingga pemilihan

informasi yang tepat menjadi penting. Pemilihan informasi dapat dilakukan

dengan mengelompokkan informasi tersebut dalam kategori-kategori yang sesuai.

Informasi tersebut umumnya tersaji dalam dokumen digital salah satunya berupa

audio. Proses kategorisasi ini juga dapat mengatasi kendala biaya yang besar serta

subyektifitas jika dilakukan secara manual.

Pada Tugas Akhir ini dipresentasikan sebuah teknik untuk meningkatkan

klasifikasi dan kategorisasi audio. Teknik ini menggunakan penggabungan antara

Transformasi Wavelet dan Support Vector Machine (SVM) untuk

mengklasifikasikan dan mengkategorisasikan data audio secara akurat. Ketika

diberikan sebuah data audio yang akan diujikan, Wavelet pertama-tama digunakan

untuk mengekstraksi feature-feature akustik seperti pitch frequency and subband

power. Kemudian, metode yang dipakai adalah menggunakan sebuah SVM untuk

mengatasi feature-feature akustik tersebut dan parameter-parameter tambahan,

seperti frequency cepstral coefficient, untuk menyelesaikan klasifikasi dan

kategorisasi audio.

Dari hasil eksperimen diperoleh bahwa dengan menggunakan

Transformasi Wavelet dan Support Vector Machine, error klasifikasi berkurang

dari 11,6 % menjadi 3,0 % pada nilai L di antara 80 dan 82. Akurasi kategorisasi

juga dapat mencapai 97,0 %.

(2)

ABSTRACT

Recently, multimedia growth very fast. With multimedia, user can absorb

information easily. So, choosing the suitable information is more important than

information it selves. Choosing information can do with classify the information

with a certain subjects or topics. The information usually in digital format

document, include audio. This categorization also can solve the high cost problem

and subjectivity if we do classsification manually.

In this final project, an improved audio classification and categorization

technique is presented. This technique uses combination of Wavelet Transform

and Support Vector Machine (SVM) to classify and categorize audio data

accurately. Wavelets are first applied to extract acoustical features such as pitch

frequency and subband power. Then, the proposed method uses a SVM over these

acoustical features and additional parameters, such as frequency cepstral

coefficient, to accomplish audio classification and categorization.

From using of Wavelet Transform and Support Vector Machine,

experimental results can achieve that the classification errors are reduced from

11.6 % to 3.0 % when L is between 80 dan 82. Categorization accuracy also can

achieves 97.0 %.

(3)

DAFTAR ISI

LEMBAR PENGESAHAN

SURAT PERNYATAAN

ABSTRAK ...i

ABSTRACT... ii

KATA PENGANTAR ... iii

DAFTAR ISI... v

DAFTAR GAMBAR ... vii

DAFTAR TABEL... viii

I.5 Sistematika Penulisan ... 2

BAB II LANDASAN TEORI ... 4

II.1 Definisi Sinyal ... 4

II.2 Wavelet... 6

II.2.1 Analisis Wavelet dan Aplikasinya... 6

II.2.2 Operasi Terhadap Sinyal ... 7

II.2.3 Inner Product... 9

II.2.4 Transformasi Wavelet ... 9

II.2.5 Karekteristik Khusus dari Ekspansi Wavelet ...10

II.2.6 Analisa Multiresolusi dan Fungsi Penskalaan ...11

II.2.7 Transformasi Wavelet Diskrit (DWT : Discrete Wavelet Transform) ...12

II.2.8 Pemilihan Wavelet...17

II.3 Support Vector Machine (SVM) ...19

II.3.1 Pengenalan Support Vector Machines...19

II.3.2 Ide Dasar SVM ...21

II.3.3 Teorema Cover ...25

II.3.4 Hyperplane Optimal ...26

(4)

II.3.4.1 Linearly Separable ...26

II.3.4.2 Optimisasi Kuadratik...28

II.3.5 Fungsi Kernel ...31

II.3.5.1 Hasil Kali Dalam ...31

II.3.5.2 Tipe Kernel dan Parameternya ...32

BAB III PERANCANGAN SIMULASI ...33

III.1 Ekstraksi Feature...33

III.1.1 Preprocessing ...33

III.1.2 Ekstraksi Feature dari Frame-Frame Non-Silent...33

III.1.3 Ekstraksi Perceptual Feature dan Frequency Cepstral Coefficient...34

III.1.4 Vektor Feature ...35

III.1.5 Normalisasi Training dan Testing ...35

III.2 Proses Klasifikasi dengan Menggunakan Support Vector Machine...36

III.2.1 Proses Pembelajaran ...36

III.2.2 Proses Klasifikasi ...37

BAB IV DATA PENGAMATAN DAN ANALISA...39

IV.1 Sinyal Input ...39

IV.2 Ekstraksi Feature...39

IV.3 Proses Training...41

IV.4 Hasil Percobaan ...42

BAB V KESIMPULAN DAN SARAN ...44

V.1 Kesimpulan...44

V.2 Saran ...44

DAFTAR PUSTAKA ...45

LAMPIRAN A : LISTING PROGRAM

(5)

DAFTAR TABEL

Tabel IV.1 Karakteristik Sinyal Input...39

Tabel IV.2 Ekstraksi Feature...41

Tabel IV.3 Persentase Kesalahan Klasifikasi...42

(6)

DAFTAR GAMBAR

Gambar II.1 Proses Konversi Sinyal Analog ke Digital ... 5

Gambar II.2 Proses Sampling ... 6

Gambar II.3 Operasi Translasi ... 8

Gambar II.4 Operasi Dilatasi ... 9

Gambar II.5 Dekomposisi Sinyal dengan Discrete Wavelet Transform...13

Gambar II.6 Wavelet Decomposition Tree Level 3 ...14

Gambar II.7 Skema Tiga Tahap Sinyal Dekomposisi...15

Gambar II.8 Respon Frekuensi untuk Dekomposisi DWT pada Level 3 ...16

Gambar II.9 Skema Sinyal Rekonstruksi pada Level 3 ...16

Gambar II.10 Diagram Proses SVM ...20

Gambar II.11 Arsitektur Jaringan SVM...21

Gambar II.12 Skema SVM...21

Gambar II.13 Struktur Objek Kompleks...22

Gambar II.14 Proses Pemetaan pada SVM ...23

Gambar II.15 Hyperplane Linier Optimal ...27

Gambar III.1 Proses Dekomposisi ...34

Gambar III.2 Diagram Alir Klasifikasi dan Kategorisasi Audio ...38

Gambar IV.1 Dekomposisi Sinyal Audio ”sample1.wav” (birds) ...40

Gambar IV.2 Error Klasifikasi Menggunakan Fungsi ERBF Kernel ...42

Gambar IV.3 Akurasi Kategorisasi ...43

(7)

preprocessing.m

clear; close all; clc;

% Membaca file.wav

[x fs nbit]=wavread('nama file'); pjg=length(x);

% Membagi data menjadi frame jml_frame=round(pjg/256); jml=0;

for k=1:jml_frame

x_win((k-1)*256+1:k*256)=x((k-1)*256+1:k*256).*hamming(256); x_win_tanda(1:256)=sign(x_win((k-1)*256+1:k*256));

for m=2:256

Function [c,l] = wavedec(x,n,varargin)

% WAVEDEC Dekomposisi Wavelet multilevel 1-D

% [C,L] = WAVEDEC(X,N,'wname') menghasilkan wavelet dekomposisi dari sinyal X

% pada level N menggunakan ‘wname’ returns the wavelet % N =Level

% [C,L] merupakan vektor yang merupakan output dari struktur dekomposisi. % For [C,L] = WAVEDEC(X,N,Lo_D,Hi_D),

% Lo_D = dekomposisi low-pass filter % Hi_D = dekomposisi high-pass filter.

% Susunan Struktur

if errargn(mfilename,nargin,[3:4],nargout,[0:2]), error('*'), end if errargt(mfilename,n,'int'), error('*'), end

if nargin==3

[Lo_D,Hi_D] = wfilters(varargin{1},'d');

(8)

else

function lev = wmaxlev(sizeX,wname);

% WMAXLEV level dekomposisi Wavelet maksimum

% L = WMAXLEV(S,'wname') merupakan maksimum level dekomposisi dari suatu sinyal

% sizeX = ukuran (panjang) data X

% wname = jenis wavelet yang dipilih dengan ordenya

% Argument

(9)

wname = deblankl(wname);

errargt(mfilename,'invalid argument','msg'); error('*');

% f_y = pitch_detec(x, window, hop, xformlength) function f_y = pitch_detec(x, window, hop, xformlength)

% Windowing sinyal input

numwinds = ceil((size(x,1) - window)/hop) + 1; windstart = 1;

h=1;

for(windnum = 1:numwinds)

% jika diperlukan untuk window terakhir if(windnum ~= numwinds)

windx = x(windstart:windstart + window - 1); else

% Window Hamming pada sampel windx = windx .* hamming(window);

% STFT (konversi dari domain waktu ke domain frekuensi menggunakan FFT) f_x = fft(windx, xformlength);

% HPS

% function f_y = hps(f_x)

(10)

f_x = f_x(1 : size(f_x,1) / 2); f_x = abs(f_x);

% HPS, bagian1: downsampling for i = 1:length(f_x)

for i = 1:floor((length(f_x)-1)/2)

f_x2(i,1) = (f_x(2*i,1) + f_x((2*i)+1,1))/2; end

f_x3(i,1) = (f_x(3*i,1) + f_x((3*i)+1,1) + f_x((3*i)+2,1))/3; end

f_x4(i,1) = (f_x(4*i,1) + f_x((4*i)+1,1) + f_x((4*i)+2,1) + f_x((4*i)+3,1))/4;

% HPS, bagianII : perhitungan hasil

f_ym = (1*f_x) .* (1.0*f_x2);% .* (1*f_x3) .* f_x4; %.* f_x5;

% HPS, bagianIII : nilai maksimum f_y1 = max(f_ym);

% Konversi ke frekuensi

(11)

% Increment pointer windstart windstart = windstart + hop;

fprintf ('Klasifikasi Support Vektor\n')

fprintf (' _____________________________ \n') n = size (X ,1);

if ( nargin <4) C= Inf ;, end if ( nargin <3) ker ='linear ';, end fprintf ('Konstruksi ...\ n'); H = zeros(n,n);

fprintf ('Optimisasi ...\ n'); st = cputime ;

(12)

epsilon = svtol ( alpha ); svi = find ( alpha > epsilon ); nsv = length ( svi );

fprintf ('Support Vektor : % d (%3.1 f %%)\ n',nsv ,100* nsv /n); b0 = 0;

if nobias ( ker ) ~= 0

svii = find ( alpha > epsilon & alpha < (C - epsilon )); if length ( svii ) > 0

b0 = (1/ length ( svii ))* sum (Y( svii ) - H(svii , svi )* alpha ( svi ).* Y( svii )); else

fprintf (‘Tidak ada support vector .\n'); end

end end

(13)

BAB I

PENDAHULUAN

I.1 Latar Belakang

Saat ini perkembangan dunia informasi sangat cepat dan banyak.

Penyajian informasi secara multimedia sangat diperlukan karena dengan

multimedia, pengguna dapat menyerap informasi secara lebih mudah dibanding

non-multimedia. Sistem multimedia adalah sistem yang menggunakan lebih dari

satu media, misalnya media visual (penglihatan) dan media audio (pendengaran).

Selain lebih mudah untuk penyampaian informasi, sistem multimedia juga dapat

lebih menarik minat pengguna. Pentingnya multimedia dalam sistem komputer

ditandai oleh pesatnya perkembangan hardware dan software untuk mendukung

multimedia.

Untuk informasi digital, data audio telah menjadi sebuah bagian penting.

Sebuah multimedia memuat jutaan klip audio, seperti suara manusia, suara mesin,

suara hewan, dan lainnya. Kebutuhan untuk mengenali kelas / kategori apa yang

dimiliki oleh audio tersebut secara tepat mengakibatkan munculnya sebuah

penelitian untuk mengklasifikasi dan mengkategorisasi sinyal audio tersebut.

Data audio mempunyai karakteristik-karakteristik tertentu untuk suatu

kategori. Karakteristik-karakteristik tersebut terdapat dalam feature-feature

dokumen audio yang mempunyai makna khusus terhadap kategori dalam

dokumen tersebut. Dengan mengekstraksi sampel audio melalui metode tertentu,

dokumen tersebut dapat dikelompokkan menurut kategori tertentu.

Untuk mendapatkan sebuah sistem klasifikasi dan kategorisasi audio yang

baik maka digunakanlah metoda penggabungan antara Transformasi Wavelet dan

Support Vector Machine (SVM). Hal ini dikarenakan Transformasi Wavelet lebih

natural dan efektif untuk mendeskripsikan feature audio. Support Vector Machine

dapat memisahkan feature-feature audio tersebut dengan tingkat akurasi yang

tinggi untuk menyelesaikan klasifikasi dan kategorisasi audio.

(14)

2

I.2 Identifikasi Masalah

1. Bagaimana Transformasi Wavelet dan Support Vector Machine ( SVM )

dapat digunakan untuk mengklasifikasi dan mengkategorisasi audio ?

2. Bagaimana cara untuk meminimalisasi kesalahan klasifikasi dan mencapai

akurasi kategorisasi ?

I.3 Tujuan

1. Mensimulasikan metode Transformasi Wavelet dan Support Vector

Machine untuk mengklasifikasi dan mengkategorisasi sinyal audio.

2. Meminimalisasikan kesalahan klasifikasi audio dan mendapatkan

kategorisasi audio yang tepat.

I.4 Pembatasan Masalah

1. Suara audio disampel pada frekuensi 22 KHz dengan resolusi 16 bit.

2. Klasifikasi dilakukan untuk suara hewan dan alat musik.

3. Menggunakan fungsi Eksponensial Radial Basis Function Kernel (ERBF

Kernel).

4. Perangkat lunak yang dihasilkan hanya dapat memproses data dari file

audio berekstensi .WAV menggunakan MATLAB 6.5.

I.5 Sistematika Penulisan

BAB I PENDAHULUAN

Bab ini menguraikan tentang latar belakang, identifikasi

masalah, tujuan, pembatasan masalah, dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini membahas tentang sinyal audio, Transformasi Wavelet

dan Support Vector Machine secara teoritis.

BAB III PERANCANGAN SIMULASI

Bab ini menjelaskan tentang tahapan-tahapan perancangan

simulasi dalam melakukan klasifikasi dan kategorisasi sinyal

audio.

(15)

3

BAB IV DATA PENGAMATAN DAN ANALISA

Bab ini menyampaikan hasil dari simulasi dan analisa data dari

proses klasifikasi dan kategorisasi sinyal audio dengan

menggunakan Transformasi Wavelet dan Support Vector

Machine.

BAB V KESIMPULAN DAN SARAN

Bab ini menyampaikan kesimpulan dari hasil klasifikasi sinyal

audio menggunakan Transformasi Wavelet dan Support Vector

Machine serta saran untuk pengembangan Tugas Akhir ini lebih

lanjut.

(16)

BAB V

KESIMPULAN DAN SARAN

V.1 Kesimpulan

Dari analisa yang telah dilakukan maka dapat diambil kesimpulan :

1. Ketepatan proses klasifikasi audio bergantung pada besarnya kemampuan

untuk menangkap feature-feature yang sesuai pada setiap feature set bagi

setiap kelas audio secara akurat.

2. Transformasi Wavelet cocok digunakan untuk ekstraksi feature power

subband dan pitch frequency.

V.2 Saran

Saran yang dapat diberikan untuk perbaikan dan pengembangan lebih

lanjut agar diperoleh hasil yang lebih baik adalah :

1. Untuk penelitian selanjutnya dapat digunakan fungsi Kernel yang lain

seperti Polinomial Kernel dan Gausian Kernel.

(17)

DAFTAR PUSTAKA

1. Burrus, C. Sidney, Ramesh. A. Gopinath, dan Haitao Guo, Introduction to

Wavelets and Wavelet Transform, Prentice Hall, New Jersey, 1998.

2. C. C. Lin, S. H. Chen, T. K. Truong, dan Y. Chang, Audio Classification

and Categorization Based on Wavelets and Support Vector Machine, IEEE

Transactions on Speech and Audio Processing, vol. 13, no. 5, pp 644-651,

Sept. 2005.

3. Haykin, Simon, Neural Network, a Comprehensive Foundation, Prentice

Hall, New Jersey, 1998.

4. Puspitaningrum, Diyah, Pengantar Jaringan Saraf Tiruan, Andi,

Yogyakarta, 2006.

5. Siang, Jong Jek, Jaringan Saraf Tiruan dan Pemrogramannya

Menggunakan Matlab, Andi, Yogyakarta, 2005.