ABSTRAK
Perkembangan multimedia saat ini sangat cepat. Dengan multimedia,
pengguna dapat menyerap informasi dengan lebih mudah, sehingga pemilihan
informasi yang tepat menjadi penting. Pemilihan informasi dapat dilakukan
dengan mengelompokkan informasi tersebut dalam kategori-kategori yang sesuai.
Informasi tersebut umumnya tersaji dalam dokumen digital salah satunya berupa
audio. Proses kategorisasi ini juga dapat mengatasi kendala biaya yang besar serta
subyektifitas jika dilakukan secara manual.
Pada Tugas Akhir ini dipresentasikan sebuah teknik untuk meningkatkan
klasifikasi dan kategorisasi audio. Teknik ini menggunakan penggabungan antara
Transformasi Wavelet dan Support Vector Machine (SVM) untuk
mengklasifikasikan dan mengkategorisasikan data audio secara akurat. Ketika
diberikan sebuah data audio yang akan diujikan, Wavelet pertama-tama digunakan
untuk mengekstraksi feature-feature akustik seperti pitch frequency and subband
power. Kemudian, metode yang dipakai adalah menggunakan sebuah SVM untuk
mengatasi feature-feature akustik tersebut dan parameter-parameter tambahan,
seperti frequency cepstral coefficient, untuk menyelesaikan klasifikasi dan
kategorisasi audio.
Dari hasil eksperimen diperoleh bahwa dengan menggunakan
Transformasi Wavelet dan Support Vector Machine, error klasifikasi berkurang
dari 11,6 % menjadi 3,0 % pada nilai L di antara 80 dan 82. Akurasi kategorisasi
juga dapat mencapai 97,0 %.
ABSTRACT
Recently, multimedia growth very fast. With multimedia, user can absorb
information easily. So, choosing the suitable information is more important than
information it selves. Choosing information can do with classify the information
with a certain subjects or topics. The information usually in digital format
document, include audio. This categorization also can solve the high cost problem
and subjectivity if we do classsification manually.
In this final project, an improved audio classification and categorization
technique is presented. This technique uses combination of Wavelet Transform
and Support Vector Machine (SVM) to classify and categorize audio data
accurately. Wavelets are first applied to extract acoustical features such as pitch
frequency and subband power. Then, the proposed method uses a SVM over these
acoustical features and additional parameters, such as frequency cepstral
coefficient, to accomplish audio classification and categorization.
From using of Wavelet Transform and Support Vector Machine,
experimental results can achieve that the classification errors are reduced from
11.6 % to 3.0 % when L is between 80 dan 82. Categorization accuracy also can
achieves 97.0 %.
DAFTAR ISI
LEMBAR PENGESAHAN
SURAT PERNYATAAN
ABSTRAK ...i
ABSTRACT... ii
KATA PENGANTAR ... iii
DAFTAR ISI... v
DAFTAR GAMBAR ... vii
DAFTAR TABEL... viii
I.5 Sistematika Penulisan ... 2
BAB II LANDASAN TEORI ... 4
II.1 Definisi Sinyal ... 4
II.2 Wavelet... 6
II.2.1 Analisis Wavelet dan Aplikasinya... 6
II.2.2 Operasi Terhadap Sinyal ... 7
II.2.3 Inner Product... 9
II.2.4 Transformasi Wavelet ... 9
II.2.5 Karekteristik Khusus dari Ekspansi Wavelet ...10
II.2.6 Analisa Multiresolusi dan Fungsi Penskalaan ...11
II.2.7 Transformasi Wavelet Diskrit (DWT : Discrete Wavelet Transform) ...12
II.2.8 Pemilihan Wavelet...17
II.3 Support Vector Machine (SVM) ...19
II.3.1 Pengenalan Support Vector Machines...19
II.3.2 Ide Dasar SVM ...21
II.3.3 Teorema Cover ...25
II.3.4 Hyperplane Optimal ...26
II.3.4.1 Linearly Separable ...26
II.3.4.2 Optimisasi Kuadratik...28
II.3.5 Fungsi Kernel ...31
II.3.5.1 Hasil Kali Dalam ...31
II.3.5.2 Tipe Kernel dan Parameternya ...32
BAB III PERANCANGAN SIMULASI ...33
III.1 Ekstraksi Feature...33
III.1.1 Preprocessing ...33
III.1.2 Ekstraksi Feature dari Frame-Frame Non-Silent...33
III.1.3 Ekstraksi Perceptual Feature dan Frequency Cepstral Coefficient...34
III.1.4 Vektor Feature ...35
III.1.5 Normalisasi Training dan Testing ...35
III.2 Proses Klasifikasi dengan Menggunakan Support Vector Machine...36
III.2.1 Proses Pembelajaran ...36
III.2.2 Proses Klasifikasi ...37
BAB IV DATA PENGAMATAN DAN ANALISA...39
IV.1 Sinyal Input ...39
IV.2 Ekstraksi Feature...39
IV.3 Proses Training...41
IV.4 Hasil Percobaan ...42
BAB V KESIMPULAN DAN SARAN ...44
V.1 Kesimpulan...44
V.2 Saran ...44
DAFTAR PUSTAKA ...45
LAMPIRAN A : LISTING PROGRAM
DAFTAR TABEL
Tabel IV.1 Karakteristik Sinyal Input...39
Tabel IV.2 Ekstraksi Feature...41
Tabel IV.3 Persentase Kesalahan Klasifikasi...42
DAFTAR GAMBAR
Gambar II.1 Proses Konversi Sinyal Analog ke Digital ... 5
Gambar II.2 Proses Sampling ... 6
Gambar II.3 Operasi Translasi ... 8
Gambar II.4 Operasi Dilatasi ... 9
Gambar II.5 Dekomposisi Sinyal dengan Discrete Wavelet Transform...13
Gambar II.6 Wavelet Decomposition Tree Level 3 ...14
Gambar II.7 Skema Tiga Tahap Sinyal Dekomposisi...15
Gambar II.8 Respon Frekuensi untuk Dekomposisi DWT pada Level 3 ...16
Gambar II.9 Skema Sinyal Rekonstruksi pada Level 3 ...16
Gambar II.10 Diagram Proses SVM ...20
Gambar II.11 Arsitektur Jaringan SVM...21
Gambar II.12 Skema SVM...21
Gambar II.13 Struktur Objek Kompleks...22
Gambar II.14 Proses Pemetaan pada SVM ...23
Gambar II.15 Hyperplane Linier Optimal ...27
Gambar III.1 Proses Dekomposisi ...34
Gambar III.2 Diagram Alir Klasifikasi dan Kategorisasi Audio ...38
Gambar IV.1 Dekomposisi Sinyal Audio ”sample1.wav” (birds) ...40
Gambar IV.2 Error Klasifikasi Menggunakan Fungsi ERBF Kernel ...42
Gambar IV.3 Akurasi Kategorisasi ...43
preprocessing.m
clear; close all; clc;
% Membaca file.wav
[x fs nbit]=wavread('nama file'); pjg=length(x);
% Membagi data menjadi frame jml_frame=round(pjg/256); jml=0;
for k=1:jml_frame
x_win((k-1)*256+1:k*256)=x((k-1)*256+1:k*256).*hamming(256); x_win_tanda(1:256)=sign(x_win((k-1)*256+1:k*256));
for m=2:256
Function [c,l] = wavedec(x,n,varargin)
% WAVEDEC Dekomposisi Wavelet multilevel 1-D
% [C,L] = WAVEDEC(X,N,'wname') menghasilkan wavelet dekomposisi dari sinyal X
% pada level N menggunakan ‘wname’ returns the wavelet % N =Level
% [C,L] merupakan vektor yang merupakan output dari struktur dekomposisi. % For [C,L] = WAVEDEC(X,N,Lo_D,Hi_D),
% Lo_D = dekomposisi low-pass filter % Hi_D = dekomposisi high-pass filter.
% Susunan Struktur
if errargn(mfilename,nargin,[3:4],nargout,[0:2]), error('*'), end if errargt(mfilename,n,'int'), error('*'), end
if nargin==3
[Lo_D,Hi_D] = wfilters(varargin{1},'d');
else
function lev = wmaxlev(sizeX,wname);
% WMAXLEV level dekomposisi Wavelet maksimum
% L = WMAXLEV(S,'wname') merupakan maksimum level dekomposisi dari suatu sinyal
% sizeX = ukuran (panjang) data X
% wname = jenis wavelet yang dipilih dengan ordenya
% Argument
wname = deblankl(wname);
errargt(mfilename,'invalid argument','msg'); error('*');
% f_y = pitch_detec(x, window, hop, xformlength) function f_y = pitch_detec(x, window, hop, xformlength)
% Windowing sinyal input
numwinds = ceil((size(x,1) - window)/hop) + 1; windstart = 1;
h=1;
for(windnum = 1:numwinds)
% jika diperlukan untuk window terakhir if(windnum ~= numwinds)
windx = x(windstart:windstart + window - 1); else
% Window Hamming pada sampel windx = windx .* hamming(window);
% STFT (konversi dari domain waktu ke domain frekuensi menggunakan FFT) f_x = fft(windx, xformlength);
% HPS
% function f_y = hps(f_x)
f_x = f_x(1 : size(f_x,1) / 2); f_x = abs(f_x);
% HPS, bagian1: downsampling for i = 1:length(f_x)
for i = 1:floor((length(f_x)-1)/2)
f_x2(i,1) = (f_x(2*i,1) + f_x((2*i)+1,1))/2; end
for i = 1:floor((length(f_x)-2)/3)
f_x3(i,1) = (f_x(3*i,1) + f_x((3*i)+1,1) + f_x((3*i)+2,1))/3; end
for i = 1:floor((length(f_x)-3)/4)
f_x4(i,1) = (f_x(4*i,1) + f_x((4*i)+1,1) + f_x((4*i)+2,1) + f_x((4*i)+3,1))/4;
% HPS, bagianII : perhitungan hasil
f_ym = (1*f_x) .* (1.0*f_x2);% .* (1*f_x3) .* f_x4; %.* f_x5;
% HPS, bagianIII : nilai maksimum f_y1 = max(f_ym);
% Konversi ke frekuensi
% Increment pointer windstart windstart = windstart + hop;
fprintf ('Klasifikasi Support Vektor\n')
fprintf (' _____________________________ \n') n = size (X ,1);
if ( nargin <4) C= Inf ;, end if ( nargin <3) ker ='linear ';, end fprintf ('Konstruksi ...\ n'); H = zeros(n,n);
fprintf ('Optimisasi ...\ n'); st = cputime ;
epsilon = svtol ( alpha ); svi = find ( alpha > epsilon ); nsv = length ( svi );
fprintf ('Support Vektor : % d (%3.1 f %%)\ n',nsv ,100* nsv /n); b0 = 0;
if nobias ( ker ) ~= 0
svii = find ( alpha > epsilon & alpha < (C - epsilon )); if length ( svii ) > 0
b0 = (1/ length ( svii ))* sum (Y( svii ) - H(svii , svi )* alpha ( svi ).* Y( svii )); else
fprintf (‘Tidak ada support vector .\n'); end
end end
BAB I
PENDAHULUAN
I.1 Latar Belakang
Saat ini perkembangan dunia informasi sangat cepat dan banyak.
Penyajian informasi secara multimedia sangat diperlukan karena dengan
multimedia, pengguna dapat menyerap informasi secara lebih mudah dibanding
non-multimedia. Sistem multimedia adalah sistem yang menggunakan lebih dari
satu media, misalnya media visual (penglihatan) dan media audio (pendengaran).
Selain lebih mudah untuk penyampaian informasi, sistem multimedia juga dapat
lebih menarik minat pengguna. Pentingnya multimedia dalam sistem komputer
ditandai oleh pesatnya perkembangan hardware dan software untuk mendukung
multimedia.
Untuk informasi digital, data audio telah menjadi sebuah bagian penting.
Sebuah multimedia memuat jutaan klip audio, seperti suara manusia, suara mesin,
suara hewan, dan lainnya. Kebutuhan untuk mengenali kelas / kategori apa yang
dimiliki oleh audio tersebut secara tepat mengakibatkan munculnya sebuah
penelitian untuk mengklasifikasi dan mengkategorisasi sinyal audio tersebut.
Data audio mempunyai karakteristik-karakteristik tertentu untuk suatu
kategori. Karakteristik-karakteristik tersebut terdapat dalam feature-feature
dokumen audio yang mempunyai makna khusus terhadap kategori dalam
dokumen tersebut. Dengan mengekstraksi sampel audio melalui metode tertentu,
dokumen tersebut dapat dikelompokkan menurut kategori tertentu.
Untuk mendapatkan sebuah sistem klasifikasi dan kategorisasi audio yang
baik maka digunakanlah metoda penggabungan antara Transformasi Wavelet dan
Support Vector Machine (SVM). Hal ini dikarenakan Transformasi Wavelet lebih
natural dan efektif untuk mendeskripsikan feature audio. Support Vector Machine
dapat memisahkan feature-feature audio tersebut dengan tingkat akurasi yang
tinggi untuk menyelesaikan klasifikasi dan kategorisasi audio.
2
I.2 Identifikasi Masalah
1. Bagaimana Transformasi Wavelet dan Support Vector Machine ( SVM )
dapat digunakan untuk mengklasifikasi dan mengkategorisasi audio ?
2. Bagaimana cara untuk meminimalisasi kesalahan klasifikasi dan mencapai
akurasi kategorisasi ?
I.3 Tujuan
1. Mensimulasikan metode Transformasi Wavelet dan Support Vector
Machine untuk mengklasifikasi dan mengkategorisasi sinyal audio.
2. Meminimalisasikan kesalahan klasifikasi audio dan mendapatkan
kategorisasi audio yang tepat.
I.4 Pembatasan Masalah
1. Suara audio disampel pada frekuensi 22 KHz dengan resolusi 16 bit.
2. Klasifikasi dilakukan untuk suara hewan dan alat musik.
3. Menggunakan fungsi Eksponensial Radial Basis Function Kernel (ERBF
Kernel).
4. Perangkat lunak yang dihasilkan hanya dapat memproses data dari file
audio berekstensi .WAV menggunakan MATLAB 6.5.
I.5 Sistematika Penulisan
BAB I PENDAHULUAN
Bab ini menguraikan tentang latar belakang, identifikasi
masalah, tujuan, pembatasan masalah, dan sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini membahas tentang sinyal audio, Transformasi Wavelet
dan Support Vector Machine secara teoritis.
BAB III PERANCANGAN SIMULASI
Bab ini menjelaskan tentang tahapan-tahapan perancangan
simulasi dalam melakukan klasifikasi dan kategorisasi sinyal
audio.
3
BAB IV DATA PENGAMATAN DAN ANALISA
Bab ini menyampaikan hasil dari simulasi dan analisa data dari
proses klasifikasi dan kategorisasi sinyal audio dengan
menggunakan Transformasi Wavelet dan Support Vector
Machine.
BAB V KESIMPULAN DAN SARAN
Bab ini menyampaikan kesimpulan dari hasil klasifikasi sinyal
audio menggunakan Transformasi Wavelet dan Support Vector
Machine serta saran untuk pengembangan Tugas Akhir ini lebih
lanjut.
BAB V
KESIMPULAN DAN SARAN
V.1 Kesimpulan
Dari analisa yang telah dilakukan maka dapat diambil kesimpulan :
1. Ketepatan proses klasifikasi audio bergantung pada besarnya kemampuan
untuk menangkap feature-feature yang sesuai pada setiap feature set bagi
setiap kelas audio secara akurat.
2. Transformasi Wavelet cocok digunakan untuk ekstraksi feature power
subband dan pitch frequency.
V.2 Saran
Saran yang dapat diberikan untuk perbaikan dan pengembangan lebih
lanjut agar diperoleh hasil yang lebih baik adalah :
1. Untuk penelitian selanjutnya dapat digunakan fungsi Kernel yang lain
seperti Polinomial Kernel dan Gausian Kernel.
DAFTAR PUSTAKA
1. Burrus, C. Sidney, Ramesh. A. Gopinath, dan Haitao Guo, Introduction to
Wavelets and Wavelet Transform, Prentice Hall, New Jersey, 1998.
2. C. C. Lin, S. H. Chen, T. K. Truong, dan Y. Chang, Audio Classification
and Categorization Based on Wavelets and Support Vector Machine, IEEE
Transactions on Speech and Audio Processing, vol. 13, no. 5, pp 644-651,
Sept. 2005.
3. Haykin, Simon, Neural Network, a Comprehensive Foundation, Prentice
Hall, New Jersey, 1998.
4. Puspitaningrum, Diyah, Pengantar Jaringan Saraf Tiruan, Andi,
Yogyakarta, 2006.
5. Siang, Jong Jek, Jaringan Saraf Tiruan dan Pemrogramannya
Menggunakan Matlab, Andi, Yogyakarta, 2005.