Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika

(1)

PENGENALAN

SONG-TYPE

BURUNG

ORTOLAN BUNTING

MENGGUNAKAN PENDEKATAN

HIDDEN MARKOV

MODELS

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik

Program Studi Teknik Informatika

Oleh:

Lydia Rizcy Arimbi

NIM

: 055314072

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

(2)

(3)

(4)

(5)

HALAMAN PERSEMBAHAN

Ketika segala macam ujian dan pencobaan menekan hidup kita,

jangan menganggap semua itu seperti para penyusup,

tetapi sambutlah mereka seperti para kawan.

Skipsi ini saya persembahkan untuk :

Yesus Kristus,

keluarga, sahabat-sahabat dan kekasih.

Terima kasih untuk segalanya.

(6)

(7)

(8)

(9)

(10)

(11)

(12)

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA... ...I

HALAMAN JUDUL BAHASA INGGRIS ... ..II

HALAMAN PERSETUJUAN ... .III

HALAMAN PENGESAHAN... .IV

HALAMAN PERSEMBAHAN ... ..V

HALAMAN PERNYATAAN KEASLIAN KARYA ... .VI

HALAMAN PERSETUJUAN PUBLIKASI ... VII

ABSTRAK ... VIII

ABSTRACT... .IX

KATA PENGANTAR... ...X

DAFTAR ISI... XII

I. PENDAHULUAN ... …1

1.1. Latar Belakang dan Deskripsi Topik ... ....1

1.2. Rumusan Masalah ... …2

1.3. Tujuan ... …2

1.4. BatasanMasalah… ... ...3

1.5. Metodologi Penelitian ... …3

1.6. Sistematika Penulisan ... …4

II. LANDASAN TEORI ... …6

2.1. Teori

Speech Recognition

(Pengenalan suara) ... …6

2.1.1.

Feature Analysis

... …7

2.1.2.

Accoustic Modeling

... …8

2.1.3.

Language Modeling

... …8

2.2.

Feature Extraction

... …8

(13)

2.2.1.

Greenwood function cepstral coefficients

(GFCC)... …9

2.2.2.

(GFCC)

Delta dan delta-delta ... ..13

2.3. Hidden Markov Models (HMM) ... ..14

2.3.1. Teori Markov Model... ..14

2.3.2. Definisi HMM... ..16

2.3.3. Algoritma

Viterbi

... ..22

2.3.4. Algoritma

Baum-Welch

... ..23

III.METODOLOGI ... ..27

3.1. Data... ..27

3.2. Skema Pengenalan Suara menggunakan HMM ... ..32

3.2.1.

Feature extraction

... ..33

3.2.2. Tahap

Training

... ..34

3.2.3. Tahap

Testing

... ..35

3.3. Kebutuhan Perangkat Lunak ... ..37

3.4. Kebutuhan Perangkat Keras ... ..37

3.5. Perancangan Antar Muka ... ..38

3.5.1. Halaman

Home

... ..38

3.5.2. Halaman Pengenalan

Song-type

... ..39

3.5.3. Halaman Pengujian Akurasi

Hidden Markov Models

... ..40

3.5.4. Halaman Bantuan... ..41

3.5.5. Halaman Tentang Program ... ..42

IV. IMPLEMENTASI DAN ANALISA ... . 43

4.1. Hasil Penelitian... ..43

4.2. Implementasi Antar Muka yang Digunakan pada Sistem ... ..48

4.2.1. Halaman Utama ... ..48

4.2.2. Halaman Pengenalan

Song-type

... ..50

4.2.3. Halaman Pengujian

... ..52

4.2.4. Halaman Bantuan... ..54

V. PENUTUP... ..56

5.1. Kesimpulan... ..56

(14)

5.2. Saran ... ..57

DAFTAR PUSTAKA... ..58

HALAMAN LAMPIRAN LISTING PROGRAM... ..60

HALAMAN LAMPIRAN FILE HMM... ..93

(15)

BAB I

PENDAHULUAN

1.1.

Latar Belakang dan Deskripsi Topik

Perkembangan teknologi informasi saat ini mengalami kemajuan yang

sangat pesat. Berbagai pemanfaatan teknologi informasi menghasilkan informasi

yang dapat meningkatkan kinerja manusia. Perkembangan teknologi

speech

recognition

(pengenalan suara) adalah salah satu bentuk perkembangan teknologi

di abad ke 20 yang memanfaatkan suara sebagai masukan. Komputer akan

mengenali suara sebagai perintah dan memberi terhadap perintah tersebut.

Teknologi pengenalan suara dapat diimplementasikan untuk mengenali

suara binatang. Teknik-teknik yang digunakan untuk mengenal pola suara

binatang dengan variasi vokalisasi dibagi menjadi 2 kategori yaitu kualitatif dan

kuantitatif (Mc.Gregor et al., 2000). Pendekatan kualitatif meliputi perbandingan

spectogram

yang dilakukan oleh para peneliti. Kebanyakan peneliti biologi

mengenal suara binatang dengan sonogram yaitu deskripsi dari sebuah

spectogram

. Pendekatan ini mempunyai konsep yang sederhana dan kemudahan

dalam pengoperasian (Wakita, 1976). Akan tetapi,

variable

yang dilibatkan dalam

perhitungan dengan

spectogram

tidak cukup untuk menggambarkan karakteristik

dari isi

spectrum

dan pola

signal

sehingga tingkat akurasinya rendah. Untuk itu,

diperlukan metode kuantitatif yang lebih teliti dalam pengukuran secara detail

parameter frekuensi dan parameter

temporal

dari suatu vokalisasi. Salah satu

(16)

membutuhkan waktu yang lama dalam pengoperasian, dan hasil akurasi yang

diperoleh tinggi.

Dalam penulisan tugas akhir ini, akan diterapkan pendekatan

Hidden

Markov Models

untuk mengenal

song-type

burung

Ortolon Bunting

. Burung ini

bermigrasi tersebar dari Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Burung

ini mempunyai ciri khas suara yang unik. Suara yang dihasilkan mempunyai

variasi

song-type.

Burung ini mempunyai

song-type

yang berbeda untuk setiap

individu. Setiap burung mempunyai dua sampai tiga

song-type

.

1.2.

Rumusan Masalah

Dari latar belakang diatas dapat dirumuskan masalah sebagai berikut :

1. Bagaimana komputer secara otomatik dapat mengenal

song-type

burung?

2. Bagaimana mengimplementasikan pendekatan

(HMM) yang banyak digunakan dalam teknologi

Speech Recognation

untuk mengenali

song-type

burung?

3. Bagaimana tingkat akurasi pengenalan

song-type

burung dengan

menggunakan metode HMM?

1.3

Tujuan

Adapun tujuan dari penelitian ini adalah

1. Merancang dan mengimplementasikan metode HMM untuk mengenal

(17)

2. Menganalisa dan mengetahui keakuratan metode HMM dalam

penerapan pengenalan

song-type

burung

Ortolan Bunting

.

1.4

Batasan Masalah

Dalam pengenalan jenis nyanyian burung dilakukan beberapa batasan

sebagai berikut :

1. Suara yang dapat diproses adalah suara wav (*.WAV).

2. Ekstrak

ciri

dilakukan

dengan

menggunakan

metode

GFCC

(

Greenwood Functions Ceptral Coefficients

).

3. Pemodelan suara burung menggunakan metode HMM (

Hidden

Markov Models

).

4. Jumlah data ada lima

song-type

burung dan setiap

song-type

ada 100

song

.

5. Bahasa pemrograman yang digunakan adalah

MATLAB 6.5

.

1.5.

Metodologi Penelitian

Metodologi yang digunakan untuk penelitian sebagai berikut :

1. Studi pustaka dan literature

Tahap ini akan mempelajari teori-teori tentang pengenalan suara

(

Speech Recognition)

,

feature

extraction, metode HMM, algoritma

Baum-

Welch, algoritma

Viterbi

yang kesemuanya bersumber dari

(18)

2. Akuisisi Data

Tahap ini mengolah sampel nyanyian burung

Ortolon Bunting

dari

koleksi data yang tersedia.

3. Implementasi

Pada tahap ini akan dibuat desain

user interface

serta berbagai tombol

atau fungsi yang akan digunakan untuk membangun perangkat lunak

sebagai alat bantu untuk pengenalan

song-type

burung.

4. Pengujian dan analisa

Pada tahap ini akan dilakukan pengujian dan menganalisis hasil

akurasi dengan menggunakan pendekatan HMM.

5. Kesimpulan

Pembuatan kesimpulan dari hasil dan analisa yang dilakukan pada

tahap pengujian.

1.6.

Sistematika Penulisan

BAB I, Pendahuluan

Berisi latar belakang yang mengarah pada deskripsi topik, rumusan

masalah, batasan sistem, tujuan penelitian, metode penelitian, serta

sistematika penulisan.

BAB II, Landasan Teori

Berisi tentang teori-teori yang dipakai dalam implementasi, yaitu

(19)

Models

),

feature extraction,

algoritma

Baum-Welch

dan algoritma

Viterbi

.

BAB III, Metodologi

Berisi tentang bagaimana perancangan dan pengimplementasian

metode

dan desain

user interface

untuk

membangun perangkat lunak sebagai alat bantu pengenalan

song-type

burung.

BAB IV, Implementasi dan Analisa

Berisi tentang implementasi dari program yang dibuat sehingga

menghasilkan akurasi serta analisis dari sistem yang dibuat.

BAB V, Penutup

(20)

BAB II

LANDASAN TEORI

Pada bab ini akan dijelaskan beberapa teori yang menunjang perancangan

dan implementasi pengenalan

song-type

burung. Bagian ini mencakup : teknologi

Speech Recognition

,

feature extraction

dan HMM.

2.1

Teori

Speech Recognition

(Pengenalan suara)

Gambar 2.1 Blok diagram sistem pengenalan suara (Rabiner,1996)

Gambar 2.1 menunjukkan blok diagram suatu sistem pengenalan suara.

Speech Recognition

(pengenalan suara) merupakan metode untuk pengembangan

dan pengimplementasian algoritma pada komputer untuk mengenal

linguistic

content

dari suatu suara. Sinyal suara merupakan sinyal yang kompleks yang tidak

mudah diuraikan. Hasil sinyal suara antara orang yang satu berbeda dengan yang

lain. Suatu sinyal suara bisa berbeda, meskipun diucapkan oleh orang yang sama

(21)

terdiri dari beberapa tahap yaitu:

feature analysis, accoustic modeling

dan

language modeling.

2.1.1.

Feature analysis

Pada

feature analysis

, suara akan diekstrak menjadi sebuah rangkaian

feature

vektor

X

yang mengandung informasi yang relevan tentang rangkaian kata

dari suatu suara.

Feature analysis

melakukan konversi sinyal suara ke dalam

bentuk rangkaian

feature

vector

yang akan digunakan pada saat klasifikasi.

Analisis suara dikerjakan pada sebuah ukuran frame tertentu pada

analysis

window

. Sebuah

window

dengan ukuran 3 ms sampai 6 ms dapat digunakan untuk

feature analysis

.

Fourier

adalah metode yang banyak digunakan untuk

mengekstrak

feature spectral

untuk pengenalan suara. Tujuan dari

feature

analysis

adalah menghitung parameter sebuah vokalisasi menjadi sebuah vektor

feature

yang berisi informasi suatu vokalisasi

. Feature analysis

pada

speech

recognition

terdiri dari tiga proses:

1. Beberapa deteksi suara digunakan untuk menghapus bagian

yang

bukan merupakan suara.

2.

Feature

diekstraksi untuk mendapatkan informasi.

3. Beberapa kompensasi sinyal diterapkan.

2.1.2.

Accoustic modeling

digunakan untuk memodelkan secara statistik hasil

(22)

sistem harus dapat menentukan nilai

P

(

X

│

W

), kemungkinan dari observasi

X

bila

diketahui sebuah rangkaian suara tertentu

W.

2.1.3.

Language modeling

digunakan untuk memodelkan bentuk kata baik

berupa kata, fonem, ataupun kalimat. Awalnya sistem pengenalan suara hanya

menggunakan

informasi

akustik

untuk

mengevaluasi

kemungkinan.

Perkembangan pada sistem pengenalan suara yaitu pemisahan bahasa untuk

meningkatkan akurasi. Struktur dan

grammar

rangkaian kata meningkatkan

akurasi sistem pengenalan suara dengan menghapus rangkaian kata yang baru

yang tidak sesuai dengan

grammar

(Seneff, 1992).

Feature Extraction

Pengenalan

song-type

burung yang menggunakan data yang mempunyai

label disebut sebagai “

supervised”

. Data suara yang diambil merupakan data

signal

(audio). Namun tidak semua data audio tersebut yang digunakan, sehingga

diperlukan proses

feature extraction

untuk mengambil

feature

yang digunakan.

Feature

yang diekstrak diharapkan mempunyai kemampuan untuk membedakan

kemiripan vokalisasi serta untuk membuat model tanpa membutuhkan sebuah data

training

yang berlebihan.

Adapun tujuan dari proses

feature extraction

adalah untuk parameterisasi

suara (audio) ke dalam rangkaian

vector feature

, sehingga dapat mewakili

(23)

2.2.1.

Greenwood function cepstral coefficients (GFCC)

(GFCC) merupakan salah satu

pendekatan yang digunakan untuk mengekstrak

feature

berdasarkan pada

perceptual model

dari spesies. Dalam kasus ini adalah suara spesies burung

Ortolan Bunting

.

Greenwood

(Greenwood , 1961, 1990) menjelaskan bahwa beberapa dari

spesies mamalia baik yang di darat maupun di air dapat menerima frekuensi pada

skala algoritmik dengan persamaan sebagai berikut :

= (10

−

)

(2.1)

Keterangan :



f

merupakan frekuensi (Hz)



A, a

dan

b

merupakan konstanta untuk masing-masing spesies



x

merupakan posisi dari selaput pendengaran

Untuk frekuensi

f

, maka pendefinisian frekuensi

warping

sebagai berikut :

( ) =

( + )

(2.2)

Konstanta

A

dan

a

dapat diperoleh sebagai berikut :

(24)

dimana range pende

(

LePage

, 2003).

Vocalization

waveform

Gam

Proses ekstrak

menjadi beberapa fram

data suara kemudia

didefinisikan sebagai

dimana

x(n)

adalah si

berkorespondensi den

dalam Hz dan

w(n)

hamming window

deng

ndengaran spesies tersebut

dan

Windowed FFT Greenwood filterbank Discrete cosine transform

ambar 2.2.

Blok diagram perhitungan GFCC

kstrak ciri bisa dilihat pada gambar 2.2. Siny

frame dan masing-masing frame disebut

window

udian ditransformasi menggunakan

fast fouri

ai berikut :

h sinyal dalam waktu dengan panjang

N; k=

0,1,...

dengan frekuensi

f

(

k

) =

kfs

/

N

,

f

s adalah sam

n)

adalah

time-window

.

Time-window

yang di

dengan

w(n) = 0.54 - 0.46cos(pn/N)

.

(2.4)

dan nilai

b

=0,88

Ceptral

coefficients

nyal suara dibagi

ndow

.

Window

dari

ourier transform

,

(2.5)

0,1,...

N

-1 dan

k

sampling frekuensi

(25)

Suara burung

Ortolan Bunting

mempunyai jangkuan frekuensi yang lebih

tinggi dari suara manusia.

Window-sizes

untuk suara burung adalah antara 3 ms

hingga 6 ms sehingga untuk setiap ukuran frame adalah satu-setengah dari

window-sizes

dengan

overlap

secara berturut-turut sebesar 50% dari

window-sizes

. Besarnya koefisien |

X(k)

| dikorelasikan dengan masing-masing

triangular

filter

dalam

Greenwood filterbank (k, m)

. Korelasi ini berarti koefisien magnitude

dari

fast fourier transform

dikalikan dengan

filter-gain

, didefinisikan sebagai

berikut :

( ) =

(

∑

| ( )| ( ,

))

(2.6)

untuk

m

= 1, 2, …,

M

, dimana

M

adalah jumlah dari

filterbank

dan

M<<N

.

Greenwood filterbank

merupakan kumpulan dari

triangular filter

yang

didefinisikan oleh frekuensi-frekuensi utama. Frekuensi utama pada

Greenwood

filterbank

dihitung dengan menggunakan skala

Greenwood

pada persamaan (2.2).

Triangular filter

terdapat diseluruh jangkauan frekuensi dari nol hingga frekuensi

Nyquist

.

Band-limiting

menggunakan frekuensi bawah dan atas untuk me-

reject

frekuensi yang tidak diinginkan. Pada

, untuk suara burung

Ortolan Bunting

menggunakan jangkauan frekuensi dari 400 hz hingga 7400 Hz

(gambar 2.3) supaya sesuai dengan

−

dari

song

burung (Edwards,

(26)

Gambar 2.3.

Gambar 2.3 merupakan proses pada

Greenwood filterbank.

Pada proses ini

sinyal suara akan di

filter

sehingga menghasilkan

feature

yang tidak berkorelasi.

Amplitudo

filterbank

biasanya berkorelasi dan penggunaan dari sebuah

transformasi

cepstral

memberikan gambaran yang lebih baik untuk pengenalan

pola.

Discrete cosine transform

digunakan untuk menghitung koefisien

cepstral

dari log amplitudo

filterbank

sebagai berikut :

(

) =

∑

( )cos (

(

−

0,5))

(2.7)

(27)

2.2.2.

Greenwood function cepstral coefficients (GFCC) Delta dan

delta-delta

Vektor-vektor

feature

dihitung dari fungsi

Greenwood

yang memberikan

sebuah perkiraan yang terbaik dari

local spectra

. Karakteristik yang penting dari

data vokalisasi ini dinamis vokalisasi. Kinerja sistem suara dapat ditingkatkan

dengan menambah waktu turunan pada parameter statis. Banyak peneliti

memanfaatkan perkiraan daerah turunan waktu.

Delta cepstrum

(Furui, 1986)

adalah

salah

satu

bentuk

umum

dari

langkah

ini.

Delta

cepstrum

diimplementasikan sebagai turunan pertama koefisien regresi. Turunan waktu

dinyatakan sebagai berikut :

=

∑ ( )

∑

(2.8)

dimana d

t

adalah koefisien delta pada waktu t dihitung dalam jangka koefisien

waktu statis c

t-k

hingga c

t+k

.

Turunan kedua, disebut sebagai delta-delta

cepstrum

atau koefisien

percepatan, sesuai dengan penerapan korelasi yang sama pada koefisien delta.

Sebagian besar sistem yang memadukan

feature

delta dan delta-delta. Kedua

feature

tersebut digunakan sebagai tambahan pada perhitungan statis seperti

(28)

2.3

Hidden Mar

2.3.1. Teori Markov

Markov mode

state (setiap transisi da

dari state-state tersebut

Dalam Markov

probabilitas observasi

dilakukan pada waktu

P

(S

n

│

Untuk mempe

observasi-observasi se

menjadi :

Contoh soal :

Misalkan terda

dengan tabel probabi

berdasarkan cuaca har

Markov Models

(HMM)

kov Model

odel merupakan sistem dengan serangkaian st

si dari state mempunyai sebuah probabilitas) di

sebut disebut dengan

Markov chain.

rkov model atau

first-order-Markov

mengasum

vasi pada waktu

n

hanya tergantung pada obse

ktu

n

-1. Untuk serangkaian {S

1

,S

2

,...,S

n

} maka

│

S

n-1

,S

n-2

,...,S

1

) =

P

(

Sn│

Sn

-1

)

(asumsi Markov)

mperoleh probabilitas gabungan (

joint probabi

si sebelumnya maupun observasi sekarang da

rdapat 3 tipe cuaca : “

sunny”, ”rainy”

dan “

abilitas

P

(

Sn+1│Sn

) cuaca yang akan terjadi

hari ini (

Sn

) yang terlihat pada tabel 2.1.

state dan transisi

dimana rangkaian

asumsikan bahwa

observasi

Sn

-1

yang

Markov)

(2.9)

probability

) dari

dapat diturunkan

(2.10)

n “

foggy

”, berikut

(29)

Tabel 2.1.

Probabolitas

P

(

Sn+1│

Sn

) cuaca yang akan terjadi besok berdasarkan

cuaca hari ini

Cuaca besok

Cuaca hari ini

sunny

Rainy

foggy

Sunny

0.8

0.05

0.15

Rainy

0.2

0.6

0.2

Foggy

0.2

0.3

0.5

State yang ada

q

= {“

sunny”, ”rainy”

, “

foggy

”} dan setiap hari mempunyai

kemungkinan transisi

P

(

Sn│

Sn

-1

) state berdasarkan tabel probabilitas 2.1.

1.

Jika hari ini cuacanya adalah “

sunny”

berapakah probabilitas besok

bercuaca “

sunny”

dan hari berikutnya (

S3

) adalah

“rainy”

?

P(S2=sunny, S3=rainy| S1=sunny) = P(S3=rainy, S2=sunny| S1=sunny) .

P(S2=sunny| S1=sunny)= P(S3=rainy| S2=sunny) . P(S2=sunny| S1=sunny)

=

0.05 . 0.8 = 0.04

2.

Jika cuaca kemarin

S1

adalah “

rainy”

dan cuaca hari ini

S2

adalah “

foggy”,

berapakah probabilitas besok

S3

dengan cuaca “

sunny”

?

P(S3=sunny| S2=foggy, S1=rainy)= P(S3=sunny| S2=foggy)= 0.2

2.3.2

Definisi HMM

(HMM) adalah sebuah model statistik yang

diasumsikan dari rantai Markov dengan parameter yang tidak diketahui. Metode

(30)

probabilitas

dari model yang dimasukkan.

merupakan rantai markov dengan himpunan

state

terbatas yang menghasilkan suatu barisan pengamatan dan bersifat tersembunyi

(

hidden

). Perubahan atau perpindahan

state

direpresentasikan oleh suatu

himpunan peluang yang dinamakan matriks peluang transisi.

Hidden Markov

Models

dibangun oleh suatu kejadian yang tersembunyi

hidden

. HMM digunakan

untuk pembuatan model pada proses

training

dan

testing

. Bentuk model HMM

berupa state-state yang saling berhubungan. Proses

training

bertujuan untuk

membuat model untuk data suara burung. Pemodelan ini berupa model yang

bersifat kontinu untuk data suara.

Gambar 2.4.

HMM dari kiri ke kanan (after Young et al., 2002)

Gambar 2.4 merupakan salah satu contoh rangkaian HMM dari kiri ke

kanan dimana ada sebuah lima model state yang bergerak melalui rangkaian state

(31)

3 dan 4 mempunyai

state tersebut. Matriks

berikut :

aij=

Probabilitas ke

bergerak melalui rang

transisi dan probabili

berikut :

Pendekatan ini

state

S

tersembunyi (

hi

HMM didefini



{

s

} ada

akhir

S



{

aij

} a



{

bj(k)

}

a

dan

b

memenuhi sif

ai hasil probabilitas yang saling berhubungan

riks pada model ini mempunyai 5 baris dan 5

0 1 0 0 0

0 0.3 0. 4 0. 3 0

0 0 0.3 0.7 0

0 0 0 0.3 0.7

0 0 0 0 0

keseluruhan adalah

X

yang dihasilkan oleh

angkaian state

S

adalah hanya dihitung hasil

bilitas output. Jadi rangkaian state pada gam

P ( X , S

│

M )= a

12

b

2

(x

1

) a

22

b

2

(x

2

) a

23

b

3

(x

3

)...

ini, hanya rangkaian observasi

X

yang diketahui

hidden

). Pendekatan ini disebut

Hidden Mark

inisikan oleh sebuah kumpulan parameter (

฀฀

adalah kumpulan state yang menyatakan state a

SF

} adalah probabilitas sebuah transisi dari state

i

} adalah probabilitas dari keluaran output

k

pa

sifat sebagai berikut :

gan dengan model

5 kolom sebagai

h model HMM

M

sil dari probabilitas

ambar 2.4 sebagai

(2.13)

ahui dan rangkaian

arkov Model

.

฀฀

e awal

S1

dan state

i

sampai state

j

(32)

Ada dua asum

Markov

pada persa

independence

. Proba

observasi

xi

sehingga pr

Dengan memperhatika

maka masing-masing

probabilitas

P(xi)

yan

berikut :

Contoh soal :

Pada contoh

langsung sedangkan p

dapat kita umpamaka

hari (tidak dapat me

sumsi pada sebuah deret pertama HMM. Pertam

rsamaan (2.10). Asumsi kedua adalah a

obabilitas pada masing-masing state diperol

ngga probabilitas

P(Si|xi)

dapat dirumuskan sebaga

tikan probabilitas

P(xi)

yang tidak berubah unt

sing potensi state yang akan diuji atau diperiksa

ang sama sehingga persamaan 2.14 dapat dirum

oh Markov model, keadaan cuaca dapat diobse

n pada HMM, cuaca-cuaca dalam keadaan “

hi

akan seandainya kita dikunci disebuah kamar

elihat kondisi luar). Untuk melakukan predi

ama adalah asumsi

asumsi

output-roleh berdasarkan

bagai berikut :

(2.14)

untuk setiap state

periksa mempunyai

dirumuskan sebagai

(2.15)

diobservasi secara

hidden”

. Hal ini

ar untuk beberapa

(33)

akan terjadi, maka hanya terdapat tanda yaitu pada orang yang setiap datang ke

kamar untuk membawakan makanan, apakah orang tersebut membawa payung

atau tidak.

Tabel 2.2

. Probabilitas

P(xi|Si)

membawa payung berdasarkan cuaca

Si

pada hari

i

Cuaca

Probabilitas membawa payung

Sunny

0.1

Rainy

0.8

Foggy

0.3

Tabel 2.2 merupakan probabilitas membawa payung berdasarkan keadaan

cuaca. Probabilitas orang tersebut membawa payung jika cuaca pada hari itu

“

sunny”

adalah 0.1

,

jika bercuaca “

rainy

” adalah 0.8, jika bercuaca “

foggy”

adalah

0.3.

1. Seandainya hari pada saat kita terkunci bercuaca “

sunny”

. Hari

berikutnya orang yang mengantarkan makanan membawa payung.

Berapakah probabilitas masing-masing cuaca pada hari itu?



Kemungkinan hari kedua adalah “

sunny”

:

L(S2=sunny| S1=sunny, x2=membawa payung) = P(x2=membawa

payung| S2=sunny) . P(S2=sunny| S1=sunny) =

0.1 . 0.8 = 0.08



Kemungkinan hari kedua “

rainy”

:

(34)

payung| S2=rainy) . P(S2=rainy| S1=sunny) =

0.8 . 0.05 = 0.04



Kemungkinan hari kedua “

foggy”

:

L(S2=foggy| S1=sunny, x2=membawa payung) = P(x2=membawa

payung| S2=foggy) . P(S2=foggy| S1=sunny) =

0.3 . 0.15 =0.045

2. Seandainya kita tidak mengetahui cuaca pada hari kita dikunci dalam

kamar, tiga hari berturut-turut orang mengantarkan makanan tidak

membawa payung. Berapakah

likelihood

cuaca tersebut adalah

{

₁

=

,

2

=

,

3

=

}

?

L(S1=sunny| S2=foggy, S3=sunny| x1=tidak membawa payung,

x2=tidak

membawa payung, x3=tidak membawa payung) = P(x1=tidak membawa payung|

S1=sunny) . P(x2=tidak membawa payung| S2=foggy) . P(x3=tidak membawa

payung| S3=sunny) . P(S1=sunny). P(S2=foggy| S1=sunny) . P(S3=sunny|

S2=foggy) =

0.9 . 0.7 . 0.9 . 1/3 . 0.15 . 0.2 = 0.0057

Pada vokalisasi burung, state menunjukkan rangkaian waktu dari silabel,

dapat dilihat pada gambar 2.5 sebagai berikut :

(35)

Dalam kasus penge

memodelkan karakter

yang memiliki bebera

yang dihasilkan oleh sua

Struktur dasar

HMM (Rabiner, 1989

1.

Masalah evalua

Bila diketahui

menghitung p

2.

Masalah

decodi

Bila diketahui

barisan state y

3.

Masalah penge

Bagaimana menyesua

observasi?

2.3.3

Algoritma

Vit

Rangkaian obse

algoritma Viterbi. Alg

δ

dan ψ

t(

i

).

δ

t(

i

) adalah

semua jalur terakhir pa

genalan

song-type

burung

Ortolan Bunting,

kteristik sinyal atau suara yang secara

temporal

berapa variasi. Dalam state terdapat suatu runtun

h suara burung

Ortolan Bunting

tersebut.

sar HMM diatas memberikan tiga masalah utam

1989) sebagai berikut :

aluasi

hui suatu model HMM



dan barisan observa

probabilitas observasi jika diberikan model?

coding

hui barisan observasi dan model, bagaima

e yang optimal?

ngenalan

suaikan model parameter untuk memaksimalka

Viterbi

observasi dapat ditentukan secara rekursif

Algoritma Viterbi membuat penggunaan dari dua

δ

lah kemungkinan nilai tertinggi mendekati jalur

r pada state

i

waktu

t

.

unting,

HMM akan

poral

dan

spectrum

untun waktu sinyal

ama yang dihadapi

observasi, bagaimana

ana menentukan

lkan

probabilitas

kursif menggunakan

i dua variabel

δ

t(

i

)

lur

single

diantara

(36)

ψ

t(

i

) merupakan varia

pada state

i

waktu

t

.

δ

t(

i

) seperti

forward re

dan perhitungannya id

HMM dengan

adalah sebagai berikut



Inisialisasi



Recursion



Terminati



Backtrack

sehingga

variabel untuk menyimpan data pada akhir jalur

ard recursion

αt

(

i

), hanya dengan mengenai rangk

a identik mendekati.

gan

N

state, cara menemukan rangkaian stat

kut :

sasi

ion

nation

racking

alur yang terbaik

(2.17)

gkaian state

single

(37)

Sebelumnya r

parameter

Φ

, algoritm

jalur yang terbaik diant

= {

S1

*

,...., ST

*

} dan ke

2.3.4

Algoritma

Bau

Pada

training

estimate model akan menghitung probabilitas state. Definisi γ

probabilitas pada state

sebagai berikut :

Rumus (2.16) dapat di

Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ

pada state

Si

pada wakt

rangkaian observasi

X

rangkaian observasi

X

= (

x

1,

x

2, ...,

x

T

) adalah

oritma

Viterbi

memberikan dua hasil yang bai

diantara semua jalur yang mungkin pada model

kemungkinan jalur terbaik

P

(

X,S

*

│

Φ

)=

Φ

P

(

X

│

Baum-welch

ning

akan membentuk suatu model (estimate

estimate model akan menghitung probabilitas state. Definisi γ

state

Si

pada waktu

t

, diketahui deret obeservasi

t dinyatakan dengan variabel

forward-bakward

Selain itu juga dapat didefinisikan dengan fungsi probabilitas ξ

t(

aktu

t

sampai state

Sj

pada waktu

t+1

, diketah

X

sebagai berikut:

lah sebuah model

aik, yaitu pilihan

el yang dikenal,

S

*

X

│

Φ

)



ate model). Pada

estimate model akan menghitung probabilitas state. Definisi γ

t

(

i

) adalah

si

X

dan model

,

(2.18)

ard

seperti :

(2.19)

(i,j)

, probabilitas

tahui model



dan

(38)

Dari definisi variabel

berikut :

Hubungan antara

γ

t

(

i

) dan ξ

Estimasi

awal

da

bel

forward

dan

backward

, rumus diatas didef

) dan ξ

t(i,j)

sebagai berikut :

dari

parameter

model

adalah

sebaga

definsikan sebagai

(2.21)

(2.22)

agai

berikut

:

(2.23)

(2.24)

(39)

Setelah estimasi awal dari parameter model, model baru



^

yang lebih mungkin

menghasilkan rangkaian observasi

X

dari model



yang dihasilkan yaitu

P(X│



^

)>

P(X│

).

Algoritma

Baum-welch

yang dijelaskan diatas merupakan implementasi

secara umum dari EM algoritma. Awalnya dengan menginisialisasi parameter

HMM

=(A, B,

π

), perhitungan E (

expectation

) dan M (

maximization

) secara

bergantian. Untuk E (

expectation

) menghitung perkiraan total state

occupancy

γ

dan perkiraan total transisi state dari kemungkinan probabilitas A dan B dengan

algoritma

forward-backward

. Pada M(

maximization

), γ dan ξ digunakan untuk

menghitung probabilitas baru A, B dan

π

dengan persamaan (2.23), (2.24) dan

(40)

BAB III

METODOLOGI

Bab ini menjelaskan tahap perancangan dan pengimplementasian metode

untuk mengenal

song-type

burung

Ortolan Bunting

sehingga menghasilkan akurasi yang optimal.

3.1.

Data

Jenis burung yang dijadikan sampel adalah

Ortolan Bunting

(

Emberiza

hortulana)

.

Ortolan Bunting

adalah burung yang bermigrasi yang tersebar dari

Eropa Barat ke Mongolia (Cramp, Perrins, 1994). Pada musim dingin berada di

Africa. Burung ini mendiami daerah pertanian, dataran tinggi, padang pasir ,

hutan yang telah terbakar dan hutan gundul.

Ortolan Bunting

termasuk burung

monogami, diklasifikasi sebagai spesies yang langka. Burung ini mengalami

penurunan populasi yang cukup besar pada jumlah individu dan penyebarannya.

Ortolan Bunting

mempunyai

song

yang relatif sederhana dan setiap individu

mempunyai 2-3 song-type. Frekuensi

song

berada diantara 1.9 kHz dan 6.7 kHz.

Beberapa

song

dari

Ortolon Bunting

digambarkan berdasar silabel,

song-type

dan

song variants

. Jumlah keseluruhan ada 63

song type

dan 234 variasi

song

,

tersusun dari 20 silabel yang berbeda. Sebuah silabel merupakan inisial suatu

song

.

Sebuah

song

digambarkan dengan menggunakan notasi huruf seperti

(41)

song-type

mempunyai beberapa silabel yang panjang dan frekuensinya berbeda di

antara individu, tetapi mempunyai ukuran yang sama pada sonogram.

Gambar 3.1.

Syllable Ortolan Bunting

(Osiejuk, 2003)

Gambar 3.1 merupakan kumpulan silabel dari burung

Ortolan Bunting. Song-type

adalah sebuah kumpulan

song

yang terdiri dari susunan silabel yang sama pada

rangkaian yang sama. Sebagai contoh:

type

-ab(

aaabb

),

type

-cb(

cccbb

).

Setiap

song-type

mempunyai perbedaan pada jumlah silabel dalam

song

yang disebut

song variant

, misalnya :

song-type

ab mempunyai banyak

song

variant

yang mungkin yaitu

aaab,aabbbb,aaabb

. Silabel awal dan akhir

mempunyai sedikit perbedaan pada amplitudo dan frekuensi karena mekanisme

produksi suara. Contoh s

ong-type

burung

Ortolan bunting

yang diubah menjadi

(42)

Gambar 3.2

. Specgram Song-type ab

Gambar 3.3

. Specgram Song-type cb

Perancangan dan pengimplementasian metode HMM untuk mengenal

song-type

burung

Ortolan Bunting

, menggunakan jumlah sampel lima

song-type

yaitu

song-type

ab,

song-type

cb,

song-type

cd,

song-type

eb,

song-type

ef.

(43)

(gambar 3.2 dan 3.3)

. Specgram

pada masing-masing

song-type

menggambarkan

silabelnya. Setiap

song-type

terdapat 100

song

burung

Ortolan Bunting

dan ada 8

individu burung

Ortolan Bunting

yang bernyanyi.

Tabel 3.1 menunjukkan tabel untuk pembagian data. Pembagian data

menggunakan cara

five fold cross-validation

yaitu membagi data menjadi lima

kelompok, dimana empat kelompok sebanyak 400 data digunakan untuk

pembentukan model (

training

) sedangkan yang lain sebanyak 100 data untuk

pengenalan data baru (

testing

). Proses pembentukan model (

training)

dan

pengenalan data baru (

testing

) dilakukan sebanyak lima kali sehingga data

keseluruhan yang digunakan untuk proses

training

sebanyak 2000 data dan 500

data untuk proses

testing

.

Dari hasil perhitungan diperoleh 20 feature suara untuk setiap bagian.

Tabel 3.1.

Tabel Pembagian Data

Bagian

Song-type

ab

Bagian

Song-type

cb

1

20 feature

1

20 feature

2

20 feature

2

20 feature

3

20 feature

3

20 feature

4

20 feature

4

20 feature

(44)

Tabel 3.2.

Tabel Percobaan Training dan Testing

Bagian

Song-type

cd

Bagian

Song-type

eb

1

20 feature

1

20 feature

2

20 feature

2

20 feature

3

20 feature

3

20 feature

4

20 feature

4

20 feature

5

20 feature

5

20 feature

Bagian

Song-type

ef

1

20 feature

2

20 feature

3

20 feature

4

20 feature

5

20 feature

Percobaan

Training

Testing

1

Bagian 1, 2, 3, 4

Bagian 5

2

Bagian 1, 2, 3, 5

Bagian 4

3

Bagian 1, 2, 4, 5

Bagian 3

4

Bagian 1, 3, 4, 5

Bagian 2

(45)

Tabel 3.2 menunjukkan tabel percobaan yang dilakukan dalam pengenalan

suara. Jika

feature

bagian 1, 2, 3, dan 4 digunakan untuk data

training

, maka

feature

bagian 5 digunakan untuk data

testing

. Hal tersebut diulang sampai setiap

kelompok digunakan sebagai

testing

.

3.2.

Skema Pengenalan Suara menggunakan HMM

Gambar 3.4

Skema sistem pengenalan suara

Gambar 3.4 menjelaskan mengenai tahapan proses yang dilakukan dalam

pengenalan suara dimulai dari suara burung yang berbentuk file .wav sebagai data

mentah diekstrak

feature

menjadi file .mfc. Suara yang telah diekstrak dijadikan

inputan dalam proses pengenalan suara untuk di

training

dan di

testing

dengan

metode HMM yang kemudian dihasilkan

song-type

yang telah dikenali sebagai

(46)

3.2.1

Feature extraction

Pada tahap

feature extraction

, data suara mentah yang berupa .wav

diekstrak menjadi data suara .mfc.

Feature extraction

menggunakan 3 jenis tipe

parameter yaitu GFCC,delta (GFCC_D) dan delta-delta (GFCC_D_A).

Masing-masing tipe parameter mempunyai parameter yang berbeda, untuk GFCC

menggunakan parameter 12, GFCC_D menggunakan parameter 24, dan

GFCC_D_A menggunakan parameter 36. Pada sistem ini, dilakukan pemilihan

ukuran window (

window-sizes

) antara 3 ms hingga 6 ms dan

overlap

antara 1,5

ms hingga 3 ms. Adapun untuk pemilihan jumlah state yaitu 5, 10 dan 15. Pada

proses

feature extraction

, mengubah informasi

time

menjadi informasi frekuensi

melalui

Fast Fourier Transform

(FFT). Kemudian, informasi frekuensi di

window

dengan ukuran window (

window-sizes

) yang dipilih. Tujuan dari proses membuat

window

agar informasi-informasi setiap bagian tidak hilang. Ukuran window

(

window-sizes

) kecil karena suara burung lebih cepat. Selanjutnya, diambil

magnitudenya setelah proses membuat

window

selesai. Kemudian, proses FFT

yang akan menghasilkan nilai besaran signal. Nilai tersebut akan dimasukkan

pada

Greenwood

. Pada

Greenwood

konstanta frekuensi

warping

dihitung dari

fmin 400 Hz hingga 7400 Hz yang tepat didengar oleh

Ortolan Bunting

. Pada

proses

Greenwoood

mengambil

gain

, kemudian dikalikan dengan nilai besaran

signal menghasilkan

output

parameter berupa koefisien parameter. Koefisien

parameter tersebut digunakan untuk observasi pada proses HMM.

Output

parameter berupa matriks dengan jumlah kolom tergantung dari jenis feature yang

(47)

GFCC_D sebanyak 24 dan GFCC_D_A sebanyak 36. Sedangkan jumlah baris

tergantung dari panjangnya sinyal suara yang dihasilkan.

3.2.2

Tahap

Training

Gambar 3.5.

Blok diagram tahap

training

Gambar 3.5 menggambarkan tahap

training

untuk pengenalan

song-type

burung. Setelah mengekstrak feature suara kemudian perancangan sistem

dilanjutkan dengan tahap

training

.

Pada tahap

training

akan membentuk model yang mewakili

masing-masing

song-type

burung

Ortolan Bunting

. Pembentukan model mencakup

perhitungan parameter menggunakan sample yang diambil dari contoh suara

masing-masing

song-type

burung

Ortolan Bunting

. Pembentukan model ini

menggunakan algoritma

Baum-Welch

. Perhitungan

Baum-Welch

untuk mean dan

varian pada masing masing state HMM.

HMM merupakan sebuah model statistik yang diasumsikan dari rantai

(48)

statistik karena metode ini mencari

means

,

varians

dan

probabilitas

dari model

yang dimasukkan. Pada proses

training

menghasilkan

output

yang tersimpan pada

file

hmmdefs

. File

hmmdefs

dapat dilihat pada halaman lampiran file HMM.

3.2.3

Tahap

Testing

Gambar 3.6.

Blok diagram tahap

testing

Gambar 3.6 menggambarkan tahap testing untuk pengenalan

song-type

burung

Ortolan Bunting

. Pada tahap

testing

akan mengenal data baru. Proses

pengenalan data baru (

testing)

menggunakan algoritma

Viterbi

. Algoritma

Viterbi

adalah algoritma

dynamic programming

untuk menemukan kemungkinan

rangkaian state yang tersembunyi (biasa disebut

Viterbi path

) yang dihasilkan

(49)

menemukan jalur terbaik dalam sebuah matrik dimana dimensi vertikal

merepresentasikan state-state hmm dan dimensi horisontal merepresentasikan

frame suara.

Pada tahap

testing

menggunakan 500 data suara yang sudah dibagi

sebelumnya. Pada awalnya tahap training untuk pembentukan model

song-type

burung

Ortolan Bunting

, yaitu “

song

ab”, “

song

cb”, “

song

cd”, “

song

eb”,

“

song

ef”. Hasil

training

adalah model yang telah diestimasi (

M

). Kemudian

HMM digunakan untuk mengenali suara baru (

O

) berdasarkan hasil

training

tersebut. P(

O

|

M

) adalah kemungkinan suatu

song-type

O dihasilkan oleh suatu

model M. Untuk mengenal suatu suara burung baru, sistem akan menghitung

berapa probabilitas data ini diturunkan oleh masing-masing model. Probabilitas

paling tinggi di antara model yang ada menunjukkan kedekatan data terhadap

model.

Perhitungan dilakukan sebanyak 5 kali percobaan yang hasilnya disajikan

dengan

confusion matrix

sebagai berikut:

Tabel 3.3.

Confusion matrix

Song-type

ab

Song-type

cb

Song-type

cd

Song-type

eb

Song-type

ef

Song-type ab X

Song-type cb X

Song-type cd X

Song-type eb X

(50)

Dari hasil percobaan (tabel 3.3) kemudian dilakukan perhitungan akurasi

untuk setiap percobaan yang dilakukan. Perhitungan akurasi sebagai berikut :

=

∑

× 100%

Dimana data benar adalah jumlah elemen diagonal pada

confusion matrix

, dan

data testing adalah jumlah data yang digunakan untuk testing.

3.3

Kebutuhan Perangkat Lunak

Kebutuhan perangkat lunak dalam menyelesaikan tugas akhir ini adalah

Matlab 6.5.1 MathWork yang digunakan sebagai

library

untuk menjalankan

program dan sebagai alat bantu pembangunan sistem pengenalan

song-type

burung.

3.4

Kebutuhan Perangkat Keras

Kebutuhan perangkat keras dalam menyelesaikan tugas akhir ini adalah

sebuah system computer dengan spesifikasi sebagai berikut :

1.

Prosesor

: AMD Turion64 X2 TL-60

2. Sistem Operasi

: Windows XP

3. Memory

: 1 GByte

4. Media tampilan

: VGA nVIDIA GeForce 7000M

(51)

3.5

Perancangan Antar Muka

Pada perancangan antar muka alat bantu pengenalan

song-type

ini terdiri

dari halaman

Home

, halaman pengenalan

song-type

, halaman pengujian akurasi

dan halaman bantuan.

3.5.1

Halaman

Home

Gambar 3.7.

Halaman

Home

sistem pengenalan

song-type

Gambar 3.7 merupakan rancangan halaman

Home

yang berisi judul

(52)

3.5.2

Halaman Pengenalan

Song-type

Gambar 3.8.

Halaman pengenalan

song-type

sistem pengenalan

song-type

Gambar 3.8 menunjukkan halaman pengenalan

song-type

. Pada halaman

ini pengguna dapat memasukkan suara dengan menekan tombol “cari”. Pada

visualisasi data input akan ditampilkan gambar

specgram

dan

signal

dari suara

yang dimasukkan. Pengguna dapat mendengar suara yang dimasukkan dengan

menekan tombol “suara” pada bawah gambar

signal

.

Pengenalan

song-type

dilakukan dengan menekan tombol “ Proses” pada

sisi kiri bawah kotak “hasil”. Hasil ekstrak

feature

dan pengenalan dapat dilihat

(53)

3.5.3

Halaman Pengujian Akurasi

Gambar 3.9.

Halaman pengujian akurasi dengan

Gambar 3.9 merupakan halaman pengujian akurasi dengan

Hidden

Markov Models

. Pada sistem ini, akan diolah 2000 model

song-type

yang

sebelumnya telah tersimpan. Pertama, pengguna memilih tipe parameter,

window-sizes

dan jumlah

state

. Setelah itu, pengguna menekan tombol “proses” untuk

menguji akurasi HMM terhadap

song-type

. Pada kotak “proses” akan

menampilkan proses dari pengujian. Pada kotak “hasil” akan menampilkan hasil

(54)

3.5.4

Halaman Bantuan

Gambar 3.10.

Halaman bantuan pengenalan

song-type

Gambar 3.10 menunjukkan halaman bantuan untuk pengenalan

song-type

.

Pada halaman ini pengguna dapat mengetahui informasi cara penggunaan sistem

(55)

3.5.5

Halaman Tentang program

Gambar 3.11.

Halaman Tentang program

(56)

BAB IV

IMPLEMENTASI DAN ANALISA

Bab ini membahas hasil implementasi sistem berupa hasil penelitian dan

analisa dari hasil penelitian yang didapatkan, serta implementasi

desain user

interface

.

Bagian pertama menganalisa hasil penelitian untuk setiap percobaan yang

dilakukan. Hasil penelitian berupa tabel hasil akurasi dengan

confusion matriks

untuk akurasi yang terbaik. Dalam penelitian ini, untuk mendapatkan akurasi

terbaik dipengaruhi oleh tipe parameter

feature

, ukuran

window

(

windows size

)

dan jumlah state. Bagian kedua menganalisa implementasi sistem dengan

penjelasaan penggunaan menu dan tombol untuk setiap halaman.

4.1

Hasil penelitian

Penelitian ini, menggunakan 5

song-type.

Setiap

song-type

mempunyai

100

song-variant.

Percobaan menggunakan data suara burung

Ortolan Bunting

sebanyak 2000

song-variant

untuk pembentukan model (

training)

dan 500

song-variant

untuk pengenalan data baru (

testing)

. Pada proses

feature extraction

, data

song-type

diekstrak menggunakan 3 jenis tipe parameter untuk mendapatkan hasil

akurasi untuk setiap percobaan yang dilakukan. Pertama, percobaan dilakukan

dengan pemilihan 3 tipe parameter yaitu GFCC, GFCC_D dan GFCC_D_A.

Kemudian, dilakukan pemilihan ukuran

window (window-sizes)

antara 3 ms

(57)

mencari tipe parameter untuk proses

feature

dan ukuran

window (window-sizes)

yang terbaik untuk pengenalan dalam bentuk akurasi secara keseluruhan. Hasil

dari tiap percobaan adalah sebagai berikut :

Tabel 4.1.

Tabel hasil akurasi pengenalan

song-type

menggunakan tipe parameter

feature

dan ukuran

yang berubah tetapi

jumlah state tetap yaitu 15.

No.

Tipe

Parameter

Window

size

(ms)

Akurasi

1.

GFCC

3

87%

2.

GFCC_D

3

90,6%

3.

GFCC_D_A

3

91,4%

4.

GFCC

4

88,6%

5.

GFCC_D

4

90,4%

6.

GFCC_D_A

4

94,4%

7.

GFCC

5

87%

8.

GFCC_D

5

89,6%

9.

GFCC_D_A

5

92,4%

10.

GFCC

6

88%

11.

GFCC_D

6

91,2%

(58)

Gambar 4.1.

Grafik hasil akurasi pengenalan

song-type

menggunakan tipe

parameter

feature

dan ukuran

yang berubah

tetapi jumlah state tetap yaitu 15.

Tabel 4.1 menunjukkan tabel hasil akurasi pengenalan

song-type

menggunakan tipe parameter

feature

dan ukuran

yang

berubah. Tabel penelitian diatas, mendapatkan hasil akurasi terendah 87% untuk

feature

GFCC, sedangkan hasil akurasi tertinggi dengan

feature

GFCC_D_A

menggunakan ukuran

4 ms dan

overlap

2 ms. Akurasi

yang dihasilkan yaitu 94,4%. GFCC dengan koefisien delta dan

acceleration

(percepatan) memberikan hasil akurasi tertinggi pada pengujian HMM, klasifikasi

benar 94,4% dari data pengujian. Apabila dibandingkan dengan penelitian yang

dilakukan oleh Trawichi, dkk (Trawichi, 2005) hasil penelitian ini lebih tinggi

karena penelitian yang dilakukan Trawichi, dkk menggunakan

feature

Mel-frequency ceptral coefficients

(MFCCs) karena MFCC merupakan jenis

feature

untuk suara manusia sehingga akurasi yang diperoleh rendah. Hasil penelitian

82,00

84,00 86,00 88,00 90,00 92,00 94,00 96,00

3 4 5 6

GFCC

GFCC_D

GFCC_D_A

(59)

yang dilakukan oleh Trawichi, dkk menunjukkan akurasi terendah 63,6 % dan

akurasi tertinggi 92,4%.

Feature

menggunakan tipe parameter dan ukuran

ini, kemudian digunakan untuk mencari hasil akurasi yang terbaik dengan jumlah

state yang berbeda yaitu 5, 10 dan 15. Hasil dari percobaan ini sebagai berikut :

Tabel 4.2.

Tabel hasil percobaan pengenalan

song-type

menggunakan tipe

parameter GFCC_D_A, ukuran

4 ms dan

overlap

2 ms dengan jumlah state yang berubah

No.

Jumlah

State

Akurasi

1.

5

84,2%

2.

10

87%

3.

15

94,4%

Tabel 4.2 menunjukkan tabel hasil akurasi pengenalan

song-type

menggunakan tipe parameter GFCC_D_A, ukuran

window (window-sizes)

4 ms

dan

overlap

2 ms dengan jumlah state yang berubah. Hasil percobaan ini,

mendapatkan hasil akurasi tertinggi dengan jumlah state 15. Hasil akurasi

menunjukkan nilai 94,4 %.

Confusions matrix

yang dihasilkan untuk pengenalan

song-type

window

(60)

Tabel 4.3.

C

onfusions matrix

pengenalan

song-type

menggunakan tipe

parameter GFCC_D_A, ukuran

4 ms

dan

overlap

2 ms dengan jumlah state 15

ab

cb

cd

eb

ef

ab

98

1

0

1

0

cb

3

94

1

2

0

cd

0

2

91

0

7

eb

2

1

0

90

7

ef

2

0

1

99

Tabel 4.3 merupakan tabel

confusions matrix

pengenalan

song-type

4 ms

dan

overlap

2 ms dengan jumlah state 15. Setiap baris dari matriks di atas

mewakili label

song-type

yang dikenal, sedangkan kolom mewakili klasifikasi

yang diberikan oleh sistem untuk setiap

song-type

. Angka pada diagonal adalah

jumlah dari vokalisasi yang diklasifikasi dengan benar untuk setiap

song-type

.

Klasifikasi benar 94,4% dari data yang diuji.

Dari

confusion

matriks diatas, dapat diketahui

song-type

ef mudah dikenali

sebagai

song-type

ef, yaitu sebanyak 99. Masing-masing

song-type

mudah

dikenali dengan hasil suara yang tidak dikenal hanya sedikit yaitu kurang dari 50

sehingga memperoleh hasil akurasi yang cukup tinggi dan mampu mengenal

(61)

4.2

Implementasi Antar Muka yang Digunakan pada Sistem

4.2.1

Halaman Utama

Pada halaman utama, terdapat identitas penulis dan judul sistem yang

dibuat. Selain itu, terdapat dua pilihan menu, yaitu :

1.

Menu

Menu ini berfungsi menampilkan halaman pengenalan

song-type

dan

halaman pengujian akurasi

.

2.

Bantuan

Menu bantuan ini berfungsi menampilkan halaman bantuan

pengenalan

song-type

dan halaman bantuan pengujian HMM.

Halaman tersebut akan menampilkan panduan dalam menggunakan

(62)

Gambar 4.2

. Halaman utama sistem pengenalan

song-type

Gambar 4.1 menunjukkan desain antar muka dari sistem pengenalan

song-type

. Pengguna dapat menggunakan sistem ini untuk mengenal

song-type

burung

(63)

4.2.2

Halaman Pengenalan

Song-type

Gambar 4.3.

Halaman pengenalan

song-type

(64)

Gambar 4.5

Peringatan jika tidak memilih file

Gambar 4.2 menunjukkan halaman pengenalan

song-type

. Halaman ini

berfungsi mengenal suara burung yang dimasukkan lewat tombol “cari”.

Pengguna menekan tombol “cari” kemudian memasukkan suara yang dipilih

melalui jendela

file selector

seperti gambar 4.3. Jika tidak ada file suara yang

dipilih, maka akan muncul kotak peringatan “File tidak ditemukan” seperti pada

gambar 4.4.

Pada halaman pengenalan

song-type

, untuk melihat proses pengenalan

dapat dilihat pada kotak “proses”. Pada kotak ini akan menampilkan proses

feature

dan pengenalan (

testing

) dengan menggunakan algoritma

Viterbi

. Pada

proses pengenalan, sistem melakukan pencocokan suara yang dimasukkan yang

didalam file

dataTest

.

scp

dengan

hmmdefs

(file definisi HMM),

model.list

(daftar

model),

wordnet

dan

dict

. Setelah pencocokan, hasil dari proses pengenalan akan

ditampilkan pada kotak “hasil”. Pada kotak ini menampilkan suara burung dikenal

(65)

4.2.3

Halaman Pengujian

Gambar 4.6.

Halaman pengujian akurasi

Gambar 4.5 menunjukkan halaman pengujian akurasi HMM. Pada

feature

extraction

pengguna dapat memilih tipe parameter,

window-sizes

dan jumlah

state

yang akan digunakan untuk proses pengujian. Pemilihan tipe parameter ada tiga

jenis, yaitu MFCC, MFCC_D dan MFCC_D_A.

Window-sizes

terdapat empat

ukuran, yaitu 3 ms, 4 ms, 5 ms dan 6 ms. Pemilihan jumlah

state

ada tiga macam,

yaitu 5, 10 dan 15.

Proses pengujian ini ditampilkan pada kotak “proses”. Kotak ini

menampilkan proses dari mengekstrak

feature

, pembentukan prototipe model,

(66)

a.

Pengambilan

grammarSong

menggunakan fungsi HParse untuk

membuat

wordnet

.

b.

Pemrosesan seluruh

song-type

yang tersimpan dalam

allsongs.mlf

,

file

dict

, dan file

songtypephone.led

dengan fungsi HLed untuk

membuat file

songtypephone.mlf

dengan pemberian label.

c.

Pembuatan prototipe baru

proto

dengan fungsi HCompV yang

mengambil

song-type

dari

file

AllTrainData1.scp,

kemudian

disimpan dalam direktori hmm1.

d.

Pembuatan model (

training)

menggunakan fungsi HERest. Pada

proses ini menggunakan algoritma

Baum-Welch

. Pembuatan model

ini mengambil informasi

feature

dalam file

AllTrainData1.scp,

daftar

label

song-type

dalam

file

songtypephone.mlf

.

Setelah

itu,

pencocokan dengan daftar model yang disimpan dalam file

model.list

Hasil pembuatan model disimpan dalam file

hmmdefs

.

e.

Proses

testing

menggunakan fungsi HVite untuk mencocokkan

song-type

dengan mengambil daftar

testing song-type

pada file

AllTestData.scp

. File tersebut dicocokkan dengan

wordnet

,

dict

,

model.list

dan defini HMM yang tersimpan dalam

hmmdefs

.

f.

Proses

training

dan

testing

diatas dilakukan sebanyak lima kali

(67)

Pada kotak “hasil” menampilkan hasil dari pengujian jika proses

pengujian telah selesai. Hasil pengujian berupa

confusion matrix

dan prosentase

akurasi secara keseluruhan. Waktu yang dibutuhkan untuk proses pengujian ini

dapat dilihat pada bawah kotak “hasil”.

4.2.4

Halaman Bantuan

Gambar 4.7.

Halaman bantuan penggunaan sistem pengenalan

song-type

Halaman bantuan penggunaan sistem ini terlihat pada gambar seperti

(68)

penggunaan sistem ini pada halaman pengenalan

song-type

dan halaman

pengujian HMM untuk masing-masing tombol yang ada dalam kedua halaman

(69)

BAB V

PENUTUP

5.1.

Kesimpulan

1.

Langkah-langkah pengenalan dan pengujian

song-type

burung

Ortolan

Bunting

menggunakan metode HMM adalah :

1.

Ekstraksi

feature

dari suara file .wav menjadi .mfc dan

menggunakan

feature

dengan tipe parameter GFCC, GFCC_D dan

GFCC_D_A.

Window-sizes

yang digunakan antara 3 ms hingga 6

ms dan jumlah

state

sebesar 5, 10 dan 15.

2.

Proses

training

Pada

training

akan membentuk model yang mewakili

masing-masing

song-type

burung

Ortolan Bunting

. Pembentukan model

mencakup perhitungan parameter menggunakan algoritma

Baum-Welch

.

3.

Proses

testing

Pada

testing

akan mengenal data baru. Proses pengenalan data

baru

menggunakan

algoritma

Viterbi

.

Setelah

itu,

akan

menghasilkan akurasi untuk pengujian yang dilakukan.

2.

Pada penelitian ini, Hidden Markov Models merupakan metode

pengenalan suara (

speech recognition)

yang baik dalam menangani data

berupa sinyal suara dan memberi hasil akurasi yang cukup tinggi.

(70)

GFCC_D_A,

window-sizes

4 ms,

overlap

2 ms dan jumlah

state

15.

Akurasi paling tinggi sebesar 94,4 %.

3.

Penelitian ini menggunakan 500 data

song-type

dan proses evaluasi

menggunakan metode

five fold cross validation

.

4.

Penelitian ini menggunakan jenis

feature Greenwood function cepstral

coefficients

(GFCC).

5.2.

Saran

Penelitian ini sebatas mengenai pengenalan

song-type

burung

Ortolan

Bunting

, sehingga diperlukan sebuah studi lanjut untuk mengenal

song-type

burung lain atau binatang dengan mengetahui

song-type

yang dimiliki burung

maupun binatang tersebut. Selain itu, diperlukan sebuah studi lanjut untuk

mengenal

song-type