• Tidak ada hasil yang ditemukan

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

N/A
N/A
Protected

Academic year: 2016

Membagikan "Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows"

Copied!
62
0
0

Teks penuh

(1)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

▸ Baca selengkapnya: perintah g01 adalah perintah yang berarti

(2)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(3)

iii

PERSETUJUAN

Judul : Penerapan Perintah Suara Berbahasa Indonesia

untuk Mengoperasikan Perintah Dasar di

Windows

Kategori : SKRIPSI

Nama : RAISHA ARIANI SIRAIT

Nomor Induk Mahasiswa : 091402014

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI

Departemen : TEKNOLOGI INFORMASI

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI (FASILKOM-TI) UNIVERSITAS

SUMATERA UTARA

Diluluskan di

Medan, 25 Juni 2015

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1 004

M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010

Diketahui/Disetujui oleh

Program Studi S1 Teknologi Informasi

Ketua,

(4)

PERNYATAAN

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, 25 Juni 2015

Raisha Ariani Sirait

(5)

v

PENGHARGAAN

Alhamdulillah, segala puji dan syukur penulis panjatkan atas kehadirat Allah SWT beserta Nabi besar Muhammad SAW yang telah memberikan rahmat, hidayah-Nya, segala daya dan upaya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat utnuk memperoleh gelar Sarjana Program Studi S-1 Teknologi Informasi Universitas Sumatera Utara, Ucara terima kasih yang sebesar-besarnya penulis sampaikan kepada:

1. Kedua orang tua penulis, orang yang paling berharga dalam hidup penulis, ayahanda Mamora Sirait dan ibunda Anggreini Hasibuan yang telah membesarkan, mendidik, memberi dukungan, doa dan motivasi tanpa henti. Serta kepada Abang penulis Radinal Moechtar Sirait yang selalu ada dan menemani penulis.

2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak Muhammad Anggia Muchtar, ST., MM. IT. dan Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.

3. Bapak M. Anggia Muchtar, S.T, MMIT selaku pembimbing pertama dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku pembimbing kedua, yang telah banyak meluangkan waktunya dan memberikan masukan-masukan yang bermanfaat bagi penulis dalam menyelesaikan skripsi ini.

4. Bapak Sajaddin Sembiring, S.Si, M.Comp.Sc dan Dani Gunawan, ST, MT yang telah bersedia menjadi dosen pembanding dan Bapak Ainul Hizriadi, S.Kom, M. Kom yang telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini.

5. Kepada Ade, Yogi, Ibnu, Ammar, Reza, Ridzuan, Fadli Rizky, Icha, Yanna, Dijah, Julia, Fanny, Hani, M. Ardiansyah, Fadli Rachman, Dezi, Kurniawan, Fadil, Lydia, Amira, Jihan, Musyafa dan Andre yang selalu mendukung, membantu dan memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini. Serta teman-teman yang mendukung dan membantu penulis Febrina Panjaitan, Ifitriana dan Mifthah Huljannah dan seluruh teman-teman lainnya yang tidak dapat disebutkan satu persatu.

6. Kepada Ibu Mega, Abang Manaf dan Kak Umi yang selaku bagian tata usaha Program Studi S1 Teknologi Informasi yang telah membimbing dan membantu penulis dari awal proposal sampai sidang.

(6)

ABSTRAK

Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk

dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal

baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti

input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan

bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft

Corporation menciptakan Speech Application Programming Interface (SAPI) untuk

membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan

perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk

mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus

sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa

sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai

81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan

untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar

30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit

noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali

input.

Kata kunci : speech recognition, Speech Application Programming Interface (SAPI),

(7)

vii

ABSTRACT

Speech recognition is a study that use human voice as an input for device to

recognize. The research about speech recognition that use voice as an input for an

application is not a new thing. However among that researches there still rarely to see

an application that used Indonesia as an input. Among that researches, Microsoft

Corporation create Speech Application Programming Interface (SAPI) that can use to

develop a speech recognition application. For this research, it will use command in

Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal

by dividing every part of the signal into two parts continuously until each part consist

one point signal. The final result of this research show that the system has succeed

recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise

frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The

accuracy of the system be affected by noise and the quality of the voice input, if the

fewer the noise and with good quality of the voice input, then more and more accurate

the system in recognising the input.

Keyword : speech recognition, Speech Application Programming Interface (SAPI),

(8)

DAFTAR ISI

Hal

PERSETUJUAN i

PERNYATAAN ii

PENGHARGAAN iii

ABSTRAK vi

ABSTRACT vii

DAFTAR ISI viii

DAFTAR TABEL xi

DAFTAR GAMBAR xii

BAB 1 PENDAHULUAN 1

1.1Latar Belakang 1

1.2Rumusan Masalah 3

1.3Batasan Masalah 3

1.4Tujuan Penelitian 4

1.5Manfaat Penelitian 4

1.6Metodologi Penelitian 4

1.7Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 7

2.1Suara 7

2.2Kata Baku & Tidak Baku 7

2.3Speech Recognition 7

2.3.1 Mode Speech Recognition 8

2.3.2 Proses Speech Recognition 8

2.3.2.1 Pemisahan kata 8

2.3.2.2 Ketergantungan terhadap pengguna 9

2.3.2.3 Pencocokan kata 10

2.3.2.4 Pembendaharaan kata 10

(9)

ix

2.4.1 Komponen Speech Application Programming Interface

(SAPI)

11

2.4.2 Antar muka Speech Application Programming

Interface (SAPI)

11

2.5Transformasi Fourier 12

2.5.1 Discrete Fourier Transform (DFT) 13

2.5.2 Fast Fourier Transform (FFT) 13

2.6Penelitian Terdahulu 16

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18

3.1Identifikasi Masalah 18

3.2Data yang Digunakan 19

3.3Analisis Sistem 20

3.3.1Proses ekstraksi 22

3.3.2Penetapan grammar 23

3.3.3Pengenalan pola spektrum suara 23

3.3.4Jalankan perintah pada perangkat 23

3.4 Perancangan Sistem 23

3.4.1 Diagram use case 23

3.4.2 Spesifikasi use case 24

3.4.3 Diagram aktifitas 25

3.4.4 Perancangan antar muka 27

BAB 4 IMPLEMENTASI DAN PENGUJIAN 29

4.1Implementasi Sistem 29

4.1.1Perangkat keras 29

4.1.2Perangkat lunak 30

4.1.3Implementasi perancangan antar muka 30

4.2Pengujian Sistem 32

4.2.1Kasus dan hasil pengujian sistem 34

4.2.2Pengujian kinerja sistem 35

4.3Hasil Pengujian Suara 40

4.3.1 Hasil pengujian suara dengan tingkat frekuensi

lingkungan 0 – 500 Hz

(10)

4.3.2 Hasil pengujian suara dengan tingkat frekuensi

lingkungan 501 – 1000 Hz

42

BAB 5 KESIMPULAN DAN SARAN 45

5.1Kesimpulan 45

5.2Saran 46

(11)

xi

DAFTAR TABEL

Hal

Tabel 2.1 Penelitin terdahulu 17

Tabel 3.1 Penjelasan data yang akan digunakan 19

Tabel 3.2 Spesifikasi use case untuk input suara 24

Tabel 3.3 Spesifikasi use case untuk bantuan 25

Tabel 4.1 Hasil pengujian halaman awal 33

Tabel 4.2 Hasil pengujian halaman tentang 35

Tabel 4.3 Hasil pengujian halaman bantuan 39

Tabel 4.4 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0

– 500 Hz 40

Tabel 4.5 Hasil pengujian suara dengan tingkat frekuensi lingkungan

(12)

DAFTAR GAMBAR

Hal

Gambar 2.1 Blok Diagram Arsitektur SAPI 12

Gambar 2.2 Desimasi untuk 16 titik 14

Gambar 2.3 Konsep FFT 14

Gambar 3.1 Arsitektur umum sistem 20

Gambar 3.2 Flowchart sistem 21

Gambar 3.3 Diagram use case sistem 24

Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara) 26

Gambar 3.5 Diagram aktifitas sistem (Bantuan) 26

Gambar 3.6 Rancangan halaman awal 27

Gambar 3.7 Rancangan halaman bantuan 28

Gambar 4.1 Halaman awal 31

Gambar 4.2 Halaman bantuan 32

Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan 36 Gambar 4.4 Halaman awal ketika perintah “buka” diucapkan 36 Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan 37

Gambar 4.6 Halaman awal ketika perintah “Word” diucapkan 37

Gambar 4.7 Halaman awal ketika perintah “Excel” diucapkan 38

Gambar 4.8 Halaman awal ketika perintah “Publisher” diucapkan 38

Gambar 4.9 Halaman awal ketika input kata ganti perintah 39

Gambar 4.10 Halaman bantuan 39

Gambar 4.11 Persentase keberhasilan perintah suara denga tingkat

frekuensi lingkungan 0 – 500 Hz 44

Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat

(13)

vi

ABSTRAK

Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk

dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal

baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti

input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan

bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft

Corporation menciptakan Speech Application Programming Interface (SAPI) untuk

membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan

perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk

mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus

sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa

sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai

81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan

untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar

30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit

noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali

input.

Kata kunci : speech recognition, Speech Application Programming Interface (SAPI),

(14)

ABSTRACT

Speech recognition is a study that use human voice as an input for device to

recognize. The research about speech recognition that use voice as an input for an

application is not a new thing. However among that researches there still rarely to see

an application that used Indonesia as an input. Among that researches, Microsoft

Corporation create Speech Application Programming Interface (SAPI) that can use to

develop a speech recognition application. For this research, it will use command in

Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal

by dividing every part of the signal into two parts continuously until each part consist

one point signal. The final result of this research show that the system has succeed

recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise

frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The

accuracy of the system be affected by noise and the quality of the voice input, if the

fewer the noise and with good quality of the voice input, then more and more accurate

the system in recognising the input.

Keyword : speech recognition, Speech Application Programming Interface (SAPI),

(15)

BAB 1

PENDAHULUAN

1.1Latar Belakang

Pada tahun 2005, Martin, Brown, DeHayes, Hoffer dan Perkins mendefinisikan

teknologi informasi merupakan kombinasi teknologi komputer yang terdiri dari

perangkat keras dan lunak untuk mengolah dan menyimpan informasi dengan

teknologi komunikasi untuk melakukan penyaluran informasi. Berdasarkan definisi di

atas, dapat disimpulkan bahwa hubungan antara teknologi komputer dan penyaluran

informasi merupakan hubungan yang saling membutuhkan baik teknologi komputer

sebagai media atau alat dan informasi sebagai data yang diolah, disimpan dan

disalurkan begitu pula sebaliknya.

Perkembangan cara berkomunikasi antara manusia dan komputer telah

mengalami perubahan dari waktu ke waktu. Perubahan tersebut bertujuan agar

komunikasi antara manusia dan komputer menjadi lebih efisien. Salah satu metode

komunikasi yang banyak dikembangkan saat ini adalah pengenalan ucapan atau yang

lebih kita kenal dengan istilah speech recognition. Manusia dalam berinteraksi dengan

sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan

menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara

alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan

layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin,

M.J., 2011).

Teknologi pengenalan ucapan telah banyak diterapkan di berbagai sistem. Hal

tersebut bertujuan agar ke depannya manusia dapat berkomunikasi dengan komputer

selayaknya berkomunikasi dengan sesama manusia. Oleh karena itu, penulis mencoba

(16)

sebagai data. Speech recognition merupakan metode komunikasi yang berfokus pada

suara, sehingga diharapkan penyaluran informasi dapat dilaksanakan dengan lebih

efisien. Selain itu, teknologi pengenalan ucapan masih memiliki banyak potensi untuk

dikembangkan.

Banyak penelitian yang telah dan sedang dilakukan untuk mendapatkan

pengenalan ucapan yang cepat dan akurat. Salah satu yang terkenal adalah penelitian

yang dilakukan oleh Microsoft Corporation yang dikembangkan untuk sistem operasi

Windows. Selain mengembangkan mesin pengenalan ucapan, Microsoft juga

mengembangkan standar untuk pengenalan ucapan yaitu Speech Application

Programming Interface (SAPI).

Pada penelitian ini, penulis mencoba menerapkan metode Fast Fourier

Transform pada tahap ekstraksi ciri untuk mengetahui frekuensi lingkungan sehingga

dapat dibandingkan ketika mengoperasikan perintah – perintah dasar di OS Windows.

Proses yang akan dilalui oleh sistem ini mengadaptasi dasar dari sistem pengenalan

ucapan pada umumnya. Proses tersebut diawali dengan menginput suara

menggunakan microphone. Kemudian dilanjutkan dengan proses ekstraksi ciri, yakni

proses mendapatkan besaran pada bagian sinyal masukan untuk menetapkan pola

pembelajaran atau pola uji.

Untuk tahap pembelajaran atau pola uji penulis juga menggunakan Speech

Application Programming Interface (SAPI) dengan grammar yang telah ditentukan

sendiri oleh penulis. SAPI memungkinkan pengenalan ucapan tanpa mempengaruhi

aplikasi yang ingin dibuat, sehingga SAPI dapat digunakan sebagai fungsi tersendiri

untuk mendukung aplikasi yang akan dibuat.

Sedangkan pada proses eksekusi, dimana ucapan yang dimasukkan telah

dikenali akan dieksekusi dengan perintah event/case yang terdapat pada bahasa

pemrograman visual basic. Event/case merupakan jenis perintah pengganti keyboard

pada pemrograman visual basic. Disini penulis akan mengganti event keyboard di

visual basic agar bisa dieksekusi melalui perintah suara yang telah didefinisikan

terlebih dahulu.

Sistem diharapkan dapat digunakan oleh pengguna yang berbeda setiap kali

percobaannya. Hal tersebut sesuai dengan sifat sistem pengenalan suara, yakni

Speaker Adaptive. Speaker Adaptive merupakan perpaduan dari Speaker Dependent

(17)

3

keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama

bekerja terus menerus selama beberapa waktu tertentu (Adipranata, 2003).

Berdasarkan penelitian terdahulu yang telah dilakukan dan keefektifan yang

dimiliki metode tersebut, penulis terdorong untuk membuat penelitian penerapan

perintah suara berbahasa Indonesia menggunakan aplikasi SAPI. Dipilihnya bahasa

Indonesia sebagai jenis input untuk menjalankan aplikasi ini dikarenakan masih

sedikitnya aplikasi – aplikasi yang mengenali ucapan bahasa Indonesia. Maka dari itu,

penulis ingin mengetahui sejauh apa sistem pengenalan ucapan dapat mengidentifikasi

kata – kata berbahasa Indonesia. Hal ini diharapkan memberikan kemampuan yang

baik pada sistem penerapan perintah suara berbahasa Indonesia untuk mengoperasikan

perintah – perintah dasar pada OS Windows.

1.2Rumusan Masalah

Berdasarkan latar belakang yang telah dipaparkan, dapat dilihat bahwa penelitian di

bidang speech recognition masih memiliki banyak peluang untuk dikembangkan,

terutama implementasi di bahasa – bahasa asing. Oleh karena itu, rumusan masalah

dari penelitian ini adalah bagaimana menerapkan perintah suara berbahasa Indonesia

untuk mengoperasikan perintah – perintah dasar di OS Windows menggunakan

Speech Application Programming Interface (SAPI)

1.3Batasan Masalah

Penelitian ini memiliki banyak cakupan sehingga penulis membatasi permasalahan

pada penelitian ini. Batasan masalah tersebut adalah sebagai berikut :

a. Perintah suara menggunakan bahasa Indonesia,

b. Perintah yang diterapkan berupa Explorer, buka, atas, bawah, kanan, kiri,

kembali, Browser, Word, Point, Excel dan Publisher,

c. Menggunakan Ejaan Yang Disempurnakan (EYD),

d. Pengambilan data suara dari 4 responden. Dimana 2 responden adalah wanita

dan 2 responden adalah pria,

(18)

f. Diterapkan pada Operating System (OS) Windows 7.

1.4Tujuan Penelitian

Tujuan dari penelitian ini adalah memanfaatkan teknologi aplikasi Speech Application

Programming Interface (SAPI) untuk menjalankan perintah dengan pengucapan

berbahasa Indonesia serta menerapkan metode Fast Fourier Transform (FFT) untuk

melihat tingkat frekuensi noise yang mempengaruhi kinerja Speech Application

Programming Interface (SAPI) tersebut.

1.5Manfaat Penelitian

Penulis berharap penelitian ini dapat memberikan manfaat kepada penulis sendiri dan

para pembaca. Adapun manfaat dari penelitian ini adalah sebagai berikut :

a. Meningkatkan efisiensi interaksi manusia dengan komputer ketika akan

mengoperasikan perintah dasar di windows.

b. Mengetahui kinerja Speech Application Programming Interface (SAPI) pada

aplikasi yang menggunakan bahasa Indonesia sebagai inputnya serta metode

Fast Fourier Transform (FFT) pada transformasi sinyal suara.

c. Penelitian dapat menjadi bahan rujukan untuk pengembangan penelitian lebih

lanjut.

1.6Metodologi Penelitian

Adapun metodologi penelitian yang digunakan peneliti yaitu :

1. Studi Literatur

Pada tahap ini peneliti melakukan pengumpulan sumber referensi yang akan

digunakan untuk penelitian. Peneliti membaca dan mempelajari buku-buku,

jurnal, media online dan sumber lainnya yang berhubungan dengan penelitian

pengenalan ucapan (speech recognition) serta metode – metode terkait yang

(19)

5

2. Perancangan Desain Sistem

Pada tahap ini peneliti melakukan perancangan aplikasi, seperti merancang

activity diagram, diagram alur (flowchart) sistem, perancangan desain, dan

perancangan desain antarmuka (interface).

3. Implementasi Sistem

Pada tahap ini dilakukan pengkodean dan implementasi rancangan yang telah

dibuat dengan menggunakan bahasa pemrograman yang telah dipilih.

Pengkodean dilakukan dengan bahasa pemrograman visual basic dengan

menggunakan aplikasi Speech Application Programming Interface (SAPI) dan

metode Fast Fourier Transform (FFT).

4. Pengujian Sistem

Pada tahap ini dilakukan pengujian dan percobaan pada sistem dengan subjek

berbeda yang telah dibuat sesuai dengan kriteria dan kebutuhan yang

diinginkan dan memastikan apakah program berjalan sesuai dengan yang

diinginkan.

5. Dokumentasi Sistem

Pada tahap ini, peneliti mendokumentasikan sistem dalam bentuk laporan

tertulis untuk menunjukkan hasil penelitian yang dilakukan.

1.7Sistematika Penulisan

Adapun penulisan skripsi ini terdiri dari lima bagian utama dengan penjelasan singkat

sebagai berikut :

Bab 1 Pendahuluan

Pada bab ini berisi uraian penjelasan latar belakang terkait judul skripsi yang diajukan,

perumusan masalah pada penelitian, batasan masalah yang ditetapkan, tujuan

penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan dari

(20)

Bab 2 Landasan Teori

Pada bab ini dibahas mengenai teori-teori pendukung yang digunakan pada penelitian

ini, seperti suara, speech recognition, Speech Application Programming Interface

(SAPI), Fast Fourier Transform (FFT) dan penelitian terdahulu.

Bab 3 Analisis dan Perancangan Sistem

Pada bab ini berisi penjelasan analisis mengenai permasalahan dan identifikasi

kebutuhan perancangan sistem.

Bab 4 Implementasi dan Pengujian Sistem

Pada bab ini berisi penjelasan implementasi sistem dari hasil analisis yang dilakukan

serta menguji sistem yang telah dibuat.

Bab 5 Kesimpulan dan Saran

Pada bab ini berisi kesimpulan yang didapat dari penelitian skripsi yang telah

dilakukan dan saran yang dapat digunakan untuk penelitian lebih lanjut mengenai

(21)

BAB 2

LANDASAN TEORI

2.1 Suara

Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat

didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo

tertentu. Suara yang dapat didengar manusia berkisar antara 20 Hz sampai dengan 20

KHz, dimana Hz adalah satuan frekuensi yang artinya banyaknya getaran per-detik

(cps / cycle per second) (Darmawan, Y., 2011).

Speech Processing (pemrosesan lafal/ucapan) adalah metode mengekstrak

informasi yang diinginkan dari sebuah sinyal suara. Untuk memproses sebuah sinyal

dengan sebuah computer digital, sinyal harus dihadirkan dalam bentuk digital

sehingga sinyal tersebut dapat digunakan oleh sebuah computer digital (L. Rabiner et

al. 1993)

2.2 Kata Baku dan Tidak Baku Bahasa Indonesia

Di dalam bahasa Indonesia terdapat dua jenis kata, yakni kata baku dan kata tidak

baku. Kata baku adalah kata yang digunakan sesuai dengan kaidah bahasa Indonesia

yang telah ditentukan. Kamus Besar Bahasa Indonesia (KBBI) merupakan sumber

utama dan menjadi acuan untuk menentukan kata baku bahasa Indonesia. Kata tidak

baku adalah kata yang digunakan tidak sesuai dengan kaidah bahasa Indonesia yang

ditentukan.

2.3 Speech Recognition

Speech recognition merupakan teknik dimana perangkat akan mengenali masukan

berupa suara, setelah itu perangkat melakukan respon yang sesuai dengan masukan

(22)

(pengenalan lafal/ucapan) juga diketahui sebagai suatu proses untuk mengenali

seseorang dengan mengenali ucapan dari orang tersebut (L. Rabiner et al. 1993).

2.3.1 Mode Speech Recognition

Speech recognition memiliki dua mode, yakni mode diktasi dan mode command and

control. Penjelasan kedua mode tersebut adalah sebagai berikut :

a. Mode Diktasi

Mode ini merupakan mode dimana pengguna komputer dapat mengucapkan

kata / kalimat yang selanjutnya akan dikenali oleh komputer dan diubah

menjadi data teks. Pengenalan mode diktasi merupakan speaker dependent.

Keakuratan pengenalan mode ini bergantung pada pola suara dan aksen

pembicara serta pelatihan yang telah dilakukan.

b. Mode Command and Control

Pada mode ini pengguna komputer mengucapkan kata / kalimat yang sudah

terdefinisi terlebih dahulu pada database dan selanjutnya akan digunakan

untuk menjalankan perintah tertentu pada aplikasi komputer. Mode ini

merupakan speaker independent karena jumlah kata yang dikenali biasanya

terbatas sekali dan ada kemungkinan pembicara tidak perlu melakukan

pelatihan pada sistem sebelumnya (Junaedih. 2007)

2.3.2 Proses Speech Recognition

Pada proses speech recognition atau sistem pengenal pembicaraan, terdapat empat

proses utama yang diterapkan baik pada mode diktasi maupun mode command and

control. Keempat proses tersebut adalah pemisahan kata, ketergantungan terhadap

pengguna, pencocokan kata dan pembendaharaan kata.

2.3.2.1. Pemisahan Kata

Pemisahan kata adalah proses untuk memisahkan suara yang diucapkan oleh

pengguna menjadi beberapa bagian (Junaedih. 2007). Pada proses pemisahan kata ini,

(23)

9

a. Discrete Speech

Pada discrete speech, pengguna diharuskan mengucapkan kalimat secara

terpenggal dengan adanya jeda sejenak diantara kata. Jeda tersebut digunakan

oleh sistem untuk mendeteksi awal dan akhir sebuah kata.

b. Word Spotting

Pada word spotting, dalam sebuah kalimat yang diucapkan pengguna, sistem

hanya mendeteksi kata yang terdapat di dalam perbendaharaan yang

dimilikinya, dan mengabaikan kata – kata lain yang tidak dimilikinya.

Sehingga walau pengguna mengucapkan kalimat yang berbeda tetapi di

dalam kalimat tersebut terdapat sebuah kata yang sama dan terdapat di

perbendaharaan sistem, maka hasil pengenalan akan sama.

c. Continuous Speech

Pada metode continuous speech, sistem akan mengenali dan memproses

setiap kata yang diucapkan.

2.3.2.2. Ketergantungan Terhadap Pengguna

Ketergantungan terhadap pengguna merupakan sebuah kondisi yang menjadikan

sistem pengenalan pembicaraan memiliki beberapa sifat. Sifat – sifat tersebut adalah

speaker dependent, speaker independent dan speaker adaptive.

a. Speaker Dependant

Pada speaker dependent, sistem membutuhkan pelatihan untuk setiap

pengguna yang akan menggunakan system tersebut.

b. Speaker Independent

Pada speaker independent, pengguna tidak perlu melakukan pelatihan

sebelum dapat menggunakan sistem, karena sistem mampu mengenali suara

semua pengguna tidak tergantung warna suara dan dialek yang digunakan.

c. Speaker Adaptive

Speaker adaptive merupakan perpaduan dari speaker dependent dan speaker

(24)

keakuratan pengenalan sistem akan makin meningkat jika pengguna yang

sama bekerja terus menerus selama beberapa waktu tertentu (Junaedih. 2007).

2.3.2.3. Pencocokan Kata

Pencocokan kata adalah proses untuk mencocokkan kata ucapan yang berhasil

diidentifikasi dengan basis data yang dipunyai oleh sistem.

2.3.2.4. Pembendaharaan Kata

Perbendaharaan kata ialah bagian terakhir dalam sebuah sistem pengenalan

pembicaraan. Jika perbendaharaan kata berjumlah banyak, maka sebuah sistem akan

mudah dalam melakukan pencocokan kata, tetapi dengan makin meningkatnya jumlah

perbendaharaan kata, maka jumlah kata yang mempunyai ucapan hampir sama juga

meningkat, dimana hal ini menurunkan keakuratan pengenalan.

Dan sebaliknya, jika sebuah sistem mempunyai perbendaharaan kata sedikit,

maka keakuratan pengenalan akan tinggi karena sedikitnya kata yang hampir sama,

tetapi akan semakin banyak kata yang tidak terkenali.

2.4 Speech Application Programming Interface (SAPI)

Speech recognition bukanlah hal baru untuk dunia penelitian teknologi. Penelitian –

penelitian mengenai speech recognition telah banyak dilakukan dan salah satu

diantaranya yang cukup dikenal adalah penelitian yang dilakukan oleh Microsoft

Corporation. Microsoft telah mengembangkan sistem speech recognition yang dapat

digunakan pada sistem operasi Windows. Sistem tersebut memiliki perkembangan

termasuk standard interface SAPI (Speech Application Programming Interface) yang

memungkinkan pembuat aplikasi menerapkan sistem speech recognition

menggunakan engine yang berbeda tanpa merubah aplikasi yang dibuat.

Sekarang banyak aplikasi yang dikembangkan menggunakan speech

recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat

High-performance fighter aircraft, Training air traffic controllers, sampai pada alat

yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan,

maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi

(25)

11

2.4.1 Komponen Speech Application Programming Interface (SAPI)

Selain mengenali ucapan, SAPI juga memiliki fungsi untuk mengenali ucapan dan

mengubahnya menjadi teks. Hal tersebut dapat terjadi karena di dalam SAPI sendiri

terdapat komponen – komponen yang memang memiliki fungsi – fungsi khusus untuk

pengembangan sistem speech recognition, diantaranya :

a. Voice Command

Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan

pengenalan suara.

b. Voice Dictation

Sebuah obyek level tinggi untuk continous dictation speech recognition.

c. Voice Talk

Sebuah obyek level tinggi untuk speech synthesis.

d. Voice Telephony

Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara.

e. Direct Speech Recognition

Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara (direct

control of recognition engine)

f. Direct Text to Speech

Sebuah obyek sebagai mesin yang mengontrol synthesis.

g. Audio Object

Untuk membaca dari audio device atau sebuah file audio.

2.4.2 Antar muka Speech Application Programming Interface (SAPI)

SAPI 5.1 terdiri dari 2 antar muka yaitu application programming interface (API) dan

device driver interface (DDI) (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).

a. Application Programming Interface (API)

Windows Application Programming Interface (API) adalah sekumpulan fungsi

dan konstanta yang terdapat dalam file-file Dynamic Link Library (DLL) yang

(26)

pengenalan pembicaraan, aplikasi akan menerima event pada saat suara yang

diterima telah dikenali oleh engine. Arsitektur SAPI sendiri dapat kita lihat

pada blog diagram seperti yang terlihat pada gambar 2.1 (Supriyono, B.,

2004).

Gambar 2.1 Blok Diagram Arsitektur SAPI

Dalam API terdapat fungsi-fungsi/ perintah-perintah untuk menggantikan bahasa

yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah

dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut

kemudian akan memanggil system calls sesuai dengan sistem operasinya (Sianturi,

A.H., 2014).

b. Device Driver Interface (DDI)

DDI menyediakan fungsi untuk menerima data suara dari SAPI dan

mengembalikan pengenalan frasa pada level SAPI paling dasar. Terdapat dua

antar muka yang digunakan oleh DDI yaitu ISpSREngine, yang

diimplementasikan oleh engine dan ISpSREngineSite yang diimplementasikan

oleh SAPI (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).

2.5 Transformasi Fourier

Transformasi Fourier merupakan suatu persamaan integral untuk menghitung

(27)

13

Angzas, Y., 2005). Sementara untuk menghitung spektrum frekuensi sinyal pada

komputer digital, kita membutuhkan algoritma Discrete Fourier Transform (DFT).

2.5.1 Discrete Fourier Transform (DFT)

DFT adalah suatu persamaan integral alat yang digunakan untuk menganalisa suatu

frekuensi diskrit (Stefanus, Hamz, M. & Angzas, Y., 2005). DFT mengubah sinyal

domain waktu, menjadi sinyal domain frekuensi. DFT dapat diterjemahkan dalam

rumus :

F(k∆f) ≡ ∑

for k = 0, 1, 2, ….., N – 1 (1)

N = jumlah sampel yang diambil

T = total waktu sampling

∆t = pertambahan waktu antar sampel

= frekuensi sampel =

2.5.2 Fast Fourier Transform (FFT)

Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal,

sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan

waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan

memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas,

Y., 2005).

Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut

sebagai desimasi – dalam – waktu (decimation-in-time) dan desimasi-dalam-frekuensi

(decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya

algoritma ini adalah memecah N-titik menjadi dua (N/2) – titik, kemudian memecah

tiap (N/2) – titik menjadi dua (N/4) – titik, begitu seterusnya sampai hanya terdapat 1

titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut (Gunawan,

(28)

Gambar 2.2 Desimasi untuk 16 titik

Sedangkan untuk konsep FFT sendiri secara keseluruhan dapat kita lihat pada

gambar 2.3 berikut (Gunawan, D., Juwono, F.H., 2012).

Gambar 2.3 Konsep FFT

Dikarenakan FFT masih bagian dari perhitungan DFT, maka akan lebih baik

menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, T.,

(29)

15

X(k) = ∑ k = 0, 1, 2…N-1 (2)

Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x (genap) = x(2m), dimana m=0, 1,2,…,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 :

X(k) = ∑ = ∑ + ∑

= ∑ + ∑ (3)

Dimana m = 0, 1, 2,…., N/2-1

Karena :

= cos( ) + j sin( ) (4)

= cos[ ] + j. sin[

= -cos( ) – j.sin( )

= -[cos( ) + j.sin( )]

= - (5)

Maka :

= - (6)

Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut

tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini

merupakan sifat simetri dari faktor. Karena factor bisa juga ditulis sebagai =

, maka :

= - (7)

Dan

( 2 = - = (8)

(30)

X(k) = ∑ (9)

k = 0,1….N/2

X(k + N/2) = - (10)

k = 0, 1, 2…..N/2

Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (9),

(k) memiliki (N/2) * (N/2) = (N/2)2. memiliki N/2 + (N/2)2.

Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2)2 +

N/2=N2/2+N/2. Untuk nilai awal N DFT, dimulai dari N2. Maka pada langkah

pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N2

menjadi N2/2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala.

Berikut adalah proses pengurangan perkalian dari nilai N menjadi N/2.

Lanjutkan pemisahan (m) dan (m) menjadi bagian ganjil dan genap dengan cara

yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian

perhitungan DFT akan berkurang secara terus – menerus. Jadi jika sinyal untuk nilai N

DFT terpisah terus – menerus sampai sinyal akhir menjadi satu titik. Misalkan ada

N=2v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah

v = (N). maka jumlah total perkalian akan dikurangi hingga (N/2) (N). untuk

tambahan perhitungan, angka yang akan dikurangi mencapai N (N). Karena

perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT

dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan

data menjadi ganjil dan genap secara terus – menerus sampai mendekati setengah

perhitungan.

2.6 Penelitian Terdahulu

Pada bagian ini akan dipaparkan mengenai penelitian terdahulu yang berkaitan dengan

(31)
[image:31.595.96.530.115.492.2]

17

Tabel 2.1 Penelitian Terdahulu

No. Peneliti Tahun Judul Penelitian Keterangan

1 Syarif, Daryanto,

et al

2011 Aplikasi Speech

Application Programming

Interface (SAPI) 5.1

Sebagai Perintah untuk

Pengoperasian Aplikasi

Berbasis Windows

Memanfaatkan

SAPI untuk

menjalankan

aplikasi berbasis

windows

2 Nurcahyono,

Kristalina, et al

2011 Pembuatan Speech

Recognition dan Database

Wicara Untuk Konrol

Peralatan Rumah Tangga

Jarak Jauh

Noise, jenis

kelamin dan usia

user

mempengaruhi

hasil akhir aplikasi

3 Yang 2012 The Algorithms of Speech

Recognition,

Programming and

Simulating in MATLAB

Pengujian

algoritma FFT

dalam sistem

speech recognition

menggunakan

(32)

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Bab ini menjelaskan data yang digunakan, flowchart, diagram use case serta tahapan – tahapan dan rancangan antar muka sistem

3.1 Identifikasi Masalah

Keinginan untuk membuat cara berinteraksi yang lebih alami menyebabkan perlunya

dicari alternatif lain sebagai pengganti atau pelengkap piranti yang sudah ada.

Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan

menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia

tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara

manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia

(Syarif, A., Daryanto, T. & Arifin, M.J., 2011).

Interaksi antara manusia dengan komputer yang paling berkembang saat ini

adalah menggunakan suara sebagai input untuk menjalankan aplikasi. Kebanyakan

aplikasi – aplikasi yang menggunakan suara sebagai input digunakan menggunakan

perangkat mobile dan memiliki fungsi tersendiri seperti aplikasi pencari lirik lagu

ataupun yang pencarian kata. Disini penulis ingin menerapkan suara sebagai input

untuk aplikasi yang dapat mengoperasikan windows. Walaupun windows sudah

memiliki Speech Application Programming Interface (SAPI) untuk mengoperasikan

windows menggunakan suara, penulis ingin menerapkan perintah yang bersifat bahasa

Indonesia. Selama ini kebanyakan aplikasi perintah suara bersifat mengenali suara dan

mengenali ucapan yang berbahasa inggris. Untuk penelitian ini, penulis akan

menerapkan bahasa Indonesia sebagai perintah suara untuk menjalankan aplikasi yang

(33)

19

3.2 Data yang Digunakan

[image:33.595.181.453.217.489.2]

Dalam pembangunan sistem ini, data yang akan digunakan berupa suara yang terdiri dari dua orang perempuan dan dua orang laki - laki dengan usia 20 – 60 tahun dengan kata yang berjumlah 12 seperti yang dijabarkan dalam tabel 3.1.

Tabel 3.1 Penjelasan data yang akan digunakan

NO JENIS SUARA KATA

1 Perempuan A

Explorer

Buka

Atas

Bawah

Kanan

Kiri

Kembali

Browser

Word

Point

Excel

Publisher 2 Perempuan B

3 Laki – laki A

4 Laki – laki B

Kata yang akan digunakan sebagai input adalah :

- Explorer : untuk mengaktifkan window explorer

- Buka : untuk membuka folder atau menjalankan file

- Atas : untuk menggerakkan kursor satu langkah ke atas

- Bawah : untuk menggerakkan kursor satu langkah ke bawah

- Kanan : untuk menggerakkan kursor satu langkah ke kanan

- Kiri : untuk menggerakkan kursor satu langkah ke kiri

- Kembali : untuk mengembalikan explorer ke halaman sebelumnya

- Browser : untuk mengaktifkan browser google chrome

- Word : untuk mengaktifkan aplikasi Microsoft office Word

(34)

- Excel : untuk mengaktifkan aplikasi Microsoft office Excel

- Publisher : untuk mengaktifkan aplikasi Microsoft office Publisher

3.3 Analisis Sistem

Analisis sistem bertujuan untuk mengidentifikasi sistem yang akan dikembangkan.

Analisis diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, analisis

yang akan dilakukan berupa arsitektur umum dan flowchart. Arsitektur umum akan

menggambarkan keseluruhan metode yang diterapkan dan flowchart dapat

menggambarkan tahapan – tahapan sistem yang akan dirancang secara terstruktur

sehingga memudahkan pemahaman atas gambaran sistem yang sedang dirancang.

Arsitektur umum mengenai sistem pengenapan perintah suara berbahasa Indonesia

untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.1.

Ekstraksi Ciri Pengenalan Pola (Speech API)

Jalankan perintah pada windows Input suara

Digitalisasi suara

Fast Fourier

[image:34.595.124.513.336.551.2]

Transform Grammar

Gambar 3.1 Arsitektur umum sistem

Adapun penjelasan tahapan dari arsitektur umum sistem adalah sebagai berikut :

1. User berbicara menggunakan mikrofon agar kata yang diucapkan dapat

dijadikan input untuk menjalankan aplikasi

2. Suara tersebut akan diubah menjadi sinyal digital menggunakan SoundCard

yang terdapat di dalam komputer

3. Setelah input telah berbentuk sinyal digital di dalam komputer, tahapan

selanjutnya adalah proses ekstraksi dimana sinyal tersebut akan diubah

(35)

21

4. Pada proses ekstraksi tersebut, algoritma Fast Fourier Transform akan

mengubah sinyal digital ke dalam bentuk spektrogram

5. Setelah proses spektogram, aplikasi akan menggunakan Speech API sebagai

library yang berperan sebagai tempat menetapkan grammar dan pengenal pola

sinyal yang dimasukkan

6. Sebelum sinyal dikenali, grammar ditetapkan terlebih dahulu sebagai

pembanding di tahap pengenalan nantinya

7. Pada tahap pengenalan, engine pada Speech API yang berfungsi sebagai

recognition akan mengenali jenis sinyal dan membandingkannya dengan yang

ada pada grammar

8. Setelah input dikenali, aplikasi akan dibaca sebagai perintah yang akan

digunakan untuk menjalankan perangkat Windows

Bentuk flowchart dari tahapan di atas dapat dilihat pada gambar 3.2

Mulai

Sinyal suara diubah ke dalam bentuk

digital

Pengenalan pola

spektrum suara Grammar

Dikenali Jalankan komando

pada perangkat end Masukkan

sinyal suara

Proses ekstraksi (FFT)

[image:35.595.173.464.379.730.2]

ya tidak

(36)

3.3.1 Proses Ekstraksi

Pada proses ekstraksi, sinyal suara yang sudah dikonversi ke dalam bentuk sinyal

digital akan diubah ke dalam bentuk spektrum suara untuk mendapatkan

karakteristiknya. Pada proses ini digunakan algoritma Fast Fourier Transform untuk

mendapatkan spektrogram sinyal sehingga dapat dijadikan pola untuk dikenali pada

proses pengenalan.

Adapun penjelasan mengenali algoritma Fast Fourier Transform dapat dilihat melalui

pseudocode berikut :

Fast Fourier Transform

For i = 0 To bitsInLength - 1

m, n, k, j : integer

For k = 0 to m -1

alpha : double

alpha = -(2 * Math.PI/n)

j = k

while j < length

even = data(j)

odd = oddmultiplier * data(j+m)

data(j) = even + odd

data (j + m) = even - odd

j += n

End While

Next

(37)

23

3.3.2 Penetapan Grammar

Sebelum spektrogram sinyal suara dikenali, jenis perintah yang akan dikenali akan

ditetapkan terlebih dahulu sebagai grammar. Grammar ini akan dijadikan contoh

untuk dibandingkan pada tahap pengenalan pola.

3.3.3 Pengenalan pola spektrum suara

Pada tahap pengenalan pola spektrum suara, aplikasi akan menggunakan engine

speech API untuk mengenali pola spekrum suara tersebut. Speech API akan

membandingkan suara tersebut dengan grammar yang sudah ditetapkan terlebih

dahulu.

3.3.4 Jalankan perintah pada perangkat

Proses jalankan perintah pada perangkat merupakan tahap akhir atau tahap eksekusi

dari aplikasi ini, spektrogram yang telah dikenali dan disesuaikan dengan grammar

akan menjadi pemicu perintah untuk menjalankan operating system Windows.

3.4 Perancangan Sistem

Pada perancangan sistem akan dilakukan perancangan bagaimana aplikasi akan

memproses sinyal suara serta menjalankannya sebaga perintah untuk mengoperasikan

operating system Windows dan dilakukan juga perancangan tentang antarmuka sistem

yang akan dibangun.

3.4.1 Diagram Use Case

Use case diagram merupakan pemodelan terhadap cara kerja maupun tingkah laku

sistem informasi yang akan dibuat. Use case mendeskripsikan interaksi tipikal antara

user dengan sistem itu sendiri dengan member sebuah narasi tentang bagaimana

sistem tersebut digunakan (Fowler, 2005). Diagram use case sistem untuk aplikasi

penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar pada

(38)

Halaman utama / input suara

Tentang

Bantuan

Jalankan komando pada perangkat

[image:38.595.127.510.78.309.2]

User

Gambar 3.3 diagram use case sistem

3.4.2Spesifikasi Use Case

Use case spesifikasi adalah dekskripsi mengenai use case diagram, menjelaskan

bagaimana sebuah use case itu bekerja (Muchtar, et al. 2011).

Tabel 3.2 Spesifikasi use case untuk input suara

Nama use case Halaman utama / input suara

Aktor Pengguna komputer (user)

Deskripsi Use case ini digunakran oleh user untuk menginput

suara

Pre condition User diasumsikan sudah mengetahui kata apa saja

yang bisa dijadikan input untuk menjalankan sistem

Characteristic of activation Eksekusi dapat dilakukan oleh siapapun

Basic flow - User yang sudah mengetahui kata yang ingin

digunakan menjalankan sistem atau menginput

sendiri kata yang ingin digunakan sebagai input

perintah

- User melakukan input suara

- Sistem mengenali input dan mengeksekusi

[image:38.595.112.523.461.759.2]
(39)

25

- Windows dijalankan berdasarkan perintah yang

diinput

Alternative flow - Perintah tidak dikenali

- User melakukan input suara lagi

Post condition User dapat memasukkan input suara berupa kata

dan melihat daftar kata yang dapat digunakan

sebagai perintah untuk menjalankan windows

Limitations User hanya dapat menginput kata tertentu sesuai

[image:39.595.111.522.80.275.2]

dengan yang tertera pada halaman utama

Tabel 3.3 Spesifikasi use case untuk bantuan

Nama use case Bantuan

Aktor Pengguna komputer (user)

Deskripsi Use case ini digunakan oleh user untuk melihat

petunjuk penggunaan aplikasi

Pre condition Setiap pengunjung bisa mengakses modul ini

Characteristic of activation Eksekusi dapat dilakukan oleh siapa pun

Basic flow User mengklik tombol bantuan untuk melihat

petunjuk penggunaan aplikasi

Alternative flow

-Post condition User dapat melihat petunjuk penggunaan aplikasi

Limitations -

3.4.3Diagram Aktifitas

Activity diagram sistem menggambarkan urutan aktivitas dalam sistem yang sedang

dirancang. Aktivitas yang digambarkan hanya secara umum, tidak secara eksak seperti

pembuatan flowchart yang terstruktur. Diagram aktivasi menjelaskan tentang kegiatan

apa yang dapat dilakukan pada sistem tetapi tidak menjelaskan apa yang telah

dilakukan oleh aktor (Fowler, 2005).

Pada gambar 3.4, setelah user melihat daftar perintah user dapat memilih untuk

(40)

dalam daftar. Sistem akan merekam suara tersebut dan melakukan proses ekstraksi ciri

dan dilanjutkan dengan proses pengenalan pola sehingga eksekusi berupa

pengoperasian windows sesuai inputan suara dapat dijalankan.

Input suara

Jalankan perintah untuk perangkat

Ekstraksi ciri

Pengenalan pola

[image:40.595.203.431.157.401.2]

User Sistem

Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara)

Pada gambar 3.5, sistem memberikan informasi mengenai petunjuk penggunaan

aplikasi yang disebut bantuan. Hal ini bertujuan untuk memberikan kemudahan bagi

user yang kurang terbiasa dengan aplikasi speech recognition atau pengguna pertama

kali.

User Sistem

Lihat bantuan Menampilkan petunjuk penggunaan aplikasi

[image:40.595.197.430.523.720.2]
(41)

27

3.4.4 Perancangan Antar Muka

Perancangan antar muka merupakan gambaran umum tentang perancangan setiap

tampilan yang terdapat dalam sistem yang akan dibangun. Berikut akan dijelaskan

rancangan bagian-bagian dari sistem.

a. Rancangan halaman awal

Pada halaman awal nama aplikasi terletak paling atas, dengan logo

universitas di bagian kiri, keterangan perintah yang tersedia di kanan serta

progress bar untuk menandakan suara terdeteksi tepat di sebelah kiri

[image:41.595.173.511.310.579.2]

keterangan perintah seperti yang tertera pada gambar 3.6.

Gambar 3.6 Rancangan halaman awal

b. Rancangan halaman bantuan

Pada rancangan halaman bantuan, nama aplikasi dan logo tidak berubah.

Namun, pada bawah nama aplikasi tersedia tiga bagian untuk penjelasan

mengenai penggunaan aplikasi. Kemudian di bawah bagian keterangan

penggunaan aplikasi tersebut terdapat satu tombol kembali untuk

(42)
[image:42.595.165.502.81.328.2]
(43)

BAB 4

IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini, pengimplementasian dan pengujian sistem akan dibahas sesuai dengan

analisis dan perancangan yang telah dibahas pada bab tiga. Tahapan ini bertujuan

untuk menampilkan hasil tampilan akhir sistem yang dibangun dan proses pengujian

sistem untuk melihat tingkat keberhasilan sistem dalam mengenali perintah berbahasa

Indonesia.

4.1 Implementasi Sistem

Berdasarkan analisis dan perancangan yang dibuat, sistem akan diimplementasikan

menggunakan bahasa pemrograman visual basic dan aplikasi SAPI 5.1. Kebutuhan

dalam pembangunan sistem ini meliputi perangkat keras dan lunak.

4.1.1 Perangkat keras

Spesifikasi perangkat keras yang digunakan untuk implementasi sistem adalah sebagai

berikut :

- Processor, Intel® Core™ i3-3217U CPU @ 1.80 GHz

- RAM , 4 GB

- Harddisk, 500 GB

(44)

4.1.2 Perangkat lunak

Spesifikasi perangkat lunak yang digunakan untuk implementasi sistem adalah

sebagai berikut :

- Windows 7 Pro 64-bit

- Speech Application Programming Interface (SAPI) 5.1

- Microsoft Visual Studio 2012

- CorelDraw 12

4.1.3 Implementasi perancangan antar muka

Adapun implementasi perancangan antarmuka yang telah dilakukan sebelumnya pada

sistem adalah:

1. Halaman Awal

Halaman awal merupakan halaman pertama yang muncul apabila aplikasi

dijalankan. Pada halaman ini terdapat keterangan perintah yang dapat

digunakan, progress bar, dua text box serta tombol bantuan dan tombol

tentang. Progress bar berfungsi untuk mendeteksi suara yang masuk sehingga

user dapat melihat apakah suaranya cukup keras atau tidak untuk menjalankan

aplikasi. Dua text box yang terdapat pada halaman awal ini berfungsi untuk

mendeskripsikan perintah yang diucapkan dan juga untuk mengetahui tingkat

frekuensi suara baik suara input ataupun suara keadaan sekitar (noise).

Sedangkan tombol bantuan dan tombol tentang berfungsi untuk membuka

halaman bantuan dan tentang. Untuk input kata – kata pengganti perintah dapat

diketik pada textbox yang tersedia dan disesuaikan dengan ketersediaan

combobox. Untuk keterangan perintah yang dapat digunakan dapat langsung

dilihat pada halaman awal aplikasi penerapan perintah suara berbahasa

Indonesia untuk mengoperasikan perintah dasar pada windows seperti yang

(45)
[image:45.595.183.486.83.371.2]

31

Gambar 4.1 Halaman Awal

2. Halaman Bantuan

Pada halaman bantuan, terdapat tiga jenis penjelasan. Penjelasan pertama

adalah deskripsi perintah yang dapat digunakan serta fungsi – fungsinya.

Penjelasan yang kedua merupakan penjelasan mengenai cara penggunaan

aplikasi.Sedangkan penjelasan yang ketiga adalah penjelasan mengenai

penggunaan control panel / penetapan perintah sendiri. Halaman bantuan juga

memiliki tombol kembali yang berfungsi mengembalikan aplikasi ke halaman

awal. Halaman bantuan penerapan perintah suara berbahasa Indonesia untuk

(46)
[image:46.595.145.537.83.334.2]

Gambar 4.2 Halaman Bantuan

4.2 Pengujian Sistem

Pengujian sistem dilakukan untuk mengantisipasi kemungkinan terjadinya eror pada

komponen ataupun pada interface dari program. Hal ini dilakukan dengan menguji

apakah sistem tersebut telah memenuhi functional requirement dan non-functional

requirement (Sommerville, 2004).

Metode pengujian yang digunakan adalah metode pengujian black box.

Pengujian black box merupakan pengujian yang dilakukan pada interface sistem yang

digunakan untuk mendemonstrasikan fungsi sistem yang dioperasikan (Gea, 2011).

4.2.1 Kasus dan Hasil Pengujian Sistem

Adapun kasus dan hasil pengujian sistem menggunakan teknik black box adalah

sebagai berikut :

a. Halaman Awal

(47)
[image:47.595.137.533.86.779.2]

33

Tabel 4.1 Hasil pengujian halaman awal

No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian

1 Mengklik tombol “Bantuan” Aplikasi menampilkan halaman

bantuan Berhasil

2 Mengklik tombol “Tentang” Aplikasi menampilkan halaman

tentang Berhasil

3 Mengklik tombol “Tetapkan”

Aplikasi menampilkan message box berisi kata yang diinput dalam text box

Berhasil

4

Masukkan input suara “Explorer” menggunakan EYD

Aplikasi menampilkan windows

explorer Berhasil

Masukkan input suara “Explorer” tidak

menggunakan EYD

Aplikasi tidak menampilkan

windows explorer Berhasil

5

Masukkan input suara “Buka” menggunakan EYD

Aplikasi akan membuka folder / file yang terpilih pada windows explorer

Berhasil

Masukkan input suara “Buka” tidak

menggunakan EYD

Aplikasi tidak akan membuka folder / file yang terpilih pada windows explorer

Tidak Berhasil

6

Masukkan input suara “Atas” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke atas pada

windows explorer

Berhasil

Masukkan input suara “Atas” tidak menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke atas pada windows explorer

Berhasil

7

Masukkan input suara “Bawah” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke bawah pada windows explorer

Berhasil

Masukkan input suara “Bawah” tidak

menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke bawah pada windows explorer

Berhasil

8

Masukkan input suara “Kanan” menggunakan

Aplikasi akan menggeser pointer satu langkah ke kanan pada windows explorer

(48)

EYD

Masukkan input suara “Kanan” tidak

menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke kanan pada windows explorer

Berhasil

9

Masukkan input suara “Kiri” menggunakan EYD

Aplikasi akan menggeser pointer satu langkah ke kiri pada

windows explorer

Berhasil

Masukkan input suara “Kiri” tidak menggunakan EYD

Aplikasi tidak akan menggeser pointer satu langkah ke kiri pada windows explorer

Berhasil

10

Masukkan input suara “Kembali” menggunakan EYD

Aplikasi akan mengembalikan ke direktori sebelumnya pada windows explorer

Berhasil

Masukkan input suara “Kembali” tidak

menggunakan EYD

Aplikasi tidak akan

mengembalikan ke direktori sebelumnya pada windows explorer

Berhasil

11

Masukkan input suara “Browser” menggunakan EYD

Aplikasi menampilkan browser

Google Chrome Berhasil

Masukkan input suara “Browser” tidak

menggunakan EYD

Aplikasi tidak menampilkan

browser Google Chrome Berhasil

12

Masukkan input suara “Word” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Word Berhasil

Masukkan input suara “Word” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Word Berhasil

13

Masukkan input suara “Point” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Power Point Berhasil

Masukkan input suara “Point” tidak

menggunakan

Aplikasi tidak menampilkan

(49)

35

EYD

14

Masukkan input suara “Excel” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Excel Berhasil

Masukkan input suara “Excel” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Excel Berhasil

15

Masukkan input suara “Publisher” menggunakan EYD

Aplikasi menampilkan Microsoft

Office Publisher Berhasil

Masukkan input suara “Publisher” tidak

menggunakan EYD

Aplikasi tidak menampilkan

Microsoft Office Publisher Berhasil

[image:49.595.138.533.83.351.2]

b. Halaman Bantuan

[image:49.595.134.531.469.588.2]

Tabel 4.2 akan menjelaskan skenario pengujian sistem pada halaman bantuan

Tabel 4.2 Hasil pengujian halaman bantuan

No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian

1 Mengklik tombol “kembali”

Aplikasi akan menutup halaman

bantuan dan kembali ke halaman

awal

Berhasil

4.2.2 Pengujian kinerja sistem

Pada pengujian kinerja sistem akan dijelaskan hasil perancangan sistem yang dibuat.

Hasil dari tiap halaman sistem adalah sebagai berikut :

a. Halaman awal

Gambar 4.3 dan gambar 4.4 menampilkan halaman awal dari aplikasi. Apabila

(50)

mengklik apapun. Begitu pula apabila user mengatakan kata “atas”, “buka”

dan perintah lain yang berfungsi menggeser pointer, maka pointer akan

[image:50.595.112.528.167.403.2]

bergerak tanpa kita menggunakan mouse.

Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan

[image:50.595.110.528.447.685.2]
(51)

37

Sedangkan untuk perintah memanggil aplikasi seperti browser, word, excel

dan publisher juga dapat dilakukan sama seperti windows explorer seperti yang

[image:51.595.110.524.168.400.2]

terlihat pada gambar 4.5 sampai gambar 4.8

Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan

[image:51.595.108.527.449.685.2]
(52)
[image:52.595.111.525.85.317.2]

Gambar 4.7 Halaman awal ketika perintah “excel” diucapkan

Gambar 4.8 Halaman awal ketika perintah “publisher” diucapkan

Pada gambar 4.9 adalah halaman ketika user menggunakan fasilitas control

panel / tetapkan perintah untuk memasukkan kata – kata yang user inginkan untuk

[image:52.595.111.528.368.601.2]
(53)
[image:53.595.109.527.84.317.2]

39

Gambar 4.9 Halaman awal ketika input kata ganti perintah

b. Halaman bantuan

Gambar 4.10 menunjukkan halaman bantuan dari aplikasi ini. Apabila user

mengklik tombol kembali maka halaman tersebut akan tertutup dan kembali

[image:53.595.109.527.469.703.2]

pada halaman awal

(54)

4.3 Hasil Pengujian Suara

Disini penulis akan memaparkan hasil pengujian suara dari dua orang perempuan dan

dua orang laki – laki sebanyak lima kali per perintah dengan tingkat sensitifitas

microphone dan keadaan frekuensi noise yang berbeda. Berikut penjelasan pengujian

dari tiap kondisi.

4.3.1 Hasil pengujian suara dengan tingkat frekuensi noise0 – 500 Hz

Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi

[image:54.595.120.514.316.770.2]

berada pada 0 – 500 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.4

Tabel 4.4 Pengujian suara dengan tingkat frekuensi noise 0 – 500 Hz

Subjek Kata yang diuji

Pengujian (Berhasil / Gagal /

Jumlah)

Tingkat frekuensi lingkungan

(noise)

Tingkat keberhasilan

B G J

Perempuan A

Explorer 5 0 5

0 – 500 Hz

100 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 5 0 5 100 %

Word 5 0 5 100 %

Point 3 2 5 60 %

Excel 5 0 5 100 %

Publisher 5 0 5 100 %

Perempuan B

Explorer 5 0 5

0 – 500 Hz

100 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 0 5 5 0 %

Kembali 5 0 5 100 %

Browser 2 3 5 40 %

Word 0 5 5 0 %

Point 0 5 5 0 %

Excel 4 1 5 80 %

Publisher 3 2 5 60 %

Laki – Laki A

Explorer 4 1 5

0 – 500 Hz

80 %

Buka 5 0 5 100 %

(55)

41

Bawah 5 0 5 100 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 4 1 5 80 %

Word 5 0 5 100 %

Point 4 1 5 80 %

Excel 5 0 5 100 %

Publisher 4 1 5 80 %

Laki – Laki B

Explorer 4 1 5

0 – 500 Hz

80 %

Buka 5 0 5 100 %

Atas 5 0 5 100 %

Bawah 2 3 5 40 %

Kanan 5 0 5 100 %

Kiri 5 0 5 100 %

Kembali 5 0 5 100 %

Browser 5 0 5 100 %

Word 5 0 5 100 %

Point 1 4 5 20 %

Excel 5 0 5 100 %

Publisher 5 0 5 100 %

Dari tabel 4.4 dapat diketahui persentase keberhasilan aplikasi pada

lingkungan dengan tingkat frekuensi (noise) 0 – 500 Hz adalah sebagai berikut :

Perempuan A = 96,6 %

Perempuan B = 65 %

Laki – laki A = 83 %

Laki – laki B = 80 %

Dengan tingkat keberhasilan per perintah sebagai berikut :

- Explorer = 90 %

- Buka = 100 %

- Atas = 90 %

- Bawah = 85 %

- Kanan = 100 %

- Kiri = 75 %

- Kembali = 100 %

- Browser = 80 %

- Word = 75 %

- Point = 40 %

- Excel = 95 %

(56)

4.3.2 Hasil pengujian suara dengan tingkat frekuensi (noise) 501 – 1000 Hz

Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 501 – 1000 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.5

Tabel 4.5 Pengujian suara dengan tingkat frekuensi noise 501 – 1000 Hz

Subjek Kata yang diuji

Pengujian (Berhasil / Gagal /

Jumlah)

Tingkat frekuensi lingkungan

Gambar

Gambar 2.1 Blok Diagram Arsitektur SAPI
Gambar 2.2 Desimasi untuk 16 titik
Tabel 2.1 Penelitian Terdahulu
Tabel 3.1 Penjelasan data yang akan digunakan
+7

Referensi

Dokumen terkait

Puji dan syukur penulis panjatkan kehadirat Tuhan yang maha Esa atas segala berkat, anugerah dan penyertaanNya sehingga penulis dapat menyelesaikan penelitian dan penulisan

Utilisez la commande show vlan brief pour vérifier la configuration du réseau local virtuel et l’affectation de port sur chaque commutateur. Comparez votre résultat avec

dan Pengawasan Dalam' Organisasi' Usaha Penangkapan - Ikan Dengan Purse Seine Di Tulungagung.. 9 , Hasil Perhitungan Lampiran

Pada kawasan permukiman perkotaan tersebut pada umumnya berkembang kegiatan berupa non pertanian dan merupakan wilayah pusat kabupaten sehingga kawasan perkotaan ini juga

45 Total Aset Gross, Pembiayaan, Dana Pihak Ketiga, FDR dan NPF Bank Pembiayaan Rakyat Syariah berdasarkan Propinsi (Total of Gross Assets, Financing, Depositor Funds,

Penelitian ini merupakan penelitian lapangan ( field research ), dengan pengumpulan data yang dilakukan menggunakan metode catatan pengamatan, wawancara dan

Perkebunan Nusantara V dengan menggunakan rasio keuangan likuiditas, solvabilitas dan profitabilitas selama periode 2012-2014 dan kemudian ditarik kesimpulannya untuk

DESKRIPSI UNIT : Unit kompetensi ini menjelaskan keterampilan, pengetahuan, dan Sikap kerja yang diperlukan untuk bekerja secara etis dan memberikan pandangan yang