Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

(1)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

▸ Baca selengkapnya: perintah g01 adalah perintah yang berarti

(2)

PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

RAISHA ARIANI SIRAIT 091402014

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(3)

iii

PERSETUJUAN

Judul : Penerapan Perintah Suara Berbahasa Indonesia

untuk Mengoperasikan Perintah Dasar di

Windows

Kategori : SKRIPSI

Nama : RAISHA ARIANI SIRAIT

Nomor Induk Mahasiswa : 091402014

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI

Departemen : TEKNOLOGI INFORMASI

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI (FASILKOM-TI) UNIVERSITAS

SUMATERA UTARA

Diluluskan di

Medan, 25 Juni 2015

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1 004

M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010

Diketahui/Disetujui oleh

Program Studi S1 Teknologi Informasi

Ketua,

(4)

PERNYATAAN

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, 25 Juni 2015

Raisha Ariani Sirait

(5)

v

PENGHARGAAN

Alhamdulillah, segala puji dan syukur penulis panjatkan atas kehadirat Allah SWT beserta Nabi besar Muhammad SAW yang telah memberikan rahmat, hidayah-Nya, segala daya dan upaya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat utnuk memperoleh gelar Sarjana Program Studi S-1 Teknologi Informasi Universitas Sumatera Utara, Ucara terima kasih yang sebesar-besarnya penulis sampaikan kepada:

1. Kedua orang tua penulis, orang yang paling berharga dalam hidup penulis, ayahanda Mamora Sirait dan ibunda Anggreini Hasibuan yang telah membesarkan, mendidik, memberi dukungan, doa dan motivasi tanpa henti. Serta kepada Abang penulis Radinal Moechtar Sirait yang selalu ada dan menemani penulis.

2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak Muhammad Anggia Muchtar, ST., MM. IT. dan Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.

3. Bapak M. Anggia Muchtar, S.T, MMIT selaku pembimbing pertama dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku pembimbing kedua, yang telah banyak meluangkan waktunya dan memberikan masukan-masukan yang bermanfaat bagi penulis dalam menyelesaikan skripsi ini.

4. Bapak Sajaddin Sembiring, S.Si, M.Comp.Sc dan Dani Gunawan, ST, MT yang telah bersedia menjadi dosen pembanding dan Bapak Ainul Hizriadi, S.Kom, M. Kom yang telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini.

5. Kepada Ade, Yogi, Ibnu, Ammar, Reza, Ridzuan, Fadli Rizky, Icha, Yanna, Dijah, Julia, Fanny, Hani, M. Ardiansyah, Fadli Rachman, Dezi, Kurniawan, Fadil, Lydia, Amira, Jihan, Musyafa dan Andre yang selalu mendukung, membantu dan memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini. Serta teman-teman yang mendukung dan membantu penulis Febrina Panjaitan, Ifitriana dan Mifthah Huljannah dan seluruh teman-teman lainnya yang tidak dapat disebutkan satu persatu.

6. Kepada Ibu Mega, Abang Manaf dan Kak Umi yang selaku bagian tata usaha Program Studi S1 Teknologi Informasi yang telah membimbing dan membantu penulis dari awal proposal sampai sidang.

(6)

ABSTRAK

Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk

dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal

baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti

input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan

bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft

Corporation menciptakan Speech Application Programming Interface (SAPI) untuk

membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan

perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk

mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus

sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa

sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai

81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan

untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar

30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit

noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali

input.

Kata kunci : speech recognition, Speech Application Programming Interface (SAPI),

(7)

vii

ABSTRACT

Speech recognition is a study that use human voice as an input for device to

recognize. The research about speech recognition that use voice as an input for an

application is not a new thing. However among that researches there still rarely to see

an application that used Indonesia as an input. Among that researches, Microsoft

Corporation create Speech Application Programming Interface (SAPI) that can use to

develop a speech recognition application. For this research, it will use command in

Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal

by dividing every part of the signal into two parts continuously until each part consist

one point signal. The final result of this research show that the system has succeed

recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise

frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The

accuracy of the system be affected by noise and the quality of the voice input, if the

fewer the noise and with good quality of the voice input, then more and more accurate

the system in recognising the input.

Keyword : speech recognition, Speech Application Programming Interface (SAPI),

(8)

DAFTAR ISI

Hal

PERSETUJUAN i

PERNYATAAN ii

PENGHARGAAN iii

ABSTRAK vi

ABSTRACT vii

DAFTAR ISI viii

DAFTAR TABEL xi

DAFTAR GAMBAR xii

BAB 1 PENDAHULUAN 1

1.1Latar Belakang 1

1.2Rumusan Masalah 3

1.3Batasan Masalah 3

1.4Tujuan Penelitian 4

1.5Manfaat Penelitian 4

1.6Metodologi Penelitian 4

1.7Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 7

2.1Suara 7

2.2Kata Baku & Tidak Baku 7

2.3Speech Recognition 7

2.3.1 Mode Speech Recognition 8

2.3.2 Proses Speech Recognition 8

2.3.2.1 Pemisahan kata 8

2.3.2.2 Ketergantungan terhadap pengguna 9

2.3.2.3 Pencocokan kata 10

2.3.2.4 Pembendaharaan kata 10

(9)

ix

2.4.1 Komponen Speech Application Programming Interface

(SAPI)

11

2.4.2 Antar muka Speech Application Programming

Interface (SAPI)

11

2.5Transformasi Fourier 12

2.5.1 Discrete Fourier Transform (DFT) 13

2.5.2 Fast Fourier Transform (FFT) 13

2.6Penelitian Terdahulu 16

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18

3.1Identifikasi Masalah 18

3.2Data yang Digunakan 19

3.3Analisis Sistem 20

3.3.1Proses ekstraksi 22

3.3.2Penetapan grammar 23

3.3.3Pengenalan pola spektrum suara 23

3.3.4Jalankan perintah pada perangkat 23

3.4 Perancangan Sistem 23

3.4.1 Diagram use case 23

3.4.2 Spesifikasi use case 24

3.4.3 Diagram aktifitas 25

3.4.4 Perancangan antar muka 27

BAB 4 IMPLEMENTASI DAN PENGUJIAN 29

4.1Implementasi Sistem 29

4.1.1Perangkat keras 29

4.1.2Perangkat lunak 30

4.1.3Implementasi perancangan antar muka 30

4.2Pengujian Sistem 32

4.2.1Kasus dan hasil pengujian sistem 34

4.2.2Pengujian kinerja sistem 35

4.3Hasil Pengujian Suara 40

4.3.1 Hasil pengujian suara dengan tingkat frekuensi

lingkungan 0 – 500 Hz

(10)

4.3.2 Hasil pengujian suara dengan tingkat frekuensi

lingkungan 501 – 1000 Hz

42

BAB 5 KESIMPULAN DAN SARAN 45

5.1Kesimpulan 45

5.2Saran 46

(11)

xi

DAFTAR TABEL

Hal

Tabel 2.1 Penelitin terdahulu 17

Tabel 3.1 Penjelasan data yang akan digunakan 19

Tabel 3.2 Spesifikasi use case untuk input suara 24

Tabel 3.3 Spesifikasi use case untuk bantuan 25

Tabel 4.1 Hasil pengujian halaman awal 33

Tabel 4.2 Hasil pengujian halaman tentang 35

Tabel 4.3 Hasil pengujian halaman bantuan 39

Tabel 4.4 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0

– 500 Hz 40

Tabel 4.5 Hasil pengujian suara dengan tingkat frekuensi lingkungan

(12)

DAFTAR GAMBAR

Hal

Gambar 2.1 Blok Diagram Arsitektur SAPI 12

Gambar 2.2 Desimasi untuk 16 titik 14

Gambar 2.3 Konsep FFT 14

Gambar 3.1 Arsitektur umum sistem 20

Gambar 3.2 Flowchart sistem 21

Gambar 3.3 Diagram use case sistem 24

Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara) 26

Gambar 3.5 Diagram aktifitas sistem (Bantuan) 26

Gambar 3.6 Rancangan halaman awal 27

Gambar 3.7 Rancangan halaman bantuan 28

Gambar 4.1 Halaman awal 31

Gambar 4.2 Halaman bantuan 32

Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan 36 Gambar 4.4 Halaman awal ketika perintah “buka” diucapkan 36 Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan 37

Gambar 4.6 Halaman awal ketika perintah “Word” diucapkan 37

Gambar 4.7 Halaman awal ketika perintah “Excel” diucapkan 38

Gambar 4.8 Halaman awal ketika perintah “Publisher” diucapkan 38

Gambar 4.9 Halaman awal ketika input kata ganti perintah 39

Gambar 4.10 Halaman bantuan 39

Gambar 4.11 Persentase keberhasilan perintah suara denga tingkat

frekuensi lingkungan 0 – 500 Hz 44

Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat

(13)

vi