PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS
SKRIPSI
RAISHA ARIANI SIRAIT 091402014
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
▸ Baca selengkapnya: perintah g01 adalah perintah yang berarti
(2)PENERAPAN PERINTAH SUARA BERBAHASA INDONESIA UNTUK MENGOPERASIKAN PERINTAH DASAR DI WINDOWS
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
RAISHA ARIANI SIRAIT 091402014
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
iii
PERSETUJUAN
Judul : Penerapan Perintah Suara Berbahasa Indonesia
untuk Mengoperasikan Perintah Dasar di
Windows
Kategori : SKRIPSI
Nama : RAISHA ARIANI SIRAIT
Nomor Induk Mahasiswa : 091402014
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI (FASILKOM-TI) UNIVERSITAS
SUMATERA UTARA
Diluluskan di
Medan, 25 Juni 2015
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1 004
M. Anggia Muchtar, ST., MM.IT. NIP 19800110 200801 1 010
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi
Ketua,
PERNYATAAN
Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 25 Juni 2015
Raisha Ariani Sirait
v
PENGHARGAAN
Alhamdulillah, segala puji dan syukur penulis panjatkan atas kehadirat Allah SWT beserta Nabi besar Muhammad SAW yang telah memberikan rahmat, hidayah-Nya, segala daya dan upaya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat utnuk memperoleh gelar Sarjana Program Studi S-1 Teknologi Informasi Universitas Sumatera Utara, Ucara terima kasih yang sebesar-besarnya penulis sampaikan kepada:
1. Kedua orang tua penulis, orang yang paling berharga dalam hidup penulis, ayahanda Mamora Sirait dan ibunda Anggreini Hasibuan yang telah membesarkan, mendidik, memberi dukungan, doa dan motivasi tanpa henti. Serta kepada Abang penulis Radinal Moechtar Sirait yang selalu ada dan menemani penulis.
2. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak Muhammad Anggia Muchtar, ST., MM. IT. dan Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.
3. Bapak M. Anggia Muchtar, S.T, MMIT selaku pembimbing pertama dan Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc selaku pembimbing kedua, yang telah banyak meluangkan waktunya dan memberikan masukan-masukan yang bermanfaat bagi penulis dalam menyelesaikan skripsi ini.
4. Bapak Sajaddin Sembiring, S.Si, M.Comp.Sc dan Dani Gunawan, ST, MT yang telah bersedia menjadi dosen pembanding dan Bapak Ainul Hizriadi, S.Kom, M. Kom yang telah memberikan saran-saran yang baik bagi penulis dalam menyelesaikan skripsi ini.
5. Kepada Ade, Yogi, Ibnu, Ammar, Reza, Ridzuan, Fadli Rizky, Icha, Yanna, Dijah, Julia, Fanny, Hani, M. Ardiansyah, Fadli Rachman, Dezi, Kurniawan, Fadil, Lydia, Amira, Jihan, Musyafa dan Andre yang selalu mendukung, membantu dan memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini. Serta teman-teman yang mendukung dan membantu penulis Febrina Panjaitan, Ifitriana dan Mifthah Huljannah dan seluruh teman-teman lainnya yang tidak dapat disebutkan satu persatu.
6. Kepada Ibu Mega, Abang Manaf dan Kak Umi yang selaku bagian tata usaha Program Studi S1 Teknologi Informasi yang telah membimbing dan membantu penulis dari awal proposal sampai sidang.
ABSTRAK
Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk
dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal
baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti
input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan
bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft
Corporation menciptakan Speech Application Programming Interface (SAPI) untuk
membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan
perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk
mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus
sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa
sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai
81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan
untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar
30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit
noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali
input.
Kata kunci : speech recognition, Speech Application Programming Interface (SAPI),
vii
ABSTRACT
Speech recognition is a study that use human voice as an input for device to
recognize. The research about speech recognition that use voice as an input for an
application is not a new thing. However among that researches there still rarely to see
an application that used Indonesia as an input. Among that researches, Microsoft
Corporation create Speech Application Programming Interface (SAPI) that can use to
develop a speech recognition application. For this research, it will use command in
Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal
by dividing every part of the signal into two parts continuously until each part consist
one point signal. The final result of this research show that the system has succeed
recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise
frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The
accuracy of the system be affected by noise and the quality of the voice input, if the
fewer the noise and with good quality of the voice input, then more and more accurate
the system in recognising the input.
Keyword : speech recognition, Speech Application Programming Interface (SAPI),
DAFTAR ISI
Hal
PERSETUJUAN i
PERNYATAAN ii
PENGHARGAAN iii
ABSTRAK vi
ABSTRACT vii
DAFTAR ISI viii
DAFTAR TABEL xi
DAFTAR GAMBAR xii
BAB 1 PENDAHULUAN 1
1.1Latar Belakang 1
1.2Rumusan Masalah 3
1.3Batasan Masalah 3
1.4Tujuan Penelitian 4
1.5Manfaat Penelitian 4
1.6Metodologi Penelitian 4
1.7Sistematika Penulisan 5
BAB 2 LANDASAN TEORI 7
2.1Suara 7
2.2Kata Baku & Tidak Baku 7
2.3Speech Recognition 7
2.3.1 Mode Speech Recognition 8
2.3.2 Proses Speech Recognition 8
2.3.2.1 Pemisahan kata 8
2.3.2.2 Ketergantungan terhadap pengguna 9
2.3.2.3 Pencocokan kata 10
2.3.2.4 Pembendaharaan kata 10
ix
2.4.1 Komponen Speech Application Programming Interface
(SAPI)
11
2.4.2 Antar muka Speech Application Programming
Interface (SAPI)
11
2.5Transformasi Fourier 12
2.5.1 Discrete Fourier Transform (DFT) 13
2.5.2 Fast Fourier Transform (FFT) 13
2.6Penelitian Terdahulu 16
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18
3.1Identifikasi Masalah 18
3.2Data yang Digunakan 19
3.3Analisis Sistem 20
3.3.1Proses ekstraksi 22
3.3.2Penetapan grammar 23
3.3.3Pengenalan pola spektrum suara 23
3.3.4Jalankan perintah pada perangkat 23
3.4 Perancangan Sistem 23
3.4.1 Diagram use case 23
3.4.2 Spesifikasi use case 24
3.4.3 Diagram aktifitas 25
3.4.4 Perancangan antar muka 27
BAB 4 IMPLEMENTASI DAN PENGUJIAN 29
4.1Implementasi Sistem 29
4.1.1Perangkat keras 29
4.1.2Perangkat lunak 30
4.1.3Implementasi perancangan antar muka 30
4.2Pengujian Sistem 32
4.2.1Kasus dan hasil pengujian sistem 34
4.2.2Pengujian kinerja sistem 35
4.3Hasil Pengujian Suara 40
4.3.1 Hasil pengujian suara dengan tingkat frekuensi
lingkungan 0 – 500 Hz
4.3.2 Hasil pengujian suara dengan tingkat frekuensi
lingkungan 501 – 1000 Hz
42
BAB 5 KESIMPULAN DAN SARAN 45
5.1Kesimpulan 45
5.2Saran 46
xi
DAFTAR TABEL
Hal
Tabel 2.1 Penelitin terdahulu 17
Tabel 3.1 Penjelasan data yang akan digunakan 19
Tabel 3.2 Spesifikasi use case untuk input suara 24
Tabel 3.3 Spesifikasi use case untuk bantuan 25
Tabel 4.1 Hasil pengujian halaman awal 33
Tabel 4.2 Hasil pengujian halaman tentang 35
Tabel 4.3 Hasil pengujian halaman bantuan 39
Tabel 4.4 Hasil pengujian suara dengan tingkat frekuensi lingkungan 0
– 500 Hz 40
Tabel 4.5 Hasil pengujian suara dengan tingkat frekuensi lingkungan
DAFTAR GAMBAR
Hal
Gambar 2.1 Blok Diagram Arsitektur SAPI 12
Gambar 2.2 Desimasi untuk 16 titik 14
Gambar 2.3 Konsep FFT 14
Gambar 3.1 Arsitektur umum sistem 20
Gambar 3.2 Flowchart sistem 21
Gambar 3.3 Diagram use case sistem 24
Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara) 26
Gambar 3.5 Diagram aktifitas sistem (Bantuan) 26
Gambar 3.6 Rancangan halaman awal 27
Gambar 3.7 Rancangan halaman bantuan 28
Gambar 4.1 Halaman awal 31
Gambar 4.2 Halaman bantuan 32
Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan 36 Gambar 4.4 Halaman awal ketika perintah “buka” diucapkan 36 Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan 37
Gambar 4.6 Halaman awal ketika perintah “Word” diucapkan 37
Gambar 4.7 Halaman awal ketika perintah “Excel” diucapkan 38
Gambar 4.8 Halaman awal ketika perintah “Publisher” diucapkan 38
Gambar 4.9 Halaman awal ketika input kata ganti perintah 39
Gambar 4.10 Halaman bantuan 39
Gambar 4.11 Persentase keberhasilan perintah suara denga tingkat
frekuensi lingkungan 0 – 500 Hz 44
Gambar 4.12 Persentase keberhasilan perintah suara denga tingkat
vi
ABSTRAK
Speech recognition merupakan teknik mengenali ucapan dari suara seseorang untuk
dikenali di sebuah perangkat. Penelitian di bidang speech recognition bukanlah hal
baru mengingat banyaknya aplikasi yang sudah menggunakan suara sebagai pengganti
input. Namun diantara aplikasi – aplikasi tersebut belum banyak yang menjadikan
bahasa Indonesia sebagai sarana input. Diantara penelitian tersebut Microsoft
Corporation menciptakan Speech Application Programming Interface (SAPI) untuk
membantu pengembangan aplikasi pengenalan ucapan. Penelitian ini menerapkan
perintah suara berbahasa Indonesia dan metode Fast Fourier Transform (FFT) untuk
mentransformasi sinyal frekuensi dengan membagi dua tiap titik sinyal terus menerus
sehingga sinyal menjadi satu titik. Hasil akhir pada penelitian ini menunjukkan bahwa
sistem berhasil mengenali jenis perintah berbahasa Indonesia hingga mencapai
81,15% untuk lingkungan dengan noise frekuensi sebesar 0 – 500 Hz. Sedangkan
untuk lingkungan dengan noise frekuensi sebesar 501 – 1000 Hz hanya sebesar
30,8%. Keakuratan sistem dipengaruhi noise dan kualitas input suara, semakin sedikit
noise dan bagus kualitas input suara maka akan semakin akurat sistem mengenali
input.
Kata kunci : speech recognition, Speech Application Programming Interface (SAPI),
ABSTRACT
Speech recognition is a study that use human voice as an input for device to
recognize. The research about speech recognition that use voice as an input for an
application is not a new thing. However among that researches there still rarely to see
an application that used Indonesia as an input. Among that researches, Microsoft
Corporation create Speech Application Programming Interface (SAPI) that can use to
develop a speech recognition application. For this research, it will use command in
Indonesia and Fast Fourier Transform (FFT) to transform the frequency of the signal
by dividing every part of the signal into two parts continuously until each part consist
one point signal. The final result of this research show that the system has succeed
recognize the input in Indonesia with 81,15% in scope with 0 – 500 Hz noise
frequency. While the scope with 501 – 1000 Hz noise frequency only has 30,8%. The
accuracy of the system be affected by noise and the quality of the voice input, if the
fewer the noise and with good quality of the voice input, then more and more accurate
the system in recognising the input.
Keyword : speech recognition, Speech Application Programming Interface (SAPI),
BAB 1
PENDAHULUAN
1.1Latar Belakang
Pada tahun 2005, Martin, Brown, DeHayes, Hoffer dan Perkins mendefinisikan
teknologi informasi merupakan kombinasi teknologi komputer yang terdiri dari
perangkat keras dan lunak untuk mengolah dan menyimpan informasi dengan
teknologi komunikasi untuk melakukan penyaluran informasi. Berdasarkan definisi di
atas, dapat disimpulkan bahwa hubungan antara teknologi komputer dan penyaluran
informasi merupakan hubungan yang saling membutuhkan baik teknologi komputer
sebagai media atau alat dan informasi sebagai data yang diolah, disimpan dan
disalurkan begitu pula sebaliknya.
Perkembangan cara berkomunikasi antara manusia dan komputer telah
mengalami perubahan dari waktu ke waktu. Perubahan tersebut bertujuan agar
komunikasi antara manusia dan komputer menjadi lebih efisien. Salah satu metode
komunikasi yang banyak dikembangkan saat ini adalah pengenalan ucapan atau yang
lebih kita kenal dengan istilah speech recognition. Manusia dalam berinteraksi dengan
sesama manusia secara umum banyak dilakukan menggunakan ucapan. Dengan
menerapkan cara interaksi antara sesama manusia tersebut diharapkan menjadi cara
alternatif yang dapat dipakai untuk interaksi antara manusia dan komputer secara lisan
layaknya interaksi antara manusia dengan manusia (Syarif, A., Daryanto, T. & Arifin,
M.J., 2011).
Teknologi pengenalan ucapan telah banyak diterapkan di berbagai sistem. Hal
tersebut bertujuan agar ke depannya manusia dapat berkomunikasi dengan komputer
selayaknya berkomunikasi dengan sesama manusia. Oleh karena itu, penulis mencoba
sebagai data. Speech recognition merupakan metode komunikasi yang berfokus pada
suara, sehingga diharapkan penyaluran informasi dapat dilaksanakan dengan lebih
efisien. Selain itu, teknologi pengenalan ucapan masih memiliki banyak potensi untuk
dikembangkan.
Banyak penelitian yang telah dan sedang dilakukan untuk mendapatkan
pengenalan ucapan yang cepat dan akurat. Salah satu yang terkenal adalah penelitian
yang dilakukan oleh Microsoft Corporation yang dikembangkan untuk sistem operasi
Windows. Selain mengembangkan mesin pengenalan ucapan, Microsoft juga
mengembangkan standar untuk pengenalan ucapan yaitu Speech Application
Programming Interface (SAPI).
Pada penelitian ini, penulis mencoba menerapkan metode Fast Fourier
Transform pada tahap ekstraksi ciri untuk mengetahui frekuensi lingkungan sehingga
dapat dibandingkan ketika mengoperasikan perintah – perintah dasar di OS Windows.
Proses yang akan dilalui oleh sistem ini mengadaptasi dasar dari sistem pengenalan
ucapan pada umumnya. Proses tersebut diawali dengan menginput suara
menggunakan microphone. Kemudian dilanjutkan dengan proses ekstraksi ciri, yakni
proses mendapatkan besaran pada bagian sinyal masukan untuk menetapkan pola
pembelajaran atau pola uji.
Untuk tahap pembelajaran atau pola uji penulis juga menggunakan Speech
Application Programming Interface (SAPI) dengan grammar yang telah ditentukan
sendiri oleh penulis. SAPI memungkinkan pengenalan ucapan tanpa mempengaruhi
aplikasi yang ingin dibuat, sehingga SAPI dapat digunakan sebagai fungsi tersendiri
untuk mendukung aplikasi yang akan dibuat.
Sedangkan pada proses eksekusi, dimana ucapan yang dimasukkan telah
dikenali akan dieksekusi dengan perintah event/case yang terdapat pada bahasa
pemrograman visual basic. Event/case merupakan jenis perintah pengganti keyboard
pada pemrograman visual basic. Disini penulis akan mengganti event keyboard di
visual basic agar bisa dieksekusi melalui perintah suara yang telah didefinisikan
terlebih dahulu.
Sistem diharapkan dapat digunakan oleh pengguna yang berbeda setiap kali
percobaannya. Hal tersebut sesuai dengan sifat sistem pengenalan suara, yakni
Speaker Adaptive. Speaker Adaptive merupakan perpaduan dari Speaker Dependent
3
keakuratan pengenalan sistem akan makin meningkat jika pengguna yang sama
bekerja terus menerus selama beberapa waktu tertentu (Adipranata, 2003).
Berdasarkan penelitian terdahulu yang telah dilakukan dan keefektifan yang
dimiliki metode tersebut, penulis terdorong untuk membuat penelitian penerapan
perintah suara berbahasa Indonesia menggunakan aplikasi SAPI. Dipilihnya bahasa
Indonesia sebagai jenis input untuk menjalankan aplikasi ini dikarenakan masih
sedikitnya aplikasi – aplikasi yang mengenali ucapan bahasa Indonesia. Maka dari itu,
penulis ingin mengetahui sejauh apa sistem pengenalan ucapan dapat mengidentifikasi
kata – kata berbahasa Indonesia. Hal ini diharapkan memberikan kemampuan yang
baik pada sistem penerapan perintah suara berbahasa Indonesia untuk mengoperasikan
perintah – perintah dasar pada OS Windows.
1.2Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, dapat dilihat bahwa penelitian di
bidang speech recognition masih memiliki banyak peluang untuk dikembangkan,
terutama implementasi di bahasa – bahasa asing. Oleh karena itu, rumusan masalah
dari penelitian ini adalah bagaimana menerapkan perintah suara berbahasa Indonesia
untuk mengoperasikan perintah – perintah dasar di OS Windows menggunakan
Speech Application Programming Interface (SAPI)
1.3Batasan Masalah
Penelitian ini memiliki banyak cakupan sehingga penulis membatasi permasalahan
pada penelitian ini. Batasan masalah tersebut adalah sebagai berikut :
a. Perintah suara menggunakan bahasa Indonesia,
b. Perintah yang diterapkan berupa Explorer, buka, atas, bawah, kanan, kiri,
kembali, Browser, Word, Point, Excel dan Publisher,
c. Menggunakan Ejaan Yang Disempurnakan (EYD),
d. Pengambilan data suara dari 4 responden. Dimana 2 responden adalah wanita
dan 2 responden adalah pria,
f. Diterapkan pada Operating System (OS) Windows 7.
1.4Tujuan Penelitian
Tujuan dari penelitian ini adalah memanfaatkan teknologi aplikasi Speech Application
Programming Interface (SAPI) untuk menjalankan perintah dengan pengucapan
berbahasa Indonesia serta menerapkan metode Fast Fourier Transform (FFT) untuk
melihat tingkat frekuensi noise yang mempengaruhi kinerja Speech Application
Programming Interface (SAPI) tersebut.
1.5Manfaat Penelitian
Penulis berharap penelitian ini dapat memberikan manfaat kepada penulis sendiri dan
para pembaca. Adapun manfaat dari penelitian ini adalah sebagai berikut :
a. Meningkatkan efisiensi interaksi manusia dengan komputer ketika akan
mengoperasikan perintah dasar di windows.
b. Mengetahui kinerja Speech Application Programming Interface (SAPI) pada
aplikasi yang menggunakan bahasa Indonesia sebagai inputnya serta metode
Fast Fourier Transform (FFT) pada transformasi sinyal suara.
c. Penelitian dapat menjadi bahan rujukan untuk pengembangan penelitian lebih
lanjut.
1.6Metodologi Penelitian
Adapun metodologi penelitian yang digunakan peneliti yaitu :
1. Studi Literatur
Pada tahap ini peneliti melakukan pengumpulan sumber referensi yang akan
digunakan untuk penelitian. Peneliti membaca dan mempelajari buku-buku,
jurnal, media online dan sumber lainnya yang berhubungan dengan penelitian
pengenalan ucapan (speech recognition) serta metode – metode terkait yang
5
2. Perancangan Desain Sistem
Pada tahap ini peneliti melakukan perancangan aplikasi, seperti merancang
activity diagram, diagram alur (flowchart) sistem, perancangan desain, dan
perancangan desain antarmuka (interface).
3. Implementasi Sistem
Pada tahap ini dilakukan pengkodean dan implementasi rancangan yang telah
dibuat dengan menggunakan bahasa pemrograman yang telah dipilih.
Pengkodean dilakukan dengan bahasa pemrograman visual basic dengan
menggunakan aplikasi Speech Application Programming Interface (SAPI) dan
metode Fast Fourier Transform (FFT).
4. Pengujian Sistem
Pada tahap ini dilakukan pengujian dan percobaan pada sistem dengan subjek
berbeda yang telah dibuat sesuai dengan kriteria dan kebutuhan yang
diinginkan dan memastikan apakah program berjalan sesuai dengan yang
diinginkan.
5. Dokumentasi Sistem
Pada tahap ini, peneliti mendokumentasikan sistem dalam bentuk laporan
tertulis untuk menunjukkan hasil penelitian yang dilakukan.
1.7Sistematika Penulisan
Adapun penulisan skripsi ini terdiri dari lima bagian utama dengan penjelasan singkat
sebagai berikut :
Bab 1 Pendahuluan
Pada bab ini berisi uraian penjelasan latar belakang terkait judul skripsi yang diajukan,
perumusan masalah pada penelitian, batasan masalah yang ditetapkan, tujuan
penelitian, manfaat penelitian, metodologi penelitian, dan sistematika penulisan dari
Bab 2 Landasan Teori
Pada bab ini dibahas mengenai teori-teori pendukung yang digunakan pada penelitian
ini, seperti suara, speech recognition, Speech Application Programming Interface
(SAPI), Fast Fourier Transform (FFT) dan penelitian terdahulu.
Bab 3 Analisis dan Perancangan Sistem
Pada bab ini berisi penjelasan analisis mengenai permasalahan dan identifikasi
kebutuhan perancangan sistem.
Bab 4 Implementasi dan Pengujian Sistem
Pada bab ini berisi penjelasan implementasi sistem dari hasil analisis yang dilakukan
serta menguji sistem yang telah dibuat.
Bab 5 Kesimpulan dan Saran
Pada bab ini berisi kesimpulan yang didapat dari penelitian skripsi yang telah
dilakukan dan saran yang dapat digunakan untuk penelitian lebih lanjut mengenai
BAB 2
LANDASAN TEORI
2.1 Suara
Suara adalah sebuah sinyal yang merambat melalui media perantara. suara dapat
didefinisikan sebagai gelombang yang merambat dengan frekuensi dan amplitudo
tertentu. Suara yang dapat didengar manusia berkisar antara 20 Hz sampai dengan 20
KHz, dimana Hz adalah satuan frekuensi yang artinya banyaknya getaran per-detik
(cps / cycle per second) (Darmawan, Y., 2011).
Speech Processing (pemrosesan lafal/ucapan) adalah metode mengekstrak
informasi yang diinginkan dari sebuah sinyal suara. Untuk memproses sebuah sinyal
dengan sebuah computer digital, sinyal harus dihadirkan dalam bentuk digital
sehingga sinyal tersebut dapat digunakan oleh sebuah computer digital (L. Rabiner et
al. 1993)
2.2 Kata Baku dan Tidak Baku Bahasa Indonesia
Di dalam bahasa Indonesia terdapat dua jenis kata, yakni kata baku dan kata tidak
baku. Kata baku adalah kata yang digunakan sesuai dengan kaidah bahasa Indonesia
yang telah ditentukan. Kamus Besar Bahasa Indonesia (KBBI) merupakan sumber
utama dan menjadi acuan untuk menentukan kata baku bahasa Indonesia. Kata tidak
baku adalah kata yang digunakan tidak sesuai dengan kaidah bahasa Indonesia yang
ditentukan.
2.3 Speech Recognition
Speech recognition merupakan teknik dimana perangkat akan mengenali masukan
berupa suara, setelah itu perangkat melakukan respon yang sesuai dengan masukan
(pengenalan lafal/ucapan) juga diketahui sebagai suatu proses untuk mengenali
seseorang dengan mengenali ucapan dari orang tersebut (L. Rabiner et al. 1993).
2.3.1 Mode Speech Recognition
Speech recognition memiliki dua mode, yakni mode diktasi dan mode command and
control. Penjelasan kedua mode tersebut adalah sebagai berikut :
a. Mode Diktasi
Mode ini merupakan mode dimana pengguna komputer dapat mengucapkan
kata / kalimat yang selanjutnya akan dikenali oleh komputer dan diubah
menjadi data teks. Pengenalan mode diktasi merupakan speaker dependent.
Keakuratan pengenalan mode ini bergantung pada pola suara dan aksen
pembicara serta pelatihan yang telah dilakukan.
b. Mode Command and Control
Pada mode ini pengguna komputer mengucapkan kata / kalimat yang sudah
terdefinisi terlebih dahulu pada database dan selanjutnya akan digunakan
untuk menjalankan perintah tertentu pada aplikasi komputer. Mode ini
merupakan speaker independent karena jumlah kata yang dikenali biasanya
terbatas sekali dan ada kemungkinan pembicara tidak perlu melakukan
pelatihan pada sistem sebelumnya (Junaedih. 2007)
2.3.2 Proses Speech Recognition
Pada proses speech recognition atau sistem pengenal pembicaraan, terdapat empat
proses utama yang diterapkan baik pada mode diktasi maupun mode command and
control. Keempat proses tersebut adalah pemisahan kata, ketergantungan terhadap
pengguna, pencocokan kata dan pembendaharaan kata.
2.3.2.1. Pemisahan Kata
Pemisahan kata adalah proses untuk memisahkan suara yang diucapkan oleh
pengguna menjadi beberapa bagian (Junaedih. 2007). Pada proses pemisahan kata ini,
9
a. Discrete Speech
Pada discrete speech, pengguna diharuskan mengucapkan kalimat secara
terpenggal dengan adanya jeda sejenak diantara kata. Jeda tersebut digunakan
oleh sistem untuk mendeteksi awal dan akhir sebuah kata.
b. Word Spotting
Pada word spotting, dalam sebuah kalimat yang diucapkan pengguna, sistem
hanya mendeteksi kata yang terdapat di dalam perbendaharaan yang
dimilikinya, dan mengabaikan kata – kata lain yang tidak dimilikinya.
Sehingga walau pengguna mengucapkan kalimat yang berbeda tetapi di
dalam kalimat tersebut terdapat sebuah kata yang sama dan terdapat di
perbendaharaan sistem, maka hasil pengenalan akan sama.
c. Continuous Speech
Pada metode continuous speech, sistem akan mengenali dan memproses
setiap kata yang diucapkan.
2.3.2.2. Ketergantungan Terhadap Pengguna
Ketergantungan terhadap pengguna merupakan sebuah kondisi yang menjadikan
sistem pengenalan pembicaraan memiliki beberapa sifat. Sifat – sifat tersebut adalah
speaker dependent, speaker independent dan speaker adaptive.
a. Speaker Dependant
Pada speaker dependent, sistem membutuhkan pelatihan untuk setiap
pengguna yang akan menggunakan system tersebut.
b. Speaker Independent
Pada speaker independent, pengguna tidak perlu melakukan pelatihan
sebelum dapat menggunakan sistem, karena sistem mampu mengenali suara
semua pengguna tidak tergantung warna suara dan dialek yang digunakan.
c. Speaker Adaptive
Speaker adaptive merupakan perpaduan dari speaker dependent dan speaker
keakuratan pengenalan sistem akan makin meningkat jika pengguna yang
sama bekerja terus menerus selama beberapa waktu tertentu (Junaedih. 2007).
2.3.2.3. Pencocokan Kata
Pencocokan kata adalah proses untuk mencocokkan kata ucapan yang berhasil
diidentifikasi dengan basis data yang dipunyai oleh sistem.
2.3.2.4. Pembendaharaan Kata
Perbendaharaan kata ialah bagian terakhir dalam sebuah sistem pengenalan
pembicaraan. Jika perbendaharaan kata berjumlah banyak, maka sebuah sistem akan
mudah dalam melakukan pencocokan kata, tetapi dengan makin meningkatnya jumlah
perbendaharaan kata, maka jumlah kata yang mempunyai ucapan hampir sama juga
meningkat, dimana hal ini menurunkan keakuratan pengenalan.
Dan sebaliknya, jika sebuah sistem mempunyai perbendaharaan kata sedikit,
maka keakuratan pengenalan akan tinggi karena sedikitnya kata yang hampir sama,
tetapi akan semakin banyak kata yang tidak terkenali.
2.4 Speech Application Programming Interface (SAPI)
Speech recognition bukanlah hal baru untuk dunia penelitian teknologi. Penelitian –
penelitian mengenai speech recognition telah banyak dilakukan dan salah satu
diantaranya yang cukup dikenal adalah penelitian yang dilakukan oleh Microsoft
Corporation. Microsoft telah mengembangkan sistem speech recognition yang dapat
digunakan pada sistem operasi Windows. Sistem tersebut memiliki perkembangan
termasuk standard interface SAPI (Speech Application Programming Interface) yang
memungkinkan pembuat aplikasi menerapkan sistem speech recognition
menggunakan engine yang berbeda tanpa merubah aplikasi yang dibuat.
Sekarang banyak aplikasi yang dikembangkan menggunakan speech
recognition, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat
High-performance fighter aircraft, Training air traffic controllers, sampai pada alat
yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan,
maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi
11
2.4.1 Komponen Speech Application Programming Interface (SAPI)
Selain mengenali ucapan, SAPI juga memiliki fungsi untuk mengenali ucapan dan
mengubahnya menjadi teks. Hal tersebut dapat terjadi karena di dalam SAPI sendiri
terdapat komponen – komponen yang memang memiliki fungsi – fungsi khusus untuk
pengembangan sistem speech recognition, diantaranya :
a. Voice Command
Sebuah obyek level tinggi untuk perintah dan kontrol menggunakan
pengenalan suara.
b. Voice Dictation
Sebuah obyek level tinggi untuk continous dictation speech recognition.
c. Voice Talk
Sebuah obyek level tinggi untuk speech synthesis.
d. Voice Telephony
Sebuah obyek untuk menulis aplikasi telepon berbasiskan pengenalan suara.
e. Direct Speech Recognition
Sebuah obyek sebagai mesin untuk mengontrol pengenalan suara (direct
control of recognition engine)
f. Direct Text to Speech
Sebuah obyek sebagai mesin yang mengontrol synthesis.
g. Audio Object
Untuk membaca dari audio device atau sebuah file audio.
2.4.2 Antar muka Speech Application Programming Interface (SAPI)
SAPI 5.1 terdiri dari 2 antar muka yaitu application programming interface (API) dan
device driver interface (DDI) (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).
a. Application Programming Interface (API)
Windows Application Programming Interface (API) adalah sekumpulan fungsi
dan konstanta yang terdapat dalam file-file Dynamic Link Library (DLL) yang
pengenalan pembicaraan, aplikasi akan menerima event pada saat suara yang
diterima telah dikenali oleh engine. Arsitektur SAPI sendiri dapat kita lihat
pada blog diagram seperti yang terlihat pada gambar 2.1 (Supriyono, B.,
2004).
Gambar 2.1 Blok Diagram Arsitektur SAPI
Dalam API terdapat fungsi-fungsi/ perintah-perintah untuk menggantikan bahasa
yang digunakan dalam system calls dengan bahasa yang lebih terstruktur dan mudah
dimengerti oleh programmer. Fungsi yang dibuat dengan menggunakan API tersebut
kemudian akan memanggil system calls sesuai dengan sistem operasinya (Sianturi,
A.H., 2014).
b. Device Driver Interface (DDI)
DDI menyediakan fungsi untuk menerima data suara dari SAPI dan
mengembalikan pengenalan frasa pada level SAPI paling dasar. Terdapat dua
antar muka yang digunakan oleh DDI yaitu ISpSREngine, yang
diimplementasikan oleh engine dan ISpSREngineSite yang diimplementasikan
oleh SAPI (Nurcahyono, D., Kristalina, P. & Huda, M., 2011).
2.5 Transformasi Fourier
Transformasi Fourier merupakan suatu persamaan integral untuk menghitung
13
Angzas, Y., 2005). Sementara untuk menghitung spektrum frekuensi sinyal pada
komputer digital, kita membutuhkan algoritma Discrete Fourier Transform (DFT).
2.5.1 Discrete Fourier Transform (DFT)
DFT adalah suatu persamaan integral alat yang digunakan untuk menganalisa suatu
frekuensi diskrit (Stefanus, Hamz, M. & Angzas, Y., 2005). DFT mengubah sinyal
domain waktu, menjadi sinyal domain frekuensi. DFT dapat diterjemahkan dalam
rumus :
F(k∆f) ≡ ∑
for k = 0, 1, 2, ….., N – 1 (1)
N = jumlah sampel yang diambil
T = total waktu sampling
∆t = pertambahan waktu antar sampel
= frekuensi sampel =
2.5.2 Fast Fourier Transform (FFT)
Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal,
sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan
waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan
memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas,
Y., 2005).
Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut
sebagai desimasi – dalam – waktu (decimation-in-time) dan desimasi-dalam-frekuensi
(decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya
algoritma ini adalah memecah N-titik menjadi dua (N/2) – titik, kemudian memecah
tiap (N/2) – titik menjadi dua (N/4) – titik, begitu seterusnya sampai hanya terdapat 1
titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut (Gunawan,
Gambar 2.2 Desimasi untuk 16 titik
Sedangkan untuk konsep FFT sendiri secara keseluruhan dapat kita lihat pada
gambar 2.3 berikut (Gunawan, D., Juwono, F.H., 2012).
Gambar 2.3 Konsep FFT
Dikarenakan FFT masih bagian dari perhitungan DFT, maka akan lebih baik
menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, T.,
15
X(k) = ∑ k = 0, 1, 2…N-1 (2)
Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x (genap) = x(2m), dimana m=0, 1,2,…,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 :
X(k) = ∑ = ∑ + ∑
= ∑ + ∑ (3)
Dimana m = 0, 1, 2,…., N/2-1
Karena :
= cos( ) + j sin( ) (4)
= cos[ ] + j. sin[
= -cos( ) – j.sin( )
= -[cos( ) + j.sin( )]
= - (5)
Maka :
= - (6)
Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut
tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini
merupakan sifat simetri dari faktor. Karena factor bisa juga ditulis sebagai =
, maka :
= - (7)
Dan
( 2 = - = (8)
X(k) = ∑ ∑ (9)
k = 0,1….N/2
X(k + N/2) = - (10)
k = 0, 1, 2…..N/2
Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (9),
(k) memiliki (N/2) * (N/2) = (N/2)2. memiliki N/2 + (N/2)2.
Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2)2 +
N/2=N2/2+N/2. Untuk nilai awal N DFT, dimulai dari N2. Maka pada langkah
pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N2
menjadi N2/2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala.
Berikut adalah proses pengurangan perkalian dari nilai N menjadi N/2.
Lanjutkan pemisahan (m) dan (m) menjadi bagian ganjil dan genap dengan cara
yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian
perhitungan DFT akan berkurang secara terus – menerus. Jadi jika sinyal untuk nilai N
DFT terpisah terus – menerus sampai sinyal akhir menjadi satu titik. Misalkan ada
N=2v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah
v = (N). maka jumlah total perkalian akan dikurangi hingga (N/2) (N). untuk
tambahan perhitungan, angka yang akan dikurangi mencapai N (N). Karena
perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT
dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan
data menjadi ganjil dan genap secara terus – menerus sampai mendekati setengah
perhitungan.
2.6 Penelitian Terdahulu
Pada bagian ini akan dipaparkan mengenai penelitian terdahulu yang berkaitan dengan
17
Tabel 2.1 Penelitian Terdahulu
No. Peneliti Tahun Judul Penelitian Keterangan
1 Syarif, Daryanto,
et al
2011 Aplikasi Speech
Application Programming
Interface (SAPI) 5.1
Sebagai Perintah untuk
Pengoperasian Aplikasi
Berbasis Windows
Memanfaatkan
SAPI untuk
menjalankan
aplikasi berbasis
windows
2 Nurcahyono,
Kristalina, et al
2011 Pembuatan Speech
Recognition dan Database
Wicara Untuk Konrol
Peralatan Rumah Tangga
Jarak Jauh
Noise, jenis
kelamin dan usia
user
mempengaruhi
hasil akhir aplikasi
3 Yang 2012 The Algorithms of Speech
Recognition,
Programming and
Simulating in MATLAB
Pengujian
algoritma FFT
dalam sistem
speech recognition
menggunakan
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Bab ini menjelaskan data yang digunakan, flowchart, diagram use case serta tahapan – tahapan dan rancangan antar muka sistem
3.1 Identifikasi Masalah
Keinginan untuk membuat cara berinteraksi yang lebih alami menyebabkan perlunya
dicari alternatif lain sebagai pengganti atau pelengkap piranti yang sudah ada.
Manusia dalam berinteraksi dengan sesama manusia secara umum banyak dilakukan
menggunakan ucapan. Dengan menerapkan cara interaksi antara sesama manusia
tersebut diharapkan menjadi cara alternatif yang dapat dipakai untuk interaksi antara
manusia dan komputer secara lisan layaknya interaksi antara manusia dengan manusia
(Syarif, A., Daryanto, T. & Arifin, M.J., 2011).
Interaksi antara manusia dengan komputer yang paling berkembang saat ini
adalah menggunakan suara sebagai input untuk menjalankan aplikasi. Kebanyakan
aplikasi – aplikasi yang menggunakan suara sebagai input digunakan menggunakan
perangkat mobile dan memiliki fungsi tersendiri seperti aplikasi pencari lirik lagu
ataupun yang pencarian kata. Disini penulis ingin menerapkan suara sebagai input
untuk aplikasi yang dapat mengoperasikan windows. Walaupun windows sudah
memiliki Speech Application Programming Interface (SAPI) untuk mengoperasikan
windows menggunakan suara, penulis ingin menerapkan perintah yang bersifat bahasa
Indonesia. Selama ini kebanyakan aplikasi perintah suara bersifat mengenali suara dan
mengenali ucapan yang berbahasa inggris. Untuk penelitian ini, penulis akan
menerapkan bahasa Indonesia sebagai perintah suara untuk menjalankan aplikasi yang
19
3.2 Data yang Digunakan
[image:33.595.181.453.217.489.2]Dalam pembangunan sistem ini, data yang akan digunakan berupa suara yang terdiri dari dua orang perempuan dan dua orang laki - laki dengan usia 20 – 60 tahun dengan kata yang berjumlah 12 seperti yang dijabarkan dalam tabel 3.1.
Tabel 3.1 Penjelasan data yang akan digunakan
NO JENIS SUARA KATA
1 Perempuan A
Explorer
Buka
Atas
Bawah
Kanan
Kiri
Kembali
Browser
Word
Point
Excel
Publisher 2 Perempuan B
3 Laki – laki A
4 Laki – laki B
Kata yang akan digunakan sebagai input adalah :
- Explorer : untuk mengaktifkan window explorer
- Buka : untuk membuka folder atau menjalankan file
- Atas : untuk menggerakkan kursor satu langkah ke atas
- Bawah : untuk menggerakkan kursor satu langkah ke bawah
- Kanan : untuk menggerakkan kursor satu langkah ke kanan
- Kiri : untuk menggerakkan kursor satu langkah ke kiri
- Kembali : untuk mengembalikan explorer ke halaman sebelumnya
- Browser : untuk mengaktifkan browser google chrome
- Word : untuk mengaktifkan aplikasi Microsoft office Word
- Excel : untuk mengaktifkan aplikasi Microsoft office Excel
- Publisher : untuk mengaktifkan aplikasi Microsoft office Publisher
3.3 Analisis Sistem
Analisis sistem bertujuan untuk mengidentifikasi sistem yang akan dikembangkan.
Analisis diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, analisis
yang akan dilakukan berupa arsitektur umum dan flowchart. Arsitektur umum akan
menggambarkan keseluruhan metode yang diterapkan dan flowchart dapat
menggambarkan tahapan – tahapan sistem yang akan dirancang secara terstruktur
sehingga memudahkan pemahaman atas gambaran sistem yang sedang dirancang.
Arsitektur umum mengenai sistem pengenapan perintah suara berbahasa Indonesia
untuk mengoperasikan perintah dasar pada windows dapat dilihat pada gambar 3.1.
Ekstraksi Ciri Pengenalan Pola (Speech API)
Jalankan perintah pada windows Input suara
Digitalisasi suara
Fast Fourier
[image:34.595.124.513.336.551.2]Transform Grammar
Gambar 3.1 Arsitektur umum sistem
Adapun penjelasan tahapan dari arsitektur umum sistem adalah sebagai berikut :
1. User berbicara menggunakan mikrofon agar kata yang diucapkan dapat
dijadikan input untuk menjalankan aplikasi
2. Suara tersebut akan diubah menjadi sinyal digital menggunakan SoundCard
yang terdapat di dalam komputer
3. Setelah input telah berbentuk sinyal digital di dalam komputer, tahapan
selanjutnya adalah proses ekstraksi dimana sinyal tersebut akan diubah
21
4. Pada proses ekstraksi tersebut, algoritma Fast Fourier Transform akan
mengubah sinyal digital ke dalam bentuk spektrogram
5. Setelah proses spektogram, aplikasi akan menggunakan Speech API sebagai
library yang berperan sebagai tempat menetapkan grammar dan pengenal pola
sinyal yang dimasukkan
6. Sebelum sinyal dikenali, grammar ditetapkan terlebih dahulu sebagai
pembanding di tahap pengenalan nantinya
7. Pada tahap pengenalan, engine pada Speech API yang berfungsi sebagai
recognition akan mengenali jenis sinyal dan membandingkannya dengan yang
ada pada grammar
8. Setelah input dikenali, aplikasi akan dibaca sebagai perintah yang akan
digunakan untuk menjalankan perangkat Windows
Bentuk flowchart dari tahapan di atas dapat dilihat pada gambar 3.2
Mulai
Sinyal suara diubah ke dalam bentuk
digital
Pengenalan pola
spektrum suara Grammar
Dikenali Jalankan komando
pada perangkat end Masukkan
sinyal suara
Proses ekstraksi (FFT)
[image:35.595.173.464.379.730.2]ya tidak
3.3.1 Proses Ekstraksi
Pada proses ekstraksi, sinyal suara yang sudah dikonversi ke dalam bentuk sinyal
digital akan diubah ke dalam bentuk spektrum suara untuk mendapatkan
karakteristiknya. Pada proses ini digunakan algoritma Fast Fourier Transform untuk
mendapatkan spektrogram sinyal sehingga dapat dijadikan pola untuk dikenali pada
proses pengenalan.
Adapun penjelasan mengenali algoritma Fast Fourier Transform dapat dilihat melalui
pseudocode berikut :
Fast Fourier Transform
For i = 0 To bitsInLength - 1
m, n, k, j : integer
For k = 0 to m -1
alpha : double
alpha = -(2 * Math.PI/n)
j = k
while j < length
even = data(j)
odd = oddmultiplier * data(j+m)
data(j) = even + odd
data (j + m) = even - odd
j += n
End While
Next
23
3.3.2 Penetapan Grammar
Sebelum spektrogram sinyal suara dikenali, jenis perintah yang akan dikenali akan
ditetapkan terlebih dahulu sebagai grammar. Grammar ini akan dijadikan contoh
untuk dibandingkan pada tahap pengenalan pola.
3.3.3 Pengenalan pola spektrum suara
Pada tahap pengenalan pola spektrum suara, aplikasi akan menggunakan engine
speech API untuk mengenali pola spekrum suara tersebut. Speech API akan
membandingkan suara tersebut dengan grammar yang sudah ditetapkan terlebih
dahulu.
3.3.4 Jalankan perintah pada perangkat
Proses jalankan perintah pada perangkat merupakan tahap akhir atau tahap eksekusi
dari aplikasi ini, spektrogram yang telah dikenali dan disesuaikan dengan grammar
akan menjadi pemicu perintah untuk menjalankan operating system Windows.
3.4 Perancangan Sistem
Pada perancangan sistem akan dilakukan perancangan bagaimana aplikasi akan
memproses sinyal suara serta menjalankannya sebaga perintah untuk mengoperasikan
operating system Windows dan dilakukan juga perancangan tentang antarmuka sistem
yang akan dibangun.
3.4.1 Diagram Use Case
Use case diagram merupakan pemodelan terhadap cara kerja maupun tingkah laku
sistem informasi yang akan dibuat. Use case mendeskripsikan interaksi tipikal antara
user dengan sistem itu sendiri dengan member sebuah narasi tentang bagaimana
sistem tersebut digunakan (Fowler, 2005). Diagram use case sistem untuk aplikasi
penerapan perintah suara bahasa Indonesia untuk mengoperasikan perintah dasar pada
Halaman utama / input suara
Tentang
Bantuan
Jalankan komando pada perangkat
[image:38.595.127.510.78.309.2]User
Gambar 3.3 diagram use case sistem
3.4.2Spesifikasi Use Case
Use case spesifikasi adalah dekskripsi mengenai use case diagram, menjelaskan
bagaimana sebuah use case itu bekerja (Muchtar, et al. 2011).
Tabel 3.2 Spesifikasi use case untuk input suara
Nama use case Halaman utama / input suara
Aktor Pengguna komputer (user)
Deskripsi Use case ini digunakran oleh user untuk menginput
suara
Pre condition User diasumsikan sudah mengetahui kata apa saja
yang bisa dijadikan input untuk menjalankan sistem
Characteristic of activation Eksekusi dapat dilakukan oleh siapapun
Basic flow - User yang sudah mengetahui kata yang ingin
digunakan menjalankan sistem atau menginput
sendiri kata yang ingin digunakan sebagai input
perintah
- User melakukan input suara
- Sistem mengenali input dan mengeksekusi
[image:38.595.112.523.461.759.2]25
- Windows dijalankan berdasarkan perintah yang
diinput
Alternative flow - Perintah tidak dikenali
- User melakukan input suara lagi
Post condition User dapat memasukkan input suara berupa kata
dan melihat daftar kata yang dapat digunakan
sebagai perintah untuk menjalankan windows
Limitations User hanya dapat menginput kata tertentu sesuai
[image:39.595.111.522.80.275.2]dengan yang tertera pada halaman utama
Tabel 3.3 Spesifikasi use case untuk bantuan
Nama use case Bantuan
Aktor Pengguna komputer (user)
Deskripsi Use case ini digunakan oleh user untuk melihat
petunjuk penggunaan aplikasi
Pre condition Setiap pengunjung bisa mengakses modul ini
Characteristic of activation Eksekusi dapat dilakukan oleh siapa pun
Basic flow User mengklik tombol bantuan untuk melihat
petunjuk penggunaan aplikasi
Alternative flow
-Post condition User dapat melihat petunjuk penggunaan aplikasi
Limitations -
3.4.3Diagram Aktifitas
Activity diagram sistem menggambarkan urutan aktivitas dalam sistem yang sedang
dirancang. Aktivitas yang digambarkan hanya secara umum, tidak secara eksak seperti
pembuatan flowchart yang terstruktur. Diagram aktivasi menjelaskan tentang kegiatan
apa yang dapat dilakukan pada sistem tetapi tidak menjelaskan apa yang telah
dilakukan oleh aktor (Fowler, 2005).
Pada gambar 3.4, setelah user melihat daftar perintah user dapat memilih untuk
dalam daftar. Sistem akan merekam suara tersebut dan melakukan proses ekstraksi ciri
dan dilanjutkan dengan proses pengenalan pola sehingga eksekusi berupa
pengoperasian windows sesuai inputan suara dapat dijalankan.
Input suara
Jalankan perintah untuk perangkat
Ekstraksi ciri
Pengenalan pola
[image:40.595.203.431.157.401.2]User Sistem
Gambar 3.4 Diagram aktifitas sistem (Halaman utama / input suara)
Pada gambar 3.5, sistem memberikan informasi mengenai petunjuk penggunaan
aplikasi yang disebut bantuan. Hal ini bertujuan untuk memberikan kemudahan bagi
user yang kurang terbiasa dengan aplikasi speech recognition atau pengguna pertama
kali.
User Sistem
Lihat bantuan Menampilkan petunjuk penggunaan aplikasi
[image:40.595.197.430.523.720.2]27
3.4.4 Perancangan Antar Muka
Perancangan antar muka merupakan gambaran umum tentang perancangan setiap
tampilan yang terdapat dalam sistem yang akan dibangun. Berikut akan dijelaskan
rancangan bagian-bagian dari sistem.
a. Rancangan halaman awal
Pada halaman awal nama aplikasi terletak paling atas, dengan logo
universitas di bagian kiri, keterangan perintah yang tersedia di kanan serta
progress bar untuk menandakan suara terdeteksi tepat di sebelah kiri
[image:41.595.173.511.310.579.2]keterangan perintah seperti yang tertera pada gambar 3.6.
Gambar 3.6 Rancangan halaman awal
b. Rancangan halaman bantuan
Pada rancangan halaman bantuan, nama aplikasi dan logo tidak berubah.
Namun, pada bawah nama aplikasi tersedia tiga bagian untuk penjelasan
mengenai penggunaan aplikasi. Kemudian di bawah bagian keterangan
penggunaan aplikasi tersebut terdapat satu tombol kembali untuk
BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
Pada bab ini, pengimplementasian dan pengujian sistem akan dibahas sesuai dengan
analisis dan perancangan yang telah dibahas pada bab tiga. Tahapan ini bertujuan
untuk menampilkan hasil tampilan akhir sistem yang dibangun dan proses pengujian
sistem untuk melihat tingkat keberhasilan sistem dalam mengenali perintah berbahasa
Indonesia.
4.1 Implementasi Sistem
Berdasarkan analisis dan perancangan yang dibuat, sistem akan diimplementasikan
menggunakan bahasa pemrograman visual basic dan aplikasi SAPI 5.1. Kebutuhan
dalam pembangunan sistem ini meliputi perangkat keras dan lunak.
4.1.1 Perangkat keras
Spesifikasi perangkat keras yang digunakan untuk implementasi sistem adalah sebagai
berikut :
- Processor, Intel® Core™ i3-3217U CPU @ 1.80 GHz
- RAM , 4 GB
- Harddisk, 500 GB
4.1.2 Perangkat lunak
Spesifikasi perangkat lunak yang digunakan untuk implementasi sistem adalah
sebagai berikut :
- Windows 7 Pro 64-bit
- Speech Application Programming Interface (SAPI) 5.1
- Microsoft Visual Studio 2012
- CorelDraw 12
4.1.3 Implementasi perancangan antar muka
Adapun implementasi perancangan antarmuka yang telah dilakukan sebelumnya pada
sistem adalah:
1. Halaman Awal
Halaman awal merupakan halaman pertama yang muncul apabila aplikasi
dijalankan. Pada halaman ini terdapat keterangan perintah yang dapat
digunakan, progress bar, dua text box serta tombol bantuan dan tombol
tentang. Progress bar berfungsi untuk mendeteksi suara yang masuk sehingga
user dapat melihat apakah suaranya cukup keras atau tidak untuk menjalankan
aplikasi. Dua text box yang terdapat pada halaman awal ini berfungsi untuk
mendeskripsikan perintah yang diucapkan dan juga untuk mengetahui tingkat
frekuensi suara baik suara input ataupun suara keadaan sekitar (noise).
Sedangkan tombol bantuan dan tombol tentang berfungsi untuk membuka
halaman bantuan dan tentang. Untuk input kata – kata pengganti perintah dapat
diketik pada textbox yang tersedia dan disesuaikan dengan ketersediaan
combobox. Untuk keterangan perintah yang dapat digunakan dapat langsung
dilihat pada halaman awal aplikasi penerapan perintah suara berbahasa
Indonesia untuk mengoperasikan perintah dasar pada windows seperti yang
31
Gambar 4.1 Halaman Awal
2. Halaman Bantuan
Pada halaman bantuan, terdapat tiga jenis penjelasan. Penjelasan pertama
adalah deskripsi perintah yang dapat digunakan serta fungsi – fungsinya.
Penjelasan yang kedua merupakan penjelasan mengenai cara penggunaan
aplikasi.Sedangkan penjelasan yang ketiga adalah penjelasan mengenai
penggunaan control panel / penetapan perintah sendiri. Halaman bantuan juga
memiliki tombol kembali yang berfungsi mengembalikan aplikasi ke halaman
awal. Halaman bantuan penerapan perintah suara berbahasa Indonesia untuk
Gambar 4.2 Halaman Bantuan
4.2 Pengujian Sistem
Pengujian sistem dilakukan untuk mengantisipasi kemungkinan terjadinya eror pada
komponen ataupun pada interface dari program. Hal ini dilakukan dengan menguji
apakah sistem tersebut telah memenuhi functional requirement dan non-functional
requirement (Sommerville, 2004).
Metode pengujian yang digunakan adalah metode pengujian black box.
Pengujian black box merupakan pengujian yang dilakukan pada interface sistem yang
digunakan untuk mendemonstrasikan fungsi sistem yang dioperasikan (Gea, 2011).
4.2.1 Kasus dan Hasil Pengujian Sistem
Adapun kasus dan hasil pengujian sistem menggunakan teknik black box adalah
sebagai berikut :
a. Halaman Awal
33
Tabel 4.1 Hasil pengujian halaman awal
No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian
1 Mengklik tombol “Bantuan” Aplikasi menampilkan halaman
bantuan Berhasil
2 Mengklik tombol “Tentang” Aplikasi menampilkan halaman
tentang Berhasil
3 Mengklik tombol “Tetapkan”
Aplikasi menampilkan message box berisi kata yang diinput dalam text box
Berhasil
4
Masukkan input suara “Explorer” menggunakan EYD
Aplikasi menampilkan windows
explorer Berhasil
Masukkan input suara “Explorer” tidak
menggunakan EYD
Aplikasi tidak menampilkan
windows explorer Berhasil
5
Masukkan input suara “Buka” menggunakan EYD
Aplikasi akan membuka folder / file yang terpilih pada windows explorer
Berhasil
Masukkan input suara “Buka” tidak
menggunakan EYD
Aplikasi tidak akan membuka folder / file yang terpilih pada windows explorer
Tidak Berhasil
6
Masukkan input suara “Atas” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke atas pada
windows explorer
Berhasil
Masukkan input suara “Atas” tidak menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke atas pada windows explorer
Berhasil
7
Masukkan input suara “Bawah” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke bawah pada windows explorer
Berhasil
Masukkan input suara “Bawah” tidak
menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke bawah pada windows explorer
Berhasil
8
Masukkan input suara “Kanan” menggunakan
Aplikasi akan menggeser pointer satu langkah ke kanan pada windows explorer
EYD
Masukkan input suara “Kanan” tidak
menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke kanan pada windows explorer
Berhasil
9
Masukkan input suara “Kiri” menggunakan EYD
Aplikasi akan menggeser pointer satu langkah ke kiri pada
windows explorer
Berhasil
Masukkan input suara “Kiri” tidak menggunakan EYD
Aplikasi tidak akan menggeser pointer satu langkah ke kiri pada windows explorer
Berhasil
10
Masukkan input suara “Kembali” menggunakan EYD
Aplikasi akan mengembalikan ke direktori sebelumnya pada windows explorer
Berhasil
Masukkan input suara “Kembali” tidak
menggunakan EYD
Aplikasi tidak akan
mengembalikan ke direktori sebelumnya pada windows explorer
Berhasil
11
Masukkan input suara “Browser” menggunakan EYD
Aplikasi menampilkan browser
Google Chrome Berhasil
Masukkan input suara “Browser” tidak
menggunakan EYD
Aplikasi tidak menampilkan
browser Google Chrome Berhasil
12
Masukkan input suara “Word” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Word Berhasil
Masukkan input suara “Word” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Word Berhasil
13
Masukkan input suara “Point” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Power Point Berhasil
Masukkan input suara “Point” tidak
menggunakan
Aplikasi tidak menampilkan
35
EYD
14
Masukkan input suara “Excel” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Excel Berhasil
Masukkan input suara “Excel” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Excel Berhasil
15
Masukkan input suara “Publisher” menggunakan EYD
Aplikasi menampilkan Microsoft
Office Publisher Berhasil
Masukkan input suara “Publisher” tidak
menggunakan EYD
Aplikasi tidak menampilkan
Microsoft Office Publisher Berhasil
[image:49.595.138.533.83.351.2]b. Halaman Bantuan
[image:49.595.134.531.469.588.2]Tabel 4.2 akan menjelaskan skenario pengujian sistem pada halaman bantuan
Tabel 4.2 Hasil pengujian halaman bantuan
No. Skenario Uji Hasil yang Diharapkan Hasil Pengujian
1 Mengklik tombol “kembali”
Aplikasi akan menutup halaman
bantuan dan kembali ke halaman
awal
Berhasil
4.2.2 Pengujian kinerja sistem
Pada pengujian kinerja sistem akan dijelaskan hasil perancangan sistem yang dibuat.
Hasil dari tiap halaman sistem adalah sebagai berikut :
a. Halaman awal
Gambar 4.3 dan gambar 4.4 menampilkan halaman awal dari aplikasi. Apabila
mengklik apapun. Begitu pula apabila user mengatakan kata “atas”, “buka”
dan perintah lain yang berfungsi menggeser pointer, maka pointer akan
[image:50.595.112.528.167.403.2]bergerak tanpa kita menggunakan mouse.
Gambar 4.3 Halaman awal ketika perintah “Explorer” diucapkan
[image:50.595.110.528.447.685.2]37
Sedangkan untuk perintah memanggil aplikasi seperti browser, word, excel
dan publisher juga dapat dilakukan sama seperti windows explorer seperti yang
[image:51.595.110.524.168.400.2]terlihat pada gambar 4.5 sampai gambar 4.8
Gambar 4.5 Halaman awal ketika perintah “browser” diucapkan
[image:51.595.108.527.449.685.2]Gambar 4.7 Halaman awal ketika perintah “excel” diucapkan
Gambar 4.8 Halaman awal ketika perintah “publisher” diucapkan
Pada gambar 4.9 adalah halaman ketika user menggunakan fasilitas control
panel / tetapkan perintah untuk memasukkan kata – kata yang user inginkan untuk
[image:52.595.111.528.368.601.2]39
Gambar 4.9 Halaman awal ketika input kata ganti perintah
b. Halaman bantuan
Gambar 4.10 menunjukkan halaman bantuan dari aplikasi ini. Apabila user
mengklik tombol kembali maka halaman tersebut akan tertutup dan kembali
[image:53.595.109.527.469.703.2]pada halaman awal
4.3 Hasil Pengujian Suara
Disini penulis akan memaparkan hasil pengujian suara dari dua orang perempuan dan
dua orang laki – laki sebanyak lima kali per perintah dengan tingkat sensitifitas
microphone dan keadaan frekuensi noise yang berbeda. Berikut penjelasan pengujian
dari tiap kondisi.
4.3.1 Hasil pengujian suara dengan tingkat frekuensi noise0 – 500 Hz
Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi
[image:54.595.120.514.316.770.2]berada pada 0 – 500 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.4
Tabel 4.4 Pengujian suara dengan tingkat frekuensi noise 0 – 500 Hz
Subjek Kata yang diuji
Pengujian (Berhasil / Gagal /
Jumlah)
Tingkat frekuensi lingkungan
(noise)
Tingkat keberhasilan
B G J
Perempuan A
Explorer 5 0 5
0 – 500 Hz
100 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 5 0 5 100 %
Word 5 0 5 100 %
Point 3 2 5 60 %
Excel 5 0 5 100 %
Publisher 5 0 5 100 %
Perempuan B
Explorer 5 0 5
0 – 500 Hz
100 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 0 5 5 0 %
Kembali 5 0 5 100 %
Browser 2 3 5 40 %
Word 0 5 5 0 %
Point 0 5 5 0 %
Excel 4 1 5 80 %
Publisher 3 2 5 60 %
Laki – Laki A
Explorer 4 1 5
0 – 500 Hz
80 %
Buka 5 0 5 100 %
41
Bawah 5 0 5 100 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 4 1 5 80 %
Word 5 0 5 100 %
Point 4 1 5 80 %
Excel 5 0 5 100 %
Publisher 4 1 5 80 %
Laki – Laki B
Explorer 4 1 5
0 – 500 Hz
80 %
Buka 5 0 5 100 %
Atas 5 0 5 100 %
Bawah 2 3 5 40 %
Kanan 5 0 5 100 %
Kiri 5 0 5 100 %
Kembali 5 0 5 100 %
Browser 5 0 5 100 %
Word 5 0 5 100 %
Point 1 4 5 20 %
Excel 5 0 5 100 %
Publisher 5 0 5 100 %
Dari tabel 4.4 dapat diketahui persentase keberhasilan aplikasi pada
lingkungan dengan tingkat frekuensi (noise) 0 – 500 Hz adalah sebagai berikut :
Perempuan A = 96,6 %
Perempuan B = 65 %
Laki – laki A = 83 %
Laki – laki B = 80 %
Dengan tingkat keberhasilan per perintah sebagai berikut :
- Explorer = 90 %
- Buka = 100 %
- Atas = 90 %
- Bawah = 85 %
- Kanan = 100 %
- Kiri = 75 %
- Kembali = 100 %
- Browser = 80 %
- Word = 75 %
- Point = 40 %
- Excel = 95 %
4.3.2 Hasil pengujian suara dengan tingkat frekuensi (noise) 501 – 1000 Hz
Pengujian suara akan dilakukan dengan keadaan lingkungan memiliki frekuensi berada pada 501 – 1000 Hz. Hasil pengujian tersebut dapat dilihat pada tabel 4.5
Tabel 4.5 Pengujian suara dengan tingkat frekuensi noise 501 – 1000 Hz
Subjek Kata yang diuji
Pengujian (Berhasil / Gagal /
Jumlah)
Tingkat frekuensi lingkungan