• Tidak ada hasil yang ditemukan

Aplikasi pengenalan ucapan secara real time untuk mengatur nyala led hias dengan ekstraksi ciri DCT dan Jarak Clark.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Aplikasi pengenalan ucapan secara real time untuk mengatur nyala led hias dengan ekstraksi ciri DCT dan Jarak Clark."

Copied!
141
0
0

Teks penuh

(1)

viii

INTISARI

Dalam perkembangannya suara tidak hanya digunakan untuk berkomunikasi antar manusia, akan tetapi suara manusia sudah dapat digunakan untuk mengendalikan suatu alat elektronik. Lampu adalah sebuah komponen elektronik yang dapat digunakan untuk berbagai macam hal yaitu dimanfaatkan untuk hiasan dan penerangan. Berdasarkan hal tersebut maka dibentuklah sistem yang bertujuan untuk pengenalan jenis suara manusia yang dapat mengendalikan nyala lampu led hias.

Sistem pengenalan ucapan untuk mengendalikan nyala led hias menggunakan beberapa alat. Mikrofon untuk merekam ucapan yang diucapkan oleh user, dalam proses perekaman alat yang digunakan adalah sebuah laptop untuk menjalankan proses pengenalan dan mengenali ucapan yang terekam. Proses pengenalan ucapan meliputi beberapa subproses diantaranya merekam, normalisasi, pemotongan sinyal, windowing, ekstraksi ciri, fungsi jarak clark, metode k-Nearest Neighbor dan penentuan hasil ucapan pengenalan. Setelah ini hasil pengenalan akan dikirim dalam bentuk data string ke mikrokontroller dengan melalui alat yang disebut modul serial K-125R untuk mengatur nyala led hias.

Dalam sistem pengenalan ucapan manusia ini menggunakan fungsi jarak clark dan metode k-Nearest Neighbor. Program ini sudah berhasil bekerja sesuai dengan yang diharapkan. Dalam program pengenalan ini menampilkan gelombang ucapan terekam, ekstraksi ciri DCT, dan keluaran berupa tulisan huruf yang berhasil dikenali. Program ini dapat mengenali secara real-time sebesar 80%. Pada variasi nilai batas potong 0.2, nilai segment averaging 64 titik dan nilai k-Nearest Neighbor sebesar 3. Pengenalan ini dapat mengenali 5 jenis ucapan yaitu cepat, lambat, kanan, kiri dan stop.

(2)

ix

ABSTRACT

With progress sound is not used only to communicate between humans , however the human voice are ready to use for controlling the electronic devices . The lamp a electronic components can be used for multiple that is used for ornament and for illumination. Based on it then formed a system that aims to the introduction of human kind of sound that can control the flame of a lamp led a decorative .

Speech recognition systems to controlling the leds ornamental uses a tool. Microphone for recording speech uttered by users, in the process of recording instrument used is a laptop to take the recognition and speech are recognized. Speech recognition process includes several subproses namely is Record , normalization , cutting a signal , windowing, feature extraction DCT, clark distance function, a method of k-Nearest Neighbor and the determination of the introduction of the results of speech. After the results of the introduction of this string data to mikrokontroller with through an instrument called serial K-125R module to control a decorative led lamp.

In a system of the introduction of human speech is using the serial K-125R module to control the decorative led lamp used clark distance function dan a method of k-Nearest Neighbor. This program has successfully working in accordance with the expected. In a program featuring the introduction of this speech waves were recorded, feature extraction DCT, and output in the form of script characters could be recognized. This program can recognize in real-time as much as 80%. In variation limiting-value 0,2; segment averaging value 64 point and k-Nearest Neighbor value is 3. The speech recognition can be recognize 5 kinds recognition is cepat, lambat, kanan, kiri and stop.

(3)

TUGAS AKHIR

APLIKASI PENGENALAN UCAPAN SECARA REAL TIME UNTUK

MENGATUR NYALA LED HIAS DENGAN EKSTRAKSI CIRI DCT

DAN JARAK CLARK

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik

Program Studi Teknik Elektro

Oleh :

DIONISIUS DIVA ROSARIAN NIM : 105114008

PROGRAM STUDI TEKNIK ELEKTRO

JURUSAN TEKNIK ELEKTRO

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

(4)

i

TUGAS AKHIR

APLIKASI PENGENALAN UCAPAN SECARA REAL TIME UNTUK

MENGATUR NYALA LED HIAS DENGAN EKSTRAKSI CIRI DCT

DAN JARAK CLARK

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik

Program Studi Teknik Elektro

Oleh :

DIONISIUS DIVA ROSARIAN NIM : 105114008

PROGRAM STUDI TEKNIK ELEKTRO

JURUSAN TEKNIK ELEKTRO

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

(5)

ii

FINAL PROJECT

APPLICATION OF REAL TIME SPEECH RECOGNITION FOR

DECORATIVE LED LAMP USING DCT FEATURE EXTRACTION

AND CLARK DISTANCE FUNCTION

Presented as partial fulfillment of the requirement

To obtain the sarjana teknik degree

In electrical engineering study program

DIONISIUS DIVA ROSARIAN NIM : 105114008

ELECTRICAL ENGINEERING STUDY PROGRAM

DEPARTMENT OF ELECTRICAL ENGINEERING

SCIENCE AND TECHNOLOGY FACULTY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

(6)
(7)
(8)

v

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguh nya bahwa tugas akhir yang saya tulis ini tidak memuat karya ataupun bagian dari karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 8 April 2015

(9)

vi

HALAMAN PERSEMBAHAN DAN MOTTO HIDUP

“Tuhan Yesus pasti memberikan jalan,

mencoba adalah hak dan kewajiban dari kita”

Persembahan

Karya ini aku persembahkan untuk…

Tuhan yang selalu memberkatiku…

Bunda Maria yang selalu membimbingku…

Bapak Ibu Kakak ku tercinta yang selalu ada memberikan segalanya dalam perjalanan hidupku…

Teman-teman ku elektro 2010 yang selalu menemaniku dalam segala kondisi…

(10)

vii

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK

KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :

Nama : Dionisius Diva Rosarian

Nomor Mahasiswa : 105114008

Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul :

APLIKASI PENGENALAN UCAPAN SECARA REAL TIME UNTUK

MENGATUR NYALA LED HIAS DENGAN EKSTRAKSI CIRI DCT

DAN JARAK CLARK

beserta perangkat yang diperlukan ( bila ada ). Dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara terbatas dan mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalty kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yogyakarta, 8 April 2015

(11)

viii

INTISARI

Dalam perkembangannya suara tidak hanya digunakan untuk berkomunikasi antar manusia, akan tetapi suara manusia sudah dapat digunakan untuk mengendalikan suatu alat elektronik. Lampu adalah sebuah komponen elektronik yang dapat digunakan untuk berbagai macam hal yaitu dimanfaatkan untuk hiasan dan penerangan. Berdasarkan hal tersebut maka dibentuklah sistem yang bertujuan untuk pengenalan jenis suara manusia yang dapat mengendalikan nyala lampu led hias.

Sistem pengenalan ucapan untuk mengendalikan nyala led hias menggunakan beberapa alat. Mikrofon untuk merekam ucapan yang diucapkan oleh user, dalam proses perekaman alat yang digunakan adalah sebuah laptop untuk menjalankan proses pengenalan dan mengenali ucapan yang terekam. Proses pengenalan ucapan meliputi beberapa subproses diantaranya merekam, normalisasi, pemotongan sinyal, windowing, ekstraksi ciri, fungsi jarak clark, metode k-Nearest Neighbor dan penentuan hasil ucapan pengenalan. Setelah ini hasil pengenalan akan dikirim dalam bentuk data string ke mikrokontroller dengan melalui alat yang disebut modul serial K-125R untuk mengatur nyala led hias.

Dalam sistem pengenalan ucapan manusia ini menggunakan fungsi jarak clark dan metode k-Nearest Neighbor. Program ini sudah berhasil bekerja sesuai dengan yang diharapkan. Dalam program pengenalan ini menampilkan gelombang ucapan terekam, ekstraksi ciri DCT, dan keluaran berupa tulisan huruf yang berhasil dikenali. Program ini dapat mengenali secara real-time sebesar 80%. Pada variasi nilai batas potong 0.2, nilai segment averaging 64 titik dan nilai k-Nearest Neighbor sebesar 3. Pengenalan ini dapat mengenali 5 jenis ucapan yaitu cepat, lambat, kanan, kiri dan stop.

(12)

ix

ABSTRACT

With progress sound is not used only to communicate between humans , however the human voice are ready to use for controlling the electronic devices . The lamp a electronic components can be used for multiple that is used for ornament and for illumination. Based on it then formed a system that aims to the introduction of human kind of sound that can control the flame of a lamp led a decorative .

Speech recognition systems to controlling the leds ornamental uses a tool. Microphone for recording speech uttered by users, in the process of recording instrument used is a laptop to take the recognition and speech are recognized. Speech recognition process includes several subproses namely is Record , normalization , cutting a signal , windowing, feature extraction DCT, clark distance function, a method of k-Nearest Neighbor and the determination of the introduction of the results of speech. After the results of the introduction of this string data to mikrokontroller with through an instrument called serial K-125R module to control a decorative led lamp.

In a system of the introduction of human speech is using the serial K-125R module to control the decorative led lamp used clark distance function dan a method of k-Nearest Neighbor. This program has successfully working in accordance with the expected. In a program featuring the introduction of this speech waves were recorded, feature extraction DCT, and output in the form of script characters could be recognized. This program can recognize in real-time as much as 80%. In variation limiting-value 0,2; segment averaging value 64 point and k-Nearest Neighbor value is 3. The speech recognition can be recognize 5 kinds recognition is cepat, lambat, kanan, kiri and stop.

(13)

x

KATA PENGANTAR

Puji dan Syukur penulis kepada Tuhan Yesus karena telah memberikan berkat-Nya sehingga penulis dapat menyelesaikan laporan tugas akhir ini dengan baik dan dapat memenuhi syarat memperoleh gelar sarjana.

Penulis menyadari bahwa selama pembuatan tugas akhir ini tidak lepas dari seluruh bantuan dan bimbingan dari berbagai pihak. Oleh karena itu, pada kesempatan ini penulis mengucapkan terima kasih kepada :

1. Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta . 2. Petrus Setyo Prabowo, S.T., M.T., Ketua Program Studi Teknik Elektro Universitas

Sanata Dharma Yogyakarta.

3. Dr.Linggo Sumarno, dosen pembimbing yang dengan penuh setia, kesabaran dan pengertian untuk membimbing dalam menyelesaikan tugas akhir ini.

4. Djoko Untoro Suwarno S.Si., M.T. dan Pius Yozy Merucahyo, ST., M.T., dosen penguji yang telah memberikan bimbingan, saran dan merevisi tugas akhir ini. 5. Bapak dan Ibu tercinta, Hugo Rokhayadi dan Stefani Wahyuni atas perhatian, kasih

sayang,dukungan dan doa.

6. Kakak saya, S.W. Kuncoro Adi, yang selalu memberi semangat dan doa untuk kelancaran tugas akhir penulis.

7. Segenap staff sekretariat dan laboran Teknik Elektro yang telah memberikan dukungan secara tidak langsung dalam kelancaran pengerjaan tulisan tugas akhir ini.

8. Teman-teman Teknik Elektro 2010 yang telah menemani di segala kondisi pada saat menempuh pendidikan di Universitas Sanata Dharma Yogyakarta.

(14)

xi

Penulis menyadari bahwa dalam penyusunan laporan tugas akhir masih mengalami kesulitan dan tidak lepas dari kesalahan. Oleh karena itu, penulis mengharapkan masukan, kritik dan saran yang membangun agar skripsi ini menjadi lebih baik. Dan semoga skripsi ini dapat bermanfaat sebagaimana mestinya.

Penulis

(15)

xii

DAFTAR ISI

HALAMAN JUDUL ...i

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN ... iv

PERNYATAAN KEASLIAN KARYA ... v

HALAMAN PERSEMBAHAN DAN MOTTO HIDUP ... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ...vii

INTISARI ... viii

ABSTRACT ... ix

KATA PENGANTAR ... x

DAFTAR ISI ...xii

DAFTAR GAMBAR ... xvi

DAFTAR TABEL ... xix

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Tujuan dan Manfaat Penelitian ... 2

1.3. Batasan Masalah ... 2

1.4. Metodologi Penelitian ... 3

BAB II DASAR TEORI ... 5

2.1 Suara ... 5

2.2 Sampling ... 6

2.3 Windowing ... 6

2.4 Discrete Cosine Transform (DCT) ... 7

(16)

xiii

2.6 Jarak Clark ... 9

2.7 Metode Template Matching ... 10

2.8 Metode k-Nearest Neighbor (kNN) ... 10

2.9 Mikrofon ... 10

2.10 Sound Card ... 11

2.11 Modul Mikrokontroler AVR ATMega ... 12

2.12 USART (Universal Synchronous and Asynchronous serial Receiver and Transmitter) pada Atmega8535... 15

2.13 Timer/Counter ... 17

2.14 Transistor Sebagai Saklar ... 17

2.15 Lampu LED ( Light-Emitting Diode ) ... 18

2.16 Modul Serial ... 19

2.17 Voltage Regulators ... 20

2.18 MATLAB ... 22

BAB III PERANCANGAN ... 23

3.1. Sistem Pengenalan Ucapan Suara Manusia Untuk Pengaturan Nyala LED Hias.... 23

3.1.1 Ucapan Manusia ... 24

3.1.2 Mikrofon ... 24

3.1.3 Soundcard... 24

3.1.4 Proses Perekaman ... 24

3.1.5 Pengenalan Suara ... 25

3.1.5.1 Perekaman ... 25

3.1.5.2 Suara Uji ... 26

3.1.6. Pre-processing ... 26

3.1.7 Ekstraksi Ciri ... 27

(17)

xiv

3.1.9 Proses k-Nearest Neighbor (k-NN) ... 27

3.1.10 Output Pengenalan Ucapan Manusia ... 27

3.2 Perancangan Referensi Ucapan ... 28

3.3 Perancangan Sistem Software ... 28

3.3.1 Proses Perekaman ... 29

3.3.2 Pre-processing ... 30

3.3.3 Ekstraksi Ciri ... 33

3.3.4 Perhitungan Jarak ... 33

3.3.5 Proses k-Nearest Neighbor (k-NN)... 34

3.3.6 Output Pengenalan Ucapan ... 35

3.3.7 Tampilan Pengenalan Ucapan ... 35

3.4 Perancangan Sistem Hardware ... 36

3.4.1 Perancangan Catu Daya ... 37

3.4.2 Modul Serial ... 39

3.4.3 Perancangan Mikrokontroler ... 40

3.4.3.1 Perancangan Input-Output Sistem ATmega8535... 42

3.4.3.2 Alur Program Pengaturan Nyala LED Hias ... 43

3.4.4 Alur Program untuk Pulse Width Modulation ... 46

3.4.5 Perancangan Rangkaian Lampu LED ... 46

3.4.5.1 Rangkaian Transistor Sebagai Saklar ... 47

3.4.5.2 Rangkaian Lampu LED ... 47

3.4.6 Perancangan Mekanik ... 48

BAB IV HASIL DAN PEMBAHASAN ... 49

4.1. Pengujian Program Pengenalan Nada Pengenalan Ucapan Manusia Secara Real-Time Menggunakan Ekstraksi Ciri DCT dan Fungsi Jarak Clark ... 49

(18)

xv

4.2. Hasil Pengujian Program Pengenalan Ucapan Terhadap Tingkat

Pengenalan Ucapan Manusia ... 58

4.2.1 Metode Segment Averaging ... 59

4.2.2 Pengujian Tidak Real-Time ... 61

4.2.3 Pengujian Real-Time ... 68

4.3. Bentuk Fisik Hardware ... 72

4.3.1 Mekanik Kotak Lampu LED Hias ... 72

4.3.2 Subsistem Elektronik Lampu LED Hias ... 74

4.4. Pengujian Hardware ... 76

4.4.1 Cara Penggunaan Alat ... 76

4.4.2 Pengujian Rangkaian Catu Daya ... 76

4.4.3 Pengujian Modul Serial ... 77

4.4.4 Pengujian Program Nyala Led Hias... 78

BAB V KESIMPULAN DAN SARAN ... 80

5.1 Kesimpulan ... 80

5.2 Saran ... 80

DAFTAR PUSTAKA... 81

LAMPIRAN

LAMPIRAN A Percobaan Perekaman ... L 1

LAMPIRAN B Proses Pengenalan Ucapan Suara Manusia ... L 3

LAMPIRAN C Ekstraksi Ciri DCT... L 4

LAMPIRAN D Listing Program Mikrokontroller ... L 7

LAMPIRAN EListing Program Pengenalan Ucapan ... L 25

(19)

xvi

DAFTAR GAMBAR

Gambar 1.1. Blok Model Perancangan ... 3

Gambar 2.1. Gambar artikulator pada saat produksi suara ... 5

Gambar 2.2. Gambar tempat produksi suara ... 6

Gambar 2.3. Contoh jendela Blackman [11] ... 7

Gambar 2.4. Contoh DCT dari sinyal dengan menggunakan DCT 256 titik[4] ... 8

Gambar 2.5. Contoh proses pembagian data dengan segment (��) ... 9

Gambar 2.6. Contoh mikrofon ... 11

Gambar 2.7. Contoh kartu suara ... 12

Gambar 2.8. Modul mikrokontroler AVR ATMega ... 12

Gambar 2.9. Konfigurasi pin modul mikrokontroler AVR dengan Atmega8535[8] ... 13

Gambar 2.10. Diagram blok arsitektur USART mikrokontroler AVR ATmega8535[8] ... 15

Gambar 2.11. Transistor sebagai saklar ... 17

Gambar 2.12. LED ( Light-Emitting Diode ) ... 18

Gambar 2.13. Modul K-125R[13] ... 19

Gambar 2.14. Kaki IC 78xx[14] ... 20

Gambar 2.15. Rangkaian Regulator Tegangan +12 V[14] ... 21

Gambar 3.1. Diagram blok keseluruhan sistem ... 23

Gambar 3.2. Diagram Blok sistem pengenalan ucapan ... 25

Gambar 3.3. Diagram blok proses pengambilan suara referensi ... 28

Gambar 3.4. Diagram blok keseluruhan proses ... 29

Gambar 3.5. Diagram alir proses perekaman ... 29

Gambar 3.6. Diagram alir proses pre-processing ... 30

(20)

xvii

Gambar 3.8. Diagram alir proses pemotongan sinyal ... 31

Gambar 3.9. Diagram alir proses jendela blackman ... 32

Gambar 3.10. Diagram alir proses zero padding ... 32

Gambar 3.11. Diagram alir proses ekstraksi ciri ... 33

Gambar 3.12. Diagram alir proses pembanding fungsi jarak ... 33

Gambar 3.13. Diagram alir proses k-Nearest Neighbor... 34

Gambar 3.14. Diagram alir proses output pengenalan ucapan ... 35

Gambar 3.15. Tampilan user ... 36

Gambar 3.16. Diagram blok sistem hardware ... 37

Gambar 3.17. Rangkaian Catu Daya ... 39

Gambar 3.18. Diagram alir komunikasi serial ... 40

Gambar 3.19. Minimum sistem ATmega8535 ... 41

Gambar 3.20. Rangkaian clock external ... 41

Gambar 3.21. Rangkaian reset Atmega8535... 42

Gambar 3.22. Gambar alir Pengaturan nyala LED Hias ... 45

Gambar 3.23 Diagram alir untuk Pulse Width Modulation ... 46

Gambar 3.24. Rangkaian transistor sebagai sakar ... 47

Gambar 3.25. Kotak sistem mekanik ... 48

Gambar 4.1 IconMatlab ... 49

Gambar 4.2 Tampilan awal Matlab ... 50

Gambar 4.3 Tampilan program pengenalan ucapan manusia ... 50

Gambar 4.4 Tampilan pengaturan pengenalan ucapan manusia ... 51

Gambar 4.5 Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan ... 60

Gambar 4.6 Pengaruh perubahan k-Nearest Neighbor terhadap pengenalan ucapan ... 61

(21)

xviii

Gambar 4.8 Pengaruh perubahan batas potong terhadap pengenalan ucapan ... 63

Gambar 4.9 Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan ... 64

Gambar 4.10 Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan ... 64

Gambar 4.11 Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan ... 65

Gambar 4.12 Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan ... 66

Gambar 4.13 Pengaruh perubahan nilai batas potong terhadap pengenalan ucapan ... 67

Gambar 4.14 Pengaruh perubahan lebar segment averaging terhadap pengenalan ucapan ... 67

Gambar 4.15. Perbedaan ciri-ciri ekstraksi ciri DCT pada setiap jenis ucapan ... 70

Gambar 4.16. Persamaan ciri-ciri ekstraksi ciri DCT pada jenis ucapan “kiri” ... 71

Gambar 4.17. Mekanik kotak lampu led hias tampak atas ... 72

Gambar 4.18. Mekanik kotak lampu led hias tampak samping ... 73

Gambar 4.19. Mekanik kotak lampu led hias tampak dalam ... 73

Gambar 4.20. Rangkaian catu daya 12V dan 5V ... 74

Gambar 4.21. (a) Modul serial K-125R dan (b) modul mikrokontroller ... 75

Gambar 4.22. (a) Rangkaian lampu led dan (b) rangkaian transistor sebagai saklar ... 75

(22)

xix

DAFTAR TABEL

Tabel 2.1. Fungsi pin-pin pada Atmega8535[8] ... 13

Tabel 2.2. Fungsi alternatif Port B[8]... 14

Tabel 2.3. Fungsi alternatif Port C[8]... 14

Tabel 2.4. Fungsi alternatif Port D[8] ... 14

Tabel 2.5. Persamaan baud rate [10] ... 16 Tabel 2.6. Jenis-jenis IC Regulator 78xx[14] ... 20

Table 3.1. Spesifikasi Desktop Microphone SONIC GEAR dengan model DM150... 24 Tabel 3.2. Keterangan tampilan user... 36 Tabel 3.3. Konfigurasi port mikrokontroler ... 43 Tabel 3.4. Keterangan konversi kode ascii ke bilangan hexadesimal ... 43

Tabel 3.5. Konfigurasi keadaan program pengaturan nyala led hias ... 43

Tabel 4.1. Hasil tingkat pengenalan setelah pembagian data awal ... 59

Tabel 4.2. Tingkat pengenalan (%) untuk hasil nilai batas potong dan k-Nearest

Neighbor tanpa menggunakan lebar segment averaging ... 60 Tabel 4.3. Tingkat pengenalan (%) untuk hasil nilai batas potong dan segment

averaging tanpa menggunakan nilai k-Nearest Neighbor (K=1) ... 62 Tabel 4.4. Tingkat pengenalan (%) untuk hasil nilai batas potong dan segment tanpa

menggunakan nilai k-Nearest Neighbor (K=3) ... 63 Tabel 4.5. Tingkat pengenalan (%) untuk hasil nilai batas potong dan lebar segment

averaging tanpa menggunakan nilai k-Nearest Neighbor (K=5) ... 65 Tabel 4.6. Tingkat pengenalan (%) untuk hasil nilai batas potong dan segment

(23)

xx

Tabel 4.9. Hasil perhitungan jarak clark ... 72 Tabel 4.10. Hasil pengujian rangkaian catu daya ... 76

(24)

1

BAB I

PENDAHULUAN

1.1.

Latar Belakang

Zaman memang telah berubah, dari yang sebelumnya tanpa penerangan, sekarang malam pun bisa menjadi seperti siang. Hal ini terjadi karena keberadaan suatu benda yang biasa kita sebut dengan nama lampu. Lampu diciptakan dengan berbagai macam bentuk guna. Selain itu, ada banyak pilihan ukuran penerangan yang ditawarkan, masyarakat bisa menggunakan sesuai dengan kebutuhannya.

Lampu memang memberikan arti tersendiri bagi kehidupan manusia sekarang ini, selain sebagai alat penerangan, sistem keamanan, lampu juga dapat digunakan untuk membuat suatu tempat menjadi jauh lebih menarik untuk dipandang.

Sistem pengenalan ucapan suara manusia untuk pengeturan nyala LED hias merupakan salah satu contoh dari berbagai macam aplikasi penggunaan teknologi digital. Sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias ini memanfaatkan teknologi pengolahan sinyal dalam pengenalan ucapan manusia dengan menggunakan ekstraksi ciri DCT dan fungsi jarak clark, dan untuk hasil keluarannya LED hias tersebut akan diatur oleh sebuah mikrokontroller ATmega8535 yang berfungsi untuk memprogram bagaimana lampu LED akan menyala.

(25)

1.2.

Tujuan dan Manfaat Penelitian

Tujuan dari penulisan tugas akhir ini adalah menghasilkan sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias.

Manfaat dari penelitian ini adalah :

a. Sebagai software untuk mengenali ucapan suara “kanan”, “kiri”,”cepat”,”lambat”, “stop”.

b. Sebagai alat bantu berupa sebuah software bagi seseorang untuk mempermudah dalam pengaturan nyala LED hias.

c. Sebagai bahan untuk penelitian yang selanjutnya.

1.3.

Batasan Masalah

Sistem pengenalan ucapan suara manusia terdiri dari hardware dan software (komputer). Hardware mempunyai tiga fungsi yaitu untuk memasukkan ucapan suara manusia, untuk mengeluarkan output yang berupa nyala LED dan untuk menghubungkan antara komputer dengan mikrokontroller. Sedangkan software pada komputer berfungsi untuk mengatur semua proses pengenalan ucapan suara manusia dan software yang terdapat didalam mikrokontroler berfungsi untuk mengatur tampilan nyala LED.

Peneliti menetapkan beberapa batasan masalah yang dianggap perlu pada perancangan ini, yaitu sebagai berikut:

a. Menggunakan ekstraksi ciri DCT

b. Menggunakan fungsi jarak sebagai pembanding

c. Ucapan yang dikenali merupakan suara peneliti itu sendiri dan ucapan yg dikenali adalah ” kanan” ,” kiri” , “cepat” ,” lambat”,” stop” dan selain ucapan tersebut akan dikenali secara salah

d. Hasil pengenalan ucapan secara realtime. e. Jarak dari mulut ke mikrofon sekitar ± 10 cm

f. Menggunakan perangkat lunak komputasi (Matlab) dalam pembuatan program. g. Menggunakan mikrokontroler dari keluarga AVR

h. Pengolahan data menggunakan mikrokontroler ATmega8535

(26)

Komputer

j. Menggunakan LED 5 Voltberjumlah 30 buah yang berbentuk lingkaran. k. Menggunakan catu daya 12 Volt dan 5 Volt

l. Menggunakan fungsi jarak Clark.

1.4.

Metodologi Penelitian

Penulisan skripsi ini menggunakan metode :

a. Pengumpulan bahan–bahan referensi berupa buku–buku dan jurnal–jurnal.

b. Perancangan subsistem software. Tahap ini bertujuan untuk mencari bentuk model yang optimal dari sistem yang akan dibuat dengan mempertimbangkan dari berbagai faktor–faktor permasalahan dan kebutuhan yang telah ditentukan. Gambar 1.1 memperlihatkan blok model yang akan dirancang.

Gambar 1.1. Blok Model Perancangan

c. Pembuatan subsistem hardware dan software. Berdasarkan gambar 1.1 sistem akan bekerja jika mendapat input berupa suara manusia dengan menggunakan mikrofon yang akan diproses di soundcard menggunakan MATLAB kemudian menggunakan K-125R ke mikrokontroller, kemudian mikrokontroller akan mengatur nyala LED dengan program yang sudah ada di mikrokontroller tersebut.

SoundCard Pengenalan Ucapan

Mikrokontroler K-125 R Mikrofon

Ucapan Manusia

(27)

d. Analisa penyimpulan dan hasil percobaan. Analisa data dilakukan secara offline dalam menyelidiki pengaruh batas potong dan lebar segment averaging.Percobaan pengenalan dilakukan sebanyak 50 (lima puluh) kali. Penyimpulan dilakukan dengan mencari ukuran batas potong dan lebar segment averaging yang menghasilkan tingkat pengenalan yang tertinggi.

(28)

5

BAB II

DASAR TEORI

2.1

Suara

Suara adalah sebuah gelombang yang merambat melalui media perantara. Suara dapat dihantarkan dengan media air, udara maupun benda padat. Dengan kata lain, suara adalah gelombang yang merambat dengan frekuensi dan amplitudo tertentu. Suara yang dapat didengar oleh manusia berkisar antara 20 Hz sampai dengan 20 KHz, dimana Hz (Hertz) adalah satuan frekuensi yang artinya banyaknya getaran per detik.[1]

Sumber bunyi yang ada dalam tubuh manusia dipilah atas 3 bagian yaitu Rongga mulut, tenggorokan dan rongga badan. Pada gambar 2.1 artikulator pada saat produksi suara.

Gambar 2.1. Gambar artikulator pada saat produksi suara.

(29)

suara pada manusia yaitu proses oronasal, proses artikulasi, proses aliran udara dan proses pembunyian. Pada gambar 2.2 menunjukan tempat produksi suara.

Gambar 2.2. Gambar tempat produksi suara.

2.2

Sampling

Sampling merupakan proses pencuplikan gelombang suara yang akan menghasilkan gelombang diskret [3]. Dalam proses sampling, ada yang disebut dengan laju pencuplikan (samplingrate). Sampling rate menandakan berapa banyak pencuplikan gelombang analog dalam satu detik. Kriteria Nyquist perlu diperhatikan dalam melakukan sampling. Kriteria Nyquist menyatakan bahwa sebuah sinyal harus memiliki sampling rate yang lebih besar dari 2 dengan adalah frekuensi paling tinggi yang muncul di sebuah sinyal.

2.3

Windowing

(30)

mengurangi munculnya sinyal-sinyal frekuensi tinggi tersebut, maka tepi-tepi sinyal masukan perlu dikurangi kontinuitasnya dengan menggunakan windowing [4].

Jendela Blackman adalah suatu jendela yang dapat digunakan untuk keperluan windowing. Berikut Contoh jendela Blackman pada gambar 2.3.

Gambar 2.3. Contoh jendela Blackman [11]

Jendela Blackman w(n) dengan lebar N titik, dirumuskan secara matematis sebagai berikut [11]:

+ 1 = 0,42−0,5 cos 2π k

n1 + 0,008cos 4π

k

n1 , k = 0,…, n−1 (2.1)

Blackman windows mempunyai sedikit lebih luas pusat lobus dan sideband kebocoran setara panjang hamming dan hann windows.[11]

2.4

Discrete Cosine Transform (DCT)

(31)

dikodekan secara independen tanpa kehilangan efisiensi kompresi [4]. Definisi DCT yang paling umum panjang N adalah:

= ( ) � 2 −1 −1

2�

=1 , = 1,…,� (2.2)

Dengan :

=

1

� = 0

2

� ≠0

(2.3)

DCT sinyal hasil windowing terlihat lebih bersih, karena sinyal-sinyal frekuensi tinggi tidak tampak seperti gambar 2.4 berikut [4] :

Gambar 2.4. Contoh DCT dari sinyal dengan menggunakan DCT 256 titik [4].

2.5

Segment Averaging

(32)

Dalam contoh gambar 2.5. ukuran data sinyal adalah 2048 (211). Selanjutnya data sinyal tersebut dapat disegmentasi menggunakan lebar segment dengan kelipatan 2n ( dengan 1≤ n≤ 11 ). Keluarandariproses segment averaging adalah rata-rata dari setiap segment.

lebar 2n

Gambar 2.5. Contoh proses pembagian data dengan segment (��)

2.6

Jarak Clark

Fungsi jarak Clark berfungsi untuk mencari jarak minimumnya. Dengan rumus ini dapat mengetahui jarak antara database dan data masukan. Rumus fungsi jarak yang digunakan ditunjukkan pada persamaan dibawah ini .

= �− � � + �

2

�=

(33)

Di mana:

dclk = Jarak Clark

Pi = Nilai dari ekstraksi ciri citra masukan

= Nilai dari ekstraksi ciri Database n = Jumlah koefisien DCT

2.7

Metode Template Matching

Template Matching adalah sebuah operasi dalam pengenalan pola yang digunakan untuk menentukan ada tidaknya perbedaan antara dua entitas (titik,kurva atau bentuk) dari jenis template (acuan) yang sama. Secara umum template matching diartikan sebagai suatu cara untuk membandingkan dua deret angka untuk menentukan kesamaanya.[7]

2.8

Metode k-Nearest Neighbor

Alogarima yang disebut aturan tetangga terdekat atau biasa dikenal k – Nearest Neighbor ( k-NN ) diringkas sebagai berikut [2]. Sebuah fitur yang tidak diketahui vektor x dan jarak mengukur, kemudian:

a. Diluar vektor N(jarak) , identifikasi nilai k tetangga terdekat , terlepas dari label kelas,untuk masalah 2 kelas dipilih dari nilai k yang ganjil, dan biasanya bukan merupakan kelipatan dari banyaknya kelas M

b. Dari sampel k tersebut, identifikasi jumlah vektor ki yang termasuk dalam kelas ωi , I = 1,2,…, M . Dengan � � =

c. Tetapkan x untuk kelas ωi dengan jumlah ki terbanyak dari sampel.

2.9

Mikrofon

(34)

1. Prinsip cara kerja mikrofon dari jenis mikrofon itu sendiri.

2. Daerah respon frekuensi suara yang mampu dicuplik oleh mikrofon. 3. Sudut atau arah pencuplikan mikrofon.

4. Output sinyal listrik yang dihasilkan mikrofon. 5. Bentuk fisik mikrofon.

Gambar 2.6. Contoh mikrofon

2.10 Sound Card

Sound card adalah sebuah peranti keras yang terdapat di sebuah komputer . Piranti keras ini memungkinkan komputer dapat memproses suara melalui I/O yang terdapat pada piranti ini. Dalam beberapa perangkat komputer, sound card sudah terpasang di dalam sebuah komputer, tetapi dalam keperluan lain sound card dapat ditambahan pada slot PCI motherboard. Hampir semua kartu suara menggunakan standar MIDI (Musical Instrument Digital Interface) [3]. MIDI merupakan standar hardware dan software internasional untuk saling bertukar data (seperti kode musik) [4]. Pada setiap sound card memiliki:

1. Digital Signal Processor (DSP) yang akan menangani semua jenis komputasi. 2. Digital to Analog Converter (DAC) sebagai keluaran suara ke speaker.

3. Analog to Digital Converter (ADC) sebagai masukan suara. 4. Read Only Memory (ROM) atau Flash sebagai penyimpanan data.

5. Musical Instrument Digital Interface (MIDI) untuk menyambungkan beberapa peralatan musik eksternal.

(35)

Gambar 2.7. Contoh kartu suara

2.11 Modul Mikrokontroler AVR ATMega

Modul Mikrokontroler AVR adalah sistem mikrokontroler yang berbasis ATMega8535. Modul mikrokontroler dapat dilihat pada gambar 2.8.

Gambar 2.8. Modul mikrokontroler AVR ATMega

(36)

dilihat di Gambar 2.9. Dalam setiap pin mikrokontroler mempunyai fungsi yang berbeda-beda dan dapat dilihat pada tabel 2.1, tabel 2.2; tabel 2.3; dan tabel 2.4.

Gambar 2.9. Konfigurasi pin modul mikrokontroler AVR dengan Atmega8535. [8]

Tabel 2.1. Fungsi pin-pin pada Atmega8535. [8]

Pin Nama Pin Keterangan

10 VCC Masukan catu daya

11,31 GND Ground

33,34,35,36, 37,38,39,40

Port A (PA7:0)

Merupakan port I/O 8 bit dua arah dengan resistor pull-up internal tiap pinnya dan pin masukan ADC.

1,2,3,4,5,6,7,8 Port B (PC7:0)

Merupakan port I/O 8 bit dengan resistor pull-up internal tiap pinnya. Fungsi alternatif dari Port B dpat dilihat di pada Tabel 2.10.

9 RESET Merupakan port berfungsi untuk mereset mikrokontroler

20 Port D

(PD7:0)

Merupakan port I/O 8 bit dua arah dengan resistor pull-up internal tiap pinnya. Fungsi alternatif dari Port D dapat dilihat pada Tabel 2.9.

30 Avcc Merupakan pin tegangan untuk A/D converter. 32 AREF merupakan pin masukan tegangan referensi A/D

(37)

Tabel 2.2. Fungsi alternatif Port B. [8]

Pin Nama Pin Keterangan

1 PB0 T0 T1 (Timer/Counter External Counter Input)

XCK (USART External Clock Input/Output)

2 PB1 T1 (Timer/ Counter1 External Counter Input)

3 PB2 AIN0 (Analog Comparator Positive Input)

INT2 (External Interrupt 2 Input)

4 PB3 AIN1 (Analog Comparator Negative Input)

OC0 (Timer/Counter0 Output Compare Match Output)

5 PB4 SS (SPI Slave Select Input)

6 PB5 MOSI (SPI Bus Master Output/ Slave Input)

7 P6 MISO (SPI Bus Master Input/ Slave Output)

8 PB7 SCK (SPI Bus Serial Clock)

Tabel 2.3. Fungsi alternatif Port C. [8]

Pin Nama Pin Keterangan

22 PC0 SCL ( Two-wire Serial Buas Clock Line)

23 PC1 SDA ( Two-wire Serial Buas Data Input/Output Line)

24 PC2 Input/Output

25 PC3 Input/Output

26 PC4 Input/Output

27 PC5 Input/Output

28 PC6 TOSC1 ( Timer Oscillator Pin1)

29 PC7 TOSC2 ( Timer Oscillator Pin2)

Tabel 2.4. Fungsi alternatif Port D. [8]

Pin Nama Pin Keterangan

14 PD0 RXD (USART Input Pin)

15 PD1 TXD (USART Output Pin)

16 PD2 INT0 (External Interrupt 0 Input)

17 PD3 INT1 (External Interrupt 1 Input)

18 PD4 OC1B (Timer/Counter1 Output Compare B Match

Output) 19

PD5 OC1A (Timer/Counter1 Output Compare A Match Output)

20 PD6 ICP (Timer/Counter1 Input Capture Pin)

(38)

2.12 USART (Universal Synchronous and Asynchronous serial Receiver

and Transmitter) pada Atmega8535

Komunikasi USART (Universal Synchronous and Asynchronous serial Receiver and Transmitter) adalah fasilitas komunikasi serial yang disediakan oleh mikrokontroler Atmega8535, baik secara sikron maupun asinkron. Komunikasi serial sinkron adalah komunikasi antara mikrokontroler dengan peripheral lain di mana sinyal clock yang digunakan anatara transmitter dan receiver berasal dari satu sumber clock sendiri. Komunikasi USART dilakukan dalam mode full duplex (dua arah) antara transmitter dan receiver.[8]

(39)

Baud rate USART diatur pada register (UBRRn) yang dari register tersebut dapat dipilih prescaler untuk baud rate generator. Frekuensi keluaran baud rate=fosc / (UBRRn+1) , fosc adalah frekuensi clock sistem. Tabel 2.5 berisi perhitungan pengaturan register baud rate.[8]

Tabel 2.5. Persamaan baud rate [10].

(40)

2.13 Timer/Counter

Timer pada dasarnya hanya menghitung pulsa clock. Frekuensi pulsa clock yang dihitung tersebut bisa sama dengan frekuensi Kristal yang dipasang atau dapat diperlambat menggunakan prescaler dengan faktor 8, 64, 256 atau 1024. Mikrokontroler AVR ATmega8535 mempunyai tiga macam timer, yaitu timer/counter0 (8 bit), timer/counter1(16 bit), timer/counter2 (8 bit).[8]

Timer berhubungan erat dengan kata frekuensi, perioda dan duty cycle. Frekuensi adalah jumlah pulsa yang terjadi dalam satu satuan waktu. Perioda merupakan kebalikan dari frekuensi. Jika frekuensi dinyatakan dan ƒ, dan perioda dalam T maka hubungan antara keduanya adalah ƒ =1/T. Duty cycle (DC) adalah perbandingan antara pulsa (tH) dan perioda yang dinyatakan dalam persen.[8]

(2.5)

2.14 Transistor Sebagai Saklar

Pada keadaan aktif, transistor dapat berfungsi sebagai penguat arus dan pada keadaan saturasi dan cut-off, transistor dapat berfungsi sebagai saklar. Saat transistor berada dalam keadaan saturasi, transistor berfungsi sebagai saklar yang tertutup. Saat transistor dalam keadaan cut-off, transistor berfungsi sebagai saklar terbuka. Konfigurasi transistor sebagai saklar dapat dilihat pada Gambar 2.11.

Gambar 2.11. Transistor sebagai saklar

Konfigurasi transistor sebagi saklar mempunyai persamaan arus basis (IB):

(41)

Beta DC (β) atau sering disebut hfe pada transistor adalah rasio arus kolektor (IC) dengan

arus basis (IC). Persamaannya adalah :

� = (2.7)

Dari persamaan 2.30 dapat diperoleh persamaan untuk arus basis minimal (IBmin) yaitu:

� = (2.8)

Arus IC saturasi (ICsat) adalah arus kolektor ketika nilai VCE = 0, sehingga nilai ICsat dapat diperoleh dengan persamaan:

= � (2.9)

2.15 Lampu LED ( Light-Emitting Diode )

Sebuah LED adalah sejenis dioda semikonduktor yang dapat mengeluarkan energi cahaya ketika diberikan tegangan. LED mempunyai struktur yang sama dengan dioda, akan tetapi pada LED elektron melewati sambungan P-N. Untuk menyalakan sebuah lampu LED, membutuhkan arus sebesar 10mA-20mA dan tegangan sebesar 3V-5V. LED mempunyai tiga warna dasar yang banyak dijual dipasaran yaitu merah,hijau dan biru akan tetapi dalam perkembangannya LED sudah mempunyai banyak macam warna.

Gambar 2.12. LED ( Light-Emitting Diode ).

LED akan menyala bila ada arus listrik mengalir dari anoda menuju katoda. Semakin besar arus yang mengalir maka semakin terang nyala LED tersebut. Berikut rumus untuk menghitung resistor pada LED :

(42)

dengan V adalah tegangan, I adalah arus dan R adalah hambatan. Apabila ingin mencari nilai resistor, maka:

= � (2.11)

= (� −� ) (2.12)

dengan Vs adalah tegangan sumber dan Vd adalah tegangan kerja LED.

2.16 Modul Serial

Alat ini akan membantu kita dalam memprogram Mikrokontroler AVR semudah memasang sebuah USB konektor pada komputer PC/ Laptop kita. Kelengkapan seperti software AVRprog, AVR OSP II, CodeVision AVR, AVR Studio 4, Mikrobasic for AVR dan beberapa pendukung lainnya akan membantu kita dalam memprogram Mikrokontroler AVR/AT89. Jadi kapan pun dan dimanapun kita dapat melakukan pemrogramman Mikrokontroler AVR anda dengan mudahnya baik menggunakan OS windows XP, windows Vista dan windows 7 32/ 64bit [13].

Module K-125R memiliki spesifikasi:

a. Format file yang didukunng adalah *.hex b. Target In system Programmer (ISP)

c. Kompatibel dengan Windows XP, Windows Vista dan Windows 7

d. Didukung oleh software CodeVision AVR Evaluasi, AVR OSP II dan AVR Studio4.

e. Tidak membutuhkan catu daya tambahan dari luar.

f. Terdapat selector jumper untuk power board mikrokontroler AVR jika membutuhkan power dari USB untuk Men-download.

(43)

2.17 Voltage Regulators

IC secara luas dapat digunakan sebagai regulator tegangan. Unit regulator IC mengandung rangkaian sumber referensi, penguat komparator, perangkat pengendali dan perlindungan beban lebih. Keluaran unit regulator IC bisa berupa tegangan tetap positif, tegangan tetap negatif atau tegangan variabel [14].

Tegangan tetap positif dapat menggunakn IC dengan seri 78xx. IC seri ini menghasilkan keluaran dari +5 sampai +24. Gambar 2.14. menunjukkan kaki dari IC 78xx, dan Tabel 2.7. menunjukkan jenis-jenis IC regulator 78xx.

Gambar 2.14. Kaki IC 78xx [15]

Tabel 2.6. Jenis-jenis IC Regulator 78xx [14]

IC part Tegangan keluaran (V)

Tegangan masukan minimum (V)

7805 +5 7,3

7806 +6 8,3

7808 +8 10,5

7810 +10 12,5

7812 +12 14,6

7815 +15 17,7

7818 +18 21,0

7824 +24 27,1

(44)

Gambar 2.15. Rangkaian Regulator Tegangan +12 V [14]

Perhitungan nilai kapasitor C1 menggunakan persamaan:[14]

(2.13)

dengan

C = kapasitor dalam Farad

= arus beban dalam Ampere

f = frekuensi dalam Hz

�( ) = tegangan ripple rms dalam volt

Di mana nilai �( ) dapat dicari dengan menggunakan persamaan:[14]

(2.14)

dengan � ( − ) adalah tegangan ripple peak to peak yang merupakan selisih antara tegangan masukan regulator dengan tegangan masukan minimum IC regulator yang digunakan atau dapat dirumuskan sebagai berikut:[14]

(45)

dengan:

� = tegangan masukkan regulator dalam volt

� � = tegangan masukkan minimum IC regulator

Apabila tegangan masukan regulator berasal dari tegangan AC yang kemudian disearahkan menggunakan dioda, nilai � dicari menggunakan persamaan:[14]

(2.16)

dengan � merupakan nilai tegangan AC yang sudah diturunkan menggunakan trafo step-down (volt) dan adanya nilai 1,4 karena menggunakan dioda sebagai penyearah.

2.18 MATLAB

(46)

23

BAB III

PERANCANGAN

3.1. Sistem Pengenalan Ucapan Suara Manusia Untuk Pengaturan

Nyala LED Hias

Sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias mengunakan 2 macam software untuk dipergunakan sebagai user interface dan sebagai bahasa pemrograman. Software yang digunakan sebagai user interface yaitu program bernama MATLAB dan software yang digunakan sebagai bahasa pemrograman yaitu menggunakan program CodeVision AVR. Kedua software tersebut bertujuan untuk mempermudah user untuk melakukan pengenalan suara manusia dan mengaturan nyala LED hias.

Sistem pengenalan ucapan suara manusia dilakukan secara real time. Dalam sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias memerlukan beberapa komponen yang diperlukan untuk mendukung sistem, yaitu mikrofon, soundcard yang sudah terdapat dalam komputer. Gambar 3.1 memperlihatkan Diagram Blok dari keseluruhan sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias.

(47)

3.1.1

Ucapan Manusia

Suara manusia berfungsi sebagai sumber suara dalam sistem ini. Dalam sistem ini suara manusia bersumber dari suara yang dikeluarkan oleh peneliti. Suara yang dikeluarkan peneliti berkisar antara 20 Hz sampai dengan 20 KHz, dan ucapan yang akan dikenali adalah kanan, kiri, cepat, lambat dan stop.

3.1.2

Mikrofon

Mikrofon yang digunakan adalah jenis desktop microphone SONIC GEAR dengan model DM150 (gambar 2.7). Desktop microphone daya tangkap yang baik jika jarak antara sumber suara dengan mikrofon sekitar + 10 cm. Penentuan jarak mikrofon dengan sumber suara berdasarkan berapa kali peneliti melakukan percobaan. Spesifikasi dari desktop mikrofon SONIC GEAR dengan model DM150 terdapat pada tabel 3.2.

Table 3.1 Spesifikasi Desktop Microphone SONIC GEAR dengan model DM150

Frequency Response 50 Hz -13 KHz

Sensitivity -58 dB - +3 dB

Operating Range 2V – 8V

S/N Ratio >50 db

Audio Output Connector 3.5 mm

3.1.3

Soundcard

Soundcard berfungsi suatu jenis transduser yang mengubah gelombang suara menjadi sinyal listrik atau mengubah sinyal analog dari mikrofon menjadi sinyal digital. Dalam proses mengubah dari sinyal analog ke digital kemudian disimpan diperlukan pengaturan sampling rate. Pengaturan sampling rate dapat dilakukan didalam program dalam software MATLAB.

3.1.4

Proses Perekaman

(48)

P rep ro cess in g

manusia yaitu sbesar 3000 Hz kemudian dikalikan dua, perekamannya selama 1,5 detik, dan sepuluh kali perekaman.

3.1.5

Pengenalan Suara

Dalam proses pengenalan suara ini, suara peneliti akan terekam dan dikenali. Proses ini suara akan terekam secara real time, data input berupa *.Wav dan dari perekaman tersebut akan menghasilkan keluaran yang berupa nyala LED hias. Proses ini menggunakan beberapa subproses sampling, pemotongan sinyal, jendela blackman, ekstraksi ciri, k-Nearest Neighbor, fungsi jarak dan keluaran. Pada Gambar 3.2. adalah diagram blok sistem pengenalan.

Gambar 3.2. Diagram Blok sistem pengenalan ucapan

3.1.5.1

Perekaman

Proses perekaman ini berfungsi sebagai data masukan uang berupa suara manusia yang berupa sinyal analog kemudian akan diubah menjadi sinyal digital ketika melalui soundcard yang terdapat di dalam komputer. Suara direkam dengan memakai frekuensi sampling sebesar 6000 Hz, frekuensi ini ditentukan berdasarkan frekuensi suara yang dapat dihasilkan manusia dari 300 – 3000 Hz dilanjutkan dengan berdasar kriteria Nyquist yaitu minimal frekuensi sampling harus dua kali dari frekuensi sebenarnya.

� ≥2� (3.1)

� ≥2 × 3000 (3.2)

� ≥6000 (3.3)

Ekstraksi ciri Jarak Clark

Output Pengenalan Ucapan

Database Ucapan Manusia

Perekaman

Pemotongan Sinyal Normalisasi

Jendela Blackman Zero Padding

(49)

Maka dengan batas maksimal frekuensi manusia yang dapat didengar yaitu 3000 Hz, maka batas maksimal frekuensi tersebut kemudian dikalikan dua yaitu menjadi 6000 Hz. Dalam sekali perekaman peneliti membutuh 1,5 detik dikarenakan untuk setiap kali perekeman, peneliti mengucapkan 2 suku kata.

3.1.5.2 Suara Uji

Suara uji ini merupakan suara terekam yang bertujuan untuk menjalankan proses program secara offline. Suara uji ini untuk menentukan nilai batas potong dan lebar segment averaging, agar mendapatkan hasil pengenalan ucapan yang paling baik. Gambar 3.3. menunjukan pembuatan suara referensi sama dengan pembuatan suara uji.

3.1.6. Preprocessing

a. Normalisasi

Pada proses normalisasi ini berfungsi untuk menyamakan besar nilai amplitudo dalam setiap database. Dalam proses ini setiap database akan mempunyai besar skala amplitudo puncak sebesar 1 dan -1 dan skala yang lainnya akan menyesesuaikan. Dalam proses normalisasi ini mengunakan rumus (3.4) untuk menyamakan skala amplitudo puncak :

� = �� ( )

max⁡( � ) (3.4) b. Pemotongan Sinyal

Dalam proses perekaman, sering kali adanya data sebelum dan sesudah data ucapan peneliti yang terdapat dalam setiap perekaman. Proses pemotongkan data ucapan ditentukan oleh variabel batas potong pada program peneliti. Dalam proses ini akan menghasilkan data yang berisi ucapan saja.

c. Jendela Blackman

(50)

d. Zero Padding

Dalam proses ini berfungsi sebagai penyamaan jumlah data sinyal dalam setiap database. Dengan cara menambahkan deretan nilai nol setelah data yang berisi ucapan. Penambahan deretan nilai nol tersebut ditentukan dengan rumus 2n , disebabkan dalam sinyal suara dibagi dalam beberapa grup darri n sampel, dimana n dapat mengambil nilai sebasar 64, 128, 256, 512, 1024, 2048, 4096 dan 8192.

3.1.7 Ekstrasi Ciri

Discrete Cosine Transform berfungsi sebagai proses ekstraksi ciri. Teknik ini untuk mengubah sinyal ke dalam komponen frekuensi dasar. Discrete Cosine Transform proses ekstraksi ciri suatu data suara maupun gambar. Setelah mengekstraksi ciri, setiap koefisien transform dapat dikodekan secara independen tanpa kehilangan efisiensi kompresi.

3.1.8 Jarak Clark

Proses ini untuk membandingkan suara manusia yang terekam dengan 10 nada referensi yang terdapat di database. Hasil yang diperoleh dari perbandingan yaitu jarak minimum dengan suara terekam, yang kemudian akan digunakan dalam proses selanjutnya. Dalam proses ini peneliti menggunakan fungsi jarak Clark.

3.1.9 Proses k-Nearest Neighbor (k-NN)

Dalam proses ini hasil dari pembanding fungsi jarak kemudian k-Nearest Neighbor (k-NN) akan mengurutkan hasil perhitungan jarak dari nilai yang paling kecil sampai yang besar. Hasil nilai yang paling terkecil atau paling minimum akan diambil sesuai dengan banyaknya k seperti 1, 3, 5, dan 7.

3.1.10 Output Pengenalan Ucapan Manusia

(51)

P

rep

ro

cess

in

g

3.2 Perancangan Referensi Ucapan

Dalam proses pengenalan ucapan manusia ,dibutuhkan suara acuan yang disebut nada referensi. Nada referensi diperlukan sebagai database yang nantinya akan dibandingkan dengan suara yang akan dikenali, proses pembandingan ini terdapat dalam subproses fungsi jarak. Dalam memeperoleh nada referensi pada setiap jenis ucapan yang akan dikenali pada sistem pengenalan ucapan manusia, peneliti mengambil 10 sample pada setiap jenis ucapan ( ucapan kanan, kiri, cepat, lambat, stop ). Bahwa sepuluh sample tersebut diasumsikan bahwa sudah cukup untuk mendapatkan variasi ucapan normal. Pengambilan suara ucapan yang akan dijadikan suara referensi melalui proses perekaman, preprocessing dan ekstraksi cirri DCT.

Gambar 3.3. Diagram blok proses pengambilan suara referensi

3.3 Perancangan Sistem Software

Dalam sistem pengenalan ucapan suara manusia untuk pengaturan nyala LED hias menggunakan beberapa subproses yang akan dilalui dalam melakukan pengenalan ucapan. Pada gambar 3.4. ini memperlihatkan alur proses yang dimulai dari perekaman sampai dengan output pengenalan Ucapan.

Ekstraksi Ciri Hasil Ekstraksi Ciri Ucapan Manusia

Perekaman

Pemotongan Sinyal Normalisasi

(52)

P

rep

ro

cess

in

g

Gambar 3.4. Diagram blok keseluruhan proses

3.3.1 Proses Perekaman

Dalam proses rekam peneliti menentukan panjang frekuensi dan panjang durasi waktu rekam, kemudian baru memulai proses perekaman, kemudian melalui proses sampling. Panjang pencuplikan dalam proses ini sebesar 6000 Hz, nilai tersebut berasal dari perkalian antara frekuensi sampling dan waktu pencuplikan. Hasil output proses berupa *.wav . Pada gambar 3.5.menunjukan diagram alir proses perekaman.

Gambar 3.5. Diagram alir proses perekaman Ekstraksi Ciri

Jarak Clark k-Nearest Neighbor Output Pengenalan Ucapan

Database Ucapan Manusia

Perekaman

Pemotongan Sinyal Normalisasi

(53)

3.3.2 Pre-processing

Pada proses Pre-processing ini merupakan proses dimana hasil perekaman yang berupa data sinyal dan akan dikondisikan supaya sinyal lebih baik. Macam-macam subproses Pre-processing dapat dilihat pada gambar 3.6.

Gambar 3.6. Diagram alir proses pre-processing

a. Normalisasi

(54)

Gambar 3.7. Diagram alir proses normalisasi

b. Pemotongan Sinyal

Pada proses ini masukan yang berupa data ucapan yang sudah ternormalisasi, data ucapan akan dipotongan dibagian awal dan akhir data, dan akan menghasilkan keluaran yang berupa data ucapan yang hanya menyisakan data yang berisi ucapan saja. Padagambar 3.8diagram alir proses pemotongan sinyal.

Pada proses ini, pemotongan sinyal tergantung nilai batas potong yang terdapat di M-file. Proses pemotongan pertama adalah data sinyal di bagian awal akan dipotong dan kemudian posisi data sinyal akan diputar dari kanan ke kiri kemudian dipotong lagi sesuai batas potong, kemudian data sinyal yang hanya menyisakan data sinyal yg berisi data ucapan dibalik seperti semula.

(55)

c. Jendela Blackman

Dalam proses windowing yang menggunakan jendela blackman. Proses ini menggunakan masukan yang berasal dari pemotongan sinyal. Gambar 3.9. dibawah ini merupakan diagram alir dari proses windowing. Pada gambar 3.9. diagram alir proses Jendela Blackman.

Gambar 3.9. Diagram alir proses jendela blackman

d. Zero Padding

Dalam proses zero padding ini mendapatkan masukan yang berasal dari proses windowing. Pada proses ini panjang sinyal antara setiap database akan berbeda, maka proses zero padding ini akan menyamakan panjang satiap database. Zero padding merupakan proses pengolahan sinyal digital untuk menyamakan panjang gelombang yang berisi data ucapan dengan menambahkan deretan nilai nol didepan setiap database, panjangnya data dapat menggunkan rumus 2n . Alur program zero padding terdapat di gambar 3.10.

(56)

3.3.3 Ekstraksi Ciri

Discrete Cosine Transform berfungsi sebagai proses ekstraksi ciri. Pada proses ini terdapat dua macam proses yaitu transformasi, absolut DCT dan log DCT. Dalam proses ini transformasi yang digunakan adalah transformasi Discrete Cosine Transform ( DCT ). Dalam proses ini terdapat proses segment averaging yang berfungsi untuk mendapatkan hasil yang lebih baik dan agar dalam pengecekkan hasil DCT dapat lebih mudah. Pada gambar 3.11.menunjukandiagram alir proses ekstraksi ciri.

Gambar 3.11. Diagram alir proses ekstraksi ciri

3.3.4 Perhitungan Jarak

Dalam proses pembanding jarak ini mendapat masukan dari hasil ekstrasi ciri dan dari database. Dalam proses ini membandingkan dua variabel antara nada referensi dan nada terekam kemudian daftar perhitungan dari perbandingan kedua variabel akan digunakan sebagai hasil keluaran dalam pengenalan ucapan. Gambar 3.12 berikut adalah alur program perhitungan fungsi jarak clark.

(57)

Mencari sejumlah k jarak terkecil INPUT:

Hasil Perhitungan Jarak MULAI

Pemilihan nilai k=1, 3, 5, dan 7

Sortir jarak dari yang paling kecil ke yang paling besar

Keluaran= kelas yang paling sering muncul

OUTPUT:

Hasil k-Nearest Neighbor (k-NN)

SELESAI

Mencari sejumlah kelas dari sejumlah k jarak terkecil tersebut

3.3.5 Proses k-Nearest Neighbor (k-NN)

Dalam proses ini hasil dari pembanding fungsi jarak kemudian k-Nearest Neighbor (k-NN) akan mengurutkan hasil perhitungan jarak dari nilai yang paling kecil sampai yang besar. Hasil nilai yang paling terkecil atau paling minimum akan diambil sesuai dengan banyaknya k seperti 1, 3, 5, dan 7. Hasil dari pemilihan k tersebut akan mengeluarkan urutan sampel yang sesuai dengan urutan hasil pembanding fungsi jarak yang sudah berurutan dari nilai terkecil sampai terbesar dan hasil dan hasil urutan nomor sampel. Setelah itu yang di ambil nilai kelas yang paling banyak muncul yang akan menjadi penentuan keluaran jenis ucapan yang dikenal.

(58)

Dalam penentuan keluaran merupakan proses terakhir dari sistem software pengenalan ucapan manusia untuk mengatur nyala LED hias. Penentuan keluaran ini mempunyai keluaran yang berupa data hasil pengenalan suara. Ditentukan berdasarkan kelas yang paing banyak muncul dengan menggunakan metode K-nearest neiber. Setelah itu hasil dari nilai kelas yang paling banyak muncul tersebut akan menjadi keluaran berupa teks yang berupa jenis ucapan suara (cepat, lambat, kanan, kiri dan stop).

3.3.6 Output Pengenalan Ucapan

Dalam proses ini hasil dari inisialisasi hasil keluaran kemudian akan dikirimkan ke mikrokontroler melalui modul K-125R secara serial. Setelah diterima oleh mikrokontroler kemudian diproses untuk menentukan aksi dalam mengatur nyala LED hias. Alur program pengenalan ucapan dapat dilihat pada gambar 3.14.

Gambar 3.14. Diagram alir proses output pengenalan ucapan

3.3.7 Tampilan Pengenalan Ucapan

(59)

Gambar 3.15. Tampilan user Tabel 3.2. Keterangan tampilan user

NO. NAMA BAGIAN KETERANGAN

1 PLOT HASIL

PEREKAMAN Tampilan grafik untuk suara hasil perekaman

2 PLOT HASIL EKSTRAKSI

CIRI DCT Tampilan grafik hasil ektraksi ciri DCT

3 NILAI kNN Untuk memilih nilai K-nearest neiber

4 NILAI BATAS POTONG Untuk memilih nilai batas potong 5 HASIL PENGENALAN Menunjukkan hasil pengenalan suara

6 NILAI SEGMENT

AVERAGING Untuk memilih nilai segment averaging

7 REKAM Tombol tekan untuk memulai perekaman

8 RESET Tombol tekan untuk mengulang proses dari awal

9 KELUAR Tombol tekan untuk mengakhiri aplikasi atau

keluar aplikasi

3.4

Perancangan Sistem Hardware

(60)

Sistem hardware

Gambar 3.16. Diagram blok sistem hardware

3.4.1

Perancangan Catu Daya

Rangkaian catu daya memperoleh sumber tegangan dari jala-jala listrik PLN. Tegangan AC 220 volt harus diturunkan terlebih dahulu melalui trafo 1 Ampere. Penurunan tegangan menjadi sekitar 15 volt. Tegangan AC tersebut kemudian disearahkan oleh dioda bridge, sehingga menghasilkan gelombang penuh. Rangkaian catu daya yang digunakan menghasilkan tegangan catu sebesar +12 dan +5 volt. Catu daya digunakan untuk memberikan suplai tegangan ke seluruh sistem hardware alat.

IC regulator yang digunakan untuk menghasilkan tegangan keluaran +12 dan +5 volt adalah IC 7812 dan 7805. Rangkaian catu daya yang digunakan bisa dilihat pada Gambar 3.14.

Nilai kapasitor C1 dihitung dengan menggunakan persamaan 2.13, dengan sebesar 1 A dan frekuensi 50 Hz. Nilai �( )dihitung menggunakan persamaan 2.14, � ( − ) dihitung mengggunakan persamaan 2.15, dan � dihitung menggunakan persamaan 2.16. Berikut perhitungan yang dilakukan untuk mencari nilai kapasitor C1.

a. LM7812

� = � 2−1,4 � = 15 2−1,4 � = 19,8 �

Mikrokontroler Modul Serial

Rangkaian lampu LED Catu Daya

INPUT

(61)

� − = � − � � − = 19,8−14,6 � − = 5,2 �

=

� ( − )

2 3

=

5,2

2 3

= 1,5

1

=

4 3∗ ∗�( ) 1

=

1 4 3∗50∗1,5

1 = 1924 µ�

b. LM7805

� = � 2−1,4 � = 15 2−1,4 � = 19,8 �

� − = � − � � − = 19,8−7,3 � − = 12,5 �

=

� ( − )

2 3

=

12,5

2 3

= 3,61

2

=

4 3∗ ∗� ( )

2

=

1 4 3∗50∗3,61

(62)

Kapasitor C1 1924 µF dan kapasitor C2 799 μF tidak ada di pasaran, sehingga digunakan kapasitor C1 2200 μF dan kapasitor C2 1000 µ F. Nilai kapasitor C1 dan C2 merupakan nilai kapasitor minimum yang dibutuhkan oleh rangkaian regulator yang akan dirancang, sehingga digunakan kapasitor yang lebih besar. Semakin besar nilai kapasitansi C, nilai tegangan ripple juga akan semakin kecil. Nilai kapasitor C3 dan C4 adalah 0,1µ F diperoleh dari datasheet [16]. Pada gambar 3.17. menunjukan rangkaian catu daya.

Gambar 3.17. Rangkaian Catu Daya

3.4.2

Modul Serial

Modulserial ini digunakan untuk proses pengiriman data hasil keluaran pengenalan suara, yang akan dikirim secara serial menuju mikrokontroler. Data yang berasal dari program Matlab berupa teks akan di coding dalam bentuk karakter angka. Jika keluaran teks menampilkan ucapan sebagai berikut :

(63)

Gambar 3.18. Diagram alir komunikasi serial

3.4.3 Perancangan Mikrokontroler

(64)

Gambar 3.19. Minimum sistem ATmega8535

Pada perancangan minimum sistem ATmega8535 ini menggunakan osilator external yang berguna untuk menentukan kecepatan proses yang dilakukan oleh mikrokontroler dengan sumber clock yang mengendalikan mikrokontroler tersebut. Untuk menentukan frekuensi osilatornya dengan cara menghubungkan Kristal dengan pin 13(XTAL1) dan pin 12(XTAL2) serta dua buah kapasitor ke ground.

Besar kapasitansi disesuaikan dengan spesifikasi ATmega8535 yang terdapat pada datasheet, maka dengan menggunakan Kristal 12 MHz nilai kapasitor yang digunakan sebesar 22pF. Rangkaian clock external terdapat pada gambar 3.20.

(65)

Pada perancangan minimum sistem ATmega8535 ini juga menggunakan sebuah rangkaian reset, yang berfungsi untuk memaksa proses kerja pada mikrokontroler dapat diulang prosesnya dari awal. Saat tombol reset ditekan, mikrokontroler mendapat input logika rendah, sehinga proses akan dimulai dari awal kembali. Pada gambar 3.21. menunjukan rangkaian reset Atmega8535

Gambar 3.21. Rangkaian reset Atmega8535

Resistor dan kapasitor berfungsi untuk menunda waktu tegangan masuk ke reset. Kapasitor yang terdapat pada rangkaian reset berfungsi sebagai waktu jeda antara reset ekternal dengan masukan VCC, dikarenakan waktu yang dibutuhkan reset eksternal tidak bersamaan dengan waktu masukan VCC. Untuk memperoleh waktu pengisian 47us dengan menggunakan kapasitor (C2) sebesar 10nF, nilai resistor minimum dapat dihitung dengan persamaan

T=R×C

1 = 47

10 �

= 4700 Ω

3.4.3.1 Perancangan Input-Output Sistem ATmega8535

(66)

Tabel 3.3. Konfigurasi port mikrokontroler

FUNGSI Hardware Port yang digunakan

INPUT Penerima serial PORTD.0

OUTPUT

Lampu LED PORTA.0-PORTA.7

Lampu LED PORTB.0-PORTB.7

Lampu LED PORTC.0-PORTC.7

Lampu LED PORTD.2-PORTD.7

Pengirim serial PORTD.1

3.4.3.2 Alur Program Pengaturan Nyala LED Hias

Dalam proses pengiriman data dari matlab menuju ke mikrokontroler, terjadi pengubahan bentuk data yang berasal dari matlab berupa teks hasil proses pengenalan ucapan mejadi data berupa kode ascii dan dikonversi lagi menjadi bentuk hexa desimal sehingga dapat dikenali oleh mikrokontroler. Tabel 3.4 menunjukan inisialisasi dari keluaran pengenalan ucapan peneliti. Pada tabel 3.5 menjelaskan kondisi keadaan program pengaturan nyala led yang mempunyai tingkat kecepatan sebanyak lima tingkat.

Tabel 3.4. Keterangan konversi kode ascii ke bilangan hexadesimal.

Pengenalan Kode Ascii Bilangan Hexadesimal

Kanan K 4B

Kiri I 49

Cepat C 43

Lambat L 4C

Stop S 73

Tabel 3.5. Konfigurasi keadaan program pengaturan nyala LED hias

Kanan

Kiri

Cepat

Lambat

Stop

L

0

L

1

kanan

x

x

x

x

L

1

kanan

L

1

kanan

L

1

kiri

L

2

kanan

L

1

kanan

L

0

L

1

kiri

L

1

kanan

L

1

kiri

L

2

kiri

L

1

kiri

L

0

L

2

kanan

L

2

kanan

L

2

kiri

L

3

kanan

L

1

kanan

L

0

L

2

kiri

L

2

kanan

L

2

kiri

L

3

kiri

L

1

kiri

L

0

L

3

kanan

L

3

kanan

L

3

kiri

L

3

kanan

L

2

kanan

L

0
(67)

Keterangan tabel 3.5 sebagai berikut :

L0 : menunjukan keadaan awal atau LED tidak berputar

(68)

Ga

mbar

3.

2

2.

Dia

gr

am

a

li

r

P

enga

tur

an

nya

la

L

E

D

(69)

3.4.4 Alur Program untuk Pulse Width Modulation

Dalam proses ini rangkaian 30 LED yang berbentuk lingkaran akan diprogram dengan software CodeVision AVR. Dalam program bertujuan agar LED dapat berjalan sesuai dengan keinginan peneliti. Dalam mensetting Timer0 dan Timer2 peneliti menggunakan mode normal.

Pada gambar 3.23. dapat dilihat lebih jelas diagram alir untuk Pulse Width Modulation tersebut. Dalam diagram alir ini dimulai dari inisialisasi timer, posisi led,kecepatan, nomor led, serial dan nilai set untuk led, kemudian akan langsung proses penentuan arah kanan ,kiri dan stop. Kemudian pencacahan ini berfungsi untuk mensetting cepat dan lambatnya perpindahan antar lampu led, dalam proses pencacahan jika nilai yang berada pada TCNT2 bernilai nol maka clock

Referensi

Dokumen terkait

Dalam transaksi efek di pasar reguler, tanggal timbulnya perikatan transaksi berbeda dengan tanggal penyelesaian transaksi. Risiko, manfaat dan potensi ekonomi timbul pada tanggal

Berdasarkan hasil analisis dengan menggunakan uji Kruskal-Wallis diperoleh tidak terdapat perbedaan kepadatan telur di dalam rumah berdasarkan warna ovitrap pada ketinggian

Mengingat manajemen sumber daya manusia (MSDM) merupakan bagian dari sebuah lingkungan manajemen, maka pemgertian MSDM itu dapat disimpulkan sebagai berikut; manajemen sumber

Kepentingan- kepentingan tersebut antara lain, mendominasi pasar energi Eropa melalui Turki, menguasai pasar energi Turki secara penuh dan menghalangi negara Asia

Bagaimana pengaruh interaksi gula pasir dan starter terhadap sifat fisikokimia (warna, viskositas dan pH) dan organoleptik (rasa, warna dan kenampakan) fruit

Apakah belajar fisika menggunakan aplikasi ini (SiJaKa) lebih menarik daripada metode belakar fisika yang selama ini anda

Harsono, Boedi, Hukum Agraria Indonesia, Sejarah Pembentukan Undang-Undang Pokok Agraria, Isi dan Pelaksanaannya , Jakarta: Djambatan, 2005.. Hustiati, Agrarian Reform di

Penelitian ini bertujuan untuk mengetahui timbulnya pembengkakan berbentuk kista di pusat retina yang timbul setelah operasi katarak dengan pemeriksaan alat optical