• Tidak ada hasil yang ditemukan

BAB III PERANCANGAN PENELITIAN

3.2. Perancangan Pengenalan Ucapan

3.2.1 Perancangan Software

3.2.1.1 Proses pengenalan ucapan

Proses pengenalan ucapan merupakan ucapan manusia sebagai input pengenalan yang direkam akan dikenali ucapannya. Proses ini terdiri dari sampling, pre-processing, ekstraksi ciri, database, fungsi jarak (pembanding), penentuan keluaran dan pengiriman data secara serial. Proses pengenalan ucapan dapat dilihat pada gambar 3.3.

1. Sampling

Proses sampling merupakan proses pencuplikan ucapan manusia. Pencuplikan ucapan manusia dipengaruhi oleh frekuensi sampling dan banyaknya waktu pencuplikan. Ucapan manusia memiliki rentang frekuensi 250 – 3000 Herzt[18]. Frekuensi ucapan manusia tertinggi 3000 Hertz, agar dapat tercuplik dengan baik maka, frekuensi sampling ucapan sebesar 6000 Hertz. Frekuensi sampling dapat dirumuskan dengan aturan Nyquist sebagai berikut :

(3.1)

(3.2)

Banyaknya waktu pencuplikan dapa proses sampling ditentukan sebesar 1.5 detik. Rentang waktu ini digunakan untuk lamanya proses perekaman. Dengan waktu tersebut cukup untuk melakukan proses perekaman, sehingga data sinyal ucapan yang disampling tidak terpotong. Proses pencuplikan ucapan dapat dilihat pada gambar 3.4.

Gambar 3.4 Flowchart Proses Pencuplikan Ucapan

Panjang pencuplikan merupakan banyaknya jumlah data sinyal ucapan yang tercuplik selama rentang waktu pencuplikan . Panjang pencuplikan ini diperoleh sebagai berikut:

(3.4)

(3.5) 2. Pre-processing

Pre-processing merupakan proses pengkondisi sinyal data ucapan pengenalan maupun database. Proses pre-processing ini meliputi proses normalisasi, pemotongan sinyal, windowing dan zero padding. Proses pre- processing ini dapat dilihat pada gambar 3.5.

Gambar 3.5 Flowchart Proses Pre-processing

a. Normalisasi

Proses normalisasi berfungsi untuk menyetarakan besar amplitudo data ucapan pengenalan ucapan maupun database, sehingga efek dari kuat lemahnya suara pengucapan tidak terlalu mempengaruhi pada proses pengenalan. Besar amplitudo maksimum ini bernilai 1 atau -1 dan amlipitudo yang lain menyesuaikan skala tersebut. Proses normalisasi ditunjukkan pada gambar 3.6.

Gambar 3.6 Flowchart Proses Normalisasi

Pada proses normalisasi hasil pencuplikan ucapan akan akan disamakan nilai amplitudo dengan skala maksimum amplitudo maksimum 1 atau -1 menggunakan rumus normalisasi sebagai berikut :

( ) (3.6)

b. Pemotongan sinyal

Proses pemotongan sinyal ini untuk menghilangkan atau memotong sinyal yang bukan merupakan data ucapan. Tujuan dari proses ini untuk mendapatkan data ucapan yang diperlukan. Proses pemotongan sinyal memiliki variabel batas potong yang bertujuan untuk membatasi data sinyal ucapan yang akan dipotong. Pemotongan sinyal ini terdiri dari dua tahap, yaitu pemotongan sinyal sebelah kiri dan sebelah kanan. Proses pemotongan sinyal ditujukkan pada gambar 3.7.

Gambar 3.7 Flowchart Proses Pemotongan Sinyal

Hasil normalisasi akan masuk dalam proses pemotongan sinyal. Proses pertama diakukan adalah memotong sinyal pada sebelah kiri. Setelah memotong sinyal pada sebelah kiri, proses berikutnya memotong sinyal pada sebelah kanan. Kedua proses pemotongan sinyal ini ditentukan oleh variabel batas potong dengan batas potong 0,1; 0,2; 0,3 dan 0,4.

c. Windowing

Proses windowing merupakan proses perkalian antar elemen.

Windowing ini berfungsi untuk mengurangi efek diskontiunitas dari data sinyal dari hasil perekaman. Dalam perancangan ini jenis windowing yang digunakan adalah Hanning window. Proses windowing ditunjukkan pada gambar 3.8.

d. Zero padding

Zero padding adalah proses yang digunakan untuk menyamakan panjang data sinyal setelah proses pemotongan sinyal. Pada proses pemotongan sinyal, banyak terjadi perbedaan panjang sinyal data, sehingga proses zero padding menambah jumlah data sinyal dengan nilai 0 sesuai dengan panjang yang ditentukan. Panjang ukuran sinyal ditentukan oleh bilangan 2n . Proses zero padding ditunjukkan pada gambar 3.9.

Gambar 3.9 Flowchart Proses Zero Padding

Proses zero padding merupakan proses akhir dari proses pre- processing. Jika panjang sinyal data diperoleh 1641 data, maka panjang ukuran sinyal data untuk sinyal data tersebut adalah 211 atau 2048 data. Setelah data ke 1641 akan bernilai 0 sampai data ke 2048.

3. Ekstraksi ciri

Proses ekstraksi ciri terdiri dari proses downsampling dan transformasi. Proses downsampling bertujuan untuk mencuplik data sinyal ucapan menjadi lebih sedikit. Banyaknya data yang dicuplik dalam proses ekstraksi ciri ditentukan oleh nilai faktor downsampling. Variabel nilai faktor downsampling ditentukan 1 , 2 dan 4.

Data sinyal ucapan pertama sampai dengan data sinyal terakhir akan dicuplik sebesar nilai faktor downsampling yang telah ditetukan. Setelah data sinyal ucapan tercuplik dalam proses downsampling, proses selanjutnya adalah proses transformas, transformasi yang digunakan adalah transformasi DCT ( Discrete Cosine transform). Flowchart ekstraksi ciri ditunjukkan pada gambar 3.10.

Gambar 3.10 Flowchart Proses Ekstraksi Ciri 4. Pembanding

Proses pembanding ini untuk menghitung jarak data sinyal ucapan pada pengenalan dan database ucapan. Proses pembanding ini menggunakan perhitungan jarak dengan fungsi jarak Euclidean. Proses pembanding ini digunakan sebagai penentu hasil pengenalan ucapan. Hasil keluaran ini adalah nilai minimum dari proses pembanding pada data pengenalan dan database. Proses pembanding ini ditunjukan pada gambar 3.11.

Gambar 3.11 Flowchart Proses Pembandingan 5. Penentuan keluaran

Pada proses penentuan keluaran ini hasil pengenalan ucapan ditentukan oleh jarak yang paling minimum yang diperoleh dari nilai jarak minimum dalam proses pembandingan. Hasil jarak minimum pengenalan ucapan akan ditampilkan dalam bentuk teks. Proses penentuan keluaran ditunjukkan pada gambar 3.12.

6. Pengiriman data secara serial

Proses pengiriman data secara serial ini merupakan proses terakhir pada

software Matlab. Proses ini berfungsi untuk mengirimkan hasil keluaran ditentukan pada proses penentuan keluaran. Data berupa teks yang ditampilkan keluaran akan di coding dalam bentuk karakter angka. Jika keluaran teks menampilkan ucapan berikut :

a. Hidup maka akan di coding dengan karakter “1”

b. Mati maka akan di codingdengan karakter “2”

c. Cepat maka akan di codingdengan karakter “3”

d. Lambat maka akan di coding dengan karakter “4”

Proses pengiriman data secara serial pada matlab ditunjukkan pada gambar 3.13.

3.2.1.2 Database Ucapan

Sebagai pengenalan ucapan untuk pengaturan kecepatan kipas DC dibutuhkan database ucapan yang digunakan sebagai pembanding dengan proses pengenalan ucapan. Proses pengambilan sampel yang dibutuhkan sebagai database merupakan ucapan manusia dengan ucapan yang telah ditentukan, yaitu ucapan hidup, mati, cepat dan lambat. Proses pengambilan database ucapan dapat dilihat pada gambar 3.14.

Gambar 3.14 Flowchart Pembentukan Database Ucapan

Proses pembentukan database ucapan melalui memberikan masukan ucapan manusia, sampling, pre-processing, ekstraksi ciri dan keluaran database ucapan. Dalam penelitian ini, terdapat 40 database ucapan, yang terdiri dari masing- masing 10 database hidup, mati, cepat dan lambat. Variasi masukkan nilai variabel batas potong berjumlah 4 dan downsampling berjumlah 3. Variasi variabel yang dilakukan akan diperoleh 12 set dari

database.

3.2.2 Perancangan Hardware

Dokumen terkait