• Tidak ada hasil yang ditemukan

BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB 1 PENDAHULUAN. berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang"

Copied!
10
0
0

Teks penuh

(1)

1

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Kecerdasan buatan (artificial intelligence) merupakan bidang yang berkembang pesat pada akhir-akhir ini mengingat perkembangan teknologi yang mengarah kepada bidang aplikasi yang memerlukan keputusan yang cepat, yang juga terkadang mengandung resiko tinggi bagi manusia yang terlibat didalamnya atau tantangan resiko yang tidak diramalkan yang memerlukan keputusan kondisional. Semua kebutuhan tersebut memberikan dorongan bagi perkembangan pengetahuan kecerdasan buatan sebagai disiplin ilmu yang dapat dikembangkan untuk meniru pola pikir manusia dan meniru kemampuan kretifitas manusia dalam menyelesaikan masalah.

Ciri utama kecerdasan buatan adalah kemampuan belajar dan berpikir secara nalar sebagaimana manusia belajar dari pengalaman dan berpikir secara simbolik. Kemampuan belajar dalam kecerdasan buatan memungkinkan teknik ini mampu melakukan inferensi secara berbeda sesuai dengan perbadaan lingkungan dan kondisi yang dihadapi [1].

Pada tiga dasawarsa terakhir, mulai muncul adanya teknik-teknik pendekatan dalam penyelesaian masalah yang kemudian dikenal dengan istilah soft computing. Soft computing adalah suatu model pendekatan untuk melakukan

(2)

2

komputasi dengan meniru akal manusia dan memiliki kemampuan untuk menalar dan belajar pada lingkungan yang penuh ketidakpastian dan ketidaktepatan [2].

Komponen utama pembentuk soft computing adalah sistem fuzzy (fuzzy system), jaringan neural (neural network), algoritma evolusioner (evolusionary algorithm) dan penalaran dengan probabilitas (probabilistic reasoning). Keempat

komponen tersebut bukanlah merupakan pesaing antara satu dengan yang lain, melainkan saling melengkapi. Komponen-komponen utama tersebut memiliki bidang-bidang kajian yang sangat bervariasi [3].

Sistem inferensi fuzzy sering kali digunakan sebagai salah satu mekanisme inferensi pada sistem pakar, terutama untuk sistem pakar yang menggunakan aturan-aturan dalam basis pengetahuannya. Meskipun logika fuzzy dapat menterjemahkan pengetahuan dari para pakar secara langsung dengan menggunakan aturan-aturan yang dibangun secara linguistik, namun biasanya dibutuhkan waktu yang cukup lama untuk menetapkan fungsi keanggotaan pada setiap pernyataan linguistiknya. Untuk kepentingan efisiensi waktu dan biaya, perlu adanya metode lain yang digunakan untuk melengkapi logika fuzzy tersebut.

Teknik-teknik pembelajaran pada jaringan neural dapat mengotomatisasi proses tersebut dan secara substansial dapat mengurangi waktu dan biaya [4].

Di antara sekian banyak penerapan teknik kecerdasan buatan salah satunya adalah dalam bidang pengenal isyarat atau signal recognize. Bidang aplikasi ini sangat luas, antara lain: sebagai interface agar manusia dapat berkomunikasi dengan mesin, sebagai indentifikasi personel melalui sidik jari (sidik jari setiap orang bersifat unik), sebagai alat deteksi kebohongan melalui suara (pola suara

(3)

3

orang akan berubah bila mengatakan sesuatu dengan tidak benar dan disengaja), dan lain-lain [1].

Pengenalan Tutur Otomatis (Automatic Speech Recognition, ASR) telah mencapai keberhasilan besar dalam beberapa dekade terakhir namun studi lebih lanjut diperlukan karena tidak ada metode saat ini yang cukup cepat dan tepat sebanding dengan kemampuan pengenalan manusia [5]. Hasil review terhadap beberapa hasil penelitian dipaparkan dalam kajian pustaka di Bab 2.

Upaya awal untuk merancang sistem ASR dibuat tahun 1950-an dan 1960- an ketika berbagai peneliti mencoba untuk mengeksploitasi ide-ide dasar fonetik akustik. Karena pengolahan isyarat dan teknologi komputer yang masih primitif, sebagian besar sistem pengenalan tutur diteliti menggunakan resonansi spektral pada daerah vokal setiap ucapan yang diekstrak dari isyarat keluaran sebuah bank filter analog dan rangkaian logika. Selama 35 tahun terakhir, sistem ASR telah mengalami kemajuan besar selama bertahun-tahun. Beberapa faktor telah memberi kontribusi pada kemajuan pesat, seperti pengembangan teknik pemrosesan isyarat yang canggih dan juga daya komputasi yang terus meningkat.

Kompleksitas dari suatu aplikasi pengolahan tutur sangat ditentukan oleh persyaratan sistem. Untuk sistem pengenalan tutur otomatis, parameter penting adalah jenis tutur, gaya berbicara, ukuran kosakata, lingkungan operasi dan ketergantungan pembicara [6].

Dilihat dari jenis tutur, sistem pengenalan tutur terbagi kepada dua jenis, yaitu pengenalan tutur kata-terisolasi (isolated-word speech recognition system)

(4)

4

dan pengenalan tutur kontinu (continuous speech recognition system). Jenis pengenalan tutur kata-terisolasi mengharuskan pembicara jeda sebentar antara kata-kata, sedangkan sistem pengenalan tutur kontinu tidak mengharuskan demikian [6]. Penggunaan kata-kata tunggal yang terisolasi menjadikan pengenalan tutur lebih mudah untuk diimplementasikan, sementara dengan kalimat tutur yang secara alami diucapkan kontinu menjadikan pengenalan tutur lebih sulit untuk diimplementesikan.

Dalam pengenalan tutur kata-terisolasi yang menerapkan algoritma end- point detection (voice activity detection) dalam mendeteksi titik awal dan akhir setiap kata, disyaratkan jeda antar-tutur setidaknya 100 milidetik [7]. Hal ini dimaksudkan untuk memastikan agar algoritma tersebut berjalan dengan benar.

Pengenalan tutur kata-terisolasi menggunakan kata tunggal

Dalam hal gaya berbicara, dialek dan aksen pembicara bisa membuat sulit bagi sistem ASR untuk mengenali kata yang diucapkan. Beberapa aplikasi membutuhkan penggunaan hanya sejumlah terbatas dari kata yang diprediksi, sementara sistem ASR lainnya dapat dihadapkan dengan kata apapun yang mungkin. Secara umum, ASR juga lebih sulit ketika beberapa kata yang terdengar mirip harus dibedakan. Beberapa aplikasi hanya digunakan di ruangan yang tenang, sementara yang lain harus mengenali tutur yang terdistorsi oleh suara latar belakang yang tak terduga seperti di stasiun kereta api atau tempat pasar.

Secara garis besar suatu sistem pengenalan tutur terdiri dari pengolahan awal, ekstraksi ciri dan pengklasifikasi. Langkah-langkah tesebut diperlihatkan pada Gambar 1.1.

(5)

5

Gambar 1.1 Sistem pengenealan tutur.

Ciri dari isyarat tutur dapat diekstrak diantaranya dengan menggunakan Linear Predictive Coding (LPC), Fast Fourier Transform (FFT), Fuzzy C-Means Clustering (FCM), wavelet, Mel Frequency Cepstral Coeficient (MFCC), dan

lain-lain. Pada penelitian ini digunakan MFCC yang merupakan teknik ekstraksi ciri yang telah luas dipakai dalam pemrosesan isyarat suara.

Selama bertahun-tahun para peneliti telah menemukan beberapa metode untuk pengenalan tutur terisolasi seperti Hidden Markov Models (HMM), Support Vector Classifiers, Time Delay Neural Networks (TDNN), Hybrid Neuro-Fuzzy Network, Multi-layer Perceptron (MLP) dengan algoritma genetika (genetic algorithm) sebagai algoritma pelatihannya, dan Dynamic Time Warping (DTW).

Semua studi ini telah dilakukan dalam pengenalan tutur tak bergantung-pembicara (independent-speaker)dengan sejumlah kata terbatas [5].

Dalam bidang pemrosesan isyarat suara, sistem jaringan neural (neural network) telah banyak diaplikasikan untuk proses pengenalan suara atau

pengenalan kata. Akan tetapi, dalam beberapa kasus, jaringan neural belum dapat memberikan hasil yang baik. Penerapan sistem neuro-fuzzy yang menggabungkan sistem fuzzy yang mempunyai gaya penalaran (reasoning) seperti manusia dengan jaringan neural yang mempunyai kemampuan pembelajaran (learning) dimungkinkan dapat memberikan hasil yang lebih baik.

Isyarat tutur

Pre- processing

Hasil pengenalan Ekstraksi

ciri Pengklasifikasi

(6)

6

Penentuan set aturan pada sistem fuzzy didasarkan pada jumlah masukan dan fungsi keanggotaan. Dengan lima fungsi keanggotaan dan dua masukan maka sebuah Adaptive Neuro Fuzzy Inference System (ANFIS) yang digunakan mempunyai 52 = 25 aturan [8]. Jika jumlah masukannya adalah lima dengan sepuluh fungsi keanggotaan, maka jumlah aturannya adalah 105 = 100.000 aturan.

Semakin banyak jumlah masukan dan jumlah fungsi keanggtaan yang digunakan maka jumlah aturan yang diperlukan akan semakin banyak pula. Terlalu banyaknya aturan yang digunakan dapat menimbulkan permasalahan dalam kecepatan komputasi. Untuk itu diperlukan proses identifikasi sistem yang mengidentifikasi parameter-parameter dan menginisialisasi aturan-aturan yang digunakan untuk membedakan kualitas-kualitas fuzzy dikaitkan dengan masing- masing cluster (Fuzzy Inference System, FIS) dengan metode clustering terhadap masukan-masukan ANFIS. Tujuan menggunakan metode clustering adalah untuk menemukan aturan yang lebih disesuaikan dengan data masukan daripada dalam suatu FIS yang dihasilkan tanpa clustering [9].

1.1.1 Perumusan Masalah

Berdasarkan uraian di atas, maka perumusan masalah pada penelitian ini adalah bagaimana implementasi MFCC sebagai ciri dan ANFIS sebagai pengklasifikasi dalam sebuah sistem pengenalan tutur kata terisolasi, serta implementasi FCM untuk clustering vektor ciri dalam proses identifikasi dan inisialisasi sistem inferensi fuzzy.

(7)

7

Perancangan sistem pengenalan tutur kata terisolasi berbasiskan ciri MFCC dan pengklasifikasi ANFIS dalam penelitian ini difokuskan pada masalah perancangan ANFIS sebagai pengklasifikasinya. Dalam perancangan ANFIS, masalah utama adalah perancangan aturan, dalam hal ini adalah pemilihan jumlah aturan dan parameter-parameter awal himpunan fuzzy yang akan digunakan dalam ANFIS. Tanpa adanya satu set aturan yang diberikan oleh pakarnya maka proses penentuan aturan dan parameter-parameter awal akan bersifat trial and error dengan keacakan yang cukup tinggi. Clustering data pelatihan ANFIS dengan metode FCM diharapkan dapat mengarahkan dan memperpendek proses trial and error dalam perancangan bagian pengklasifikasi dari sistem pengenalan tutur terisolasi berbasiskan MFCC dan ANFIS.

1.1.2 Keaslian Penelitian

Penelitian mengacu pada beberapa penelitian sebelumnya, diantaranya penelitian “Speech Recognition of Isolated Malayalam Words Using Wavelet Features and Artificial Neural Network” [10]. Dalam penelitian ini digunakan

wavelet daubechies tipe 4 untuk ekstraksi ciri dan Jaringan Syaraf Tiruan (Artificial Neural Network, ANN) untuk tujuan kalsifikasi dan pengenalan. Lima kata dalam Bahasa Malayalam (salah satu bahasa di India Selatan) digunakan untuk eksperimen.

Penelitian yang berjudul Isolated Digit Speech Recognition in Malay Language using Neuro-Fuzzy Approach, membahas pengembangan dan implementasi sebuah sistem pengenalan tutur angka (dari 0 sampai 9) dalam

(8)

8

Bahasa Melayu [5]. Teknik Mel Frequency Cepstral Coefficient (MFCC) digunakan untuk ekstraksi ciri tutur, Adaptive Neuro Fuzzy Inference System (ANFIS) digunakan sebagai teknik klasifikasi modern untuk melatih dalam identifikasi ciri dari tutur, sedangkan algoritma substractive clustering diterapkan untuk mengidentifikasi sistem inferensi fuzzy.

Dalam penelitian yang berjudul Aplikasi Sistem Neuro-Fuzzy untuk Pengenalan Kata digunakan sistem neuro-fuzzy untuk pengenalan kata dalam Bahsa Indonesia yaitu kata “nol”, “satu”, “dua”, “tiga”, “empat” [11]. Disini digunakan Fast Fourier Transform (FFT) dalam proses transformasi isyarat tutur dalam domain waktu menjadi domain frekuensi untuk kemudian dilakukan segmentasi dan menjadi masukan bagi sistem neuro-fuzzy untuk tujuan klasifikasi dan pengenalan.

Berdasarkan rujukan pada penelitian-penelitian yang telah ada, penelitian ini mengambil gagasan untuk menerapkan algoritma MFCC untuk ekstraksi ciri, clustering dengan FCM untuk mengidentifikasi sistem inferensi fuzzy dan sistem

neuro-fuzzy struktur ANFIS untuk tujuan klasifikasi pada sebuah sistem pengenalan tutur tersiolasi dalam Bahasa Indonesia.

1.1.3 Manfaat Penelitian

Hasil penelitian ini diharapkan memberikan manfaat sebagai berikut.

1. Mengembangkan metode pengenalan isyarat tutur kata terisolasi dengan menggunakan metode-metode atau teknik-teknik modern (MFCC, FCM dan ANFIS) yang dapat diimplementasikan diantaranya untuk voice-dialing,

(9)

9

aplikasi telepon, sistem transkripsi dan interaksi manusia dengan komputer, antarmuka pengguna dan khususnya interaksi manusia dengan robot, atau untuk secured access lainnya;

2. Menunjang sains dan teknologi bagi dunia akademik dan masyarakat industri terutama di bidang teknik elektro dan ilmu komputer, khususnya bidang sistem isyarat elektronis;

3. Memberikan tambahan khazanah pustaka mengenai implementasi sistem kecerdasan buatan (artificial intelligence);

4. Menjadi dasar alternatif untuk pengembangan pada penelitain-penelitian selanjutnya mengenai pengenalan tutur (speech recognition).

1.2 Tujuan Penelitian

Tujuan penelitian ini adalah:

1. Membangun sistem pengenalan tutur kata terisolasi menggunakan ciri MFCC dan pengklasifikasi ANFIS.

2. Memilih jumlah aturan fuzzy dan parameter-parameter awal himpunan fuzzy yang akan digunakan dalam ANFIS dengan clustering data pelatihan ANFIS menggunakan metode FCM.

3. Menguji dan menganalisis unjuk kerja hasil rancangan untuk jumlah aturan fuzzy yang berbeda-beda.

(10)

10

1.3 Batasan Masalah

Batasan masalah dalam penelitian ini adalah sebagai berikut:

1. Jangkauan dari sistem dalam penelitian ini dibatasi pada sampel tutur dalam Bahasa Indonesia.

2. Sebagai sampel dipilih lima kata yang tersusun dari dua suku kata dan tiga suku kata; tersusun dari berbagai struktur suku kata (V, KV, KVK, KKV, KKVK); terdri dari kata yang diawali vokal dan kata yang diawali konsonan;

terdiri dari kata yang diakhiri vokal dan kata yang diakhiri konsonan.

3. Jenis tutur yang digunakan adalah tutur kata-terisolasi (isolated-word speech) yang mengharuskan ada jeda diantara tutur kata yang diucapkan, dengan 100 milidetik pertama dari isyarat tutur merupakan durasi diam.

4. Isyarat tutur yang diambil sebagai data pelatihan dan pengujian pengklasifikasi adalah tutur yang direkam dari orang dewasa.

Gambar

Gambar 1.1 Sistem pengenealan tutur.

Referensi

Dokumen terkait

Dalam pelaksanaan Program Induksi, pembimbing ditunjuk oleh kepala sekolah/madrasah dengan kriteria memiliki kompetensi sebagai guru profesional; pengalaman mengajar

Tingkat pencemaran tanah ditentukan oleh peruntukan tanah, jenis tanah, jumlah bahan kimia dalam tanah (alamiah), jumlah partikel tanah, jenis tanah, jumlah bahan kimia

Berdasarkan hasil penelitian yang dilakukan tentang perlakukan ayah tiri terhadap anak tiri di Nagari Lubuk Ulang Aling Selatan Kecamatan Sangir Batang Hari Kabupaten

Mesin Pencacah Batang Jagung untuk Pakan Ternak dengan Ukuran yang Sama Kapasitas 120 [Kg/Jam].. Batang jagung merupakan suatu hasil tanaman hijauan yang

Demikian pula dari penelitian ini menunjukkan bahwa klon Sca 6 dari eksplan petala mempunyai persentase jumlah eksplan menghasilkan embrio tertinggi pada minggu ke-18 yaitu 52.2%

Pendidikan adalah suatu usaha untuk mengembangkan kepribadian dan kemampuan di dalam dan di luar sekolah dan berlangsung seumur hidup. Pendidikan mempengaruhi proses belajar,

Dari definisi diatas dapat dipahami beberapa hal yang sebagai berikut: Pertama , Standar Isi menjelaskan tentang lingkup materi atau bahan ajar minimal yang diajarkan

biaya dengan rasio nilai struktur (SN) maka untuk seluruh lapis pondasi yang distabilisasi semen, baik untuk lapis pondasi atas maupun untuk lapis pondasi bawah, diperoleh