• Tidak ada hasil yang ditemukan

SISTEM TTS DALAM BAHASA INDONESIA MENGGUNAKAN METODE FSA DAN DATABASE DIPHONE

N/A
N/A
Protected

Academic year: 2021

Membagikan "SISTEM TTS DALAM BAHASA INDONESIA MENGGUNAKAN METODE FSA DAN DATABASE DIPHONE"

Copied!
6
0
0

Teks penuh

(1)

B1-139

SISTEM TTS DALAM BAHASA INDONESIA MENGGUNAKAN

METODE FSA DAN DATABASE DIPHONE

Ely Setyo Astuti, ST, MT 1) , DR. Eng. Agus Naba, MT2), Ir.Wahyu Adi Prijono, MT.3) 1)

Staf pengajar STT STIKMA Internasional Malang.

2) 3)

Staf Pengajar Magister Teknik Elektro Pasca Sarjana Universitas Brawijaya Malang. ABSTRAK Pemenggalan suku kata adalah salah satu bagian dari mata pelajaran Bahasa Indonesia. Salah satu cara agar lebih mudah mempelajari pemenggalan suku kata dan mengetahui bagaimana pengucapan suatu kata dalam Bahasa Indonesia dengan menggunakan teknologi TTS (Text to Speech). TTS merupakan suatu sistem yang melakukan dua konversi yaitu konversi dari teks ke fonem dan konversi dari fonem ke ucapan. Penelitian ini bertujuan untuk merancang dan membuat perangkat lunak sistem TTS. Sistem dibangun dengan metode FSA (Finite State

Automata) untuk pemenggalan suku kata Bahasa Indonesia sesuai dengan Ejaan Yang

Disempurnakan. Metode FSA dua tingkat - yang merupakan perbaikan dari metode FSA tiga tingkat dari penelitian Anung (2000) - untuk pemenggalan suku kata. Proses penggabungan suku kata dan konversinya menjadi ucapan dalam sistem TTS menggunakan teknik Diphone

Concatenation. Teknik ini bekerja dengan cara menggabung-gabungkan segmen-segmen bunyi

suku kata yang telah direkam sebelumnya berupa file suara berekstensi *.wav. Hasil ujicoba membuktikan bahwa metode FSA dua tingkat bisa mengenali suku kata Bahasa Indonesia dengan tingkat keberhasilan 96%, kesalahan 3,94% untuk kata dasar, sedangkan untuk kata berimbuhan dengan tingkat keberhasilan 69%, kesalahan 30,88%. Semua pasangan vokal ‘au’, ‘ai’ dan ‘oi’ akan dikenali sebagai diftong.Teknik diphone concatenation dapat menggabung-gabungkan file suara diphone menjadi ucapan suatu kata/kalimat. Sistem TTS ini hanya bisa memilih satu diphone.

Kata kunci: Text to speech, Suku kata, Bahasa Indonesia, Finite-State Automata, Database

Diphone

1. Pendahuluan

Bahasa Indonesia adalah bahasa resmi

Republik Indonesia sebagaimana disebutkan dalam Undang-Undang Dasar RI 1945, Pasal 36. Ia juga merupakan bahasa persatuan bangsa Indonesia seperti disiratkan dalam Sumpah Pemuda 28 Oktober 1928. Bahasa Indonesia adalah sebuah dialek bahasa Melayu yang dinamis dan terus

menghasilkan kata-kata baru, baik melalui

penciptaan maupun penyerapan dari bahasa daerah dan asing (Wikipedia Ensiklopedia Indonesia, Ejaan Yang disempurnakan).

Salah satu bagian dalam mata pelajaran bahasa Indonesia adalah pemenggalan suku kata. Menurut Anung (2000), setidaknya ada dua kegunaan pemenggalan suku kata, yaitu : a) Jika kita melihat peranan suku kata dalam bahasa tulisan, maka pemenggalan suku kata perlu dilakukan ketika kata yang kita tulis panjangnya melebihi batas kanan kertas, b)Jika kita melihat peranan suku kata dalam bahasa lisan, maka

pemenggalan suku kata diperlukan untuk

mengetahui bagaimana cara mengucapkan suatu kata.

Agar lebih mudah mempelajari

pemenggalan suku kata dan mengetahui bagaimana pengucapan suatu kata dalam Bahasa Indonesia dapat menggunakan teknologi Text to Speech

(TTS). TTS merupakan suatu sistem yang

melakukan dua konversi yaitu konversi dari teks ke fonem dan konversi dari fonem ke ucapan yang dilakukan secara berurutan dengan input teks dan

menghasilkan output ucapan.

Para pengembang teknologi sudah

membangun sistem TTS pada sistem komputer. Akan tetapi, penggunaan TTS masih terbatas pada Bahasa Inggris atau bahasa asing lainnya. Bladon dan Carlson (1987), melakukan penelitian sistem TTS dengan gaya dan dialek bahasa Inggris. Emorine dan Martin (1988) dalam bahasa Perancis. Borkar (2004) melakukan penelitian TTS synthesizer dengan sistem berbasis komputer dalam bahasa Konkani (Goan). Rao et.al (2005) melakukan penelitian TTS synthesis menggunakan unit-unit daftar suku kata dalam bahasa India. Jayavardhana et.al (2001) mengembangkan penelitian sistem TTS

synthesis untuk membaca input berupa teks (novel)

ke dalam bentuk ucapan dalam bahasa Tamil. Khishore dan Alan (2005) mengembangkan sistem TTS pada Universal Digital Library yang bertujuan untuk menjadikan sistem baca perpustakaan dalam format digital dengan menggunakan bahasa India.

Pada tahun 2000 Anung melakukan

penelitian yang mengenali suku kata Bahasa Indonesia menggunakan Finite-State automata tiga

tingkat. Secara khusus penelitian tersebut

membahas tentang cara pemenggalan suku kata Bahasa Indonesia sesuai dengan aturan persukuan menurut Kamus Besar Bahasa Indonesia. Penelitian sistem TTS bahasa Indonesia sudah dilakukan Arman pada tahun 2000 dengan nama IndoTTS.

Rommel (2005) mengimplementasikan sistem

IndoTTS pada telepon selular dengan sistem operasi symbian.

(2)

B1-140

FSA adalah salah suatu sistem pemodelan matematika yang khusus mempelajari tentang bahasa, yaitu Teori Bahasa Formal (TBF). Bahasa yang dibahas pada TBF adalah bahasa tulisan dengan masukan dan keluaran berupa diskrit. FSA dapat berfungsi sebagai pengenal (recognizer) suatu bahasa dengan melakukan pengelolaan dari masukan-masukan yang berupa string dan mengeluarkan suatu keputusan YA jika string masukan termasuk dalam bahasa dan TIDAK jika string masukan tidak termasuk dalam bahasa (Hariyanto, 2004).

Synthesizer yang menggunakan teknik diphone concatenation bekerja dengan cara menggabung beberapa segmen bunyi yang telah direkam sebelumnya. Setiap segmen berupa

diphone (gabungan dua buah fonem) yang disimpan

dalam diphone database. (Arman, 2002).

Dalam penelitian ini, penulis mengembangkan dari penelitian sebelumnya (Anung, 2000) yaitu pengenalan suku kata Bahasa Indonesia dengan Algoritma FSA tiga tingkat menjadi sistem TTS Bahasa Indonesia dengan algoritma FSA dua tingkat dan database diphone. Metode FSA dua tingkat digunakan untuk pemenggalan suku kata dalam bahasa Indonesia. Proses penggabungan suku kata dan konversinya menjadi ucapan dalam sistem TTS ini menggunakan teknik diphone

concatenation. Teknik ini bekerja dengan cara

menggabungkan segmen-segmen bunyi suku kata yang telah diidentifikasi dan direkam sebelumnya. Setiap segmen berupa suku kata (diphone) disimpan dalam Database Diphone.

Penelitian “Sistem TTS dalam Bahasa

Indonesia menggunakan metode Finite State Automata dan database diphone” diharapkan bisa

membantu anak-anak dalam mempelajari suku kata dalam Bahasa Indonesia dan cara pengucapannya, membantu orang buta dalam mempelajari cara pengucapan kata yang ditulis dengan huruf alfabet (braille) dalam bahasa Indonesia, membantu orang asing dalam mempelajari bahasa Indonesia secara otodidak, dan membantu komunikasi orang tuna wicara dan orang yang tidak diperbolehkan berbicara karena sakit.

2. Tinjauan Pustaka

Bahasa formal adalah kumpulan kalimat. Dalam pembicaraan selanjutnya ‘bahasa formal’ akan disebut ‘bahasa’ saja. Bahasa dalam bentuk tulisan sebenarnya terdiri atas simbol-simbol yang bisa digunakan dalam sebuah bahasa membentuk sebuah himpunan dan disebut sebagai abjad.

Deretan karakter membentuk string. Bahasa

didefinisikan sebagai himpunan semua string yang dapat dibentuk dari suatu abjad. Kaidah/aturan pembentukan kata/kalimat disebut grammar (tata bahasa).

Otomata berasal dari bahasa Yunani automatos, yang berarti sesuatu yang bekerja secara otomatis (mesin). Otomata merupakan suatu sistem yang terdiri atas sejumlah berhingga state, dimana state menyatakan informasi mengenai input yang lalu,

dan dapat pula dianggap sebagai memori mesin. Input pada mesin otomata adalah bahasa yang harus dikenali oleh mesin. Selanjutnya mesin otomata membuat keputusan yang mengindikasikan apakah input ini diterima atau tidak.

Gambar 2.1. Mesin otomata sederhana Contoh sebuah mesin otomata sederhana diberikan dalam Gambar 2.1. Bila mesin mendapat untai/ string input: Ada, adu, add maka keputusan mesin adalah diterima, diterima, ditolak.

Gambar 2.2. Diagram State untuk FSA Keterangan Gambar 2.2:

Lingkaran menyatakan state/kedudukan

Label pada lingkaran adalah nama state

tersebut

• Busur menyatakan transisi yaitu perpindahan kedudukan/state

• Lingkaran didahului sebuah busur tanpa label menyatakan state awal

Lingkaran ganda menyatakan state akhir/final Menurut Arman (2000), sistem TTS pada prinsipnya terdiri dari dua sub sistem, yaitu :

1) Bagian Konverter Teks ke Fonem (Text to

Phoneme), serta

2) Bagian Konverter Fonem to Ucapan

(Phoneme to Speech).

Gambar 2.3 Blok Diagram sistem TTS Gambar 2.3 menunjukkan blok diagram sistem TTS. Bagian Konverter Teks ke Fonem berfungsi untuk mengubah kalimat masukan dalam suatu bahasa tertentu yang berbentuk teks menjadi

Even/

Genap

l

Odd/ Ganjil

0 0 1 1

q

0

q

1

q

2

q

5

q

q

a

d

a

u

d

Konversi fonem ke ucapan Teks Ucapan Kode-kode fonem, durasi dan pitch, Konversi Teks ke fonem

(3)

B1-141

rangkaian kode-kode bunyi. Konverter Fonem ke Ucapan akan menghasilkan bunyi atau sinyal ucapan yang sesuai dengan kalimat yang ingin diucapkan. Dua teknik yang banyak digunakan

adalah formant synthesizer serta diphone

concatenation. Konversi dari teks ke fonem sangat

dipengaruhi oleh aturan-aturan yang berlaku dalam suatu bahasa.

Bahasa Indonesia mengenal bahasa tulisan maupun bahasa lisan. Dalam bahasa lisan, dikenal istilah fonem, yang merupakan kesatuan bahasa terkecil yang dapat membedakan arti. Dalam bahasa tulisan, fonem dilambangkan dengan huruf. Dengan kata lain, huruf adalah tulisan dari fonem. Seringkali istilah fonem disamakan dengan huruf, padahal tidak selamanya berlaku demikian. Fonem dibagi menjadi vokal dan konsonan. Bahasa Indonesia mengenal 5 vokal yaitu : a, e, i ,o, u, dan 25 konsonan yaitu : b, c, d ,f , g , h, j , k, kh, l, m, n, ng, ny, p, q, r, s, sy, t, v, w, x, y, z. Konsonan kh, ng, ny dan sy adalah contoh fonem yang terdiri atas dua huruf. Selain itu dikenal pula istilah diftong, yaitu gabungan 2 vokal yang membentuk kesatuan bunyi, yaitu : au, ai, oi. Pada beberapa buku referensi, diftong digolongkan sebagai vokal pula.

Aturan pemenggalan kata pada kata dasar dilakukan sebagai berikut. a).Jika di tengah kata ada vokal yang berurutan, pemenggalan itu dilakukan di antara kedua huruf vokal itu. Misalnya: ma-in, sa-at, bu-ah. Huruf diftong ai, au, dan oi tidak pernah diceraikan sehingga pemenggalan kata tidak dilakukan di antara kedua huruf itu. Misalnya: au-la bukan a-u-la. b). Jika di tengah kata ada huruf konsonan, termasuk gabungan-huruf konsonan, di antara dua buah huruf vokal, pemenggalan dilakukan sebelum huruf konsonan. Misalnya: ba-pak, ba-rang, su-lit. c). Jika di tengah kata ada dua huruf konsonan yang berurutan, pemenggalan dilakukan di antara kedua huruf konsonan itu. Gabungan huruf konsonan tidak pernah diceraikan. Misalnya: man-di, ap-ril, swas-ta, d). Jika di tengah kata ada tiga buah huruf konsonan atau lebih, pemenggalan dilakukan di antara huruf konsonan yang pertama dan huruf konsonan yang kedua. Misalnya: in-stru-men ul-tra

Menurut Tofani & Nugroho, (1995) Bahasa Indonesia mengenal beberapa pola umum suku kata, yaitu : a) V1 a-nak, ba-u b) VK an-da, da-un c) KV se-bab, man-di d) KVK lan-tai, ma-kan e) KKV pra-ha-rai, sas-tra f) KKVK frik-si, kon-trak g) VKK eks, ons h) KVKK pers, kon-teks i) KKVKK kom-pleks, ke-nyang j) KKKV in-stru-men, stra-ta k) KKKVK struk-tur, stres Keterangan:

V berarti vokal dan K berarti konsonan

3. Perancangan 3.1 Diagram Alur

Gambar 3.1. Diagram alur TTS dalam Bahasa Indonesia

3.2 Algoritma Finite State Automata (FSA)

Gambar 3.2 FSA Tingkat 1. Normalisasi teks

Kenali Suku kata BI dengan Algoritma FSA,

Deklarasi dan inisialisasi Speech Input teks Tidak Ya Suku kata Input teks Lagi? Selesai Mulai Lockup pustaka Diphone database Konsonan selain N,K,S,G,B Q9 Q7 Q6 Q5 Q4 Q3 Q2 Q1 Q8 Q10 Q0 Start N K S G B Vokal Blank Spasi Blank Spasi Vokal ‘R’ ‘R’ ‘Y’,’P’ Vokal Vokal Vokal Vokal Vokal ‘H’ ‘G’,’Y’

(4)

B1-142

Algoritma FSA yang digunakan untuk

pengenalan suku kata bahasa Indonesia dirancang dalam dua tingkat. Perancangan ini merupakan pengembangan dari algoritma FSA yang telah dibuat sebelumnya oleh Anung dengan FSA tiga tingkat. Dalam algoritma FSA Anung, tingkat pertama mengenali pola suku kata V, K dan KV. Pada tingkat 2 FSA mengenali suku kata dengan pola V, VK, VKK, KV, KVK, KKV, KKVK, KKKV, KKKVK. Sedangkan pada tingkat ketiga pola suku kata yang dapat dikenali adalah VK, VKK, KVK, KVKK, KKVK, KKVKK, V, KV, KVV, KKV, KKVV

Gambar 3.3 FSA Tingkat 2

FSA tingkat 2 juga dapat mengenali diftong (au, ai dan oi), namun kemunculan dua vokal tersebut secara berurutan belum tentu berupa diftong. Semua pasangan vokal ‘au’, ‘ai’ dan ‘oi’ akan dikenali sebagai diftong.

3.3 Perekaman suara

Synthesizer yang menggunakan teknik diphone

concatenation bekerja dengan cara

menggabung-gabungkan segmen-segmen bunyi yang telah direkam sebelumnya. Setiap segmen berupa

diphone (gabungan dua buah fonem). Sebelum

melakukan perekaman suara untuk menghasilkan diphone database dilakukan persiapan:

1. Identifikasikan jumlah suku kata (diphone) dari Bahasa Indonesia.

2. Membuat daftar kombinasi lengkap diphone.

jumlah diphone dikurangi dengan

menghilangkan kombinasi diphone tertentu yang anda anggap tidak pernah terjadi, misalnya urutan dua fonem konsonan yang sama, seperti b-b, c-c, dan sebagainya.

3. Membuat daftar contoh kata yang mengandung setiap diphone

Pada saat perekaman diphone, terdapat

beberapa hal yang harus diperhatikan, yaitu :

Menyiapkan ruangan, yang mempunyai

karakteristik : bebas noise(noise rendah), tidak ada pantulan suara.

1. Siapkan perangkat perekaman yang berkualitas tinggi dan tempat nyaman.

2. Perekaman serangkaian diphone, lalu disimpan pada file yang berbeda.

3. Memeriksa seluruh kualitas suara hasil

rekaman. Jika ada suara yang kurang

memuaskan, lakukan perekaman ulang.

Dalam satu kali perekaman akan merekam beberapa suku kata sekaligus. Maka dari itu hasil rekaman masih berupa serangkaian diphone. Rangkaian tersebut akan dipotong-potong menjadi per satu suku kata dengan menggunakan software adhope audition 1.0. Hasil perekaman berupa file suara berekstensi *.wav.

4. Hasil Dan Pembahasan 4.1 Pengenalan suku kata

Untuk mengenali suku kata Bahasa

Indonesia menggunakan pemodelan FSA bertingkat yang berfungsi untuk mempermudah pemisahan suku kata. Sebagai contoh pada saat kita membaca dua huruf pertama pada kata anak (VKVK) dan kata anda (VKKV) kita belum bisa memutuskan apakah pemisahan suku kata akan dilakukan diantara kedua huruf tersebut atau tidak. Setelah membaca huruf ketiga, barulah bisa diputuskan di mana harus dilakukan pemisahan suku kata. Jika huruf ketiga

berupa sebuah konsonan maka pemisahan

dilakukan setelah huruf kedua (kata anda akan menjadi an-da). Sedangkan jika huruf ketiga adalah sebuah vokal, maka harus ditelusuri mundur dan memisahkan suku kata setelah huruf pertama (kata anak akan menjadi a-nak). FSA tingkat pertama yang mengenali pola V, K, . KV. Hasil eksekusi algoritma FSA Tingkat 1 ditunjukkan dalam gambar 4.1. Hasil-hasil pengujian lain dari algoritma Tingkat 1 terangkum pada tabel 4.1

Gambar 4.1 Output Pengenalan suku kata Tingkat 1

Pada tingkatan pertama kata anak akan dipisahkan menjadi a-na-k (V-KV-K). Algoritma FSA Tingkat 1 (lihat gambar 3.2)

q

q q q q q q K V K STAR T q K K q K KV K K V K q q V spas i V K spa

(5)

B1-143

Tabel 4.1 Hasil pengujian pengenalan suku kata

tingkat 1 INPUT (teks) OUTPUT Tingkat 1 Tingkat 2 Anak a-na-k - Anda A-n-da - Buah Bu-a-h - Kenyang Ke-nya-ng - Ultra u-l-t-ra - Simpati Si-m-pa-ti - Migrasi mi-gra-si - Biografi Bi-o-gra-fi Struktur s-t-ru-k-tu-r - Pantai Pa-n-ta-i - Eks e-k-s -

Kemudian pada tingkat kedua FSA akan mengenali suku kata dengan pola VK, VKK, KVK, KVKK, KKVK, KKVKK, V, KV, KVV, KKV, KKVV (Gambar 3.3). Gambar 4.2 menunjukkan hasil eksekusi algoritma Tingkat 2.

Gambar 4.2 Output Pengenalan suku kata Tingkat 2

Kata anak pada Tingkat 1 menghasilkan output a-na-k yang selanjutnya akan menjadi input pada Tingkat 2. Output pada tingkat 2 akan menjadi a-nak (V-KVK). Pemisahan sesudah huruf pertama ini terjadi karena tidak dikenal suku kata berpola VKV. Sedangkan kata anda pada tingkat pertama akan

dipisahkan menjadi a-n-da (V-K-KV), yang

selanjutnya masuk ke tingkat kedua akan dipisahkan menjadi an-da. Hal ini sesuai dengan aturan pemisahan suku kata Bahasa Indonesia. Contoh hasil pengujian lain terangkum pada tabel 4.2

Tabel 4.2 Hasil pengujian pengenalan suku kata tingkat 2

INPUT (teks)

OUTPUT

Tingkat 1 Tingkat 2

Anak a-na-k a-nak

anda A-n-da an-da

Buah Bu-a-h Bu-ah

Kenyang Ke-nya-ng Ke-nyang

Ultra u-l-t-ra Ul-tra

Simpati Si-m-pa-ti Sim-pa-ti

Migrasi mi-gra-si mi-gra-si

Biografi Bi-o-gra-fi Bi-o-gra-fi struktur s-t-ru-k-tu-r struk-tur

Pantai Pa-n-ta-i pan-tai

Eks e-k-s Eks

Selain itu FSA pada Tingkat 2 juga dapat mengenali diftong. Dalam penelitian ini semua vokal ‘au’, ‘ai’, ‘oi’ akan dianggap sebagai diftong.

Untuk input yang berupa angka akan

dinormalisasi terlebih dahulu dalam bentuk teks yang lengkap. Misalnya input teks: 17 agustus 1945 akan dinormalisasi menjadi tujuh belas agustus seribu sembilan ratus empat puluh lima. Selanjutnya akan mengikuti proses yang sama dengan input teks lainnya, berupa pengenalan suku katanya. Hasil pengenalan suku kata akan menjadi: tu-juh be-las a-gus-tus se-ri-bu sem-bi-lan ra-tus em-pat pu-luh li-ma.

4.2 Pengolahan Hasil Rekaman

Hasil perekaman suku kata masih berupa serangkaian diphone (suku kata) dalam bentuk file suara berekstensi *.wav. Misalnya suku kata yang huruf depan a, ab, ad, direkam dalam satu kali rekaman suara. Serangkaian suku kata tersebut

akan dipotong-potong, diolah menggunakan

software menjadi per satu suku kata. Gambar 5.5 menunjukkan hasil rekaman suku kata a, ab, ad. Hasil rekaman tersebut letakan pada track1. Selanjutnya masing-masing suku kata a di pindah ke

track2 dan ab ke track3, ad di track4 (gambar 4.6)

Gambar 5.5 Hasil rekaman suara suku kata a, ab, ad

Gambar 5.8 Hasil pemisahan suku kata Metode yang sama dilakukan untuk suku kata-suku kata yang lain. Ribuan kata-suku kata yang

(6)

B1-144

teridentifikasi di rekam dan di simpan sebagai database diphone.

4.3 Konversi ke ucapan

Proses terakhir adalah dari hasil pemisahan suku kata dicocokkan dengan database diphone untuk menge-load diphone tersebut sehingga menjadi output pengucapan suatu kata/ kalimat.

Pada penelitian ini untuk pengkonversian dari suku kata ke ucapan masih terbatas untuk 1 pilihan diphone. Misalnya suku kata me mempunyai dua macam pengucapan diphone seperti mê pada kata merah dan më pada kata melati. Program ini belum bisa memilih kapan menggunakan diphone mê dan kapan më. Dengan sistem database suku kata mempunyai kelebihan kapasitas database lebih sedikit daripada database kata sehingga proses lebih cepat, akan tetapi hasil suara yang diperoleh masih patah-patah.

5. Kesimpulan Dan Saran 5.1 Kesimpulan

• metode FSA dua tingkat bisa mengenali suku

kata Bahasa Indonesia dengan tingkat

keberhasilan 96%, kesalahan 3,94% untuk kata dasar, sedangkan untuk kata berimbuhan dengan tingkat keberhasilan 69%, kesalahan 30,88%.

• Metode FSA belum bisa membedakan

gabungan dua vokal au, ai, oi yang diftong dan bukan diftong. Semua gabungan dua vokal au, ai, oi dianggap diftong.

• Untuk pengkonversian dari suku kata ke ucapan

masih terbatas untuk 1 pilihan 1 diphone. Misalnya untuk suku kata me pada kata merah dan melati.

• Dengan sistem database suku kata mempunyai

kelebihan kapasitas database lebih sedikit daripada database kata sehingga proses lebih cepat, akan tetapi hasil suara yang diperoleh masih patah-patah.

5.2 Saran

Dari kesimpulan hasil penelitian iharapkan pada penelitian berikutnya :

 Mengembangkan pada kata berimbuhan.

 Membedakan gabungan dua vokal au, ai, oi yang diftong dan bukan diftong

 Bisa mempunyai lebih dari 2 diphone.

 Untuk hasil suara yang lebih halus dan natural

diperlukan suatu algoritma untuk

menggabungkan diphone dengan diphone

lainnya, serta algoritma untuk memanipulasi diphone, khususnya untuk mengubah durasi serta pitch diphone. Ada berbagai teknik yang dapat digunakan untuk mendukung pensintesa jenis ini diantaranya adalah autoregressive (AR), Glottal AR, hybrid harmonic/stocastic, time

domain PSOLA (TD-PSOLA), multiband

resynthesis-PSOLA (MBR-PSOLA), serta Linear

Prediction-PSOLA (LP-PSOLA) [Dut97].

Diharapkan dengan penambahan salah satu metode di atas akan dihasilkan suara yang lebih halus dan natural.

DAFTAR PUSTAKA

Alam, 2001. Borland Delphi 6.0. PT. Elex Media Komputindo kelompok Gramedia. Jakarta Arman, 2002. Konversi dari Text ke Ucapan.

Departement Teknik Elektro, ITB, Bandung. Arman, 2002. Perkembangan Teknologi TTS dari

Masa ke Masa. Departement Teknik Elektro,

ITB, Bandung.

Basuki, 2000. Pengenalan Suku Kata Bahasa

Indonesia Menggunakan Finite-State Automata. Jurusan Ilmu Komputer, Universitas Katolik Parahyangan, Bandung. Borkar, . Text to Speech System for Konkani

(GOAN) Language. Electronics Department

Rajarambapu Institute of Technology

Sakharale, Islampur, Maharashtra, India. Dutoit, Thierry. 1997. An Introduction to

Text-to-Speech Synthesis. Kluwer Academic, Publisher Dordrecht (Text, Speech, and Language Series, edited by Nancy Ide and Jean Veronis, volume 3). State University. USA.

G. L. Jayavardhana, A. G. Ramakrishnan, M vijay Venkatesh, R. Murali Shankar. Thirukkural,

A Text to Speech Synthesis System.

Department of Electrical Engineering, Indian Institute of Science, Bangalore, India. Hariyanto Bambang. 2004. Teori Bahasa, Otomata,

dan Komputasi serta terapannya.

Informatika Bandung, Bandung. HOPCROFT, J.E. dan J.D. ULLMAN. 1979.

Introduction to Automata Theory, anguages and Computation.Addison-Wesley

Publishing Company, Reading, Massachusetts.

Kelley Dean.1999. Otomata dan Bahasa-bahasa Formal : Suatu Pengantar. PT. Prehallindo, Jakarta.

Nageshwara Rao, Thomas Samuel, Nagarajan T, Murthy Hema A. Text to Speech Synthesis

Using Syllable-like Units. Department of

Computer Science and Engineering, Indian Institute of Technology, Madras, India. Parson, Thomas W. 1986. Voice and Speech

Processing. McGraw Hill, New York.

Romel, Edwin. 2005. Aplikasi SMS dengan Text to

Speech Bahasa Indonesia pada sistem Operasi Symbian. Departemen Teknik

Elektro, ITB, Bandung.

Sojka Petr, Kopecek Ivan, Pala Karel. 2004. Text,

Speech and Dialogue: 7th International Conference. TSD 2004, Brno, Czech

Republic.

www.Wikipedia Indonesia, ensiklopedia bebas

Gambar

Gambar 2.2. Diagram State untuk FSA  Keterangan Gambar 2.2:
Gambar 3.1. Diagram alur TTS dalam Bahasa  Indonesia
Gambar 3.3 FSA Tingkat 2
Gambar 5.5 Hasil rekaman suara suku kata a, ab,  ad

Referensi

Dokumen terkait

Berdasarkan uraian di atas, maka perlu dilakukan perhitungan atau analisis biomassa, simpanan karbon dan serapan CO2 tanaman di jalur hijau jalan Kota Binjai dan

Di Indonesia pada umumnya penyuluhan pertanian belum dapat dikatakan berhasil hal ini disebabkan antara lain karena jumlah penyuluh masih terlalu sedikit yaitu hanya pada

Kinerja jaringan listrik yang baik diperlukan juga sistem proteksi yang baik pula salah satunya adalah Over Current relay (OCR) dan Ground fault Relay (GFR)

Agar dapat memenuhi kebutuhan logistik di posyandu petugas kesehatan dapat menyampaikan jadwal sasaran imunisasi per antigen kepada koordinator imunisasi. Dimana koordinasi

Maka dari itu disarankan untuk menerapkan konsep Livable Street yang merupakan konsep menyatakan bahwasanya jalan ideal itu harus aman, nyaman dan memberikan efek sehat,

Suatu atom dikatakan tereksitasi (terbangkit) jika satu atau bebarapa electron mempunyai energi yang lebih besar dari tingkat energinya sendiri.. Dalam keadaan

Instrumen dalam penelitian ini dilakukan uji validitas tiap item pertanyaan menggunakan content validity. Uji validitas pada penelitian ini menggunakan panel expert yaitu