• Tidak ada hasil yang ditemukan

LAPORAN AKHIR PENELITIAN HIBAH BERSAING

N/A
N/A
Protected

Academic year: 2021

Membagikan "LAPORAN AKHIR PENELITIAN HIBAH BERSAING"

Copied!
96
0
0

Teks penuh

(1)

i

LAPORAN AKHIR

PENELITIAN HIBAH BERSAING

SISTEM VISUALISASI PELAFALAN BAHASA INDONESIA BERBASIS WEB UNTUK MENINGKATKAN IMPLEMENTASI MODEL PEMBELAJARAN

JARAK JAUH BAHASA INDONESIA BAGI PENUTUR ASING

Tahun ke I dari rencana 2 tahun TIM PENGUSUL

Ketua :

Arifin, M.Kom ( NIDN : 0612077101 )

Anggota :

Hanny Haryanto, S.Kom, MT ( NIDN : 0621118401 ) Achmad Basari, SS., M.Pd. ( NIDN : 0602046701 )

UNIVERSITAS DIAN NUSWANTORO SEMARANG NOPEMBER, 2015

(2)
(3)

iii RINGKASAN

Bahasa Indonesia merupakan salah satu bahasa yang mulai diminati oleh penutur asing sebagai bahasa kedua. Hal ini disebabkan karena Bahasa Indonesia merupakan bahasa standar yang dapat digunakan sebagai kunci untuk mempelajari bahasa-bahasa daerah lainnya di Indonesia. Indonesia mempunyai ratusan bahasa daerah, letak yang sangat strategis dan juga kekayaan alam yang melimpah, sehingga sangat menguntungkan untuk menanamkan investasi di Indonesia. Hal ini merupakan salah satu faktor banyak penutur asing ingin mempelajari Bahasa Indonesia. Tetapi banyak kendala bagi penutur asing dalam mempelajari Bahasa Indonesia, khususnya masalah pelafalan (fonologi).

Banyak perbedaan-perbedaan yang mendasar dalam melafalkan bunyi dan masalah yang berkaitan dengan keterbatasan waktu dan tempat dalam proses pembelajaran. Oleh karena itu, media yang dapat dikembangkan adalah melalui metode pembelajaran jarak jauh yang berbasis web dengan menggunakan teknologi internet. Metode penelitian dalam membangun sistem ini menggunakan pendekatan penelitian dan pengembangan (research and development) yang terdiri dari beberapa tahapan define, design, develop dan disseminate. Penelitian ini dibagi menjadi tiga sub penelitian yaitu pemodelan visualisasi fonem (viseme / visual phoneme) Bahasa Indonesia, Transkripsi teks ke fonem-fonem dan penggenerasian suara, dan sub penelitian terakhir adalah sinkronisasi fonem, suara dan model serta pengembangan sistem berbasis web.

Hasil penelitian ini diharapkan dapat mengatasi masalah yang ditimbulkan akibat keterbatasan penutur dalam bidang tersebut serta keterbatasan jarak dan waktu. Sistem hasil penelitian ini dapat membantu orang asing untuk memahami mengenai pelafalan Bahasa Indonesia yang sesuai dengan kaidah yang benar.

Kata kunci : pembelajaran jarak jauh, pelafalan Bahasa Indonesia, visualisasi fonem, penutur asing, web.

(4)

iv PRAKATA

Assalamu’alaikum wr.wb

Penulis panjatkan segala puji syukur ke hadirat Allah SWT yang telah melimpahkan maghfiroh, kekuatan, kemampuan, hidayah serta inayah-NYA sehingga kita masih bisa merasakan nikmat-NYA yang tidak dapat kita hitung. Sholawat dan salam tercurah bagi bagi Rasulullah SAW, suri tauladan sepanjang masa semoga kita kelak mendapatkan syafaat beliau di Yaumul Akhir nanti.

Pada kesempatan ini kami ingin mengucapkan terima kasih yang tiada terkira kepada pihak-pihak dibawah ini yang telah membantu kami dalam menyelesaikan penelitian ini :

1. Dr. Ir. Edi Noersasongko, M.Kom selaku rektor Universitas Dian Nuswantoro Semarang.

2. Dr. Drs. Abdul Syukur, MM, selaku Dekan Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang.

3. Prof. Vincent Didiek Wiet Aryanto, MBA., Ph. D., selaku kepala LPPM dan Juli Ratnawati, S.E, M.Si Selaku Kepala Pusat Penelitian Universitas Dian Nuswantoro atas motivasi dan dukungannya yang tiada terhingga sehingga laporan kemajuan ini dapat terselesaikan dengan baik. Serta tiada keringnya pelajaran MORAL dan KEHIDUPAN yang peneliti peroleh selama menjalankan laporan penelitian ini yang Insya Allah tidak akan pernah peneliti lupakan. Terima kasih banyak buat staf LPPM pak Karis Widyatmoko, S.Si, M.Kom atas perhatian dan dukungannya serta tak lupa Ibu Cicik Harini, SE, MM atas bantuan administrasi dan doanya.

4. Bp. Dr. Surya Sumpeno, M.Sc. dan Program Studi Teknik Multimedia Jaringan Jurusan Teknik Elektro Institut Teknologi Sepuluh Nopember (ITS) Surabaya, atas diijinkannya menggunakan Laboratorium HCS (Human Centric System).

5. Hanny Haryanto, S.Kom., MT., dan Achmad Basari, SS., M.Pd. atas partisipasinya sebagai anggota. Alhamdulillah ! Kita dapat menjalin kerjasama yang baik. Semoga di lain waktu kita dapat menjalin kembali kerjasama ini.

6. Dr. Heru Agus Santoso, M.Kom selaku Kaprodi Teknik Informatika dan rekan-rekan dosen, baik di progdi Teknik Informatika maupun Fakultas Ilmu Komputer Udinus.

(5)

v

7. Untuk keluargaku tercinta, penulis berharap terus atas cinta, doa, yang telah diberikan kepada peneliti.

8. Mahasiswa progdi Teknik Informatika Udinus, khususnya Galih Muji Nugroho

(

A11.2011.05950)

, Fadhilah Nurul dan M Nasrul (Mahasiswa Pasca Teknik

Elektro ITS) atas dukungan dan doanya, semoga penelitian ini bermanfaat bagi kalian semua.

Wassalamu’alaikum wr.wb

Semarang, 2015

(6)

vi DAFTAR ISI

Halaman

RINGKASAN ... v

BAB I. PENDAHULUAN ... 1

1.1 Latar Belakang dan Permasalahan ... 1

1.2 Perumusan Masalah ... 3

BAB II. TINJAUAN PUSTAKA ... 4

2.1 State of the art ... 4

2.2 Visualisasi Wicara ... 5

2.2.1 Wicara ... 5

2.3 Metode Ekstraksi Fitur Bibir ... 6

2.3.1 Ekstraksi Berbasis Fitur ... 6

2.3.2 Esktraksi Berbasis Kontour... 7

2.4 Artikulasi dan Koartikulasi ... 8

2.4.1 Definisi Koartikulasi ... 8

2.5 Pengertian Fonem dalam Bahasa Indonesia ... 10

2.5.1 Fonologi, Fonetik dan Fonemik ... 10

2.5.2 Pengertian Dasar Fonem ... 12

2.5.3 Pelafalan Artikulasi Fonem ... 13

2.5.4 Simbol dan Bunyi ... 13

2.5.4.1 Realisasi Fonem ... 13

2.5.4.2 Variasi Fonem ... 14

2.5.5 Pembentukan Fonem Bahasa Indonesia ... 17

2.5.5.1 Cara Pembentukan Vokal ... 17

2.5.5.2 Pembentukan Vokal Berdasarkan Tinggi Rendahnya Lidah ... 18

2.5.5.3 Struktur Vokal ... 19

2.5.5.4 Cara Pembentukan Konsonan ... 20

2.5.5.5 Cara Pembentukan Diftong ... 22

2.5.6 Pemilihan Fonem Bahasa Indonesia yang Digunakan ... 23

2.5.6.1 Macam-macam Fonem Bahasa Indonesia ... 23

(7)

vii

2.6 Pemetaan Fonem ke Viseme ... 25

2.6.1 Pengertian Viseme ... 25

2.6.2 Pemetaan Fonem ke Viseme ... 26

2.7 Roadmap Penelitian ... 27

2.8 Penelitian Pendahuluan Yang Telah Dilakukan Pengusul ... 27

BAB III. TUJUAN DAN MANFAAT PENELITIAN ... 29

3.1 Tujuan Penelitian ... 29

3.2 Manfaat Pertahun ... 29

BAB IV. METODE PENELITIAN ... 32

4.1 Bagan Alir Penelitian ... 32

4.1.1 Proses 1 : Pembentukan Model Viseme Bahasa Indonesia ... 33

4.1.2 Proses 2 : Rekayasa Sistem ... 36

BAB V. HASIL YANG DICAPAI ... 37

5.1 Pembuatan Database Visual Speech ... 37

5.1.1 Proses Perekaman Video ... 37

5.2 Pembentukan Model Viseme Statis Bahasa Indonesia ... 39

5.2.1 Proses Ekstraksi Fitur Mulut ... 39

5.2.2 Reduksi Dimensi ... 42

5.2.3 Proses Klasterisasi ... 47

5.2.4 Hasil Eksperimen ... 49

5.2.5 Pemetaan Hasil Klasterisasi ke Kelas-Kelas Viseme ... 51

5.3 Desain Sistem Visualisasi Pelafalan Bahasa Indonesia Berbasis Animasi 2D ... 52

5.3.1 Desain Karakter Animasi Wajah ... 52

5.3.2 Desain Antarmuka Sistem ... 54

5.4 Layout Sistem Yang Dihasilkan ... 58

5.5 Pembuatan Database Motion Capture Wajah ... 59

5.5.1 Pengambilan Data Motion Capture Wajah ... 60

5.5.2 Data Koordinat 3D Mulut ... 62

5.6 Pembentukan Model Viseme Dinamis Berdasarkan Database Motion Capture ... 62

(8)

viii

5.6.1 Normalisasi Posisi 3D ... 63

5.6.2 Segmentasi Data Motion Capture Wajah ... 64

5.6.3 Fitur Mulut Sebagai Fitur Tambahan ... 64

5.6.4 Membangun Model Viseme Dinamis Bahasa Indonesia ... 65

5.7 Sistem Visualisasi Pelafalan Bahasa Indonesia Berbasis Web ... 68

5.8 Capaian Publikasi ... 70

BAB VI. RENCANA TAHAPAN BERIKUTNYA ... 73

6.1 Rencana dan Jadual Selanjutnya ... 73

BAB VII. KESIMPULAN DAN SARAN ... 74

7.1 Kesimpulan ... 74

7.2 Saran ... 74

DAFTAR PUSTAKA ... 75

LAMPIRAN

(9)

ix

DAFTAR TABEL

Tabel 2.1. Pola Suku Kata Bahasa Indonesia ... 25

Tabel 2.2. Hasil Pemetaan Fonem ke Viseme Bahasa Indonesia ... 27

Tabel 2.3. Model-model Kelas Viseme setiap Bahasa ... 28

Tabel 5.1. Hasil Perhitungsn SSE dan rasio antara BCV dan WCV ... 50

Tabel 5.2. Struktur Kelas Viseme Statis Bahasa Indonesia ... 51

Tabel 5.3. Implementasi Masing-Masing Kelas Viseme Statis ... 52

(10)

x

DAFTAR GAMBAR

Gambar 2.1. Model-model Kelas Viseme Statis Bahasa Indonesia... 4

Gambar 2.2. Cabang Ilmu Fonologi ... 10

Gambar 2.3. Posisi Lidah pada Daerah Artikulasi Vokal ... 18

Gambar 2.4. Posisi Lidah dalam Mengucapkan Vokal Depan, Tengah dan Belakang ... 19

Gambar 2.5. Bentuk Bibir Bulat dan Tak Bulat ... 20

Gambar 2.6. Daerah Artikulasi pada Pengucapan Konsonan ... 20

Gambar 2.7. Kerangka Roadmap Penelitian ... 27

Gambar 2.8. Contoh Sinkronisasi Sinyal Wicara dan Model Viseme ... 28

Gambar 4.1. Fishbone Chart Bagan Alir Penelitian ... 32

Gambar 4.2. Tahapan Pembentukan Model Viseme Bahasa Indonesia ... 36

Gambar 5.1. Laboratirum Audiovisual ... 38

Gambar 5.2. Tim Perekaman Video ... 38

Gambar 5.3. Video Visual Speech ... 39

Gambar 5.4. Frame-frame hasil proses ekstraksi setelah dilakukan cropping ... 40

Gambar 5.5. Program matlab Untuk Ekstraksi Fitur ... 41

Gambar 5.6. Isi Matriks T ... 42

Gambar 5.7. Program matlab untuk Ekstraksi Fitur dan Reduksi Dimensi Dengan PCA ... 45

Gambar 5.8. Isi Matriks ProjectedTrain setelah Reduksi Dimensi dengan PCA ... 45

Gambar 5.9. Program matlab untuk Ekstraksi Fitur dan Reduksi dengan LDA... 47

Gambar 5.10. Isi matriks ProjectedTrain setelah reduksi dimensi dengan LDA ... 47

Gambar 5.11. Hasil proses klasterisasi untuk matriks ProjectedTrain ... 49

Gambar 5.12. Hasil Proses Klasterisasi pada k=9 ... 50

Gambar 5.13. Visualisasi Kelas Viseme Statis Bahasa Indonesia ... 51

Gambar 5.14. Karakter Animasi Wajah ... 52

Gambar 5.15. Desain Antarmuka Sistem ... 54

Gambar 5.16. Menu file ... 54

Gambar 5.17. Waveform ... 57

(11)

xi

Gambar 5.19. Layout Sistem ... 58

Gambar 5.20. Layout Sistem Alternatif ... 59

Gambar 5.21. Laboratorium Motion Capture ... 60

Gambar 5.22. Formasi optiTrack Camera ... 60

Gambar 5.23. Face Template dan Pemasangan di Wajah ... 61

Gambar 5.24. Marker-marker di Kepala dan di mulut ... 62

Gambar 5.25. Overview Pembentukan Model-model Viseme Dinamis ... 63

Gambar 5.26. Bentuk Bidang untuk Acuan Sistem Koordinat ... 64

Gambar 5.27. Fitur Mulut ... 64

Gambar 5.28. Model-model Viseme Dinamis Bahasa Indonesia ... 68

Gambar 5.29. Home Page Sistem Visualisasi Berbasis Web ... 68

Gambar 5.30. Salah Satu Halaman Tentang BIPA ... 69

Gambar 5.31. Salah Satu Halaman Tentang Sistem Visualisasi Pelafalan BI ... 69

Gambar 5.32. Bukti Submit pada Jurnal International IRECOS ... 70

Gambar 5.33. Publikasi pada Seminar Nasional UPGRIS ... 71

Gambar 5.34. publikasi pada Seminar Nasional SNATi UII ... 71

(12)
(13)

1 BAB I PENDAHULUAN

1.1. Latar Belakang dan Permasalahan

Belajar bahasa adalah belajar mengenai skill atau keahlian. Bahasa tidak untuk dipahami atau diingat saja tetapi harus digunakan, diucapkan, dan dituliskan dalam setiap hembusan nafas kita. Apabila tidak digunakan, maka fungsi pembelajaran bahasa menjadi sia-sia. Dewasa ini, Bahasa Indonesia semakin diminati oleh orang asing atau penutur asing. Hal ini dapat dilihat dengan semakin banyak dibukanya lembaga-lembaga yang mengajarkan Bahasa Indonesia sebagai bahasa asing di beberapa negara. Di dalam negei, terdapat 45 perguruan tinggi baik negeri maupun swasta yang menyelenggarakan Program Darmasiswa. Program ini merupakan program pembelajaran Bahasa Indonesia bagi penutur asing yang diselenggarakan oleh Biro Kerjasama Luar Negeri Departemen Pendidikan dan Kebudayaan sejak tahun 2005 dan diikuti oleh 110 negara dari lima benua, yaitu Asia, Amerika, Australia, Eropa dan Afrika. Penelitian-penelitian terdahulu seperti yang dilakukan oleh Lengkanawati (1997)[1], Ajip Rosidi (2001)[2], dan Hardini (2004)[3] membuktikan adanya perkembangan pembelajaran Bahasa Indonesia bagi penutur asing.

Pembelajaran Bahasa Indonesia bagi penutur asing diharapkan dapat memperkenalkan Bahasa Indonesia kepada penutur asing untuk berbagai kepentingan, baik pengajaran maupun komunikasi praktis. Pembelajaran Bahasa Indonesia juga bertujuan untuk memberikan penguasaan bahasa secara lisan dan tulisan kepada para penutur asing, sehingga penutur asing diharapkan mampu menggunakannya dengan lancar dan sekaligus dapat mengerti bahasa yang digunakan oleh penutur aslinya.

Berbagai upaya telah banyak dilakukan untuk mewujudkan kondisi pembelajaran Bahasa Indonesia bagi penutur asing (biasanya disingkat dengan BIPA) yang mantap. Dalam konteks global, pembelajaran BIPA akan mengalami perkembangan, sehingga berbagai langkah harus segera dirumuskan untuk mengantisipasi perkembangan yang terjadi. Dan perkembangan saat ini yang cenderung berpihak pada perkembangan teknologi informasi.

Tujuan pembelajaran Bahasa Indonesia sebagai bahasa asing tidak serta merta dapat tercapai, karena dalam proses pembelajaran banyak ditemukan kendala-kendala atau permasalahan. Salah satu permasalahan yang muncul adalah kesalahan dalam

(14)

2

cakupan linguistik khususnya permasalahan fonologi. Secara umum fonologi merupakan ilmu bunyi yang mengkaji mengenai bunyi bahasa, maka pembahasan mengenai pengucapan atau pelafalan bunyi termasuk ke dalam bidang fonologi.

Pelatihan kata Bahasa Indonesia pada setiap vokal yang digunakan belum tentu sama pada setiap kata. Jadi, tidak bisa menyamaratakan bunyi dari vokal yang ditemukan di kata tersebut. Sebagai contoh adalah bunyi /E/ pelafalannya berbeda. Apabila salah melafalkan, akan berbeda maknanya. Pada kata /teras/ yang artinya halaman rumah dan /teras/ yang artinya pejabat. Bunyi yang demikian disebut dengan homograf. Kata /kepala/ berbeda pelafalannya apabila diucapkan oleh orang Jawa dan orang Medan. Bunyi /K/ di akhir kata ada yang diucapkan dan ada yang tidak diucapkan. Misalnya pada kata /sendok/, /kodok/ dan lain sebagainya.

Contoh-contoh di atas hanyalah sebagian kecil kesalahan dalam pelafalan yang ditemukan. Masih banyak sederet kata lain yang salah dalam pengucapannya. Keadaan seperti ini sangat memprihatinkan, apalagi jika kesalahan ini sudah berawal dari pengajaran Bahasa Indonesia pada tingkat dasar / pemula. Pola pemikiran seperti ini akan selalau melekat pada ingakatan mereka saat itu, sehingga akan sangat sulit untuk diperbaiki karena di alam bawah sadar mereka, pelafalan pertama-lah yang akan tersimpan dalam memori.

Dengan perkembangan teknologi internet yang demikian pesat, dapat digunakan untuk mendukung pembelajaran Bahasa Indonesia bagi penutur asing yang mempunyai waktu terbatas dan mempunyai keterbatasan jarak untuk mencari lembaga pembelajaran Bahasa Indonesia. Pembelajaran dengan menggunakan teknologi internet dengan metode pembelajaran jarak jauhnya dan sistem interaktif dapat diguanakn sebagai salah satu jalan keluar untuk membantu mereka dalam melaksanakan pembelajaran Bahasa Indonesia. Selain sistem yang interaktif, Sistem ini seyogyanya dapat menampilkan audio visual yang lebih menarik dengan teknologi multimedianya, sehingga sistem betul-betul menjadi solusi terhadap permasalahan yang ada.

Berdasarkan pemikiran di atas, penelitian ini dimaksudkan untuk mengembangkan sistem pembelajaran pelafalan Bahasa Indonesia yang interaktf (melibatkan interaksi antara user dengan sistem) dengan mengedepankan tampilan audio visual yang menarik, yaitu dengan menyertakan suara penutur dan visualisasi bentuk mulut saat pengucapan dengan karakter animasi yang menarik dan dapat diakses menggunakan teknologi internet sehingga dapat dijalankan secara online tidak

(15)

3

terbatas oleh jarak dan waktu. Hasil penelitian ini diharapkan menjadi solusi yang tepat terhadap permasalahan-permasalahan pembelajaran Bahasa Indonesia, khususnya masalah pelafalan Bahasa Indonesia bagi penutur asing.

1.2. Perumusan Masalah

Beerdasarkan latar belakang dan permasalahan di atas, perumusan masalah dalam penelitian ini adalah :

1. Bagaimana membangun model-model viseme (visual phoneme) Bahasa Indonesia dengan metode data-driven untuk data-data fitur yang diperoleh dari hasil ekstraksi dan reduksi dimensi data-data image dua dimensi dari hasil transformasi video orang Berbicara bahasa Indonesia yang berdurasi 6 menit. Data-data fitur ini selanjutnya di kluster (dikelompokan secara alamiah) sehingga dihasilkan kelas-kelas viseme?

2. Bagaimana membangun sistem pengucapan Bahasa Indonesia berdasarkan teks berbahasa Indonesia yang di tranformasikan menjadi fonem-fonem dan selanjutnya digunakan sebagai dasar penggenerasian suara. Pada tahap ini, diperlukan adanya database suara Bahasa Indonesia. Pembanganunan database suara ini tidak termasuk dalam cakupan penelitian ini, sehingga peneliti akan menggunakan database suara yang sudah dibangun oleh peneliti sebelumnya dengan memohon ijin kepada peneliti yang bersangkutan?

3. Bagaiman merancang pelafalan Bahasa Indonesia ke dalam sajian sistem yang interaktif dan mampu memvisualisasikan pelafalan Bahasa Indoensia dengan model animasi yang menarik sehingga pembelajaran pelafalan Bahasa Indonesia dapat disajikan lebih lengkap?

4. Bagaimana merancang dan membangun sistem ini dalam 2 versi, yaitu versi PC (Personal Computer) yang dapat mengakses sistem dari PC / laptop dan versi mobile yang dapat di akses dari hand phone?

5. Bagaimana mengimplementasikan aplikasi ini sebagai media pembelajaran yang efektif khususnya untuk penutur asing sebagai bahasa kedua. Dengan demikian Bahasa Indonesia menjadi salah satu bahasa yang mudah dipelajari oleh siapapun sehingga ekesistensi Bahasa Indonesia dapat lebih diakui seperti bahasa-bahasa lain di dunia ini?

(16)

4 BAB II

TINJAUAN PUSTAKA

2.1 State of The Art

Penelitian visualisasi pelafalan Bahasa Indonesia berkaitan dengan penelitian mengenai visual speech (visualisasi wicara) dan visual phoneme (viseme). Visualisasi pelafalan ini adalah salah satu metode terbaru menggunakan teknologi dalam memberikan pembelajaran pelafalan bahasa [4]. Penelitian yang terkait dengan hal tersebut telah banyak dilakukan, tetapi penelitian ini dilakukan pada bahasa selain bahasa Indonesia. Sedangkan penelitian bidang ini untuk Bahasa Indonesia masih jarang dilakukan. Salah satu penelitian yang terkait dengan viseme Bahasa Indoneisa, antara lain penelitian yang dilakukan oleh pengusul, Arifin dkk (2013)[5] yang dipresentasikan pada Seminar Internasional IEEE, dengan judul “Towards Building Indonesian Viseme: A Clustering-Based Approach”, dijelaskan bahwa model-model kelas viseme Bahasa Indonesia yang terbentuk pada penelitian ini adalah 10 kelas viseme. Pembentukan kelas-kelas viseme ini didasarkan hasil dari proses klusterisasi pada data-data fitur hasil ekstraksi fitur dari image-image yang diperoleh dari video orang berbicara Bahasa Indoneisa. Pembentukan model-model kelas ini merupakan tahap awal yang selanjutnya dapat digunakan sebagai dasar pembuatan sistem visualisasi pelafalan Bahasa Indonesia. Model-model kelas viseme tersebut dapat dilihat pada Gambar 2.1.

(17)

5

Didalam ilmu linguistik, terdapat beberapa cabang yang sangat penting untuk dipelajari, seperti sintaksis, morfologi, fonologi, dan lain sebagainya. Tetapi yang paling berkaitan dengan bahasa adalah bunyi yang dikeluarkan sehingga melambangkan sesuatu [6]. Ilmu linguistik yang berhubungan dengan bunyi, produksi bunyi, instrumen bunyi. Pembelajaran jarak jauh mengacu pada instruksional dimana guru dan siswa terpisah secara geografis. Metode ini digunakan untuk pembelajaran jarak jauh yang sudah terjadi selama dua abad. Sekarang, banyak sekali model pembelajaran jarak jauh menggunakan internet, menyediakan secara virtual pada lokasi yang tersambung dengan internet [7].

2.2 Visualisasi wicara

Wicara telah berkembang selama ribuan tahun sehingga saat ini manusia mampu menghasilkan aplikasi yang luas dari suara yang kompleks [8]. Suara ini diproduksi menggunakan rahang, bibir, lidah, velum dan laring, dan kedua rongga hidung dan rongga mulut. Ini semua adalah artikulator wicara dan ketika kita melihat dan mendengar seseorang berbicara, itu diproduksi oleh interaksi yang rumit dari artikulator ini. Penelitian analisis wicara telah mengembangkan set abstrak simbol untuk merepresentasikan wicara, yang meliputi :

a. Fonem, sebuah unit minimal yang dapat berfungsi untuk membedakan antara makna kata-kata. Difon merupakan rangkaian dua fonem berturut-turut, sedangkan trifon merupakan rangkaian tiga fonem berturut-turut.

b. Alofon, anggota dari keluarga fonem. Sebuah varian fonetik dari fonem dalam suatu bahasa tertentu.

c. Monoftong, suara vokal tunggal atau kombinasi dua vokal yang diucapkan seperti satu vokal.

d. Diftong, sebuah huruf vokal rangkap yang terdapat dalam satu suku kata, biasa disebut juga vokal rangkap.

2.2.1 Wicara

Bicara, Wicara, Ujaran, Tuturan adalah bentuk kegiatan komunikasi yang mengeluarkan suara / disuarakan antara sesama manusia. Hal ini didasarkan pada kombinasi sintaksis lexicals dan nama yang diambil dari kosakata yang sangat banyak (biasanya sekitar 10.000 kata-kata yang berbeda). Setiap kata yang diucapkan diciptakan dari kombinasi fonetik dari seperangkat terbatas unit suara vokal dan

(18)

6

konsonan. Kosa kata ini merupakan sintaks yang struktur, dan seperangkat dengan unit bunyi ujaran yang berbeda, menciptakan keberadaan ribuan jenis bahasa manusia agar bisa saling dimengerti. Penutur / manusia yang berbicara (poliglot) mampu berkomunikasi dalam dua bahasa atau lebih. Kemampuan vokal yang memungkinkan manusia untuk menghasilkan ujaran juga mampu menyebabkan manusia dengan kemampuan bernyanyi.

2.3 Metode Ekstraksi Fitur Bibir

Ekstraksi fitur merupakan dasar retieval citra berbasis konten. Ekstraksi fitur dapat diklasifikasi sebagi fitur-fitur umum dan fitur dengan spesifik domain. Klasifikasi pertama mencakup fitur warna, tekstur, dan bentuk, sedangkan klasifikasi kedua termasuk fitur-fitur yang merupakan fitur spesifik aplikasi sebagai contoh fitur untuk wajah manusia dan sidik jari.

Analisis otomatis dan akurasi fitur wajah telah memotivasi penelitian yang intensif dalam bidang visi komputer dan merupakan hal penting untuk beberapa aplikasi seperti animasi data-driven yang semakin banyak digunakan untuk identifikasi dan rekognisi wajah. Ekstraksi gerakan bibir semakin banyak digunakan untuk membantu rekognisi otomatis audio-visual dan untuk mempelajari ilmu wicara yaitu produksi wicara dan koartikulasi.

Sejumlah metode telah diusulkan untuk mengekstraksi kontur bibir dari citra. Sebagian besar metode-metode yang direview dalam sesi ini terdiri dari tiga kategori : metode feature-based, counter-based, dan model-based. Teknik feature-based mengekstrak daerah lokal fitur dari citra-citra dan mengidentifikasi fitur-fitur yang sesuai dalam masing-masing gambar berikutnya dalam urutan. Dengan teknik contour-based, kontur gerakan objek direpresentasikan oleh sebuah “snake” yang diupdat secara dinamis. Baik teknik feature-based dan contour-based, umumnya sangat tergantung pada inisialisasi. Teknik model-based mengeksploitasi ‘a priori knowledge’ objek khusus dalam sebuah adegan tertentu. Pelacakan terlokalisir dengan mencocokkan model yang diproyeksikan data citra.

2.3.1 Ekstraksi Berbasis Fitur

Salah satu metode yang paling umum ekstraksi fitur visual adalah metode deformable template [9]. Fitur yang menarik seperti bibir, dijelaskan oleh template yang diparameterisasi. Parametrik deformable template adalah sebuah model

(19)

7

matematika yang diparameterisasi digunakan untuk melacak gerakan objek. Sebuah fungsi energi didefinisikan yang menghubungkan tepi, puncak dan lembah dalam intensitas citra untuk propertis yang sesuai dengan template. Model berinteraksi secara dinamis dengan citra dengan cara mengubah nilai parameter untuk meminimalkan fungsi energi, sehingga menggambarkan bentuk template ke fitur yang penting. Pencarian citra dilakukan dengan deformable template yang pas untuk gradien citra, asumsi tepi yang kuat yang konsisten pada kontur bibir. Beberapa model parametrik telah diusulkan untuk bibir. Tian et al. [10] menggunakan tiga model state geometris sederhana yang terbuat dari parabola. Hennecke et al. [11] mengusulkan model bibir yang terdiri dari jenis curva, parabola dan quartik. Metode ini tidak mampu menyelesaikan detil kontur yang halus karena model parametrik tidak menjelaskan konsisten asimetrik bibir, khususnya selama wicara.

2.3.2 Ekstraksi Berbasis Kontour

Pendekatan lain yang umum untuk pemodelan bentuk didasarkan pada model kontur active yang memparameterisasi energi yang meminimalkan spline yang konvergen ke suatu kontur objek dalam sebuah citra. Teknik snake pertama dikenalkan oleh Kass et al. [12]. Modifikasi teknik ini telah diaplikasikan ke bibir dalam [13]. Snake dapat menyelesaikan detil kontur yang halus, namun sensitif terhadap daerah yang menonjol, karena bayangan dan refleksi, dekat dengan batas bibir yang diinginkan dan dengan demikian menyelaraskan minimum lokal yang diinginkan. Konfigurasi bibir direpresentasikan sebagai titik dalam ruang fitur dan satu set dari semua konfigurasi bibir adalah permukaan atau manifold dalam ruang ini.

Barnard et al. [14] mengembangkan sistem lip-tracking yang menggunakan kombinasi dari algoritma snake yang dimodifikasi [15] dan teknik pencocokan template 2D yang tidak memerlukan pelatihan sebelumnya. Dalam kasus ini, snake dikontrol dengan menggunakan template pola dua dimensi dari kontur tepi bibir yang bukan gradien citra. Titik snake dan template pola 2D diinisialisasi secara manual sekitar tepi bibir luar untuk frame pertama. Selama tracking, template titik snake diupdat dengan menggunakan rata-rata tertimbang dari template pola awal dan template diekstrak dari citra sebelumnya dari urutan. Energi citra didefiniskan sebagai korelasi 2D antara patch 2D dari citra dan template yang diharapkan untuk titik snake yang spesifik.

(20)

8 2.4 Artikulasi dan Koartikulasi

Artikulator adalah bagian alat-alat ucap yang terdapat dalam rongga mulut yang bisa digerakkan, dan bagian-bagian alat ucap yang menjadi sasaran sentuh disebut titik artikulasi. Artikulator berada dibagian bawah rongga mulut, sedangkan titik artikulasi berada dibagian atas rongga mulut. Koartikulasi adalah fenomena fisik yang menggambarkan ‘kaburnya’ perbedaan antara unit atomik wicara, baik yang terlihat dan terdengar. Transisi antara gerakan artikulatoris yang dibawa oleh sistem fisik otot. Hasil koartikulasi adalah bahwa gerakan artikulatoris yang dibentuk untuk unit wicara tertentu (dan suara yang dihasilkan itu sendiri) akan bervariasi selama produksi wicara alami. Koartikulasi tidak sekedar memperhatikan sejauh mana isyarat direalisasikan, tetapi juga pengaruh gerakan selama aksi wicara. Koartikulasi dapat antisipatif, yaitu saluran vokal yang mempersipkan gerakan penting yang akan datang (koartikulasi maju, misalnya pembuatan bibir dalam two), dan juga dapat mencerminkan efek yang dibawa dari gerakan sebelumnya (koartikulasi terbalik, misalnya tonjolan bibir dalam boots).

Dalam rangka untuk menjelaskan sifat koartikulasi, beberapa teori telah diusulkan. Kent dan Minifie [3] mengkategorikan menjadi : learnt allophonic models; target based models; dan hierarchical models. Model hirarkis menempatkan koartikulasi sebagai bagian dari strategi produksi wicara secara keseluruhan, misalnya Kent dan Minifie mengusulkan hirarki yang meliputi tugas wicara dari kontrol neuromotor sampai dengan pengelompokan suku kata. Sementara ada banyak usulan, dengan pencocokan argumen dan bukti yang mendukung, beberapa cukup konkrit untuk diletakan untuk penggunaan praktis (misalnya dalam sebuah sistem sintesis). 2.4.1 Definisi Koartikulasi

Koartikulasi atau artikulasi penyerta atau artikulasi skunder adalah gejala saling mempengaruhi antara bunyi yang satu dengan bunyi yang lain, dan dapat ditinjau dari tempat artikulasi yang mana yang mempengaruhi terjadinya gejala tersebut. Dalam proses ini, artikulasi primer, yaitu artikulator yang bekerja untuk menghasilkan bunyi tertentu, secara bersamaan tersertakan gerakan artikulator itu yang menghasilkan bunyi yang lain (artikulasi skunder). Contohnya yaitu bunyi /b/ pada kata “buku” dengan bunyi /b/ pada kata “baca”, diucapkan berbeda, meskipun titik artikulasinya sama yaitu bilabial.

(21)

9

Perbedaan yang menyebabkan terjadinya pengucapan yang berbeda yaitu adanya artikulasi penyerta (koartikulasi) dari vukuoid yang mengikutinya. Kata “buku”, vokoid yang langsung mengikutinya yaitu vokoid /u/. Vokoid /u/ adalah vokoid belakang, tinggi, bundar, maka /b/ pada kata “buku” diucapkan dengan posisi bibir bundar. Proses pengaruh bunyi yang disebabkan oleh artikulasi penyerta dapat dibedakan atas: labialisasi, retrospeksi, palatalisasi, velarisasi, dan glotalisasi [39]. (1) Labialisasi

Labialisasi adalah pembulatan bibir pada artikulasi primer sehingga terdengar bunyi semi vokal [w] pada bunyi utama tersebut. Kecuali bunyi labial, bunyi bahasa dapat disertai labialisasi. Misalnya, bunyi [t] pada kata tujuan terdengar sebagai bunyi [tw] atau [t dilabialisasi].

(2) Retrofleksi

Retrofleksi adalah penarikan ujung lidah ke belakang pada artikulasi primer, sehingga terdengar [r] pada bunyi utamanya. Kecuali bunyi apikal, bunyi lain dapat disertai retrofleksi. Misalnya, [kr] atau [k] diretrofleksi seperti kata kerdus. (3) Palatalisasi

Palatalisasi adalah pengangkatan daun lidah ke arah langit-langit keras pada artikulasi primer. Kecuali bunyi palatal, bunyi lain dapat disertai palatalisasi. Misalnya, bunyi bunyi [p] dalam kata piara terdengar sebagai [py] atau [p] dipalatalisasi.

(3) Velarisasi

Velarisasi adalah pengangkatan pangkal lidah ke arah langit-langit lunak pada artikulasi primer. Selain buinyi velar, bunyi-bunyi lain dapat divelarisasi. Misalnya, bunyi [m] dalam kata mahluk terdengar sebagai [mx] atau [m] divelarisasi.

(4) Glotalisasi

Glotalisasi adalah proses penyerta hambatan pada glottis atau glottis tertutup rapat sewaktu artikulasi primer diucapkan. Selain bunyi glotal, bunyi-bunyi lain dapat disertai glotalisasi. Vokal pada awal kata dalam bahasa Indonesia sering diglotalisasikan. Misalnya bunyi [o] dalam obat terdengar sebagai [?o] [?obat] atau [o] diglotalisasi.

(22)

10 2.5 Pengertian Fonem dalam Bahasa Indonesia 2.5.1 Fonologi, Fonetik dan Fonemik

Sebelum membahas tentang pembentukan fonem dalam bahasa Indonesia secara lebih nci, terlebih dahulu akan dijelaskan tentang pengertian fonologi, fonetik, dan fonemik. Dari beberapa sumber, pengertian fonologi (phonology) antara lain :

o Fonologi ialah bagian dari tata bahasa yang memperlajari bunyi-bunyi bahasa [16].

o Fonologi ialah bidang dalam linguistik yang menyelidiki bunyi-bunyi bahasa menurut fungsinya [18].

o Fonologi ialah bidang linguistik yang mempelajari, menganalisis, dan membicarakan runtutan bunyi-bunyi bahasa, yang secara etimologi terbentuk dari kata fon yaitu bunyi dan logi yaitu ilmu [17].

o Dalam Kamus Besar Bahasa Indonesia (1997) dinyatakan bahwa fonologi adalah bidang dalam linguistik yang menyelidiki bunyi-bunyi bahasa menurut fungsinya.

Secara garis besar fonologi adalah merupakan sistem bunyi dalam bahasa Indonesia atau dapat juga dikatakan bahwa fonologi adalah ilmu tentang bunyi bahasa. Fonologi dalam tataran ilmu bahasa dibagi dua bagian, yaitu: (1) fonetik dan (2) fonemik. Gambar 2.2. menunjukkan dua cabang fonologi tersebut.

Gambar 2.2. Cabang Ilmu Fonologi Dari beberapa sumber, pengertian fonetik antara lain adalah :

 Fonetik adalah cabang studi fonologi yang mempelajari bunyi bahasa tanpa memperhatikan apakah bunyi-bunyi tersebut mempunyai fungsi sebagai pembeda makna atau tidak [17].

 Fonetik adalah ilmu yang menyelidiki dan menganalisa bunyi-bunyi ujaran yang dipakai dalam tutur, serta mempelajari bagaimana menghasilkan bunyi-bunyi tersebut dengan alat ucap manusia [16].

 Fonetik adalah ilmu yang menyelidiki penghasilan, penyampaian, dan penerimaan bunyi bahasa; ilmu interdisipliner linguistik dengan fisika, anatomi, dan psikologi [18].

(23)

11

Secara garis besar fonetik adalah ilmu bahasa yang membahas bunyi-bunyi bahasa yang dihasilkan alat ucap manusia, serta bagaimana bunyi itu dihasilkan. Macam-macam fonetik antara lain :

a. Fonetik artikulatoris adalah fonetik yang mempelajari posisi dan gerakan bibir, lidah dan organ-organ manusia lainnya yang memproduksi suara atau bunyi bahasa.

b. Fonetik akustik adalah fonetik yang mempelajari gelombang suara dan bagaimana mereka didengarkan oleh telinga manusia.

c. Fonetik auditori adalah fonetik yang mempelajari persepsi bunyi dan terutama bagaimana otak mengolah data yang masuk sebagai suara.

Dari beberapa sumber, pengertian fonemik (phonemic) antara lain :

 Fonemik adalah cabang studi fonologi yang mempelajari bunyi bahasa dengan memperhatikan fungsi bunyi tersebut sebagai pembeda makna [17].

 Fonemik adalah ilmu yang mempelajari bunyi ujaran dalam fungsinya sebagai pembeda arti [16].

 Fonemik adalah penyelidikan mengenai sistem fonem suatu bahasa [18].

Secara garis besar fonemik adalah ilmu bahasa yang membahas bunyi-bunyi bahasa yang berfungsi sebagai pembeda makna. Jika dalam fonetik kita mempelajari segala macam bunyi yang dapat dihasilkan oleh alat-alat ucap serta bagaimana tiap-tiap bunyi itu dilaksanakan, maka dalam fonemik kita mempelajari dan menyelidiki kemungkinan-kemungkinan, bunyi-ujaran yang manakah yang dapat mempunyai fungsi untuk membedakan arti? Untuk jelasnya kalau kita perhatikan baik-baik ternyata bunyi [i] yang terdapat pada kata-kata [intan], [angin], dan [batik] adalah tidak sama. Begitu juga bunyi [p] pada kata dalam bahasa Inggris [pace], [space], dan [map], juga tidak sama. Ketidaksamaan bunyi [i] dan bunyi [p] pada deretan kata-kata di atas itulah salah satu contoh obyek atau sasaran studi fonetik.

Dalam kajiannya, fonetik akan berusaha mendeskripsikan perbedaan bunyi-bunyi itu serta menjelaskan sebab-sebabnya. Sebaliknya, perbedaan bunyi-bunyi [p] dan [b] yang terdapat, misalnya, pada kata [paru] dan [baru] adalah menjadi contoh sasaran studi fonemik, sebab perbedaan bunyi [p] dan [b] itu menyebabkan berbedanya makna kata [paru] dan [baru] itu

(24)

12 2.5.2 Pengertian Dasar Fonem

Sebelum ditemukan sejumlah fonem dalam bahasa Indonesia terlebih akan dirumuskan mengenai pengertian tentang fonem. Fonem adalah unsur bahasa yang terkecil dan dapat membedakan arti atau makna [19]. Berdasarkan definisi diatas maka setiap bunyi bahasa, baik segmental maupun suprasegmental apabila terbukti dapat membedakan arti dapat disebut fonem.

Setiap bunyi bahasa memiliki peluang yang sama untuk menjadi fonem. Namun, tidak semua bunyi bahasa pasti akan menjadi fonem. Bunyi itu harus diuji dengan beberapa pengujian penemuan fonem. Nama fonem, ciri-ciri fonem, dan watak fonem berasal dari bunyi bahasa. Adakalanya jumlah fonem sama dengan jumlah bunyi bahasa, tetapi sangat jarang terjadi. Pada umumnya fonem suatu bahasa lebih sedikit daripada jumlah bunyi suatu bahasa.

Berdasarkan kenyataan, ternyata di dalam bahasa Indonesia hanya ditemukan fonem segmental saja, dan bunyi suprasegmental tidak terbukti dapat membedakan arti. Oleh karena itu, dalam bahasa Indonesia tidak ditemukannya fonem suprasegmental. Itulah sebabnya dalam kajian berikut ini hanya dibicarakan fonem segmental bahasa Indonesia yang meliputi fonem vokal, fonem konsonan, dan fonem semi konsonan.

Dalam mengenali fonem terdapat beberapa pokok pikiran umum yang disebut premis-premis fonologis. Berdasarkan sifat umumnya premis-premis bahasa tersebut adalah sebagai berikut:

a) Bunyi bahasa mempunyai kencenderungan untuk dipengaruhi oleh lingkungannya.

b) Sistem bunyi mempunyai kecenderungan bersifat simetris.

c) Bunyi-bunyi bahasa yang secara fonetis mirip harus digolongkan ke dalam kelas-kelas bunyi (fonem) yang berbeda, apabila terdapat pertentangan di dalam lingkungan yang sama.

d) Bunyi-bunyi yang secara fonetis mirip dan terdapat di dalam distribusi yang komplementer, harus dimasukkan ke dalam kelas-kelas bunyi (fonem) yang sama.

Untuk mengenal dan menentukan bunyi-bunyi bahasa yang bersifat fungsional (fonem), biasanya ditentukan melalui kontras pasangan minimal. Pasangan minimal ini adalah pasangan bentuk-bentuk bahasa yang terkecil dan bermakna pada sebuah bahasa atau kata tunggal yang secara ideal sama, kecuali satu bunyi berbeda.

(25)

13

Contohnya : dara dan tara fonemnya /d/ dan /t/ atau kalah dan galah fonemnya /k/ dan /g/.

2.5.3 Pelafalan Artikulasi Fonem

Fonem adalah satuan bunyi bahasa terkecil yang bersifat fungsional, artinya satuan yang memiliki fungsi untuk membedakan makna. Fonem tidak dapat berdiri sendiri karena belum mengandung arti. Fonemisasi adalah usaha untuk menemukan bunyi-bunyi yang berfungsi dalam rangka pembedaan makna.

Dalam bahasa Indonesia bunyi [f], [v] dan [p] pada dasarnya bukanlah tiga fonem yang berbeda. Kata provinsi apabila dilafazkan sebagai [propinsi], [profinsi] atau [provinsi] tetap sama saja. Fonem tidak memiliki makna, tapi peranannya dalam bahasa sangat penting karena fonem dapat membedakan makna. Misalnya saja fonem [l] dengan [r]. Jika kedua fonem tersebut berdiri sendiri, pastilah kita tidak akan menangkap makna. Akan tetapi lain halnya jika kedua fonem tersebut kita gabungkan dengan fonem lainnya seperti [m], [a], dan [h], maka fonem [l] dan [r] bisa membentuk makna /marah/ dan /malah/. Bagi orang Jepang kata marah dan malah mungkin mereka anggap sama karena dalam bahasa mereka tidak ada fonem [l]. Contoh lain: mari, lari, dari, tari, sari, jika satu unsur diganti dengan unsur lain maka akan membawa akibat yang besar yakni perubahan arti.

2.5.4 Simbol dan Bunyi

Dalam kajian fonologi sering dipaparkan simbol dan bunyi dari oposisi fonemis tertentu. Oposisi rendah terdapat pada bunyi /p/ dan /f/ pada kata kapan dan kafan, sedangkan oposisi tinggi terdapat pada bunyi /k/ dan /g/ pada kata gita dan kita. 2.5.4.1 Realisasi Fonem

Realisasi fonem adalah pengungkapan sebenarnya dari ciri atau satuan fonologis, yaitu fonem menjadi bunyi bahasa. Realisasi fonem antara lain:

(1) Realisasi Vokal, berdasarkan pembentukannya, realisasi fonem vokal dibedakan sebagai berikut :

a) Fonem /i/ adalah vokal tinggi-depan-tak bulat. b) Fonem /u/ adalah vokal atas-belakang-bulat. c) Fonem /e/ adalah vokal sedang-depan-bulat. d) Fonem /Ɛ/ adalah vokal sedang-teng.ah-bulat. e) Fonem /ə/ adalah vokal rendah-tengah-bulat

(26)

14

f) Fonem /o/ adalah vokal sedang-belakang-bulat g) Fonem /O/ adalah vokal tinggi-tengah-bulat h) Fonem /a/ adalah vokal rendah-tengah-bulat.

(2) Realisasi Konsonan, berdasarkan cara pembentukannya, realisasi fonem konsonan dibedakan sebagai berikut :

a) Konsonan hambat, dibedakan sebagai berikut : o konsonan hambat-bilabial, yaitu fonem /p/ dan /b/ o konsonan hambat-dental, yaitu fonem /t/ dan /d/ o konsonan hambat-palatal, yaitu /c/ dan /j/ o konsonan hambat-velar, yaitu /k/ dan /g/ b) Konsonan Frikatif, dibedakan sebagai berikut :

o konsonan frikatif-labio-dental, yaitu /f/ dan /v/ o konsonan ferikatif-alveolar, yaitu /s/ dan /z/ o konsonan frikatif-palatal tak bersuara, yaitu /sy/ o konsonan frikatif-velar tak bersuara, yaitu /x/ dan /kh/ o konsonan frikatif-glotal tak bersuara, yaitu /h/

c) Konsonan getar-alveolar, yaitu /r/ d) Konsonan lateral-alveolar, yaitu /l/

e) Konsonan nasal, dibedakan dalam daerah artikulasi sebagai berikut : o konsonan nasal-bilabial, yaitu /m/

o konsonan nasal-dental, yaitu /n/ o konsonan nasal-palatal, yaitu /ny/ o konsonan nasal-velar, yaitu /h/

f) Semi-vokal , yaitu semivokal bilabial (/w/) dan semivokal palatal( /y/). 2.5.4.2 Variasi Fonem

Variasi fonem ditentukan oleh lingkungan dalam distribusi yang komplementer disebut variasi alofonis. Variasi fonem yang tidak membedakan bentuk dan arti kata disebut alofon, yang terdiri dari :

(1) Alofon Vokal

a) Alofon fonem /i/, yaitu:

[i] jika terdapat pada suku kata terbuka, misalnya, [bibi] /bibi/ [I] jika terdapat pada suku kata tertutup, misalnya, [karIb] /karib/ [Iy] palatalisasi jika diikuti oleh vokal [a,o,u], misalnya [kiyos] /kios/

(27)

15

[ϊ] nasalisasi jika diikuti oleh nasal. [ϊndah]à /indah/ b) Alofon fonem /ε/, yaitu:

[e] jika terdapat pada suku kata terbuka dan tidak diikuti oleh suku kata yang mengandung alofon [ε]. Misalnya, [sore] /sore/

[ε] jika terdapat pada tempat-tempat lain. Misalnya, [pεsta] /pesta/ [ə] jika terdapat pada posisi suku kata terbuka. [pəta] /peta/

[¶] jika terdapat pada posisi suku kata tertutup. [sent¶r] /senter/ c) Alofon fonem /o/, yaitu:

[o] jika terdapat pada suku kata akhir terbuka. [soto] /soto/ [O] jika terdapat pada posisi lain. [jeblÉs] /jeblos/

d) Alofon fonem /a/, yaitu:

[a] jika terdapat pada semua posisi suku kata. [aku] /aku/ e) Alofon fonem /u/, yaitu:

[u] jika terdapat pada posisi suku kata terbuka. [aku] /aku/ [U] jika terdapat pada suku kata tertutup. [kumpul] /kumpul/

[uw] labialisasi jika diikuti oleh [I,e,a]. [buwih] /buih/, [kuwe] /kue/ (2) Alofon Konsonan

a) Fonem /p/

[p] bunyi lepas jika diikuti vokal. [pipi] /pipi/, [sapi] /sapi/

[p>] bunyi tak lepas jika terdapat pada suku kata tertutup. [atap>] /atap/ [b] bunyi lepas jika diikuti oleh vocal. [babi] /babi/, [babu] /babu/

[p>] bunyi taklepas jika terdapat pada suku kata tertutup, namun berubah lagi menjadi [b] jika diikuti lagi vokal. [adap>] /adab/, [jawap>] /jawab/

b) Fonem /t/

[t] bunyi lepas jika diikut oleh vokal. [tanam] /tanam/, [tusuk] /tusuk/

[t>] bunyi tak lepas jika terdapat pada suku kata tertutup. [lompat>] /lompat/, [sakit>] /sakit/

[d] bunyi lepas jika diikuti vocal. [duta] /duta/, [dadu] /dadu/

[t>] bunyi hambat-dental-tak bersuara dan tak lepas jika terdapat pada suku kata tertutup atau pada akhir kata. [abat>] /abad/, [murtat>] /murtad/ c) Fonem /k/

[k] bunyi lepas jika terdapat pada awal suku kata. [kala] /kala/, [kelam] /kelam/

(28)

16

[k>] bunyi tak lepas jika tedapat pada tengah kata dan diikuti konsonan lain. [pak>sa] /paksa/, [sik>sa] /siksa/

[?] bunyi hambat glottal jika terdapat pada akhir kata. [tida?] /tidak/, [ana?] /anak/

d) Fonem /g/

[g] bunyi lepas jika diikuti glottal. [gagah] /gagah/, [gula] /gula/

[k>] bunyi hambat-velar-tak bersuara dan lepas jika terdapat di akhir kata. [beduk>] /bedug/, [gudek>] /gudeg/

e) Fonem /c/

[c] bunyi lepas jika diikuti vocal. [cari] /cari/, [cacing] /cacing/ f) Fonem /j/

[j] bunyi lepas jika diikuti vocal. [juga] /juga/, [jadi] /jadi/ g) Fonem /f/

[f] jika terdapat pada posisi sebelum dan sesudah vocal. [fakir] /fakir/, [fitri] /fitri/

h) Fonem /z/

[z] [zat] /zat/, [izin] /izin/ i) Fonem /š/

[š] umumnya terdapat di awal dan akhir kata [šarat] /syarat/, [araš] /arasy/ j) Fonem /x/

[x] berada di awal dan akhir suku kata. [xas] /khas/, [xusus] /khusus/ k) Fonem /h/

[h] bunyi tak bersuara jika terdapat di awal dan akhir suku kata. [hasil] /hasil, [hujan] /hujan/

[H] jika berada di tengah kata. [taHu] /tahu/, [laHan] /lahan/ l) Fonem /m/

[m] berada di awal dan akhir suku kata. [masuk] /masuk/, [makan] /makan/ m) Fonem /n/

[n] berada di awal dan akhir suku kata. [nakal] /nakal/, [nasib] /nasib/ n) Fonem /ň/

[ň] berada di awal suku kata. [baňak] /banyak/, [buňi] /bunyi/ o) Fonem /Ƞ/

[Ƞ] berada di awal dan akhir suku kata. [Ƞarai] /ngarai/, [paȠkal] /pangkal/ p) Fonem /r/

(29)

17

[r] berada di awal dan akhir suku kata, kadang-kadang bervariasi dengan bunyi getar uvular [R]. [raja] atau [Raja] /raja/, [karya] atau [kaRya] /karya/

q) Fonem /l/

[l] berada di awal dan akhir suku kata. [lama] /lama/, [palsu] /palsu/ r) Fonem /w/

[w] merupakan konsonan jika terdapat di awal suku kata dan semi vocal pada akhir suku kata. [waktu] /waktu/, [wujud] /wujud/

s) Fonem /y/

[y] merupakan konsonan jika terdapat di awal suku kata dan semi vocal pada akhir suku kata. [santay] /santai/, [ramai] /ramai/

(3) DIFTONG

Diftong adalah dua buah vokal yang berdiri bersama dan pada saat diucapkan berubah kualitasnya. Perbedaan vokal dengan diftong adalah terletak pada cara hembusan nafasnya. Diftong dalam bahasa Indonesia adalah sebagai berikut :

a) Diftong /au/, pengucapannya [aw]. [kerbaw] /kerbau/, [pulaw] /pulau/ b) Diftong /ai/, pengucapannya [ay]. [santay] /santai/, [sungay] /sungai/ c) Diftong /oi/, pengucapannya [oy]. [amboy] /amboi/, [asoy] /asoi/ 2.5.5 Pembentukan Fonem Bahasa Indonesia

Bunyi bahasa yang disebut fon dibentuk dengan cara diartikulasikan. Berdasarkan sifatnya, artikulator terbagi dua, yakni: (1) artikulator aktif dan (2) artikulator pasif. Artikulator aktif biasanya berpindah-pindah posisi untuk menentukan titik artikulasi guna menghasilkan bunyi bahasa. Menurut [20], hubungan posisional antara artikulator aktif dan artikulator pasif disebut struktur (structrure). Oleh karena vokal tidak mempunyai artikulasi, strukturnya ditentukan oleh celah antara lidah dan langit-langit. Sesuai dengan strukturnya, di bawah ini dikemukakan cara-cara membentuk fonem, baik vokal maupun konsonan.

2.5.5.1 Cara Pembentukan Vokal

Vokal yaitu bunyi ucapan yang terbentuk oleh udara yang keluar dari paru-paru dan ketika melalui tenggorokan mendapat hambatan. Kualitas vokal umumnya ditentukan oleh tiga hal, antara lain:

(1) bulat-hamparnya bentuk bibir, (2) atas-bawah lidah, dan

(30)

18 (3) maju-mundurnya lidah.

Penentuan klasifikasi vokal diperkenalkan oleh Daniel Jones [38] dengan istilah sistem vokal kardinal, lihat Gambar 2.3. Vokal kardinal adalah bunyi vokal yang mempunyai kualitas tertentu, yang telah dipilih sedemikian rupa untuk dibentuk dalam suatu rangka gambar bunyi. Rangka gambar bunyi ini dapat dipakai sebagai acuan perbandingan dalam deskripsi vokal seluruh bahasa dunia.

Gambar 2.3. Posisi Lidah pada Daerah Artikulasi Vokal

Vokal kardinal dilambangkan dengan [i, e, ε, a, u, o, O, dan ə] dalam International Phonetics Association [39]. Adapun vokal dalam bahasa Indonesia berjumlah delapan buah, yakni: [a], [i], [ə], [e], [ε], [o], [O], dan [u]. Pembentukan vokal ini didasarkan pada posisi bibir, tinggi rendahnya lidah, dan maju mundurnya lidah.

2.5.5.2 Pembentukan Vokal Berdasarkan Tinggi Rendahnya Lidah dan Lidah yang Bergerak

Pembentukan vokal dasar berdasarkan tinggi rendahnya lidah, dapat dibedakan menjadi:

a. Vokal tinggi atau atas yang dibentuk apabila rahang bawah merapat ke rahang atas: [i] dan [u]

b. Vokal madya atau tengah yang dibentuk apabila rahang bahwa menjauh sedikit dari rahang atas: [e], [...], [o] dan [O]

c. Vokal rendah atau tengah yang di bentuk apabila rahang bawah diundurkan lagi sejauh-jauhnya: [a] dan [ə].

Berdasarkan lidah yang bergerak, vokal dibedakan adanya:

a) Vokal depan, yaitu vokal yang dihasilkan oleh gerakan peranan turun naiknya lidah bagian depan, misalnya bunyi [i, e, ... , ə];

b) Vokal tengah, yaitu vokal yang dihasilkan oleh gerakan peranan lidah bagian tengah, misalnya bunyi [a];

(31)

19

c) Vokal belakang, yaitu vokal yang digerakan peranan turun naiknya lidah bagian belakang (pangkal lidah), misalnya bunyi [u, o, O].

Untuk melihat posisi lidah dalam mengucapkan vokal, dapat dilihat pada Gambar 2.4.

Posisi Lidah pada Daerah Artikulasi Vokal

[i, e, ə , a] [ a ] [u, o] Posisi Lidah dalam

Mengucapkan Vokal Depan

Posisi Lidah dalam Mengucapkan Vokal

Tengah

Posisi Lidah dalam Mengucapkan Vokal

Belakang Gambar 2.4 Posisi Lidah dalam Mengucapkan Vokal Depan, Tengah dan

Belakang [39] 2.5.5.3 Struktur Vokal

Struktur ialah keadaan hubungan posisional artikulator aktif dengan artikulator pasif[39]. Karena vokal tidak ada artikulasi, maka struktur untuk vokal ditentukan oleh jarak lidah dengan langit-langit. Menurut strukturnya, maka vokal dapat dibedakan atas :

(a) vokal tertutup (close vowel), yaitu vokal yang dibentuk dengan lidah diangkat setinggi mungkin mendekati langit-langit dalam batas vokal. Vokal tertutup ini dapat digambarkan terletak pada garis yang menghubungkan antara [i] dengan [u]. Jadi, vokal [i] dan [u] menurut strukturnya merupakan vokal tertutup.

(b) vokal semi-tertutup (half-close), yaitu vokal yang dibentuk dengan lidah diangkat dalam ketinggian sepertiga di bawah tertutup atau dua pertiga di atas vokal yang paling rendah, terletak pada garis yang menghubungkan antara vokal [e] dengan [...]. Dengan demikian, vokal [e] dan [...] adalah semi-tertutup.

(c) vokal semi-terbuka (half-open), yaitu vokal yang dibentuk dengan lidah diangkat dalam ketinggian sepertiga diatas vokal yang paling rendah atau dua pertiga di bawah vokal tertutup. Letaknya pada garis yang menghubungkan vokal [o] dengan [O], dan

(32)

20

(d) vokal terbuka (open vowel), yaitu vokal yang dibentuk dengan lidah dalam posisi serendah mungkin, pada garis yang menghubungkan antara vokal [a] dengan [ə].

Menurut bentuk bibir dibedakan adanya: (a) vokal bulat dan (b) vokal tak bulat. Vokal bulat yaitu vokal yang diucapkan dengan bentuk bibir bulat. Bentuk bibir bulat bisa terbuka atau tertutup, misalnya vokal [o] dan vokal [u]. Vokal tak bulat, yaitu vokal yang diucapkan dengan bentuk bibir tidak bulat atau terbentang lebar, misalnya vokal [i, e, a]. Bentuk bibir tak bulat terbentang lebar. Contoh dari kedua bentuk bibir dapat dilihat dalam Gambar 2.5. di bawah ini.

Bentuk Bibir Bulat Bentuk Bibir Tak Bulat Gambar 2.5. Bentuk Bibir Bulat dan Tak Bulat

2.5.5.4 Cara Pembentukan Konsonan

Jika bunyi ujaran, ketika udara keluar dari paru-paru mendapat halangan, maka terjadilah bunyi konsonan. Halangan yang dijumpai bermacam-macam, ada hubungan yang bersifat seluruhnya, dan ada pula yang sebagian yaitu dengan menggeser atau mengadukkan arus suara/tabel sehingga menghasilkan konsonan bermacam-macam pula. Gambar 2.6. adalah daerah artikulasi pada pengucapan konsonan.

Daerah artikulasi (pasif & aktif): 1. Bibir luar, 2. Bibir dalam, 3. Gigi, 4. Rongga-gigi, 5. Pascarongga-gigi, 6. Pralangit-langit, 7. Langit-langit, 8. Langit-langit belakang, 9. Tekak, 10. Hulu kerongkongan, 11. Celah suara, 12. Katup napas, 13. Akar lidah, 14. Lidah belakang, 15. Punggung lidah, 16. Lidah depan, 17. Ujung lidah, 18. Bawah ujung lidah.

Gambar 2.6. Daerah Artikulasi pada Pengucapan Konsonan

Artikulasi adalah perubahan rongga dan ruang dalam saluran suara untuk menghasilkan bunyi bahasa. Daerah artikulasi terbentang dari bibir luar sampai pita suara, fonem-fonem terbentuk berdasarkan getaran pita suara disertai perubahan posisi lidah dan semacamnya.

(33)

21

Bunyi konsonan dihasilkan apabila arus udara mendapat hambatan, baik di rongga mulut atau di rongga hidung. Konsonan dalam bahasa Indonesia dapat digolongkan berdasarkan tiga faktor, yaitu:

(a) Bergetar tidaknya pita suara: konsonan bersuara dan konsonan tidak bersuara (b) Daerah artikulasi: bilabial, labiodental, alveolar, palatal, velar, glotal. (c) Cara artikulasi: hambat, frikatif ,nasal, getar atau lateral.

Bunyi konsonan biasanya dibedakan berdasarkan tiga kriteria, yaitu posisi pita suara, tempat artikulasi, dan cara artikulasi. Ketiga kriteria tersebut dapat dijelaskan sebagai berikut:

(1) Posisi pita suara dibedakan adanya bunyi bersuara dan tidak bersuara. Bunyi terjadi apabila hanya pita suara terbuka sedikit, sehingga terjadi getaran pada pita suara. Bunyi bersuara antara lain, bunyi [b], [d], [g], dan [j]. Bunyi tidak bersuara terjadi apabila pita suara terbuka agak lebar, sehingga tidak ada getaran pada pita suara. Bunyi yang termasuk tidak bersuara, antara lain; bunyi [s], [k], [p], [t]. (2) Tempat artikulasi tidak lain dari pada alat ucap yang digunakan dalam

pembentukan bunyi konsonan. Berdasarkan tempat artikulasinya kita mengenal konsonan:

a) Bilabial, yaitu konsonan yang terjadi pada kedua belah bibir, bibir bawah merapat pada bibir atas. Bunyi yang termasuk konsonan bilabial adalah bunyi [b], [p], dan [m].

b) Labio-dental, yaitu konsonan yang terjadi pada gigi atas dan bibir bawah; gigi atas merapat pada bibir bawah. Bunyi yang termasuk konsonan labio-dental adalah bunyi [f], [v], dan [w].

c) Dental/alveoral, yaitu konsonan yang terjadi pada ujung lidah yang ditempelkan pada gusi yang merupakan daerah kasar terletak di belakang gigi atas. Bunyi yang termasuk konsonan dental/alveoral adalah [t], [d], [s], [z], [n], [r], dan [l].

d) Palatal, adalah bunyi yang dibentuk dengan lidah menyentuh langit-langit keras. Bunyi yang termasuk konsonan palatal adalah bunyi [c], [j], [š], [ň], dan [y].

e) Velar, yaitu bunyi yang dihasilkan dengan bagian belakang lidah menyentuh langit-langit lunak. Bunyi yang termasuk konsonan velar adalah bunyi [k, kh], [g], [q], [x], dan [ŋ].

(34)

22

f) Glotal, pengucapan bunyi glottal atau hamzah tidak terlalu menuntut penggunaan lidah dan bagian mulut yang lain secara aktif. Bunyi yang termasuk konsonan glotal adalah [h] dan [?].

(3) Cara artikulasi, yaitu bagaimana gangguan atau hambatan yang dilakukan terhadap arus udara. Berdasarkan cara artikulasinya konsonan dapat dibedakan menjadi:

a. Hambat, yaitu bunyi yang dihasilkan dengan menghambat arus udara yang keluar dari paru-paru, lalu dilepaskan seketika. Bunyi yang termasuk konsonan hambat [p], [t], [c], [k], [b], [d], [j], [g], dan [?].

b. Geseran, yaitu bunyi yang melibatkan penghambatan arus udara melalui celah sempit. Bunyi yang termasuk konsonan geseran adalah [f], [v], [x], [h], [s], [š], z, dan x.

c. Nasal, yaitu bunyi yang dihasilkan dengan menghambat rapat jalan udara dari paru-paru melalui rongga hidung. Bunyi yang termasuk konsonan nasal adalah [m], [n], [ň] atau [ny], dan [ŋ] atau [ng].

d. Getar, yaitu bunyi yang dibentuk dengan cara menaikkan ujung lidah dan melengkungkannya ke belakang gusi secara berulang-ulang menempel dan lepas dari gusi. Bunyi yang termasuk konsonan getar adalah [r].

e. Lateral, yaitu bunyi yang dihasilkan dengan cara menempelkan daun lidah pada gusi dan mengeluarkan udara melalui sisi-sisi lidah. Pada saat bunyi lateral dihasilkan pita suara bergetar. Bunyi termasuk konsonan lateral adalah [l].

f. Luncuran, yaitu bunyi yang dihasilkan sebagai bunyi- bunyi transisi. Bunyi yang termasuk transisi adalah [w, u, o], dan [y, i].

2.5.5.5 Cara Pembentukan Diftong

Telah disebutkan sebelumnya bahwa ciri diftong ialah waktu diucapkan posisi lidah yang satu dengan yang lain saling berbeda. Perbedaan itu menyangkut tinggi rendahnya lidah, bagian lidah yang bergerak, serta strikturnya (jarak lidah dengan langit-langit). Berdasarkan itu pula maka diftong kemudian dikiasifikasikan. Klasifikasi diftong dengan contoh dalam bahasa Indonesia dan bahasa Inggris diuraikan di bawah ini. Ada 2 kategori untuk diftong, antara lain: (1) Diftong Naik dan (2) Diftong Turun.

(35)

23

Diftong naik (rising diphtongs) ialah jika vokal yang kedua diucapkan dengän posisi lidah lebih tinggi daripada yang pertama. Karena lidah semakin menaik, dengan demikian strukturnya semakin tertutup, sehingga diftong ini juga dapat disebut diftong menutup (closing diphtongs). Berikut akan diuraikan diftong naik dalam bahasa Indonesia dan bahasa Inggris.

Menurut Soebardi (1973:8-9), bahasa Indonesia mempunyai tiga jenis diftong naik, yaitu:

a) Diftong naik-menutup-maju [ai], misalnya pada kata pakai, lalai, pandai, nilai, tupai, sampai.

b) Diftong naik-menutup-maju [oi], misalnya pada kata amboi, sepoi-sepoi.

c) Diftong naik-menutup-mundur [au], misalnya pada kata saudara, saudagar, lampau, surau, pulau, kacau.

Dalam bahasa Indonesia hanya ada diftong naik, sedangkan diftong turun tidak ada. Diftong naik di sini diambil contohnya dari bahasa Inggris. Di dalam bahasa Inggris terdapat dua jenis diftong turun, yaitu :

(1) Diftong turun membuka-memusat [iə], misalnya dalam kata ear. (2) Diftong turun membuka-memusat [uə], misalnya dalam kata poor [39]. 2.5.6 Pemilihan Fonem Bahasa Indonesia yang Digunakan

Abjad latin atau huruf dalam bahasa Indonesia terdiri dari 5 vokal dan 21 konsonan, total 26 jenis huruf. Akan tetapi, jumlah fonem dalam bahasa Indonesia tidak sama dengan jumlah huruf, melainkan terdapat 48 fonem. Hal ini disebabkan dalam bahasa Indonesia juga dipengaruhi oleh kata serapan (absorp) dari bahasa daerah (Jawa, Sunda, dll.) maupun bahasa asing (bahasa Arab, bahasa Inggris, dll). Contoh fonem-fonem serapan, antara lain: ch (achmad), dh (dhuafa), dl (ramadlan), dz (muadzin), ky (kyai), sh (sholat), th (therapi), ts (tsunami).

2.5.6.1 Macam-macam Fonem Bahasa Indonesia

Setelah menganalisis dari banyak literatur dan mengamati frekuensi penggunaan dalam kalimat bahasa Indonesia secara umum, jumlah fonem bahasa Indonesia yang digunakan pada penelitian ini adalah 48 fonem. Fonem yang digunakan meliputi vokal (V) dan konsonan (K), baik monoftong (huruf tunggal) maupun diftong (huruf rangkap / ganda). Fonem vokal yang digunakan dalam penelitian ini terdiri dari 10 vokal tunggal (a, i, I, u, U, ə, e, Ɛ, o, O) dan 3 vokal ganda (ai, au, oi). Sedangkan

(36)

24

fonem konsonan terdiri dari 21 konsonan tunggal (b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, w, x, y, z) dan 14 konsonan ganda (ch, dh, dl, dz, gh, kh, ks, ky, sh, sy, th, ts, ng, ny).

Fonem konsonan yang berfungsi sebagai akhiran yang tidak (jarang) terpakai dalam bahasa Indonesia terdiri dari 18 fonem konsonan, antara lain: c, ch, dh, dl, dz, j, ky, q, sh, sy, th, ts, v, w, x, ny, y, z dan 3 fonem vokal Ɛ, I, dan U. Dari dua puluh satu akhiran fonem konsonan yang tidak (jarang) terpakai ini, seringkali cara membacanya diganti menjadi fonem lainnya seperti yang tertulis dalam penjelasan berikut ini : o Akhiran /c/, /j/ dan /th/ sering kali dibaca menjadi /t/.

o Akhiran /ch/ sering kali dibaca menjadi /kh/.

o Akhiran /dh/, /dl/ dan /dz/ sering kali dibaca menjadi /d/. o Akhiran /q/ sering kali dibaca menjadi /k/.

o Akhiran /sh/, /sy/, /ts/ dan /z/ sering kali dibaca menjadi /s/. o Akhiran /v/ sering kali dibaca menjadi /f/.

o Akhiran /U/ dan /w/ sering kali dibaca menjadi /u/. o Akhiran /x/ sering kali dibaca menjadi /ks/.

o Akhiran /I/, /ky/ dan /y/ sering kali dibaca menjadi /i/

o Akhiran / Ɛ / dan /ny/, tidak pernah ada dalam kalimat bahasa Indonesia baku. Pada tabel 2.1 berikut, terlihat bahwa tidak semua fonem dapat digunakan di awal, di tengah dan di akhir sebuah kata. Seperti fonem vokal diftong ai (pan-tai), au (pu-lau), dan oi (a-soi), hanya bisa dipakai di akhir kata. Vokal diftong bila diletakkan di awal sebuah kata, maka dibaca sebagai vokal monoftong, misal: aida (a-i-da, bukan ai-da), aura (a-u-ra, bukan au-ra), soimah (so-i-mah, bukan soi-mah). Fonem vokal Ɛ, I, O dan U, juga tidak pernah digunakan di akhir kata dalam bahasa Indonesia, akan tetapi sering dipakai sebagai pengganti ucapan, seperti pantai (dibaca pantƐ), dan pulau (dibaca pulO), sedangkan diftong oi sangat jarang dipakai dalam bahasa Indonesia. 2.5.6.2 Pola Suku kata

Suku kata (syllable) adalah unit pembentuk kata yang tersusun dari satu fonem atau urutan fonem. Suku kata sering dianggap sebagai unit pembangun fonologis kata, karena dapat mempengaruhi ritme dan artikulasi suatu kata. Sementara ritme atau irama adalah suatu ukuran gerakan yang simetris dan aksen dari suatu suara yang teratur. Ilmu tentang ritme, penekanan, dan laras / nada dalam percakapan disebut prosodi (prosody), yang merupakan bagian dari ilmu linguistik. Suku kata ialah unit

(37)

25

penyusun aturan bunyi percakapan, yang boleh mempengaruhi irama, prosodi, puitis, corak tekanan, dsb. dalam sebuah bahasa. Contohnya, perkataan sayang terdiri dari dua suku kata sa dan yang.

Satu suku kata biasanya terdiri dari nukleus suku kata (selalu vokal) dengan pinggir awalan dan akhiran biasanya konsonan. Satu kata yang terdiri dari satu suku kata saja (seperti yang) disebut eka-suku. Kata yang terdiri dari dua suku kata (seperti mana) disebut dwi-suku. Kata yang terdiri dari tiga suku kata (seperti belalang) disebut tri-suku, dan kata yang memiliki lebih dari tiga suku kata (seperti kebaikan) disebut banyak suku.

Suku kata dalam bahasa Indonesia memiliki beberapa pola. Pola suku kata tersebut terdiri dari kombinasi vokal dan konsonan. Pemenggalan atau pemisahan suku kata dari sebuah kata, harus didasarkan pada kata dasar dan pola suku katanya. Tabel 2.3 berikut ini adalah daftar pola suku kata dalam bahasa Indonesia.

Tabel 2.1. Pola Suku Kata Bahasa Indonesia [21] No Pola Suku

Kata

Contoh Pemenggalan Kata Di depan Di belakang 1 V i-bu di-a 2 VK er-na ma-in 3 KV sa-ya ban-tu 4 KVK pin-tu ru-sak 5 KKV dra-ma in-dus-tri 6 KKVK trak-tor e-lek-trik 7 VKK eks-port eks 8 KVKK sank-si kon-teks 9 KKVKK gross kom-pleks 10 KKKV stra-tegi de-mon-stra-si 11 KKKVK struk-tur in-do-spring 2.6 Pemetaan Fonem ke Viseme (Mapping Phoneme to Viseme) 2.6.1 Pengertian Viseme

Viseme adalah unit ekivalen dalam domain visual yang memodelkan sistem pengenalan pengucapan secara audio-visual. Sebenarnya, viseme mempunyai banyak interpretasi dalam literatur-literatur dan ada yang tidak setuju pada cara mendefinisikan viseme-viseme tersebut. Dua cara mendefinisikan secara praktis yang masuk akal adalah sebagai berikut:

 Viseme dapat diasumsikan sebagai gerakan artikulasi, seperti menutup bibir bersama-sama, menggerakkan dagu, dan lain-lain.

(38)

26

 Viseme diturunkan dari sekelompok fonem yang memiliki penampilan visual sama.

Cara kedua adalah yang paling banyak digunakan [22][23][24][18]. Dengan menggunakan pendekatan kedua, viseme dan fonem dikorelasikan melalui pemetaan fonem ke viseme. Pemetaan ini harus menjadi sebuah pemetaan banyak ke satu (many-to-one), karena banyak fonem yang tidak dapat dibedakan dengan menggunakan isyarat visual.

2.6.2 Pemetaan Fonem ke Viseme

S aat ini, belum banyak penelitian yang membahas tentang viseme Indonesia. Sehingga proses pemetaan fonem-ke-viseme yang dapat digunakan untuk acuan adalah pemetaan dengan bahasa lainnya, seperti viseme Inggris, China, Canton, Jerman yang sudah banyak diteliti. Pemetaan fonem ke viseme dapat menggunakan dua pendekatan [23], yaitu :

a. Linguistik

Kelas-kelas viseme didefinisikan melalui pengatahuan linguistik dan intuisi dengan memilih fonem-fonem yang memiliki tampilan yang sama secara visual. b. Data Driven

Kelas-kelas viseme dibentuk dengan melakukan proses klasterisasi terhadap fonem-fonem, berdasarkan pada ekstraksi fitur dari region of interest (ROI) objek.

Metode data driven mempunyai beberapa kelebihan. Pertama, sistem pengenalan viseme menggunakan data yang dilatih dengan model statistik sehingga kelas-kelas dibentuk secara alami. Kedua, dapat menjelaskan variasi kontekstual dan perbedaan antara speaker (jika database yang tersedia besar). Metode linguistik biasanya dilakukan dengan fonem-fonem kanonik secara intuitif, sementara pengenalan dilakukan pada continuous speech.

Pada Tabel 2.4 disajikan contoh hasil pemetaan fonem-ke-viseme untuk bahasa Indonesia dengan menggunakan pendekatan data driven berdasarkan ekstraksi fitur data-data citra visualisasi wicara.

(39)

27

Tabel 2.2. Hasil Pemetaan Fonem ke Viseme Bahasa Indonesia [5] Vise

Classes Associated Phoneme

Visem e

Class#0 Silence -

Class#1 /a/, /h/ /a/

Class#2 /p/, /b/, /m/ /b/

Class#3 /d/, /t/, /n/, /l/, /r/ /d/ Class#4 /o/, /au/, /u/, /w/ /u/

Class#5 /k/, /g/, /kh/ /k/

Class#6 /c/, /j/, /s/,/i/, /z/, /sy/, /ny/ /c/ Class#7 /E/, /y/, /oi/, /ai/ /E/

Class#8 /f/, /v/ /f/

Class#9 /ng/, /e/ /ng/

2.7. Roadmap Penelitian

Kerangka Roadmap penelitian ini dapat digambarkan sebagai berikut :

Gambar 2.7. Kerangka Roadmap Penelitian 2.8. Penelitian pendahuluan yang telah dilakukan pengusul

Penelitian yang telah dilakukan oleh pengusul untuk mencapai tujuan penelitian hibah bersaing adalah :

a. Pembentukan mode-model viseme dinamis Bahasa Indonesia dengan menggunakan metode pengelompokan secara natural yaitu dengan proses klusterisasi.

(40)

28

b. Sistem text to speech Bahasa Indonesia dengan metode Finite State Automata, Pada penelitian ini pengusul tidak membuat database suara sendiri tetapi menggunakan database suara dari hasil penelitian dari peneliti lain.

Hasil penelitian di atas dapat digunakan sebagai dasar untuk mengembangkan sistem yang akan diusulkan dalam penelitian hibah bersaing ini. Model-model kelas viseme yang dihasilkan, selanjutnya digunakan untuk membuat sistem visualisasi pelafalan pada karakter animasi dengan cara merangkai model-model viseme tersebut yang disinkronisasi dengan fonem dan suara yang diucapkan. Proses merangkai dalam proses sinkronisasi dapat dilihat seperti Gambar 2.8.

Penelitian mengenai pembentukan model-model viseme Bahasa Indonesia perlu dilakukan, karena setiap bahasa yang digunakan akan menghasilkan jumlah model kelas viseme yang berbeda-beda. Jumlah model kelas viseme untuk setiap bahasa dapat dilihat pada Tabel 2.3.

Gambar 2.8. Contoh Sinkronisasi Sinyal Wicara dan Model Viseme Tabel 2.3. Model-model Kelas Viseme Setiap Bahasa

Bahasa Jumlah Kelas Viseme Statis

English 16

Persian 7

Swedish 11

Gambar

Gambar 2.1. Model-model Kelas Viseme Bahasa Indonesia [5]
Gambar 2.3. Posisi Lidah pada Daerah Artikulasi Vokal
Tabel 2.3 berikut ini adalah daftar pola suku kata dalam bahasa Indonesia.
Gambar 2.7. Kerangka Roadmap Penelitian  2.8. Penelitian pendahuluan yang telah dilakukan pengusul
+7

Referensi

Dokumen terkait

Dengan ini kami beritahukan bahwa perusahaan Saudara telah ditetapkan sebagai Calon Pemenang dalam Seleksi Sederhana untuk paket pekerjaan Jasa Konsultasi

Mengenai sanksi administrasi yang dikenakan terhadap pengelolaan limbah Rumah Sakit Umum Daerah Raden Mattaher Jambi temasuk ke dalam pelanggaran kerusakan lingkungan hidup

dari anak dan kepikiran anak terus di desa, lebih enak hidup apa adanya di desa, setelah cukup bekalnya setelah hari raya ini dia akan kembali kedesa karena didesa sudah bangun

 Peserta adalah perwakilan dari setiap TK/RA/BA dengan jumlah tim yang tidak ditentukan;..  1 tim yang terdiri 1 model dan 1 guru

Provokasi/ancaman/mencela pemain lawan selama pertandingan liga juga akan menyebabkan pemain yang bersangkutan dikeluarkan dari liga dan dilarang mengikuti liga untuk minimal enam

Budaya atau kebudayaan juga bisa dikatakan sebagai kerangka acuan perilaku kehidupan bagi masyarakat pendukungnya berupa nilai-nilai kebenaran, keindahan, keadilan ,

Bukan tidak mungkin nasabah pindah ke lain bank karena pelayanan yang kurang, sehingga diperlukan hubungan yang baik antara bank dengan nasabah agar nasabah

Actor tersebut dapat melakukan edit profil proyek, tambah divisi, edit divisi, ahapus divisi, tambah anggota, hapus anggota, melihat profil anggota, set divisi