BAB II TINJAUAN PUSTAKA

(1)

4 BAB II

TINJAUAN PUSTAKA

2.1. Getaran

Ditinjau sistem pegas massa sebagaimana disajikan pada Gambar (2.1) yang merupakan sistem satu dimensi yang terdiri dari sebuah massa yang menempel pada ujung sebuah pegas, dengan konstanta pegas k. Massa tersebut bebas bergerak secara horisontal pada bidang tanpa gesekan. Massa yang berada pada posisi kesetimbangan 𝑥 = 0, akan bergerak maju mundur atau berosilasi ketika diberi gangguan pada posisi tersebut. Karena permukaan bidang yang tanpa gesekan, maka massa tersebut bergerak mengikuti pola gerak harmonik sederhana. (Serway, 2004)

Gambar 2.1. Sebuah massa menempel pada ujung pegasyang dapat bergerak maju mundur pada bidang tanpa gesekan.

(Pain, 2005)

Ketika massa m disimpangkansejauh x dari posisi setimbang, maka keadaan tersebut memicu sebuah gaya pemulih yang nilainya sebanding dan menuju posisi kesetimbangan, sesuai persamaan berikut,

𝐹 = −𝑘𝑥 (2.1)

dengan kadalah kekakuan atau konstanta pegas yang setara dengan gaya pemulih per satuan jarak. Tanda negatif (-) menunjukkan bahwa gaya bergerak melawan arah dari pertambahan x dan kembali menuju posisi kesetimbangan.

(2)

Persamaan gerak dari suatu sistem yang terganggu patuh kepada ketentuan keseimbangan dinamis antara gaya yang bekerja pada sistem sesuai Hukum Newton yang dinyatakan sebagai,

𝑚ẍ = −𝑘𝑥 (2.2)

dengan m adalah massa, dan percepatan ẍ= ^𝑑²^𝑥

𝑑𝑡²sehingga,

𝑚ẍ + 𝑘𝑥 = 0 (2.3)

atau,

ẍ + 𝜔²𝑥 = 0 (2.4)

dengan,

𝜔 = √^𝑘

𝑚 (2.5)

sehingga Tperiode osilasiadalah,

𝑇 = 2𝜋√^𝑚_𝑘 (2.6)

Solusi persamaan (2.4) berbentuk,

𝑥 = 𝐴 cos 𝜔𝑡 (2.7)

dengan𝑥 adalah persamaan simpangan getaran,A adalah amplitudo (meter), dan 𝜔 adalah kecepatan sudut, sehingga didapatkan persamaan untuk kecepatan,

ẋ = −𝐴𝜔 sin 𝜔𝑡 (2.8)

dan percepatan,

ẍ = −𝐴𝜔²cos 𝜔𝑡 = −𝜔²𝑥 (2.9)

Solusi yang lain adalah,

𝑥 = 𝐵 sin 𝜔𝑡 (2.10)

Ketika B mempunyai dimensi yang sama dengan A, kemudian kecepatan dan percepatannya berturut-turut,

ẋ = −𝐵𝜔 cos 𝜔𝑡 (2.11)

ẍ = −𝐵𝜔²sin 𝜔𝑡 = −𝜔²𝑥 (2.12)

Persamaan (2.4) diselesaikan dengan superposisidari kedua nilai x menjadi,

𝑥 = 𝐴 cos 𝜔𝑡 + 𝐵 sin 𝜔𝑡 (2.13)

dengan turunan kedua,

(3)

ẍ = −𝜔²(𝐴 cos 𝜔𝑡 + 𝐵 sin 𝜔𝑡) = −𝜔²𝑥 (2.14) dimana dalam hal iniA dan B ditentukan oleh nilai x dan ẋ pada waktu tertentu.

Jika ditulis kembali konstanta sebagai 𝐴 = 𝑎 sin 𝜙 dan 𝐵 = 𝑎 cos 𝜙, dengan ϕ sebagai konstanta sudut, maka,

𝐴²+ 𝐵² = 𝑎²(𝑠𝑖𝑛²𝜙 + 𝑐𝑜𝑠²𝜙) = 𝑎² (2.15)

𝑎 = √𝐴² + 𝐵² (2.16)

dan persamaan umum simpangan getaran harmonis adalah, 𝑥 = 𝑎 sin 𝜙 cos 𝜔𝑡 + 𝑎 cos 𝜙 sin 𝜔𝑡

𝑥 = 𝑎 sin(𝜔𝑡 + 𝜙) (2.17)

dengan 𝜙 adalah fase (rad), nilainya dari 0 – 2π. Nilai maksimum dari sin(𝜔𝑡 + 𝜙) = 1 maka konstanta a adalah nilai maksimum x dikenal sebagai amplitudo simpangan. (Pain, 2005)

2.2.Gelombang Bunyi

Suara termasuk komponen penting dalamberkomunikasi. Cara menggambarkan suara adalah dari sinyal atau bentuk gelombang yang berisi pesan atau informasi.Produksi suara pada manusia adalah sinyal analog yang secara terus menerus bervariasi terhadap waktu.Sinyal analog tersebut dapat diubah ke dalam bentuk digital.Sinyal suara mentransmisikan dua tipe pesan.Pertama, berisi pesan tersurat atau informasi tentang sesuatu. Kedua, berisi pesan tersirat tentang manusianya seperti umur, jenis kelamin, emosi, kesehatan, dan lain – lain. (Anne et al., 2015)

Suara merambat melalui medium dalam bentuk gelombang longitudinal dengan kecepatan yang bergantung pada kerapatan medium yang dilaluinya. Di udara kecepatan suara sebesar 343,2 m/s. (Furtuna, 2008)

Diasumsikan gas dengan massa tetapmpada tekanan 𝑃₀yang menempati ruangan dengan volume 𝑉₀dan massa jenis𝜌₀. Pada saat terjadi deformasi, maka tekanan 𝑃₀berubah menjadi 𝑃 = 𝑃₀+ 𝑝, volume 𝑉₀ menjadi 𝑉 = 𝑉₀+ 𝑣, dan massa jenis𝜌₀ menjadi 𝜌 = 𝜌₀ + 𝜌_𝑑. Perubahan kecil pada volume disebut dilatasi𝑣/𝑉₀ = 𝛿, dan perubahan kecil pada massa jenisdisebut kondensasi 𝜌_𝑑/𝜌₀ = 𝑠. Nilai 𝛿 dan 𝑠 adalah ≈ 10^-3 dan nilai 𝑝_𝑚 = 2 × 10⁻⁵Nm^-2.

(4)

Misal,

𝑚₀ = 𝑚

𝜌₀𝑉₀ = 𝜌𝑉 (2.18)

= (𝜌₀+ 𝜌_𝑑)(𝑉₀+ 𝑣)

= 𝜌₀(1 +𝜌_𝑑

𝜌₀) 𝑉₀(1 + 𝑣 𝑉₀) = 𝜌₀(1 + 𝑠) + 𝑉₀(1 + 𝛿)

𝜌₀𝑉₀

𝜌₀𝑉₀ = (1 + 𝑠)(1 + 𝛿) 1 = (1 + 𝑠)(1 + 𝛿)

𝑠 = −𝛿, bahwa dengan bertambahnya tekanan maka volume berkurang.

Sifat gas yang elastis menjadikan gas dapat dimampatkan, akibatnya volume gas berubah sesuai dengan perubahan tekanan, didefinisikan dalam modulus Bulk,

𝐵 = − ^𝑑𝑃

𝑑𝑉/𝑉 (2.19)

𝐵 = −𝑉^𝑑𝑃

𝑑𝑉 (2.20)

Kenaikan volume dengan penurunan tekanan menimbulkan tanda negatif (-).

Nilai B bergantung pada perubahan dalam gas yang timbul dari gerak gelombang baik adiabatik ataupun isotermal.

Pada kondisi adiabatik, tekanan total 𝑃 = 𝑃₀+ 𝑝. Bila gas memenuhi adiabatik maka,

𝑃𝑉^𝛾= konstan (2.21)

𝑉^𝛾𝑑𝑃 + 𝛾𝑃𝑉^𝛾−1𝑑𝑉 = 0 (2.22)

−𝑉^𝛾𝑑𝑃 = 𝛾𝑃𝑉^𝛾−1𝑑𝑉 (2.23)

−𝑉^𝛾𝑑𝑃 =^𝛾𝑃𝑉^𝛾^𝑑𝑉

𝑉 (2.24)

−𝑉𝑑𝑃 = 𝛾𝑃𝑑𝑉 (2.25)

−𝑉^𝑑𝑃

𝑑𝑉 = 𝛾𝑃 (2.26)

Substitusi persamaan (2.26) ke (2.20) maka,

𝐵_𝑎 = 𝛾𝑃 (2.27)

(5)

denganB adalah modulus bulk, a adalah notasi untuk adiabatik, 𝛾 adalah perbandingan antara kalor jenis gas pada tekanan dan volume tetap, dan 𝛾𝑃 adalah sifat elastis gas.

Jika 𝑃 = 𝑃₀ + 𝑝 maka 𝑑𝑃 = 𝑝, dan jika 𝑉 = 𝑉₀+ 𝑣 disubstitusikan ke dalam persamaan (2.21) menjadi,

𝐵_𝑎 = − ^𝑝

𝑣/𝑉0 = −^𝑝

𝛿 (2.28)

atau,

𝑝 = −𝐵_𝑎𝛿 (2.29)

Dalam gelombang bunyi, simpangan dan kecepatan partikel berada di sepanjang sumbu xdan menggunakan koordinat 𝜂 untuk mendefinisikan simpangan.

Gambar 2.2. Elemen tipis gas dengan ketebalan Δ𝑥 yang dipengaruhi oleh gelombang bunyi. (Pain, 2005)

Dalam memperoleh persamaan gelombang, diasumsikan gerakan dari sebuah elemen tipis gas dengan ketebalan Δ𝑥. Elemen tipis tersebut dipengaruhi oleh gelombang bunyi seperti yang ditunjukkan pada Gambar (2.2). Partikel pada x memiliki simpangan sejauh 𝜂 dan partikel pada 𝑥 + Δ𝑥 memiliki simpangan sejauh 𝜂 + Δ𝜂, sehingga peningkatan ketebalan Δ𝑥 pada elemen tersebut menjadi,

Δ𝜂 =^𝜕𝜂

𝜕𝑥Δ𝑥 (2.30)

(6)

dengan ukuran volume awal elemen gas tersebut 𝑉₀ diwakili oleh Δ𝑥 dan 𝑣 diwakili oleh Δ𝜂 maka,

𝛿 = ^𝑣

𝑉0 (2.31)

=Δ𝜂 Δ𝑥

= (𝜕𝜂

𝜕𝑥) Δ𝑥 Δ𝑥 𝛿 =^𝜕𝜂

𝜕𝑥 (2.32)

dengan 𝜕𝜂/𝜕𝑥 disebut sebagai regangan.

Gas terdeformasi disebabkan dari tekanan sepanjang sumbu x pada salah satu sisi dari elemen gas tersebut akibatnya gaya yang bekerja antara kedua sisi elemen tipis tersebut tidak seimbang. Gaya yang bekerja pada elemen tersebut diuraikan dengan,

𝑃_𝑥− 𝑃_𝑥+Δ𝑥 = [𝑃_𝑥− (𝑃_𝑥+^𝜕𝑃^𝑥

𝜕𝑥 Δ𝑥)] (2.33)

= −^𝜕𝑃^𝑥

𝜕𝑥 Δ𝑥 = −^𝜕𝑃^𝑥

𝜕𝑥 (𝑃₀+ 𝑝)Δ𝑥 𝑃_𝑥− 𝑃_{𝑥+𝛥𝑥} = −^𝜕𝑃

𝜕𝑥Δ𝑥 (2.34)

Berdasarkan Hukum Newton 𝐹 = 𝑚𝑎, maka,

𝐹 𝐴 =^𝑚

𝐴𝑎 (2.35)

dengan,𝐹 𝐴⁄ = −^𝜕𝑃

𝜕𝑥𝛥𝑥,𝑚 𝐴⁄ = 𝜌0Δ𝑥 dan 𝑎 = 𝜕²𝜂/𝜕𝑡² sehingga solusi persamaan (2.35) menjadi,

−^𝜕𝑃^𝑥

𝜕𝑥 Δ𝑥 = 𝜌₀Δ𝑥^𝜕²^𝜂

𝜕𝑡² (2.36)

−^𝜕𝑃^𝑥

𝜕𝑥 = 𝜌₀^𝜕²^𝜂

𝜕𝑡² (2.37)

Dari persamaan (2.29) dan (2.32),

𝑝 = −𝐵_𝑎𝛿 (2.38)

𝑝 = −𝐵_𝑎^𝜕𝜂

𝜕𝑥 (2.39)

maka,

(7)

𝜕𝑝

𝜕𝑥 = −𝐵_𝑎𝜕(𝜕𝜂

𝜕𝑥)

𝜕𝑥 = −𝐵_𝑎^𝜕²^𝜂

𝜕𝑥² (2.40)

sehingga, 𝐵_𝑎^𝜕²^𝜂

𝜕𝑥² = −^𝜕𝑃^𝑥

𝜕𝑥 (2.41)

𝐵_𝑎^𝜕²^𝜂

𝜕𝑥² = 𝜌₀^𝜕²^𝜂

𝜕𝑡² 𝐵_𝑎

𝜌0

𝜕²𝜂

𝜕𝑥² =^𝜕²^𝜂

𝜕𝑡² (2.42)

dengan𝐵_𝑎/𝜌₀ = 𝑐², dan c merupakan kecepatan bunyi, maka persamaan gelombangnya menjadi,

𝑐^{2 𝜕}²^𝜂

𝜕𝑥² = ^𝜕²^𝜂

𝜕𝑡² (2.43)

𝜕²𝜂

𝜕𝑥² = ¹

𝑐²

𝜕²𝜂

𝜕𝑡² (2.44)

(Pain, 2005, Wijayanti, 2016)

2.3.Prinsip Superposisi.

2.3.1. Getaran dengan frekuensi yang sama.

Untuk menentukan simpangan yang dihasilkan dari sistem yang bergerak dalam arah x di bawah pengaruh serempak dari dua osilasi harmonik sederhana dengan kecepatan sudut yang sama tapi amplitudo dan fase yang berbeda, setiap gerak harmonik sederhana dapat direpresentasikan dengan vektor yang tepat dan mengadakan vektor tambahan. Jika simpangan dari gerak pertama adalah,

𝑥₁ = 𝑎₁cos(𝜔𝑡 + 𝜙₁) (2.45)

dan yang kedua,

𝑥₂ = 𝑎₂cos(𝜔𝑡 + 𝜙₂) (2.46)

maka Gambar (2.3) menunjukkan bahwa dihasilkan amplitudo simpanganRyaitu,

𝑅² = (𝑎₁+ 𝑎₂cos 𝛿)²+ (𝑎₂sin 𝛿)²

= 𝑎₁²+ 𝑎₂²+ 2𝑎₁𝑎₂cos 𝛿 (2.47)

(8)

dimana𝛿 = 𝜙₂− 𝜙₁ adalah konstan.

Gambar 2.3.Masing – masing mewakili gerak harmonik sederhana sepanjang sumbux pada frekuensisudut ωuntuk mendapatkan hasil

simpangan gerak harmoniksederhana 𝑥 = 𝑅 cos(𝜔𝑡 + 𝜃)pada 𝑡 = 0. (Pain, 2005)

Konstanta fase θ dari R adalah, tan 𝜃 = ^𝑎¹^{sin 𝜙}¹^+𝑎²^{sin 𝜙}²

𝑎1cos 𝜙1+𝑎2cos 𝜙2 (2.48)

maka dihasilkan gerak harmonik sederhana yang dinyatakan sebagai,

𝑥 = 𝑅 cos(𝜔𝑡 + 𝜃) (2.49)

yang menggambarkan sebuah osilasi dari frekuensi ω yang sama tetapi mempunyai amplitudo R dan konstanta fase θ yang berbeda. (Pain, 2005) 2.3.2. Getaran dengan frekuensi yang berbeda.

Dua getaran dengan amplitudo yang sama tetapi frekuensinya berbeda disuperposisikan, dapat dinyatakannya sebagai,

𝑥₁ = 𝑎 sin 𝜔₁𝑡 (2.50)

𝑥₂ = 𝑎 sin 𝜔₂𝑡 (2.51)

dimana 𝜔₂ > 𝜔₁, maka persamaan simpangannya menjadi, 𝑥 = 𝑥₁+ 𝑥₂ = 𝑎(sin 𝜔₁𝑡 + sin 𝜔₂𝑡)

= 2𝑎 sin^(𝜔¹^+𝜔²^)𝑡

2 cos^(𝜔²^−𝜔¹^)𝑡

2 (2.52)

(9)

seperti diilustrasikan pada Gambar (2.4). (Pain, 2005)

Gambar 2.4. Superposisi dari dua simpangan harmonik sederhana 𝑥₁ = 𝑎 sin 𝜔₁𝑡dan𝑥₂ = 𝑎 sin 𝜔₂𝑡 ketika 𝜔₂ > 𝜔₁. Perlambatan cos^(𝜔²^−𝜔¹^)𝑡

2 memodulasi kurva sin^(𝜔¹^+𝜔²^)𝑡

2

antara nilai 𝑥 = ⃒ ± 2𝑎. (Pain, 2005) 2.4.AnalisaSpektral

2.4.1.Frekuensi Ambang (f0)

Frekuensi ambang adalah isyarat akustik utama untuk intonasi dan tekanan dalam berbicara berupa komponen frekuensi terendah dari spektrum dan berubah secara konstan, sebagaimana ketika mendengarkan pola intonasi kalimat.Dalam fonasi pita suara bergetar penuh pada f0 dengan rentang 250 – 700 Hz, hiperfonasi mempunyai rentang 1000 – 2000 Hz, dan disfonasi berisi periodik dan aperiodik sumber bunyi dan terjadi ketika derau terbentuk pada pita suara.

Metode estimasi frekuensi dasar (f0) membagi sinyal input ke dalam blok – blok kecil, juga dikenal sebagai frame atau window, dan menggunakan transformasi spektral seperti klipping atau filtering terbalik untuk ekstrak frekuensi dasar. (Boashash, 2003, Rani et al., 2012, Petroni, 1995, Daga et al., 2011, Lederman, 2002, Saputro, 2005)

2.4.2. Formant (f1, f2, f3, ..., fn)

(10)

Formant adalah sebuah nada harmonik yang muncul akibat pengaruh vocal tract yang berlaku sebagai ruang resonansi. Perhitungan frekuensi formant pada bunyi telah diterapkan pada literatur dari berbagai sudut yang berbeda salah satunya Monsen dan Engebretson (Robb & Cacae, 1994) membandingkan keakuratan perhitungan formant antara wideband Sound Spectrographic (SS) dengan Linier Predictive Coding (LPC). Tehnik SS menghitung formant dengan dasar properti filtering dari vocal tract asli, sedangkan tehnik LPC mengekstrak formant atas dasar digitally-derived model vocal tract.Menurut keduanya, estimasi formant lebih bagus menggunakan tehnik LPC.

Lain halnya dengan Miller et al (Robb & Cacae, 1994) yang menghitung formant menggunakan FFT contohnya tehnik Power Spectrum (PS) yang menghasilkan amplitudo dari displai frekuensi dari sinyal akustik sebagai fungsi dari diskrit window waktu.Manfaat tehnik PS adalah bahwa tehnik tersebut merupakan gabungan dari tehnik SS dan LPC.Menghitung frekuensi formant pada bayi dengan f0 tinggi tidak ada pengujian yang spesifik yang menghasilkan frekuensi formant tangis bayi secara akurat.

Hal utama yang perlu diperhatikan dalam penggunaan tehnik LPC adalah jumlah koefisien prediksi yang terpilih untuk memodelkan vocal tract.

Jika terlalu banyak koefisien yang dihitung maka yang seharusnya bukan formant akan muncul. Begitu pula sebalknya, jika terlalu sedikit koefisien yang dihitung maka formant yang sebenarnya bisa jadi tidak muncul. (Robb & Cacae, 1994)

2.4.3.Fourier transform

Fourier transform adalah salah satu metode yang dapat digunakan untuk analisa pulsa atau sinyal lainnya dengan durasi terhingga. Jika f(t) adalah gangguan sementara, yang secara umum dapat ditulis sebagai,

𝑓(𝑡) ∫ 𝑔(𝜔)𝑒_−∞^∞ ^𝑗𝜔𝑡𝑑𝜔 (2.53)

dimana𝜔 adalah kecepatan sudut. Kuantitas g(𝜔) adalah kerapatan spektral dari𝑓(𝑡).

𝑒^{𝑗(±𝜔𝑡)}= cos 𝜔𝑡 ± 𝑗 sin 𝜔𝑡 (2.54)

(11)

Diberikan 𝑓(𝑡), inversi dari integral untuk mendapatkan kerapatan spektral dari hasil fungsi sementara,

𝑔(𝜔) = ¹

2𝜋∫ 𝑓(𝑡)𝑒_−∞^∞ ^{−𝑗𝜔𝑡}𝑑𝑡 (2.55)

Pasangan persamaan (2.53) dan (2.55) merupakan salah satu bentuk Fourier integral transforms.

Sebagai contoh, osilator dipukul dengan palu, gaya yang terbentuk adalah f(t). Gaya tersebut dapat didekati dengan Dirac delta function,

𝛿(𝑡) = 0dengan t ≠ 0

∫ 𝛿(𝑡)𝑑𝑡 = 1_−∞^∞ (2.56)

Integral tidak punya dimensi, maka pada umumnya 𝛿(𝑓) mempunyai dimensi 1/𝑓 dimana 𝑓 variabel integrasi. Satu representasi 𝛿(𝑡) adalah,

𝛿(𝑡) = { 0 1/𝜀

|𝑡| > 𝜀/2

|𝑡| ≤ 𝜀/2 (2.57)

pada batasan 𝜀 → 0.

Substitusi dari 𝑓(𝑡) = 𝛿(𝑡) ke dalam persamaan (2.55) menghasilkan, 𝑔(𝜔) = ¹

2𝜋∫ 𝛿(𝑡)𝑒_−∞^∞ ^{−𝑗𝜔𝑡}𝑑𝑡 (2.58)

penggunaanpersamaan (2.55) menunjukkan bahwa, karena 𝛿(𝑡) adalah bukan nol hanya di mana |𝑡| ≤ 𝜀/2, batas dapat diganti dengan ±𝜀/2. Sebagaimana 𝜀 → 0 bisa diganti dengan nilai 𝜔 = 0, yang hasilnya,

𝑔(𝜔) = ¹

2𝜋∫ 𝛿(𝑡)𝑑𝑡 = ¹

2𝜋 𝜀/2

−𝜀/2 (2.59)

Dengan demikian, semua frekuensi direpresentasikan dengan 𝛿(𝑡).

Sebaliknya jika menulis 𝑔(𝜔) yang hanya terdiri dari satu frekuensi,

𝑔(𝜔) = 𝛿(𝑣 − 𝜔) (2.60)

kemudian,

𝑓(𝑡) ∫ 𝛿(𝑣 − 𝜔)𝑒_−∞^∞ ^𝑗𝜔𝑡𝑑𝜔= 𝑒^𝑗𝜔𝑡 (2.61)

Dan kerapatan spektral dari sinyal monofrekuensi adalah fungsi delta yang terpusat pada frekuensi.𝛿(𝜔 − 𝜔)memiliki dimensi s, sedangkan 𝑓(𝑡) dan 𝑔(𝜔) tak berdimensi. (Kinsler, 2000)

2.4.4.Pendekatan cepstral

(12)

Jika sebuah sinyal dari gema (echo) sederhana direpresentasikan dengan persamaan sebagai berikut:

𝑥(𝑡) = 𝑠(𝑡) + 𝛼𝑠(𝑡 − 𝜏) (2.62)

dengan t = waktu (s), dan 𝜏 = 𝑡₀

Kerapatan spektral fourier (spektrum) dari persamaan tersebut dapat direpresentasikan dengan,

|𝑋(𝑓)|² = |𝑆(𝑓)|²[1 + 𝛼²+ 2𝛼 cos(2𝜋𝑓𝜏)] (2.63) Dengan mengambil logaritma dari spektrum, produk ini dikonversi ke dalam penjumlahan 2 komponen,

𝐶(𝑓) = log |𝑋(𝑓)|²

𝐶(𝑓) = log |𝑋(𝑓)|²+ log[1 + 𝛼²+ 2𝛼 cos(2𝜋𝑓𝜏)] (2.64) 𝐶(𝑓)dilihat sebagai bentuk gelombang yang mempunyai komponen periodik tambahan yang frekuensi ambangnya adalahecho delay𝜏.

Maka dari itu, spektrum dari log spektrum (Inverse Fourier transform dari logaritma Fourier transform) akan menunjukkan puncak ketika gelombang aslinya memiliki echo. Bogert et al (1963) menyebut spektrum baru ini bukanlah domain frequency maupun domain waktu melainkan domainquefrency, dan menyebut spektrum dari log spektrum dengan bentuk gelombang terhadap waktu sebagaicepstrum. Jadi,fpada persamaan (2.64) adalah quefrency. (Oppenheim & Schafer, 2004)

2.4.5.MFCC

MFCC adalah metode ekstraksi ciri yang telah banyak digunakan untuk speech analysis dan proses klasifikasi suara. MFCC mengandung kedua informasi yaitu waktu dan frekuensi dari sinyal, membuatnya menjadi lebih berguna untuk ekstraksi ciri. Terdapat empat langkah penting dalam perolehan MFCC yaitu: Windowing, Fast Fourier Transform (FFT), Mel scale, dan Discrete Cosine Transform (DCT). Proses akustikperolehan MFCCdigambarkanpadaGambar (2.5).

(13)

Gambar 2.5. Proses akustikuntukmemperoleh MFCC

Sinyal masukan melalui prosesframing dan windowing. Windowing dilakukan untuk reduksi derau di awal dan ujung frame. Terdapat beberapa fungsi window yang ada seperti Rectangular Window, Flat Top Window, dan Hamming Window. Dalam penelitian ini digunakan Hamming Window yang direpresentasikan dengan,

𝑊𝑛(𝑚) = 0.54 − 0.46 𝐶𝑜𝑠 ( ^2𝜋𝑚

(𝑁𝑚−1)) , 0 ≤ 𝑚 ≤ 𝑁𝑚 − 1 (2.65) Cuplikan hasil windowing kemudian diproses dengan algoritma FFTsehinggga diperoleh data di domain frekuensi. Transformasi Fourier adalah suatu algoritma cepat untuk aplikasi Discrete Fourier Transform (DFT) yang direpresentasikan dengan,

𝐷_𝑘 = ∑ 𝐷_𝑚𝑒

−𝑗2𝜋𝑘𝑚 𝑁𝑚−1 𝑁𝑚

𝑚=0 (2.66)

dimana k = 0, 1, 2, .... Nm-1.

(14)

Data dimaksud kemudian ditapis menggunakan Mel-frequency filterbank yang merupakan untai triangular band pass filter sebagaimana disajikan dalam Gambar (2.6).

Gambar 2.6.Mel-frequency filterbank (Tan&Karnjanadecha, 2003)

Pada tahap akhir diterapkan algoritma DCT untuk menginversi data kembali ke domain waktu. Hasilnya merupakan MFCC yang dapat dihitung dengan persamaan:

𝐶_𝑗 = √²

𝑁∑^𝑝_𝑗=1𝑚_𝑗cos (^𝜋𝑗

𝑁 (𝑗 − 0.5)) (2.67)

Hasil perhitungan MFCC selanjutnya digunakan sebagai masukan pada metode analisis kemiripan pola dengan DTW.(Saputro, 2005, Ali et al., 2012, Gupta et al., 2013)

MFCC telah terbukti menjadi salah satu metode ekstraksi ciri yang sukses dalam klasifikasi disfluensi suara. MFCC inilah yang digunakan sebagai isyarat untuk kondisi patologis bayi, dalam penelitian ini adalah bayi penderita penyakit jantung bawaan. (Fook, et al., 2013 & Singh, et al., 2012)

2.4.6.Linier Predictive Coding

LPC juga termasuk metode lain yang sering digunakan untuk Automatic Speech Recognition (ASR) seperti MFCC. LPC dipilih sebagai ekstraksi ciri disamping MFCC karena LPC merupakan salah satu tehnik analisis terbaik dan salah satu metode yang paling menguntungkan yang diterapkan untuk mengkodekan kualitas suara yang baik pada tingkat bit yang rendah, sambil memberikan estimasi yang akurat dari sinyal suara secara bersamaan. Pada

(15)

prinsipnya LPC mencoba menirukan struktur resonan dari vocal tract manusia ketika memproduksi suara.LPC diawali dengan asumsi bahwa sinyal diproduksi oleh buzzer pada akhir vocal tract.Analisa LPC ditunjukkan atas hasil koefisien autokorelasi. (Perez et al., 2015)

2.5.Dynamic Time Warping

Untuk kepentingan visualisasi kemiripan ciri akustik tangis bayi, digunakan algoritma DTW yang berawal dari pembentukan jarak matriks C  R^NxMmewakili jarak matriks antar pasangan X dan Y menurut hubungan berikut, 𝐶_𝑙∈ 𝑅^𝑁𝑥𝑀∶ 𝑐_𝑖,𝑗= ||𝑥_𝑖− 𝑦_𝑗|| , 𝑖 ∈ [1: 𝑁], 𝑗 ∈ [1: 𝑀] (2.68) Setelah jarak matriks terbentuk, algoritma menemukan warping path.Warping path yang mempunyai jarak terdekat disebut optimal warping path sepertipada Gambar (2.7).(Senin, 2008, Muller, 2007)

Gambar 2.7. Optimal warping path (Muller, 2007)

2.6.Tangisan Bayi

2.6.1. Mekanisme Produksi Tangisan Bayi

Mekanisme produksi tangisan pada bayi menyerupai proses produksi suara pada orang dewasa. Secara fisiologis, mekanisme produksi tangisan bayi diawali dalam otak bayi atas rangsangan eksternal maupun internal. Perintah otak diterjemahkan kedalam serial perintah melalui sistem saraf menuju suara dan cabang pernapasan. Proses ini berlanjut dengan penyemburan udara dari paru – paru ke vocal tract, seperti yang ditunjukkan pada Gambar (2.8). Dua jenis tangisan yang dipertimbangan yaitu tangisan normal dan patologi. Jika

(16)

suatu kelainan terjadi pada bayi, tangisannya mungkin berbeda yang disebut tangisan patologi. Pada umumnya, tangisan bayi sehat ialahnoiseless, dibandingkan dengan bayi yang mempunyai kondisi patologi. (Lederman, 2002, Daga et al., 2011, Kheddache et al., 2013)

Gambar 2.8. Skema secara umum untuk produksi suara manusia (Várallyay, G. Jr et al., 2005)

Paru – paru adalah sumber utama udara selama bersuara. Suara dapat diklasifikasikan ke dalam 2 jenis yaitu bersuara (voiced) dan tak bersuara (unvoiced). Bunyi dikatakan bersuara ketika kedua pita suara saling berdekatandan saling berosilasi satu sama lain selama bersuara. Dikatakan tidak bersuara ketika pita suara terlalu lemah untuk berosilasi.Tempat dimana kedua pita suara saling berdekatan disebut glottis.Artikulator yang menyebabkan manusia dapat melafalkan konsonan tertentu diantaranya langit – langit keras, lidah, gigi dan mulut. (Lederman, 2002, Fort et al., 1998)

Vocal tract atau saluran suara diawali pada pita suara dan berakhir di mulut. Salurannya dibangun dari faring yang saling berhubungan antara mulut ke esofagus, rongga mulut dan rongga hidung yang diawali pada velum (bagian belakang langit – langit mulut) dan berakhir di mulut. Pangkal tenggorokan (laring) yang sangat berperan dalam menghasilkan suara merupakan sistem yang terdiri dari tulang dan otot yang berlokasi di tenggorokan. Hasil suara mengandung f0 dan harmoniknya. Kerasnya suara dan nada dari tangisan bergantung pada tekanan udara dari paru – paru dan keketatan pita suara.

(Lederman, 2002, Marsudi, 2006)

(17)

Selama periode awal masa bayi (antara 0-3 bulan), vocal tractbayi berbeda secara substansial dari orang dewasa, panjangnya sekitar 6 – 8 cm,seperti yang ditunjukkan pada Gambar (2.9).Rongga faring dan vocal tract yang relatif pendek, posisi laring yang lebih tinggi pada vocal tract, velopharynx dan epiglotis yang berdekatan, saluran orofaringeal yang miring berlawanan terhadap lengkungan kanan, dan massa lidahnya anterior.(Kheddache & Tadj, 2014, Robb & Cacace, 1994)

Gambar 2.9.Vocal tract bayi dan dewasa.Epiglotis (E), langit-langitkeras (HP), laring (La), Mandibula(M), rongga hidung (N), langit- langitlunak (SP),lidah (T), dan mulut (Li).(Robb&Cacace,1994)

2.6.2. Penelitian Sebelumnya tentang Tangisan Bayi

Banyak penelitian sebelumnya yang meneliti tangisan bayi normaluntuk menemukan frekuensi ambang (f0)sebagai referensi bahwa bayi ada pada kondisi normal. Runefors et al (Runefors et al., 2000) meneliti tangis sakit bayi dengan stimulasi tusukan di tumit untuk menguji hipotesa bahwa tangisan bayi dapat digunakan bersama dengan sebuah instrumen untuk mengukur rasa sakit.

Hasil mereka menunjukkan bahwa bayi langsung menangis setelah tusukan pertama pada rata – rata frekuensi ambang 598 Hz (rentang 320 – 1269 Hz).

Pada tahun 2011, Raina dan Anagha (Daga et al., 2011) meneliti tangisan bayi sehat dengan stimulus suntik vaksin BCG sebagai rangsangan sakit. Seratus bayi, laki – laki dan perempuan, usia kurang dari 1 bulan telah

(18)

diuji. Ditemukan frekuensi ambangnya (f0) sekitar 400Hz.Rani et al (Rani et al., 2012) dalam penelitiannya tentang tangis bayi salah satunya untuk menemukan frekuensi ambang dari tangisan bayi sehat. Dengan menggunakan analisa domain frekuensi (cepstrum) dan metode LPC ditemukan frekuensi ambang dari tangis bayi sehat sekitar 367 – 409 Hz dengan rata-rata 383 Hz, dan 3 frekuensi formant yaitu f1, f2, dan f3 secara berturut – turut sebesar 684 Hz, 1315 Hz, 2174 Hz.

Wolff (Daga et al., 2011) pada tahun 1969 meneliti bahwa tangisan bayi dapat dikelompokkan. Ditemukan terdapat 2 grup: tangisan rasa lapar (tangisan normal) dan tangisan marah. Mima dan Arakawa (Mima et al., 2013) meneliti tangisan bayi untuk mendeteksi 3 penyebab bayi menangis: lapar, mengantuk, dan ketidaknyamanan. Akan tetapi penelitian ini tidak dapat digunakan untuk bayi usia kurang dari satu bulan.

Penelitian tentang tangisan bayi juga telah dilakukan pada bermacam – macam masalah medis. Contohnya tangisan bayi yang digunakan untuk mendeteksi ketidaknormalan kromosom dilakukan oleh Vuorenkoski et al (Vuorenkoski et al., 1966), menganalisa 44 sinyal tangis bayi penderita sindrom cri-du-chat (“cry of the cat”) menemukan frekuensi ambang rata – rata yang mempunyai pitch tinggi sebesar 860 Hz. Lind et al (Lind et al., 1970), 120 sampel dari 30 bayi dengan sindrom Down diuji. Rentang frekuensi ambangnya ditemukan berkisar 270 – 510 Hz berhubungan dengan low-pitched, parau/serak, suara tekak, dan ambangnya lebih tinggi untuk produksi tangisan.Lain halnya dengan Michelsson et al (Michelsson et al., 1977) yang meneliti bayi meningitis. Mereka melaporkan frekuensi ambang dari bayi penderita meningitis berkisar 560 – 750 Hz. Di penelitian lainnya oleh Michelsson et al (Michelsson et al., 1984) menguji 248 sinyal tangis dari 62 bayi penderita hidrosefalus. Mereka menemukan frekuensi dasar pada rentang 430 – 750 Hz.

Rani et al (Rani et al., 2012) menemukan frekuensiambang (f0) dengan rentang 600 – 800 Hz, dan 3 frekuensi formant yaitu f1, f2, f3, secara beruturut- turut dengan rentang sebesar 616 – 1021 Hz, 959 – 1904 Hz, 2133 – 2886 Hz,

(19)

jugabernada tinggi untuk bayi dengan kelainan jantung asianotik; 364 – 396 Hz untuk bayi dengan TOF; 435 – 447 Hz untuk bayi dengan VSD, 435 – 467 Hz untuk bayi dengan ASD;dan 553 – 584 Hz untuk bayi denganPDA. Tangisan bayi penderita hipotiroidismeditemukan oleh Michelsson dan Sirvio (Michelsson & Sirvio, 1976) mempunyaif0rentang 270 – 470 Hz. Di penelitian lainnya, Michelsson dan koleganya (Michelsson et al., 1975) meneliti tangisan bayi dengan langit – langit mulut yang terbelah (cleft palate) yang merupakan kelainan dari saluran orolaringeal, frekuensi dasar ditemukan sekitar 360 – 710 Hz.

Wasz-Hockert (Wasz-Hockert et al., 1971) menemukan bahwa bayi dengangangguan metabolikyang menderita hipoglikemia memiliki nada tinggi dengan frekuensi ambang 1520 Hz, bayi dengan hiperbilurubinemia memiliki frekuensi dasar (f0) bahkan lebih tinggi yaitu 1790 Hz yang bernada (pitch) tinggi, dan bayi yang menderita keduanya memiliki f0 sebesar 1980 Hz yang juga bernada tinggi, hasil – hasil tersebut ditemukan oleh Thoden dan Michelsson. (Rani et al., 2012, Zeskind et al., 1978)

2.7.Penyakit Jantung Bawaan (congenital heart disease, CHD)

Penyakit Jantung Bawaan berkait dengan adanya kerusakan atau kelainan pada struktur jantung yang hadir pada saat lahir.Merupakan gejala paling umum teramati dan mempengaruhi sekitar 1% atau 1 dari 120 bayi.CHD dapat menjadi sebuah ancaman hidup yang terhitung sekitar 7% dari seluruh kematian bayi.(Rani et al., 2012, Larsen et al., 2010)

CHD diklasifikasikan ke dalam kelainan jantung sianotik and asianotik.

Gejala utama dari kelainan jantung sianotik adalah kebiruan dari kulit bayi saat lahir. TOF termasuk ke kelainan jantung sianotik. Berbeda dari sianotik, asianotik tidak menyebabkan kebiruan pada kulit. Asianotik termasuk VSD, ASD dan PDA. Hal ini dapat dikarenakan oleh adanya hubungan genetik kelainan oleh sebuah penyakit yang mempengaruhi si ibu selama perkembangan jantung janin. (Rani et al., 2012)

(20)

Beberapa gejala CHD pada bayi berdampak pada sesak napas, sianosis, nyeri dada, sinkop, berkeringat, gumaman jantung, dan infeksi saluran pernapasan. Bayi penderita CHD dapat didiagnosa sejak dini menggunakan tehnik identifikasi seperti gumaman jantung, Elektrokardiogram, Sinar-X dada, tes darah, Ekokardiografi, Kateterisasi jantung. Namun demikian, pengujian ini tidak selalu menjadi bukti sebelum selesai penginapan rumah sakit, dan biayanya yang relatif tinggi. (Rani et al., 2012, Mahle et al., 2009)

2.8.Sound-Spectrogram

Spektrografi mengintegrasikan kedua domain yaitu domain waktu dan domain frekuensi untuk memproduksi rekaman visual yang menunjukkan distribusi energi keduanya.Plot spektrografi adalah waktu pada sumbu x dan frekuensi pada sumbu y seperti yang ditunjukkan pada Gambar (2.10). Alatnya biasa disebut spektrogram. Spektrografi telah berfungsi sebagai perangkat penting dan berguna dalam banyak bidang pemrosesan sinyal.

Gambar 2.10.Sound-spectrogram tangis bayi normal.

Ada beberapa ciri tangisan yang dapat diperoleh dari spektrogram, seperti frekuensi tangis, panjang tangis, komponen spektral, bentuk kontur melodi, dan lain – lain. Sekarang ini spektografi masih merupakan alat yang umum digunakan dalam analisa tangisan bayi, tentu saja dalam bentuk digital spektrogram. (Petroni 1995, Várallyayet al., 2006, Lederman 2002)

(21)

Dalam penelitian ini menggunakan perangkat lunak SFS sebagai digital sound-spectrogram. SFS bukan perangkat lunak milik publik, tetapi kekayaan intelektual milik Mark Huckvale, University College London dan koleganya.

SFS telah digunakan secara terus-menerus dalam Fonetik dan Linguistik di UCL sejak tahun 1987. Mereka telah menggunakannya untuk penelitian pada suara, persepsi bicara dan pendengaran, sintesis pidato dan pengenalan suara.

Merka juga menggunakannya di laboratorium pengajaran pada pelajaran seperti

"Akustik Suara dan Pendengaran", atau "Pengantar Ilmu Suara dan Pendengaran", atau "Pengolahan Suara oleh Computer".

Beberapa program dalam SFS yg dipakai pada penelitian ini yaitu:

Fxcepyang merupakanalgoritma pengukuran frekuensi ambang suara berdasarkan cepstrum. Sebuah FFT 512 titik dilakukan pada 40ms windows dari suara masukan untuk menemukan log spektrum, kemudian FFT dari log spektrummenghasilkan cepstrum.Item masukan berupa item suara apa saja, danitem keluaran berupa Fx cepstrum.Formanal adalah pelacak formant berdasarkan akar polinomial LPC dan pemrograman dinamis. Item masukan berupa bentuk gelombang suara, item keluaran berupa perkiraan formant.MFCC mendesain mel-scaled filterbank untuk jumlah saluran yang disediakan dan memproses sinyal suara masukan melalui filterbank menjadi satu set mel-scaled cepstral coefficients. Metode ini didasarkan pada yang dijelaskan dalam Deller, et al.,Discrete Time Processing of Speech Signals.

Menggunakan Hamming window, FFT maju, dan DFT terbalik. Item masukan berupa bentuk gelombang suara dan item keluaran berupa Mel-scaled cepstral coefficients. (Perangkat lunak SFS)