Hak cipta milik Institut Pertanian Bogor, tahun 2007 Hak cipta dilindung

Dilarang mengutip dan memperbanyak tanpa izin tertulis dari Institut Pertanian Bogor, sebagian atau seluruhnya dalam bentuk apa pun, baik cetak, fotokopi, microfilm, dan sebagainya

PADA IDENTIFIKASI PEMBICARA

JAYANTA

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Departemen Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007

Nama : JAYANTA NIM : G.651030064

Disetujui

Komisi Pembimbing

( Ir. Agus Buono, M.Si, M.Kom ) ( Aziz Kustiyo, S.Si, M.Kom )

Ketua Anggota

Diketahui,

Ketua Program Studi Ilmu Komputer Dekan Sekolah Pascasarjana IPB

( Dr. Sugi Guritman, MSc.) ( Prof. Dr. Ir. Khairil Anwar Notodiputro, MS )

Syukur Alhamdulillah, penulis panjatkan kepada illahi robbi Allah SWT, atas rahmat dan hidayahnya sehingga akhirnya karya ilmiah ini dapat diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak Desember 2005 ini adalah sistem identifikasi pembicara, dengan judul Pengembangan Model Jaringan Syaraf Tiruan Probabilistik (PNN) pada Identifikasi Pembicara.

Pada kesempatan ini, penulis menyampaikan ucapan terima kasih dan penghargaan yang setinggi – tingginya kepada bapak Ir. Agus Buono, M.Si, M.Kom, dan bapak Aziz Kustiyo, S.Si, M.Kom, atas kesediaanya meluangkan waktu untuk membimbing sejak awal pemilihan tema penelitian hingga selesainya karya ilmiah ini. Penghargaan yang tulus penulis sampaikan pula, kepada para dosen Program Studi Ilmu Komputer, Sekolah Pascasarjana, Institut Pertanian Bogor, yang telah memberi wawasan pengetahuan bagi penulis.

Atas do’a, pengorbanan, kesabaran serta dukungan moril, penulis ucapkan terima kasih dan rasa hormat yang tulus pada ibu dan istri tercinta, serta seluruh keluarga.

Semoga, hasil karya ilmiah yang jauh dari sempurna ini dapat bermanfaat.

Bogor, Mei 2007

Penulis dilahirkan di Jakarta pada tanggal 30 September 1961 dari ayah Sirtoe Astrodiwiryo dan ibu Fatimah Haryana Prawira. Penulis adalah putra kedua dari tiga bersaudara.

Pada tahun 1981 penulis lulus dari SMA Negeri 1 Jakarta. Pendidikan sarjana ditempuh pada tahun 1989 di Sekolah Tinggi Manajemen Informatika dan Komputer Gunadarma, jurusan Manajemen Informatika, lulus pada tahun 1993. Pada tahun 2003 penulis mendapat kesempatan untuk melanjut pendidikan ke program magister pada program Studi Ilmu Komputer, Sekolah Pascasarjana IPB.

Penulis bekerja di Universitas Pembangunan Nasional ”Veteran” Jakarta, pada Fakultas Ilmu Komputer sejak tahun 1987 hingga sekarang. Pada tahun 1996 hingga tahun 1999 penulis dipercaya sebagai kepala laboratorium komputer Fakultas Ilmu Kompter UPN ”Veteran” Jakarta. Pada tahun 1999 hingga tahun 2000 penulis mendapat kesempatan menjadi staff pengajar yunior, di jurusan Teknologi Informatika, Fakultas Teknik pada Hoogeschool van Arnhem en Nijmegen, Belanda. Sejak tahun 2005 penulis dipercaya sebagai Ketua Jurusan Teknologi Informatika pada Fakultas Ilmu Komputer UPN ”Veteran” Jakarta.

DAFTAR ISI

Halaman

DAFTAR TABEL ... iii DAFTAR GAMBAR ... iv DAFTAR LAMIRAN ... vi PENDAHULUAN Latar Belakang ... 1 Tujuan Penelitian ... 2 Ruang Lingkup ... 2 Manfaat Penelitian ... 3 TINJAUAN PUSTAKA Sinyal Suara ... 4 Prinsip Identifikasi Pembicara ... 4 Preemphasis ... 5 Frame ... 5 Window ... 6 Transformasi Fourier Diskret (DFT) ... 7 Mel-Frequency Cepstral Coefficients (MFCC) ………. 8 Peubah Acak Kontinyu ……….. 10 Analisis Komponen Utama (PCA) .……… 12 Normalisasi Data ………….………... 14

Kaidah Bayes ………. 15

Jaringan Syaraf Tiruan Probabilistik (PNN) ... 16 Validasi Hasil Pengukuran ... 18 Penelitian Terkait ... 19 DATA DAN METODE

Keragka Pikir Penelitian ... 21 Struktur Data Penelitian ... 33 Bahan dan Alat ... 34 Waktu Penelitian ... 35

Halaman

HASIL DAN PEMBAHASAN

Hasil Pra-proses ... 36 Hasil Ekstraksi Ciri ... 36 Hasil Pengujian PNN70 ... 38 Hasil Pengujian PNN90 ... 40 Waktu Komputasi ... 42 Hasil Pengujian dengan Data Noise ... 45 Pengaruh Parameter Pembentuk Data Ciri ... 47 SIMPULAN DAN SARAN

Simpulan ... 51 Saran ... 51 DAFTAR PUSTAKA ... 52

DAFTAR TABEL

Halaman

1 Komposisi dan jumlah vektor ciri untuk metode validasi holdout... 27

2 Komposisi dan jumlah vektor ciri untuk metode validasi leave-one out ... 27 3 Nilai parameter pembentuk data ciri ... 33

4 Jumlah frame suara untuk frekuensi suara 16000 Hz ... 36

5 Jumlah sampel data per satu frame ... 36

6 Nama kelompok data ... 37

7 Dimensi data penelitian hasil ekstraksi ciri suara untuk data asli ... 38

8 Dimensi data penelitian hasil ekstraksi ciri suara untuk data noise.. 38

9 Hasil pengujian model PNN70 ... 39

10 Hasil Pengujian model PNN90 ... 41

11 Waktu komputasi model PNN70 ... 43

12 Waktu komputasi model PNN90 ... 44

13 Hasil pengujian model PNN90 untuk data noise 20 desibel ... 45

14 Hasil pengujian model PNN90 untuk data noise 30 desibel ... 46

15 Hasil pengujian model PNN90 untuk data noise 40 desibel ... 46

DAFTAR GAMBAR

Halaman

1 Visualisasi satu frame suara ... 6

2 Bentuk kurva Hamming window ... 7

3 Hasil penerapan hamming window terhadap frame suara ………. 8

4 Skema transformasi fourier ………... 8

5 Blok diagram metode MFCC ………. 9

6 Mel filter-bank dengan triangular badpass ... 10

7 Arsitektur PNN ……….. 18

8 Blok kerangka pikir penelitian pengembangan model JST

probabilistik (PPN) pada identifikasi pembicara ………... 21 9 Blok diagram sistem identifikasi pembicara ... 22

10 Antar muka modul rekam suara ... 23

11 Cuplikan program rekam suara ... 23

12 Blok diagram alir proses pengumpulan suara ... 24

13 Antar muka proses penambahan noise ... 24

14 Cuplikan program tambah noise ... 25

15 Diagram alir proses kegiatan pra-proses ... 25

16 Diagram alir proses ekstraksi ciri dengan metode MFCC ... 26

17 Diagram alir proses model identifikasi pertama ... 28

18 Diagram alir proses model identifikasi kedua ... 29

19 Diagram pembentukan data pelatihan ... 30

20 Diagram pembentukan data pengujian ... 30

21 Rancang bangun pengembangan model jaringan syaraf tiruan

probabilistik pada identifikasi pembicara ... 32 22 Antar muka modul menu ... 33

23 Struktur pohon data penelitian ... 34

Halaman

24 Visualisasi grafis hasil pengujian model PNN70 ... 40

25 Visualisasi grafis hasil pengujian model PNN90 ... 42

26 Visualisasi waktu komputasi model PNN70 ... 43

27 Visualisasi waktu komputasi model PNN90 ... 44

28 Visualisasi hasil pengujian PNN90 untuk data noise ... 47

29 Perbandingan nilai akurasi kelompok data 1, 2, dan 3 ... 48

30 Perbandingan nilai akurasi kelompok data 4, 5, dan 6 ... 49

31 Perbandingan nilai akurasi kelompok data 10, 11, dan 12 ... 50

DAFTAR LAMPIRAN

Halaman

1 Bentuk sinyal suara ... 54

2 Visualisasi grafis hasil pengujian data asli ... 64

3 Visualisasi grafis hasil pengujian data noise ... 68

4 Perbandingan hasil pengujian data asli dan data noise ... 74

1.1 Latar Belakang

Suara sebagai salah satu sumber data biometrik mempunyai keunggulan sifat tidak dapat dihilangkan, dilupakan, atau dipindahkan dari satu orang ke orang lain. Suara dapat dijadikan data masukkan untuk mengidentifikasikan seseorang. Melalui dukungan teknologi informasi yang semakin baik dan murah, di masa depan teknologi berbasis data biometrik akan mirip fenomena komputer, yang kemudian menjadi bagian dari sebuah kebutuhan hidup sehari-hari.

Suara adalah suatu gelombang yang merambat diudara, dan merupakan salah satu sumber data alamiah yang membawa informasi bagi sipendengar, terutama mengenai berita yang akan disampaikan melalui kata-kata. Beberapa informasi lain yang dapat diperoleh dari gelombang suara, adalah: bahasa yang di gunakan untuk berbicara; emosi; jenis kelamin; usia dan identitas pemilik suara (Reynolds 2002).

Dengan menggunakan informasi spesifik yang terdapat dalam gelombang suara, sistem pengenalan pembicara secara otomatis akan mengenali identitas seseorang, teknik ini dapat diterapkan untuk mengidentifikasi dan memverifikasi identitas seseorang ketika mengakses suatu jasa layanan menggunakan suara melalui jaringan telepon (Furui 1997).

Secara ekonomi, aplikasi teknologi informasi berbasis pengenalan suara dapat memberikan nilai jual produk teknologi yang sangat besar. Penjualan produk teknologi berbasis sistem pengenalan suara pada tahun 1997, memberikan nilai sebesar 500 juta dolar Amerika, dan meningkat menjadi 38 milyar dolar Amerika pada tahun 2003 (Rabah 2004).

Penting untuk diperhatikan dalam mengembangkan sistem ceras berbasis suara, yaitu: sistem harus mampu mengurangi gangguan sinyal (noise), dan mampu mendapatkan informasi spesifik (feature) dari suara dalam berbagai kondisi pemilik suara, seperti: kesehatan, usia, tingkat emosi, jenis kelamin, dan logat bicara. Terjadinya noise, juga dapat dipengaruhi kondisi ruang pengambilan suara, alat penangkap suara (mikrofon), dan peniruan suara (Rabiner et al. 1993).

Selain suara harus minim noise, dimensi suara juga merupakan kendala tersendiri karena besarnya dimensi suara dapat mempengaruhi kinerja sistem. Salah satu cara mengatasi kendala dimensi suara adalah dengan menyederhanakan dimensi suara melalui proses ekstraksi ciri. Teknik yang dapat diterapkan pada proses ekstraksi ciri diantaranya adalah Mel-Frequency Cepstral Coefficients (MFCC), dan analisis komponen utama (PCA).

Klasifikasi pola suara merupakan dasar kerja sistem pengenalan pembicara, dengan demikian, untuk mengetahui apakah kinerja sistem dalam melakukan proses klasifikasi itu baik atau tidak, perlu ditetapkan alat yang dapat melakukan proses klasifikasi. Salah satu alat yang dapat digunakan untuk melakukan proses klasifikasi adalah jaringan syaraf tiruan (JST). Melalui proses pembelajaran, JST akan membentuk suatu model referensi berdasarkan data pelatihan (data acuan) yang ditetapkan, kemudian JST yang telah melakukan pembelajaran, dapat digunakan sebagai alat untuk melakukan pencocokan pola (Kusumadewi 2004). Keunggulan dari penggunaan jaringan syaraf tiruan (JST) adalah kemampuannya untuk melakukan klasifikasi data yang belum diberikan pada saat pembelajaran sebelumnya (Li Min Fu 1994).

Bolat dan Yildirim (Bolat et al. 2003) menerapkan kombinasi metode PCA untuk memperbaiki kinerja JST Probabilistik, sedangkan penelitian yang memanfaatkan MFCC dan JST Probabilistik dilakukan oleh Low dan Togneri (1998) dan Ganchev et al. (2002b).

Berdasarkan hasil-hasil penelitian tersebut pada penelitian ini akan dikombinasikan MFCC dan PCA untuk mengatasi masalah dimensi data.

1.2 Tujuan Penelitian

Tujuan penelitian ini adalah mengamati pengaruh kombinasi metode PCA dengan MFCC pada pengembangan model jaringan syaraf tiruan probabilistik (PNN) pada identifikasi pembicara.

1.3 Ruang Lingkup

Lingkup penelitian dibatasi, pada:

1 Sistem yang dikembangkan hanya dalam bentuk prototipe sistem, dengan menerapkan metode text-dependent;

2 Penggunaan jaringan syaraf tiruan probabilistik (Probabilistic Neural Networks) sebagai alat klasifikasi pola suara;

3 Penerapan kombinasi metode PCA dengan metode MFCC, sebagai alat ekstraksi ciri;

4 Sampel data yang digunakan, berupa teks “Sembilan” yang diucapkan dalam bahasa Indonesia, oleh 10 orang dewasa, terdiri atas: 5 pria dan 5 wanita.

5 Untuk mempermudah dan mempercepat proses ekstraksi ciri, data penelitian dibentuk menggunakan:

a Lebar waktu frame (16 ms, 30 ms, dan 40 ms); b Lebar overlap (40% dan 50%);

c Koefisien mel atau filter bank (16 dan 20).

6 Penggunaan noise sebesar 20, 30 dan 40 desibel terhadap sinyal suara asli.

1.4 Manfaat Penelitian

Hasil penelitian diharapkan dapat memberi manfaat bagi perkembangan teknologi biometrik dan ilmu komputer dalam bidang pengamanan akses layanan sistem berbasis suara.

2.1 Sinyal Suara

Sinyal adalah kumpulan tanda atau bunyi untuk menyampaikan pesan atau informasi. Suara adalah bentuk kompleks yang dapat disampaikan dengan cerdas melalui partikel udara dengan berbagai intensitas gelombang bunyi. Untuk setiap gelombang bunyi yang dikirimkan mengandung karakteristik, ciri dan bentuk informasi tertentu yang akan disampaikan (Shiavi 1991).

Sinyal suara merupakan rangkaian bunyi yang merambat dan berubah secara lambat melalui partikel udara dalam kurun waktu tertentu. Analisis terhadap sinyal suara akan memberikan nilai karakteristik memadai dan stabil, apabila dilakukan pada inteval waktu cukup pendek (antara 5 ms hingga 100 ms). Bila interval waktu tersebut diperpanjang menjadi lebih dari, atau sama dengan 200 ms, akan memberikan perubahan nilai karakteristik (Rabiner et al. 1993).

Sinyal suara merupakan sumber data alamiah yang dapat memberikan bermacam informasi, antara lain: informasi mengenai rangkaian huruf pembentuk kata atau kalimat; bahasa yang di gunakan untuk berbicara; emosi; jenis kelamin; serta usia dan identitas pemilik suara (Reynolds 2002). Visualisasi sinyal suara dapat dilihat pada Lampiran 1.

2.2 Prinsip Identifikasi Pembicara

Identifikasi pembicara, merupakan proses mengklasifikasikan pembicara dari sejumlah alternatif pembicara yang diberikan, sebagai suatu keputusan terbaik. Jumlah alternatif pembicara adalah sama dengan jumlah populasi pembicara terregistrasi.

Meniru kemampuan manusia mengenal identitas seseorang melalui suara yang didengar, merupakan dasar kerja yang diadopsi oleh sistem identifikasi pembicara, sehingga sistem identifikasi pembicara dapat dimasukan kedalam kelompok sistem kecerdasan buatan (Kusumadewi 2003).

Terdapat 2 tahap proses yang dilibatkan untuk mengetahui identitas seseorang dari suara yang diucapkan. Pertama, mendapatkan informasi spesifik atau nilai ciri dari suara yang diamati. Kedua, mengklasifikasikan suara, melalui

proses pencocokan nilai ciri suara yang diterima dengan nilai ciri suara acuan (basis data ciri suara) (Furui 1997).

Dari sudut pandang linguistik, terdapat dua metode yang dapat diterapkan untuk mengembangkan sistem identifikasi pembicara. Metode pertama disebut text-dependent, dan metode kedua disebut text-independent. Sistem identifikasi pembicara yang mengadopsi metode text-dependent, harus mengetahui dan menentukan terlebih dahulu teks yang akan diucapkan pembicara. Contoh penerapan metode text-dependent adalah pada pengucapan PIN (nomor identitas diri) yang digunakan sebagai kata kunci. Sistem identifikasi pembicara yang mengadopsi metode text-independent, tidak perlu menentukan teks apa yang harus diucapkan pembicara, sehingga pembicara bebas menentukan pilihan teks yang akan diucapkannya (Furui 1997).

2.3 Preemphasis

Preemphasis adalah teknik yang digunakan untuk menyaring sinyal suara, umumnya dilakukan menggunakan Finite Impulse Response (FIR). Persamaan yang digunakan pada proses preemphasis mempunyai bentuk sebagai berikut:

F(w) = 1 – a.Z -1 (0 < a <1) (1) dimana a adalah faktor preemphasis, nilai yang direkomendasikan untuk a adalah 0,95 (Rabiner et al. 1993). Jika Z adalah e jw, maka fungsi penyaringan preemphasis dapat dinyatakan dengan

F(w) = 1 – a.e -j.w (2)

Preemphasis diterapkan pada sinyal dijital untuk menstabilkan spektrum sinyal dan memperkecil dampak keterbatasan ketelitian perhitungan. Persamaan (2) diatas, dapat dituliskan kembali sebagai berikut (Rabiner et al. 1993).

F(w) = 1 – 0,95* e -j.w (3)

2.4 Frame

Untuk memudahkan dan mempercepat proses analisis suara, dilakukan pemecahan sinyal suara menjadi beberapa partisi, disebut juga frame. Pembentukan frame dilakukan menggunakan parameter lebar waktu tertentu (umumnya 10 ms hingga 50 ms) dan lebar overlap.

* , 1000 fs

N = (4)

dimana fr adalah lebar waktu frame, fs adalah frekuensi suara, dan N adalah jumlah data per frame.

Metode Welch, adalah salah satu metode yang dapat digunakan untuk membentuk frame. Pembentukan frame, dilakukan dengan membagi sinyal suara dijital menjadi sejumlah K frame. Dengan N data per satu frame-nya, dan D titik awal terjadinya overlapping dalam frame, maka N dikurangi D atau (N - D), adalah jumlah data pada bagian overlap. Secara matematis persamaan untuk mendapatkan sejumlah frame dari satu sinyal suara, dapat dituliskan sebagai berikut: K = ((L – N)/(N – D)) + 1, dimana L merupakan panjang sinyal suara (Shiavi 1991).

Overlap merupakan bagian dari frame, berfungsi menjaga keterkaitan antar frame yang berdampingan, dan memperkecil tingkat resiko kehilangan informasi dan nilai ciri yang terdapat pada setiap frame. Contoh visualisasi 1 frame disajikan pada Gambar 1.

Gambar 1 Visualisasi satu frame suara

2.5 Window

Window, adalah fungsi yang dapat digunakan untuk mengarahkan nilai data pada setiap frame sesuai dengan bentuk kurva window. Window yang umum digunakan pada proses analisis suara (ekstraksi ciri), adalah hamming window, dinyatakan dengan persamaan (Porat 1997),

, 1 2 cos 46 . 0 54 . 0 ) ( _⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = N n n w π 0 ≤ n ≤ N – 1 (5)

dimana N merupakan lebar window, umumnya memiliki nilai yang sama dengan lebar waktu frame. Visualisasi hamming window, disajikan pada Gambar 2. Jika window dinyatakan dengan simbol w(n), dan frame dinyatakan dengan xi(n), maka penerapan window terhadap setiap frame, akan menghasilkan sinyal baru

(lihat Gambar 3), dan dapat dinyatakan dengan persamaan berikut: (Rabiner et al. 1993)

) ( ~_x _n

~x(n)=x_i(n).w(n), 0 ≤ n ≤ N – 1 (6)

Gambar 2 Bentuk kurva hamming window

Gambar 3 Hasil penerapan hamming window terhadap frame suara

2.6 Transformasi Fourier Diskret (DFT)

Proses analisis suara, umumnya menggunakan sinyal suara dalam domain frekuensi, namun sinyal suara terekam berada dalam domain waktu, sehingga perlu pengubahan domain sinyal. Salah satu metode yang dapat digunakan untuk mengubah domain sinyal, adalah metode transformasi Fourier.

Transformasi sinyal akan lebih stabil dan sinyal berbentuk periodik dengan periode N, bila dilakukan pada interval waktu yang cukup pendek atau dalam bentuk frame. Transformasi Fourier cepat (FFT), merupakan varian dari transformasi Fourier diskret (DFT), biasa digunakan pada proses analisis suara. FFT, merupakan metode transformasi hasil perbaikan dari DFT, dan memiliki pengulangan proses yang lebih sedikit dibanding DFT. Persamaan transformasi Fourier yang digunakan, adalah (Rabiner et al. 1993).

( )

nk N j N n k x n .e X ⎟⎠ ⎞ ⎜ ⎝ ⎛ − − =

∑

= π 2 1 0 , dimana 0 ≤ k ≤ N – 1 (7) Sedangkan skema transformasi Fourier disajikan pada Gambar 4.

Gambar 4 Skema transformasi Fourier (Karpov 2003)

2.7 Mel-Frequency Cepstral Coefficients

Untuk setiap nada frekuensi f, yang dinyatakan dalam Hertz (Hz), adalah suatu titi nada yang diukur menggunakan skala pengukuran, disebut skala “mel”. Sebagai titik acuan, suatu titi nada 1 kHz nada, 40 dB diatas batas kemampuan pendengaran manusia, dinyatakan sebagai 1000 mel. Hubungan lain dengan nilai titi nada, diperoleh dengan menyesuaikan frekuensi nada, menjadi setengah atau 2 kali frekuensi acuan, dan dinyatakan dengan 500 mel atau 2000 mel.

Skala Mel (Melodi) di bawah 1000 Hz, merupakan frekuensi linier, dan mel dengan skala di atas 1000 Hz, merupakan frekuensi logaritmik. Skala mel ekivalen dengan nilai frekuensi f , dapat dinyatakan dengan persamaan

dimana f menunjukan frekuensi sebenarnya, dan mel(f) adalah frekuensi yang dihasilkan dalam skala mel.

Mel-Frequency Cepstral Coefficients (MFCC), merupakan salah satu metode untuk mendapatkan informasi spesifik atau nilai ciri dari suara. Dengan menerapkankan koefisien mel pada penyaringan mel-triangular (lihat Gambar 6), setiap frame suara yang telah melalui proses transformasi fourier, disaring dengan mel-triangular filter bank, kemudian hasil penyaringan tersebut dikompresi menggunakan fungsi log, untuk selanjutnya ditransformasikan menjadi koefisien cesptral menggunakan Discrete Cosine Transformation (DCT). Tahapan proses MFCC dituangkan dalam suatu blok diagram proses, disajikan pada Gambar 5.

Hasil proses metode MFCC, adalah vector yang berisi data ciri atau Cepstrum, tahapan proses metode MFCC dapat dinyatakan menggunakan pseudocode berikut (Karpov 2003):

Ceps(frame) = DCT(log10(abs(FFT(frame)))) (9)

Gambar 5 Blok diagram proses MFCC

Discrete Cosine Transformation (DCT), digunakan untuk mendapat nilai koefisien cepstral. DCT dinyatakan dengan persamaan:

N k N k n n x k k y N n , ... , 1 , 2 ) 1 ( ) 1 2 ( cos ) ( ) ( ) ( 1 = − − =

∑

= π ω (10)

Posisi pertama dari vektor yang dihasilkan metode MFCC dapat diabaikan, karena tidak terlalu mempengaruhi hasil proses selanjutnya (Rabiner et al. 1993).

Gambar 6 mel filter-bank dengan triangular bandpass

2.8 Peubah Acak Kontinyu.1

Dalam kehidupan nyata, banyak dijumpai permasalahan dimana nilai-nilai pengamatan tidak dapat dihitung. Sebagai contoh, waktu tunggu suatu job hingga diproses sampai selesai, waktu hidup komponen perangkat keras komputer (CPU, RAM, Harddisk, dsb). Peubah – peubah acak dengan nilai seperti di atas disebut sebagai peubah acak kontinyu. Nilai peubah acak kontinyu adalah dalam domain real.

Pernyataan bahwa: fungsi distribusi kumulatif, untuk suatu peubah acak y adalah sama dengan peluang F

( )

y₀ = P

(

y ≤ y₀

)

, dari pernyataan tersebut, maka untuk peubah acak diskret dan kontinyu dapat di tuliskan menjadi:

a Peubah acak diskret :

( )

∑

(

)

≤ ∀ = = 0 0 0 y y y y P y F (11)

b Peubah acak kontinyu :

( )

∫

( )

(12)

∞ − = 0 0 y dy y f y F

Karena bentuk distribusi fungsi untuk peubah acak diskret dan kontinyu berbeda, untuk peubah acak diskret bentuknya seperti tangga, sedang untuk peubah acak kontinyu bentuknya berupa kurva mulus, dalam hal ini disebut sebagai fungsi kepekatan peluang (probability density function --PDF--). Beberapa pustaka menuliskan sebagai

) (y f

( )

f_y , yang artinya fungsi kepekatan peluang peubah acak y. Perbedaan mendasar antara kedua jenis peubah tersebut adalah bahwa nilai peluang peubah acak diskret untuk suatu titik tertentu, dapat

saja tidak nol, sedangkan untuk peubah acak kontinyu, peluang untuk munculnya suatu titik, pasti nol. Hal ini karena nilai peluang diartikan sebagai luas daerah di bawah kurva fungsi kepekatan peluang.

Pernyataan bahwa: jika F

( )

y adalah fungsi distribusi kumulatif peubah acak y, maka fungsi kepekatan peluang dari peubah acak y tersebut adalah f_y

( )

yang dirumuskan sebagai:

( )

dy y dF y f_y = (13)

Sifat dari fungsi kepekatan peluang adalah:

a. fy

( )

y ≥0, −∞≤ y ≤∞ (14)

∫

∞

( )

(15)

∞

− fy y dy =F ∞ =1

Pernyataan bahwa: jika y adalah peubah acak kontinyu dengan fungsi kepekatan peluang , maka nilai harapan dan ragam dari y dinyatakan sebagai:

( )

y f_y (16)

( )

_∫

∞

( )

∞ − = y f y dy y E_y _y (17)

( )

(

( ))

_∫

∞

(

( )) (

∞ − − = − = E y E y y E y f y dy y Var 2 2 _y

)

Fungsi kepekatan untuk peubah acak Uniform menjelaskan nilai kejadian untuk cakupan terbatas, dinyatakan dengan

( )

⎪⎩ ⎪ ⎨ ⎧ _≤ _≤ − = lainnya y nilai untuk b y a a b y f_x 0 , 1 (18)

Fungsi kepekatan untuk peubah acak eksponensial, menjelaskan nilai kejadian untuk cakupan semi terbatas, dinyatakan dengan rumusan,

( )

( ) ⎪⎩ ⎪ ⎨ ⎧ ≤ ≤ ≤ ⋅ = − − a y b y a e b y f b a y x 0 , 1 _/ (19)

Fungsi kepekatan peluang untuk peubah acak normal y, mempunyai persamaan sebagai berikut

( )

(

)

_⎟⎟ −∞≤ ≤∞ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − = y y y f , 2 exp . 2 1 2 2 σ μ π σ (20)

persamaan ini dapat digunakan untuk menjelaskan banyak bentuk, seperti noise atau gangguan sinyal.

2.9 Analisis Komponen Utama (PCA) 2

Metode statistik yang paling popler untuk mereduksi dimensi data adalah metode Karhunen-Loeve, disebut juga Principal Component Analysis (PCA). PCA merupakan salah satu teknik analisis peubah ganda yang sering digunakan untuk mereduksi dimensi data tanpa harus kehilangan nilai informasi berarti. Peubah, hasil transformasi pca merupakan kombinasi linier dari peubah asli, tidak berkorelasi antar sesama, tersusun berdasarkan informasi yang dikandungnya.

Andaikan peubah asli adalah suatu vektor X, berdimensi p: X = (x1, x2, …, xp)T,

maka peubah hasil transformasi adalah vektor Y, berdimensi q: Y = (y1, y2, …, yq),

dengan q << p. Dalam hal ini yi dirumuskan sebagai:

y1 = a11.x1 + a12.x2 + …….. + a1p.xp = a1Tx

y2 = a21.x1 + a22.x2 + …….. + a2p.xp = a2Tx

……….

yq = aq1.x1 + aq2.x2 + …….. + aqp.xp = aqTx

Jika matriks koragam (covariance matrix) dari vektor X adalah Σ, maka ragam (variance) yi dirumuskan sebagai:

ragam(yi) = σ2y_i = ai

.Σ.ai, (21)

Dari penjabaran diatas diketahui bahwa permasalahan transformasi, adalah bagaimana memilih koefisien dari kombinasi linier tersebut, sehingga:

Informasi y1 > informasi y2 > …….> informasi yq

dengan kata lain

ragam(y1) > ragam(y2) > ……….. > ragam(yq)

Dari sudut pandang geometrik, unsur – unsur dalam vektor ai merupakan

komponen penyusun sumbu koordinat. Oleh karenanya dapat dipilih vektor ai

yang mempunyai panjang satu dan saling ortogonal. Dengan demikian ini menjadi

masalah optimasi dengan fungsi tujuan memaksimumkan ragam(yi), dengan

kendala aiTai = 1, dan cov(ai,aj) = 0, untuk i ≠ j.

Penentuana1 Masalah optimasi

Maksimumkan : ragam(y1) = a1TΣa1 Kendala : a1Ta1 = 1

Melalui pengganda Lagrange, fungsi yang dimaksimumkan adalah:

f(a1) = a1TΣa1 – λ (a1Ta1 – 1) (22) Optimasi dilakukan dengan cara menurunkan fungsi f, terhadap peubah – peubah yang dicari, dan diperoleh

(

a a

)

0 0 a 2 a 2 a f 1 1 1 1 1 = − Σ ⇔ = − Σ = ∂ ∂ _λ _λ

Ini berarti a1 merupakan vektor eigen dari matriks Σ dengan nilai eigen λ. Berdasarkan hasil di atas, maka

(

Σ −λ

)

= ⇔ Σ =λ ⇔ ΤΣ = Τλ = Τ λ = λ =λ 1 a a a a a a a a 0 a a₁ ₁ ₁ ₁ ₁ ₁ ₁ ₁ ₁ ₁

Ini berarti ragam(y1), adalah λ yang merupakan nilai eigen matriks Σ.

Karena di inginkan peubah hasil transformasi tersusun berdasarkan ‘pentingnya’, maka vektor a1 adalah vektor eigen yang bersesuaian dengan nilai eigen terbesar

pertama.

Penentuan a2 Masalah optimasi

Maksimumkan : ragam(y2) = a2TΣa2

Kendala : a2Ta2 = 1 dan a1Ta2 = 0

Melalui pengganda larange, fungsi yang dimaksimumkan adalah

f(a2) = a2TΣa2 – λ2 (a2Ta2 – 1). δ(a1Ta2) (23)

Setelah dideferensialkan, diperoleh:

0 a a 2 a 2 a f 1 2 2 2 2 = − − Σ = ∂ ∂ _λ _δ

Dengan mengalikan a2T pada ruas kiri dan kanan diperoleh

2 2 2 1 2 2 2 2 2 2 a 2 a a a a 0 a a a 2 ΤΣ − λ Τ −δ Τ = ⇔ ΤΣ =λ

Oleh karena itu Σ.a2 = λ2a2 yang berarti bahwa vektor a2 merupakan vektor eigen

dari Σ yang bersesuaian dengan nilai eigen terbesar ke dua, λ2. Penentuan ai

Memperhatikan cara diatas, maka vektor ai merupakan vektor eigen dari

matriks Σ yang bersesuaian dengan nilai eigen terbesar ke i, yaitu λi, atau dengan

kata lain berlaku:

Λ=ΑΤΣΑ

dengan matriks Λ=diag

{ }

λi dan A = [a1,a2, ….., ap]

Berapa banyak nilai komponen utama diperlukan sebagai data penelitian, atau seberapa efektif dimensi data dapat dijadikan data penelitian. Pertanyaan tersebut dapat dijawab dengan menerapkan perhitungan proporsi nilai eigen, yaitu membagi jumlah r nilai eigen dengan jumlah seluruh nilai eigen, kita akan mendapatkan hasil pengukuran untuk kualitas dari representasi yang didasarkan

Dalam dokumen Pengembangan Model Jaringan Syaraf Tiruan Probabilistik (PNN) Pada Identifikasi Pembicara (Halaman 105-190)