Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra Pemrosesan

(1)

WAVELET

SEBAGAI METODE

PRA-PEMROSESAN

SONY SUNARYO

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(2)

Dengan ini saya menyatakan bahwa disertasi dengan judul Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan adalah karya saya

sendiri dibawah arahan komisi pembimbing dan belum diajukan dalam bentuk apa- pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.

Bogor, September 2005

Sony Sunaryo

(3)

SONY SUNARYO. Calibration Model Using Wavelet Transform as Preprocessing Methods . Under supervision of KHAIRIL ANWAR NOTODIPUTRO, LATIFAH K. DARUSMAN and I WAYAN MANGKU.

In the modeling E(y)= f(x₁,x₂,..., x_p) serious problems will be occurred if the number of observations (n) is less than the number of independent variables (p)

and between independent variables are correlated. The real applications of this modeling is in multivariate calibration. Reduction of dimension of independent variables (known as a preprocessing method) is useful to solve these problems. In this research we have studied discrete wavelet transformation as a preprocessing method. The study has been done both empirically and theoretically.

The exploration of three preprocessing methods, i.e. principal component analysis, Fourier transformation and discrete wavelet transformation (DWT) based on simulated data showed that discrete wavelet transformation resulted in superior goodness of fit when compared with other preprocessing methods, even when using the simplest mother wavelet function such as Haar wavelet.

The study showed that the use of any mother wavelet will result in orthogonal matrices. Because the matrix of new variables resulted from DWT which was based on centered matrix X has column sum equal to zero then the statistical properties of

the regression of wavelet coefficient are analogous to the statistical properties in the regression model of y on centered independent variables X.

If DWT is applied to the original data which are highly correlated, then the resulting variables are generally still correlated. To overcome this problem the regression models are combined with other methods. The combination of DWT and principal component regression has been utilized in this research to predict concentration of gingerol and curcuminoid, and has resulted in better calibration models.

(4)

WAVELET

SEBAGAI METODE

PRA-PEMROSESAN

SONY SUNARYO

Disertasi

sebagai salah satu syarat untuk memperoleh gelar Doktor pada

Departemen Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(5)

Nama : Sony Sunaryo

NIM : G161020011

Program Studi : Statistika

Disetujui : Komisi Pembimbing

Dr. Ir. Khairil Anwar Notodiputro, M.S. Ketua

Prof. Dr. Ir. Latifah K. Darusman, M.S. Dr. Ir. I Wayan Mangku, M.Sc. Anggota Anggota

Diketahui :

Ketua Program Studi Statistika Dekan Sekolah Pascasarjana

Dr. Ir. Budi Susetyo, M.S. Prof. Dr. Ir. Syafrida Manuwoto, M.Sc.

(6)

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah pemodelan kalibrasi dengan judul Model Kalibrasi dengan Transformasi

Wavelet sebagai Metode Pra-Pemrosesan. Penelitian yang dilakukan penulis

merupakan bagian dari payung penelitian Hibah Pasca 2003-2005, yang merupakan kerjasama antara Departemen Statistika dengan Pusat Studi Biofarmaka LPPM, Institut Pertanian Bogor.

Disertasi ini memuat dua bab yang merupakan pengembangan dari naskah artikel yang telah diterbitkan ke jurnal ilmiah. Bab 5 berjudul Sifat-sifat Statistik Pendugaan Model Kalibrasi Melalui Transformasi Wavelet Diskret, telah diterbitkan

(Prosiding Seminar Nasional Matematika dan Informatika FMIPA-UNS; Surakarta, 7 Mei 2005. hlm 159-168) dan Bab 6 yang berjudul Penerapan Model Kalibrasi dengan Wavelet-PCR terhadap Data Gingerol dan Kurkuminoid telah diterbitkan (Statistika-Forum Teori dan Aplikasi Statistika 4: 181-185).

Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak Dr. Ir. Khairil Anwar Notodiputro, MS. ; Ibu Prof. Dr. Ir. Latifah K. Darusman, MS. dan Bapak Dr. Ir. I Wayan Mangku, MSc. selaku pembimbing. Di samping itu penghargaan yang tinggi penulis sampaikan kepada Bapak Dr. Ir. Budi Susetyo, MS. selaku ketua Program Studi Statistika Sekolah Pascasarjana IPB, yang telah banyak memberikan dorongan dan fasilitas kepada penulis dalam menyelesaikan studi dan pe nelitian. Tidak lupa terima kasih juga penulis sampaikan kepada ayah, ibu (alm), istri, putra-putri serta seluruh keluarga penulis atas segala do’a dan kasih sayangnya.

(7)

Penulis dilahirkan di Kediri, Jawa Timur pada tanggal 25 Juli 1964 sebagai anak ketiga dari pasangan Soewoto dan Siti Masringah (alm). Pendidikan sarjana ditempuh di Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS), Surabaya, lulus tahun 1988. Pada tahun 1994 penulis diterima di Program Studi Statistika pada Program Pascasarjana Institut Pertanian Bogor dan menamatkannya tahun 1997. Pada tahun 2002 penulis mendapat kesempatan untuk mengikuti program doktor pada Program Studi Statistika, Sekolah Pascasarjana Institut Pertanian Bogor, dengan beasiswa dari Due-Like ITS.

Penulis bekerja sebagai dosen di Jurusan Statistika FMIPA-ITS sejak tahun 1989.

Selama mengikuti pendidikan program doktor, penulis telah menghasilkan beberapa karya ilmiah yang telah dipublikasikan dalam seminar nasional, dan sebagian dipublikasikan dalam jurnal ilmiah nasional. Karya -karya ilmiah tersebut merupakan bagian dari program doktor penulis. Daftar karya-karya ilmiah tersebut dapat dirinci sebagai berikut :

1. Sunaryo S, Setiawan, Djuraidah A dan Saefuddin A. 2003. Sejarah Perkembangan Statistika dan Aplikasinya. Forum Statistika dan

Komputasi, Vol 8 No.1, 2003.

2. Sunaryo S dan Notodiputro KA. 2003. Regresi Fourier dalam Kalibrasi. Prosiding Seminar Nasional Statistika VI, ITS Surabaya, 10 Oktober 2003. 3. Sunaryo S dan Notodiputro KA. 2004. Fungsi Hubung untuk Model yang Memiliki Koefisien Keragaman Konstan. Prosiding Pertemua n Ilmiah

Nasional Basic Science I, UNIBRAW, Malang, 17 Januari 2004.

4. Sunaryo S dan Notodiputro KA. 2004. Reduksi Dimensi Data Spektra dengan Transformasi Fourier dan Wavelet. Prosiding Seminar Nasional Statistika, IPB, Bogor 4 September 2004.

(8)

Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185 , Jurusan Statistika FMIPA UNISBA.

7. Sunaryo S dan Notodiputro KA. 2005. Penerapan Metode Transformasi

Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta, 7 Mei 2005.

8. Sunaryo S dan Notodiputro KA. 2005. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika, halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005.

9. Sunaryo S. 2005. Transformasi Wavelet Diskret dalam Regresi Nonparametrik. Inferensi Jurnal Statistika FMIPA-ITS. 1 : 24-32.

(9)

viii

DAFTAR ISI

Halaman

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR LAMPIRAN ... xiii

PENDAHULUAN Latar Belakang ... 1

Tujuan Penelitian ... 6

Manfaat Penelitian ... 6

TINJAUAN PUSTAKA Senyawa Aktif pada Rimpang jahe dan Temulawak …………... 7

Spektroskopi FTIR (FourierTransform Infrared) ……… 8

HPLC (High Performance Liquid Chromatography) ……… 10

Kalibrasi Peubah Ganda ………... 11

Regresi Kuadrat Terkecil ... 14

Model Regresi Terkoreksi Terhadap Nilai Tengah ... 17

Wavelet ... 20

Transformasi Wavelet Diskret (TWD) ... 25

Periodisasi Barisan Bilangan Sepanjang N ... 26

Diskripsi Algoritma Piramida Secara Matriks ……… 27

EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI Abstrak ………... 31

Abstract ……… 31

Pendahuluan ... 32

Metode dan Bahan Penelitian ... 32

Hasil dan Pembahasan ... 34

Simpulan ... 38

(10)

ix REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET DISKRET

Abstrak ………... 40

Pendahuluan ... 41

Sifat-sifat matriks koefesien wavelet ... 45

Simpulan ... 51

Daftar Pustaka ... 52

SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI MELALUI METODE TRANSFORMASI WAVELET DISKRET Abstrak ………... 54

Pendahuluan ... 55

Regresi Terhadap Koefisien Wavelet dan Sifat-sifat Statistiknya ... 56

Ilustrasi Data Simulasi ... 60

Simpulan ... 63

PENERAPAN MODEL KALIBRASI DENGAN WAVELET –PCR PADA DATA GINGEROL DAN KURKUMINOID Abstrak ………... 66

Pendahuluan ... 67

Metode Evaluasi ... 68

Analisis dan Pembahasan ... 71

Penentuan Kadar Gingerol ... 71

(11)

x

Simpulan ... 82

PEMBAHASAN UMUM ……… 84

SIMPULAN DAN SARAN ………. 87

Simpulan ... 87

Saran ... 88

DAFTAR PUSTAKA ………. 89

(12)

xi

DAFTAR TABEL

Halaman

1. Daerah identifikasi spektra IR gingerol ... 9

2. Daerah identifikasi spektra IR kurkuminoid ……….. 10

3. Ringkasan hasil analisis model D(nxm)terhadap y ………. 35

4. Akar ciri D*T D pada beberapa kombinasi .. ………. 61

5. Nilai beberapa ukuran kebaikan model ……... 61

6. Ringkasan hasil prediksi untuk suatu pengamatan baru ... 62

7. Ringkasan Nilai Kebaikan model Gingerol dengan wavelet D-10 dan PCR ... 74

8. Nilai Y dan Yˆ kadar gingerol dengan wavelet D10-PCR (Pc1-Pc7) ... 75

9. Ringkasan nilai kebaikan model kurkuminoid dengan wavelet D9-PCR (level 0,1,2,4) ... 79

(13)

xii

DAFTAR GAMBAR

Halaman

1. Struktur gingerol ... 7

2. Struktur kurkuminoid dari temulawak ……….. 8

3. Metode-metode kalibrasi peubah ganda dan keterkaitannya ………….. 14

4. Bentuk Haar wavelet ……… 21

5. Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5) .... 22

6. Skema algoritma piramida ... 30

7. Plot y vs yˆ untuk data simulasi 1 ………... 36

8. Plot y vs yˆ untuk data simulasi 2 ... 36

9. Plot y vs yˆ untuk data simulasi 3 ... 37

10.Plot y dengan yˆ …... 63

11.Spektra persen transmitan 1866 titik, untuk 20 contoh serbuk rimpang jahe ... 72

12.Spektra persen transmitan 1024 titik, untuk 20 contoh serbuk rimpang jahe ... 72

13.Plot Y dengan Yˆ kelompok data kalibrasi gingerol ……….………. 75

14.Plot Y dengan Yˆ kelompok data validasi gingerol (RMSEP =0.1072) ... 76

15.Spektrum 40 contoh pada 1866 titik serbuk rimpang temulawak ……….. 77

16.Spektrum 40 contoh pada 1024 titik serbuk rimpang temulawak ……….. 78

17.Plot Y dengan Yˆ kelompok data kalibrasi kurkuminoid ... 81

18.Plot Y dengan Yˆ kelompok data validasi kurkuminoid ... 81

(14)

xiii

DAFTAR LAMPIRAN

Halaman

1. Hasil lengkap analisis data simulasi 1 Bab 3 ... 95

2. Hasil lengkap analisis data simulasi 2 Bab 3 ……….. 97

3. Hasil lengkap analisis data simulasi 3 Bab 3 ……….. 99

4. Program SAS untuk simulasi data 1 pada Bab 3 ………... 101

5. Program SAS untuk simulasi data 2 pada Bab 3 ... 102

6. Program SAS untuk simulasi data 3 pada Bab 3 ... 103

7. Hasil analisis regresi antara kadar gingerol dengan 12 koefesien wavelet dan 1 peubah dummy ... 104

8. Hasil analisis regresi antara kadar kurkuminoid dengan 24 koefesien wavelet ... ... 105

9. Hasil lengkap analisis regresi komponen utama kadar gingerol ... 106

(15)

1.1. Latar belakang

Didalam pembuatan model E(y)= f(x₁,x₂,...,x_p) permasalahan serius

akan muncul jika banyaknya pengamatan (n) jauh lebih kecil dari banyaknya peubah (p) dan antar peubah saling berkorelasi. Kasus-kasus ini membawa ke permasalahan kekhasan pendugaan parameter model. Metode untuk mengatasi hal ini adalah dengan melakukan reduksi dimensi data sehingga diperoleh peubah baru yang dimensinya jauh lebih kecil dari p dan antar peubah baru tidak saling berkorelasi. Metode yang banyak dikenal sampai saat ini adalah Principal

Component Regression (PCR) dan Partial Least Square (PLS). Dengan p yang

besar proses perhitungan regresi komponen utama (PCR) dan regresi PLS biasanya akan mengalami kendala dalam komputasi.

Metode lain untuk reduksi dimensi data adalah dengan mendekomposisi

T ip i

i

i x x x

x =( ₁, ₂,..., ) ke dalam sekumpulan fungsi basis, seperti dalam metode

transformasi Fourier dan metode transformasi wavelet. Metode wavelet merupakan metode yang relatif baru, yang berkembang mulai tahun 1983 sampai sekarang dan merupakan alat analisis data untuk berbagai tujuan seperti analisis deret waktu, analisis image (image analysis), reduksi dimensi data, pemodelan

nonparametrics dan lain-lain (Percival 2000). Prinsip-prinsip yang ada pada

metode wavelet merupakan perpaduan antara ide lama, seperti Haar wavelet yang ditemukan oleh Alfred Haar tahun 1909, dan ide baru yang muncul dengan adanya perkembangan perangkat lunak komputer, seperti penerapan Multi Resolution Analysis untuk menghitung koefis ien-koefisien wavelet dengan algoritma piramid

(Mallat 1989). Pembahasan secara luas tentang wavelet dapat dikatagorikan menjadi dua kelompok yaitu transformasi wavelet kontinu (TWK), yang berkembang mulai tahun 1983 sampai sekarang, dan transformasi wavele t diskret (TWD), yang berkembang mulai tahun 1988 sampai sekarang (Percival 2000).

(16)

diperoleh dengan dilatasi dan translasi dua jenis fungsi wavelet yang disebut

father wavelet, φ, dan mother wavelet ψ (Nason dan Silverman 1997). Dalam analisis Fourier fungsi basis yang digunakan adalah fungsi sinus dan kosinus, sehingga metode wavelet dapat dipandang sebagai perluasan dari analisis Fourier. Dalam metode wavelet jika suatu fungsi yang didekomposisi ke dalam fungsi-fungsi wavelet diambil bilangan dilatasi dan translasi yang kontinu maka akan termasuk dalam TWK. Sedangkan jika bilangan dilatasi dan translasi berupa bilangan bulat bukan negatif , maka termasuk dalam TWD (Nason dan Silverman 1997). Dengan TWD akan diperoleh koefisien-koefisien wavelet yang jumlahnya sama dengan jumlah titik asal.

Berbagai penelitian dalam perkembangan terakhir tentang wavelet adalah penerapan wavelet untuk regresi dan permasalahan statistik lainnya ( Nason dan Silverman 1997), studi simulasi untuk melihat perilaku penduga wavelet dalam regresi nonparametrik (Antoniadis et al. 2001; Sunaryo 2005), Bayes empirik untuk pemilihan threshold wavelet (Johnstone dan Silverman, 2004), penerapan metode wavelet dalam chemometrics (Depczynski et al. 1997), transformasi

wavelet ganda diskret dan thresholding (Downie dan Silverman 1996), model regresi PLS-wavelet untuk eksplorasi data dan proses monitoring (Teppola dan Pentti 2000), aplikasi dari analisis wavelet untuk menentukan konsentrasi gula dari solutant cair (McNulty dan Ganapati 1998), penggabungan metode transformasi wavelet dengan metode pemodelan kalibrasi peubah ganda yang lain (Dean et al. 2004; Leung et al. 1998; Naes et al. 2002; Sunaryo dan Notodiputro 2004b; Sunaryo dan Notodiputro 2005a; Tan dan Brown 2002; Yi-yu dan Chen min-jun 2000) , dan masih banyak lagi yang lain. Menurut Percival (2005) ada lebih dari 26000 artikel dan buku sejak tahun 1989 sampai dengan tahun 2004, dan lebih dari 3000 artikel sejak tahun 2004. Pertanyaan terbuka yang belum diteliti adalah bagaimana sifa t-sifat statistik dari hasil dugaan model dengan pra-pemrosesan metode wavelet. Dengan mengetahui sifat-sifat statistik akan bisa dilakukan pengujian-pengujian terhadap hasil dugaan, sehingga kesimpulan berlaku secara umum dan valid.

(17)

sekelompok ukuran lain yang relatif susah (labour intensive) atau mahal memperolehnya. Tujuan kalibrasi peubah ganda adalah menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan teliti dari ukuran-ukuran yang murah (Naes et al. 2002). Secara umum kalibrasi peubah ganda menggunakan suatu fungsi matematika dengan data empirik dan pengetahuan untuk menduga informasi pada Y, ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , ukuran yang murah, yang tersedia (Martens dan Naes 1989).

Kalibrasi peubah ganda sering diterapkan untuk menduga senyawa aktif dari contoh yang diukur melalui FTIR atau NIR. Sebagai ilustrasi marilah kita tengok potensi penerapannya pada penentuan senyawa aktif tanaman obat.

Indonesia dikenal sebagai salah satu negara penghasil tanaman obat dan mempunyai potensi dan prospek pengembangan yang baik. Sekitar 25 obat-obatan yang diresepkan negara industri maju mengandung bahan senyawa aktif hasil ekstraksi tanaman obat (Supriadi 2001). Jahe (Zingeber officinale Roscoe) dan temulawak (Curcuma xanthorrhiza Roxb.) merupakan tanaman obat yang banyak digunakan sebagai bahan baku dalam industri jamu dan farmasi. Saat ini permintaan akan jahe oleh negara importir terus mengalami peningkatan dari tahun ke tahun, akan tetapi permintaan tersebut belum semuanya dapat dipenuhi mengingat produksi jahe masih terserap oleh kebutuhan dalam negeri. Sedangkan setiap industri jamu baik skala kecil maupun skala industri selalu memasukkan temulawak ke dalam racikan.

Khasiat dan kualitas tanaman obat tidak terlepas dari senyawa aktif yang dikandungnya. Metode penentuan kadar senyawa aktif dari rimpang tanaman obat yang selama ini digunakan, dilakukan melalui proses yang panjang meliputi penghancuran bahan, pelarutan, dan pengukuran, baik dengan HPLC (High

Performance Liquid Chromatography) maupun dengan instrumen lainnya. Proses ini memerlukan waktu dan biaya yang relatif mahal. Alternatif cara penentuan lain yang dapat dilakukan adalah dengan mengembangkan model kalibrasi peubah ganda yang menyatakan hubungan antara kadar senyawa aktif hasil pengukuran HPLC dengan data hasil pengukuran dengan FTIR (Fourier Transform Infra

(18)

Melalui metode HPLC, suatu senyawa dapat diketahui secara kualitatif dan kuantitatif yaitu dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui. Sedangkan spektroskopi FTIR memberikan informasi yang mencerminkan gugus fungsi yang terdapat pada suatu senyawa akif dan kuantitatif melalui nilai absorbannya. Setiap jenis senyawa aktif secara kimiawi akan memberikan pola tapak FTIR dan juga pola kromatogram yang tertentu tergantung responnya. Pada kasus ini data pengukuran HPLC berfungsi sebagai data pembanding.

Pada pendugaan model kalibrasi peubah ganda sering timbul masalah multikolinearitas di antara peubah persen transmitan (Naes 1985). Selain itu muncul juga masalah bahwa banyaknya peubah bebas (p) jauh lebih besar dari banyaknya pengamatan pada peubah tak bebas (n), sehingga metode baku seperti model regresi ganda biasa sering memberikan solusi yang tidak unik. Oleh karena itu diperlukan suatu metode yang dapat mengatasi kedua masalah tersebut sehingga metode tersebut akan memberikan solusi yang unik dan baik.

Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang terdapat dalam literatur antara lain regresi komponen utama, dan metode PLS (Martens dan Naes 1989; Naes et al. 2002). Dalam penyusunan model, regresi komponen utama menggunakan peubah baru yang merupakan kombinasi linear peubah-peubah asal. Metode PLS menghasilkan komponen-komponen yang tidak berkorelasi atau tidak terjadi multikolinearitas tetapi dapat memaksimumkan korelasinya dengan peubah respons (Geladi dan Kowalski 1986). Metode kalibrasi peubah ganda yang lain sampai saat ini adalah jaringan syaraf tiruan (JST), regresi Fourier , wavelet, bayes, dan gabungan antara beberapa metode tersebut.

Informasi yang diperoleh dari FTIR untuk setiap contoh (sampel) rimpang ke-i adalah data vektor spektra yang merupakan sederetan ukuran persen

transmitan T

ip i

i

i x x x

x =( ₁, ₂,..., ) , yang diamati pada p titik bilangan gelombang

(19)

bobot dari fungsi basis (yang disebut fungsi wavelet). Dengan memilih m yang jauh lebih kecil dari p, diharapkan hasil pemodelan kalibrasi peubah ganda masih cukup baik dan valid (Sunaryo dan Notodiputro 2004a).

Di Indonesia sampai saat ini kalibrasi peubah ganda khususnya dengan pra-pemrosesan transformasi wavelet belum banyak dikembangkan dan dikaji. Oleh karena itu penelitian ini akan mengkaji dan menerapkan pemodelan kalibrasi peubah ganda dengan pra -pemrosesan transformasi wavelet. Dengan tujuan utama mengkaji perilaku dan mencari model yang lebih baik untuk menduga kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak.

Disertasi ini ditulis dalam bentuk rangkaian topik-topik penelitian yang dapat berdiri sendiri tetapi membentuk satu kesatuan untuk menjawab tujuan penelitian. Pada Bab 3 dilakukan eksplorasi terhadap berbagai metode reduksi dimensi data X (nxp) menjadi peubah baru, misalkan D (nxm), m < p dalam pemodelan dengan kasus multikolinear dan n lebih kecil dari p. Metode reduksi yang diteliti adalah analisis komponen utama, transformasi Fourier dan transformasi wavelet. Harapan dari peneltian ini mencari potensi untuk diteliti lebih lanjut salah satu metode yang menghasilkan ukuran-ukuran kebaikan model yang lebih baik. Dari kajian pustaka ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, dibanding yang lainnya. Maka penelitian ini akan menjustifikasi hal tersebut lewat analisis berbasis data simulasi.

(20)

Setelah mengetahui sifat-sifat statistik dan perilaku hasil transformasi wavelet, maka penelitian dilanjutkan pada penerapan transformasi wavelet untuk mencari dugaan model kalibrasi terhadap data gingerol dan kurkuminoid yaitu senyawa aktif pada rimpang jahe dan temulawak yang dilakukan pada Bab 6. Analisis yang dilakukan pada Bab 6 mempertimbangkan aspek-aspek kimia yang berkaitan yaitu dengan memperhatikan daerah identifikasi spektra infra merah untuk gugus -gugus fungsi yang ada pada gingerol dan kurkuminoid . Pada bab 7 dilakukan pembahasan secara umum sedangkan Bab 8 membuat suatu simpulan dari rangkaian penelitian tersebut dan memberikan saran-saran yang bisa dilakukan untuk penelitian lebih lanjut.

1.2.Tujuan Penelitian

Tujuan dari penelitian ini adalah :

1. Mengkaji secara teoritis sifat-sifat hasil dugaan pemodelan kalibrasi peubah ganda dengan pra-pemrosesan metode wavelet.

2. Mengaplikasikan metode wavelet dalam pengembangan model kalibrasi peubah ganda untuk menentukan kadar senyawa aktif kurkuminoid pada rimpang temulawak dan senyawa aktif gingerol pada rimpang jahe.

1.3. Manfaat Penelitian

(21)

2.1. Senyawa Aktif pada Rimpang Jahe dan Temulawak

Menurut Young (2003) rimpang jahe mengandung dua bagian utama yaitu minyak esensial (volatil) yang memberikan aroma dan pembawa rasa pedas yaitu

gingerol. Kandungan gingerol yang cukup tinggi pada rimpang jahe,

menyebabkan jahe memiliki peranan penting dalam dunia pengobatan, baik pengobatan tradisional atau skala industri dengan memanfaatkan kemajuan teknologi. Jahe merupakan salah satu dari beberapa tanaman yang digunakan secara tradisional sebagai obat rematik, demam, radang dan lain-lain (Lee dan Lim 2000). Stuktur gingerol dapat dilihat pada Gambar 1.( Chan et al., 1986)

H3CO

O

OH

(CH₂)nCH₃

N-Gingerol

Keterangan : N= 6, 8, 10 n= 4, 6, 8 Gambar 1 Struktur gingerol

Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. Warna kekuningan temulawak disebabkan adanya kurkuminoid. Kandungan utama kurkuminoid terdiri dari senyawa kurkumin, desmetoksikurkumin dan bis-desmetoksikurkumin. Struktur kurkuminoid dapat dilihat pada Gambar 2. Disamping tiga senyawa utama tersebut terdapat senyawa lain yang digolongkan termasuk ke dalam senyawa kurkuminoid yaitu monometoksikurkumin,

(22)

Keterangan:

R1 R2

-OCH3 -OCH3 = kurkumin

-OCH3 -H = desmetoksikurkumin

-H -H = bis-desmetoksikurkumin

Gambar 2 Struktur kurkuminoid dari temulawak

Rimpang temulawak segar, selain terdiri dari senyawa kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati, dan mineral.

Menurut Darwis et al. (1991), kurkuminoid temulawak mempunyai khasiat sebagai antibakteri dan dapat merangsang dinding kantong empedu untuk mengeluarkan cairan empedu supaya pencernaan lebih sempurna. Selain itu temulawak digunakan juga sebagai pengobatan gangguan pada hati atau penyakit kuning, batu empedu, memperlancar aliran air empedu, obat demam dan sembelit, memperlancar keluarnya air susu ibu, obat diare, imflamasi pada anus, gangguan perut karena dingin, dan radang dalam perut atau kulit.

2.2. Spektroskopi FTIR (Fourier Transform Infrared)

Aplikasi teknik spektroskopi infra merah sangat luas, baik untuk tujuan analisis kuantitatif maupun kualitatif. Untuk analisis kualitatif dan kuantitatif maka pola spektrum FTIR suatu senyawa perlu dilakukan analisis referensi sebagai pembanding. Instrumentasi spektrum infra merah dibagi kedalam tiga jenis radiasi yaitu infra merah dekat (bilangan gelombang 12800-4000 cm-1_{), infra}

merah pertengahan (bilangan gelombang 4000-200 cm-1), dan infra merah jauh (bilangan gelombang 200-10 cm-1) (Nur dan Adijuwana 1989), FTIR termasuk dalam kategori radiasi infra merah pertengahan (bilangan gelombang 4000-200 cm-1_).

Hampir setiap senyawa yang memiliki ikatan kovalen akan menyerap berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah. Setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda,

OH O

R2

OH HO

(23)

dan karena tipe ikatan yang sama dalam dua senyawa yang berbeda terletak dalam lingkungan yang sedikit berbeda, maka tidak akan ada dua molekul yang berbeda strukturnya akan mempunyai bentuk serapan inframerah atau spektrum inframerah yang tepat sama.

Jika I0 adalah intensitas IR yang masuk kedalam contoh dan I adalah

intensitas IR yang diteruskan (transmitted) oleh contoh, maka : Absorban (A) = Log (I0 / I) dan %transmitan (%T) = 100 (I/I0).

Sehingga hubungan absorban dengan %transmitan adalah : A = - log ( %T/100).

Karena kekuatan serapan proporsional terhadap konsentrasi, maka FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi dengan absorban atau persen transmitan. Untuk menduga konsentrasi suatu senyawa tertentu dala m contoh, diperlukan pengukuran nilai-nilai absorban dari contoh pada berbagai bilangan gelombang. Pembuatan model yang menghu bungkan konsentrasi dengan nilai-nilai absorban dapat digunakan untuk menduga konsentrasi senyawa tertentu yang tidak diketahui dalam contoh.

Kegunaan penting dari spektrum infra merah adalah untuk mendeteksi tentang gugus fungsi dari suatu molekul. Dari struktur gingerol dan kurkuminoid yang khas, maka spe ktrum yang dihasilkan dengan FTIR akan khas pula. Menurut Socrates (1994) daerah identifikasi spekta infra merah (IR) untuk gingerol dan kurkuminoid adalah seperti yang terlihat pada Tabel 1 dan Tabel 2.

Tabel 1 Daerah identifikasi spektra IR gingerol

No Jenis vibrasi Bilangan

gelombang cm-1

intensitas

1 Ikatan hidrogen O-H 3550-3230 m-s

2 C-H rentangan asimetri ; CH3-Ar 2935-2925 m-s

3 Aromatik -C=C- 1625-1590 v

4 α-β-keton takjenuh 1700-1660 vs

5 R-O-Ar 1310-1210

1050-1010

m m 6 C-H ikatan bidang luar

Vinil R- CH=CH2-

990-980

910-230 m s 7 C-H ikatan bidang luar

o-subsitusi benzen

770-735 710-690

(24)

Tabel 2 Daerah identifikasi spektra IR kurkuminoid

No Jenis vibrasi Bilangan Gelombang cm-1 intensitas

1 Ikatan hidrogen OH 3600-3300 m-s

2 C-H Alkana 3000-2850 s

3 Aromatik -C=C- rentangan 1660-1450 s

4 R-O-Ar 1300-1000 m

5 C=O keton 1820-1660 v

6 Sidik jari 900-700 s

Keterangan: (s) kuat; (m) medium; (vs) sangat kuat

Jika untuk analisis lanjutan perlu dilakukan pengambilan beberapa data %transmitan hasil pengukuran dengan FTIR, maka daerah identifikasi IR suatu senyawa sangat perlu diperhatikan, pemotongan yang tidak memperhatikan daerah identifikasi bisa mengarah ke pemodelan yang hasilnya kurang baik. Sebagai misal McNulty dan Ganapati (1998) menduga konsentrasi glukosa dalam larutan encer, dimana spektrum masing-masing contoh dihasilkan dari FTIR dengan kisaran bilangan gelombang 10000 cm-1 s/d 4000 cm-1 pada relolusi 4 cm-1 sehingga diperoleh 1500 titik absorban. Karena dalam analisis lanjut hanya dibutuhkan 256 titik, maka penentuan 256 titik dilakukan dengan me mperhatikan daerah identifikasi dari glukosa, yaitu pada kisaran bilangan gelombang 4550 cm-1

s/d 4150 cm-1 dengan resolusi 4 cm-1. Cara yang sama dilakukan oleh Brown et al. (2001) yang memprediksi kandungan lemak, gula, flour dan air dalam suatu contoh adonan kue. Pada awalnya spektrum absorban diukur pada kisaran panjang gelombang 1100 nm s/d 2498 nm dengan resolusi 2 nm, sehingga diperoleh 700 titik absorban. Dari 700 titik hanya dibutuhkan 256 titik, maka langkah yang diambil oleh Brown et al. (2001) adalah membuang titik-titik absorban pada pengamatan 140 titik panjang gelombang pertama, dan 49 titik panjang gelombang terakhir dengan alasan pada kisaran tersebut sedikit mengandung informasi. Kemudian dari pengamatan absorban pada panjang gelombang 1380 nm s/d 2400 nm, resolusi ditingkatkan menjadi 4 nm. Sehingga diperoleh 256 titik absorban.

2.3. HPLC (High Performance Liquid Chromatography)

(25)

mengidentifikasi berbagai komponen dalam campuran. Prinsip pemisahan komponen campuran dalam kolom yaitu berdasarkan perbedaan kesetimbangan retensi dan gerakan masing-masing komponen pada pemukaan fase diam dan fase gerak. Zat-zat yang terabsorpsi kuat dalam fase diam akan lama bertahan dalam kolom, sedangkan yang teradsorpsi lemah akan keluar dengan cepat dari kolom. Waktu dari mulai contoh diinjeksikan kedalam HPLC sampai dengan suatu puncak analat (analyte peak) muncul di detektor pada akhir kolom disebut waktu retensi (retention time). Masing-masing analat dalam suatu contoh akan mempunyai perbedaan waktu retensi. Waktu retensi mencerminkan keberadaan suatu komponen kimia, dan merupakan penciri kualitatif suatu senyawa. Luas area dibawah kurva mencerminkan konsentrasi secara kuantitatif.

HPLC digunakan terutama untuk golongan senyawa tak atsiri, misalnya terpenoid tinggi, segala jenis fenol, alkaloid, lipid, dan gula. HPLC berhasil baik untuk senyawa yang dapat dideteksi di daerah spektrum UV dan spektrum sinar tampak (Harborne 1996). HPLC digunakan untuk mengkuantisasi senyawa aktif yang diperoleh dari berbagai perlakuan. Secara kualitatif dan kuantitatif suatu senyawa aktif dapat diketahui antara lain melalui metoda HPLC dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui pada waktu retensi tertentu. HPLC dapat digunakan untuk analisis kulitatif dan kuantitatif atau bahkan dapat dimanfaatkan sebagai sarana untuk pemurnian melalui pemisahan secara preparatif.

Analisis kuantitatif dengan HPLC dilakukan terhadap hasil ekstraksi suatu contoh. Makin murni ekstrak maka hasil HPLC makin kuantitatif. Tetapi pemurnian suatu ekstrak membutuhkan biaya yang mahal. Pengukuran konsentrasi dengan HPLC memerlukan analisis referensi terhadap ekstrak murni sebagai pembanding.

2.4. Kalibrasi Peubah Ganda

Chemometrics adalah dapat dipandang sebagai gabungan antara matematika dan statistika dengan kimia. Kalibrasi peubah ganda merupakan bagian dari

Chemometrics yang bertujuan untuk menemukan hubungan antara sekumpulan

(26)

ukuran lain yang relatif sulit (labour in tensive) atau mahal memperolehnya. Naes

et al. (2002) menyebutkan bahwa tujuan kalibrasi peubah ganda adalah

menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan tepat dan akurat dari ukuran-ukuran yang murah. Secara umum kalibrasi peubah ganda menggunakan formula matematika untuk menduga informasi pada Y, yaitu ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , yaitu ukuran yang murah, yang tersedia (Martens dan Naes 1989). Formula matematika yang disebut model pada prinsipnya dibagi menjadi dua komponen, yaitu komponen yang terstruktur yang merepresentasikan variasi sistematis dan komponen sisaan yang merepresentasikan perbedaan antara data dengan komponen terstruktur. Pemodelan kalibrasi peubah ganda yang baik akan memperhatikan terhadap kedua komponen tersebut. Secara umum dengan membuat asumsi-asumsi terhadap komponen terstruktur (seperti linear) dan komponen sisaan (seperti mempunyai sebaran normal) akan membuat model lebih baik dan lebih berguna (Ma rten dan Naes 1989). Karena mengandung komponen sisaan, maka parameter-parameter yang ada dalam model diduga secara statistika berdasarkan contoh-contoh data yang representatif dan asumsi sebaran tertentu dari sisaan.

Menurut Naes et al. (2002) pembuatan model untuk memprediksi Y dengan kalibrasi peubah ganda, yaitu dengan mempertimbangkan beberapa atau semua pengamatan pada spektrum, akan memberikan hasil lebih baik dibanding dengan pemodelan kalibrasi peubah tunggal yang hanya mempertimbangkan satu puncak pada masing-masing spektrum. Dengan mengkombinasi informasi dari beberapa atau bahkan semua peubah spektrum, permasalahan yang muncul pada pendugaan model kalibrasi ganda adalah kasus multikolinearitas di antara peubah absorban dan banyaknya contoh (n) yang lebih kecil dari banyaknya peubah bebas (p) (Marten dan Naes 1985; Naes et al. 2000), sehingga metode baku seperti model regresi sering memberikan solusi yang tidak stabil. Oleh karena itu diperlukan suatu metode yang dapat mengatasi masalah tersebut, sehingga diperoleh solusi yang lebih stabil.

(27)

chemometric ada dua pendekatan yang sangat populer yaitu menggunakan regresi

ganda terbakukan, dengan kehati-hatian dalam memilih peubah bebas, dan pendekatan dengan reduksi dimensi data (Naes et al. 2002). Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang ada dalam beberapa literatur antara lain regresi komponen utama, regresi kuadrat terkecil parsial (PLS), regresi fourier, Jaringan Syaraf Tiruan (JST), transformasi wavelet ( Naes et al. 2002; Marten dan Naes 1989; Osborne et al. 1993), dan metode bayes. Menurut Naes et

al. (2002) dengan mengambil beberapa koefisien wavelet sebagai reduksi dimensi

akan menghasilkan rekontruksi ulang spektrum IR yang cukup mendekati spektrum IR asli. Keterkaitan metode-metode ini dalam kalibrasi peubah ganda dapat dilihat seperti pada Gambar 3.

Selain kasus multikolinearitas dan n < p, masalah lain yang muncul dalam pemodelan kalibrasi peubah ganda adalah kesalahan dari pencaran spektrum (Scatter problem), yaitu spektrum yang diamati bisa berbeda dari yang sesungguhnya. Hal ini akan berpengaruh terhadap benar tidaknya pengukuran X dalam pemodelan, dan disebut kesalahan pengukuran peubah-peubah (Error of

variables). Menurut Naes et al. (2002) salah satu metode untuk mengatasi

(28)

Y

T

Y

T Y

Y

T

Y

T

Gambar 3 Metode -metode kalibrasi peubah ganda dan keterkaitannya.

2.5. Regresi Kuadrat Terkecil

Bentuk umum regresi linear berganda adalah :

y=1b0+ X1b+e (1)

atau bisa ditulis :

y= X β +e, (2)

dengan E(y)=X β , E(e)=0 dan Var(e)=Iσ2,

Data

n pengamatan

p peubah bebas

p=1 ?

Model Regr. Peubah tunggal

p n ?

Koline ari tas dari X ?

Reduksi dimensi ?

Komp. Utama PLS Fourier

Wavelet

JST

Penambahan Informasi ?

Penambahan Informasi

Bayes Regresi Ganda

(29)

dimana

[

p

]

T

b b b

b = ₁, ₂,..., , βT =

[

b₀,b₁,...,b_p

]

                    = np n n p p x x x x x x x x x X . . . . . . . . . . . . . . . . . . . . . 2 1 2 22 21 1 12 11 1 ,                     = np n n p p x x x x x x x x x X . . . . . . . . . . . . . . . . . . . . . 1 . . . 1 1 2 1 2 22 21 1 12 11 ,                     = n y y y y . . . 2 1 dan                     = n e e e e . . . 2 1 .

Dugaan kuadrat terkecil dari persamaan (2) adalah :

βˆ =

(

X T X

)

−1 XT y,

yang mempunyai sifat dan konsekwensi sebagai berikut (Searle 1971) :

a. βˆ adalah penduga tak bias dari β, yang berarti E(β =ˆ) β.

b. Mempunyai ragam

₍_βˆ₎₌

(

)

−1_σ2

X X

Var T . (3)

c. Prediksi terhadap nilai E(y)dapat dijelaskan sebagai berikut :

Penduga βˆ dapat digunakan untuk menduga model

p p x b x b b y

E( )= 0 + 1 1 +...+ dengan

βˆ ˆ . . . ˆ ˆ ) ( ˆ 1 1 0 T p

p x x

b x

b b y

E = + + + = .

Sehingga untuk pengamatan T

[

_o _o _op

]

o x x x

x = 1, ₁, ₂,..., , dugaan terhadap E(yo)

adalah : βˆ ˆ . . . ˆ ˆ ) ( ˆ

ˆ ₀ ₁ ₁ T

o op k o

o

o E y b b x b x x

y = = + + + = , (4)

dengan ragam :

[ ]

(

)

o

T T o o T o

o x Var x x X X x

y

(30)

Karena βˆ adalah penduga tak bias, maka yˆ juga merupakan penduga tak bias o

bagi E(yo) sehingga

(

)

1 2

2 2

0) (ˆ ( )) (ˆ ) (ˆ )

ˆ

( oσ

T o T o o

o

o E y Vary bias y x X X x

y E y

MSE = − = + = − . (6)

d. Prediksi nilai pengamatan tunggal , yf yang tidak diketahui, yang berkaitan

dengan vektor nilai x, misalnya [1, f₁, f₂,..., fp]

T

f x x x

x = dapat dijelaskan

sebagai berikut :

Dari model f

T f

f x e

y = β + , dimana e_fadalah galat random. Dugaan ter baik

bagi yfadalah ˆ βˆ

T f

f x

y = , sehingga T βˆ f

x dapat digunakan untuk

menduga pengamatan yfyang berhubungan dengan f T

x , maupun menduga

nilai E(yf) yang berhubungan dengan f T

x .

Jika yˆ digunakan untuk memprediksi peubah random f yf, maka bias dari yˆ f

adalah :

bias(yˆf)= E(yˆf −yf).

Karena y_f adalah pengamatan yang diperoleh secara bebas dari penurunan

βˆ , maka βˆ dan ef saling bebas, atau berarti cov(βˆ,ef)=0.

[ ]

T

(

T

)

_f

f f T

f

f x Var x x X X x

y

Var ˆ = (βˆ ) = −1σ2 . (7)

₍_ˆ ₎ ₍ _ˆ ₎2

f f

f E y y

y

MSE = −

₍ ₍ ˆ₎ ₎2

f T

f e

x

E − +

= β β

( ˆ) ( 2) 2cov( ( ˆ), )

f T

f f

f T

fVar x E e x e

x β − β + + β −β

=

=[

(

)

−1 f +1] σ2

T T

f X X x

x . (8)

(31)

2.5.1. Model Regresi Terkoreksi Terhadap Nilai Tengah

Dari persamaan (1) dan (2), telah diketahui bahwa X =[1 X₁], dimana 1

adalah vektor 1 berukuran nx1. Dengan mendefinisikan vektor nilai tengah (rata

-rata) dari pengamatan X1 sebagai [ .1 , .2 ,..., .p] T

x x

x

x = maka dari definisi ini

mengimplikasikan :

n

T

= 1

1 , 1T y =n y dan 1T X₁ =nx.

Sehingga solusi dari βˆ dapat ditulis sebagai berikut :

βˆ =

(

X T X

)

−1 X T y

[

]

y X X X T T T T                     = − 1 1 1 1 1 1 1                 = − y X y n X X x n x n n T T T 1 1 1 1                 − − + = − − − − y X y n S x S S x x S x n T T T 1 1 1 1 1 1 ,

dimana T T

x x n X X

S = ₁ ₁ − (Bukti lihat Searle 1971).

Dengan mempartisi _

     =                     = b b b b b k 0 1 0 . . .

β , maka diperoleh :

          − − − =           − − ) ( ) ( ˆ ˆ 1 1 1 1 0 x y n y X S x y n y X S x y b b T T T . Sehingga

ˆ 1( ₁ ) x y n y X S

(32)

bˆ₀ = y −xT bˆ . (10)

Jika X = X₁ −1xT yaitu matriks X1 yang terkoreksi terhadap nilai

tengah, maka (X1 x1 ) (X1 1 x)

T T

T

T ₌ ₋ ₋

X X

= X1T X1 −n x xT =S

X T y= (X₁T −x1T) y = X₁Ty−nx y.

Sehingga persamaan (9) dapat ditulis :

bˆ S 1(X1 y n y x)

T ₋

= −

_X T _X -1_X T y )

(

= . (11)

Jika model umum y =1b₀ + X₁ b+ e, ditulis dalam bentuk X1 yang terkoreksi

terhadap nilai tengah (X ), maka diperoleh :

y=1b₀ +[X +1xT ] b + e

=1b0 + 1xT b+X b+ e

=1β₀ + X b+ e. (12)

Dan diduga oleh :

b

yˆ = β1 ˆ₀ + X ˆ, dan karena βˆ0 =bˆ0 + xT bˆ=[ y−x T bˆ] + xT bˆ= y, maka

model (12) diduga oleh :

yˆ =1y + X bˆ , dengan bˆ diperoleh dari persamaan (11).

Beberapa sifat penulisan model yang terkoreksi terhadap nilai tengah adalah :

1. bˆ dan βˆ0 adalah penduga tidak bias terhadap b dan y.

2. Jika X pada (3) diganti dengan [1 X +1x T]maka akan diperoleh (Searle

(33)

₍ ˆ₎₌ ₍ ₎−1_σ2 X

X T

b

Var . (13)

Dengan penguraian nilai singular dari X , persamaan (13) dapat ditulis

sebagai : T j p j j j v v b Var

∑

= = 1

2 ₍1 ₎

) ˆ (

λ

σ , (14)

dimana λj dan vj masing-masing adalah akar ciri ke-j dan vektor ciri ke-j

yang bersesuaian dari matriks X T X .

Dari (14) dengan mengganti :

                  = 2 2 2 2 1 2 1 2 1 . . . . . . . . .

*

j p j p j j j p j j j j T j j v v v v v v v v v v v

maka akan diperoleh :

Var b v v v i p

p p i i

i

i) ... , 1,2,...,

( 2 2 2 2 1 2 1 = + + + = λ λ

λ . (15)

Sehingga ragam dari bi akan sangat dipengaruhi oleh akar ciri-akar ciri dari

X

X T , semakin kecil akar ciri ke -i maka semakin besar ragam dari bi.

Dalam kasus multikoline aritas akar ciri X T X ada yang mendekati nol,

sehingga ragam dari bi akan besar.

3. Pendugaan nilai harapan pengamatan baru, E( yo ) dapat dijelaskan sebagai

berikut :

Dari persamaan (5) dengan mengganti T [1 T T ] x o o

x = X + akan

diperoleh ragam prediksi nilai harapan yo :

[ ]

2

1 2

ˆ σ _o _o _σ

n y

Var o X T X T X X

−       +

(34)

Atau bisa ditulis sebagai :

[ ]

∑

= = = + + = p j _j j p j _j T j j o t n o v v o n y Var T 1 2 2 2 1 2 2 ˆ λ σ σ λ σ

σ X X

j

j o v

t =X T disebut skor X _o pada vj.

(17)

Dengan mengganti T [1 T T ] x o o

x = X + , maka persamaan (6) akan

diperoleh sama seperti persamaan (17).

4. Pendugaan nilai pengamatan baru yˆ dapat dijelaskan sebagai berikut : f

Dengan cara yang sama maka dari persamaan (7) dan (8) dengan mengganti

] 1

[ T T

T

x f f

x = X + akan diperoleh :

[ ]

2

1 2

ˆ σ _f _f σ

n y

Var f X T X T X X

−       + = (18)

[ ]

2

1 1 1 ˆ _σ      +       +

= _f − _f

n y

MSE f X T X T X X . (19)

Dan dengan penguraian nilai singular dari X maka persamaan (19) dapat

ditulis:

[ ]

2

1 2 1 1 ˆ σ λ __      + + =

∑

= p j j j f h n y

MSE , (20)

j

j f v

h =X T disebut skor X _f pada v_j.

Persamaan (20) menjelaskan bahwa besaran MSE(yˆf )tidak hanya

tergantung pada besaran akar ciri, tetapi juga tergantung pada skor X _f pada

vektor ciri vj.

2.6.Wavelet

Wavelet berarti gelombang-gelombang kecil (small waves), sedangkan sinus dan kosinus adalah gelombang-gelombang besar (Percival 2005). Suatu fungsi

) . (

(35)

1.

∫

∞

∞ −

=1 )

(

2 _u _du

ψ (21)

2.

∫

∞

∞ −

=0 )

(u du

ψ . (22)

Sehingga secara umum Wavelet adalah fungsi-fungsi yang mempunyai sifat-sifat tertentu, seperti jika diintegralkan pada

(

−∞,∞

)

hasilnya nol, grafik fungsi

ada yang di atas dan di bawah sumbu X (Vidacovic dan Meuller 1991). Ada banyak jenis fungsi wavelet, seperti wavelet yang mulus, wavelet yang nilainya tidak nol secara terbatas (compact support), wavelet yang ekspresi matematikanya sederhana, wavelet yang dihasilkan dari filter-filter yang sederhana, dan lain-lain. Fungsi wavelet yang paling sederhana dan paling tua adalah wavelet Haar, yang ditemukan oleh Alferd Haar tahun 1909 (Vidacovic dan Meuller 1991). Beberapa bentuk wavelet dari keluarga Daubechies, yang termasuk wavelet compact

support, dapat dilihat pada Gambar 4 dan Gambar 5.

Wavelet Picture

Haar waveletx

psi

0.0 0.2 0.4 0.6 0.8 1.0

-1.0

-0.5

0.0

0.5

1.0

(36)

Wavelet Picture

Daub cmpct on ext. phase N=2x

psi

-1 0 1 2 3

-1.0 -0.5 0.0 0.5 1.0 1.5

Wavelet Picture (Enhanced)

psi

-1.0 -0.5 0.0 0.5 1.0 1.5

Daub cmpct on ext. phase N=4 x p s i

-1 0 1 2

- 1 . 0 - 0 . 5 0 . 0 0 . 5 1 . 0

psi

-2 -1 0 1 2

-1.0

-0.5

0.0

0.5

1.0

Gambar 5 Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5)

Jika ada fungsi wavelet ψ(t), yang disebut mother wavelet, maka dapat

dibangkitkan sekumpulan fungsi lain, yang akan menjadi fungsi basis dalam suatu

ruang fungsi L2(R)(ruang dari semua fungsi yang terintegralkan), dengan cara

translasi dan dilatasi dari ψ(t). Fungsi-fungsi basis tersebut secara umum ditulis :

      _∈     

 − _a _b _R+_xR

a b t ) , ( ,

ψ . (23)

Dengan mengambil nilai a = 2-j dan b = k 2-j, k,j ∈ Z, maka akan diperoleh sekumpulan fungsi basis yang saling ortogonal, artinya grafiknya tidak saling tumpang tindih.

Sebagai misal, ekspresi matematika dari mother wavelet Haar adalah :

     < ≤ − < ≤ = selainnya t t t , 0 1 , 1 0 , 1 )

( ₂1 2

1

ψ (24)

(37)

Perhatikan bentuk fungsi basis ortogonal yang diperoleh dengan cara dilatasi dan translasi dari fungsi mother wavelet ψ(t),

) 2 ( ) ( ) (

, t konst t k

j k

j = ψ −

ψ , (25)

maka untuk memperoleh fungsi basis yang ortonormal, besarnya konstanta harus sama dengan 2 j/2. Hal ini merupakan konsekuensi dari ψj,k(t) yang ortogonal,

sehingga

₁=₍konst₎2

∫

_ψ2₍₂jt−k₎dt

₌ −j

∫

₌ −j

konst du

u

konst) 2 ( ) ( ) 2

( 2 _ψ2 2 _.

Jadi konstanta sama dengan 2 j/2 .

Dengan demikian bentuk fungsi basis yang ortonormal adalah :

() 2 /2 (2 )

,k t j jt k

j = ψ −

ψ . (26)

Fungsi basis pada persamaan (26) adalah fungsi basis ortonormal pada

ruang L2(R), yaitu ruang dari semua fungsi yang terin tegralkan kudrat

(

∫

f2(t)dt <∞). Sehingga secara formal, jika f(t)∈L2(R), maka f(t) dapat

didekomposisi atau direpresentasikan sebagai kombinasi linear dari fungsi-fungsi basis yang ortonormal (Antoniadis et al. 2001).

Di dalam analisis wavelet, selain fungsi ψ(t), dikenal juga fungsi lain yang

berkaitan dengan ψ(t), yang disebut fungsi father wavelet φ(t). Fungsi ini juga

dapat membangkitkan fungsi basis ortonormal yang menyusun ruang L2(R).

Sehingga secara lebih umum fungsi basis dalam L2(R), dapat berbentuk :

{

φ_jo_,_k ,ψ_j_,_k , j≥ j_o ,k∈Z

}

, (27) )

( 0 , 0 t

φ disebut fungsi skala, yang berhubungan dengan ψj,k(t). Himpunan

{

φ_jo_,_k ,k∈Z

}

akan membentuk anak ruang yang sama seperti

{

ψ_j_,_k , j≥ j_o ,k∈Z

}

. Untuk Haar wavelet bentuk dari φ₀_,₀(t)yang biasa ditulis

) (t

φ , adalah :

 

 ≤ < =

. ,

0

1 0 , 1 ) (

selainnya t t

(38)

Dimana hubungannya dengan ψ(t) dapat ditunjukkan sebagai

) 1 2 ( ) 2 ( )

(t =φ t −φ t−

ψ .

Fungsi skala atau father wavelet ,φ, adalah penyelesaian dari persamaan :

=

∑

−

k

k t k

h

t) 2 (2 )

( φ

φ . (29)

Fungsi φ(t)dapat membangkitkan suatu keluarga ortonormal L2

( )

R ,

_j_k =2j2 (2jt−k), j,k∈Z

, φ

φ . (30)

Motherwaveletψ dapat diperoleh dari fungsi skala φ melalui persamaan :

∑

−

=

k

k t k

g

t) 2 (2 )

( φ

ψ , (31)

dimana

( )

k k

k h

g = −1 ₁₋ (Vidacovic dan Meuller 1991).

Dari persamaan (29) hk merupakan sederetan bilangan yang mentransformasi

suatu fungsi menjadi fungsi lain tanpa merubah bentuknya secara prinsip, hanya

fungsi tersebut digeser atau diperkecil. Seda ngkan gk pada persamaan (31) akan

mentransformasi fungsi menjadi fungsi lain yang bentuk prinsipnya berubah.

Sehingga hkdan gkdisebut koefisien-koefisien dari low pass dan high pass filters.

Koefisien-koefisien ini digunakan untuk perhitungan dari transformasi wavelet diskret. Koefisien-koefisien tersebut diberikan oleh (Morettin 1997) :

∫

∞

− −

= t t k dt

hk 2 φ()φ(2 )

∫

∞

− −

= t t k dt

gk 2 ψ()φ(2 ) .

Berdasarkan fungsi basis (27), untuk f(t)∈L2(R), maka f(t) dapat

didekomposisi menjadi :

∑

∑ ∑

≥

+ =

k j jo k

k j k j k

jo k

jo t d t

c t

f( ) _, φ _, () _, ψ _, (). (32)

Karena fungsi basis saling ortonormal, maka koefisien-koefisien pada persamaan (32) dapat dihitung dengan (Morettin 1997) :

∫

∞

∞ −

(39)

∫

∞

∞ −

= f t t dt d_j_,_k ( )ψ_j_,_k() .

2.6.1. Transformasi Wavelet Diskret (TWD)

Di dalam statistika biasanya ingin diperoleh dekomposisi wavelet dari suatu

fungsi yang diamati pada sekumpulan data. Misalkan T M

x x x

x=( ₀ , ₁,..., ₂ ₋₁) adalah vektor data berukuran 2M_,

M bilangan bulat positif. Maka vektor data

tersebut dapat dihubungkan dengan potongan-potongan fungsi konstan pada interval [0,1) yang biasa disebut fungsi tangga, dengan persamaan :

{

}

∑

−

= ≤ <

+ =2 1

0 2 ) 1 ( 2 ) ( M M k M k k t k I x t

f . (33)

Fungsi tangga f(t) pada persamaan (33) termasuk dalam L2([0,1]), sehingga

dekomposisi wavelet dari f(t) adalah (Vidacovic dan Meuller 1991) :

∑ ∑

− = − = + = 1 0 1 2 0 , , 0 ,

0 () ()

) ( M j k k j k j j t d t c t

f φ ψ . (34)

Persamaan (34) disebut transformasi wavelet diskret, karena nilai j hanya diambil pada bilangan bulat positif saja. Bilangan j pada persamaan (34) disebut level resolusi, dan f(t) dapat diperoleh secara tepat, jika diambil semua level resolusi untuk dekomposisi, yaitu level resolusi 0 sampai dengan (M-1). Koefisien c0,0 disebut koefisien pemulusan atau bagian pendekatan dari suatu fungsi, sedang

dj,k disebut koefisien wavelet atau juga disebut bagian detail suatu fungsi.

Dengan mengambil nilai ψ_j_,_k(t) dan φ(t) untuk berbagai t, maka persamaan (34)

dapat dituliskan dengan notasi matriks,

x=W T d (35)

dan karena W ortonormal (bukti lihat Percival 2005) maka

d =W x (36)

dimana T

n d d d d c

d =( ₀_,₀ , ₀_,₀ , ₁_,₁, ₁_,₀ ,..., ₋₁_,₀) dan T

W adalah matriks yang

elemen-elemen kolomnya adalah nilai dari φ(t) dan ψ_j_,_k(t) untuk berbagai t

[ ]

0,1

∈ . Sifat-sifat menarik dari matriks T

W , selain ortonormal, adalah kolom

(40)

Contoh bentuk matriks T

W dari Haar wavelet untuk 2M =8_{adalah :}

0.353553 0.707107 0.000000 0.000000 0.000000 0.5 0.0 0.353553 0.353553 -0.707107 0.0 00000 0.000000 0.000000 0.5 0.0 0.353553 0.353553 0.000000 0.707107 0.000000 0.000000 -0.5 0.0 0.353553 0.353553 0.000000 -0.707107 0.000000 0.000000 -0.5 0.0 0.353553 0.353553 0.000000 0.000000 0.707107 0.000000 0.0 0.5 -0.353553 0.353553 0.000000 0.000000 -0.707107 0.000000 0.0 0.5 -0.353553 0.353553 0.000000 0.000000 0.000000 0.707107 0.0 -0.5 -0.353553 0.353553 0.000000 0.000000 0.000000 -0.707107 0.0 -0.5 -0.353553

Jika ukuran vektor data x sangat besar, maka perhitungan dengan cara

matriks akan memerlukan komputasi yang tinggi, sehingga menjadi kurang praktis. Mallat (1989) menemukan algoritma cepat untuk menghitung koefisien

wavelet dan koefisien pemulusan pada persamaan (34), yaitu melalui analisis multiresolusi. Algoritmanya disebut algoritma piramida.

Dalam analisis multiresolusi hubungan antara φ(t) dan ψ(t) dapat

dinyatakan sebagai :

∑

−

=

k

k t k

h

t) 2 (2 )

( _φ

φ dan ₌

∑

₋

k

k t k

g

t) 2 (2 )

( _φ

ψ (37)

k

h dan g_k disebut filter low-pass dan high pass, dan hubungannya untuk k = 0, 1,

..., L-1 adalah L k k k h

g =(−1) ₋1₋ (Percival 2005).

Sebagai misal untuk Haar wavele t dapat ditunjukkan bahwa :

) 1 2 ( 2 2 1 ) 2 ( 2 2 1 ) 1 2 ( ) 2 ( )

(t =φ t +φ t− = φ t + φ t− φ ) 1 2 ( 2 2 1 ) 2 ( 2 2 1 ) 1 2 ( ) 2 ( )

(t =φ t −φ t− = φ t − φ t− ψ Sehingga 2 1 ) 1 ( ) 0

( =h =

h dan

2 1 ) 1 ( ) 0

( =− g =

g .

2.6.2.Periodisasi Barisan Bilangan Sepanjang N

Jika

{ }

at adalah barisan bilangan, maka periodisasi

{ }

at sepanjang N

yang dinotasikan

{ }

o t

a dilakukan dengan langkah-langkah sebagai berikut

(41)

• Potong

{ }

a_t ke dalam barisan berhingga sepanjang N

a₀ ,a₁,...,a_N₋₁,a_N ,a_N₊₁,...,a₂_N₋₁,... (38)

blok n = 0 blok n = 1

• Tambahkan elemen barisan berhingga dengan cara a0 , a1 , ... , aN−1

+ + ... +

a_N , a_N₊₁ , ... , a₂_N₋₁ (39)

+ + ... + ... ... ... ...

Hasil : o

N o

a a

a 1 1

0

0 , , ... , −

2.6.3. Diskripsi Algoritma Piramida Secara Matriks

Jika ada x = (x0 , x1 , ... , xp-1 )T, dan diasumsikan

M

p =2 _,_M_{bilangan bulat}

positif maka langkah-langkah dalam algoritma piramida untuk memperoleh matriks transformasi wavelet diskret, dapat dideskripsikan sebagai berikut :

1. Misalkan ada sekumpulan barisan bilangan

{ }

hk sepanjang L , yang

dalam istilah algoritma piramida disebut low-pass filters atau disebut juga

filter skala. Maka dapat dicari sekumpulan barisan bilangan lain

{ }

gk

yang disebut high-pass filters, dengan aturan korespondensi satu-satu (Percival 2005) :

L k k

k h

g =(−1) ₋1₋ . (40)

Yang berarti

{ }

gk diperoleh dari

{ }

hk dengan membalik urutannya dan

tanda positif diganti negatif dan sebaliknya pada urutan genap, misalnya

{ }

hk =

{

h0 ,h1,h2 ,h3

}

maka

{ }

gk =

{

h3,−h2 ,h1,−h0

}

.

2. Bentuk matrik Bj berukuran j M

p x p

j

j ₂ , 1,2,...,

2 1 =

  

 

− dengan

baris-baris dari Bj merupakan

{ }

gk yang diperiodekan sepanjang ₂j−1

(42)

Misalkan

{ }

o k

g hasil periodisasi

{ }

gk sepanjang ₂j−1

p

yang dikalikan

-1 pada tiap elemennya, maka baris ke nol dari Bj adalah :

        = − − ₋ − o o o o o p o p o o T g g g g g g g g b j j 2 3 4 5 2 2 1 2 0 1 .

0 , , , ,..., , , ,

1 1

,

baris ke satu dari Bj adalah :

        = − − ₋ − o o o p o p o o o o T g g g g g g g g b j j 4 5 2 2 1 2 0 1 2 3 .

1 , , , , , ,..., ,

1 1

,

sampai baris ke 1 2 − p

dari Bj adalah :

        = − − − ₋ ₋ o o o o o o o p o p T

p g g g g g g g g

b j j 0 1 2 3 4 5 2 2 1 2 . 1 2 , , , , , , ... , , 1 1

Baris ke satu diperoleh dari baris ke nol dengan menggeser dua satuan ke kanan, demikian seterusnya untuk memperoleh baris-baris berikutnya dari

Bj.

3. Dengan cara yang sama seperti membentuk matriks Bj, maka bentuk

matriks Aj berukuran j M

p x p

j

j ₂ , 1,2,...,

2 1 =

  

 

− dengan baris-baris dari

Aj merupakan

{ }

hk yang diperiodekan sepanjang ₂j−1

p .

(43)

                                            =                                             = − − − 1 1 1 1 1 1 1 2 3 4 1 2 3 1 2 1 4 3 2 1 ... ... . . . ... . . . . . . . . . A A A A A