WAVELET
SEBAGAI METODE
PRA-PEMROSESAN
SONY SUNARYO
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Dengan ini saya menyatakan bahwa disertasi dengan judul Model Kalibrasi dengan Transformasi Wavelet sebagai Metode Pra-Pemrosesan adalah karya saya
sendiri dibawah arahan komisi pembimbing dan belum diajukan dalam bentuk apa- pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.
Bogor, September 2005
Sony Sunaryo
SONY SUNARYO. Calibration Model Using Wavelet Transform as Preprocessing Methods . Under supervision of KHAIRIL ANWAR NOTODIPUTRO, LATIFAH K. DARUSMAN and I WAYAN MANGKU.
In the modeling E(y)= f(x1,x2,..., xp) serious problems will be occurred if the number of observations (n) is less than the number of independent variables (p)
and between independent variables are correlated. The real applications of this modeling is in multivariate calibration. Reduction of dimension of independent variables (known as a preprocessing method) is useful to solve these problems. In this research we have studied discrete wavelet transformation as a preprocessing method. The study has been done both empirically and theoretically.
The exploration of three preprocessing methods, i.e. principal component analysis, Fourier transformation and discrete wavelet transformation (DWT) based on simulated data showed that discrete wavelet transformation resulted in superior goodness of fit when compared with other preprocessing methods, even when using the simplest mother wavelet function such as Haar wavelet.
The study showed that the use of any mother wavelet will result in orthogonal matrices. Because the matrix of new variables resulted from DWT which was based on centered matrix X has column sum equal to zero then the statistical properties of
the regression of wavelet coefficient are analogous to the statistical properties in the regression model of y on centered independent variables X.
If DWT is applied to the original data which are highly correlated, then the resulting variables are generally still correlated. To overcome this problem the regression models are combined with other methods. The combination of DWT and principal component regression has been utilized in this research to predict concentration of gingerol and curcuminoid, and has resulted in better calibration models.
WAVELET
SEBAGAI METODE
PRA-PEMROSESAN
SONY SUNARYO
Disertasi
sebagai salah satu syarat untuk memperoleh gelar Doktor pada
Departemen Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Nama : Sony Sunaryo
NIM : G161020011
Program Studi : Statistika
Disetujui : Komisi Pembimbing
Dr. Ir. Khairil Anwar Notodiputro, M.S. Ketua
Prof. Dr. Ir. Latifah K. Darusman, M.S. Dr. Ir. I Wayan Mangku, M.Sc. Anggota Anggota
Diketahui :
Ketua Program Studi Statistika Dekan Sekolah Pascasarjana
Dr. Ir. Budi Susetyo, M.S. Prof. Dr. Ir. Syafrida Manuwoto, M.Sc.
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah pemodelan kalibrasi dengan judul Model Kalibrasi dengan Transformasi
Wavelet sebagai Metode Pra-Pemrosesan. Penelitian yang dilakukan penulis
merupakan bagian dari payung penelitian Hibah Pasca 2003-2005, yang merupakan kerjasama antara Departemen Statistika dengan Pusat Studi Biofarmaka LPPM, Institut Pertanian Bogor.
Disertasi ini memuat dua bab yang merupakan pengembangan dari naskah artikel yang telah diterbitkan ke jurnal ilmiah. Bab 5 berjudul Sifat-sifat Statistik Pendugaan Model Kalibrasi Melalui Transformasi Wavelet Diskret, telah diterbitkan
(Prosiding Seminar Nasional Matematika dan Informatika FMIPA-UNS; Surakarta, 7 Mei 2005. hlm 159-168) dan Bab 6 yang berjudul Penerapan Model Kalibrasi dengan Wavelet-PCR terhadap Data Gingerol dan Kurkuminoid telah diterbitkan (Statistika-Forum Teori dan Aplikasi Statistika 4: 181-185).
Terima kasih yang sedalam-dalamnya penulis sampaikan kepada Bapak Dr. Ir. Khairil Anwar Notodiputro, MS. ; Ibu Prof. Dr. Ir. Latifah K. Darusman, MS. dan Bapak Dr. Ir. I Wayan Mangku, MSc. selaku pembimbing. Di samping itu penghargaan yang tinggi penulis sampaikan kepada Bapak Dr. Ir. Budi Susetyo, MS. selaku ketua Program Studi Statistika Sekolah Pascasarjana IPB, yang telah banyak memberikan dorongan dan fasilitas kepada penulis dalam menyelesaikan studi dan pe nelitian. Tidak lupa terima kasih juga penulis sampaikan kepada ayah, ibu (alm), istri, putra-putri serta seluruh keluarga penulis atas segala do’a dan kasih sayangnya.
Penulis dilahirkan di Kediri, Jawa Timur pada tanggal 25 Juli 1964 sebagai anak ketiga dari pasangan Soewoto dan Siti Masringah (alm). Pendidikan sarjana ditempuh di Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS), Surabaya, lulus tahun 1988. Pada tahun 1994 penulis diterima di Program Studi Statistika pada Program Pascasarjana Institut Pertanian Bogor dan menamatkannya tahun 1997. Pada tahun 2002 penulis mendapat kesempatan untuk mengikuti program doktor pada Program Studi Statistika, Sekolah Pascasarjana Institut Pertanian Bogor, dengan beasiswa dari Due-Like ITS.
Penulis bekerja sebagai dosen di Jurusan Statistika FMIPA-ITS sejak tahun 1989.
Selama mengikuti pendidikan program doktor, penulis telah menghasilkan beberapa karya ilmiah yang telah dipublikasikan dalam seminar nasional, dan sebagian dipublikasikan dalam jurnal ilmiah nasional. Karya -karya ilmiah tersebut merupakan bagian dari program doktor penulis. Daftar karya-karya ilmiah tersebut dapat dirinci sebagai berikut :
1. Sunaryo S, Setiawan, Djuraidah A dan Saefuddin A. 2003. Sejarah Perkembangan Statistika dan Aplikasinya. Forum Statistika dan
Komputasi, Vol 8 No.1, 2003.
2. Sunaryo S dan Notodiputro KA. 2003. Regresi Fourier dalam Kalibrasi. Prosiding Seminar Nasional Statistika VI, ITS Surabaya, 10 Oktober 2003. 3. Sunaryo S dan Notodiputro KA. 2004. Fungsi Hubung untuk Model yang Memiliki Koefisien Keragaman Konstan. Prosiding Pertemua n Ilmiah
Nasional Basic Science I, UNIBRAW, Malang, 17 Januari 2004.
4. Sunaryo S dan Notodiputro KA. 2004. Reduksi Dimensi Data Spektra dengan Transformasi Fourier dan Wavelet. Prosiding Seminar Nasional Statistika, IPB, Bogor 4 September 2004.
Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185 , Jurusan Statistika FMIPA UNISBA.
7. Sunaryo S dan Notodiputro KA. 2005. Penerapan Metode Transformasi
Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta, 7 Mei 2005.
8. Sunaryo S dan Notodiputro KA. 2005. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika, halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005.
9. Sunaryo S. 2005. Transformasi Wavelet Diskret dalam Regresi Nonparametrik. Inferensi Jurnal Statistika FMIPA-ITS. 1 : 24-32.
viii
DAFTAR ISI
Halaman
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xii
DAFTAR LAMPIRAN ... xiii
PENDAHULUAN Latar Belakang ... 1
Tujuan Penelitian ... 6
Manfaat Penelitian ... 6
TINJAUAN PUSTAKA Senyawa Aktif pada Rimpang jahe dan Temulawak …………... 7
Spektroskopi FTIR (FourierTransform Infrared) ……… 8
HPLC (High Performance Liquid Chromatography) ……… 10
Kalibrasi Peubah Ganda ………... 11
Regresi Kuadrat Terkecil ... 14
Model Regresi Terkoreksi Terhadap Nilai Tengah ... 17
Wavelet ... 20
Transformasi Wavelet Diskret (TWD) ... 25
Periodisasi Barisan Bilangan Sepanjang N ... 26
Diskripsi Algoritma Piramida Secara Matriks ……… 27
EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI Abstrak ………... 31
Abstract ……… 31
Pendahuluan ... 32
Metode dan Bahan Penelitian ... 32
Hasil dan Pembahasan ... 34
Simpulan ... 38
ix REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET DISKRET
Abstrak ………... 40
Abstract ……… 40
Pendahuluan ... 41
Metode dan Bahan Penelitian ... 42
Hasil dan Pembahasan ... 42
Sifat-sifat matriks koefesien wavelet ... 45
Simpulan ... 51
Daftar Pustaka ... 52
SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI MELALUI METODE TRANSFORMASI WAVELET DISKRET Abstrak ………... 54
Abstract ……… 54
Pendahuluan ... 55
Metode dan Bahan Penelitian ... 55
Hasil dan Pembahasan ... 56
Regresi Terhadap Koefisien Wavelet dan Sifat-sifat Statistiknya ... 56
Ilustrasi Data Simulasi ... 60
Simpulan ... 63
Daftar Pustaka ... 64
PENERAPAN MODEL KALIBRASI DENGAN WAVELET –PCR PADA DATA GINGEROL DAN KURKUMINOID Abstrak ………... 66
Abstract ……… 66
Pendahuluan ... 67
Metode Evaluasi ... 68
Analisis dan Pembahasan ... 71
Penentuan Kadar Gingerol ... 71
x
Simpulan ... 82
Daftar Pustaka ... 82
PEMBAHASAN UMUM ……… 84
SIMPULAN DAN SARAN ………. 87
Simpulan ... 87
Saran ... 88
DAFTAR PUSTAKA ………. 89
xi
DAFTAR TABEL
Halaman
1. Daerah identifikasi spektra IR gingerol ... 9
2. Daerah identifikasi spektra IR kurkuminoid ……….. 10
3. Ringkasan hasil analisis model D(nxm)terhadap y ………. 35
4. Akar ciri D*T D pada beberapa kombinasi .. ………. 61
5. Nilai beberapa ukuran kebaikan model ……... 61
6. Ringkasan hasil prediksi untuk suatu pengamatan baru ... 62
7. Ringkasan Nilai Kebaikan model Gingerol dengan wavelet D-10 dan PCR ... 74
8. Nilai Y dan Yˆ kadar gingerol dengan wavelet D10-PCR (Pc1-Pc7) ... 75
9. Ringkasan nilai kebaikan model kurkuminoid dengan wavelet D9-PCR (level 0,1,2,4) ... 79
xii
DAFTAR GAMBAR
Halaman
1. Struktur gingerol ... 7
2. Struktur kurkuminoid dari temulawak ……….. 8
3. Metode-metode kalibrasi peubah ganda dan keterkaitannya ………….. 14
4. Bentuk Haar wavelet ……… 21
5. Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5) .... 22
6. Skema algoritma piramida ... 30
7. Plot y vs yˆ untuk data simulasi 1 ………... 36
8. Plot y vs yˆ untuk data simulasi 2 ... 36
9. Plot y vs yˆ untuk data simulasi 3 ... 37
10.Plot y dengan yˆ …... 63
11.Spektra persen transmitan 1866 titik, untuk 20 contoh serbuk rimpang jahe ... 72
12.Spektra persen transmitan 1024 titik, untuk 20 contoh serbuk rimpang jahe ... 72
13.Plot Y dengan Yˆ kelompok data kalibrasi gingerol ……….………. 75
14.Plot Y dengan Yˆ kelompok data validasi gingerol (RMSEP =0.1072) ... 76
15.Spektrum 40 contoh pada 1866 titik serbuk rimpang temulawak ……….. 77
16.Spektrum 40 contoh pada 1024 titik serbuk rimpang temulawak ……….. 78
17.Plot Y dengan Yˆ kelompok data kalibrasi kurkuminoid ... 81
18.Plot Y dengan Yˆ kelompok data validasi kurkuminoid ... 81
xiii
DAFTAR LAMPIRAN
Halaman
1. Hasil lengkap analisis data simulasi 1 Bab 3 ... 95
2. Hasil lengkap analisis data simulasi 2 Bab 3 ……….. 97
3. Hasil lengkap analisis data simulasi 3 Bab 3 ……….. 99
4. Program SAS untuk simulasi data 1 pada Bab 3 ………... 101
5. Program SAS untuk simulasi data 2 pada Bab 3 ... 102
6. Program SAS untuk simulasi data 3 pada Bab 3 ... 103
7. Hasil analisis regresi antara kadar gingerol dengan 12 koefesien wavelet dan 1 peubah dummy ... 104
8. Hasil analisis regresi antara kadar kurkuminoid dengan 24 koefesien wavelet ... ... 105
9. Hasil lengkap analisis regresi komponen utama kadar gingerol ... 106
1.1. Latar belakang
Didalam pembuatan model E(y)= f(x1,x2,...,xp) permasalahan serius
akan muncul jika banyaknya pengamatan (n) jauh lebih kecil dari banyaknya peubah (p) dan antar peubah saling berkorelasi. Kasus-kasus ini membawa ke permasalahan kekhasan pendugaan parameter model. Metode untuk mengatasi hal ini adalah dengan melakukan reduksi dimensi data sehingga diperoleh peubah baru yang dimensinya jauh lebih kecil dari p dan antar peubah baru tidak saling berkorelasi. Metode yang banyak dikenal sampai saat ini adalah Principal
Component Regression (PCR) dan Partial Least Square (PLS). Dengan p yang
besar proses perhitungan regresi komponen utama (PCR) dan regresi PLS biasanya akan mengalami kendala dalam komputasi.
Metode lain untuk reduksi dimensi data adalah dengan mendekomposisi
T ip i
i
i x x x
x =( 1, 2,..., ) ke dalam sekumpulan fungsi basis, seperti dalam metode
transformasi Fourier dan metode transformasi wavelet. Metode wavelet merupakan metode yang relatif baru, yang berkembang mulai tahun 1983 sampai sekarang dan merupakan alat analisis data untuk berbagai tujuan seperti analisis deret waktu, analisis image (image analysis), reduksi dimensi data, pemodelan
nonparametrics dan lain-lain (Percival 2000). Prinsip-prinsip yang ada pada
metode wavelet merupakan perpaduan antara ide lama, seperti Haar wavelet yang ditemukan oleh Alfred Haar tahun 1909, dan ide baru yang muncul dengan adanya perkembangan perangkat lunak komputer, seperti penerapan Multi Resolution Analysis untuk menghitung koefis ien-koefisien wavelet dengan algoritma piramid
(Mallat 1989). Pembahasan secara luas tentang wavelet dapat dikatagorikan menjadi dua kelompok yaitu transformasi wavelet kontinu (TWK), yang berkembang mulai tahun 1983 sampai sekarang, dan transformasi wavele t diskret (TWD), yang berkembang mulai tahun 1988 sampai sekarang (Percival 2000).
diperoleh dengan dilatasi dan translasi dua jenis fungsi wavelet yang disebut
father wavelet, φ, dan mother wavelet ψ (Nason dan Silverman 1997). Dalam analisis Fourier fungsi basis yang digunakan adalah fungsi sinus dan kosinus, sehingga metode wavelet dapat dipandang sebagai perluasan dari analisis Fourier. Dalam metode wavelet jika suatu fungsi yang didekomposisi ke dalam fungsi-fungsi wavelet diambil bilangan dilatasi dan translasi yang kontinu maka akan termasuk dalam TWK. Sedangkan jika bilangan dilatasi dan translasi berupa bilangan bulat bukan negatif , maka termasuk dalam TWD (Nason dan Silverman 1997). Dengan TWD akan diperoleh koefisien-koefisien wavelet yang jumlahnya sama dengan jumlah titik asal.
Berbagai penelitian dalam perkembangan terakhir tentang wavelet adalah penerapan wavelet untuk regresi dan permasalahan statistik lainnya ( Nason dan Silverman 1997), studi simulasi untuk melihat perilaku penduga wavelet dalam regresi nonparametrik (Antoniadis et al. 2001; Sunaryo 2005), Bayes empirik untuk pemilihan threshold wavelet (Johnstone dan Silverman, 2004), penerapan metode wavelet dalam chemometrics (Depczynski et al. 1997), transformasi
wavelet ganda diskret dan thresholding (Downie dan Silverman 1996), model regresi PLS-wavelet untuk eksplorasi data dan proses monitoring (Teppola dan Pentti 2000), aplikasi dari analisis wavelet untuk menentukan konsentrasi gula dari solutant cair (McNulty dan Ganapati 1998), penggabungan metode transformasi wavelet dengan metode pemodelan kalibrasi peubah ganda yang lain (Dean et al. 2004; Leung et al. 1998; Naes et al. 2002; Sunaryo dan Notodiputro 2004b; Sunaryo dan Notodiputro 2005a; Tan dan Brown 2002; Yi-yu dan Chen min-jun 2000) , dan masih banyak lagi yang lain. Menurut Percival (2005) ada lebih dari 26000 artikel dan buku sejak tahun 1989 sampai dengan tahun 2004, dan lebih dari 3000 artikel sejak tahun 2004. Pertanyaan terbuka yang belum diteliti adalah bagaimana sifa t-sifat statistik dari hasil dugaan model dengan pra-pemrosesan metode wavelet. Dengan mengetahui sifat-sifat statistik akan bisa dilakukan pengujian-pengujian terhadap hasil dugaan, sehingga kesimpulan berlaku secara umum dan valid.
sekelompok ukuran lain yang relatif susah (labour intensive) atau mahal memperolehnya. Tujuan kalibrasi peubah ganda adalah menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan teliti dari ukuran-ukuran yang murah (Naes et al. 2002). Secara umum kalibrasi peubah ganda menggunakan suatu fungsi matematika dengan data empirik dan pengetahuan untuk menduga informasi pada Y, ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , ukuran yang murah, yang tersedia (Martens dan Naes 1989).
Kalibrasi peubah ganda sering diterapkan untuk menduga senyawa aktif dari contoh yang diukur melalui FTIR atau NIR. Sebagai ilustrasi marilah kita tengok potensi penerapannya pada penentuan senyawa aktif tanaman obat.
Indonesia dikenal sebagai salah satu negara penghasil tanaman obat dan mempunyai potensi dan prospek pengembangan yang baik. Sekitar 25 obat-obatan yang diresepkan negara industri maju mengandung bahan senyawa aktif hasil ekstraksi tanaman obat (Supriadi 2001). Jahe (Zingeber officinale Roscoe) dan temulawak (Curcuma xanthorrhiza Roxb.) merupakan tanaman obat yang banyak digunakan sebagai bahan baku dalam industri jamu dan farmasi. Saat ini permintaan akan jahe oleh negara importir terus mengalami peningkatan dari tahun ke tahun, akan tetapi permintaan tersebut belum semuanya dapat dipenuhi mengingat produksi jahe masih terserap oleh kebutuhan dalam negeri. Sedangkan setiap industri jamu baik skala kecil maupun skala industri selalu memasukkan temulawak ke dalam racikan.
Khasiat dan kualitas tanaman obat tidak terlepas dari senyawa aktif yang dikandungnya. Metode penentuan kadar senyawa aktif dari rimpang tanaman obat yang selama ini digunakan, dilakukan melalui proses yang panjang meliputi penghancuran bahan, pelarutan, dan pengukuran, baik dengan HPLC (High
Performance Liquid Chromatography) maupun dengan instrumen lainnya. Proses ini memerlukan waktu dan biaya yang relatif mahal. Alternatif cara penentuan lain yang dapat dilakukan adalah dengan mengembangkan model kalibrasi peubah ganda yang menyatakan hubungan antara kadar senyawa aktif hasil pengukuran HPLC dengan data hasil pengukuran dengan FTIR (Fourier Transform Infra
Melalui metode HPLC, suatu senyawa dapat diketahui secara kualitatif dan kuantitatif yaitu dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui. Sedangkan spektroskopi FTIR memberikan informasi yang mencerminkan gugus fungsi yang terdapat pada suatu senyawa akif dan kuantitatif melalui nilai absorbannya. Setiap jenis senyawa aktif secara kimiawi akan memberikan pola tapak FTIR dan juga pola kromatogram yang tertentu tergantung responnya. Pada kasus ini data pengukuran HPLC berfungsi sebagai data pembanding.
Pada pendugaan model kalibrasi peubah ganda sering timbul masalah multikolinearitas di antara peubah persen transmitan (Naes 1985). Selain itu muncul juga masalah bahwa banyaknya peubah bebas (p) jauh lebih besar dari banyaknya pengamatan pada peubah tak bebas (n), sehingga metode baku seperti model regresi ganda biasa sering memberikan solusi yang tidak unik. Oleh karena itu diperlukan suatu metode yang dapat mengatasi kedua masalah tersebut sehingga metode tersebut akan memberikan solusi yang unik dan baik.
Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang terdapat dalam literatur antara lain regresi komponen utama, dan metode PLS (Martens dan Naes 1989; Naes et al. 2002). Dalam penyusunan model, regresi komponen utama menggunakan peubah baru yang merupakan kombinasi linear peubah-peubah asal. Metode PLS menghasilkan komponen-komponen yang tidak berkorelasi atau tidak terjadi multikolinearitas tetapi dapat memaksimumkan korelasinya dengan peubah respons (Geladi dan Kowalski 1986). Metode kalibrasi peubah ganda yang lain sampai saat ini adalah jaringan syaraf tiruan (JST), regresi Fourier , wavelet, bayes, dan gabungan antara beberapa metode tersebut.
Informasi yang diperoleh dari FTIR untuk setiap contoh (sampel) rimpang ke-i adalah data vektor spektra yang merupakan sederetan ukuran persen
transmitan T
ip i
i
i x x x
x =( 1, 2,..., ) , yang diamati pada p titik bilangan gelombang
bobot dari fungsi basis (yang disebut fungsi wavelet). Dengan memilih m yang jauh lebih kecil dari p, diharapkan hasil pemodelan kalibrasi peubah ganda masih cukup baik dan valid (Sunaryo dan Notodiputro 2004a).
Di Indonesia sampai saat ini kalibrasi peubah ganda khususnya dengan pra-pemrosesan transformasi wavelet belum banyak dikembangkan dan dikaji. Oleh karena itu penelitian ini akan mengkaji dan menerapkan pemodelan kalibrasi peubah ganda dengan pra -pemrosesan transformasi wavelet. Dengan tujuan utama mengkaji perilaku dan mencari model yang lebih baik untuk menduga kadar gingerol dan kurkuminoid pada rimpang jahe dan temulawak.
Disertasi ini ditulis dalam bentuk rangkaian topik-topik penelitian yang dapat berdiri sendiri tetapi membentuk satu kesatuan untuk menjawab tujuan penelitian. Pada Bab 3 dilakukan eksplorasi terhadap berbagai metode reduksi dimensi data X (nxp) menjadi peubah baru, misalkan D (nxm), m < p dalam pemodelan dengan kasus multikolinear dan n lebih kecil dari p. Metode reduksi yang diteliti adalah analisis komponen utama, transformasi Fourier dan transformasi wavelet. Harapan dari peneltian ini mencari potensi untuk diteliti lebih lanjut salah satu metode yang menghasilkan ukuran-ukuran kebaikan model yang lebih baik. Dari kajian pustaka ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, dibanding yang lainnya. Maka penelitian ini akan menjustifikasi hal tersebut lewat analisis berbasis data simulasi.
Setelah mengetahui sifat-sifat statistik dan perilaku hasil transformasi wavelet, maka penelitian dilanjutkan pada penerapan transformasi wavelet untuk mencari dugaan model kalibrasi terhadap data gingerol dan kurkuminoid yaitu senyawa aktif pada rimpang jahe dan temulawak yang dilakukan pada Bab 6. Analisis yang dilakukan pada Bab 6 mempertimbangkan aspek-aspek kimia yang berkaitan yaitu dengan memperhatikan daerah identifikasi spektra infra merah untuk gugus -gugus fungsi yang ada pada gingerol dan kurkuminoid . Pada bab 7 dilakukan pembahasan secara umum sedangkan Bab 8 membuat suatu simpulan dari rangkaian penelitian tersebut dan memberikan saran-saran yang bisa dilakukan untuk penelitian lebih lanjut.
1.2.Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Mengkaji secara teoritis sifat-sifat hasil dugaan pemodelan kalibrasi peubah ganda dengan pra-pemrosesan metode wavelet.
2. Mengaplikasikan metode wavelet dalam pengembangan model kalibrasi peubah ganda untuk menentukan kadar senyawa aktif kurkuminoid pada rimpang temulawak dan senyawa aktif gingerol pada rimpang jahe.
1.3. Manfaat Penelitian
2.1. Senyawa Aktif pada Rimpang Jahe dan Temulawak
Menurut Young (2003) rimpang jahe mengandung dua bagian utama yaitu minyak esensial (volatil) yang memberikan aroma dan pembawa rasa pedas yaitu
gingerol. Kandungan gingerol yang cukup tinggi pada rimpang jahe,
menyebabkan jahe memiliki peranan penting dalam dunia pengobatan, baik pengobatan tradisional atau skala industri dengan memanfaatkan kemajuan teknologi. Jahe merupakan salah satu dari beberapa tanaman yang digunakan secara tradisional sebagai obat rematik, demam, radang dan lain-lain (Lee dan Lim 2000). Stuktur gingerol dapat dilihat pada Gambar 1.( Chan et al., 1986)
H3CO
O
OH
(CH2)nCH3
N-Gingerol
Keterangan : N= 6, 8, 10 n= 4, 6, 8 Gambar 1 Struktur gingerol
Menurut Sinambela (1985), komposisi rimpang temulawak dapat dibagi menjadi dua fraksi utama yaitu zat warna kurkuminoid dan minyak atsiri. Warna kekuningan temulawak disebabkan adanya kurkuminoid. Kandungan utama kurkuminoid terdiri dari senyawa kurkumin, desmetoksikurkumin dan bis-desmetoksikurkumin. Struktur kurkuminoid dapat dilihat pada Gambar 2. Disamping tiga senyawa utama tersebut terdapat senyawa lain yang digolongkan termasuk ke dalam senyawa kurkuminoid yaitu monometoksikurkumin,
Keterangan:
R1 R2
-OCH3 -OCH3 = kurkumin
-OCH3 -H = desmetoksikurkumin
-H -H = bis-desmetoksikurkumin
Gambar 2 Struktur kurkuminoid dari temulawak
Rimpang temulawak segar, selain terdiri dari senyawa kurkuminoid dan minyak atsiri juga mengandung lemak, protein, selulosa, pati, dan mineral.
Menurut Darwis et al. (1991), kurkuminoid temulawak mempunyai khasiat sebagai antibakteri dan dapat merangsang dinding kantong empedu untuk mengeluarkan cairan empedu supaya pencernaan lebih sempurna. Selain itu temulawak digunakan juga sebagai pengobatan gangguan pada hati atau penyakit kuning, batu empedu, memperlancar aliran air empedu, obat demam dan sembelit, memperlancar keluarnya air susu ibu, obat diare, imflamasi pada anus, gangguan perut karena dingin, dan radang dalam perut atau kulit.
2.2. Spektroskopi FTIR (Fourier Transform Infrared)
Aplikasi teknik spektroskopi infra merah sangat luas, baik untuk tujuan analisis kuantitatif maupun kualitatif. Untuk analisis kualitatif dan kuantitatif maka pola spektrum FTIR suatu senyawa perlu dilakukan analisis referensi sebagai pembanding. Instrumentasi spektrum infra merah dibagi kedalam tiga jenis radiasi yaitu infra merah dekat (bilangan gelombang 12800-4000 cm-1), infra
merah pertengahan (bilangan gelombang 4000-200 cm-1), dan infra merah jauh (bilangan gelombang 200-10 cm-1) (Nur dan Adijuwana 1989), FTIR termasuk dalam kategori radiasi infra merah pertengahan (bilangan gelombang 4000-200 cm-1).
Hampir setiap senyawa yang memiliki ikatan kovalen akan menyerap berbagai frekuensi radiasi elektromagnetik dalam daerah spektrum inframerah. Setiap tipe ikatan yang berbeda mempunyai sifat frekuensi vibrasi yang berbeda,
OH O
R2
OH HO
dan karena tipe ikatan yang sama dalam dua senyawa yang berbeda terletak dalam lingkungan yang sedikit berbeda, maka tidak akan ada dua molekul yang berbeda strukturnya akan mempunyai bentuk serapan inframerah atau spektrum inframerah yang tepat sama.
Jika I0 adalah intensitas IR yang masuk kedalam contoh dan I adalah
intensitas IR yang diteruskan (transmitted) oleh contoh, maka : Absorban (A) = Log (I0 / I) dan %transmitan (%T) = 100 (I/I0).
Sehingga hubungan absorban dengan %transmitan adalah : A = - log ( %T/100).
Karena kekuatan serapan proporsional terhadap konsentrasi, maka FTIR dapat digunakan untuk analisis kuantitatif yang menghubungkan konsentrasi dengan absorban atau persen transmitan. Untuk menduga konsentrasi suatu senyawa tertentu dala m contoh, diperlukan pengukuran nilai-nilai absorban dari contoh pada berbagai bilangan gelombang. Pembuatan model yang menghu bungkan konsentrasi dengan nilai-nilai absorban dapat digunakan untuk menduga konsentrasi senyawa tertentu yang tidak diketahui dalam contoh.
Kegunaan penting dari spektrum infra merah adalah untuk mendeteksi tentang gugus fungsi dari suatu molekul. Dari struktur gingerol dan kurkuminoid yang khas, maka spe ktrum yang dihasilkan dengan FTIR akan khas pula. Menurut Socrates (1994) daerah identifikasi spekta infra merah (IR) untuk gingerol dan kurkuminoid adalah seperti yang terlihat pada Tabel 1 dan Tabel 2.
Tabel 1 Daerah identifikasi spektra IR gingerol
No Jenis vibrasi Bilangan
gelombang cm-1
intensitas
1 Ikatan hidrogen O-H 3550-3230 m-s
2 C-H rentangan asimetri ; CH3-Ar 2935-2925 m-s
3 Aromatik -C=C- 1625-1590 v
4 α-β-keton takjenuh 1700-1660 vs
5 R-O-Ar 1310-1210
1050-1010
m m 6 C-H ikatan bidang luar
Vinil R- CH=CH2-
990-980
910-230 m s 7 C-H ikatan bidang luar
o-subsitusi benzen
770-735 710-690
Tabel 2 Daerah identifikasi spektra IR kurkuminoid
No Jenis vibrasi Bilangan Gelombang cm-1 intensitas
1 Ikatan hidrogen OH 3600-3300 m-s
2 C-H Alkana 3000-2850 s
3 Aromatik -C=C- rentangan 1660-1450 s
4 R-O-Ar 1300-1000 m
5 C=O keton 1820-1660 v
6 Sidik jari 900-700 s
Keterangan: (s) kuat; (m) medium; (vs) sangat kuat
Jika untuk analisis lanjutan perlu dilakukan pengambilan beberapa data %transmitan hasil pengukuran dengan FTIR, maka daerah identifikasi IR suatu senyawa sangat perlu diperhatikan, pemotongan yang tidak memperhatikan daerah identifikasi bisa mengarah ke pemodelan yang hasilnya kurang baik. Sebagai misal McNulty dan Ganapati (1998) menduga konsentrasi glukosa dalam larutan encer, dimana spektrum masing-masing contoh dihasilkan dari FTIR dengan kisaran bilangan gelombang 10000 cm-1 s/d 4000 cm-1 pada relolusi 4 cm-1 sehingga diperoleh 1500 titik absorban. Karena dalam analisis lanjut hanya dibutuhkan 256 titik, maka penentuan 256 titik dilakukan dengan me mperhatikan daerah identifikasi dari glukosa, yaitu pada kisaran bilangan gelombang 4550 cm-1
s/d 4150 cm-1 dengan resolusi 4 cm-1. Cara yang sama dilakukan oleh Brown et al. (2001) yang memprediksi kandungan lemak, gula, flour dan air dalam suatu contoh adonan kue. Pada awalnya spektrum absorban diukur pada kisaran panjang gelombang 1100 nm s/d 2498 nm dengan resolusi 2 nm, sehingga diperoleh 700 titik absorban. Dari 700 titik hanya dibutuhkan 256 titik, maka langkah yang diambil oleh Brown et al. (2001) adalah membuang titik-titik absorban pada pengamatan 140 titik panjang gelombang pertama, dan 49 titik panjang gelombang terakhir dengan alasan pada kisaran tersebut sedikit mengandung informasi. Kemudian dari pengamatan absorban pada panjang gelombang 1380 nm s/d 2400 nm, resolusi ditingkatkan menjadi 4 nm. Sehingga diperoleh 256 titik absorban.
2.3. HPLC (High Performance Liquid Chromatography)
mengidentifikasi berbagai komponen dalam campuran. Prinsip pemisahan komponen campuran dalam kolom yaitu berdasarkan perbedaan kesetimbangan retensi dan gerakan masing-masing komponen pada pemukaan fase diam dan fase gerak. Zat-zat yang terabsorpsi kuat dalam fase diam akan lama bertahan dalam kolom, sedangkan yang teradsorpsi lemah akan keluar dengan cepat dari kolom. Waktu dari mulai contoh diinjeksikan kedalam HPLC sampai dengan suatu puncak analat (analyte peak) muncul di detektor pada akhir kolom disebut waktu retensi (retention time). Masing-masing analat dalam suatu contoh akan mempunyai perbedaan waktu retensi. Waktu retensi mencerminkan keberadaan suatu komponen kimia, dan merupakan penciri kualitatif suatu senyawa. Luas area dibawah kurva mencerminkan konsentrasi secara kuantitatif.
HPLC digunakan terutama untuk golongan senyawa tak atsiri, misalnya terpenoid tinggi, segala jenis fenol, alkaloid, lipid, dan gula. HPLC berhasil baik untuk senyawa yang dapat dideteksi di daerah spektrum UV dan spektrum sinar tampak (Harborne 1996). HPLC digunakan untuk mengkuantisasi senyawa aktif yang diperoleh dari berbagai perlakuan. Secara kualitatif dan kuantitatif suatu senyawa aktif dapat diketahui antara lain melalui metoda HPLC dengan mengetahui pola kromatogram dan memperbandingkan luas area terhadap suatu standar senyawa yang diketahui pada waktu retensi tertentu. HPLC dapat digunakan untuk analisis kulitatif dan kuantitatif atau bahkan dapat dimanfaatkan sebagai sarana untuk pemurnian melalui pemisahan secara preparatif.
Analisis kuantitatif dengan HPLC dilakukan terhadap hasil ekstraksi suatu contoh. Makin murni ekstrak maka hasil HPLC makin kuantitatif. Tetapi pemurnian suatu ekstrak membutuhkan biaya yang mahal. Pengukuran konsentrasi dengan HPLC memerlukan analisis referensi terhadap ekstrak murni sebagai pembanding.
2.4. Kalibrasi Peubah Ganda
Chemometrics adalah dapat dipandang sebagai gabungan antara matematika dan statistika dengan kimia. Kalibrasi peubah ganda merupakan bagian dari
Chemometrics yang bertujuan untuk menemukan hubungan antara sekumpulan
ukuran lain yang relatif sulit (labour in tensive) atau mahal memperolehnya. Naes
et al. (2002) menyebutkan bahwa tujuan kalibrasi peubah ganda adalah
menemukan model yang dapat digunakan untuk memprediksi ukuran-ukuran yang mahal dengan tepat dan akurat dari ukuran-ukuran yang murah. Secara umum kalibrasi peubah ganda menggunakan formula matematika untuk menduga informasi pada Y, yaitu ukuran yang mahal, yang tidak diketahui berdasarkan informasi pada X , yaitu ukuran yang murah, yang tersedia (Martens dan Naes 1989). Formula matematika yang disebut model pada prinsipnya dibagi menjadi dua komponen, yaitu komponen yang terstruktur yang merepresentasikan variasi sistematis dan komponen sisaan yang merepresentasikan perbedaan antara data dengan komponen terstruktur. Pemodelan kalibrasi peubah ganda yang baik akan memperhatikan terhadap kedua komponen tersebut. Secara umum dengan membuat asumsi-asumsi terhadap komponen terstruktur (seperti linear) dan komponen sisaan (seperti mempunyai sebaran normal) akan membuat model lebih baik dan lebih berguna (Ma rten dan Naes 1989). Karena mengandung komponen sisaan, maka parameter-parameter yang ada dalam model diduga secara statistika berdasarkan contoh-contoh data yang representatif dan asumsi sebaran tertentu dari sisaan.
Menurut Naes et al. (2002) pembuatan model untuk memprediksi Y dengan kalibrasi peubah ganda, yaitu dengan mempertimbangkan beberapa atau semua pengamatan pada spektrum, akan memberikan hasil lebih baik dibanding dengan pemodelan kalibrasi peubah tunggal yang hanya mempertimbangkan satu puncak pada masing-masing spektrum. Dengan mengkombinasi informasi dari beberapa atau bahkan semua peubah spektrum, permasalahan yang muncul pada pendugaan model kalibrasi ganda adalah kasus multikolinearitas di antara peubah absorban dan banyaknya contoh (n) yang lebih kecil dari banyaknya peubah bebas (p) (Marten dan Naes 1985; Naes et al. 2000), sehingga metode baku seperti model regresi sering memberikan solusi yang tidak stabil. Oleh karena itu diperlukan suatu metode yang dapat mengatasi masalah tersebut, sehingga diperoleh solusi yang lebih stabil.
chemometric ada dua pendekatan yang sangat populer yaitu menggunakan regresi
ganda terbakukan, dengan kehati-hatian dalam memilih peubah bebas, dan pendekatan dengan reduksi dimensi data (Naes et al. 2002). Beberapa metode untuk pendugaan model kalibrasi peubah ganda yang ada dalam beberapa literatur antara lain regresi komponen utama, regresi kuadrat terkecil parsial (PLS), regresi fourier, Jaringan Syaraf Tiruan (JST), transformasi wavelet ( Naes et al. 2002; Marten dan Naes 1989; Osborne et al. 1993), dan metode bayes. Menurut Naes et
al. (2002) dengan mengambil beberapa koefisien wavelet sebagai reduksi dimensi
akan menghasilkan rekontruksi ulang spektrum IR yang cukup mendekati spektrum IR asli. Keterkaitan metode-metode ini dalam kalibrasi peubah ganda dapat dilihat seperti pada Gambar 3.
Selain kasus multikolinearitas dan n < p, masalah lain yang muncul dalam pemodelan kalibrasi peubah ganda adalah kesalahan dari pencaran spektrum (Scatter problem), yaitu spektrum yang diamati bisa berbeda dari yang sesungguhnya. Hal ini akan berpengaruh terhadap benar tidaknya pengukuran X dalam pemodelan, dan disebut kesalahan pengukuran peubah-peubah (Error of
variables). Menurut Naes et al. (2002) salah satu metode untuk mengatasi
Y
T
Y
T Y
Y
T
T
Y
T
Gambar 3 Metode -metode kalibrasi peubah ganda dan keterkaitannya.
2.5. Regresi Kuadrat Terkecil
Bentuk umum regresi linear berganda adalah :
y=1b0+ X1b+e (1)
atau bisa ditulis :
y= X β +e, (2)
dengan E(y)=X β , E(e)=0 dan Var(e)=Iσ2,
Data
n pengamatan
p peubah bebas
p=1 ?
Model Regr. Peubah tunggal
p n ?
Koline ari tas dari X ?
Reduksi dimensi ?
Komp. Utama PLS Fourier
Wavelet
JST
Penambahan Informasi ?
Penambahan Informasi
Bayes Regresi Ganda
dimana
[
p]
Tb b b
b = 1, 2,..., , βT =
[
b0,b1,...,bp]
= np n n p p x x x x x x x x x X . . . . . . . . . . . . . . . . . . . . . 2 1 2 22 21 1 12 11 1 , = np n n p p x x x x x x x x x X . . . . . . . . . . . . . . . . . . . . . 1 . . . 1 1 2 1 2 22 21 1 12 11 , = n y y y y . . . 2 1 dan = n e e e e . . . 2 1 .
Dugaan kuadrat terkecil dari persamaan (2) adalah :
βˆ =
(
X T X)
−1 XT y,yang mempunyai sifat dan konsekwensi sebagai berikut (Searle 1971) :
a. βˆ adalah penduga tak bias dari β, yang berarti E(β =ˆ) β.
b. Mempunyai ragam
(βˆ)=
(
)
−1σ2X X
Var T . (3)
c. Prediksi terhadap nilai E(y)dapat dijelaskan sebagai berikut :
Penduga βˆ dapat digunakan untuk menduga model
p p x b x b b y
E( )= 0 + 1 1 +...+ dengan
βˆ ˆ . . . ˆ ˆ ) ( ˆ 1 1 0 T p
p x x
b x
b b y
E = + + + = .
Sehingga untuk pengamatan T
[
o o op]
o x x x
x = 1, 1, 2,..., , dugaan terhadap E(yo)
adalah : βˆ ˆ . . . ˆ ˆ ) ( ˆ
ˆ 0 1 1 T
o op k o
o
o E y b b x b x x
y = = + + + = , (4)
dengan ragam :
[ ]
(
)
oT T o o T o
o x Var x x X X x
y
Karena βˆ adalah penduga tak bias, maka yˆ juga merupakan penduga tak bias o
bagi E(yo) sehingga
(
)
1 22 2
0) (ˆ ( )) (ˆ ) (ˆ )
ˆ
( oσ
T o T o o
o
o E y Vary bias y x X X x
y E y
MSE = − = + = − . (6)
d. Prediksi nilai pengamatan tunggal , yf yang tidak diketahui, yang berkaitan
dengan vektor nilai x, misalnya [1, f1, f2,..., fp]
T
f x x x
x = dapat dijelaskan
sebagai berikut :
Dari model f
T f
f x e
y = β + , dimana efadalah galat random. Dugaan ter baik
bagi yfadalah ˆ βˆ
T f
f x
y = , sehingga T βˆ f
x dapat digunakan untuk
menduga pengamatan yfyang berhubungan dengan f T
x , maupun menduga
nilai E(yf) yang berhubungan dengan f T
x .
Jika yˆ digunakan untuk memprediksi peubah random f yf, maka bias dari yˆ f
adalah :
bias(yˆf)= E(yˆf −yf).
Karena yf adalah pengamatan yang diperoleh secara bebas dari penurunan
βˆ , maka βˆ dan ef saling bebas, atau berarti cov(βˆ,ef)=0.
[ ]
T(
T)
ff f T
f
f x Var x x X X x
y
Var ˆ = (βˆ ) = −1σ2 . (7)
(ˆ ) ( ˆ )2
f f
f E y y
y
MSE = −
( ( ˆ) )2
f T
f e
x
E − +
= β β
( ˆ) ( 2) 2cov( ( ˆ), )
f T
f f
f T
fVar x E e x e
x β − β + + β −β
=
=[
(
)
−1 f +1] σ2T T
f X X x
x . (8)
2.5.1. Model Regresi Terkoreksi Terhadap Nilai Tengah
Dari persamaan (1) dan (2), telah diketahui bahwa X =[1 X1], dimana 1
adalah vektor 1 berukuran nx1. Dengan mendefinisikan vektor nilai tengah (rata
-rata) dari pengamatan X1 sebagai [ .1 , .2 ,..., .p] T
x x
x
x = maka dari definisi ini
mengimplikasikan :
n
T
= 1
1 , 1T y =n y dan 1T X1 =nx.
Sehingga solusi dari βˆ dapat ditulis sebagai berikut :
βˆ =
(
X T X)
−1 X T y
[
]
y X X X T T T T = − 1 1 1 1 1 1 1 = − y X y n X X x n x n n T T T 1 1 1 1 − − + = − − − − y X y n S x S S x x S x n T T T 1 1 1 1 1 1 ,dimana T T
x x n X X
S = 1 1 − (Bukti lihat Searle 1971).
Dengan mempartisi
= = b b b b b k 0 1 0 . . .
β , maka diperoleh :
− − − = − − ) ( ) ( ˆ ˆ 1 1 1 1 0 x y n y X S x y n y X S x y b b T T T . Sehingga
ˆ 1( 1 ) x y n y X S
bˆ0 = y −xT bˆ . (10)
Jika X = X1 −1xT yaitu matriks X1 yang terkoreksi terhadap nilai
tengah, maka (X1 x1 ) (X1 1 x)
T T
T
T = − −
X X
= X1T X1 −n x xT =S
X T y= (X1T −x1T) y = X1Ty−nx y.
Sehingga persamaan (9) dapat ditulis :
bˆ S 1(X1 y n y x)
T −
= −
X T X -1X T y )
(
= . (11)
Jika model umum y =1b0 + X1 b+ e, ditulis dalam bentuk X1 yang terkoreksi
terhadap nilai tengah (X ), maka diperoleh :
y=1b0 +[X +1xT ] b + e
=1b0 + 1xT b+X b+ e
=1β0 + X b+ e. (12)
Dan diduga oleh :
b
yˆ = β1 ˆ0 + X ˆ, dan karena βˆ0 =bˆ0 + xT bˆ=[ y−x T bˆ] + xT bˆ= y, maka
model (12) diduga oleh :
yˆ =1y + X bˆ , dengan bˆ diperoleh dari persamaan (11).
Beberapa sifat penulisan model yang terkoreksi terhadap nilai tengah adalah :
1. bˆ dan βˆ0 adalah penduga tidak bias terhadap b dan y.
2. Jika X pada (3) diganti dengan [1 X +1x T]maka akan diperoleh (Searle
( ˆ)= ( )−1σ2 X
X T
b
Var . (13)
Dengan penguraian nilai singular dari X , persamaan (13) dapat ditulis
sebagai : T j p j j j v v b Var
∑
= = 12 (1 )
) ˆ (
λ
σ , (14)
dimana λj dan vj masing-masing adalah akar ciri ke-j dan vektor ciri ke-j
yang bersesuaian dari matriks X T X .
Dari (14) dengan mengganti :
= 2 2 2 2 1 2 1 2 1 . . . . . . . . .
*
j p j p j j j p j j j j T j j v v v v v v v v v v vmaka akan diperoleh :
Var b v v v i p
p p i i
i
i) ... , 1,2,...,
( 2 2 2 2 1 2 1 = + + + = λ λ
λ . (15)
Sehingga ragam dari bi akan sangat dipengaruhi oleh akar ciri-akar ciri dari
X
X T , semakin kecil akar ciri ke -i maka semakin besar ragam dari bi.
Dalam kasus multikoline aritas akar ciri X T X ada yang mendekati nol,
sehingga ragam dari bi akan besar.
3. Pendugaan nilai harapan pengamatan baru, E( yo ) dapat dijelaskan sebagai
berikut :
Dari persamaan (5) dengan mengganti T [1 T T ] x o o
x = X + akan
diperoleh ragam prediksi nilai harapan yo :
[ ]
21 2
ˆ σ o o σ
n y
Var o X T X T X X
− +
Atau bisa ditulis sebagai :
[ ]
∑
∑
= = = + + = p j j j p j j T j j o t n o v v o n y Var T 1 2 2 2 1 2 2 ˆ λ σ σ λ σσ X X
j
j o v
t =X T disebut skor X o pada vj.
(17)
Dengan mengganti T [1 T T ] x o o
x = X + , maka persamaan (6) akan
diperoleh sama seperti persamaan (17).
4. Pendugaan nilai pengamatan baru yˆ dapat dijelaskan sebagai berikut : f
Dengan cara yang sama maka dari persamaan (7) dan (8) dengan mengganti
] 1
[ T T
T
x f f
x = X + akan diperoleh :
[ ]
21 2
ˆ σ f f σ
n y
Var f X T X T X X
− + = (18)
[ ]
21 1 1 ˆ σ + +
= f − f
n y
MSE f X T X T X X . (19)
Dan dengan penguraian nilai singular dari X maka persamaan (19) dapat
ditulis:
[ ]
21 2 1 1 ˆ σ λ + + =
∑
= p j j j f h n yMSE , (20)
j
j f v
h =X T disebut skor X f pada vj.
Persamaan (20) menjelaskan bahwa besaran MSE(yˆf )tidak hanya
tergantung pada besaran akar ciri, tetapi juga tergantung pada skor X f pada
vektor ciri vj.
2.6.Wavelet
Wavelet berarti gelombang-gelombang kecil (small waves), sedangkan sinus dan kosinus adalah gelombang-gelombang besar (Percival 2005). Suatu fungsi
) . (
1.
∫
∞
∞ −
=1 )
(
2 u du
ψ (21)
2.
∫
∞
∞ −
=0 )
(u du
ψ . (22)
Sehingga secara umum Wavelet adalah fungsi-fungsi yang mempunyai sifat-sifat tertentu, seperti jika diintegralkan pada
(
−∞,∞)
hasilnya nol, grafik fungsiada yang di atas dan di bawah sumbu X (Vidacovic dan Meuller 1991). Ada banyak jenis fungsi wavelet, seperti wavelet yang mulus, wavelet yang nilainya tidak nol secara terbatas (compact support), wavelet yang ekspresi matematikanya sederhana, wavelet yang dihasilkan dari filter-filter yang sederhana, dan lain-lain. Fungsi wavelet yang paling sederhana dan paling tua adalah wavelet Haar, yang ditemukan oleh Alferd Haar tahun 1909 (Vidacovic dan Meuller 1991). Beberapa bentuk wavelet dari keluarga Daubechies, yang termasuk wavelet compact
support, dapat dilihat pada Gambar 4 dan Gambar 5.
Wavelet Picture
Haar waveletx
psi
0.0 0.2 0.4 0.6 0.8 1.0
-1.0
-0.5
0.0
0.5
1.0
Wavelet Picture
Daub cmpct on ext. phase N=2x
psi
-1 0 1 2 3
-1.0 -0.5 0.0 0.5 1.0 1.5
Wavelet Picture (Enhanced)
Daub cmpct on ext. phase N=3x
psi
-1.0 -0.5 0.0 0.5 1.0 1.5
-1.0 -0.5 0.0 0.5 1.0 1.5
Wavelet Picture (Enhanced)
Daub cmpct on ext. phase N=4 x p s i
-1 0 1 2
- 1 . 0 - 0 . 5 0 . 0 0 . 5 1 . 0
Wavelet Picture (Enhanced)
Daub cmpct on ext. phase N=5x
psi
-2 -1 0 1 2
-1.0
-0.5
0.0
0.5
1.0
Gambar 5 Bentuk-bentuk keluarga wavelet Daubechies (D-2, D-3, D-4 dan D-5)
Jika ada fungsi wavelet ψ(t), yang disebut mother wavelet, maka dapat
dibangkitkan sekumpulan fungsi lain, yang akan menjadi fungsi basis dalam suatu
ruang fungsi L2(R)(ruang dari semua fungsi yang terintegralkan), dengan cara
translasi dan dilatasi dari ψ(t). Fungsi-fungsi basis tersebut secara umum ditulis :
∈
− a b R+xR
a b t ) , ( ,
ψ . (23)
Dengan mengambil nilai a = 2-j dan b = k 2-j, k,j ∈ Z, maka akan diperoleh sekumpulan fungsi basis yang saling ortogonal, artinya grafiknya tidak saling tumpang tindih.
Sebagai misal, ekspresi matematika dari mother wavelet Haar adalah :
< ≤ − < ≤ = selainnya t t t , 0 1 , 1 0 , 1 )
( 21 2
1
ψ (24)
Perhatikan bentuk fungsi basis ortogonal yang diperoleh dengan cara dilatasi dan translasi dari fungsi mother wavelet ψ(t),
) 2 ( ) ( ) (
, t konst t k
j k
j = ψ −
ψ , (25)
maka untuk memperoleh fungsi basis yang ortonormal, besarnya konstanta harus sama dengan 2 j/2. Hal ini merupakan konsekuensi dari ψj,k(t) yang ortogonal,
sehingga
1=(konst)2
∫
ψ2(2jt−k)dt= −j
∫
= −jkonst du
u
konst) 2 ( ) ( ) 2
( 2 ψ2 2 .
Jadi konstanta sama dengan 2 j/2 .
Dengan demikian bentuk fungsi basis yang ortonormal adalah :
() 2 /2 (2 )
,k t j jt k
j = ψ −
ψ . (26)
Fungsi basis pada persamaan (26) adalah fungsi basis ortonormal pada
ruang L2(R), yaitu ruang dari semua fungsi yang terin tegralkan kudrat
(
∫
f2(t)dt <∞). Sehingga secara formal, jika f(t)∈L2(R), maka f(t) dapatdidekomposisi atau direpresentasikan sebagai kombinasi linear dari fungsi-fungsi basis yang ortonormal (Antoniadis et al. 2001).
Di dalam analisis wavelet, selain fungsi ψ(t), dikenal juga fungsi lain yang
berkaitan dengan ψ(t), yang disebut fungsi father wavelet φ(t). Fungsi ini juga
dapat membangkitkan fungsi basis ortonormal yang menyusun ruang L2(R).
Sehingga secara lebih umum fungsi basis dalam L2(R), dapat berbentuk :
{
φjo,k ,ψj,k , j≥ jo ,k∈Z}
, (27) )( 0 , 0 t
φ disebut fungsi skala, yang berhubungan dengan ψj,k(t). Himpunan
{
φjo,k ,k∈Z}
akan membentuk anak ruang yang sama seperti{
ψj,k , j≥ jo ,k∈Z}
. Untuk Haar wavelet bentuk dari φ0,0(t)yang biasa ditulis) (t
φ , adalah :
≤ < =
. ,
0
1 0 , 1 ) (
selainnya t t
Dimana hubungannya dengan ψ(t) dapat ditunjukkan sebagai
) 1 2 ( ) 2 ( )
(t =φ t −φ t−
ψ .
Fungsi skala atau father wavelet ,φ, adalah penyelesaian dari persamaan :
=
∑
−k
k t k
h
t) 2 (2 )
( φ
φ . (29)
Fungsi φ(t)dapat membangkitkan suatu keluarga ortonormal L2
( )
R ,jk =2j2 (2jt−k), j,k∈Z
, φ
φ . (30)
Motherwaveletψ dapat diperoleh dari fungsi skala φ melalui persamaan :
∑
−=
k
k t k
g
t) 2 (2 )
( φ
ψ , (31)
dimana
( )
k kk h
g = −1 1− (Vidacovic dan Meuller 1991).
Dari persamaan (29) hk merupakan sederetan bilangan yang mentransformasi
suatu fungsi menjadi fungsi lain tanpa merubah bentuknya secara prinsip, hanya
fungsi tersebut digeser atau diperkecil. Seda ngkan gk pada persamaan (31) akan
mentransformasi fungsi menjadi fungsi lain yang bentuk prinsipnya berubah.
Sehingga hkdan gkdisebut koefisien-koefisien dari low pass dan high pass filters.
Koefisien-koefisien ini digunakan untuk perhitungan dari transformasi wavelet diskret. Koefisien-koefisien tersebut diberikan oleh (Morettin 1997) :
∫
∞∞
− −
= t t k dt
hk 2 φ()φ(2 )
∫
∞∞
− −
= t t k dt
gk 2 ψ()φ(2 ) .
Berdasarkan fungsi basis (27), untuk f(t)∈L2(R), maka f(t) dapat
didekomposisi menjadi :
∑
∑ ∑
≥
+ =
k j jo k
k j k j k
jo k
jo t d t
c t
f( ) , φ , () , ψ , (). (32)
Karena fungsi basis saling ortonormal, maka koefisien-koefisien pada persamaan (32) dapat dihitung dengan (Morettin 1997) :
∫
∞
∞ −
∫
∞
∞ −
= f t t dt dj,k ( )ψj,k() .
2.6.1. Transformasi Wavelet Diskret (TWD)
Di dalam statistika biasanya ingin diperoleh dekomposisi wavelet dari suatu
fungsi yang diamati pada sekumpulan data. Misalkan T M
x x x
x=( 0 , 1,..., 2 −1) adalah vektor data berukuran 2M,
M bilangan bulat positif. Maka vektor data
tersebut dapat dihubungkan dengan potongan-potongan fungsi konstan pada interval [0,1) yang biasa disebut fungsi tangga, dengan persamaan :
{
}
∑
−= ≤ <
+ =2 1
0 2 ) 1 ( 2 ) ( M M k M k k t k I x t
f . (33)
Fungsi tangga f(t) pada persamaan (33) termasuk dalam L2([0,1]), sehingga
dekomposisi wavelet dari f(t) adalah (Vidacovic dan Meuller 1991) :
∑ ∑
− = − = + = 1 0 1 2 0 , , 0 ,0 () ()
) ( M j k k j k j j t d t c t
f φ ψ . (34)
Persamaan (34) disebut transformasi wavelet diskret, karena nilai j hanya diambil pada bilangan bulat positif saja. Bilangan j pada persamaan (34) disebut level resolusi, dan f(t) dapat diperoleh secara tepat, jika diambil semua level resolusi untuk dekomposisi, yaitu level resolusi 0 sampai dengan (M-1). Koefisien c0,0 disebut koefisien pemulusan atau bagian pendekatan dari suatu fungsi, sedang
dj,k disebut koefisien wavelet atau juga disebut bagian detail suatu fungsi.
Dengan mengambil nilai ψj,k(t) dan φ(t) untuk berbagai t, maka persamaan (34)
dapat dituliskan dengan notasi matriks,
x=W T d (35)
dan karena W ortonormal (bukti lihat Percival 2005) maka
d =W x (36)
dimana T
n d d d d c
d =( 0,0 , 0,0 , 1,1, 1,0 ,..., −1,0) dan T
W adalah matriks yang
elemen-elemen kolomnya adalah nilai dari φ(t) dan ψj,k(t) untuk berbagai t
[ ]
0,1∈ . Sifat-sifat menarik dari matriks T
W , selain ortonormal, adalah kolom
Contoh bentuk matriks T
W dari Haar wavelet untuk 2M =8 adalah :
0.353553 0.707107 0.000000 0.000000 0.000000 0.5 0.0 0.353553 0.353553 -0.707107 0.0 00000 0.000000 0.000000 0.5 0.0 0.353553 0.353553 0.000000 0.707107 0.000000 0.000000 -0.5 0.0 0.353553 0.353553 0.000000 -0.707107 0.000000 0.000000 -0.5 0.0 0.353553 0.353553 0.000000 0.000000 0.707107 0.000000 0.0 0.5 -0.353553 0.353553 0.000000 0.000000 -0.707107 0.000000 0.0 0.5 -0.353553 0.353553 0.000000 0.000000 0.000000 0.707107 0.0 -0.5 -0.353553 0.353553 0.000000 0.000000 0.000000 -0.707107 0.0 -0.5 -0.353553
Jika ukuran vektor data x sangat besar, maka perhitungan dengan cara
matriks akan memerlukan komputasi yang tinggi, sehingga menjadi kurang praktis. Mallat (1989) menemukan algoritma cepat untuk menghitung koefisien
wavelet dan koefisien pemulusan pada persamaan (34), yaitu melalui analisis multiresolusi. Algoritmanya disebut algoritma piramida.
Dalam analisis multiresolusi hubungan antara φ(t) dan ψ(t) dapat
dinyatakan sebagai :
∑
−=
k
k t k
h
t) 2 (2 )
( φ
φ dan =
∑
−k
k t k
g
t) 2 (2 )
( φ
ψ (37)
k
h dan gk disebut filter low-pass dan high pass, dan hubungannya untuk k = 0, 1,
..., L-1 adalah L k k k h
g =(−1) −1− (Percival 2005).
Sebagai misal untuk Haar wavele t dapat ditunjukkan bahwa :
) 1 2 ( 2 2 1 ) 2 ( 2 2 1 ) 1 2 ( ) 2 ( )
(t =φ t +φ t− = φ t + φ t− φ ) 1 2 ( 2 2 1 ) 2 ( 2 2 1 ) 1 2 ( ) 2 ( )
(t =φ t −φ t− = φ t − φ t− ψ Sehingga 2 1 ) 1 ( ) 0
( =h =
h dan
2 1 ) 1 ( ) 0
( =− g =
g .
2.6.2.Periodisasi Barisan Bilangan Sepanjang N
Jika
{ }
at adalah barisan bilangan, maka periodisasi{ }
at sepanjang Nyang dinotasikan
{ }
o ta dilakukan dengan langkah-langkah sebagai berikut
• Potong
{ }
at ke dalam barisan berhingga sepanjang Na0 ,a1,...,aN−1,aN ,aN+1,...,a2N−1,... (38)
blok n = 0 blok n = 1
• Tambahkan elemen barisan berhingga dengan cara a0 , a1 , ... , aN−1
+ + ... +
aN , aN+1 , ... , a2N−1 (39)
+ + ... + ... ... ... ...
Hasil : o
N o
a a
a 1 1
0
0 , , ... , −
2.6.3. Diskripsi Algoritma Piramida Secara Matriks
Jika ada x = (x0 , x1 , ... , xp-1 )T, dan diasumsikan
M
p =2 , M bilangan bulat
positif maka langkah-langkah dalam algoritma piramida untuk memperoleh matriks transformasi wavelet diskret, dapat dideskripsikan sebagai berikut :
1. Misalkan ada sekumpulan barisan bilangan
{ }
hk sepanjang L , yangdalam istilah algoritma piramida disebut low-pass filters atau disebut juga
filter skala. Maka dapat dicari sekumpulan barisan bilangan lain
{ }
gkyang disebut high-pass filters, dengan aturan korespondensi satu-satu (Percival 2005) :
L k k
k h
g =(−1) −1− . (40)
Yang berarti
{ }
gk diperoleh dari{ }
hk dengan membalik urutannya dantanda positif diganti negatif dan sebaliknya pada urutan genap, misalnya
{ }
hk ={
h0 ,h1,h2 ,h3}
maka{ }
gk ={
h3,−h2 ,h1,−h0}
.2. Bentuk matrik Bj berukuran j M
p x p
j
j 2 , 1,2,...,
2 1 =
− dengan
baris-baris dari Bj merupakan
{ }
gk yang diperiodekan sepanjang 2j−1Misalkan
{ }
o kg hasil periodisasi
{ }
gk sepanjang 2j−1p
yang dikalikan
-1 pada tiap elemennya, maka baris ke nol dari Bj adalah :
= − − − − o o o o o p o p o o T g g g g g g g g b j j 2 3 4 5 2 2 1 2 0 1 .
0 , , , ,..., , , ,
1 1
,
baris ke satu dari Bj adalah :
= − − − − o o o p o p o o o o T g g g g g g g g b j j 4 5 2 2 1 2 0 1 2 3 .
1 , , , , , ,..., ,
1 1
,
sampai baris ke 1 2 − p
dari Bj adalah :
= − − − − − o o o o o o o p o p T
p g g g g g g g g
b j j 0 1 2 3 4 5 2 2 1 2 . 1 2 , , , , , , ... , , 1 1
Baris ke satu diperoleh dari baris ke nol dengan menggeser dua satuan ke kanan, demikian seterusnya untuk memperoleh baris-baris berikutnya dari
Bj.
3. Dengan cara yang sama seperti membentuk matriks Bj, maka bentuk
matriks Aj berukuran j M
p x p
j
j 2 , 1,2,...,
2 1 =
− dengan baris-baris dari
Aj merupakan
{ }
hk yang diperiodekan sepanjang 2j−1p .
= = − − − 1 1 1 1 1 1 1 2 3 4 1 2 3 1 2 1 4 3 2 1 ... ... . . . ... . . . . . . . . . A A A A A