BAB IV
KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA
n<<p DAN TERDAPAT KEKOLINEARAN-GANDA
A. PendahuluanPada pendugaan model kalibrasi peubah ganda, sering timbul masalah kekolinieran ganda. Kekolinieran ganda ditandai dengan adanya korelasi antar peubah-peubah bebasnya. Solusi untuk melakukan pendugaan parameter dengan data berkorelasi diantaranya dapat digunakan Analisis Komponen Utama, Regresi Kuadrat Terkecil Parsial, Regresi atas Koefisien Fourier, Jaringan Syaraf Tiruan dan Pendekatan Bayes (Notodiputro 2003).
Menurut penelitian yang telah dilakukan sebelumnya dengan membandingkan metode yang disebutkan di atas ternyata pendekatan Bayes mempunyai hasil yang lebih baik dibanding dengan metode lain dalam pendugaan parameter (du Plessis (1995); Wigena dan Aunuddin (1998); West (2003); Rahayu (2003); Notodiputro (2003)). Hal ini dikarenakan dalam pendekatan Bayes ditambahkan informasi tambahan terhadap model yang dibangun, informasi tambahan ini disebut dengan informasi prior. Penelitian yang dilakukan oleh Rahayu (2003) menunjukkan pemilihan penggunaan sebaran prior sangat berpengaruh terhadap hasil dugaan. Oleh karena itu diperlukan ketepatan pemilihan prior agar model mempunyai tingkat keakuratan yang tinggi.
B. Tujuan
Penelitian ini dilakukan dengan tujuan untuk mengkaji penerapan pendekatan Bayes non hirarki dan Bayes berhirarki untuk pembentukan model kalibrasi pada kondisi data yang berkorelasi.
C. Tinjauan Pustaka Metode Simulasi
Simulasi adalah suatu model matematika yang dapat menerangkan perilaku suatu sistem dari waktu ke waktu. Metode simulasi dapat memberikan efisiensi dan kemudahan dalam menganalisis suatu model matematika. Simulasi berbasis komputer saat ini lebih banyak diterapkan dalam penelitian-penelitian dibandingkan dengan simulasi secara manual (Watson & Blackstone 1989).
WinBUGS
WinBUGS merupakan suatu perangkat lunak yang berbasis Windows yang digunakan untuk analisis statistika dengan metode bayes. Software ini menggunakan Markov Chain Monte Carlo (MCMC) untuk menemukan sebaran posteriornya (Spiegelhater et al 2002). Pada penggunaan program WinBUGS perlu dituliskan nilai awal untuk parameter, terutama parameter ragam. Hal ini dikarenakan software WinBUGS dapat memberikan nilai default negatif untuk nilai awal parameter ragamnya (Anonim, 2004).
Kriteria Kebaikan Model
Menurut Mattjik dan Sumertajaya (2002) kriteria untuk melihat keterandalan model antara lain adalah Jumlah Kuadrat Galat (JKG) dan Koefisien Determinasi (R2). Model yang baik mempunyai JKG yang kecil dan R2 yang besar. Rumus untuk mencari R2 adalah sebagai berikut:
JKT JKG JKT JKR R2 = =1− di mana :
JKR = Jumlah Kuadrat Regresi JKT = Jumlah Kuadrat Total
Ukuran kebaikan model lainnya yang dapat digunakan antara lain adalah akar kuadrat tengah galat (RMSE = Root Mean Square Error). Model dikatakan baik jika memiliki nilai RMSE yang kecil (Naes et al. 2002). Rumusan RMSE dapat dituliskan dalam persamaan berikut:
RMSE = MSE = E
(
yˆ−y)
2
MSE adalah Mean Square Error (Kuadrat Tengah Galat / KTG).
D. Bahan dan Metode
Data yang digunakan dalam penelitian ini merupakan data simulasi atau data bangkitan. Data hasil bangkitan berupa data peubah Y dan peubah X, dimana peubah Y merupakan fungsi dari peubah X. Fungsi peubah Y adalah sebagai berikut:
Y = f(X1, X2, X3, …, Xp)
Dalam penelitian ini, pembangkitan nilai data Y mengikuti interval data senyawa gingerol pada jahe dengan kisaran nilai antara 0.4 sampai dengan 3.1. Sedangkan peubah X yang dibangkitkan, nilainya mengikuti kisaran nilai %transmitan. Nilai peubah X berkisar antara 0 sampai dengan 100 dan peubah-peubah X dalam matriks data X tersebut dikondisikan saling berkorelasi. Korelasi yang dicobakan adalah 0.1, 0.3, 0.5, 0.7, 0.8, 0.9, 0.95, 0.98. Sedangkan kombinasi jumlah pengamatan (n) dan jumlah peubah (p) dalam matriks data X tersaji pada Tabel 4.
Tabel 4 Kombinasi n dan p yang dicobakan n
10 20 35 50
Alur kerja yang dilakukan dalam penelitian ini adalah sebagai berikut: Tahapan Simulasi Data
1. Pembangkitan * ( 1, 2,..., )
p
nxp x x x
X = ~ N(µ, Σ), dengan korelasi antar peubah tinggi dengan langkah-langkah sebagai berikut:
1.1. Membangkitkan matriks korelasi R
= pp p p p p r r r r r r r r r R ... ... ... ... ... ... ... 2 1 2 22 21 1 12 11
Matriks R dicobakan pada beberapa kondisi yaitu: rij∼ Uniform (0.75, 0.85)
rij∼ Uniform (0.85, 0.95) rij∼ Uniform (0.95, 1)
rij∼ Uniform (0.96, 1), i = 1, 2, ....p dan j = 1, 2, ....p
Untuk setiap gugus r, dibangkitkan data berdasarkan p maks (p=150 buah). Jumlah data yang dibangkitkan untuk setiap gugus: 0.5(p-1)p = 11.175 buah
1.2. Membangkitkan matriks Xnxp = (x1, x2, ..., xp)∼ N(µ, Iσ2), untuk berbagai nilai n dan p seperti tertera pada tabel 4 (contoh yang digunakan µ=0 dan
σ2=9). Struktur data hasil tahap 1.1 dan 1.2 tersaji pada tabel 5.
1.3. Menyusun Matriks peragam Σ dengan menggunakan hasil yang diperoleh pada 1.1. dan 1.2. σij2 =rijσiσj,
1.4. Dengan menggunakan SVD dekomposisi Σ menjadi L’L
Σ = ADF, Apxn, A'A = I
D = Diagonal (d1, d2, ..., dn), d1≥d2≥ ...≥dn≥0 Fnxn,F'F=FF'=I
= AD1D1F, D = 2 1
D
= L'L Catatan : Untuk matriks yang simetrik A = F. 1.5. Hitung :X*=XS*L, S*=Diag p σ σ σ 1 ,..., 1 , 1 2 1
2.1. Tetapkan β
2.2. Hitung E(y) = Xβ
2.3. Bangkitkan ε (contoh yang digunakan ε∼ N(0, σ=2)) 2.4. Hitung nilai pengamatan y = E(y)+ ε
3. Transformasi Y dan X sehingga interval data yang digunakan sesuai dengan sesungguhnya. Bentuk transformasi data tersaji pada Tabel 6.
Tabel 5 Struktrur data simulasi
r n p #unsur segitiga R r n p #unsur segitiga R
12 66 12 66 50 1225 50 1225 100 4950 100 4950 10 150 11175 10 150 11175 25 300 25 300 50 1225 50 1225 100 4950 100 4950 20 150 11175 20 150 11175 40 780 40 780 80 3160 80 3160 100 4950 100 4950 35 150 11175 35 150 11175 60 1770 60 1770 100 4950 100 4950 0.8 50 150 11175 0.95 50 150 11175 12 66 12 66 50 1225 50 1225 100 4950 100 4950 10 150 11175 10 150 11175 25 300 25 300 50 1225 50 1225 100 4950 100 4950 20 150 11175 20 150 11175 40 780 40 780 80 3160 80 3160 100 4950 100 4950 35 150 11175 35 150 11175 60 1770 60 1770 100 4950 100 4950 0.9 50 150 11175 0.98 50 150 11175
Tabel 6 Transformasi data Y dan X P
eubah enyawa S aktif
Kisa
ran Nilai Artinya Transformasi Rumusan G
ingerol % - 3.1% 0.4 gingerol dalam 100 gr 0.4 gr – 3.1 gr jahe ( Y maks Y Y Y . * Y 3.1 0 min min 4 0 − − − + = Y K
urkumin % - 3.0% 0.6 kurkumin dalam 100 gr 0.6 gr – 3.0 gr temulawak ( Y maks Y Y Y . * Y 3 06 min min 6 0 − − − + = X (0% - 100%) transmitan ( X maks X X X * X 100 0 min min 0 − − − + =
Tahapan Penyusunan Model Kalibrasi
Model kalibrasi dibangun dengan pendekatan Bayes non hirarki dan Bayes hirarki. Pendekatan Bayes non hirarki yang dicobakan yaitu:
y ∼ N(Xβ , σ2),
y adalah vektor berukuran nx1, X adalah matriks berukuran nxp dan β adalah vektor berukuran px1, beberapa sebaran prior β yang dicobakan dirumuskan dalam model dibawah ini:
a. Model I : Prior β ~ N (0, 0.001) b. Model II : Prior β = 1/ó
c. Model III : Prior β ~ Gamma (2,5) d. Model IV : Prior β ~ Eksponensial (1)
Pada model I, III dan IV βi, i = 1, 2, ..., p bersifat saling bebas dan identik. Pada keseluruhan model dicobakan beberapa kemungkinan nilai awal bagi ragam (σ2) yaitu : 1, 10, 50, 100.
Pendekatan Bayes hirarki dilakukan berdasarkan pertimbangan pendapat Roy (1998) yang menyatakan bahwa penyusunan model pada proses biologi umumnya baik bila menggunakan pendekatan Bayes berhirarki. Hal ini didukung dengan hasil penelitian Rahayu (2003) bahwa untuk model kalibrasi pada spektroskopi dengan menggunakan pendekatan Bayes, model berhirarki lebih baik digunakan dibandingkan model non hirarki. Beberapa model Pendekatan Bayes berhirarki yang digunakan dalam penelitian ini adalah:
Y ∼ N(Xβ , σ2)
Beberapa sebaran prior β yang dicobakan dirumuskan dalam model dibawah ini:
a. Model V : β berhirarki dan σ konstan b. Model VI : β berhirarki dan σ acak c. Model VII : β berhirarki, σ berhirarki.
Pada perilaku β berhirarki, dicobakan berbagai kemungkinan kombinasi sebaran prior dan hiperprior, yaitu sebaran Normal, Eksponensial dan Gamma. Sehingga akan dapat diketahui model pendekatan yang relatif tidak dipengaruhi oleh penetapan sebaran awal β atau bersifat robust. Pemilihan bentuk sebaran prior dan hiperprior ditentukan secara subyektif, dengan anggapan keseluruhan sebaran yang dipilih telah mewakili bentuk sebaran keluarga eksponensial. Pada keseluruhan model juga dicobakan berbagai kondisi penetapan nilai awal σ2.
Ketepatan model yang dihasilkan dilihat dari beberapa kriteria yaitu besaran nilai Jumlah Kuadrat Galat (JKG) dan Root Mean Square Error (RMSE). Perangkat lunak yang digunakan adalah Winbugs14.
E. Hasil dan Pembahasan
Setiap matriks data X bangkitan mempunyai nilai korelasi antar peubah yang tertentu. Tabel 7 merupakan contoh yang menunjukkan korelasi antar peubah bebas dimana korelasi yang dicobakan adalah 0.1 dengan kombinasi jumlah pengamatan (n) 50 dan jumlah pebah bebas (p) 150. Pada tabel 7 hanya ditampilkan sebagian saja korelasi antar peubah, hasil dari pembangkitan matriks data X.
Pendekatan bayes dengan model I, II, III, IV menggunakan nilai awal parameter ragam yang nilainya ditetapkan secara subjektif. Nilai awal ragam yang digunakan adalah 1, 10, 50, 100. Sedangkan nilai awal parameter beta yang digunakan merupakan nilai default yang diberikan oleh software WinBUGS 1.4 versi beta. Jumlah iterasi dengan simulasi MCMC yang dilakukan oleh software WinBUGS 1.4 versi beta adalah 1000 kali. Alasan pemilihan jumlah iterasi sebanyak 1000 kali adalah untuk kemudahan, karena proses iterasi untuk matriks data dengan ukuran n dan p yang besar memerlukan waktu yang lama dalam
proses iterasinya. Doodle dan contoh program yang digunakan untuk setiap model disajikan pada Lampiran 1 sampai dengan Lampiran 14.
Tabel 7 Nilai korelasi antar peubah bebas.n=50, p=100, E(r)=0.1 x1 x2 x3 x4 x5 x6 x2 -0.310 x3 -0.040 0.243 -x4 -0.052 0.042 0.033 x5 0.248 0.044 - 0.067 - 0.020 x6 0.042 0.113 0.060 0.016 - 0.181 ….. ….. ….. ….. ….. ….. ….. x150 -0.108 0.006 0.031 0.157 - 0.197 0.092
Pendekatan Bayes dengan Model I
Model I merupakan model pendekatan bayes dengan menggunakan prior
βi~N(0, 0.001). Tabel Lampiran 1 merupakan hasil dari pengolahan data dengan model I. Pada matriks data 10x12 dapat dilihat bahwa peningkatan nilai awal menyebabkan nilai JKG dan nilai RMSE menurun. Sebagai contoh data pada korelasi 0.1 untuk n=10 dan p=12, pada nilai awal 1 nilai JKG sebesar 6.114 dan nilai RMSE sebesar 0.782. Saat nilai awal sebesar 100 nilai JKG mnurun menjadi 0.061 dan nilai RMSE menurun menjadi sebesar 0.078. Jika dilihat lebih jauh perubahan nilai JKG dan RMSE pada nilai awal 1 ke nilai awal 10 lebih besar dibandingkan perubahan nilai JKG dan RMSE dari nilai awal 50 ke 100.
Bila dilihat dari nilai korelasi yang dicobakan pada matriks data 10x12 perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi sangatlah kecil. Pada nilai awal 100 untuk semua nilai korelasi, nilai RMSE masih cenderung sama.
Ketika jumlah peubah bebas dinaikkan menjadi 50 dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal. Perubahan nilai JKG dan RMSE pada nilai awal 1 ke 10 masih lebih besar dibanding dengan perubahan nilai JKG dan RMSE pada nilai awal 50 ke nilai awal 100. Perilaku seperti di atas berlaku untuk semua matriks data. Kecenderungan kenaikan nilai JKG dan RMSE terjadi pada matriks data dengan nilai korelasi yang tinggi.
0 1 2 3 1 2 3 y p en g amatan y du ga an
Secara umum pada n=10 dengan p=100 dan p=150 masih memiliki sifat yang sama dengan p=12 dan p=50. Peningkatan nilai awal menyebabkan nilai JKG dan RMSE menurun. Persentase perubahan nilai JKG dan RMSE dari nilai awal 1 ke nilai awal 10 lebih besar daripada perubahan nilai JKG dan RMSE pada nilai awal 50 ke nilai awal 100. Nilai ketepatan model pada p=100 dan p=150 cenderung menurun pada saat nilai korelasi datanya tinggi.
Penambahan jumlah peubah bebas pada n=10 dengan berbagai kombinasi besaran korelasi yang dicobakan, belum menunjukkan suatu pola tertentu. Hal ini dapat dilihat pada matriks data dengan korelasi yang sama, nilai JKG dan RMSE mengalami peningkatan saat jumlah peubah bebasnya bertambah menjadi 50, tetapi nilai JKG dan RMSE kembali menurun saat jumlah peubah bebasnya 100 dan kemudian meningkat kembali saat jumlah peubah bebasnya 150.
Perilaku JKG dan RMSE untuk ukuran matriks data yang lebih besar masih sama dengan matriks data sebelumnya. Nilai JKG dan RMSE menurun seiring peningkatan nilai awal. Perubahan nilai JKG dan RMSE pada nilai awal 1 ke 10 lebih besar dari pada perubahan nilai JKG dan RMSE pada nilai awal 50 ke 100.
Untuk keseluruhan n dan p yang dicobakan, besaran JKG dan RMSE dengan model I sangat dipengaruhi oleh nilai awal. Semakin besar nilai awalnya nilai JKG dan RMSE semakin kecil. Peningkatan nilai korelasi merubah nilai JKG dan RMSE. Semakin tinggi nilai korelasi antar peubah bebasnya nilai JKG dan RMSE cenderung mengalami kenaikan. Pada n kecil dan n besar kenaikan jumlah peubah bebas merubah nilai JKG dan RMSE, tetapi secara umum belum bisa dikatakan bahwa perubahan ketepatan modelnya membentuk suatu pola ketelitian yang menurun.
Gambar 12 Plot antara Y dugaan dan Y pengamatan,n=50, p=150, r=0.7, Nilai awal 100 prior βi ~ N (0, 0.001).
Secara umum nilai ketepatan model I untuk semua ukuran matriks sangat tinggi saat nilai awalnya 100. Gambar 12 merupakan contoh plot antara y dugaan dengan y pengamatan pada matriks data n=50, p=150, r=0.7 pada nilai awal 100. Dari Gambar 12 tersebut dapat dilihat tebaran data berada disekitar garis lurus. Hal ini mengindikasikan bahwa nilai dugaan mendekati nilai pengamatan yang sesungguhnya.
Pendekatan Bayes dengan Model II
Informasi tambahan yang digunakan dalam model ini adalah prior konstan, prior βi = 1/ó. Pada Tabel Lampiran 2 ditampilkan hasil pengolahan data dengan model II untuk matriks data X dengan beberapa kombinasi peubah bebas dan kombinasi jumlah pengamatan.
Pada matriks data 10x12 dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal. Sebagai contoh data pada korelasi 0.1 untuk n=10, p=12, pada nilai awal 1 nilai JKG sebesar 5.127 dan RMSE sebesar 0.716. Saat nilai awal sebesar 100 nilai JKG adalah 0.051 dan nilai RMSE sebesar 0.05.
Masih dalam besaran korelasi dan ukuran matriks data yang sama jika dilihat lebih jauh perubahan nilai JKG dan RMSE pada nilai awal 1 ke nilai awal 10 lebih besar dibandingkan dengan perubahan JKG dan RMSE dari nilai awal 50 ke nilai awal 100. Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Semakin tinggi nilai korelasi, nilai ketepatan model semakin menurun. Penurunan yang besar terjadi pada data yang mempunyai korelasi tinggi. Sebagai contoh pada nilai korelasi 0.8 ke nilai korelasi 0.9 dengan nilai awal 100, RMSE nilainya menaik dari 0.291 menjadi 0.615. Demikian pula halnya dengan nilai ketelitian pada korelasi 0.95 dan 0.98.
Pada n yang sama, jika jumlah peubah bebas dinaikkan, nilai JKG dan RMSE menurun seiring meningkatnya nilai awal. Perubahan nilai JKG dan
0 1 2 3 1 2 3 y pengamatan y du ga an
RMSE pada nilai awal 1 ke 10 lebih besar daripada perubahan nilai JKG pada nilai awal 50 ke 100 pada korelasi data sebesar 0.1. Kecenderungan perilaku serupa juga terjadi pada tujuh korelasi lainnya. Pada matriks data n=10 pada korelasi yang sama dan kombinasi p berbeda, nilai JKG dan RMSE mengalami perubahan tetapi tidak menunjukkan suatu pola ketepatan model yang menurun.
Perilaku JKG dan RMSE untuk kombinasi n dan p lainnya secara keseluruhan sama. Pada model II besaran JKG dan RMSE, sangat dipengaruhi oleh nilai awal. Semakin besar nilai awalnya nilai ketepatan model semakin besar. Peningkatan nilai korelasi pada matriks data yang mempunyai jumlah peubah bebas dan jumlah pengamatan yang sama ketepatan modelnya cenderung mengalami penurunan. Peningkatan jumlah peubah bebas merubah nilai JKG dan RMSE, tetapi secara umum belum dapat dikatakan bahwa perubahannya membentuk suatu pola menurun.
Gambar 13 Plot antara Y dugaan dan Y pengamatan, n=10, p=100, r=0.1, nilai awal 100 prior βi = 1/ó.
Nilai ketepatan model pada model II secara umum masih tinggi pada berbagai kombinasi jumlah peubah bebas dan pengamatan pada tingkat korelasi yang rendah. Nilai ketepatan model untuk nilai korelasi yang tinggi cenderung lebih rendah. Gambar 13 adalah contoh plot antara y dugaan dan y pengamatan pada matriks data n=10 dan p=100 dengan korelasi 0.1 pada nilai awal 100. Dari Gambar 13 tersebut nampak bahwa tebaran data berada disekitar garis lurus. Hal ini mengindikasikan bahwa nilai y dugaan mendekati nilai y pengamatan yang sesungguhnya
Pendekatan Bayes dengan Model III
Pada model III informasi tambahan yang digunakan berasal dari sebaran Gamma (2,5). Tabel Lampiran 3 menampilkan hasil analisis data dengan model III untuk semua kombinasi n dan p. Pada matriks data 10x12 untuk setiap korelasi, dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal.
Nilai ketepatan model III pada matriks data 10x12 sangat rendah dibandingkan dengan model I dan II. Sebagai contoh data pada korelasi 0.1 untuk n=10 dan p=12 nilai RMSE sebesar 1.255 pada nilai awal 100. Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi dilihat dari delapan nilai korelasi yang dicobakan pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Jika jumlah peubah bebasnya dinaikkan menjadi 50 dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal.
Matriks data n=10 untuk p=100 dan p=150 secara umum masih memiliki sifat yang sama seperti matriks data dengan p=12 dan p=50 dalam hal pengaruh nilai awal. Pada semua kombinasi peubah bebas yang dicobakan dengan jumlah pengamatan yang sama yaitu n=10, nilai ketepatan model cenderung mengalami penurunan pada setiap kenaikan korelasi. Penambahan jumlah peubah bebas menyebabkan nilai JKG dan RMSE mengalami kenaikan.
Secara keseluruhan dapat dikatakan bahwa pendekatan bayes dengan model III mempunyai nilai ketepatan model yang rendah. Nilai ketepatan model meningkat seiring dengan bertambahnya nilai awal. Dalam suatu matriks data dengan jumlah n dan p tertentu nilai ketepatannya menurun seiring dengan peningkatan korelasi. Semakin besar jumlah peubah bebasnya nilai ketepatan model cenderung semakin kecil.
Pendekatan Bayes dengan Model IV
Pendekatan bayes dengan model IV menggunakan prior βi ~ Eksponensial (1), Tabel Lampiran 4 menampilkan hasil pengolahan data dengan model IV. Seperti halnya dengan tiga model sebelumnya, untuk matriks data 10x12 pada setiap korelasi, dapat dilihat bahwa nilai JKG dan nilai RMSE menurun seiring dengan meningkatnya nilai awal. Nilai ketepatan dari model dengan model IV pada matriks data 10x12 masih sangat rendah dan kisaran nilainya hampir mirip dengan model III. Sebagai contoh data pada r = 0.3, n=10, p=12 dan saat nilai awal sebesar 100 nilai RMSE yang diperoleh sebesar 1.056.
Perubahan nilai JKG dan RMSE untuk setiap kenaikan korelasi dilihat dari delapan nilai korelasi yang dicobakan pada matriks data 10x12 dapat dikatakan mempunyai kecenderungan menurun. Jika jumlah peubah bebasnya dinaikkan menjadi 50 dan seterusnya, dengan n=10 nilai JKG dan RMSE menurun seiring meningkatnya nilai awal.
Matriks data n=10, p=100 dan n=10, p=150 masih memiliki sifat yang sama seperti matriks data dengan p=12 dan p=50 dalam hal pengaruh nilai awal. Pada semua kombinasi peubah yang dicobakan pada jumlah pengamatan yang sama yaitu n=10, nilai ketepatan model cenderung mengalami penurunan pada setiap kenaikan korelasi. Penambahan jumlah peubah bebas cenderung menyebabkan nilai ketepatan model menjadi semakin rendah.
Pada jumlah pengamatan yang lebih besar perilaku JKG dan RMSE masih sama dengan matriks data sebelumnya. Nilai JKG dan RMSE menurun seiring peningkatan nilai awal. Nilai ketepatan model model IV masih sangat kecil.
Pendekatan bayes dengan model IV secara umum mempunyai nilai ketepatan model yang rendah. Nilai ketepatan model meningkat seiring dengan bertambahnya nilai awal. Pada matriks data dengan jumlah n dan p tertentu nilai ketepatan modelnya menurun seiring dengan peningkatan korelasi. Semakin besar jumlah peubah bebas nilai ketepatan model cenderung semakin rendah.
Pendekatan Bayes dengan Model V, VI dan VII
Pada hasil menggunakan Model I, II, III dan IV terlihat bahwa pada pendekatan Bayes non hirarki memiliki kelemahan bila diterapkan pada struktur data dengan korelasi antar peubah bebas relatif tinggi. Hal ini terlihat pada keseluruhan model yang digunakan dengan menggunakan berbagai prior dan nilai awal, pendekatan Bayes non hirarki memberikan hasil besaran JKG dan RMSE yang cenderung besar dengan meningkatnya besaran korelasi.
Berdasarkan hasil tersebut pada tahap selanjutnya dicobakan pendekatan Bayes hirarki menggunakan data dengan berbagai besaran korelasi antar peubah bebas. Hasil yang diperoleh diharapkan dapat memberi gambaran tentang kemungkinan penggunaan pendekatan Bayes hirarki untuk mengatasi kelemahan pada pendekatan Bayes non Hirarki.
Tabel 8 Nilai JKG dan RMSE pada berbagai besaran n dan p dengan penentuan nilai awal sembarang
Struktur
data Model V Model VI Model VII
n p JKG RMSE JKG RMSE JKG RMSE
12 5538647.45 744.22 0.00 0.01 6.44 0.80 50 5859395.82 765.47 0.00 0.02 9.79 0.99 100 7157435.55 846.02 3.74 0.61 3.74 0.61 10 150 4345047.31 659.17 18.68 1.37 18.68 1.37 25 17929105.26 946.81 15.25 0.87 15.25 0.87 50 26478014.96 1150.61 0.31 0.12 35.01 1.32 100 24848030.50 1114.63 0.15 0.09 16.67 0.91 20 150 25427307.47 1127.55 19.85 1.00 19.85 1.00 40 36105461.01 1015.67 34.37 0.99 34.37 0.99 80 22564860.38 802.94 0.02 0.02 24.41 0.84 100 38102217.35 1043.38 25.41 0.85 25.41 0.85 35 150 35029235.04 1000.42 0.03 0.03 42.26 1.10 60 41126209.49 906.93 38.90 0.88 38.90 0.88 100 40472884.12 899.70 0.43 0.09 47.12 0.97 50 150 58381274.61 1080.57 57.09 1.07 57.09 1.07 Pada data dengan korelasi kecil antara peubah bebas, hasil pengolahan data pada Tabel 8 menunjukkan dengan penentuan nilai awal yang sembarang Model V memberikan hasil RMSE yang relatif tinggi dibandingkan Model VI dan Model VII. Model VI dan Model VII relatif tidak dipengaruhi oleh penentuan nilai awal, hal ini terlihat pada penentuan nilai awal sembarang Model VI dan Model VII
memberikan hasil RMSE yang relatif rendah (lebih kecil dari satu). Model V memberikan hasil RMSEyang relatif sama dengan kondisi penetapan nilai awal sembarang pada penetapan nilai awal mendekati besaran nilai parameter (Tabel 9).
Tabel 9 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan besaran nilai awal mendekati nilai parameter
n p JKG RMSE n p JKG RMSE 12 6435792.0 802.23 35 40 25187680.9 1587.06 50 11037559.2 1050.60 80 37283331.3 1930.89 100 7513819.9 866.82 100 27728635.0 1665.19 10 150 18022260.8 1342.47 150 49467471.8 2224.13 25 20526666.6 1013.08 50 60 40352295.6 1420.43 50 9769753.2 698.92 100 47084955.0 1534.36 100 17057709.1 923.52 150 43761990.1 1479.22 20 150 29644004.8 1217.46
Model VI dan Model VII relatif memberikan hasil RMSE yang relatif rendah (lebih kecil dari satu) pada berbagai kondisi n dan p. Namun bila diperbandingkan berdasarkan besaran RMSE yang diperoleh Model VI relatif lebih baik dibandingkan Model VII. Hal ini dapat dilihat dari besaran RMSE pada Model VI yang relatif lebih kecil dibandingkan dengan Model VII.
Model V relatif dipengaruhi oleh penetapan sebaran prior β, perbedaan penetapan sebaran memberikan hasil JKG dan RMSE yang berbeda (Tabel 10). Pada Model V bila ditetapkan prior beta berdistribusi normal dan hiperprior beta berdistribusi gama diperoleh hasil JKG dan RMSE yang relatif tinggi, hasil yang sama diperoleh jika dicobakan hiperprior beta berdistribusi eksponensial. Model V bila dicobakan prior beta berdistribusi gama atau eksponensial, dan hiperprior beta berdistribusi normal, hasil yang diperoleh relatif sama. Meski demikian prior beta berdistribusi eksponensial memberikan hasil besaran JKG dan RMSE yang relatif tinggi dibandingkan prior beta berdistribusi gama.
Tabel 10 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model V dengan berbagai sebaran prior
β-hirarki, σ-tetap, Prior beta stage-1
normal, Prior beta stage-2 berubah βberubah, Prior beta -hirarki, σ-tetap, Prior beta stage-2 normalstage-1
Struktu r data
gama eksponensial gama eksponensial
n p JKG RMSE JKG RMSE JKG RMSE JKG RMSE
12 7778153 882 7210018 849 5575380 747 7218686 850
50 8983879 948 7725858 879 4923215 702 7530181 868
100 3548539 596 6284027 793 11284712 1062 13557470 1164
10
150 11585814 1076 20697114 1439 16889312 1300 17431092 1320
Tabel 11 menunjukkan Model VI memberikan hasil besaran JKG dan RMSE yang sangat baik untuk berbagai bentuk sebaran prior dan hiperprior yang dicobakan. Nilai JKG dan RMSE yang diperoleh relatif sangat kecil.
Model VII memberikan hasil besaran JKG dan RMSE yang relatif sama untuk nilai besaran n dan p yang sama tanpa dipengaruhi oleh penentuan sebaran prior dan hiperprior. Sebagai contoh untuk n=10 dan p=12, nilai JKG dan RMSE yang diperoleh akan sama pada empat pendekatan yang digunakan (Tabel 12). Tabel 11 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan
Model VI dengan berbagai sebaran prior
β-hirarki, σ-hirarki, Prior beta stage-1
normal, Prior beta stage-2 berubah β-hirarki, berubah, Prior beta σhirarki, Prior beta stage-2 normalstage-1
Struktur
data gama eksponensial gama eksponensial n p JKG RMSE JKG RMSE JKG RMSE JKG RMSE
12 0.520 0.228 0.058 0.076 0.010 0.032 0.006 0.024
50 0.010 0.032 0.004 0.020 0.050 0.071 0.430 0.207
100 0.220 0.148 0.003 0.017 0.010 0.032 0.035 0.059
10
150 0.070 0.084 0.008 0.028 0.010 0.032 0.004 0.019
Tabel 12 Nilai JKG dan RMSE pada berbagai besaran n dan p menggunakan Model VII dengan berbagai sebaran prior
β-hirarki, σ-hirarki, Prior beta stage-1
normal, Prior beta stage-2 berubah β-hirarki, berubah, Prior beta σhirarki, Prior beta stage-2 normalstage-1
Struktur
data gama eksponensial gama eksponensial n p JKG RMSE JKG RMSE JKG RMSE JKG RMSE
12 6.440 0.802 6.436 0.802 6.440 0.802 6.436 0.802
50 9.790 0.989 9.794 0.990 9.790 0.989 9.794 0.990
100 3.740 0.612 3.741 0.612 3.740 0.612 3.741 0.612
10
0 1 2 3 4 0 1 2 3 4 Y-Pengamatan Y -D uga an 0 1 2 3 4 0 1 2 3 4 Y-Pengamatan Y -D ug aa n
Gammbar 14 Model VI, n=10, p=12. Gambar 15 Model VI, n=20, p=100
Tabel 13 Nilai JKG dan RMSE pada Berbagai Besaran n dan p menggunakan Model VI dan VII
Struktur data Model VI Model VII
r n p JKG RMSE JKG RMSE 12 1.796 0.424 1.795 0.424 50 4.544 0.674 4.544 0.674 100 4.009 0.633 4.009 0.633 10 150 4.059 0.637 4.059 0.637 25 1.798 0.424 0.386 0.196 50 2.715 0.521 2.716 0.521 100 3.862 0.621 3.865 0.622 20 150 4.040 0.636 46359.34 68.088 40 9.027 0.950 9.027 0.950 80 5.172 0.719 5.173 0.719 100 6.892 0.830 6.894 0.830 35 150 6.437 0.802 6.44 0.802 60 12.872 1.135 12.871 1.135 100 4.383 0.662 4.076 0.638 0.8 50 150 10.865 1.042 10.864 1.042
Berdasarkan hasil sebelumnya, hanya model VI dan model VII yang dicobakan untuk data simulasi n<<p dan terdapat multikolinear antar peubah. Hasil yang diperoleh model VI memberikan hasil relatif lebih baik dan robust dibandingkan model VII (Tabel 13). Plot hasil antara y-dugaan dan y pengamatan dengan menggunakan Model VI disajikan pada Gambar 14. dan Gambar 15 Pada model VI dan VII nilai koefisien JKG dan RMSE yang diperoleh relatif tidak dipengaruhi oleh besaran koefisien korelasi antar peubah bebas. Pada keseluruhan model tersebut dengan besaran n dan p yang sama diperoleh hasil JKGyang relatif sama pada berbagai besaran koefisien korelasi yang dicobakan (r = 0.8, 0.9, 0.95 dan 0.98).
E. Simpulan
Hasil pengolahan data menggunakan pendekatan Bayes non hirarki ternyata sangat dipengaruhi oleh pemilihan prior â dan nilai awal σ2. Perubahan nilai korelasi data pada matriks data dengan nilai n dan p tertentu berpengaruh terhadap nilai ketelitian pada semua Model. Secara umum pada Model I, II, III dan IV peningkatan nilai korelasi berpengaruh terhadap nilai ketelitian, dimana ketelitian
modelnya mempunyai kecenderungan menurun seiring dengan bertambahnya nilai korelasi.
Pada Model I dan II, untuk semua n yang dicobakan, kenaikan jumlah peubah memberikan pengaruh perubahan terhadap nilai ketelitian tetapi perubahannya belum menunjukkan suatu pola. Untuk Model III dan IV kenaikan jumlah peubah untuk jumlah pengamatan yang sama cenderung menyebabkan nilai ketelitian semakin menurun.
Khusus untuk korelasi antar peubah bebas tinggi, secara keseluruhan pendekatan Bayes hirarki memberikan hasil lebih baik dibandingkan pendekatan Bayes non hirarki. Model V sangat dipengaruhi oleh penetapan nilai awal σ2 dan bentuk sebaran prior β. Besaran JKG yang diperoleh pada Model V relatif lebih tinggi dibandingkan dua model lainnya. Model VI tidak dipengaruhi oleh penetapan nilai awal. Pada Model VI penentuan sebaran prior β yang berbeda memberikan hasil JKG yang relatif sama dan RMSE yang sedikit berbeda, namun relatif lebih rendah dibandingkan dua model pendekatan lainnya. Model VII tidak dipengaruhi oleh penetapan nilai awal σ2 dan penentuan sebaran prior â, namun hasil JKG yang diperoleh relatif lebih tinggi dibandingkan dengan Model VI, dan RMSE yang diperoleh relatif lebih besar dibandingkan dengan Model VI. Sehingga bila diperbandingkan antara model V, VI dan VII maka Model VI bersifat robust dan menghasilkan nilai JKG dan RMSE yang lebih baik dibandingkan Model V dan dan Model VII.
Berdasarkan beberapa kondisi diatas pendekatan Bayes hirarki lebih tepat digunakan dalam penyusunan model kalibrasi, dibandingkan jika menggunakan pendekatan Bayes non hirarki. Model VI merupakan model terbaik yang dapat digunakan untuk penyusunan model kalibrasi