Pada penelitian ini simulasi pembangkitan data menggunakan empat ukuran sampel yang berbeda yang dilakukan pengulangan sebanyak 400 kali. Penelitian ini dilakukan melalui berbagai langkah.
Langkah awal yaitu membangkitkan data secara acak yang distribusi normal untuk variabel prediktor dan galat. Khusus untuk variabel prediktor harus memunculkan kasus multikolinieritas sehingga diperlukan korelasi antar variabel prediktor, di mana penelitian ini menggunakan tiga koefisien korelasi. Berikut Tabel 4.1 merupakan penjelasan ukuran sampel, koefisien korelasi, dan sebaran yang digunakan dalam pembangkitan variabel prediktor dan galat.
Tabel 4.1. Ukuran Sampel, Koefisien Korelasi Serta Sebaran untuk Variabel Prediktor dan Galat
Sebaran Koefisien Korelasi Ukuran Sampel
Data 1
Setelah membangkitkan variabel prediktor dan galat, langkah selanjutnya yaitu membangkitkan variabel respon dengan menggunakan persamaan (3.1). Setelah mendapatkan variabel prediktor, variabel respon, dan galat, langkah selanjutnya adalah mengecek keacakan variabel prediktor dan galat. Apabila variabel
30
prediktor dan galat tidak acak maka dilakukan pembangkitan ulang hingga seluruh variabel prediktor dan galat acak. Langkah selanjutnya yaitu data disimpan dan dilakukan analisis regresi ridge dengan dua metode pendugaan yaitu Metode Kuadrat Terkecil (MKT) dan Bayesian. Setiap simulasi akan didapatkan penduga parameter regresi ridge, penduga parameter regresi hasil transformasi balik, dan standard error (SE) yang akan disimpan sebanyak 400 yang kemudian akan dihitung koefisien determinasi terkoreksi (R2adjusted) dan Kuadrat Tengah Galat (KTG). Selanjutnya akan dibahas hasil simulasi untuk data 1, data 2, dan data 3 berupa pendugaan parameter, SE, R2adjusted, KTG, c (tetapan bias) pada regresi ridge dengan MKT dan metode Bayesian.
4.2. Hasil Simulasi Data 1 ( n = 20, 50, 100, dan 200, r = 0.90) 4.2.1. Penduga Parameter Pada Simulasi Data 1
Pembentukan model regresi linier berganda tanpa pengaruh multikolinieritas membutuhkan penduga parameter yang telah ditransformasi balik. Berikut Tabel 4.2 merupakan penduga paremeter regresi linier berganda hasil transformasi balik yang didapatkan dari hasil simulasi pada data 1 dengan r = 0.90.
Tabel 4.2. Penduga Parameter Regresi Linier Berganda Hasil Transformasi Balik Pada Data 1
MKT
n 20 50 100 200
ˆ0
76.54281 77.87338 77.18953 77.02017
ˆ1
79.37622 80.75563 79.97778 79.73723
1
31 Berdasarkan pada Tabel 4.2 terlihat bahwa seiring bertambahnya ukuran sampel, penduga parameter regresi tanpa pengaruh multikolinieritas dengan metode Bayesian memiliki hasil yang relatif sama dengan MKT. Berikut merupakan plot hasil simulasi yang menggambarkan pergerakan nilai penduga parameter untuk masing–masing metode pada Gambar 4.1.
Gambar 4.1. Plot Penduga Parameter Regresi Linier Berganda Hasil Transformasi Balik Pada Data 1
Kemiripan hasil penduga parameter dari kedua metode tersebut menandakan bahwa penduga parameter regresi ridge tidak hanya dapat diduga dengan MKT tetapi juga dapat diduga dengan metode
32
Bayesian. Dalam menentukan kebaikan penduga parameter yang dihasilkan dapat dilihat dari nilai Standard Error (SE) penduga parameter.
4.2.2. Standard Error Penduga Parameter Pada Simulasi Data 1 Standard error (SE) yang didapatkan dari hasil simulasi pada data 1 dengan r = 0.90 ditampilkan pada Tabel 4.3.
Tabel 4.3. Standard Error Penduga Parameter Regresi Linier Berganda Pada Data 1
MKT
n 20 50 100 200
se (ˆ0) 30.04985 16.56702 11.52323 7.93089 se (ˆ1) 0.54142 0.30048 0.20615 0.14331 se (ˆ2) 1.10527 0.59919 0.41520 0.28565 se (ˆ3) 0.30544 0.17167 0.11719 0.08175 se (ˆ4) 0.11696 0.06595 0.04559 0.03143
BAYESIAN
n 20 50 100 200
se (ˆ0) 10.98487 6.83490 4.81906 3.37318 se (ˆ1) 0.13865 0.08714 0.06183 0.04352 se (ˆ2) 0.27878 0.17507 0.12422 0.08692 se (ˆ3) 0.07905 0.04953 0.03554 0.02479 se (ˆ4) 0.06536 0.04022 0.02845 0.01983
Kriteria penduga parameter yang baik mempunyai nilai SE yang semakin kecil. Berdasarkan Tabel 4.3 didapatkan bahwa SE penduga paramater regresi ridge dengan MKT dan metode Bayesian memiliki pola menurun seiring bertambahnya ukuran sampel. Berikut merupakan plot hasil simulasi yang menggambarkan pergerakan nilai SE untuk masing–masing metode pada Gambar 4.2.
33 Gambar 4.2. Plot Standard Error Penduga Parameter Regresi Linier
Berganda Pada Data 1
Berdasarkan Gambar 4.2 dapat dilihat bahwa SE penduga parameter regresi ridge untuk metode Bayesian mengalami penurunan seperti MKT seiring bertambahnya ukuran sampel. Semakin besar ukuran sampel, SE penduga parameter regresi ridge dengan MKT dan Bayesian semakin mengecil yang artinya kedua metode tersebut sama baiknya dalam menduga parameter regresi ridge. Pendugaan parameter regresi ridge menggunakan metode Bayesian sangat baik digunakan pada ukuran sampel kecil (n=20) karena menghasilkan SE yang kecil, menandakan bahwa metode Bayesian memiliki
34
kemampuan dalam menduga parameter lebih baik karena tingkat kesalahan dalam pendugaan yang relatif lebih kecil, hal ini disebabkan bahwa penduga parameter dengan metode Bayesian tidak sepenuhnya menggunakan informasi data sampel, tetapi juga dibantu dengan memanfaatkan informasi awal (prior). Prior merupakan pengetahuan awal peneliti tentang data sampel yang bisa didapatkan dari analisis ataupun informasi sebelumnya, sehingga dengan adanya prior dan informasi data sampel yang digabungkan serta terdapat keterbatasan ukuran sampel, metode Bayesian dapat memperkecil tingkat kesalahan dalam pendugaan parameter.
Pendugaan parameter regresi ridge dengan metode Bayesian lebih stabil, dapat dilihat dari SE penduga parameter untuk setiap ukuran sampel. Berdasarkan Gambar 4.2 terlihat bahwa SE penduga parameter dengan metode Bayesian mengalami penurunan yang relatif kecil dibandingkan MKT seiring meningkatnya ukuran sampel. Hal ini dikaitkan dengan konsep metode Bayesian bahwa parameter merupakan variabel acak, sedangkan parameter pada MKT bersifat tetap.
Berdasarkan Gambar 4.2, pendugaan parameter kasus multikolinieritas dengan metode Bayesian baik digunakan karena dalam metode Bayesian, parameter dibangkitkan saling bebas sedangkan pendugaan parameter dengan MKT hanya berasal dari data sampel sehingga SE pendugaan parameter dengan metode Bayesian lebih baik. Pada penduga parameter untuk variabel prediktor ke empat memiliki pola penurunan SE yang relatif sama antara MKT dan metode Bayesian dibandingkan dengan penduga parameter untuk variabel yang lainnya. Diketahui bahwa pada variabel tersebut tidak terjadi kasus multikolinieritas, sehingga dapat disimpulkan bahwa pendugaan parameter pada data dengan tingkat korelasi yang rendah akan menghasilkan penduga yang sama baiknya antara MKT dan metode Bayesian.
4.2.3. Kuadrat Tengah Galat (KTG) dan Koefisien Determinasi Terkoreksi (R2adjusted) Model Regresi Ridge Pada Simulasi Data 1
R2adjusted dan KTG yang didapatkan dari hasil simulasi pada data 1 dengan r = 0.90 ditampilkan pada Tabel 4.4.
35 Tabel 4.4. KTG dan R2adjusted Model Regresi Ridge Pada Data 1
MKT
n 20 50 100 200
R2adjusted 0.684 0.700 0.701 0.702
KTG 0.01661 0.00606 0.00302 0.00147 BAYESIAN
n 20 50 100 200
R2adjusted 0.693 0.700 0.700 0.701
KTG 0.01613 0.00610 0.00308 0.00150