HASIL DAN PEMBAHASAN 4.1 Metode Bayes
4.8 Contoh Kasus
𝑅(𝛽𝑘) = 𝛽̂𝑘2∑ 𝑥𝑘𝑖2
4.8 Contoh Kasus
Dalam contoh kasus, akan dibandingkan antara model regresi linier sederhana dan berganda prior konjugat dan prior non-informatif dengan menggunakan metode Bayes untuk memperoleh model terbaik , dimana data dalam contoh kasus ini diambil dari website BPS
1. Regresi linier sederhana
Akan diselidiki apakah terdapat hubungan antara variabel dependen (𝑌) yaitu tingkat penghuni kamar pada hotel berbintang 1, 2, 3, 4 dan 5 (dalam persen) dengan variabel independen (𝑋) yaitu jumlah kedatangan wisatawan mancanegara (Wisman) ke Indonesia dari tahun 2004 sampai 2018
Tabel 4.1:Data tingkat penghuni kamar hotel berbintang 1. 2. 3. 4 dan 5 dan jumlah kedatangan Wisman
Tahun Tingkat Penghuni Kamar Pada Hotel Berbintang
1,2,3,4 dan 5 (dalam persen)
(Y)
Jumlah Kedatangan Wisman ke Indonesia
(X)
2004 44,98 5321165
2005 45,03 5002101
2006 46,18 4871351
2007 46,89 5505759
2008 46,06 6234497
2009 48,31 6323730
2010 48,86 7002944
2011 51,25 7649731
2012 51,55 8044462
2013 52,22 8802129
2014 52,56 9435411
2015 53,92 10230775
2016 54,29 11519275
2017 56,69 14039799
2018 58,75 16810000
Dapat dilihat pada gambar 4.1 memperlihatkan bahwa kelimabelas titik data tersebut membentuk pola yang mendekati garis linier, sehingga akan digunakan model regresi linier untuk menganalisis data tersebut dan dari data pada tabel 4.1 dan dengan menggunakan software SPSS diperoleh 𝛽̂0 = 40,477 dan 𝛽̂1 = 0,000001186 sehingga model estimasi regresi linier sederhana prior non-informatifnya yaitu
𝑦̂ = 40,48 + 0,000001186𝑥1
Gambar 4.1: Curva data tingkat penghuni kamar pada hotel bintang dan jumlah kedatangan wisman ke Indonesia
Untuk mengestimasi parameter regresi linier sederhana prior konjugat akan dilakukan dengan menggunakan algoritma Markov Chain Monte Carlo (MCMC) dengan Gibbs sampling serta software R dengan MCMCpack 1.4-8, dimana iterasi dilakuakan sebanyak 10.000 dengan burnin sebanyak 1000 dan thin sebanyak 1. Hasil estimasi parameter yang diperoleh yaitu 𝛽̂0 = 40,49 dan 𝛽̂1 = 0,000001184 sehingga model estimasi regresi linier prior konjugatnya yaitu
𝑦̂ = 40,49 + 0,000001184𝑥1
Selanjutnya yaitu menguji signifikansi parameter segresi yaitu dengan cara pengujian hipotesis yaitu
1. 𝐻0: 𝛽 = 0 (Tidak terdapat hubungan antara RUP dengan RLS di setiap Provinsi di Indonesia tahun 2019)
𝐻1: 𝛽 ≠ 0 (Terdapat hubungan antara RUP dengan RLS di setiap Provinsi di Indonesia tahun 2019)
2. Daerah kritis, 𝐻0 ditolak jika 𝑝(𝐻0|𝑦) < 𝑝(𝐻0)
3. Dengan menggunakan SPSS diperoleh 𝑅2 = 0,919 dan 𝑟(𝑥,𝑦) = 0,919, dan dengan menggunakan persamaan (4.65) diperoleh 𝑔 = 1,519401 × 10−11, dan 𝑝(𝐻0|𝑦) = 3,8979343 × 10−6
4. Karena 𝑝(𝐻0|𝑦) < 𝑝(𝐻0) yaitu 3,8979343 × 10−6 < 1
2, maka tolak 𝐻0 sehingga terdapat hubungan yang signifikan antara tingkat penghuni pada kamar hotel berbintang 1,2,3,4 dan 5 dengan jumlah kedatangan Wisman ke Indonesia dari tahun 2004 sampai 2018
Kemudian untuk menentukan model terbaik dapat dilakukan dengan menggunakan kriteria RMSE, MAD, MAPE dan dengan menggunakan software Ms. Excel diperoleh
Tabel 4.2: Kriteria evaluasi model regresi linier sederhana
Prior RSME MAD MAPE
Prior Non-informatif 2937399,066 2870653,73 99,99853089 Prior Konjugat 2937399,056 2870653,716 99,99853053 Dapat dilihat bahwa nilai RMSE, MAD dan MAPE dari model regresi linier sederhana prior konjugat menggunakan metode Bayes lebih kecil dibandingkan pada nilai RMSE, MAD dan MAPE dari model regresi linier sederhana prior non-informatif, sehingga model regresi linier sederhana prior konjugat lebih baik dibanding model regresi linier sederhana prior non-informatif.
2. Regresi linier berganda
Akan dilihat apakah terdapat hubungan antara indeks pembangunan manusia (IPM) dengan umur harapan hidup saat lahir (UHH), harapan lama sekolah (HLS), rata-rata lama sekolah (RLS) dan pengeluaran Perkapita yang disesuaikan (Rp .000) pada setiap provinsi di Indonesia tahun 2019, dimana variabel dependen yang digunakan yaitu IPM dan variabel independen 𝑋1, 𝑋2, 𝑋3, 𝑋4 berturut-turut yaitu IPM, UHH, RLS dan pengeluaran perkapita yang disesuaikan.
Tabel 4.3: Data IPM, UHH, HLS, RLS dan pengeluaran perkapita di setiap Provinsi di
PAPUA BARAT 64,7 65,9 12,72 7,44 8125
PAPUA 60,84 65,65 11,05 6,65 7336
INDONESIA 71,92 71,34 12,95 8,34 11299
Dari data pada tabel 4.3 dan dengan menggunakan software R estimasi parameter yang diperoleh yaitu 𝛽0 = −11,45, 𝛽1 = 0,8667, 𝛽2 = 0,1965, 𝛽3 = 2,268 dan 𝛽4 = 0,000001082 sehingga estimasi model regresi linier berganda prior non-informatifnya yaitu
𝑦̂ = −11,45 + 0,8667𝑥1+ 0,1965𝑥2+ 2,268𝑥3− 0,000001082𝑥4 Untuk mengestimasi parameter regresi linier berganda prior konjugat akan dilakukan dengan menggunakan algoritma Markov Chain Monte Carlo (MCMC) dengan Gibbs sampling serta software R dengan MCMCpack 1.4-8 dimana iterasi dilakukan sebanyak 10.000 dengan burnin sebanyak 1000 dan thin sebanyak 1. Hasil estimasi parameter yang diperoleh yaitu 𝛽̂0 = −11,48 dan 𝛽̂1 = 0,8684, 𝛽̂2 = 0,1908, 𝛽̂3 = 2,266 dan 𝛽̂4 = −0,00001098 sehingga model estimasi regresi linier prior konjugatnya yaitu
𝑦̂ = −11,48 + 0,8684𝑥1+ 0,1908𝑥2+ 2,266𝑥3− 0,00001098𝑥4 selanjutnya akan dilakukan pengujian signifikansi parameternya dengan cara menguji hipotesis dengan 𝑛 = 34, 𝑝 = 4 dan 𝑞 = 0 yaitu
1. 𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 0 (Tidak terdapat hubungan antara variabel independen terhadap variabel dependen IPM tahun 2019)
𝐻1: 𝛽1 ≠ 𝛽2 ≠ 𝛽3 ≠ 𝛽4 ≠ 0 (Paling sedikit terdapat satu variabel independen yang memiliki hubungan dengan variabel dependen IPM tahun 2019)
2. Daerah kritis, 𝐻0 ditolak jika 𝑝(𝐻0|𝑦) < 𝑝(𝐻0)
3. Dengan menggunakan SPSS diperoleh 𝑅2 = 0,871 dan 𝑟(𝑥,𝑦) = 0,933 , dengan menggunakan persamaan (4.68) diperoleh 𝑔 = 2,25848 × 10−21, dan 𝑝(𝐻0|𝑦) = 4,75235 × 10−11
4. Karena 𝑝(𝐻0|𝑦) < 𝑝(𝐻0) yaitu 4,75235 × 10−11 < 1
2, maka tolak 𝐻0 sehingga minimal terdapat satu variabel independen UHH, HLS, RLS ataupun pengeluaran perkapita yang disesuaikan menurut provinsi tahun 2019 yang memiliki hubungan dengan variabel dependen IPM
kemudian untuk menentukan model terbaik dapat dilakukan dengan menggunakan kriteria RMSE, MAD dan MAPE serta dengan menggunakan software Ms. Excel yaitu
Tabel 4.4: Kriteria evaluasi model regresi linier berganda
Metode RSME MAD MAPE
Prior Non-informatif 1,38657 1,17440 1,65198
Prior Konjugat 1,38657 1,17375 1,65087
Dapat dilihat bahwa nilai kriteria evaluasi MAD dan MAPE yang dihasilkan dari model regresi linier berganda prior konjugat dengan metode Bayes lebih kecil dibanding pada model regresi linier berganda prior non-informatif, serta nilai RMSE yang dihasilkan pada model regresi linier berganda prior konjugat dan non-informatif menggunakan metode Bayes bernilai sama.
Sehingga dapat disimpulkan bahwa model regresi sederhana dan berganda yang dihasilkan pada prior konjugat dengan menggunakan metode Bayes lebih baik dibandingkan dengan menggunakan prior non-informatif.
BAB 5 PENUTUP
5.1 Kesimpulan
Bedasarkan pada pembahasan, diperoleh kesimpulan sebagai berikut
1. Pada kasus regresi linier sederhana prior non-informatif maka estimasi parameter Bayes yang diperoleh sama dengan estimasi parameter OLS yaitu
𝛽̂0 = 𝑦̅ − 𝛽̂1𝑥̅
2. Pada kasus regresi linier berganda prior non-informatif maka estimasi parameter Bayes yang diperoleh sama dengan estimasi parameter OLS yaitu
𝛽̂ = (𝑋𝑇𝑋)−1𝑋𝑇𝑦 𝜇̂𝑌|𝑋 = 𝑋𝛽̂
𝜎̂2 = (𝑦 − 𝑋𝛽̂)𝑇(𝑦 − 𝑋𝛽̂) (𝑛 − 2)
3. Pada kasus regresi linier sederhana prior konjugat, estimasi parameter Bayes yang diperoleh yaitu
4. Pada kasus regresi linier berganda prior konjugat, estimasi parameter Bayes yang diperoleh yaitu
𝛽̂𝑛 = 𝛽̂0 +1
2[(𝑦𝑇𝑦 − 𝜇𝑛𝑇⋀𝑛𝜇𝑛+ 𝜇0𝑇⋀0𝜇0)]
dengan
𝜇̂𝑛 = (⋀𝑛)−1(𝑋𝑇𝑋𝛽 + ⋀0𝜇0) = (𝑋𝑇𝑋 + ⋀0)−1(𝑋𝑇𝑋𝛽 + ⋀0𝜇0)
𝑎𝑛 = 1
2(𝑛 + 𝑣0)
⋀𝑛 = 𝑋𝑇𝑋 + ⋀0
5. Uji signifikansi parameter regresi linier sederhana Bayes dilakukan dengan menggunakan probabilitas posterior bahwa hipotesis yang dilakukan adalah benar yaitu
𝑝(𝐻0|𝑦) = 1 1 + 1
√𝑔
atau pengujian hipotesis juga dapat dilakukan dengan menggunakan Uji-t dan uji-F dengan
6. Uji signifikansi parameter regresi linier berganda Bayes dilakukan dengan menghitung probabilitas posterior bahwa hipotesis yang dilakaukan benar yaitu
𝑝(𝐻0|𝑦) = 1 1 + 1
√𝑔
atau pengujian hipotesis juga dapat dilkakukan dengan menggunakan Uji-t dan uji-F dengan
7. Model regresi linier sederhana dan berganda prior konjugat yang dihasilkan lebih baik dibanding pada model regresi linier sederhana dan berganda prior non-informatif karena nilai RMSE, MAD dan MAPE yang diperoleh lebih kecil.
5.2 Saran
Bagian terpenting dari estimasi parameter dan estimasi model regresi linier dengan menggunakan metode Bayes adalah pemilihan distribusi prior. Setelah dilakukan estimasi dan uji signifikansi parameter regresi linier, terlihat bahwa hasil akhir sangat berpengaruh pada pemilihan distribusi priornya. Bagi pembaca yang ingin
melanjutkan penelitian ini dapat memilih distribusi prior yang berbeda serta dalam penelitian ini uji signifikansi hanya dilakukan pada regresi linier Bayes yang menggunakan prior non-informatif, sehingga dapat menggunakan uji signifikansi parameter regresi Bayes dengan menggunakan prior yang berbeda.