HASIL DAN PEMBAHASAN PENELITIAN
4.1 Pemrosesan dan Analisis Data 4.1.1 Pembangkitan Data
Untuk membangkitkan nilai varibel Y yang berdistribusi binomial maka sebelum melakukan membangkitkan nilai acak binomial haruslah ditentukan terlebih dahulu nilai kemungkinan atau probabilitas munculnya nilai Y=1 yang juga ikut diacak. Dengan nama variabel jmln yang merupakan variabel yang berisikan jumlah banyaknya data yang dibangkitkan. Berikut ini sintax di R-language:
pirand<-runif(jmln)
y<-10*runif(jmln)*rbinom(jmln,c(1,0),pirand)
x1<-20*runif(jmln)*rnorm(jmln*(exp(pirand/(1-pirand))))
Setelah didapatkan nilai acak variabel dependen (Y) maka nilai selanjutnya yang harus dibangkitkan secara diacak adalah nilai dari variabel (X), akan tetapi harus diingat bahwa variabel X dan variabel Y haruslah mempunyai hubungan data mengingat akan adanya probabilitas bersyarat sehingga data yang dibangkitkan juga harus berhubungan antara X dan Y. Jumlah variabel X yang dibangkitkan sebanyak dengan jumlah yang diinginkan.
4.1.2 Estimasi Parameter Regresi Logistik
Untuk mengestimasi parameter dan menghitung deviance residual dari persamaan regresi logistik biasa dengan maximum likelihood pada dengan contoh dibawah pada 3 variabel bebas dengan R-language dapat dengan sintax:
pers<-glm(y~x1+x2+x3,family=binomial) pers<-coef(pers)
pers
Output yang dihasilkan:
pers
(Intercept) x1 x2 x3
-0.99611942 0.45559697 -0.34549983 -0.03942732
Setelah didapatkan persamaan dari regresi logistik biasa secara general maka langkah selanjutnya adalah untuk mengetahui nilai deviance residual dari regresi logistik biasa yang nantinya akan dibandingkan dengan deviance residual rata-rata dari bootstrap.
Berikut ini sintaxnya di R-language:
devlogbiasa<-deviance(pers) devlogbiasa
Output yang dihasilkan : 31.51926
Untuk mendapatkan nilai probabilitas yang akan dibootstrap, nilai dari vektor p harus dihitung yang didapatkan dengan cara menghitung fitted value yang isinya berupa nilai probabilitas nilai ekspetasi dari Y=1, dengan contoh menggunakan 3 variabel bebas dengan menggunakan sintax R-language sebagai berikut :
p<-
(exp(pers[1]+(pers[2]*x1)+(pers[2]*x2)+(pers[3]*x3)))/
(1+(exp(pers[1]+(pers[2]*x1)+(pers[2]*x2)+(pers[3]*x3) )))
Output hasilnya pada 3 variabel dan 30 data adalah :
1] 0.21140081 0.27315290 0.15481178 0.37433021 0.19469076 0.08808482 [7] 0.27240353 0.42438826 0.29581396 0.30878595 0.24415744 0.20612592 [13] 0.39011860 0.24294977 0.24451962 0.15526128 0.23056249 0.19080370 [19] 0.23410562 0.25115680 0.10600435 0.13229310 0.31134796 0.17783882 [25] 0.19649676 0.17357991 0.16942676 0.21163024 0.22961314 0.30414473
4.1.3 Replikasi Bootstrap
Jumlah data hasil replikasi dari bootstrapping tergantung dari berapa banyak data yang ada pada data observasi yang ingin dibootstrap yang dikalikan dengan jumlah replikasi bootstrap yang diinginkan. Replikasi bootstrap untuk menghasilkan Y*
ditunjukkan dengan sintaks R-language berikut:
for(i in 1:jmlboot){
for(j in 1:jmln){
p2<-c(p[j],q[j])
ybootemp<-sample(c(1,0),1,replace=TRUE,prob=p2) count<-count+1
yboot[count]<-ybootemp }}
Output hasilnya ditampilkan didalam maka hasilnya seperti:
Tabel 4.1: Matrix nilai Y yang dibootstrap dengan 3 variabel X, n = 30 data, dan 1000 replikasi bootstrap
Dari tabel (4.1) dari tabel diatas menunjukan bahwa terdapat 1000 kolom yang berarti bahwa telah dilakukan bootstrap sebanyak 1000 kali dengan banyak setiap kelompok bootstrap adalah sebanyak jumlah data awal dalam hal ini adalah 30 karena data yang dibangkitkan adalah 30 buah data.
4.1.4 Fit Regresi Logistik dan Metode Bootstrap
Setelah didapatkan nilai Y yang baru dengan bootstrap maka yang harus dilakukan adalah mendapatkan nilai persamaan regresi logistik yang baru hasil dari estimasi antara Y yang merupakan variabel dependen dari hasil replikasi bootstrap yang baru dengan *
variabel X. Hal itu ditunjukkan dengan sintaks R-language seperti berikut (dengan sintax 3 variabel):
for(i in 1:jmlboot){
for(j in 1:jmln){
yboot2[j]<-ybootmtx[j,i]
}
persboot<-glm(yboot2~x1+x2+x3,family=binomial) devmtx[i]<-deviance(persboot)
persboot2<-coef(persboot) b0boot[i]<-persboot2[1]
b1boot[i]<-persboot2[2]
b2boot[i]<-persboot2[3]
b3boot[i]<-persboot2[4]
yboot2<-0 }
Tiap persamaan akan disimpan pada variabel sehingga akan terdapat 1000 persamaan pada tiap-tiap parameter yang diestimasi karena terdapat 1000 kelompok data hasil dari bootstrap yang diestimasi masing-masing. Berikut ini adalah tabel matrix hasil dari estimasi parameter dengan 3 variabel independen pada bootstrap yang berjumlah 1000 persamaan:
Tabel 4.2: Matrix nilai estimasi parameter dengan 3 variabel X, n = 30 data, dan 1000 replikasi bootstrap
Output dari devmtx yang isinya adalah deviance residual dari tiap estimasi parameter dari tiap kelompok bootstrap adalah :
[1] 3.464714e+01 2.745166e+01 2.871260e+01 2.567989e+01 3.072694e+01 [6] 3.256464e+01 3.571497e+01 3.558173e+01 2.293464e+01 3.808559e+01 [11] 2.708541e+01 2.491297e+01 3.179952e+01 3.962460e+01 3.087080e+01
……….
[496] 3.499126e+01 2.758886e+01 7.418162e+00 3.525510e+01 5.935821e+00 [501] 1.708749e+01 3.173942e+01 2.814258e+01 2.936333e+01 3.498697e+01 [506] 2.899372e+01 3.183486e+01 3.824760e+01 3.428857e+01 2.806842e+01
………..
[986] 3.335088e+01 1.961047e+01 3.716349e+01 3.940491e+01 2.645549e+01 [991] 3.132148e+01 3.314044e+01 1.681783e+01 2.301145e+01 3.641387e+01 [996] 3.030701e+01 3.759053e+01 2.478159e+01 1.016155e-07 3.119078e+01
Nilai deviance residual tersebut akan berjumlah 1000 yang masing-masingnya mewakili deviance residual pada tiap estimasi parameter pada tiap kelompok bootstrap.
4.1.5 Hitung Deviance Residual Bootstrap
Dari persamaan bootstrap tersebut hitunglah deviance residual dari metode bootstrap logistic regression tersebut. Hal itu ditunjukkan dengan sintaks R-language berikut:
for(i in 1:jmlboot) {
devttl<-devttl+devmtx[i]
}
devboot<- b0ttl/jmlboot
Output yang dihasilkannya pada 3 variabel dan 30 data adalah:
38.32749
deverr<-(b0ttl/jmlboot)-devlogbiasa
output yang dihasilkannya pada 3 variabel dan 30 data adalah -4.49721
4.1.6 Rata-Rata Estimasi Parameter Pada Bootstrap
Estimasi parameter dari regresi logistik dengan bootstrap dihitung dengan sintax seperti berikut:
for(i in 1:1000) {
b0ttl<-b0ttl+b0boot[i]
b1ttl<-b1ttl+b1boot[i]
b2ttl<-b2ttl+b2boot[i]
b3ttl<-b3ttl+b3boot[i]
}
b0ttl/jmlboot b1ttl/jmlboot b2ttl/jmlboot b3ttl/jmlboot
Output hasil dari bootstrap parameter dari 3 variabel dan 30 data yang telah di adalah :
Tabel 4.3: Tabel estimasi parameter rata-rata pada regresi logistik dengan metode bootstrap pada 3 variabel dan n=30 data.
4.2 Perbedaan Deviance Residual
Dari perhitungan perbedaan deviance residual antara regresi logistik biasa dengan regresi logistik dengan metode bootstrap probabilitas bersyarat dapat dilihat pada tabel dibawah ini:
Komparasi deviance
residual
Regresi logistik
biasa
Regresi logistik dengan bootstrap
probabilitas bersyarat
Perbedaan deviance
residual
3 variabel dengan 30 data
38.32749 33.83028 -4.49721 3 variabel dengan 60
data
58.74006 54.18114 -4.55892 3 variabel dengan
100 data
116.6011 112.3468 -4.2543 3 variabel dengan
500 data
553.9715 550.4109 -3.5606 6 variabel dengan 30
data
42.90594 34.77067 -8.13527 6 variabel dengan 60
data
67.68218 59.83228 -7.8499 6 variabel dengan
100 data
103.4155 95.77689 -7.63861 6 variabel dengan
500 data
567.2079 560.0612 -7.1467
Tabel 4.4: Tabel Perbandingan deviance residual antara regresi logistik biasa dengan regresi logistik bootstrap.
Bisa dilihat dari tabel 4.4 bahwa ternyata setelah dihitung perbedaan dari deviance residual dari regresi logistik biasa dan regresi logistik dengan metode bootstrap relatif kecil.
Bersamaan dengan bertambahnya jumlah data yang dibangkitkan maka semakin
Berbeda halnya dengan perbedaan deviance residual dari kedua regresi yang semakin kecil seiring dengan bertambahnya data sampel yang diobservasi, semakin banyak data sampel yang direplikasi semakin tepat pula nilai deviance residual dari regresi logistik dengan metode bootstrap jika dibandingkan dengan nilai regresi logistik biasa.
Dari hasil deviance residual pada tabel 4.4 dapat dikatakan bahwa deviance residual pada regresi logistik dengan bootstrap mempunyai nilai yang sebanding dengan nilai deviance residual yang dimiliki oleh regresi logistik biasa.
4.3 Nilai koefisien Regresi Logistik dan Regresi Logistik dengan Bootstrap
Berikut ini adalah tabel hasil dari dari parameter yang diestimasi dari regresi logistik dan regresi logistik dengan metode bootstrap:
Estimasi parameter pada 3 variabel X
dan n= 30 data
b0 b1 b2 b3
Regresi logistik biasa
-0.5138178 -0.02289929 -0.00380185 -0.041916019 Regresi logistik
dengan bootstrap
-0.6035863 -0.03481864 -0.00478708 -0.05873964 Tabel 4.5: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 30 data.
Estimasi parameter pada 3 variabel X
dan n= 60 data
b0 b1 b2 b3
Regresi logistik biasa
-1.4998791 -0.08619578 -0.05414047 -0.02438699 Regresi logistik
dengan bootstrap
-1.682569 -0.0878764 -0.06149699 -0.02890257 Tabel 4.6: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 60 data.
Estimasi parameter pada 3 variabel X
dan n= 100 data
b0 b1 b2 b3
Regresi logistik biasa
-0.9372089 -0.069239289 -0.00792884 -0.014988913 Regresi logistik
dengan bootstrap
-0.9896123 -0.07114679 -0.00963828 -0.01657390 Tabel 4.7: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 100 data.
Estimasi parameter pada 3 variabel X
dan n= 500 data
b0 b1 b2 b3
Regresi logistik biasa
-1.1423636 -0.013334585 -0.11207489 0.001350545 Regresi logistik
dengan bootstrap
-1.150523 -0.01184655 -0.1029682 0.001284946 Tabel 4.8: Tabel perbandingan estimasi parameter pada 3 variabel X dan n= 500 data.
Estimasi parameter pada 6 variabel X dan n= 30 data
b0 b1 b2 b3
Regresi logistik biasa
-0.80111447 -0.03031234 0.09570664 -0.08003509 Regresi logistik
dengan bootstrap
-1.071613 -0.04693233 0.1327544 -0.1126586
Estimasi parameter pada 6 variabel
X dan n= 30 data
b4 b5 b6
Regresi logistik biasa
0.04512725 -0.02304710 -0.05618512 Regresi logistik
dengan bootstrap
0.06625681 -0.03445658 -0.07164192
Tabel 4.9: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 30 data.
Estimasi parameter pada 6 variabel X dan n= 60 data
b0 b1 b2 b3
Regresi logistik biasa
-1.0332333 -0.037049959 0.002400636 0.019542216 Regresi logistik
dengan bootstrap
-1.227361 -0.04573248 0.001746254 0.02535444
Estimasi parameter pada 6 variabel
X dan n= 60 data
b4 b5 b6
Regresi logistik biasa
0.006632124 0.012158041 -0.003029066 Regresi logistik
dengan bootstrap
0.007592152 0.01578432 -0.002774887
Tabel 4.10: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 60 data.
Estimasi parameter pada 6 variabel
X dan n= 100 data
b0 b1 b2 b3
Regresi logistik biasa
-1.3029463 0.0327364890 0.0206466059 -0.007395508 Regresi logistik
dengan bootstrap
-1.449078 0.03804383 0.02262030 -0.00814266
Estimasi parameter pada 6 variabel
X dan n= 100 data
b4 b5 b6
Regresi logistik biasa
0.0045283001 0.0003223864 -0.030828788 Regresi logistik
dengan bootstrap
0.005532636 0.0003507035 -0.03899761
Tabel 4.11: Tabel perbandingan estimasi parameter pada 6 variabel X dan n= 100 data.
Estimasi parameter pada 6 variabel
X dan n= 500 data
b0 b1 b2 b3
Regresi logistik biasa
-1.07038981 0.002751933 0.002995724 -0.008538030 Regresi logistik
dengan bootstrap
-1.088501 0.002597593 0.002777001 -0.00825483
Estimasi parameter pada 6 variabel
X dan n= 500 data
b4 b5 b6
Regresi logistik biasa
-0.003875324 0.002574000 0.004579975 Regresi logistik
dengan bootstrap
-0.003991370 0.003030202 0.004852104
Dari tabel 4.5 - 4.12 diatas dapat dilihat estimasi parameter dari persamaan regresi logistik biasa dan estimasi parameter rata-rata dari regresi logistik dengan metode bootstrap. Estimasi parameter antara regresi logistik dan regresi logistik dengan metode bootstrap memiliki nilai estimasi yang sebanding.
Seperti yang diketahui besarnya nilai b0 pada regresi adalah nilai awal pada persamaan jika semua nilai X adalah nol, sedangkan pada nilai persamaan estimasi parameter lainnya (b1 ,b2, b3, dsb) nilai parameter tersebut adalah nilai besarnya perubahan pada variabel dependen Y jika X pada persamaan parameter tersebut naik sebanyak satu angka. Contohnya pada estmasi parameter dengan 6 variabel X dan n =500 nilai b6 pada regresi logistik biasa adalah 0.004579975, hal itu berati bahwa dengan kenaikan satu nilai x6 mempengharui sebesar 0.004579975 bertambahnya nilai Y.
4.4 Spesifikasi Sarana untuk Analisis
Berikut ini akan diberikan spesifikasi sarana yang digunakan dalam analisis perbandingan regresi logistik biasa dengan regresi logistic dengan metode bootstrap menggunakan R-language. Sarana ini terdiri dari perangkat keras (hardware) dan perangkat lunak (software).
4.3.1. Perangkat Keras
Perangkat keras yang digunakan untuk analisis perbandingan regresi logistik biasa dan regresi logistik dengan metode bootstrap adalah :
1. CPU Pentium 4.2.66 GHz 2. RAM DDR 512 MB
3. Harddisk 80 GB
4. Monitor 21 inci resolusi 1024*768 pixel 5. Keyboard
6. Mouse
4.3.2. Perangkat Lunak
Perangkat lunak yang dibutuhkan untuk analisis perbandingan regresi logistik biasa dan regresi logistik dengan metode bootstrap adalah :
1. Microsoft Windows XP Sp 2 2. R Language v2.1.1
3. Notepad untuk menyimpan hasil dari listing program dari R-language.