35
HASIL DAN PEMBAHASAN
Dalam bagian hasil dan pembahasan ini akan ditampilkan proses pengolahan data, dalam bentuk statement dalam R Language, diagram pencar, tabel-tabel dan grafik yang digunakan dalam analisis data beserta hasil dan pembahasannya. Dengan memperhatikan segi efisiensi dalam penelitian ini, maka tidak semua data yang diolah akan ditampilkan tetapi hanya beberapa bagian saja yang dipilih oleh penulis yaitu data berukuran n=30 untuk 2 variabel bebas, 3 varabel bebas dan 5 variabel bebas. Proses pengolahan yang tidak diuraikan dalam hasil dan pembahasan ini akan ditampilkan hasil akhir pengolahannya saja, yaitu dalam bentuk nilai standard error dan persamaan regresi yang diperoleh.
Proses penelitian dilakukan dengan R Language. Data sampel dibangkitkan dengan fungsi ‘rnorm (random number)’ yang merupakan bilangan acak yang memiliki sebaran normal baku, default dari ‘rnorm’ adalah standar deviasi = 1, mean = 0 dan memiliki rentang nilai dari -3 sampai 3. Fungsi ‘runif (random uniform)’ digunakan untuk membantu memperbesar nilai dari fungsi ‘rnorm’
4.1 Proses Pengolahan Data
Dalam bagian ini akan ditampilkan sebagian dari proses pengolahan data beserta hasil-hasil dari proses yang ditampilkan. Proses pengolahan data disajikan dalam bentuk diagram-diagram dan gambar-gambar yang menunjukkan bahwa data yang dibangkitkan memenuhi asumsi pendugaan untuk regresi linier
berganda, kemudian dilanjutkan dengan pengolahan data menggunakan metode kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual.
4.1.1 Proses Pengolahan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Berikut ini akan ditampilkan tahapan-tahapan dalam proses pengolahan data untuk sampel berukuran n=30 dengan 2 variabel bebas.
4.1.1.1 Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Data akan dibangkitkan dengan R Languge. Statement yang digunakan untuk membangkitkan data dalam R Language adalah sebagai berikut
> library(stats) > n=30
> set.seed(12343) > x=10*runif(n) > set.seed(12344)
> x1=15*runif(n)+x+rnorm(n) > set.seed(12345)
> x2=20*runif(n)+x+rnorm(n) > set.seed(12347)
> y=x+x1+x2+rnorm(n) > data.entry(y,x1,x2)
Hasil pembangkitan data disajikan dalam tabel 4.1 :
Tabel 4.1 Hasil Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Keterangan :
y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua.
4.1.1.2 Matrik Korelasi untuk Sampel n=30 dengan 2 Variabel Bebas
Dari data yang sudah dibangkitkan akan diperlihatkan gambaran dalam bentuk diagram pencar. Diagram pencar digunakan untuk mengetahui validitas asumsi dari pendugaan regresi linier berganda. Pertama-tama akan diperlihatkan matrik korelasi, untuk melihat apakah ada hubungan antar variabel. Matrik korelasi diperoleh dengan statement R Language sebagai berikut :
> library (base)
> matx=matrix(c(x1,x2),ncol=2)
> round(cor(matx),4)
Hasil pengolahan dengan R Language menunjukkan hasil sebagai berikut:
[x1] [x2]
[x1] 1.0000 0.0092 [x2] 0.0092 1.0000
Dari matrix korelasi terlihat bahwa korelasi antar x1 dengan x2 sebesar 0.0092 dan nilai ini dianggap sangat kecil sehingga dapat ditafsirkan bahwa tidak ada korelasi atau menunjukkan tidak terjadi multikolinieritas.antar variabel x.
Untuk lebih jelasnya, akan ditampilkan hubungan antara variabel x1 dan x2 dengan diagram pencar yang disajikan pada gambar berikut
> op <- par(mfrow = c(1,1), pty = "s")
> plot(x1,x2)
Gambar 4.1 Diagram Pencar (Scatter Plot) x1 dengan x2
Dari gambar tersebut diatas terlihat bahwa tidak ada hubungan antara variabel x1 dengan x2. Berdasarkan besaran koefisien korelasi dan diagram pencar menunjukkan bahwa asumsi dalam regresi linier berganda yang memerlukan tidak terjadi multikolinieritas dapat dipenuhi dari data yang telah dibangkitkan.
4.1.1.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 2 Variabel Bebas
Proses berikutnya akan menunjukkan koefisien korelasi linier antar variabel y dengan variabel x. Dalam R Language dihasilkan dengan statement sebagai berikut
> op <- par(mfrow = c(1,2), pty = "s")
> plot(x1,y)
> plot(x2,y)
Hasil yang diperoleh ditunjukkan oleh gambar 4.2
Gambar 4.2 Diagram Pencar Antara Data Y dengan Data X
Dari gambar menunjukkan hubungan yang linier dan korelasi positif yang tinggi antara kedua variabel. Sehingga memenuhi asumsi pendugaan untuk regresi linier berganda.
4.1.1.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 2 Variabel Bebas Dari data yang telah dibangkitkan, data akan diolah dengan menggunakan metode kuadrat terkecil. Statement dalam R Language adalah sebagai berikut :
> library(stats)
> reg=lm(y~x1+x2)
> reg
> summary(reg)
> ytopi=reg$fit
> residual=reg$res
> data.entry(y,x1,x2,ytopi,residual)
Hasil pengolahan data ditunjukkan pada tabel 4.2
Tabel 4.2 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 2 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
Dengan menggunakan metode kuadrat terkecil diperoleh
Persamaan regresi : Ŷ = -1.493+ 1.289X1 + 1.164X2 Nilai standard error : 2.522
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan nilai residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics)
> op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Dihasilkan gambar dalam bentuk diagram pencar seperti dalam gambar 4.3 :
Gambar 4.3 Diagram Pencar Ŷ dengan Residual
Dari gambar terlihat bahwa nilai penyimpangan (residual) tidak dipengaruhi oleh besarnya nilai y estimasi, yang berarti bahwa persamaan regresi yang dihasilkan memenuhi asumsi untuk persamaan regresi linier
berganda(homoskedastisitas). Dengan perkataan lain, besarnya nilai penyimpangan sama untuk setiap nilai pendugaan variabel tak bebas
4.1.1.5 Distribusi untuk Sampel n=30 dengan 2 Variabel Bebas
Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan.
Statement dalam R Language untuk memeperoleh gambar distribusi nilai residual adalah
> library(graphics)
> res=reg$res
> plot(density(res))
Hasil yang diperoleh ditunjukkan oleh gambar 4.4 :
Gambar 4.4 Bentuk Distribusi Residual Regresi dengan 2 Variabel Bebas
Gambar 4.4 menunjukkan kurva normal yang berbentuk genta yang mempunyai arti bahwa data yang dibangkitkan mampunyai distribusi normal atau menyebar secara normal.
4.1.1.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 2 Variabel Bebas
Selanjutnya akan dilakukan pengolahan data dengan menggunakan metode bootstrap pairs.
statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language
> ybaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ybaru[i]=y[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> regbaru=lm(ybaru~x1baru+x2baru) > regbaru
> residual=regbaru$res
> residualboot<-0 > for(i in 1:1000){
> set.seed(i+123)
> residualboot[i]=residual[sample(1000,rep=T)]
> }
> sdror=sd(residualboot) > sdror
> data.entry(ybaru,x1baru,x2baru)
Data yang diolah dengan menggunakan metode bootstrap pairs akan menghasilkan nilai-nilai baru berukuran n=1000. Dalam tabel 4.3 berikut ini akan ditampilkan sebagian dari hasil pengolahan data.
Tabel 4.3 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 2 Variabel Bebas
. . .
. . .
Keterangan :
ybaru menunjukkan nilai y yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali
x1baru menunjukkan nilai x1 yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali
x2baru menunjukkan nilai x2 yang diperoleh setelah dilakukan proses bootstrap pairs 1000 kali
Sebagai contoh dari hasil pengolahan data dengan menggunakan metode bootstrap pairs, terlihat bahwa sampel no.1 terpilih kembali sebagai sampel
no.999, sampel no.2 terpilih kembali sebagai sampel no.509 dan sampel no.3 terplilih kembali sebagai sampel no.997. Hal ini menjelaskan inti dari metode bootstrap pairs untuk model regresi yaitu sampling dengan pengembalian dengan
probabilitas terpilih yang sama untuk setiap n dan proses bootstrap dilakukan secara berpasangan untuk semua variabel
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu Ŷ = -1.374 + 1.290 X1 + 1.154 X2 dannilai standard error yang dihasilkan adalah 2.413741
4.1.1.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 2 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual ditunjukkan dalam tabel 4.4 dengan statement dalam R Language sebagai berikut > ytopi=reg$fit
> residual=reg$res
> ytopibaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ytopibaru[i]=ytopi[sample(n,rep=T)]
> }
> residualboot<-0
> for(i in 1:1000){
> set.seed(i+110)
> residualboot[i]=residual[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+124)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> ybarures=ytopibaru+residualboot
> regbaru=lm(ybarures~x1baru+x2baru)
> regbaru
> meanrb=mean(residualboot)
> resboot=residualboot-meanrb
> sderror=sd(resboot)
> sderror
> data.entry(x1baru,x2baru,ytopibaru,residualboot,ybaru)
Tabel 4.4 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 2 Variabel Bebas
. . .
. . .
Keterangan :
x1baru menunjukkan nilai x1 setelah dilakukan proses bootstrap 1000 kali
x2baru menunjukkan nilai x2 setelah dilakukan proses bootstrap 1000 kali
ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali
residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual
Dari hasil pengolahan data dengan metode bootstrap residual terlihat bahwa untuk data x1baru, data no.1 terpilih kembali sebagai data no.508, data no.2 terpilih kembali sebagai data no.504 dan 996, sedangkan untuk data x2baru terlihat bahwa data no.1 terpilih kembali sebagai data no.995. Hal ini menjelaskan metode bootstrap residual untuk model regresi yaitu sampling dengan pengembalian dengan probabilitas terpilih yang sama untuk setiap n
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu Ŷ = -1.503 + 1.298 X1 + 1.157X2 dannilai standar error yang dihasilkan adalah 2.352203
4.1.2 Proses Pengolahan Data untuk Sampel n=30 dengan 3 Variabel Bebas
Proses pengolahan data yang dilakukan untuk data sampel berukuran n=30 dengan 3 variabel bebas sama dengan proses-proses yang dilakukan untuk data sampel berukuran n=30 dengan 2 variabel bebas dan bentuk pembahasannya
pun sama, sehingga untuk pembahasan-pembahasan yang sudah dijelaskan sebelumnya tidak dilakukan penjelasan lebih lanjut.
4.1.2.1 Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel Bebas
Statement dalam R Language untuk membangkitkan data sejumlah n=30 dengan 3 variabel bebas adalah sebagai berikut :
> library(stats) > n=30
> set.seed(12343) > x=10*runif(n) > set.seed(12344)
> x1=15*runif(n)+x+rnorm(n) > set.seed(12345)
> x2=20*runif(n)+x+rnorm(n) > set.seed(12346)
> x3=35*runif(n)+x+rnorm(n) > set.seed(12347)
> y=x+x1+x2+x3+rnorm(n)
> data.entry(y,x1,x2,x3)
Hasil pembangkitan data ditunjukkan dalam tabel 4.5 :
Tabel 4.5 Hasil Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel Bebas
Keterangan :
y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua.
x3 menunjukkan variabel bebas ketiga.
4.1.2.2 Matrik Korelasi untuk Sampel n=30 dengan 3 Variabel Bebas Matrik korelasi dihasilkan dengan statement berikut ini
> library (base)
> matx=matrix(c(x1,x2,x3),ncol=3) > round(cor(matx),4)
Hasil yang diperoleh adalah sebagai berikut : [x1] [x2] x3]
[x1] 1.0000 0.1682 0.2645 [x2] 0.1682 1.0000 -0.0470 [x3] 0.2645 -0.0470 1.0000
Matrik korelasi diatas menunjukkan bahwa korelasi antar peubah bebas dari data yang diperoleh relatif kecil, sehingga antar variabel bebas dapat dianggap tidak memiliki hubungan (tidak multikolinieritas).
Hubungan antara variabel x ditunjukkan pada gambar 4.5
> op <- par(mfrow = c(1,3), pty = "s")
> plot(x1,x2)
> plot(x1,x3)
> plot(x2,x3)
Gambar 4.5 Diagram Pencar Antar variabel X
4.1.2.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 3 Variabel Bebas Koefisien korelasi linier dihasilkan oleh statement berikut ini dan ditunjukkan oleh gambar dibawahnya.
> op <- par(mfrow = c(1,3), pty = "s")
> plot(x1,y)
> plot(x2,y)
> plot(x3,y)
Gambar 4.6 Diagram Pencar Antara Data Y dan Data X
4.1.2.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 3 Variabel Bebas
Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil adalah sebagai berikut
> library(stats)
> reg=lm(y~x1+x2+x3)
> reg
> summary(reg)
> ytopi=reg$fit
> residual=reg$res
> data.entry(y,x1,x2,x3,ytopi,residual)
Hasil pengolahan data ditunjukkan pada tabel 4.6 :
Tabel 4.6 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 3 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
Dengan menggunakan metode kuadrat terkecil diperoleh
Persamaan regresi : Ŷ = 3.158+ 1.240X1 + 1.182X2 + 1.089 X3
Nilai standard error : 2.351
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics)
> op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Gambar 4.7 Diagram Pencar Ŷ dengan Residual
4.1.2.5 Distribusi Residual Regresi untuk Sampel n=30 dengan 3 Variabel Bebas Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan.
Statement dalam R Language untuk memperoleh gambar distribusi nilai residual adalah
> library(graphics)
> res=reg$res
> plot(density(res))
Diperoleh gambar sebagai berikut :
Gambar 4.8 Distribusi Residual Regresi Dengan 3 Variabel Bebas
4.1.2.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 3 Variabel Bebas
Statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language
> ybaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ybaru[i]=y[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> x3baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x3baru[i]=x3[sample(n,rep=T)]
> }
> regbaru=lm(ybaru~x1baru+x2baru) > regbaru
> residual=regbaru$res
> residualboot<-0 > for(i in 1:1000){
> set.seed(i+123)
> residualboot[i]=residual[sample(1000,rep=T)]
> }
> sdror=sd(residualboot) > sdror
> data.entry(ybaru,x1baru,x2baru,x3baru)
Hasil pengolahan data akan ditunjukkan dalam tabel 5.7 :
Tabel 4.7 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 3 Variabel Bebas
. .
. .
. . .
Keterangan :
ybaru menunjukkan nilai y setelah dilakukan proses bootstrap pairs 1000 kali
x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan proses bootstrap pairs 1000 kali
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu Ŷ = -2.856 + 1.238 X1 + 1.173 X2 + 1.083 X3 dan nilai standar error yang dihasilkan adalah 2.193715
4.1.2.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 3 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual diperoleh dengan statement dalam R Language sebagai berikut
> ytopi=reg$fit
> residual=reg$res
> ytopibaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ytopibaru[i]=ytopi[sample(n,rep=T)]
> }
> residualboot<-0
> for(i in 1:1000){
> set.seed(i+110)
> residualboot[i]=residual[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+124)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> x3baru<-0
> for(i in 1:1000){
> set.seed(i+125)
> x3baru[i]=x3[sample(n,rep=T)]
> }
> ybarures=ytopibaru+residualboot
> regbaru=lm(ybarures~x1baru+x2baru)
> regbaru
> meanrb=mean(residualboot)
> resboot=residualboot-meanrb
> sderror=sd(resboot)
> sderror
> data.entry(x1baru,x2baru,x3baru,ytopibaru,residualboot,ybaru)
Hasil pengolahan data ditampilkan dalam tabel 4.8
Tabel 4.8 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 3 Variabel Bebas
. . .
. . .
Keterangan :
x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan proses bootstrap 1000 kali
ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali
residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu Ŷ = -3.045 + 1.245 X1 + 1.182 X2 + 1.081 X3 dannilai standar error yang dihasilkan adalah 2.175285
4.1.3 Proses Pengolahan Data untuk Sampel n=30 dengan 5 Variabel Bebas
Proses pengolahan data yang dilakukan untuk data sampel berukuran n=30 dengan 5 variabel bebas sama dengan proses-proses yang dilakukan untuk data sampel sebelumnya begitu pula bentuk pembahasannya, sehingga untuk pembahasan-pembahasan yang sudah dijelaskan sebelumnya tidak dilakukan penjelasan lagi.
4.1.3.1 Pembangkitan Data untuk Sampel n=30 dengan 5 Variabel Bebas
Statement dalam R Language untuk membangkitkan data sejumlah n=30 dengan 5 variabel bebas adalah sebagai berikut :
> library(stats) > n=30
> set.seed(12343)
> x=10*runif(n) > set.seed(12344)
> x1=15*runif(n)+x+rnorm(n) > set.seed(12345)
> x2=20*runif(n)+x+rnorm(n) > set.seed(12346)
> x3=35*runif(n)+x+rnorm(n) > set.seed(12348)
> x4=40*runif(n)+x+rnorm(n) > set.seed(12349)
> x5=45*runif(n)+x+rnorm(n) > set.seed(12347)
> y=x+x1+x2+x3+x3+x4+rnorm(n) > data.entry(y,x1,x2,x3,x4,x5)
Hasil pembangkitan data ditunjukkan dalam tabel 4.9
Tabel 4.9 Hasil Pembangkitan Data untuk Sampel n=30 dengan 5
Variabel Bebas
Keterangan :
y menunjukkan variabel tak bebas, x1 menunjukkan variabel bebas pertama, x2 menunjukkan variabel bebas kedua.
x3 menunjukkan variabel bebas ketiga.
x4 menunjukkan variabel bebas keempat x5 menunjukkan variabel bebas kelima
4.1.3.2 Matrik Korelasi untuk Sampel n=30 dengan 5 Variabel Bebas Matrik korelasi dihasilkan dengan statement berikut ini
> library (base)
> matx=matrix(c(x1,x2,x3,x4,x5),ncol=5) > round(cor(matx),4)
Hasil yang diperoleh adalah sebagai berikut : [x1] [x2] [x3] [x4] [x5]
[x1] 1.0000 0.1682 0.2645 0.4519 0.4637 [x2] 0.1682 1.0000 -0.0470 -0.1043 0.0183 [x3] 0.2645 -0.0470 1.0000 0.1379 0.3258 [x4] 0.4519 -0.1043 0.1379 1.0000 0.4133 [x5] 0.4637 0.0183 0.3258 0.4133 1.0000
Hubungan antar variabel x ditunjukkan oleh diagram pencar berikut ini
> op <- par(mfrow = c(2,3), pty = "s")
> plot(x1,x2)
> plot(x1,x3)
> plot(x1,x4)
> plot(x1,x5)
> plot(x2,x3)
> plot(x2,x4)
> op <- par(mfrow = c(2,2), pty = "s")
> plot(x2,x5)
> plot(x3,x4)
> plot(x3,x5)
> plot(x4,x5)
Gambar 4.9 Diagram Pencar Antar variabel X
4.1.3.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 5 Variabel Bebas
Koefisien korelasi linier untuk data dengan 5 variabel tidak dapat digambarkan karena akan terjadi hyperplane.
4.1.3.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 5 Variabel Bebas
Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil adalah sebagai berikut
> library(stats)
> reg=lm(y~x1+x2+x3+x4+x5)
> reg
> summary(reg)
> ytopi=reg$fit
> residual=reg$res
> data.entry(y,x1,x2,x3,x4,x5,ytopi,residual)
Hasil pengolahan data ditunjukkan dalam tabel 4.10
Tabel 4.10 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari Sampel n=30 dengan 5 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
Dengan menggunakan metode kuadrat terkecil diperoleh persamaan regresi Ŷ = -4.494 + 1.175X1 + 1.204 X2 + 1.085 X3 + 1.050 X4 + 1.019X5
Nilai standard error : 2.36
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan korelasi antara y estimasi dengan residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics)
> op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Gambar 4.10 Diagram Pencar Ŷ dengan Residual
4.1.3.5 Distribusi Residual Regresi untuk Sampel n=30 dengan 5 Variabel Bebas Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan
statement dalam R Language untuk memeperoleh gambar distribusi nilai residual adalah
> library(graphics)
> res=reg$res
> plot(density(res))
Diperoleh gambar sebagai berikut :
Gambar 4.11 Distribusi Residual Regresi Dengan 5 Variabel Bebas
4.1.3.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 5 Variabel Bebas
Statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs dalam R Language
> ybaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ybaru[i]=y[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> x3baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x3baru[i]=x3[sample(n,rep=T)]
> }
> x4baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x4baru[i]=x4[sample(n,rep=T)]
> }
> x5baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x5baru[i]=x5[sample(n,rep=T)]
> }
> regbaru=lm(ybaru~x1baru+x2baru) > regbaru
> residual=regbaru$res
> residualboot<-0 > for(i in 1:1000){
> set.seed(i+123)
> residualboot[i]=residual[sample(1000,rep=T)]
> }
> sdror=sd(residualboot) > sdror
> data.entry(ybaru,x1baru,x2baru,x3baru,x4baru,x5baru)
Hasil pengolahan data ditunjukkan dalam tabel 4.11
Tabel 4.11 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari Sampel n=30 dengan 5 Variabel Bebas
. . .
. . .
Keterangan :
ybaru menunjukkan nilai y setelah dilakukan proses bootstrap pairs 1000 kali
x1baru, x2baru, x3baru, x4baru, x5baru menunjukkan nilai x1,x2,x3,x4,x5 setelah dilakukan proses bootstrap pairs 1000 kali
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh persamaan regresi yaitu
Ŷ = : -4.229 + 1.164 X1 + 1.199 X2 + 1.078 X3 + 1.050 X4 + 1.023X5 dannilai standar error yang dihasilkan adalah 2.094366
4.1.3.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 5 Variabel Bebas Hasil pengolahan data dengan menggunakan metode bootstrap residual ditunjukkan dalam tabel 4.12 dengan statement dalam R Language sebagai berikut
> ytopi=reg$fit
> residual=reg$res
> ytopibaru<-0
> for(i in 1:1000){
> set.seed(i+123)
> ytopibaru[i]=ytopi[sample(n,rep=T)]
> }
> residualboot<-0
> for(i in 1:1000){
> set.seed(i+110)
> residualboot[i]=residual[sample(n,rep=T)]
> }
> x1baru<-0
> for(i in 1:1000){
> set.seed(i+123)
> x1baru[i]=x1[sample(n,rep=T)]
> }
> x2baru<-0
> for(i in 1:1000){
> set.seed(i+124)
> x2baru[i]=x2[sample(n,rep=T)]
> }
> x3baru<-0
> for(i in 1:1000){
> set.seed(i+125)
> x3baru[i]=x3[sample(n,rep=T)]
> }
> x4baru<-0
> for(i in 1:1000){
> set.seed(i+126)
> x4baru[i]=x4[sample(n,rep=T)]
> }
> x5baru<-0
> for(i in 1:1000){
> set.seed(i+127)
> x5baru[i]=x5[sample(n,rep=T)]
> }
> ybarures=ytopibaru+residualboot
> regbaru=lm(ybarures~x1baru+x2baru)
> regbaru
> meanrb=mean(residualboot)
> resboot=residualboot-meanrb
> sderror=sd(resboot)
> sderror
> data.entry(x1baru,x2baru,x3baru,x4baru,x5baru,ytopibaru, +residualboot,ybaru)
Tabel 4.12 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual dari Sampel n=30 dengan 5 Variabel Bebas
. . .
. . .
Keterangan :
x1baru, x2baru, x3baru, x4baru, x5baru
menunjukkan nilai x1,x2,x3,x4,x5 setelah dilakukan proses bootstrap 1000 kali
ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap 1000 kali
residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap 1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap residual
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh persamaan regresi yaitu
Ŷ = -4.537 +1.166 X1 +1.203 X2 + 1.075 X3 +1.057 X4 +1.026 X5 dannilai standar error yang dihasilkan adalah 2.09187
4.2 Hasil dan Pembahasan
Dari semua data yang sudah diolah, didapatlah persamaan regresi dan standard error untuk masing-masing sampel dan masing-masing jumlah variabel.
Dari tabel persamaan regresi dan tabel standard error yang akan diperlihatkan dalam tabel 4.13 dan 4.14 dapat dilihat perbedaan nilai dari persamaan regresi dan nilai dari standar error yang dihasilkan oleh metode kuadrat terkecil, metode bootstrap pairs dan bootstrap residual.
Dari tabel standar error (tabel 4.14), terlihat bahwa meskipun terdapat perbedaan nilai yang dihasilkan oleh masing-masing metode, namun perbedaan nilai tersebut tidak terlalu jauh atau saling mendekati satu sama lain, meskipun
demikian tetap terlihat pola-pola yang menunjukkan bahwa nilai standar error metode yang satu lebih kecil dibandingkan metode lainnya
Hasil dari persamaan regresi dan standar error yang diperoleh dengan menggunakan metode kuadrat terkecil, metode bootstrap pairs dan bootstrap residual untuk semua jumlah data dan semua variabel dapat dilihat dalam tabel 4.13 dan 4.14.
Tabel 4.13 Hasil Persamaan Regresi
2 var Ŷ = -1.493 + 1.289 X1 + 1.164 X2
3 var Ŷ = -3.158 + 1.240 X1 + 1.182 X2 + 1.089 X3
N = 30
5 var Ŷ = -4.494 + 1.175 X1 + 1.204 X2 + 1.085 X3 + 1.050 X4 + 1.019 X5
2 var Ŷ = -0.4812 + 1.3055 X1 + 1.0844 X2
3 var Ŷ = -1.530 + 1.291 X1 + 1.089 X2 + 1.053 X3
N = 100
5 var Ŷ = -2.657 + 1.248 X1 + 1.092 X2 + 1.048 X3 + 1.031 X4 + 1.033 X5
2 var Ŷ = -0.2022 + 1.2924 X1 + 1.0749 X2
3 var Ŷ = -1.131 + 1.279 X1 + 1.076 X2 + 1.050 X3
N = 200
5 var Ŷ = -2.261 + 1.241 X1 + 1.072 X2 + 1.045 X3 + 1.030 X4 + 1.035 X5
2 var Ŷ = -0.2357 + 1.2507 X1 + 1.1283 X2
3 var Ŷ = -0.9261 + 1.2435 X1 + 1.1275 X2 + 1.0352 X3
N = 500
5 var Ŷ = -2.538 + 1.214 X1 + 1.116 X2 + 1.030 X3 + 1.038 X4 + 1.046 X5
2 var Ŷ = -0.4634 + 1.2405 X1 + 1.1555 X2
3 var Ŷ = -1.282 + 1.229 X1 + 1.149 X2 + 1.046 X3
Kuadrat Terkecil
N = 950
5 var Ŷ = -2.537 + 1.208 X1 + 1.139 X2 + 1.043 X3 + 1.025 X4 + 1.041 X5
2 var Ŷ = -1.374 + 1.290 X1 + 1.154 X2
3 var Ŷ = -2.856 + 1.238 X1 + 1.173 X2 + 1.083 X3
N = 30
5 var Ŷ = -4.229 + 1.164 X1 + 1.199 X2 + 1.078 X3 + 1.050 X4 + 1.023 X5
2 var Ŷ = -0.6672 + 1.3283 X1 + 1.0786 X2
3 var Ŷ = -1.838 + 1.317 X1 + 1.079 X2 + 1.061 X3
N = 100
5 var Ŷ = -2.920 + 1.271 X1 + 1.081 X2 + 1.053 X3 + 1.026 X4 + 1.039 X5
2 var Ŷ = 0.1435 + 1.2907 X1 + 1.0588 X2
3 var Ŷ = -0.7936 + 1.2806 X1 + 1.0579 X2 + 1.0491 X3
N = 200
5 var Ŷ = -1.785 + 1.248 X1 + 1.055 X2 + 1.047 X3 + 1.034 X4 + 1.021 X5
2 var Ŷ = -0.3539 + 1.2548 X1 + 1.1320 X2
3 var Ŷ = -0.8725 + 1.2496 X1 + 1.1303 X2 + 1.0267 X3
N = 500
5 var Ŷ = -2.324 + 1.223 X1 + 1.119 X2 + 1.024 X3 + 1.042 X4 + 1.034 X5
2 var Ŷ = -0.5594 + 1.2432 X1 + 1.1521 X2
3 var Ŷ = -1.499 + 1.229 X1 + 1.145 X2 + 1.053 X3
Bootstrap Pairs
N = 950
5 var Ŷ = -2.459 + 1.212 X1 + 1.135 X2 + 1.051 X3 + 1.023 X4 + 1.030 X5
2 var Ŷ = -1.503 + 1.298 X1 + 1.157 X2
3 var Ŷ = -3.045 + 1.245 X1 + 1.182 X2 + 1.081 X3
N = 30
5 var Ŷ = -4.537 + 1.166 X1 + 1.203 X2 + 1.075 X3 + 1.057 X4 + 1.026 X5
2 var Ŷ = -0.1788 + 1.3055 X1 + 1.0645 X2
3 var Ŷ = -1.307 + 1.289 X1 + 1.067 X2 + 1.060 X3
N = 100
5 var Ŷ = -2.554 + 1.252 X1 + 1.069 X2 + 1.059 X3 + 1.037 X4 + 1.026 X5
2 var Ŷ = -0.006287 + 1.296905 X1 + 1.063794 X2
3 var Ŷ = -0.9169 + 1.2802 X1 + 1.0635 X2 + 1.0514 X3
N = 200
5 var Ŷ = -2.127 + 1.240 X1 + 1.056 X2 + 1.044 X3 + 1.024 X4 + 1.047 X5
2 var Ŷ = 0.09165 + 1.23955 X1 + 1.11495 X2
3 var Ŷ = -0.7653 + 1.2317 X1 + 1.1147 X2 + 1.0423 X3
N = 500
5 var Ŷ = -2.387 + 1.199 X1 + 1.106 X2 + 1.034 X3 + 1.045 X4 + 1.044 X5
2 var Ŷ = -0.6801 + 1.2472 X1 + 1.1561 X2
3 var Ŷ = -1.499 + 1.236 X1 + 1.153 X2 + 1.043 X3
Bootstrap Residual
N = 950
5 var Ŷ = -2.823 + 1.214 X1 + 1.142 X2 + 1.040 X3 + 1.028 X4 + 1.042 X5
N = 950 2.43 2.402468 2.397367 2.382 2.359644 2.334539 2,299 2.310374 2.287538
N = 500 2.47 2.363669 2.348681 2.445 2.347885 2.332889 2.314 2.188768 2.227493
N = 200 2.442 2.349687 2.420663 2.388 2.29766 2.364284 2.32 2.245379 2.322361
N = 100 2.452 2.450007 2.437318 2.395 2.347942 2.343996 2.356 2.307948 2.271965
N = 30 2.522 2.413741 2.352203 2.351 2.193715 2.175285 2.36 2.094366 2.09187
Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual
2 Variabel 3 Variabel 5 variabel
Tabel 4.14 Hasil Standard error
4.3 Analisis Grafik
Untuk memudahkan analisis dalam membandingkan metode-metode kuadrat terkecil, bootstrap pairs dan bootstrap residual , maka nilai dari standar error yang dihasilkan akan disajikan dalam bentuk grafik seperti berikut ini :
Grafik Standard Error untuk 2 Variabel
2,25 2,3 2,35 2,4 2,45 2,5 2,55
N = 30 N = 100
N = 200
N = 500
N = 950 Jumlah Data (N)
Nilai Standard Error
Kuadrat Terkecil Bootstrap Pairs
Bootstrap Residual
Gambar 4.12 Grafik Standar Error untuk 2 variabel bebas
Grafik Standard Error untuk 3 Variabel
2 2,052,1 2,152,2 2,252,3 2,35 2,4 2,45 2,5
N = 30 N = 100
N = 200
N = 500
N = 950 Jumlah Data (N)
Nilai Standard Error
Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual
Gambar 4.13 Grafik Standar Error untuk 3 variabel bebas
Grafik Standard Error untuk 5 Variabel
1,95 2 2,05 2,1 2,15 2,2 2,25 2,3 2,35 2,4
N = 30 N = 100
N = 200
N = 500
N = 950 Jumlah Data (N)
Nilai Standard Error
Kuadrat Terkecil Bootstrap Pairs Bootstrap Residual
Gambar 4.14 Grafik Standar Error untuk 5 variabel bebas
Dari grafik dapat kita lihat bahwa kisaran nilai standard error untuk masing-masing metode yang menunjukkan bahwa nilai standard error untuk metode kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual saling mendekati dan tidak menunjukkan perbedaan nilai yang terlalu jauh.
Dapat kita lihat pula bahwa nilai standard error untuk metode bootstrap pairs dan metode bootstrap residual lebih kecil dibandingkan dengan nilai standard error metode kuadrat terkecil. Selanjutnya, bila dibandingkan lagi antara
metode bootstrap pairs dan metode bootstrap residual terlihat bahwa nilai standard error bootstrap residual cenderung lebih kecil dibandingkan nilai standard error metode bootstrap pairs terutama untuk data dengan ukuran n yang kecil, tetapi untuk data-data tertentu nilai standard error bootstrap pairs lebih kecil dibandingkan nilai standard error bootstrap residual.