nalisis regresi merupakan analisis statistik yang mempelajari hubungan antara dua variabel atau lebih. Dalam analisis regresi linear diasumsikan berlakunya bentuk hubungan linear dalam parameter. Modul regresi linear yang paling sederhana adalah regresi linear dengan satu variabel bebas (independent variable).
Pokok bahasan dalam modul ini terdiri atas dua kegiatan belajar, pertama, tentang
regresi linear dengan satu variabel bebas dan kedua, tentang inferensi dalam analisis
regresi.
Pada Kegiatan Belajar 1, Anda akan mempelajari penaksiran (estimasi) fungsi regresi
dan variansi suku sesatan
2dengan distribusi suku sesatan belum ditentukan (diasumsikan). Pada Kegiatan Belajar 2, Anda akan mempelajari inferensi pada model regresi dengan suku sesatan berdistribusi normal.
Setelah mempelajari modul ini, secara umum Anda diharapkan dapat memahami dasar-dasar pemikiran dalam analisis regresi dan dapat melakukan inferensi model regresi linear sederhana secara tepat.
Secara khusus, Anda diharapkan dapat:
1. menentukan penaksir parameter model regresi dengan metode kuadrat terkecil,
2. menentukan penaksir parameter model regresi dengan metode maksimum likelihood,
3. menentukan selang kepercayaan untuk parameter model regresi,
4. menghitung koefisien korelasi dan determinasi,
5. melakukan analisis regresi dengan pendekatan analisis variansi.
A
1
MODUL
Dra. Sri Pangesti, S.U.
PENDAHULUAN
REGRESI LINEAR
SEDERHANA
nalisis regresi adalah analisis statistik yang mempelajari hubungan antara dua atau lebih variabel kuantitatif sehingga satu variabel dapat diramalkan (predicted) dari variabel lainnya.
Hubungan antara dua variabel dapat dibedakan menjadi dua, yaitu hubungan
fungsional dan hubungan statistik. Hubungan fungsional antara dua variabel dapat
dinyatakan secara matematis; jika X variabel bebas (indenpendent variable) dan Y
variabel tak bebas (dependent variable), hubungan fungsional ditulis dalam bentuk
Y f X
Jika diketahui nilai X tertentu, fungsi f akan memberikan nilai Y yang bersesuaian.
Contoh 1.1
Misalkan Y = total nilai penjualan suatu produk (dalam ribuan rupiah) dan X =
jumlah unit produk yang terjual. Jika harga jual Rp 5.000,00 per unit produk maka
hubungan antara Y dan X dapat dinyatakan dalam Gambar 1.1.
Gambar 1.1.
A
Regresi Linear dengan
Satu Variabel Bebas
150 100 50 10 20 X Y=5X Y
SATS4312/MODUL 1
Hubungan statistik antara dua variabel tidak sempurna. Pada umumnya pada hubungan statistik, pengamatan tidak tepat jatuh pada kurve hubungan.
Contoh 1.2
Jika hubungan antara X yang menyatakan usia (dalam tahun) dan Y yang menyatakan tingkat steroid dinyatakan dalam Gambar 1.2.
Y 30 25 20 15 10 5 0 10 15 20 25 X Gambar 1.2.
Model regresi secara formal menyatakan dua hal tentang hubungan statistik, yaitu:
kecenderungan variabel tak bebas
Y berubah-ubah terhadap variabel bebas
X dalambentuk yang sistematik dan tersebarnya titik-titik di sekitar kurve hubungan statistik.
Kedua hal tersebut dinyatakan dalam suatu model regresi yaitu: untuk setiap nilai X
terdapat distribusi probabilitas dari Y dan mean dari distribusi probabilitas Y
berubah-ubah secara sistematik terhadap perberubah-ubahan nilai X .
Model Regresi Linear Sederhana
Model regresi dengan satu variabel bebas X dapat ditulis dalam bentuk
0 1 , 1, 2,
i i i
Y X i n
dengan
i
Y : nilai variabel tak bebas dalam trial ke-i,
0
,1 : parameter, i
X : konstanta yang diketahui nilainya, yakni nilai variabel bebas
dalam trial ke-i,
i
: suku sesatan random dengan E
i 0,
2, i j
, i dan j
tidak berkorelasi, kovariansi
i, j
0 untuk semua, ,
Sifat-sifat dari Model Regresi
1. Yi merupakan jumlah dari dua komponen, yaitu suku konstan 01Xi dan suku
random i.
2. Karena E
i 0 maka E Y
i E
01Xii
01Xi. Hal ini berartidistribusi dari Yi pada tingkat X dalam trial ke-i mempunyai mean
i 0 1 iE Y X
3. Nilai pengamatan Y pada trial ke-i jatuh pada jarak i dari nilai fungsi regresinya
E Yi
atau YiE Y
i i.4. Suku sesatan
i diasumsikan mempunyai variansi konstan
2 . Oleh karena itu,
2 2
i Y
.
5. Suku sesatan diasumsikan tidak berkorelasi. Karena i dan j tidak berkorelasi untuk
i j, maka Yi dan Yj tidak berkorelasi. Contoh 1.3
Diketahui model regresi Yi 9, 5 2,1 X i. Misalkan dalam trial ke-i diperoleh
nilai-nilai Xi 45, Yi 108, dan suku sesatan i 4 maka E Y
i 9,5 2,1 45
104dan Yi 104 4 108 . Visual model regresi tersebut dapat dilihat pada Gambar 1.3
berikut.
Gambar 1.3.
Model regresi linear sederhana Yi 01Xii dapat ditulis dalam bentuk lain
0 0 1
i i i
Y X X dengan X0 1. Model ini dapat kita ubah menjadi:
0 1 1 0 1 1 * 0 1 i i i i i Y X X X X X X X X Y 0 25 45 X ( )i 9,5 2,1 i E Y X ( )i 104 E Y 108 i Y 4 i SATS4312/MODUL 1
Penaksiran Fungsi Regresi
Untuk mendapatkan penaksir yang baik bagi parameter regresi
0dan 1
dapatdigunakan metode kuadrat terkecil. Untuk setiap pasangan pengamatan
X Yi, i
,i1, 2, n pandang nilai simpangan Yi terhadap E Y
i , yaitu:
0 0
i i i i
Y E Y Y X
Jumlah kuadrat dari n simpangan ini ditulis dengan notasi Q, yakni
2 0 1 1 n i i i Q Y X
Penaksir b0 dan b1 diperoleh dengan meminimumkan Q, yaitu dengan
mendeferensialkan Q terhadap 0 dan 1.
0 1 0 1 0 1 1 1 2 2 n i i i n i i i i Q Y X Q X Y X
Selanjutnya masing-masing persamaan kita samakan dengan nol serta mengganti 0
dengan b0 dan 1 dengan b1.
0 1 1 1 2 0 1 1 1 1 0 0
n n i i i i n n n i i i i i i i Y nb b X X Y b X b XKedua persamaan ini kita sebut sebagai persamaan normal. Penyelesaian persamaan
normal untuk b1 dan b0 adalah
1 1 1 1 1 2 2 1 2 1 1
n n i i n n i i i i i i i i n n i i n i i i i X Y X Y X X Y Y n b X X X X n0 1 1 1 1 1
n n i i i i b Y b X Y b X nNotasi-notasi berikut dapat dipergunakan untuk menyederhanakan penulisan rumus:
1 1 1 1 1 1 1 2 1 1 2 1 2 2 2 1 1 2 1 1 2 1 2 2 1 n n n YX i i i i i i i i i n n i i n n i i i i i i i i n n XX i i i i i n i n n i i i i i n n YY i i i i i n i n i i i i S X X Y Y X X Y X Y Y X Y X Y X Y n X Y n S X X X X X X X X n X n S Y Y Y Y Y Y Y Y n
2 1 n i n Y
Sehingga rumus untuk b1 dapat ditulis dalam bentuk lebih sederhana 1 XY
XX S b
S
dan
persamaan regresi taksiran Yˆi Y b X1
iX
. Contoh 1.4Data berikut menunjukkan jumlah unit yang diproduksi
X dan jumlah jam kerjakaryawan
Y .X 30 20 60 80 40 50 60 30 70 60
Y 73 50 128 170 87 108 135 69 148 132
Dari data dihitung 2
1 1 1 500 ; 28.400 ; 61.800 n n n i i i i i i i X X X Y
; 1 1.100 n i i Y
; 2 1 134.660 ; 10; 50; 110 n i i Y n X Y SATS4312/MODUL 1
1 1 1 1 2 2 2 1 1 500 1.100 61.800 10 2 500 28.400 10
n n i i n i i i i i n i n i i i X Y X Y n b X X n
0 1 1 1 1 1 1.100 2 500 10 10
n n i i i i b Y b X nSehingga persamaan regresi taksirannya adalah Yˆ 10 2 X, artinya kita taksir rata-rata
jam kerja bertambah dengan 2 jam untuk setiap pertambahan 1 unit produk.
Untuk model alternatif: Yi 0*1
XiX
i dengan 0* 01X , penaksirkuadrat terkecil untuk b0 adalah
*
0 0 1 1 1
b b b X Y b X b X Y . Sehingga
persamaan regresi taksiran untuk model alternatif adalah Yˆ Y b X1
X
. Persamaanregresi taksiran untuk contoh di atas adalah Yˆ 110 2
X50
.Residual
Kesalahan (residual) ke-i adalah selisih antara nilai pengamatan Yi dengan nilai
taksirannya ˆYi, ditulis dengan notasi ei.
ei Yi Yˆi Yi b0 b X1 i
Kita perlu membedakan antara nilai suku sesatan i Yi E Y
i dengan ei Yi Yˆi. Residual kita gunakan untuk mempelajari ketepatan model regresi untuk data.Contoh 1.5
Dari Contoh 1.4 telah dihitung persamaan regresi ˆY 10 2 X. Nilai taksiran ˆY , i ei,
dan ei2 dapat diperoleh dengan cara sebagai berikut. Misalkan untuk X130 dan
1 73
Y , maka diperoleh nilai-nilai Yˆ 10 2 30 701
, e173 70 3, dan e12 9.Untuk nilai-nilai Xi dan Yi lainnya, diperoleh nilai taksiran ˆY , i ei, dan
2
i
e sebagai
No. Xi Yi Y ˆi ei 2 i e 1 2 3 4 5 6 7 8 9 10 30 20 60 80 40 50 60 30 70 60 73 50 128 170 87 108 135 69 148 132 70 50 130 170 90 110 130 70 150 130 3 0 -2 0 -3 -2 5 -1 -2 2 9 0 4 0 9 4 25 1 4 4 Total 500 1.100 1.100 0 60
Sifat-Sifat Garis Regresi Taksiran (Fitted)
Persamaan garis regresi yang dihitung dengan metode kuadrat terkecil memenuhi sifat-sifat berikut:
1. Jumlah residual sama dengan nol, yakni
1 0
n i i e Bukti:
0 1 1
1 1 0 1 1 10 (dari persamaan normal)
n n i i i i n n i i i i e Y b b X Y nb b X
2. Jumlah kuadrat residual, 2
1 n i i e
adalah minimum. Hal ini sesuai dengan syarat dalampenghitungan penaksir kuadrat terkecil untuk parameter regresi.
3. Jumlah nilai observasi Yi sama dengan jumlah nilai taksiran Yˆi, yakni
1 1 ˆ n n i i i i Y Y
Bukti:Dari persamaan normal diperoleh
0 1 0 1 1 1 1 1 ˆ n n n n i i i i i i i n n Y nb b X b b X b b X Y
SATS4312/MODUL 1
4. Jumlah residual tertimbang sama dengan nol jika angka timbang adalah Xi, yakni
1 0 n i i i X e
Bukti:Dari persamaan normal dapat diturunkan
0 1
1 1 2 0 1 1 1 1 0 n n i i i i i i i n n n i i i i i i i X e X Y b b X X Y b X b X
5. Jumlah residual tertimbang dengan angka timbang ˆYi sama dengan nol, yaitu
1 ˆ 0 n i i i Y e
6. Garis regresi selalu melalui titik
X Y,
.Bukti:
Untuk X X, diperoleh Yˆ Y b X1
X
Y b X1
X
Y
Penaksiran Variansi Suku Sesatan
Variansi suku sesatan
2 kita taksir untuk mengetahui keragaman dari distribusi Y.Penaksir titik untuk 2 dapat dihitung dari residual ei. Jumlah kuadrat dari ei adalah
2
2 2 0 1 1 1 1 2 0 1 1 1 1 ˆ n n n i i i i i i i n n n i i i i i i i JKS e Y Y Y b b X Y b Y b X Y
Rumus lain untuk menghitung JKS adalah
2 2 2 1 2 1 1 n i i n i XY YY i n XX i i i X X Y Y S JKS S Y Y S X X
atau 2 2 1 1 1 1 2 2 1 1 2 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n
JKS mempunyai derajat bebas n2, dua derajat bebas hilang karena dalam perhitungan
kita gunakan penaksir untuk 0 dan 1. Kuadrat rata-rata sesatan (KRS) dirumuskan
sebagai:
2
2 2 0 1 1 1 1 ˆ 2 2 2 2 n n n i i i i i i i i e Y Y Y b b X JKS KRS n n n n
KRS merupakan taksiran tak bias dari 2, yakni
2E KRS
Contoh 1.5
Kita tinjau kembali Contoh 1.4
2 2 1 1 1 1 2 2 1 1 2 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n
2 2 2 500 1.100 61.800 10 1.100 134.660 13.660 13.600 60 10 500 28.400 10 dan 60 7, 5 2 8 JKS KRS n SATS4312/MODUL 1
1) Suatu eksperimen dilakukan untuk melihat hubungan antara dosis pemupukan
Xdan hasil panen
Y . Dari hasil perhitungan didapat nilai-nilai
2
2 1 1 70, 6; 98,5
n
n i i i i X X Y Y
1 68,3
n i i i X X Y Y ; n15; X 10,8; Y 122, 7Jika hubungan antara Y dan X diasumsikan linear, maka
a) dengan metode kuadrat terkecil, hitunglah garis regresi Yˆ b0 b X1
b) hitunglah nilai JKS dan selanjutnya hitung taksiran untuk 2
2) Diketahui observasi berpasangan
X Y,
sebagai berikut:X 1 2 3 4 5
Y 0,9 2,1 2,5 3,3 3,8
a) Buat diagram titik
b) Hitunglah penduga kuadrat terkecil b0 dan b1
c) Hitunglah nilai taksiran dari 2
Petunjuk Jawaban Latihan
1) a)
1 2 1 68,3 0,9674 70, 6
n i i i n i i X X Y Y b X X
0 1 122,7 0,9674 10,8 112, 2518 b Y b X sehingga garis regresi Yˆ 112,2518 0,9674 X
Untuk memperdalam pemahaman Anda mengenai materi di atas, silakan Anda mengerjakan latihan berikut ini!
LATIHAN
b)
2 2 1 2 1 1
n i i n i i n i i i X X Y Y JKS Y Y X X
2 68,3 98,5 32, 4251 70, 6 2 32, 4251 ˆ 2, 4942 2 13 JKS n 2) a) b)
1 2 2 1 15 12, 6 44,8 7 5 0, 7 10 15 55 5
n i i i n i i X X Y Y b X X b0 Y b X1 2,52
0,7 3 0, 42 c) 2 0 1 1 1 1
n i
n i
n i i i i i JKS Y b Y b X Y 36,8
0, 42 12,6
0,7 44,8
0,148 ˆ2 0,148 0, 0493 2 3 JKS n SATS4312/MODUL 1
1. Dalam modul ini dipelajari hubungan statistik antara variabel bebas
X danvariabel tak bebas
Y . Dalam analisis linear sederhana bentuk hubungannyaadalah garis lurus dengan model Yi 01Xii;
2
0,
i N
dan
independen.
2. Untuk mencari estimasi dari 0 dan 1 digunakan metode kuadrat terkecil
dan didapat penaksir titik:
1 1 2 1 n i i i n i i X X Y Y b X X
dan b0 Y b X1 3. Selanjutnya didefinisikan:
2 2 1 2 1 1
n i i n i i n i i i X X Y Y JKS Y Y X Xdan sebagai estimasi titik untuk 2 adalah:
2 2 JKS KRS s n RANGKUMAN
1) Tabel berikut ini menunjukkan tinggi badan
X dalam cm dan berat badan
Y dalam kg dari 10 orang dewasa.X 150 162 160 162 165 160 172 170 180 182
Y 55 67 60 70 65 79 79 76 89 90
Jika X sebagai variabel independen Y sebagai variabel dependen dalam model regresi
0 1
i i
Y X . Dari data ini dapat dihitung nilai b0 sama dengan ….
A. -103,63
B. -130,63
C. -103,36
D. -130,36
2) Lihat soal nomor 1, nilai b1 sama dengan ….
A. 1,052
B. 1,521
C. 1,062
D. 1,620
3) Lihat soal nomor 1, untuk Xk 175, nilai terhitung ˆYk sama dengan …. A. 81,28
B. 82,18 C. 82,84 D. 81,81
4) Lihat soal nomor 1, nilai variansi (s2) sama dengan ….
A. 32,61
B. 31,16
C. 32,26
D. 31,59
5) Diketahui 10 observasi berpasangan
X Y,
.X 54,5 56,4 43,2 65,2 45,5 47,5 65,0 66,5 57,3 68,0
Y 61,5 61,2 32,0 52,5 31,5 22,5 53,0 56,8 34,8 52,7
Jika digunakan model regresi Yi 01Xii; dari data di atas dihitung nilai b0
sama dengan ….
Pilih satu jawaban yang paling tepat dari beberapa alternatif jawaban yang disediakan!
TES FORMATIF 1
SATS4312/MODUL 1
A. -15,19 B. -15,20 C. -15,09 D. -15,92
6) Lihat soal nomor 5, nilai b1 sama dengan ….
A. 1,073
B. 1,072
C. 1,721
D. 1,722
7) Lihat soal nomor 5, nilai estimasi dari variansi Y, yakni s2 sama dengan ….
A. 931,46 B. 913,46 C. 116,37 D. 116,44 8) Diketahui: n277; X 65; Y 72 ;
2 1 1600; n i i X X
1 2000
n i i i X X Y Y ;
2 1 3600 n i i Y Y
Jika digunakan model regresi Yi 0 1Xii; nilai b0 sama dengan ….
A. -9,27
B. -9,25
C. -9,15
D. -9,52
9) Lihat soal nomor 8, nilai b1 sama dengan ….
A. -1,25
B. 1,25
C. -1,35
D. 1,53
10) Lihat soal nomor 8, nilai s2 sama dengan ….
A. 3,99
B. 3,98
C. 3,97
D. 4,00
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir modul ini. Hitunglah jawaban Anda yang benar. Kemudian gunakan rumus di bawah ini untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.
Rumus:
Jumlah jawaban Anda yang benar
Tingkat penguasaan = × 100%
10
Arti tingkat penguasaan yang Anda capai: 90 - 100% = baik sekali
80 - 89% = baik 70 - 79% = cukup < 70% = kurang
Bila Anda mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan
dengan Kegiatan Belajar 2. Bagus! Tetapi bila tingkat penguasaan Anda masih di bawah
80%, Anda harus mengulangi Kegiatan Belajar 1, terutama bagian yang belum Anda kuasai.
anpa memperhatikan bentuk fungsional distribusi dari i, penaksir kuadrat
terkecil b0 dan b1 selalu bersifat tak bias dan mempunyai variansi minimum
dibandingkan penaksir-penaksir tak bias linear lainnya. Untuk inferensi, kita
memerlukan asumsi tentang bentuk fungsional distribusi dari i. Salah satu asumsi baku
yang diperlukan adalah
2
0,
i N
. Secara umum model regresi dengan sesatan
normal dinyatakan sebagai
0 1
i i i
Y X
dengan
Yi : hasil observasi pada trial ke-i
i
X : konstanta yang diketahui nilainya, yakni tingkat variabel X
dalam trial ke-i
0 ,1 : parameter
2
0, i N independen; i1, 2, nSalah satu alasan digunakannya asumsi i N
0,2
karena prosedur inferensididasarkan pada distribusi t yang tidak peka terhadap penyimpangan normalitas yang
tidak besar (modurate).
Penaksiran Parameter dengan Metode Kemungkinan Maksimum
Apabila bentuk fungsional dari distribusi probabilitas suku sesatan tertentu, penaksir untuk 0, 1, dan
2
dapat dihitung dengan metode kemungkinan maksimum (maximum
likelihood). Fungsi likelihood untuk model regresi sesatan normal adalah:
2 2 0 1 1 2 0 1 2 1 2 1 1 , , 2 2 n i i i L exp Y X
T
Inferensi dalam Analisis Regresi
Nilai-nilai 0, 1, dan 2 yang memaksimumkan fungsi likelihood merupakan
penaksir-penaksir maximum likelihood yang diperoleh dengan mendeferensialkan
2
0, 1,
L terhadap 0, 1, dan 2; kemudian masing-masing disamakan dengan
nol. Untuk menyederhanakan perhitungan, kita dapat menggunakan ln L karena L dan
ln L akan maksimum untuk nilai-nilai yang sama dari 0, 1, dan 2 . Dengan mendeferensialkan
2
0 1
2 2 1 1 ln ln 2 ln 2 2 2 n i i i n n L Y X
terhadap 0 , 1, dan 2 diperoleh:
0 1 2 0 1 0 1 2 1 1 2 0 1 2 2 4 1 ln 1 ln 1 ln 1 2 2 n i i i n i i i i n i i i L Y X L X Y X L n Y X
Jika 0, 1, dan 2 masing-masing diganti dengan b0, b1 dan ˆ2
serta disamakan dengan nol, maka diperoleh persamaan
0 1 1 2 0 1 1 2 2 0 1 1 0 0 1 ˆ
n i i i n i i i i i n i i i Y b b X X Y b X b X Y b b X n Dua persamaan pertama, sama dengan persamaan normal, sehingga penaksir maximum
likelihood untuk masing-masing parameter adalah sebagai berikut.
1 1 2 1 0 1 2 ˆ n i i i i i n i i i n X X Y Y b X X b Y b X Y Y
SATS4312/MODUL 1
Jadi penaksir maksimum likelihood untuk 0 dan 1 sama dengan penaksir kuadrat
terkecil yakni b0 dan b1. Penaksir maksimum likelihood ˆ2
adalah bias sehingga untuk
mendapatkan penaksir tak bias untuk 2 digunakan KRS (Kuadrat Rata-rata Sesatan).
Inferensi tentang 1
Sering kali kita tertarik untuk melakukan inferensi tentang 1, yaitu kemiringan
(slope) dari garis regresi Yi 01Xii dengan 0 dan 1 adalah parameter, Xi
adalah konstanta yang diketahui, dan i N
0,2
adalah independen. Sebelum kitapelajari inferensi tentang 1, kita bahas terlebih dahulu tentang distribusi sampling
penaksir titik untuk 1 yaitu
1 1 2 1
n i i i n i i i X X Y Y b X XDari pengambilan sampel berulang pada nilai X tetap, diperoleh nilai b1 yang bervariasi.
Untuk model regresi sesatan normal akan dibuktikan bahwa
2 1 1 2 1 ;
n i i i b N X X Bukti: 1b dapat dinyatakan sebagai kombinasi linear dari Yi yaitu:
1 1 1 2 2 1 1 1
n n i i i i n i i i i n n i i i i i X X Y Y X X Y b k Y X X X X dengan 2 1 ( ) i i n i i X X k X X
Untuk Xi tetap, ki merupakan kuantitas tetap. Oleh karena itu, b1 merupakan kombinasi
1. 1 0
n i i k Bukti: 2 1 1 1 ( ) n n i i n i i i i X X k X X
1 2 2 1 1 0 0
n i i n n i i i i X X X X X X 2. 1 1
n i i i k X Bukti:
2 1 1 1 ( ) n n i i i i n i i i i X X X k X X X
2 2 1 2 2 1 1 1 1 ( ) n i n i i n n i i i i i X X X X X X X X
3. 2 2 1 1 1 ( ) n i n i i i k X X
Bukti:
2 2 2 1 1 1 ( ) n n i i n i i i i X X k X X
2 2 2 1 2 1 1 1 n 1 i n n i i i i i X X X X X X
Kembali kita perhatikan distribusi sampling dari b1 pada model regresi linear dengan
2
0,
i N
. Distribusi sampling dari b1 adalah normal, hal ini akibat dari b1
merupakan kombinasi linear dari Yi. Akan kita buktikan b1 merupakan penaksir tak bias
untuk 1 atau E b
1 1. Bukti:
1 1 0 1 0 1 1 n i i i i i n n n i i i i i E b E k Y k E Y k X k k X
SATS4312/MODUL 1
Selanjutnya variansi dari b1 dijabarkan sebagai berikut.
2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 1 1
n n i i i i i i n n i i n i i i i b k Y k Y k k X X Penaksir untuk 2
b1 diperoleh dengan mengganti 2 dengan KRS sehingga penaksirtak bias untuk 2
b1 adalah:
2 1 2 2 1 2 1 1
n n i i n i i i i KRS KRS s b X X X X nUntuk membuktikan bahwa b1 mempunyai variansi minimum di antara semua
penaksir tak bias linear, kita nyatakan penaksir linear tak bias untuk 1 dalam bentuk:
1 1
n i i i c Y dengan ci adalah konstanta sembarang.
Jika 1 penaksir tak bias maka:
1
1 1 1
n n i i i i i i E E c Y c E Y .Karena E Y
i 01Xi, maka syarat tak bias di atas menjadi:
1
0 1
0 1 1 1 1 1 .
n i i
n i
n i i i i i E c X c c X Agar syarat tak bias berlaku maka haruslah
1 0
n i i c dan 1 1
n i i i c X .Variansi dari 1 adalah:
2 2 2 2 2 1 1 1
n i i
n i i i c Y c .Kita definisikan: i i i c k d ;
2 1
i i n i i X X k X X; di adalah konstanta sembarang,
sehingga
2 2 2 1 1 2 2 1 2 2 2 1 1 1 2 n i i n i i i n n n i i i i i i i c k d k d k d
Telah kita buktikan bahwa
2 2 1 1 1 ( ) n i n i i i k X X
dan
2 2 2 1 1
n i i b k sehingga
2 1 1 1 1 2 2 1 1 1 1 1 2 2 1 1 1 ( ) 1 0 n n n n i i i i i i i i i i i i n i i n n i i i i i n n i i i i i n n i i i i k d k c k c k k X X c X X X X c X X c X X X X
Kita peroleh 2
1 2
1 2 2 1
n i i b d , sehingga terbukti 2
1 2
b1 . Nilaiterkecil diperoleh jika 2
1 0
n i i d atau semua 1 0
n i i d sehingga ci ki. Jadi,
2 1 b SATS4312/MODUL 1
Distribusi Sampling dari
1 1 1 b s b Diketahui b1 N
1, 2
b1
dengan
2 2 1 2 1
n i i b X X , sehingga statistik
1 1 1 0, 1 b N b . Pada umumnya 2
b1 tidak diketahui, diganti dengan s b
1 .Statistik
1 1 1 b s b dapat ditulis dalam bentuk
1 1 1 1 1 s b b b b . Diketahui
1 1 1 b z b dan
2 2 2 1 1 2 2 2 2 2 1 2 1 2 2 2 2
n i i n i i n KRS JKS X X s b KRS n JKS b n n X X sehingga
1 1 2 1 2 2 n b z s b n Karena b1 dan 2 JKS independen maka z dan
2 independen, sehingga
1 1 2 1 n b t s b .Selang Kepercayaan untuk 1
Karena
1 1 2 1 n b t s b maka kita dapat menyatakan
1 1 ; 2 1 ; 2 1 2 2 1 n n b P t t s b Karena distribusi t simetri, maka ketidaksamaan di atas dapat kita tulis sebagai berikut.
1 1 1 1 1 ; 2 ; 2 2 2 1 n n P b t s b b t s b Karena probabilitas ini berlaku untuk semua nilai yang mungkin dari 1 maka batas
kepercayaan untuk 1 adalah:
1 1 ; 2 2 n b t s bContoh 1.6
Diketahui data sebagai berikut.
i
X 1,5 1,8 2,4 3,0 3,5 3,9 4,4 4,8 5,0
i
Y 4,8 5,7 7,0 8,3 10,9 12,4 13,1 13,6 15,3
Jika digunakan model regresi linear Yi 0 1 Xi i dengan i N
0,2
,independen. Untuk menaksir 1 dengan selang kepercayaan 95%, dari data diperoleh:
1 9; 30,3
n i i n X ; X 3,3667; 1 91,1
n i i Y ; Y 10,1222; 2 1 115,11
n i i X ; 2 1 1036, 65
n i i Y ; 1 345, 09
n i i i X Y
1 1 1 1 2 2 2 1 1 30, 3 91,1 345, 09 9 2, 9303 30, 3 115,11 9
n n i i n i i i i i n i n i i i X Y X Y n b X X n 2 2 1 1 1 1 2 2 1 2 1 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n
2 2 2 30,3 91,1 345, 09 9 91,1 1036, 65 2, 026 9 30,3 115,11 9 2, 026 0, 289 2 7 JKS KRS n SATS4312/MODUL 1
2 1 2 2 2 1 1 0, 289 0, 289 0, 02206 13,1 30,3 115,11 9
n XX i n i i i KRS KRS s b S X X n
1 0, 02206 0,1485 s b dan t(0,025; 7)2, 365Selang kepercayaan 95% untuk 1 adalah
1
1 2,9303 2,365 0,1485 2,9303 2,365 0,1485 atau 2,579 3, 282 Uji tentang 1 Karena
1 1 2 1 n b t s b , uji tentang 1 dapat kita lakukan berdasarkan distribusi t.
Contoh 1.7
Jika kita hanya ingin menguji apakah ada ( atau tidak) hubungan linear antara Y dan X maka hipotesis kita rumuskan sebagai:
H0:10 danH1:1 0
Untuk 0, 05, kesimpulan tentang H0 dapat diperoleh dengan menggunakan selang
kepercayaan 95% untuk 1. Untuk Contoh 1.6, selang kepercayaan 95% untuk 1 adalah
1
2,579 3, 282 tidak memuat 0 (batas kepercayaan kiri dan kanan positif) sehingga
diperoleh kesimpulan menolak H0.
Uji yang lebih tegas dapat dilakukan berdasarkan statistik uji
11 b t s b . Aturanpengambilan kesimpulan untuk taraf nyata adalah menerima H0 jika
; 2 2 n t t dan menolak H0 jika ; 2 2 n t t . Contoh 1.8
Dari Contoh 1.6, hipotesis kita tulis sebagai H0:10 dan H1:10. Selanjutnya
kita hitung statistik uji
11 2, 9303 19, 73 0,1485 b t s b . Untuk taraf nyata 0, 05,
diperoleh nilai t0,025;72,365. Karena t 2,365 maka kita menolak H0:10,
Sering kali kita ingin menguji apakah 1 sama dengan nilai tertentu, hipotesis kita rumuskan sebagai: 0: 1 10 dan 1: 1 10 H H Statistik uji:
1 1 1 b t s b Jika kita ingin menguji apakah 1 positif, hipotesis dinyatakan sebagai:
H0:1 0 dan H1:1 0
Kesimpulan untuk taraf nyata adalah menerima H0 jika ; 2
n t t dan menolak H0 jika tt;n2. Contoh 1.9
Dari Contoh 1.8 diperoleh
1 1 1 19, 73 b t s b . Untuk 0, 05, diperoleh nilai
0,05;71,895
t . Karena t1,895, maka H0 ditolak, berarti 1 positif.
Inferensi tentang 0
Sebelum kita melakukan inferensi untuk 0, kita pelajari terlebih dahulu tentang
distribusi sampling dari b0. Penaksir titik untuk 0 adalah:
0 1
b Y b X
dapat dinyatakan sebagai kombinasi linear dari Yi yaitu:
0 1 n i i i b l Y
dengan li 1 X ki n dan
2 1
i i n i i X X k X XSATS4312/MODUL 1
Distribusi sampling untuk b0 adalah normal dan b0 merupakan penaksir tak bias dari 0
atau E b
0 0. Bukti: 0 1 b Y b X
0
1 0 1 1 0 E b E Y E b X X X Variansi dari b0 kita peroleh sebagi berikut.
0 1
n i i i b l Y
2 2 2 2 2 2 2 0 2 1 1 1 1 ( ) n n i i i n i i i i X b l Y l n X X
Sehingga untuk model regresi linear dengan sesatan normal, diperoleh:
2 0 0, 0 b N b dengan
2 2 2 0 2 1 1 ( ) n i i X b n X X
dan distribusi sampling untuk
0 0 0 b b adalah normal standar atau
0 0 0 0,1 b N b .Penaksir untuk 2
b0 adalah:
2 2 2 1 0 2 2 1 1 1
n i i n n i i i i X X s b KRS KRS n X X n X X dan
0 0 2 0 n b t s b Selang kepercayaan untuk 0 pada taraf kepercayaan
1
adalah:
0 0 0 0 0 ;n 2 ;n 2 b t s b b t s b Contoh 1.10
Dari data pada Contoh 1.6 diperoleh:
1 30,3
n i i X ; 2 1 115,11
n i i X ; X 3,3667; Y 10,1222; n = 9; b12,9303; dan 0, 289KRS . Selanjutnya kita hitung:
0 1 10,1222 2,9303 3,3667 0, 2568 b Y b X
2 2 1 0 2 1 115,11 0, 289 0, 282 9 13,1 ( ) n i i n i i X s b KRS n X X
0 0, 282 0,531 s b Untuk taraf kepercayaan 90%, diperoleh t0,05; 71,895 sehingga selang kepercayaan
untuk 0 adalah:
0
00, 2568 1,895 0,531 0, 2568 1,895 0,531 atau 0,749 1, 263
Penaksir Selang untuk E Y
hSalah satu tujuan utama analisis regresi adalah untuk menaksir mean dari satu atau
lebih distribusi probabilitas dari Y. Misalkan Xh adalah taraf dari X di mana kita ingin
menaksir mean dari Y dan Xh merupakan salah satu nilai sampel atau suatu nilai lain dari
X, maka untuk X Xh diperoleh mean Yˆh E Y
h .Untuk model regresi dengan sesatan normal, distribusi sampling dari Yˆh b0 b X1 h
adalah normal dengan mean dan variansi masing-masing adalah:
ˆ
h h E Y E Y dan
2 2 2 2 1 1 ˆ
h h n i i X X Y n X X ˆ hY merupakan penaksir titik tak bias dari E Y
h yang ditunjukkan sebagai berikut.
0 1 ˆ h h E Y E b b X E b X E bSATS4312/MODUL 1
Keragaman dari distribusi sampling ˆYh dipengaruhi oleh besarnya simpangan Xh dari
X. Makin jauh Xh dari X, nilai 2
Yˆh makin besar. Untuk menentukan 2
Yˆh , kitabuktikan dulu bahwa b1 dan Y tidak berkorelasi.
Bukti: 1 1 n i i Y Y n
; 1 1 n i i i b k Y
dengan 2 1 ( ) i i n i i X X k X X
dan Yi independen. 2
1
2
2 1 1 1 1 , 0, karena 0
n
n
n i i i i i i i Y b k Y k k n n Sekarang kita hitung variansi ˆYh, yaitu:
2 2 1 ˆ h h Y Y b X X Karena Y dan b1 independen serta Xh dan X konstan maka diperoleh:
2 2 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2 1 ˆ 1 h h i h h n i i h n i i Y Y X X b Y X X b n X X n X X X X n X X
Penaksir untuk 2
Yˆh adalah:
2 2 2 1 1 ˆ
h h n i i X X s Y KRS n X XUntuk model regresi dengan sesatan normal, distribusi sampling
ˆ ˆ h h h Y E Y s Y adalahdistribusi tn2, sehingga selang kepercayaan
1
100% untuk E Y
h adalah:
; 2 ; 2 2 2 ˆ ˆ ˆ ˆ h h h h h n n Y t s Y E Y Y t s Y Contoh 1.11Dari data pada Contoh 1.6 diperoleh:
0 0, 2568 b ; b12,93;
2 1 13,1
n i i X X ; KRS0, 289; n = 9; X 3,3667 Untuk Xh 4 diperoleh:
ˆ 0, 2568 2,93 4 11,977 h Y
2 2 ˆ 1 4 3,3667 0, 289 0, 04096 9 13,1 h s Y atau s Y
ˆh 0, 202 0,025; 7 2,365 tSelang kepercayaan 95% untuk E Y
h adalah:
11,977 2,365 0, 202 11,977 2,365 0, 202 11, 499 12, 455 h h E Y E Y Peramalan Pengamatan Baru
Pengamatan baru Yh baru dipandang sebagi hasil dari suatu trial baru yang bebas
terhadap trial lain. Jika parameter 0 dan 1 diketahui maka selang peramalan
1
100% untuk Yh baru adalah:
( )
2 2 h h baru h E Y z Y E Y z Contoh 1.12 Misalkan diketahui 0 9, 5; 1 2,1; 2 10 .UntukXh 40 didapatE Y
40 9,5
2,1 40 93,5. Selang peramalan 95% untuk Y40adalah:
SATS4312/MODUL 1
Jika parameter 0 dan 1 tidak diketahui, kita gunakan penaksir b0 dan b1. Selang
peramalan di atas tidak dapat kita gunakan karena kita hanya menggunakan taksiran dari
hE Y . Dalam penaksiran untuk E Y
h , kita gunakan selang kepercayaan sehingga letakdistribusi dari Y tidak dapat ditentukan dengan tepat.
Dengan menganggap pengamatan baru independen terhadap sampel yang digunakan untuk menaksir garis regresi, maka variansi dari Yh baru terdiri dari variansi distribusi
sampling ˆYh dan variansi distribusi Y pada X Xh, yaitu:
2 2 2 2 ( ) ˆ ˆ h baru h h Y Y Y Y Y Penaksir tak bias dari 2
Yh baru
adalah:s2
Yh baru
s2
Yˆh KRS
2 2 1 1 1
h n i i X X KRS n X X Contoh 1.13Dari data pada Contoh 1.6 diperoleh:
3,3667 X ;
2 1 13,1
n i i X X ; KRS0, 289; n = 9; b0 0, 2568; b1 2,93Sehingga untuk Xh 2 diperoleh Yˆh0, 2568 2,93 2
6,117, t0,025; 72,365; dan
2 2 2 2 3,3667 1 ˆ 0, 289 1 0,362 9 13,1 s Y .Selang peramalan 95% untuk Yh baru adalah:
6,1172,365 0,362 Yh baru 6,1172,365 0,362 atau 4,693Yh baru 7,541
Ramalan Mean dari m Pengamatan Baru
Sering kali diinginkan meramal mean dari m pengamatan baru untuk taraf variabel
bebas, X tertentu. Nilai ramalan mean dari Y ditulis sebagai Yh baru . Batas ramalan
1
100% untuk Yh baru adalah:
; 2 2 ˆ h h baru n Y t s Y dengan
2 2 ˆ h h baru KRS s Y s Y m atau ekuivalen dengan
2 2 2 1 1 1
h h baru n i i X X s Y KRS m n X XDari rumus diketahui bahwa s Y2
h baru
mempunyai dua komponen yaitu variansidistribusi sampling dari Yh dan variansi mean m pengamatan dari distribusi probabilitas Y
pada X Xh.
Contoh 1.14
Kita tinjau kembali Contoh 1.6. Jika m3, untuk Xh 2 akan dihitung selang
ramalan 90% untuk Yh baru . Dari data yang ada telah dihitung:
ˆ 6,117 h Y ; s2
Yˆh 0, 362 ; KRS0, 289; 2
0, 362 0, 289 0, 458 3 h baru s Y atau
h baru
0, 677 s Y dan t0,05; 71,895.Sehingga selang ramalan 90% untuk Yh baru adalah:
6,117 1,895 0, 677 Yh baru 6,117 1,895 0, 677 atau 4,834Yh baru 7,399
Selang ramalan Yh baru lebih sempit dibandingkan dengan selang ramalan untuk Yh baru karena selang ramalan untuk Yh baru memuat Yh baru .
Pendekatan Analisis Variansi untuk Analisis Regresi
Dasar pendekatan analisis variansi adalah pemecahan jumlah kuadrat dan derajat
bebas yang berkaitan dengan Y. Pandang simpangan total
YiY
pada Gambar 1.4berikut ini. X Y 0 1 ˆ Yb b X ˆ i i YY ˆ i YY i YY Y i Y