• Tidak ada hasil yang ditemukan

REGRESI LINEAR SEDERHANA

N/A
N/A
Protected

Academic year: 2021

Membagikan "REGRESI LINEAR SEDERHANA"

Copied!
52
0
0

Teks penuh

(1)

nalisis regresi merupakan analisis statistik yang mempelajari hubungan antara dua variabel atau lebih. Dalam analisis regresi linear diasumsikan berlakunya bentuk hubungan linear dalam parameter. Modul regresi linear yang paling sederhana adalah regresi linear dengan satu variabel bebas (independent variable).

Pokok bahasan dalam modul ini terdiri atas dua kegiatan belajar, pertama, tentang

regresi linear dengan satu variabel bebas dan kedua, tentang inferensi dalam analisis

regresi.

Pada Kegiatan Belajar 1, Anda akan mempelajari penaksiran (estimasi) fungsi regresi

dan variansi suku sesatan

 

2

dengan distribusi suku sesatan belum ditentukan (diasumsikan). Pada Kegiatan Belajar 2, Anda akan mempelajari inferensi pada model regresi dengan suku sesatan berdistribusi normal.

Setelah mempelajari modul ini, secara umum Anda diharapkan dapat memahami dasar-dasar pemikiran dalam analisis regresi dan dapat melakukan inferensi model regresi linear sederhana secara tepat.

Secara khusus, Anda diharapkan dapat:

1. menentukan penaksir parameter model regresi dengan metode kuadrat terkecil,

2. menentukan penaksir parameter model regresi dengan metode maksimum likelihood,

3. menentukan selang kepercayaan untuk parameter model regresi,

4. menghitung koefisien korelasi dan determinasi,

5. melakukan analisis regresi dengan pendekatan analisis variansi.

A

1

MODUL

Dra. Sri Pangesti, S.U.

PENDAHULUAN



REGRESI LINEAR

SEDERHANA

(2)

nalisis regresi adalah analisis statistik yang mempelajari hubungan antara dua atau lebih variabel kuantitatif sehingga satu variabel dapat diramalkan (predicted) dari variabel lainnya.

Hubungan antara dua variabel dapat dibedakan menjadi dua, yaitu hubungan

fungsional dan hubungan statistik. Hubungan fungsional antara dua variabel dapat

dinyatakan secara matematis; jika X variabel bebas (indenpendent variable) dan Y

variabel tak bebas (dependent variable), hubungan fungsional ditulis dalam bentuk

 

Yf X

Jika diketahui nilai X tertentu, fungsi f akan memberikan nilai Y yang bersesuaian.

Contoh 1.1

Misalkan Y = total nilai penjualan suatu produk (dalam ribuan rupiah) dan X =

jumlah unit produk yang terjual. Jika harga jual Rp 5.000,00 per unit produk maka

hubungan antara Y dan X dapat dinyatakan dalam Gambar 1.1.

Gambar 1.1.

A

Regresi Linear dengan

Satu Variabel Bebas

150 100 50 10 20 X Y=5X Y

(3)

SATS4312/MODUL 1

Hubungan statistik antara dua variabel tidak sempurna. Pada umumnya pada hubungan statistik, pengamatan tidak tepat jatuh pada kurve hubungan.

Contoh 1.2

Jika hubungan antara X yang menyatakan usia (dalam tahun) dan Y yang menyatakan tingkat steroid dinyatakan dalam Gambar 1.2.

Y 30 25 20 15 10 5 0 10 15 20 25 X Gambar 1.2.

Model regresi secara formal menyatakan dua hal tentang hubungan statistik, yaitu:

kecenderungan variabel tak bebas

 

Y berubah-ubah terhadap variabel bebas

 

X dalam

bentuk yang sistematik dan tersebarnya titik-titik di sekitar kurve hubungan statistik.

Kedua hal tersebut dinyatakan dalam suatu model regresi yaitu: untuk setiap nilai X

terdapat distribusi probabilitas dari Y dan mean dari distribusi probabilitas Y

berubah-ubah secara sistematik terhadap perberubah-ubahan nilai X .

Model Regresi Linear Sederhana

Model regresi dengan satu variabel bebas X dapat ditulis dalam bentuk

0 1 , 1, 2,

i i i

Y   X  in

dengan

i

Y : nilai variabel tak bebas dalam trial ke-i,

0

 ,1 : parameter, i

X : konstanta yang diketahui nilainya, yakni nilai variabel bebas

dalam trial ke-i,

i

 : suku sesatan random dengan E

 

i 0,

2

, i j

    , i dan j

 tidak berkorelasi, kovariansi   

i, j

0 untuk semua

, ,

(4)

Sifat-sifat dari Model Regresi

1. Yi merupakan jumlah dari dua komponen, yaitu suku konstan 01Xi dan suku

random i.

2. Karena E

 

i 0 maka E Y

 

iE

01Xii

01Xi. Hal ini berarti

distribusi dari Yi pada tingkat X dalam trial ke-i mempunyai mean

 

i 0 1 i

E Y  X

3. Nilai pengamatan Y pada trial ke-i jatuh pada jarak i dari nilai fungsi regresinya

 

E Yi

atau YiE Y

 

i i.

4. Suku sesatan

 

i diasumsikan mempunyai variansi konstan

 

2 . Oleh karena itu,

 

2 2

i Y

  .

5. Suku sesatan diasumsikan tidak berkorelasi. Karena i dan j tidak berkorelasi untuk

ij, maka Yi dan Yj tidak berkorelasi. Contoh 1.3

Diketahui model regresi Yi 9, 5 2,1 X i. Misalkan dalam trial ke-i diperoleh

nilai-nilai Xi 45, Yi 108, dan suku sesatan i 4 maka E Y

 

i 9,5 2,1 45

 

104

dan Yi 104 4 108  . Visual model regresi tersebut dapat dilihat pada Gambar 1.3

berikut.

Gambar 1.3.

Model regresi linear sederhana Yi 01Xii dapat ditulis dalam bentuk lain

0 0 1

  

i i i

YXX  dengan X0 1. Model ini dapat kita ubah menjadi:

0 1 1 0 1 1 * 0 1 i i i i i Y X X X X X X X X                          Y 0 25 45 X ( )i 9,5 2,1 i E Y   X ( )i 104 E Y  108 i Y 4 i  

(5)

SATS4312/MODUL 1

Penaksiran Fungsi Regresi

Untuk mendapatkan penaksir yang baik bagi parameter regresi

0dan 1

dapat

digunakan metode kuadrat terkecil. Untuk setiap pasangan pengamatan

X Yi, i

,i1, 2, n pandang nilai simpangan Yi terhadap E Y

 

i , yaitu:

 

0 0

i i i i

YE Y  Y   X

Jumlah kuadrat dari n simpangan ini ditulis dengan notasi Q, yakni

2 0 1 1 n i i i Q Y   X  

 

Penaksir b0 dan b1 diperoleh dengan meminimumkan Q, yaitu dengan

mendeferensialkan Q terhadap 0 dan 1.

0 1 0 1 0 1 1 1 2 2 n i i i n i i i i Q Y X Q X Y X                    

Selanjutnya masing-masing persamaan kita samakan dengan nol serta mengganti 0

dengan b0 dan 1 dengan b1.

0 1 1 1 2 0 1 1 1 1 0 0           

n n i i i i n n n i i i i i i i Y nb b X X Y b X b X

Kedua persamaan ini kita sebut sebagai persamaan normal. Penyelesaian persamaan

normal untuk b1 dan b0 adalah



1 1 1 1 1 2 2 1 2 1 1                   

 

n n i i n n i i i i i i i i n n i i n i i i i X Y X Y X X Y Y n b X X X X n

(6)

0 1 1 1 1 1        

n n i i i i b Y b X Y b X n

Notasi-notasi berikut dapat dipergunakan untuk menyederhanakan penulisan rumus:



1 1 1 1 1 1 1 2 1 1 2 1 2 2 2 1 1 2 1 1 2 1 2 2 1 n n n YX i i i i i i i i i n n i i n n i i i i i i i i n n XX i i i i i n i n n i i i i i n n YY i i i i i n i n i i i i S X X Y Y X X Y X Y Y X Y X Y X Y n X Y n S X X X X X X X X n X n S Y Y Y Y Y Y Y Y n                                                      

 

2 1 n i n Y  

Sehingga rumus untuk b1 dapat ditulis dalam bentuk lebih sederhana 1 XY

XX S b

S

 dan

persamaan regresi taksiran Yˆi  Y b X1

iX

. Contoh 1.4

Data berikut menunjukkan jumlah unit yang diproduksi

 

X dan jumlah jam kerja

karyawan

 

Y .

X 30 20 60 80 40 50 60 30 70 60

Y 73 50 128 170 87 108 135 69 148 132

Dari data dihitung 2

1 1 1 500 ; 28.400 ; 61.800 n n n i i i i i i i X X X Y      

; 1 1.100 n i i Y  

; 2 1 134.660 ; 10; 50; 110 n i i Y n X Y     

(7)

SATS4312/MODUL 1

1 1 1 1 2 2 2 1 1 500 1.100 61.800 10 2 500 28.400 10                

 

n n i i n i i i i i n i n i i i X Y X Y n b X X n

0 1 1 1 1 1 1.100 2 500 10 10         

n n i i i i b Y b X n

Sehingga persamaan regresi taksirannya adalah Yˆ 10 2  X, artinya kita taksir rata-rata

jam kerja bertambah dengan 2 jam untuk setiap pertambahan 1 unit produk.

Untuk model alternatif: Yi 0*1

XiX

i dengan 0* 01X , penaksir

kuadrat terkecil untuk b0 adalah

*

0 0 1 1 1

bbb XYb Xb XY . Sehingga

persamaan regresi taksiran untuk model alternatif adalah Yˆ  Y b X1

X

. Persamaan

regresi taksiran untuk contoh di atas adalah Yˆ 110 2 

X50

.

Residual

Kesalahan (residual) ke-i adalah selisih antara nilai pengamatan Yi dengan nilai

taksirannya ˆYi, ditulis dengan notasi ei.

ei     Yi Yˆi Yi b0 b X1 i

Kita perlu membedakan antara nilai suku sesatan i  Yi E Y

 

i dengan ei  Yi Yˆi. Residual kita gunakan untuk mempelajari ketepatan model regresi untuk data.

Contoh 1.5

Dari Contoh 1.4 telah dihitung persamaan regresi ˆY 10 2 X. Nilai taksiran ˆY , i ei,

dan ei2 dapat diperoleh dengan cara sebagai berikut. Misalkan untuk X130 dan

1 73

Y , maka diperoleh nilai-nilai Yˆ 10 2 30 701 

 

 , e173 70 3, dan e12 9.

Untuk nilai-nilai Xi dan Yi lainnya, diperoleh nilai taksiran ˆY , i ei, dan

2

i

e sebagai

(8)

No. Xi Yi Y ˆi ei 2 i e 1 2 3 4 5 6 7 8 9 10 30 20 60 80 40 50 60 30 70 60 73 50 128 170 87 108 135 69 148 132 70 50 130 170 90 110 130 70 150 130 3 0 -2 0 -3 -2 5 -1 -2 2 9 0 4 0 9 4 25 1 4 4 Total 500 1.100 1.100 0 60

Sifat-Sifat Garis Regresi Taksiran (Fitted)

Persamaan garis regresi yang dihitung dengan metode kuadrat terkecil memenuhi sifat-sifat berikut:

1. Jumlah residual sama dengan nol, yakni

1 0  

n i i e Bukti:

0 1 1

1 1 0 1 1 1

0 (dari persamaan normal)

n n i i i i n n i i i i e Y b b X Y nb b X           

 

2. Jumlah kuadrat residual, 2

1 n i i e

adalah minimum. Hal ini sesuai dengan syarat dalam

penghitungan penaksir kuadrat terkecil untuk parameter regresi.

3. Jumlah nilai observasi Yi sama dengan jumlah nilai taksiran Yˆi, yakni

1 1 ˆ n n i i i i Y Y   

 

Bukti:

Dari persamaan normal diperoleh

0 1 0 1 1 1 1 1 ˆ n n n n i i i i i i i n n Y nb b X b b X b b X Y           

  

(9)

SATS4312/MODUL 1

4. Jumlah residual tertimbang sama dengan nol jika angka timbang adalah Xi, yakni

1 0 n i i i X e  

Bukti:

Dari persamaan normal dapat diturunkan

0 1

1 1 2 0 1 1 1 1 0 n n i i i i i i i n n n i i i i i i i X e X Y b b X X Y b X b X            

5. Jumlah residual tertimbang dengan angka timbang ˆYi sama dengan nol, yaitu

1 ˆ 0 n i i i Y e  

6. Garis regresi selalu melalui titik

X Y,

.

Bukti:

Untuk XX, diperoleh Yˆ  Y b X1

X

 Y b X1

X

Y

Penaksiran Variansi Suku Sesatan

Variansi suku sesatan

 

2 kita taksir untuk mengetahui keragaman dari distribusi Y.

Penaksir titik untuk 2 dapat dihitung dari residual ei. Jumlah kuadrat dari ei adalah

2

2 2 0 1 1 1 1 2 0 1 1 1 1 ˆ n n n i i i i i i i n n n i i i i i i i JKS e Y Y Y b b X Y b Y b X Y             

Rumus lain untuk menghitung JKS adalah



2 2 2 1 2 1 1 n i i n i XY YY i n XX i i i X X Y Y S JKS S Y Y S X X                 

(10)

atau 2 2 1 1 1 1 2 2 1 1 2 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n                                

 

JKS mempunyai derajat bebas n2, dua derajat bebas hilang karena dalam perhitungan

kita gunakan penaksir untuk 0 dan 1. Kuadrat rata-rata sesatan (KRS) dirumuskan

sebagai:

2

2 2 0 1 1 1 1 ˆ 2 2 2 2 n n n i i i i i i i i e Y Y Y b b X JKS KRS n n n n              

 

KRS merupakan taksiran tak bias dari 2, yakni

2

E KRS 

Contoh 1.5

Kita tinjau kembali Contoh 1.4

2 2 1 1 1 1 2 2 1 1 2 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n                                   

 

 

 

2 2 2 500 1.100 61.800 10 1.100 134.660 13.660 13.600 60 10 500 28.400 10                   dan 60 7, 5 2 8 JKS KRS n    

(11)

SATS4312/MODUL 1

1) Suatu eksperimen dilakukan untuk melihat hubungan antara dosis pemupukan

 

X

dan hasil panen

 

Y . Dari hasil perhitungan didapat nilai-nilai

2

2 1 1 70, 6; 98,5      

n

n i i i i X X Y Y



1 68,3    

n i i i X X Y Y ; n15; X 10,8; Y 122, 7

Jika hubungan antara Y dan X diasumsikan linear, maka

a) dengan metode kuadrat terkecil, hitunglah garis regresi Yˆ b0 b X1

b) hitunglah nilai JKS dan selanjutnya hitung taksiran untuk 2

2) Diketahui observasi berpasangan

X Y,

sebagai berikut:

X 1 2 3 4 5

Y 0,9 2,1 2,5 3,3 3,8

a) Buat diagram titik

b) Hitunglah penduga kuadrat terkecil b0 dan b1

c) Hitunglah nilai taksiran dari 2

Petunjuk Jawaban Latihan

1) a)



1 2 1 68,3 0,9674 70, 6        

n i i i n i i X X Y Y b X X



0 1 122,7 0,9674 10,8 112, 2518 b  Y b X  

sehingga garis regresi Yˆ 112,2518 0,9674  X

Untuk memperdalam pemahaman Anda mengenai materi di atas, silakan Anda mengerjakan latihan berikut ini!

LATIHAN

(12)

b)



2 2 1 2 1 1               

n i i n i i n i i i X X Y Y JKS Y Y X X

2 68,3 98,5 32, 4251 70, 6    2 32, 4251 ˆ 2, 4942 2 13     JKS n  2) a) b)



 

 

1 2 2 1 15 12, 6 44,8 7 5 0, 7 10 15 55 5         

n i i i n i i X X Y Y b X X b0 Y b X1 2,52

  

0,7 3 0, 42 c) 2 0 1 1 1 1    

n i

n i

n i i i i i JKS Y b Y b X Y 36,8

0, 42 12,6



  

 0,7 44,8

0,148 ˆ2 0,148 0, 0493 2 3 JKS n     

(13)

SATS4312/MODUL 1

1. Dalam modul ini dipelajari hubungan statistik antara variabel bebas

 

X dan

variabel tak bebas

 

Y . Dalam analisis linear sederhana bentuk hubungannya

adalah garis lurus dengan model Yi 01Xii;

2

0,

i N

  dan

independen.

2. Untuk mencari estimasi dari 0 dan 1 digunakan metode kuadrat terkecil

dan didapat penaksir titik:



1 1 2 1 n i i i n i i X X Y Y b X X      

dan b0  Y b X1 3. Selanjutnya didefinisikan:



2 2 1 2 1 1               

n i i n i i n i i i X X Y Y JKS Y Y X X

dan sebagai estimasi titik untuk 2 adalah:

2 2 JKS KRS s n    RANGKUMAN

(14)

1) Tabel berikut ini menunjukkan tinggi badan

 

X dalam cm dan berat badan

 

Y dalam kg dari 10 orang dewasa.

X 150 162 160 162 165 160 172 170 180 182

Y 55 67 60 70 65 79 79 76 89 90

Jika X sebagai variabel independen Y sebagai variabel dependen dalam model regresi

0 1

i i

Y   X  . Dari data ini dapat dihitung nilai b0 sama dengan ….

A. -103,63

B. -130,63

C. -103,36

D. -130,36

2) Lihat soal nomor 1, nilai b1 sama dengan ….

A. 1,052

B. 1,521

C. 1,062

D. 1,620

3) Lihat soal nomor 1, untuk Xk 175, nilai terhitung ˆYk sama dengan …. A. 81,28

B. 82,18 C. 82,84 D. 81,81

4) Lihat soal nomor 1, nilai variansi (s2) sama dengan ….

A. 32,61

B. 31,16

C. 32,26

D. 31,59

5) Diketahui 10 observasi berpasangan

X Y,

.

X 54,5 56,4 43,2 65,2 45,5 47,5 65,0 66,5 57,3 68,0

Y 61,5 61,2 32,0 52,5 31,5 22,5 53,0 56,8 34,8 52,7

Jika digunakan model regresi Yi 01Xii; dari data di atas dihitung nilai b0

sama dengan ….

Pilih satu jawaban yang paling tepat dari beberapa alternatif jawaban yang disediakan!

TES FORMATIF 1

(15)

SATS4312/MODUL 1

A. -15,19 B. -15,20 C. -15,09 D. -15,92

6) Lihat soal nomor 5, nilai b1 sama dengan ….

A. 1,073

B. 1,072

C. 1,721

D. 1,722

7) Lihat soal nomor 5, nilai estimasi dari variansi Y, yakni s2 sama dengan ….

A. 931,46 B. 913,46 C. 116,37 D. 116,44 8) Diketahui: n277; X 65; Y 72 ;

2 1 1600; n i i X X   



1 2000    

n i i i X X Y Y ;

2 1 3600 n i i Y Y   

Jika digunakan model regresi Yi 0 1Xii; nilai b0 sama dengan ….

A. -9,27

B. -9,25

C. -9,15

D. -9,52

9) Lihat soal nomor 8, nilai b1 sama dengan ….

A. -1,25

B. 1,25

C. -1,35

D. 1,53

10) Lihat soal nomor 8, nilai s2 sama dengan ….

A. 3,99

B. 3,98

C. 3,97

D. 4,00

Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir modul ini. Hitunglah jawaban Anda yang benar. Kemudian gunakan rumus di bawah ini untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.

(16)

Rumus:

Jumlah jawaban Anda yang benar

Tingkat penguasaan = × 100%

10

Arti tingkat penguasaan yang Anda capai: 90 - 100% = baik sekali

80 - 89% = baik 70 - 79% = cukup < 70% = kurang

Bila Anda mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan

dengan Kegiatan Belajar 2. Bagus! Tetapi bila tingkat penguasaan Anda masih di bawah

80%, Anda harus mengulangi Kegiatan Belajar 1, terutama bagian yang belum Anda kuasai.

(17)

anpa memperhatikan bentuk fungsional distribusi dari i, penaksir kuadrat

terkecil b0 dan b1 selalu bersifat tak bias dan mempunyai variansi minimum

dibandingkan penaksir-penaksir tak bias linear lainnya. Untuk inferensi, kita

memerlukan asumsi tentang bentuk fungsional distribusi dari i. Salah satu asumsi baku

yang diperlukan adalah

2

0,

i N

  . Secara umum model regresi dengan sesatan

normal dinyatakan sebagai

0 1

i i i

Y   X 

dengan

Yi : hasil observasi pada trial ke-i

i

X : konstanta yang diketahui nilainya, yakni tingkat variabel X

dalam trial ke-i

0  ,1 : parameter

2

0, i N   independen; i1, 2, n

Salah satu alasan digunakannya asumsi i N

0,2

karena prosedur inferensi

didasarkan pada distribusi t yang tidak peka terhadap penyimpangan normalitas yang

tidak besar (modurate).

Penaksiran Parameter dengan Metode Kemungkinan Maksimum

Apabila bentuk fungsional dari distribusi probabilitas suku sesatan tertentu, penaksir untuk  0, 1, dan

2

 dapat dihitung dengan metode kemungkinan maksimum (maximum

likelihood). Fungsi likelihood untuk model regresi sesatan normal adalah:

2 2 0 1 1 2 0 1 2 1 2 1 1 , , 2 2 n i i i L    exp Y   X           

T

Inferensi dalam Analisis Regresi

(18)

Nilai-nilai 0, 1, dan 2 yang memaksimumkan fungsi likelihood merupakan

penaksir-penaksir maximum likelihood yang diperoleh dengan mendeferensialkan

2

0, 1,

L    terhadap 0, 1, dan 2; kemudian masing-masing disamakan dengan

nol. Untuk menyederhanakan perhitungan, kita dapat menggunakan ln L karena L dan

ln L akan maksimum untuk nilai-nilai yang sama dari 0, 1, dan 2  . Dengan mendeferensialkan

 

2

0 1

2 2 1 1 ln ln 2 ln 2 2 2 n i i i n n L   Y   X    

  terhadap 0  , 1, dan 2 diperoleh:

0 1 2 0 1 0 1 2 1 1 2 0 1 2 2 4 1 ln 1 ln 1 ln 1 2 2 n i i i n i i i i n i i i L Y X L X Y X L n Y X                          

Jika 0, 1, dan 2

 masing-masing diganti dengan b0, b1 dan ˆ2

serta disamakan dengan nol, maka diperoleh persamaan

0 1 1 2 0 1 1 2 2 0 1 1 0 0 1 ˆ            

n i i i n i i i i i n i i i Y b b X X Y b X b X Y b b X n

Dua persamaan pertama, sama dengan persamaan normal, sehingga penaksir maximum

likelihood untuk masing-masing parameter adalah sebagai berikut.



1 1 2 1 0 1 2 ˆ n i i i i i n i i i n X X Y Y b X X b Y b X Y Y         

(19)

SATS4312/MODUL 1

Jadi penaksir maksimum likelihood untuk 0 dan 1 sama dengan penaksir kuadrat

terkecil yakni b0 dan b1. Penaksir maksimum likelihood ˆ2

adalah bias sehingga untuk

mendapatkan penaksir tak bias untuk 2 digunakan KRS (Kuadrat Rata-rata Sesatan).

Inferensi tentang 1

Sering kali kita tertarik untuk melakukan inferensi tentang 1, yaitu kemiringan

(slope) dari garis regresi Yi 01Xii dengan 0 dan 1 adalah parameter, Xi

adalah konstanta yang diketahui, dan i N

0,2

adalah independen. Sebelum kita

pelajari inferensi tentang 1, kita bahas terlebih dahulu tentang distribusi sampling

penaksir titik untuk 1 yaitu



1 1 2 1      

n i i i n i i i X X Y Y b X X

Dari pengambilan sampel berulang pada nilai X tetap, diperoleh nilai b1 yang bervariasi.

Untuk model regresi sesatan normal akan dibuktikan bahwa

2 1 1 2 1 ;          

n i i i b N X X   Bukti: 1

b dapat dinyatakan sebagai kombinasi linear dari Yi yaitu:



1 1 1 2 2 1 1 1             

n n i i i i n i i i i n n i i i i i X X Y Y X X Y b k Y X X X X dengan 2 1 ( ) i i n i i X X k X X    

Untuk Xi tetap, ki merupakan kuantitas tetap. Oleh karena itu, b1 merupakan kombinasi

(20)

1. 1 0  

n i i k Bukti: 2 1 1 1 ( ) n n i i n i i i i X X k X X            

 

1 2 2 1 1 0 0         

n i i n n i i i i X X X X X X 2. 1 1  

n i i i k X Bukti:

2 1 1 1 ( ) n n i i i i n i i i i X X X k X X X               

2 2 1 2 2 1 1 1 1 ( ) n i n i i n n i i i i i X X X X X X X X                    

3. 2 2 1 1 1 ( ) n i n i i i k X X    

Bukti:

2 2 2 1 1 1 ( ) n n i i n i i i i X X k X X               

 

2 2 2 1 2 1 1 1 n 1 i n n i i i i i X X X X X X             

Kembali kita perhatikan distribusi sampling dari b1 pada model regresi linear dengan

2

0,

i N

  . Distribusi sampling dari b1 adalah normal, hal ini akibat dari b1

merupakan kombinasi linear dari Yi. Akan kita buktikan b1 merupakan penaksir tak bias

untuk 1 atau E b

 

1 1. Bukti:

 

 

1 1 0 1 0 1 1 n i i i i i n n n i i i i i E b E k Y k E Y k   Xkk X             

(21)

SATS4312/MODUL 1

Selanjutnya variansi dari b1 dijabarkan sebagai berikut.

 

 

2 2 2 2 1 1 1 2 2 2 2 2 2 1 1 1 1               

n n i i i i i i n n i i n i i i i b k Y k Y k k X X      

Penaksir untuk 2

 

b1 diperoleh dengan mengganti 2 dengan KRS sehingga penaksir

tak bias untuk 2

 

b1 adalah:

 

2 1 2 2 1 2 1 1          

n n i i n i i i i KRS KRS s b X X X X n

Untuk membuktikan bahwa b1 mempunyai variansi minimum di antara semua

penaksir tak bias linear, kita nyatakan penaksir linear tak bias untuk 1 dalam bentuk:

1 1  

n i i i c Y

 dengan ci adalah konstanta sembarang.

Jika 1 penaksir tak bias maka:

 

1

 

1 1 1        

n n i i i i i i EE c Y c E Y  .

Karena E Y

 

i 01Xi, maka syarat tak bias di atas menjadi:

 

1

0 1

0 1 1 1 1 1 .    

n ii

n i

n i ii i i Ec   Xcc X

Agar syarat tak bias berlaku maka haruslah

1 0  

n i i c dan 1 1  

n i i i c X .

Variansi dari 1 adalah:

 

 

2 2 2 2 2 1 1 1   

n i i

n i i i c Y c     .

(22)

Kita definisikan: i i i c  k d ;

2 1    

i i n i i X X k X X

; di adalah konstanta sembarang,

sehingga

 

2 2 2 1 1 2 2 1 2 2 2 1 1 1 2 n i i n i i i n n n i i i i i i i c k d k d k d                    

 

Telah kita buktikan bahwa

2 2 1 1 1 ( ) n i n i i i k X X    

dan

 

2 2 2 1 1  

n i i b k   sehingga

2 1 1 1 1 2 2 1 1 1 1 1 2 2 1 1 1 ( ) 1 0 n n n n i i i i i i i i i i i i n i i n n i i i i i n n i i i i i n n i i i i k d k c k c k k X X c X X X X c X X c X X X X                               

Kita peroleh 2

 

1 2

 

1 2 2 1   

n i i b d

    , sehingga terbukti  2

 

1 2

 

b1 . Nilai

terkecil diperoleh jika 2

1 0  

n i i d atau semua 1 0  

n i i d sehingga ciki. Jadi,

 

2 1 b

(23)

SATS4312/MODUL 1

Distribusi Sampling dari

 

1 1 1 b s b   Diketahui b1 N

 1, 2

 

b1

dengan

 

2 2 1 2 1   

n i i b X X   , sehingga statistik

 

 

1 1 1 0, 1 b N b   

. Pada umumnya 2

 

b1 tidak diketahui, diganti dengan s b

 

1 .

Statistik

 

1 1 1 b s b  

dapat ditulis dalam bentuk

 

 

 

1 1 1 1 1 s b b b b     . Diketahui

 

1 1 1 b z b    dan

 

 

  2 2 2 1 1 2 2 2 2 2 1 2 1 2 2 2 2            

n i i n i i n KRS JKS X X s b KRS n JKS b n n X X       sehingga

 

  1 1 2 1 2 2 n b z s b n     Karena b1 dan 2 JKS

 independen maka z dan

2  independen, sehingga

 

  1 1 2 1 n b t s b    .

Selang Kepercayaan untuk 1

Karena

 

  1 1 2 1 n b t s b   

maka kita dapat menyatakan

 

1 1 ; 2 1 ; 2 1 2 2 1                        n nb P t t s b   

Karena distribusi t simetri, maka ketidaksamaan di atas dapat kita tulis sebagai berikut.

 

 

1 1 1 1 1 ; 2 ; 2 2 2 1                          n nP b t s bb t s b

Karena probabilitas ini berlaku untuk semua nilai yang mungkin dari 1 maka batas

kepercayaan untuk 1 adalah:

 

1 1 ; 2 2        n b t s b

(24)

Contoh 1.6

Diketahui data sebagai berikut.

i

X 1,5 1,8 2,4 3,0 3,5 3,9 4,4 4,8 5,0

i

Y 4,8 5,7 7,0 8,3 10,9 12,4 13,1 13,6 15,3

Jika digunakan model regresi linear Yi 0 1 Xi i dengan i N

0,2

,

independen. Untuk menaksir 1 dengan selang kepercayaan 95%, dari data diperoleh:

1 9; 30,3  

n ii n X ; X 3,3667; 1 91,1  

n i i Y ; Y 10,1222; 2 1 115,11  

n i i X ; 2 1 1036, 65  

n i i Y ; 1 345, 09  

n i i i X Y



1 1 1 1 2 2 2 1 1 30, 3 91,1 345, 09 9 2, 9303 30, 3 115,11 9                

 

n n i i n i i i i i n i n i i i X Y X Y n b X X n 2 2 1 1 1 1 2 2 1 2 1 1 n n i i n n i i i i i n i i i n i i n i i i X Y Y X Y n JKS Y n X X n                                   

 



2 2 2 30,3 91,1 345, 09 9 91,1 1036, 65 2, 026 9 30,3 115,11 9                 2, 026 0, 289 2 7 JKS KRS n    

(25)

SATS4312/MODUL 1

 

2 1 2 2 2 1 1 0, 289 0, 289 0, 02206 13,1 30,3 115,11 9                   

n XX i n i i i KRS KRS s b S X X n

 

1 0, 02206 0,1485 s b   dan t(0,025; 7)2, 365

Selang kepercayaan 95% untuk 1 adalah

1

1 2,9303 2,365 0,1485  2,9303 2,365 0,1485 atau 2,579  3, 282 Uji tentang 1 Karena

 

  1 1 2 1 n b t s b   

, uji tentang 1 dapat kita lakukan berdasarkan distribusi t.

Contoh 1.7

Jika kita hanya ingin menguji apakah ada ( atau tidak) hubungan linear antara Y dan X maka hipotesis kita rumuskan sebagai:

H0:10 danH1:1 0

Untuk 0, 05, kesimpulan tentang H0 dapat diperoleh dengan menggunakan selang

kepercayaan 95% untuk 1. Untuk Contoh 1.6, selang kepercayaan 95% untuk 1 adalah

1

2,579 3, 282 tidak memuat 0 (batas kepercayaan kiri dan kanan positif) sehingga

diperoleh kesimpulan menolak H0.

Uji yang lebih tegas dapat dilakukan berdasarkan statistik uji

 

11 b t s b . Aturan

pengambilan kesimpulan untuk taraf nyata  adalah menerima H0 jika

; 2 2 n tt       dan menolak H0 jika ; 2 2         n t t . Contoh 1.8

Dari Contoh 1.6, hipotesis kita tulis sebagai H0:10 dan H1:10. Selanjutnya

kita hitung statistik uji

 

11 2, 9303 19, 73 0,1485 b t s b

. Untuk taraf nyata 0, 05,

diperoleh nilai t0,025;72,365. Karena t 2,365 maka kita menolak H0:10,

(26)

Sering kali kita ingin menguji apakah 1 sama dengan nilai tertentu, hipotesis kita rumuskan sebagai: 0: 1 10 dan 1: 1 10 H   H   Statistik uji:

 

1 1 1  bt s b

Jika kita ingin menguji apakah 1 positif, hipotesis dinyatakan sebagai:

H0:1  0 dan H1:1 0

Kesimpulan untuk taraf nyata  adalah menerima H0 jika  ; 2

   n t t dan menolak H0 jika tt;n2. Contoh 1.9

Dari Contoh 1.8 diperoleh

 

1 1 1 19, 73 b t s b  

. Untuk 0, 05, diperoleh nilai

0,05;71,895

t . Karena t1,895, maka H0 ditolak, berarti 1 positif.

Inferensi tentang 0

Sebelum kita melakukan inferensi untuk 0, kita pelajari terlebih dahulu tentang

distribusi sampling dari b0. Penaksir titik untuk 0 adalah:

0 1

b  Y b X

dapat dinyatakan sebagai kombinasi linear dari Yi yaitu:

0 1 n i i i b l Y  

dengan li  1 X ki n dan

2 1    

i i n i i X X k X X

(27)

SATS4312/MODUL 1

Distribusi sampling untuk b0 adalah normal dan b0 merupakan penaksir tak bias dari 0

atau E b

 

0 0. Bukti: 0 1 b  Y b X

 

0

   

1 0 1 1 0 E bE YE b X   X  X 

Variansi dari b0 kita peroleh sebagi berikut.

0 1  

n i i i b l Y

 

 

2 2 2 2 2 2 2 0 2 1 1 1 1 ( ) n n i i i n i i i i X b l Y l n X X                 

Sehingga untuk model regresi linear dengan sesatan normal, diperoleh:

 

2 0 0, 0 b N  b dengan

 

2 2 2 0 2 1 1 ( ) n i i X b n X X          

dan distribusi sampling untuk

 

0 0 0 b b   

adalah normal standar atau

 

 

0 0 0 0,1 b N b    .

Penaksir untuk 2

 

b0 adalah:

 

2 2 2 1 0 2 2 1 1 1              

n i i n n i i i i X X s b KRS KRS n X X n X X dan

 

  0 0 2 0 n b t s b   

Selang kepercayaan untuk 0 pada taraf kepercayaan

1

adalah:

 

 

0 0 0 0 0 ;n 2 ;n 2 b t s bb t s b          

(28)

Contoh 1.10

Dari data pada Contoh 1.6 diperoleh:

1 30,3  

n i i X ; 2 1 115,11  

n i i X ; X 3,3667; Y 10,1222; n = 9; b12,9303; dan 0, 289

KRS . Selanjutnya kita hitung:

0  1 10,1222 2,9303 3,3667 0, 2568 b Y b X

 

2 2 1 0 2 1 115,11 0, 289 0, 282 9 13,1 ( ) n i i n i i X s b KRS n X X                    

 

0 0, 282 0,531 s b  

Untuk taraf kepercayaan 90%, diperoleh t0,05; 71,895 sehingga selang kepercayaan

untuk 0 adalah:



0



0

0, 2568 1,895 0,531  0, 2568 1,895 0,531 atau 0,749 1, 263

Penaksir Selang untuk E Y

 

h

Salah satu tujuan utama analisis regresi adalah untuk menaksir mean dari satu atau

lebih distribusi probabilitas dari Y. Misalkan Xh adalah taraf dari X di mana kita ingin

menaksir mean dari Y dan Xh merupakan salah satu nilai sampel atau suatu nilai lain dari

X, maka untuk XXh diperoleh mean YˆhE Y

 

h .

Untuk model regresi dengan sesatan normal, distribusi sampling dari Yˆh b0 b X1 h

adalah normal dengan mean dan variansi masing-masing adalah:

 

ˆ

 

h h E YE Y dan

 

2 2 2 2 1 1 ˆ             

h h n i i X X Y n X X   ˆ h

Y merupakan penaksir titik tak bias dari E Y

 

h yang ditunjukkan sebagai berikut.

 

 

 

0 1 ˆ   h h E Y E b b X E b X E b

(29)

SATS4312/MODUL 1

Keragaman dari distribusi sampling ˆYh dipengaruhi oleh besarnya simpangan Xh dari

X. Makin jauh Xh dari X, nilai 2

 

Yˆh makin besar. Untuk menentukan 2

 

Yˆh , kita

buktikan dulu bahwa b1 dan Y tidak berkorelasi.

Bukti: 1 1 n i i Y Y n  

; 1 1 n i i i b k Y  

dengan 2 1 ( ) i i n i i X X k X X    

dan Yi independen. 2

1

2

 

2 1 1 1 1 , 0, karena 0             

n

n

n i i i i i i i Y b k Y k k n n   

Sekarang kita hitung variansi ˆYh, yaitu:

 

2 2 1 ˆ h h Y Y b X X    

Karena Y dan b1 independen serta Xh dan X konstan maka diperoleh:

 

  

 

 

 

2 2 2 2 1 2 2 2 1 2 2 2 2 1 2 2 2 1 ˆ 1 h h i h h n i i h n i i Y Y X X b Y X X b n X X n X X X X n X X                                 

Penaksir untuk 2

 

Yˆh adalah:

 

2 2 2 1 1 ˆ             

h h n i i X X s Y KRS n X X

(30)

Untuk model regresi dengan sesatan normal, distribusi sampling

 

 

ˆ ˆ h h h Y E Y s Y  adalah

distribusi tn2, sehingga selang kepercayaan

1

100% untuk E Y

 

h adalah:

 

 

 

; 2 ; 2 2 2 ˆ ˆ ˆ ˆ h h h h h n n Y t s Y E Y Y t s Y               Contoh 1.11

Dari data pada Contoh 1.6 diperoleh:

0 0, 2568 b  ; b12,93;

2 1 13,1   

n i i X X ; KRS0, 289; n = 9; X 3,3667 Untuk Xh 4 diperoleh:

 

ˆ 0, 2568 2,93 4 11,977 h Y   

 

2 2 ˆ 1 4 3,3667 0, 289 0, 04096 9 13,1 h s Y          atau s Y

 

ˆh 0, 202 0,025; 7 2,365 t

Selang kepercayaan 95% untuk E Y

 

h adalah:

 

 

11,977 2,365 0, 202 11,977 2,365 0, 202 11, 499 12, 455 h h E Y E Y      

Peramalan Pengamatan Baru

Pengamatan baru Yh baru dipandang sebagi hasil dari suatu trial baru yang bebas

terhadap trial lain. Jika parameter 0 dan 1 diketahui maka selang peramalan

1

100% untuk Yh baru adalah:

 

( )

 

2 2 h h baru h E Yz YE YzContoh 1.12 Misalkan diketahui 0 9, 5; 1 2,1; 2 10   .

UntukXh 40 didapatE Y

 

40 9,5

  

2,1 40 93,5. Selang peramalan 95% untuk Y40

adalah:

(31)

SATS4312/MODUL 1

Jika parameter 0 dan 1 tidak diketahui, kita gunakan penaksir b0 dan b1. Selang

peramalan di atas tidak dapat kita gunakan karena kita hanya menggunakan taksiran dari

 

h

E Y . Dalam penaksiran untuk E Y

 

h , kita gunakan selang kepercayaan sehingga letak

distribusi dari Y tidak dapat ditentukan dengan tepat.

Dengan menganggap pengamatan baru independen terhadap sampel yang digunakan untuk menaksir garis regresi, maka variansi dari Yh baru terdiri dari variansi distribusi

sampling ˆYh dan variansi distribusi Y pada XXh, yaitu:

 

 

2 2 2 2 ( ) ˆ ˆ h baru h h Y Y Y Y Y     

Penaksir tak bias dari 2

Yh baru

adalah:

s2

Yh baru

s2

 

YˆhKRS

2 2 1 1 1              

h n i i X X KRS n X X Contoh 1.13

Dari data pada Contoh 1.6 diperoleh:

3,3667 X  ;

2 1 13,1   

n i i X X ; KRS0, 289; n = 9; b0 0, 2568; b1 2,93

Sehingga untuk Xh 2 diperoleh Yˆh0, 2568 2,93 2

 

6,117, t0,025; 72,365; dan

 

2 2 2 2 3,3667 1 ˆ 0, 289 1 0,362 9 13,1            s Y .

Selang peramalan 95% untuk Yh baru adalah:

 

6,1172,365 0,362 Yh baru 6,1172,365 0,362 atau 4,693Yh baru 7,541

Ramalan Mean dari m Pengamatan Baru

Sering kali diinginkan meramal mean dari m pengamatan baru untuk taraf variabel

bebas, X tertentu. Nilai ramalan mean dari Y ditulis sebagai Yh baru . Batas ramalan

1

100% untuk Yh baru adalah:

 

; 2 2 ˆ        h h baru n Y t s Y dengan  

  

2 2 ˆ h h baru KRS s Y s Y m  

(32)

atau ekuivalen dengan  

2 2 2 1 1 1                

h h baru n i i X X s Y KRS m n X X

Dari rumus diketahui bahwa s Y2

h baru

mempunyai dua komponen yaitu variansi

distribusi sampling dari Yh dan variansi mean m pengamatan dari distribusi probabilitas Y

pada XXh.

Contoh 1.14

Kita tinjau kembali Contoh 1.6. Jika m3, untuk Xh 2 akan dihitung selang

ramalan 90% untuk Yh baru . Dari data yang ada telah dihitung:

ˆ 6,117 h Y  ; s2

 

Yˆh 0, 362 ; KRS0, 289; 2

0, 362 0, 289 0, 458 3    h baru s Y atau  

h baru

0, 677 s Y dan t0,05; 71,895.

Sehingga selang ramalan 90% untuk Yh baru adalah:

6,117 1,895 0, 677 Yh baru 6,117 1,895 0, 677 atau 4,834Yh baru 7,399

Selang ramalan Yh baru lebih sempit dibandingkan dengan selang ramalan untuk Yh baru karena selang ramalan untuk Yh baru memuat Yh baru .

Pendekatan Analisis Variansi untuk Analisis Regresi

Dasar pendekatan analisis variansi adalah pemecahan jumlah kuadrat dan derajat

bebas yang berkaitan dengan Y. Pandang simpangan total

YiY

pada Gambar 1.4

berikut ini. X Y 0 1 ˆ Ybb X ˆ i i YY ˆ i YY i YY Y i Y

Gambar

Tabel 1.1. ANAVA untuk Regresi Linear Sederhana
Tabel 1.2. ANAVA   Sumber Variasi  db  JK   KR  F  Regresi  1  6,13  6,13  6,13 68,1 0, 09F Sesatan 8 0,72 0,09  Total  9  6,85

Referensi

Dokumen terkait

Metode analisis data yang digunakan dalam penelitian ini adalah metode inferensi bayesian terhadap model regresi linier sederhana, yaitu: Membangkitkan variabel x

Seperti telah dijelaskan di atas, dalam dunia keteknikan metode kuadrat terkecil ini digunakan untuk melakukan regresi dan atau pencocokan kurva yang diharapkan dapat membentuk

Berdasarkan hasil analisis yang telah dilakukan, maka dapat disimpulkan bahwa estimasi parameter regresi linear menggunakan metode regresi kuantil diperoleh dengan

Dalam penulisan tugas akhir ini, permasalahan yang dibahas yaitu menentukan parameter regresi linier sederhana, inferensi statistik berupa estimasi interval dan melakukan

Nilai MSE dari penaksir rasio regresi linear yang diperolehdengan menggunakan dua karakter tambahan untuk rata-rata populasi yang diajukan pada sampling acak

Analisis regresi merupakan suatu cara yang dapat digunakan untuk mengetahui hubungan sebuah variabel tak bebas dengan satu atau lebih variabel bebas.. Analisis regresi

Nilai MSEdari penaksir rasio regresi linear yang diperolehdengan menggunakan dua karakter tambahan untuk rata-rata populasi yang diajukan pada sampling acak

Sesuai dengan hasil perhitungan nilai konstanta 𝑎 dan 𝑏 di atas maka diperoleh persamaan linear sederhana sebagai berikut: 𝑌 = 𝑎 + 𝑏𝑋 = 115 + −0,007𝑋 Berdasarkan persamaan regresi