Regresi Linear Sederhana
Regresi Linear Sederhana
dan Korelasi
1. Model Regresi Linear
2. Penaksir Kuadrat Terkecil 3. Prediksi Nilai Respons
4. Inferensi Untuk Parameter-parameter Regresi 5 Kecocokan Model Regresi
5. Kecocokan Model Regresi 6. Korelasi
Utriweni Mukhaiyar Utriweni Mukhaiyar MA 2081 Statistika Dasar 23 April 2012
Tujuan
Tujuan
1.
Menentukan/menaksir parameter-parameter yang
terlibat dalam suatu model matematik yang linear
terhadap parameter-parameter tersebut.
terhadap parameter parameter tersebut.
2. Melakukan prediksi terhadap nilai suatu variabel,
misalkan Y, berdasarkan nilai variabel yang lain ,
misalkan X, dengan menggunakan model regresi
linier (
(
interpolasi
te po as
).
).
f(x)
ILUSTRASI
f(x)
Suhu (X) Dihasilkan (Gula yang Y)
X menentukan Y X menentukan Y prediktor respons bukan peubah acak Memiliki distribusi 3 bukan peubah acak distribusi
Observasi 1 2 3 … n
X X X X X
X X1 X2 X3 … Xn
Y Y1 Y2 Y3 … Yn
Variabel yang nilainya mempengaruhi variabel yang lainnya.
11
Mana yang
merupakan Variabel yang kejadiannya lebih dahuluterjadi. 22
prediktor ??
Variabel yang variansinya terkecil te jad
33
M
ODEL
R
EGRESI
L
INEAR
S
EDERHANA
M
ODEL
R
EGRESI
L
INEAR
S
EDERHANA
0 1
i i i
Y
X
e
-
1 dan
0 merupakan parameter-parameter model yang akan ditaksiry g- ei adalah galat pada observasi ke-i (acak)
Sumber Galat
Sumber Galat
1.
Ketidakmampuan model regresi dalam memodelkan
hubungan prediktor dan respons dengan tepat
u u ga p e to a espo s e ga tepat
2.
Ketidakmampuan peneliti dalam melakukan pengukuran
dengan tepat
3.
Ketidakmampuan model untuk melibatkan semua
variabel prediktor
Penaksir Kuadrat Terkecil
Penaksir Kuadrat Terkecil
-
11 dan
00 ditaksir dengan metode kuadrat terkecilg (least square)- Asumsi-asumsi :
1. Ada pengaruh X terhadap Y
2
Y
i
0
1X
i
e
iuntuk
i
1,2,...,
n
2.3. Nilai harapan dari ei adalah 0, atau E[ ei ] = 0
4 V i i d i t k i 1 2
0 1
untuk
1,2,...,
i i i
Y
X
e
i
n
4. Variansi dari ei, sama untuk semua i = 1, 2,…, n 5. ei berdistribusi normal untuk semua i = 1, 2,…, n
7
Misalkan b adalah taksiran bagi
dan b adalah Misalkan b1 adalah taksiran bagi
1 dan b0 adalah taksiran bagi
0. Maka taksiran bagi modelregresi adalah 0 1
i iY
b
b X
Kriteria penaksiran kuadrat terkecil adalah meminimumkan n 2 1
i ie
terhadap b0 dan b1, dengan
e
i
Y
iY
iY
ib
0b X
1 i8 8
Diperolehp
1
n i i i XYX
X
Y
Y
JK
b
1 1 2 1
i XY n XX i ib
JK
X
X
S d k t k i t k i i l t k d l h 0
1b
Y
b X
Sedangkan taksiran untuk variansi galat acak adalah
2 2 2ˆ
1ˆ
2 2JK
G
y
i
y
i
JK
YY
b JK
1 XY2
2
2
i i Gy
y
YY XYs
n
n
n
9Suhu (X) 1 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2
Suhu (X) 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
Gula yg dihasilkan (Y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5
Sumber: Walpole and Myers, 1989
ei
n = 11 11 1 1 11 1 1 1,5
i i X X n 1 1 9,13
i i Y Y n
11 1 1 11 2 1,8091
i i i X X Y Y b
11 2 1
i i X X 0
1
6, 4136
b
Y
b X
11 116, 4136 1,8091
i iY
X
Model persamaan regresi
11 11
,
,
Prediksi Nilai Respons
Prediksi Nilai Respons
Prediksi model
Suhu (xi) Gula yg dihasilkan (yi) ˆ
i i i e y y ˆi y 1 8.1 8.22 -0.12 1.1 7.8 8.40 -0.60 1.2 8.5 8.58 -0.08 1.3 9.8 8.77 1.03 1.4 9.5 8.95 0.55 1.5 8.9 9.13 -0.23 1.6 8.6 9.31 -0.71 1.7 10.2 9.49 0.71 1.8 9.3 9.67 -0.37 1.9 9.2 9.85 -0.65 2 10.5 10.03 0.47
2 ˆ y y JK 12Taksiran variansi galat acak 2
0, 42 9 i i G y y JK s n
Prediksi Nilai Respons
Mi lk h (X) d l h h
Prediksi Nilai Respons
Misalkan suhu proses (X) adalah 1.55 satuan suhu. Maka prediksi banyaknya gula yang dihasilkan pada
h t b t d l h suhu tersebut adalah
6 4136 1 8091
Y
X
6, 4136 1,8091
6, 4136 1,8091 1,55
Y
X
9, 2177
13A
SUMSI
K
ENORMALAN
11
•Asumsi ei berdistribusi normal untuk semua i = 1, 2,…, n
•Yi beristribusi normal untuk
i 1 2
22
semua i = 1, 2,…, n33
•b0 dan b1 berdistribusi normalI
NFERENSI UNTUK
P
ARAMETER
0 0 0 0 2
nb
T
s
x
nJK
berdistribusi t dengan derajat kebebasan n-2.
1
i XXi
s
x
nJK
Selang kepercayaan (1-α) untuk 0 :
2 2 0 0 0 , 2 1 , 2 1 2 2
n i XX
n i XX n n i ib
t
s
x
nJK
b
t
s
x
nJK
15I
NFERENSI UNTUK
P
ARAMETER
1 1 1 1
XXb
T
s
JK
berdistribusi t dengan derajat kebebasan n-2.
XX
Selang kepercayaan (1-α) untuk 1 :
t
2; 2s
t
2; 2s
1 1 1
n
n XX XXt
s
t
s
b
b
JK
JK
16P
ENGUJIANP
ARAMETERR
EGRESITujuan : menentukan apakah parameter-parameter
t b t d t di b ik t tid k
P
ENGUJIANP
ARAMETERR
EGRESItersebut dapat diabaikan atau tidak.
Rumusan Hipotesis Rumusan Hipotesis H0 : β0 = 0 H β ≠ 0 H0 : β1 = 0 H β ≠ 0 b H1 : β0 ≠ 0 H1 : β1 ≠ 0 0 0 n 2 i i 1 b t x ˆ nJK
1 1 XX b t ˆ JK XX nJK XX 17S
ELANGP
REDIKSIS
ELANGP
REDIKSIMisalkan nilai respons Y untuk X = X0 adalah Y0,
ˆ
p 0 0,
dan misalkan adalah prediksi model regresi bagi Y0. Maka 0 0 2 0 XX ˆY -Y T ˆ 1+(1/n)+[(x x) / JK ] b di ib i d d j k b b
berdistribusi t dengan derajat kebebasan n-2. Selang prediksi (1 – α) bagi y0 adalah
2 2 0 0 0 / 2 0 0 / 2 XX XX (x x) (x x) 1 1 ˆ ˆ ˆ ˆ y t 1+ + y y t 1+ + n JK n JK XX XX 18
C
ONTOH
1
SELANG KEPERCAYAAN 1 C
ONTOH
1
SELANG KEPERCAYAAN 1-1
(2.26)(0.4) (2.26)(0.4)
1.8091 1.8091
1.1 1.1
TINJAU CONTOH SEBELUMNYA
Selang kepercayaan 95% untuk β1 :
b
1=1,8091
b
0=6,4136
Selang kepercayaan95% untuk β0 :19 0
25.85 25.85
6.4136 (2.26)(0.4) 6.4136 (2.26)(0.4)
(11)(1.1) (11)(1.1)
derajat kebebasan
C
ONTOH
2
UJI HIPOTESIS derajat kebebasan n – 2 = 9, nilai kritis 2 26 H0 : β0 = 0 H1 : β0 ≠ 0 t0.025 = 2.26 t > t & t0 > t0.025 & t1 > t0.025 maka masing-masing H ditolak masing H0 ditolak K i l H0 : β1 = 0 H1 : β1 ≠ 0 Kesimpulan β0 dan β1 tidak dapat diabaikan 20Kecocokan Model Regresi
S l h l k k lih k h d l
Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah
koefisien determinasi yaitu koefisien determinasi yaitu
2 2 1 2 ˆ d 0 1
n i i i R y y JK R R
2 1 2 2 1 , dengan 0 1
i R n T i i i R R JK y yBesaran R2 menunjukkan proporsi variasi total dalam
respons Y yang diterangkan oleh model regresi yang diperoleh
21
H M d l i di l h id k d i
U
JIK
EBAIKANM
ODELH0 : Model regresi yang diperoleh tidak memadai H1 : Model memadai Statistik uji
2ˆ
n
y
iy
i
1
R
i i iy
y
JK
f
s
s
Tolak H0 pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2) adalah nilai distribusi F dengan
derajat kebebasan 1 dan n – 2. derajat kebebasan 1 dan n 2.
C
ONTOH3
Untuk contoh sebelumnya diperoleh R2 = 0,499.
Artinya proporsi variasi total dalam respons Y y p p p yang diterangkan oleh model regresi yang
diperoleh adalah 49.9% Uji kebaikan model
11 2 1ˆ
i i i Ry
y
JK
Untuk α = 5%, titik kritis f0 05 (1 9) = 5,12
1
8,99
JK
R
i
f
s
s
, f0.05,(1,9) , f > f0.05,(1,9), model memadai. 23Korelasi
Mengukur hubungan linear dua peubah acak
Misalkan X danY adalah dua peubah acak, maka
korelasi antara X danY dinyatakan dengan
E
X
Y
C
X Y
2 2,
X Y XY X Y X YE
X
Y
Cov X Y
E
X
E
Y
24Jika nilai korelasi mendekati 1 maka
hubungan kedua peubah “sangat erat” dan
searah sedangkan jika nilai korelasi
mendekati 1 maka hubungan kedua
mendekati –1 maka hubungan kedua
peubah “sangat erat” dan berlawanan arah.
Jika nilai korelasi sama dengan nol berarti
tidak terdapat hubungan linear antara
kedua peubah acak.
25Gambar 1 Korelasi positif Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol Gambar 4 Korelasi nol
K
ORELASI
S
AMPEL
Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu
JK
XY XX YY nJK
r
JK
JK
1
n i i i n nX
X
Y
Y
2
2 1 1
n n i i i iX
X
Y
Y
27C
ONTOH4
Data berikut menggambarkan nilai kimia 12 mahasiswa
tingkat pertama yang diambil secara acak di suatu universitas bersama nilai intelegensi yang dikur sewaktu mereka di SMA
C
ONTOH4
bersama nilai intelegensi yang dikur sewaktu mereka di SMA.
Mahasiswa Nilai Intelegensi (x) Nilai Kimia (y)
1 65 85 2 50 74 3 55 76 4 65 90 5 55 85 5 55 85 6 70 87 7 65 94 8 70 98 9 55 81 10 70 91 11 50 76 12 55 74
Rata-rata nilai intelegensi = 60,42 , Rata-rata nilai kimia = 84,25
28
100 110 80 90 100 K imia 60 70 Nilai K 40 50 40 45 50 55 60 65 70 75 Nilai Intelegensig
12
X
iX
Y
iY
1 12 2 12 20,863
i i i XY XX YY i iJK
r
JK
JK
X
X
Y
Y
29
1 1
i
i i iReferensi
Referensi
Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. Walpole, Ronald E. Dan Myers, Raymond H., Ilmu
Peluang dan Statistika untuk Insinyur dan Peluang dan Statistika untuk Insinyur dan
Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995. Walpole, Ronald E., et.al, p Statistic for Scientist and f
Engineering, 8th Ed., 2007.