R EGRESI L INEAR
S EDERHANA DAN
K ORELASI
1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil 3. Prediksi Nilai Respons
4. Inferensi Untuk Parameter-parameter Regresi 5. Kecocokan Model Regresi
6. Korelasi
Utriweni Mukhaiyar MA 2181 Analisis Data
TUJUAN
1. Menentukan/menaksir parameter-
parameter yang terlibat dalam suatu model matematik yang linear terhadap
parameter-parameter tersebut
2
2. Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabel yang lain , misalkan X, dengan menggunakan model regresi linier (interpolasi).
Suhu (X) Gula yang
Dihasilkan (Y) f(X)
X menentukan Y
prediktor respons
peubah acak
Observasi 1 2 3 … n
X X1 X2 X3 … Xn
Y Y1 Y2 Y3 … Yn
Variabel yang nilainya mempengaruhi 1
Mana yang merupakan prediktor ??
4
Variabel yang nilainya mempengaruhi variabel yang lainnya.
Variabel yang variansinya terkecil Variabel yang kejadiannya lebih dahulu terjadi.
2
3
0 1
i i i
Y X e
dan merupakan parameter parameter MODELREGRESILINEARSEDERHANA
5
-1dan0merupakan parameter-parameter model yang akan ditaksir
- ei adalah galat pada observasi ke-i (acak)
1. Ketidakmampuan model regresi dalam memodelkan hubungan prediktor dan respons dengan tepat
SUMBERGALAT
2. Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat
3. Ketidakmampuan model untuk melibatkan semua variabel prediktor
PENAKSIRKUADRATTERKECIL
- 1dan0ditaksir dengan metode kuadrat terkecil (least square)
- Asumsi-asumsi :
1. Ada pengaruh X terhadap Y
7
p g p
2.
3. Nilai harapan dari eiadalah 0, atau E[ ei ] = 0 4. Variansi dari ei, sama untuk semua i = 1, 2,…, n 5. eiberdistribusi normal untuk semua i = 1, 2,…, n 6. e1,e2,...,ensaling bebas (independen)
0 1 , untuk i = 1, 2, ..., n
i i i
Y X e
Misalkan b1 adalah taksiran bagi1dan b0adalah taksiran bagi1. Maka taksiran bagi model regresi adalah
0 1
ˆ
i i Y b b XKriteria penaksiran kuadrat terkecil adalah meminimumkan
meminimumkan
terhadap b0dan b1, dengan
2
1
n ii
e
0 1
ˆ .
i i i i i
e Y Y Y b b X
88
Diperoleh
1
1 2
1
n
i i
i XY
n XX
i i
X X Y Y
b JK
JK X X
0 1
b Y b X
Sedangkan taksiran untuk variansi galat acak adalah
22 1
ˆ
ˆ 2 2
n i iG i
Y Y JK
n n
Suhu (X) 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 Gula yg dihasilkan (Y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5
Sumber: Walpole and Myers, 1989
ei
10
1
x 1 x 1.5
n i nin = 11
1
y 1 y 9.13
n i ni
1
1 2
x x y y
1.8091 x x
n
i i
i n
i
b
1
ii
0 1 6.4136 b Y b X
Model persamaan regresi
ˆ 6.4136 1.8091
Y X 1111
PREDIKSINILAIRESPONS
Prediksi model Suhu (xi) Gula yg dihasilkan (yi)
1 8.1 8.22 -0.12
1.1 7.8 8.40 -0.60
1.2 8.5 8.58 -0.08
1.3 9.8 8.77 1.03
1.4 9.5 8.95 0.55
ˆi
(y ) eiyiyˆi
1.4 9.5 8.95 0.55
1.5 8.9 9.13 -0.23
1.6 8.6 9.31 -0.71
1.7 10.2 9.49 0.71
1.8 9.3 9.67 -0.37
1.9 9.2 9.85 -0.65
2 10.5 10.03 0.47
Taksiran variansi galat acak 1 2
Misalkan suhu proses (X) adalah 1.55 satuan suhu.
Maka prediksi banyaknya gula yang dihasilkan pada suhu tersebut adalah
pada suhu tersebut adalah
ˆy 6.4136 1.8091x = 6.4136 + 1.8091(1.55) =9.217705
13
A
SUMSIK
ENORMALAN11 • Asumsi eiberdistribusi normal untuk semua i = 1, 2,…, n
14
22 • Yiberistribusi normal untuk semua i = 1, 2,…, n
33 • b0 dan b1berdistribusi normal
I
NFERENSI UNTUKP
ARAMETER
00 0
0 2
XX 1
T = b
ˆ / JK
n ii
x n
berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk0:
2 2
0 / 2 XX 0 0 / 2 XX
1 1
ˆ ˆ
b / JK b / JK
t
n xi n t
n xi nI
NFERENSI UNTUKP
ARAMETER
11 1
1 XX
T = b ˆ/ JK
16
berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk1:
t/2adalah nilai distribusi t dengan derajat kebebasan n-2
/ 2 / 2
1 1 1
XX XX
ˆ ˆ
b b
JK JK
t t
PENGUJIANPARAMETERREGRESI
Rumusan Hipotesis
17
H0: β0= 0 H1: β0≠ 0
H0: β1= 0
H1: β1≠ 0 0
0 n
2 i i 1
XX
t b x ˆ nJK
1 1XX
t b ˆ JK
0 0
2
ˆY -Y Tˆ 1 (1/ ) [( ) / JK ]
SELANGPREDIKSI
Misalkan nilai respons Y untuk X = X0 adalah Y0, dan misalkan adalah prediksi model regresi bagi Y0. Maka
2
0 XX
ˆ 1+(1/n)+[(x x) / JK ]
berdistribusi t dengan derajat kebebasan n-2.
Selang prediksi (1 – α) bagi y0 adalah
2 2
0 0
0 / 2 0 0 / 2
XX XX
(x x) (x x)
1 1
ˆ ˆ ˆ ˆ
y t 1+ + y y t 1+ +
n JK n JK
C
ONTOH;
SELANGKEPERCAYAAN1-1
(2.26)(0.4) (2.26)(0.4)
1.8091 1.8091
1.1 1.1
Selang kepercayaan 95% untuk β1: TINJAUCONTOHSEBELUMNYA
19
b1=1,8091 b0=6,4136
0
25.85 25.85
6.4136 (2.26)(0.4) 6.4136 (2.26)(0.4)
(11)(1.1) (11)(1.1)
Selang kepercayaan 95% untuk β0:
H0: β0= 0 H1: β0≠ 0
derajat kebebasan n – 2 = 9, nilai kritis t0.025 = 2.26
t0> t0.025&
t1> t0 025
C
ONTOH;
UJIHIPOTESIS20 H0: β1= 0
H1: β1≠ 0
1 0.025
maka masing- masing H0ditolak
Kesimpulan β0dan β1tidak dapat diabaikan
KECOCOKANMODELREGRESI
Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah koefisien determinasi yaitu
n 2
2 R i=1 i 2
n 2
T i
i=1
(yˆ y)
R =JK = , dengan 0 R 1
JK (y y)
Besaran R2menunjukkan proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang
H0: Model regresi yang diperoleh tidak memadai H1: Model memadai
Statistik uji
UJIKEBAIKANMODEL
Tolak H0pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2)adalah nilai distribusi F dengan derajat kebebasan 1 dan n – 2.
2 1
ˆ
ˆ ˆ
n ii=
R
(y y) f JK
22
Untuk contoh sebelumnya diperoleh R2= 0,499.
Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang di l h d l h 49 9%
CONTOH
diperoleh adalah 49.9%
Uji kebaikan model
2 1
ˆ ˆ ˆ 8.99
n i i=
R
(y y) f JK
Untuk α = 5%, titik kritis f0.05,(1,9) = 5,12
f > f0.05,(1,9), model memadai. 23
KORELASI
Mengukur hubungan linear dua peubah acak
Misalkan X dan Y adalah dua peubah acak, maka korelasi antara X dan Y dinyatakan dengan
X Y
XY
X Y
E (X )(Y )
Jika nilai korelasi mendekati 1 maka hubungan kedua peubah “sangat erat” dan searah sedangkan jika nilai korelasi mendekati –1 maka hubungan kedua peubah “sangat erat” dan berlawanan arah peubah sangat erat dan berlawanan arah.
25
Gambar 1 Korelasi positif Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol Gambar 4 Korelasi nol 26
Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu
JK
XYr
KORELASISAMPEL
XY
XX YY
n
i i
i=1
n n
r JK JK
(X X)(Y Y)
Data dua peubah acak berat badan bayi (kg) dan ukuran dada bayi (cm)
berat
berat (kg)(kg) ukuran dada (cm)ukuran dada (cm) 2.75
2.75 29.529.5 2.15
2.15 26.326.3
CONTOH
4.41
4.41 32.232.2 5.52
5.52 36.536.5 3.21
3.21 27.227.2 4.32
4.32 27.727.7 2.31
2.31 28.328.3 4.3
4.3 30.330.3 3.71
3.71 28.728.7
Rata-rata berat = 3.63 , Rata-rata ukuran dada = 29.63
28
20 22 24 26 28 30 32 34 36 38
ukuran (cm)
20
1 2 3 4 5 6
berat (kg)
9
i i
i=1
9 9
2 2
i i
i=1 i=1
(X X)(Y Y)
r 0.78
(X X) (Y Y)
29Referensi
Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.
Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995., g ,