Pokok Bahasan :
REGRESI LINIER
SEDERHANA
Macam-macam Model Regresi
Model Regresi
Sederhana Berganda
Linier Non Linier Linier Non Linier 1 peubah penjelas > 1 peubah penjelas
Reciprocal Log Multiplikatif
Sederhana
Linier
Hubungannya linier
Non Linier
Polinom
Multiplikatif
Eksponensial
Reciprocal
Contoh :
Macam-macam Model Regresi
Model Regresi Linier Sederhana
(yang hubungannya linier
ordo
x=1
)
Linier dalam parameter
Sederhana = banyaknya peubah bebas/penjelas hanya satu
Hubungan antara X dan Y dinyatakan dalam fungsi linier/ordo 1
Perubahan Y diasumsikan karena adanya perubahan X
Model populasi regresi linier sederhana yang hubungannya linier
(selanjutnya cukup sebut “regresi linier sederhana”) :
Dengan :
β0 dan β1 adalah parameter regresi
ε adalah sisaan/galat/eror (peubah acak) Y adalah peubah tak bebas (peubah acak)
X adalah peubah bebas yang nilainya diketahui
ε
x
β
β
Asumsi
Model Regresi Linier
Bentuk hubungannya linear (Y merupakan
fungsi linier
dari X, plus sisaan yang acak)
Sisaan
ε
iadalah peubah acak yang bebas thdp nilai x
Sisaan merupakan peubah acak yang menyebar
Normal
dengan rataan 0 dan memiliki ragam konstan,
σ
2(sifat ragam yang konstan/homogen ini disebut homoscedasticity)
Sisaan
ε
i, tidak berkorelasi satu dengan yang lainnya,
sehingga atau
n)
,
1,
(i
untuk
σ
]
E[
ε
dan
0
]
E[
ε
i=
i2=
2=
K
j
i
,
0
]
ε
ε
X
β
β
Y
=
0
+
1
+
Komponen linier (fix)
Interpretasi Parameter Model
Regresi Linier Sederhana
X
β
β0 + 1
σ
2Model Regresi Linier Sederhana (populasi) :
Intersep Y populasi
Koefisien kemiringan populasi
Sisaan/ galat Peubah tak
bebas/
Peubah respon
Peubah bebas/ Peubah penjelas
Komponen acak
(lanjutan)
Sisaan/galat untuk xi
Y
Nilai
pengamatan Y untuk Xi
Nilai
harapan/rataan Y untuk xi
Interpretasi Parameter Model
Regresi Linier Sederhana
i
1
0
i
b
b
x
yˆ
=
+
Dugaan persamaan garis regresi linier sederhana
Dugaan Persamaan Garis
Regresi Linier Sederhana
Dugaan bagi intersep
β
0Dugaan bagi kemiringan garis regresi
β
1Nilai dugaan y pada
pengamatan ke - i
Nilai x pada pengamatan ke - i
Galat individu ei mempunyai rataan sebesar nol
)
)
ˆ
(
i i i 0 1 ii
y
-
y
y
-
(b
b
x
b
0adalah nilai dugaan rataan y
ketika x bernilai nol
(
jika x = 0 dalam
selang pengamatan
)
b
1adalah nilai dugaan perubahan
rataan y (nilai harapan Y) jika x
berubah satu satuan
Menduga Persamaan Regresi
Menduga persamaan regresi linier sederhana
= menduga parameter-parameter regresi
β
0dan
β
1:
Penduga parameter yang dihasilkan harus
merupakan
penduga yang baik
Metode Kuadrat Terkecil
b
0dan b
1adalah dugaan bagi parameter regresi
β
0dan
β
1yang didapat
salah satunya
dengan cara
meminimumkan jumlah kuadrat galat (JKG).
Galat/sisaan = selisih antara y dan
Æ
Metode
Kuadrat Terkecil (MKT) :
2
Teknik kalkulus digunakan untuk mendapatkan nilai bo dan b1 sedemikian hingga meminimumkan JKG
Menduga Persamaan Regresi
Penduga bagi koefisien kemiringan garis
β
1ialah:
Koefisien Korelasi Pearson
Metode Kuadrat Terkecil
Asumsi Metode Kuadrat Terkecil (MKT)
Agar penduga bagi parameter regresi yang
didapatkan dengan menggunakan MKT merupakan
penduga yang baik
maka sisaan/galat harus
memenuhi kondisi Gauss-Markov berikut ini :
bebas
ticity
homoscedas
homogen
sisaan
ragam
sisaan
taan
Kondisi Gauss - Markov
(lanjutan)
Contoh
Regresi Linier Sederhana
Sebuah agen real-estate ingin mengetahui
hubungan antara harga jual sebuah rumah
dengan luas lantainya (diukur dalam m2)
10 buah rumah diambil secara acak sebagai contoh
Peubah tak bebas (Y) = harga rumah (juta rupiah)
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y) Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Contoh Regresi Linier Sederhana
Luas Lantai
Scatterplot of Harga Rumah vs Luas Lantai
Tebaran Harga Rumah vs Luas Lantai
Contoh Regresi Linier Sederhana
(lanjutan)Model Regresi-nya
ε
β
β
+
+
=
x
Y
0 1Persamaan Garis Regresi-nya
x
Y
=
β
0+
β
1Diduga dengan :
x
b
b
FILM :
MEMBUAT TEBARAN
“HARGA RUMAH” vs ”LUAS LANTAI” MENGGUNAKAN MINITAB
Klik di sini
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Contoh Regresi Linier Sederhana
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Contoh Regresi Linier Sederhana
(lanjutan)MENDUGA PARAMETER REGRESI : OUTPUT MINITAB
Dugaan Persamaan Garis Regresi-nya
b
0
b
Klik di sini
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Contoh Regresi Linier Sederhana
(lanjutan)
FILM :
0
0 500 1000 1500 2000 2500 3000
Luas Lantai (m2)
H
Tampilan Grafik
Model Harga Rumah: scatter plot dan
garis regresi
+
=
Kemiringan = 0.10977
Intersep = 98.248
Contoh Regresi Linier Sederhana
Klik di sini
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
FILM :
MEMBUAT TEBARAN ANTARA
“HARGA RUMAH”
dengan
“LUAS LANTAI”
& GARIS REGRESI-nya
MENGGUNAKAN MINITAB
Contoh Regresi Linier Sederhana
Interpretasi Intersep b
0
b
0
adalah nilai dugaan bagi nilai rataan
Y ketika X bernilai nol (
jika X = 0 di
dalam selang pengamatan
)
Dalam hal ini tidak ada rumah yang memiliki luas lantai=0,
jadi b0 = 98.24833 hanya mengindikasikan bahwa : untuk
luas lantai yang berada dalam selang pengamatan, Rp 98.248.330,- adalah bagian harga rumah yang tidak diterangkan oleh luas lantai
lantai)
(luas
0.10977
98.24833
rumah
harga
=
+
Contoh Regresi Linier Sederhana
Interpretasi koefisien kemiringan, b
1
b
1
mengukur dugaan perubahan rataan
nilai Y jika X berubah satu satuan
Dalam hal ini b
1= .10977 menggambarkan
bahwa setiap penambahan satu m
2luas lantai
rataan harga rumah akan naik sebesar 0,10977
juta rupiah
lantai)
(luas
0.10977
98.24833
rumah
harga
=
+
Contoh Regresi Linier Sederhana
Apakah b
0
dan b
1
yang didapat
merupakan penduga yang baik ?
Pertanyaan di atas = pertanyaan bahwa: “apakah
sisaan
yang dihasilkan oleh
dugaan persamaan
garis regresi
nya menghasilkan sisaan yang
memenuhi kondisi
Gauss-Markov
?”
Untuk sementara ini kita yakini saja dulu bahwa
sisaan yang dihasilkan memenuhi kondisi tersebut
PENGURAIAN
KERAGAMAN TOTAL
Sumber Keragaman Regresi
x
y
X
y
iJKT =
∑
(
y
i-
y
)
2JKG =
∑
(
y
i-
∧
y
i)
2JKR =
∑
(
y
∧
i–
y
)
2_
_
_
y
∧
Y
y
_
y
∧
iSumber Keragaman Regresi
Sumber Keragaman Regresi
Untuk suatu nilai x
ikeragaman nilai pengamatan y
idisebabkan oleh :
Menyimpangnya nilai amatan y
iterhadap dugaan nilai
harapannya
beragam
Æ
menghasilkan dugaan garis
regresi yang beragam
Æ
memiliki rataan
Menyimpangnya suatu dugaan garis regresi terhadap
rataannya menyebabkan beragamnya data.
Mengukur Keragaman
Total Keragaman disebabkan oleh dua bagian ini :
JKG
JKR
JKT
=
+
Jumlah Kuadrat Total
Jumlah Kuadrat Regresi
Jumlah Kuadrat Galat/Sisaan
∑
−
=
2i
y
)
(y
JKT
JKR
=
∑
(
yˆ
i−
y
)
2JKG
=
∑
(y
i−
yˆ
i)
2dengan:
= nilai rata-rata peubah tak bebas Y
yi = nilai pengamatan ke-i peubah tak bebas Y
i = nilai dugaan y untuk suatu nilai xi
yˆ
y
JKT = Jumlah Kuadrat Total
Mengukur keragaman nilai y
idi sekitar nilai
rataannya y
JKR = Jumlah Kuadrat Regresi
Menjelaskan keragaman karena adanya hubungan
linier antara x dan y
JKS = jumlah Kuadrat Sisa
Menjelaskan keragaman yang disebabkan oleh
faktor-faktor selain faktor hubungan linier x dan y
(lanjutan)
Derajat Bebas Jumlah Kuadrat
Ukuran keragaman adalah
ragam
Derajat bebas bagi
Derajat bebas bagi
(db)
bebas
derajat
(JK)
Kuadrat
Jumlah
Ragam
=
2
-n
JK
Sisaan
=
1
JK
0
b
|
Tabel Sidik Ragam
Sumber
Keragaman
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
Kuadrat
Tengah
(KT)
Regresi
1
Sisaan
n-2
Total
(terkoreksi)
n-1
( )
JKRegresi(
n 2)
JK sisaan
−
Pada analisis regresi ini tentunya diharapkan JK regresi lebih besar dari JK sisaan Æ sehingga dapat dikatakan bahwa keragaman nilai y
S2,
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Analysis of Variance
Source DF SS MS F P Regression 1 18935 18935 11,08 0,010 Residual Error 8 13666 1708
Total 9 32600
Tabel Sidik Ragam
OUTPUT MINITAB
db JK KT
TABEL SIDIK RAGAM
Penduga bagi Ragam Sisaan/galat
Penduga bagi ragam eror/sisaan dari model populasi
adalah :
Dibagi dengan n – 2 bukan dengan n – 1 karena model
regresi linier sederhana menggunakan 2 penduga
parameter yaitu, b
0dan b
1, bukan satu.
adalah
penduga simpangan baku
2
Dengan asumsi bahwa
modelnya pas/cocok
2
s
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Analysis of Variance
Source DF SS MS F P Regression 1 18935 18935 11,08 0,010 Residual Error 8 13666 1708
Total 9 32600
e
s
Penduga bagi Ragam Sisaan/galat
OUTPUT MINITAB
Dugaan Ragam Sisaan = s2
(JIKA MODELNYA PAS)
Perbandingan Simpangan Baku
Y
Y
X
X
kecil
s
es
ebesar
Pengujian Hipotesis
Terhadap
Slope dan Intersep
0
β
1 0
β
β
Diperlukan asumsi bahwa εi menyebar Normal
Ragam Koefisien Kemiringan Garis
Regresi (b
1
)
Ragam dari koefisien kemiringan garis regresi
(b
1) diduga sbb :
= dugaan simpangan baku kemiringan garis regresi = dugaan ragam x
Membandingkan Simpangan Baku
Koefisien Kemiringan Garis Regresi (b
1)
Y
X
Y
X
kecil
1 b
S
S
b1besar
mengukur keragaman koefisien kemiringan garis
regresi dari berbagai contoh (set data) yang mungkin.
1b
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Contoh Regresi Linier Sederhana
(lanjutan)SIMPANGAN BAKU b1 : OUTPUT MINITAB
Inferensia Koefisien Kemiringan Garis
Regresi (b
1
): Uji t
Pada
model regresi linier sederhana
:
Uji t untuk koefisien kemiringan garis regresi populasi (β1)
Apakah ada hubungan linier antara X dan Y? Hipotesis Nol dan hipotesis tandingan
H0: β1 = 0 (tidak ada hubungan linier antara X dan Y) H1: β1 ≠ 0 (ada hubungan linier antara X dan Y)
Uji Statistik
1
b 1 1
s
β
b
t
=
−
2
n
d.b.
=
−
dengan:
b1 = koefisien kemiringan regresi
β1 = kemiringan yg dihipotesiskan
Harga Rumah (Rp.juta)
(y)
Luas Lantai (m2)
(x) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700
lantai)
(luas
0.1098
98.25
rumah
harga
=
+
Dugaan persamaan garis regresi:
Koefisien kemiringan garis pada
model ini adalah 0.1098
Meskipun demikian, “apakah luas
lantai mempengaruhi harga jual?”
Contoh Inferensia
Contoh Inferensia
Koefisien Kemiringan Garis (b
1
): uji t
H
0:
β
1= 0
H
1:
β
1≠
0
b
1s
b13.32938
0.03297
0
0.10977
s
β
b
t
1
b 1
1
−
=
−
=
=
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010 OUTPUT MINITAB
Apakah luas lantai mempe-ngaruhi harga jual (secara linier)?
Contoh Inferensia
Koefisien Kemiringan Garis (b
1
): uji t
H
0:
β
1= 0
H
1:
β
1≠
0
Statistik Uji-nya : t = 3.329
Cukup bukti untuk mengatakan
bahwa luas lantai
output MINITAB :
s
b1t
b
1Keputusan :
Tolak H
0Kesimpulan :
Tolak H0 Tolak H0
α/2=.025
-t
Terima H0
0
α/2=.025
d.b. = 10-2 = 8
t8,.025 = 2.3060
(lanjutan)
t
Predictor Coef SE Coef T P
Contoh Inferensia
Koefisien Kemiringan Garis (b
1
): uji t
H
0:
β
1= 0
H
1:
β
1≠
0
Nilai peluang P =
0.01039
Cukup bukti untuk mengatakan
bahwa luas lantai
mempengaruhi harga rumah
P-value <
α
jadi
Tolak H
0Keputusan:
Kesimpulan:
(lanjutan)
Ini adalah uji dua arah,
jadi p-valuenya adalah
output MINITAB :
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
P(t > 3.329)+P(t < -3.329)
= 0.01039
(db. 8)
Ragam Intersep Garis Regresi (b
0
)
Ragam dari intersep garis regresi (b
0) diduga
sbb :
= dugaan simpangan baku intersep garis regresi
= akar KTG = akar Kuadrat Tengah Galat = dugaan
Inferensia Intersep Garis Regresi (b
0
): uji
t
Pada
model regresi linier sederhana
:
Uji t untuk intersep garis regresi populasi (β0)
Apakah ada nilai Y yang tidak dapat dijelaskan oleh x? Hipotesis Nol dan hipotesis tandingan
H0: β0 = 0 (semua nilai Y dapat dijelaskan oleh x)
H1: β0 ≠ 0 (ada nilai Y yg tidak dapat dijelaskan oleh x)
Statistik uji
0
b 0 0
s
β
b
t
=
−
1
d.b.
=
dengan:
b0 = intersep garis regresi
β0 = intersep yg dihipotesiskan
Harga Rumah (Rp. Juta)
(y)
Luas Lantai (m2)
(x) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700
lantai)
(luas
0.1098
98.25
rumah
harga
=
+
Dugaan persamaan garis regresi:
Intersep garis pada model ini adalah 98.25 Apakah ada bagian harga rumah yang tidak dapat dijelaskan oleh luas lantai? Apakah ada bagian harga rumah yang tidak dipengaruhi oleh luas lantai?
Contoh Inferensia
Contoh Inferensia
Intersep Garis Regresi (b
0
): uji-t
H
0:
β
0= 0
H
1:
β
0≠
0
0
b
s
b
01.69296
58.03348
0
98.24833
s
β
b
t
0
b 0
0
−
=
−
=
=
output MINITAB :
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
(lanjutan)
Contoh Inferensia
Intersep Garis Regresi (b
0
): uji-t
H
0:
β
0= 0
H
1:
β
0≠
0
Statistik uji: t
hit= 1.69296
Tidak cukup bukti untuk
mengatakan bahwa : ada harga
0
b
s
t
b
0Keputusan:
Kesimpulan :
Tolak H0 Tolak H0
α/2=.025
-t
Terima H0
0
α/2=.025
d.b. = 1
t1, .025 = 12,706
(lanjutan)
t
output MINITAB :
Predictor Coef SE Coef T P
Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
Uji F bagi parameter regresi :
Tabel Sidik Ragam
Sumber
Keragaman
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
Kuadrat
Tengah
(KT)
Regresi
(b1| b0)
1
Sisaan
n-2
Total
(terkoreksi)
n-1
( )
JKRegresi(
n 2)
JK sisaan
−
Statistik uji F tersebut memiliki derajat bebas db1=1 dan db2=n-2
Jika Fhit <1 Æ KTRegresi < KTSisaan ÆRagam Regresi < Ragam Sisaan Æ pengaruh regresi tdk nyata Æ pengaruh x tdk nyata Æ b1 = 0 (tdk perlu tabel)
S2, jika
mo-delnya pas
Statistik uji-nya :
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Analysis of Variance
Source DF SS MS F P Regression 1 18935 18935 11,08 0,010 Residual Error 8 13666 1708
OUTPUT MINITAB
Contoh Uji F bagi parameter regresi :
Tabel Sidik Ragam
(lanjutan)
P-value untuk uji F
1708
18935
=
=
sisaan reg hit
Statistik Uji:
Keputusan:
Kesimpulan:
Tolak H
0dg
α
= 0.05
Cukup bukti bahwa luas lantai
mempengaruhi harga rumah
0
α = .05
F = 5.32
Tolak H0 terima
H
Uji F bagi parameter regresi :
Tabel Sidik Ragam
Jika model yang kita pilih di awal ternyata tidak pas
1.
Bolehkah kita menggunakan KT sisaan sebagai
penduga bagi ragam sisaan ?
2. Masih relevankah kita melakukan uji F ?
Agar uji F pada tabel Sidik Ragam dapat digunakan, maka
model yang dipilih harus pas.
Æ
uji
lack of fit
atau periksa
pola sisaannya
Æ
akan dibahas pada sub pokok bahasan
“ Kualitas Fitted Model “ Untuk sementara anggaplah model
yang kita pilih pas.
Perbandingan Tabel Sidik Ragam
Terkoreksi dan Tidak Terkoreksi
Sumber Keragaman
Derajat
Bebas (db) Kuadrat (JK)Jumlah
Kuadrat Tengah (KT)
Regresi
(b1| b0) 1
Sisaan n - 2
Total
(terkoreksi) n - 1
( )
JKRegresi(
n 2)
JK sisaan
−
Regresi (b0,b1) 2
Sisaan n - 2
Total n
0
Tidak bisa mem-berikan jawaban apkh x berpe-ngaruh/tidak
Kualitas Fitted Model
•
Apakah model regresi sudah cukup pas mewakili data?
Tebaran
titik amatan / scatter plot
Mana di antara gambar–gam-bar ini yang mo-delnya cukup pas/sesuai ?
a.
b.
c.
d.
x
x x
x y
y y
y
Perlu diuji
Tebaran titik amatan / scatter plot
Mana di antara gambar–gam-bar ini yang mo-delnya cukup baik untuk peramalan?
a.
b.
c.
d.
y
y y
y
x x
Perlu suatu be-saran yang dapat mengukur jauh /dekatnya titik pengamatan
Koefisien Determinasi, R
2
Koefisien determinasi mengukur proporsi keragaman atau variasi
total di sekitar nilai tengah (Y) yang dapat dijelaskan oleh garis regresi
Æ secara grafis mengukur jauh/dekatnya titik pengamatan thdp garis regresi
Koefisien Determinasi, R
2
(lanjutan)
Regression Analysis: Harga Rumah versus Luas Lantai
The regression equation is
Harga Rumah = 98,2 + 0,110 Luas Lantai
Predictor Coef SE Coef T P Constant 98,25 58,03 1,69 0,129 Luas Lantai 0,10977 0,03297 3,33 0,010
S = 41,3303 R-Sq = 58,1% R-Sq(adj) = 52,8%
Analysis of Variance
Source DF SS MS F P Regression 1 18935 18935 11,08 0,010 Residual Error 8 13666 1708
Total 9 32600
5808
,
0
32600
18935
2
=
=
R
OUTPUT MINITAB
Analisis Korelasi
Analisis korelasi
digunakan untuk mengukur
kekuatan hubungan (hubungan linier) antara
dua peubah
Korelasi hanya khusus untuk kekuatan hubungan
Mengukur arah hubungan
Analisis Korelasi
Koefisien korelasi populasi
dinotasikan dengan
ρ
(huruf Greek rho)
Koefisien korelasi contoh
adalah :
y
Koefisien korelasi Pearson
Pada Model Regresi Linier Sederhana yg hub.nya linier :
Untuk melakukan tes bahwa tidak ada
hubungan linier, Hipotesis nol nya :
Statistik ujinya mengikuti sebaran t Student
dengan derajad bebas (n – 2 )
Uji Hipotesis untuk Korelasi
0
ρ
:
H
0=
)
r
(1
2)
(n
r
t
2
−
−
=
H
0:
ρ
≥
0
H
1:
ρ
< 0
H
0:
ρ ≤
0
H
1:
ρ
> 0
H
0:
ρ
= 0
H
1:
ρ ≠
0
Kaidah Keputusan
α
α
/2
α
/2
α
-t
αt
α-t
α/2t
α/2tolak H0 jika t < -tn-2, α Tolak H0 jika t > tn-2, α Tolak H0 jika t < -tn-2, α/2 atau t > tn-2, α/2
2)
(n
r
−
Uji Hipotesis untuk Korelasi
Correlations: Harga Rumah; Luas Lantai
Pearson correlation of Harga Rumah and Luas
Lantai = 0,762
P-Value = 0,010
OUTPUT MINITAB
Uji Hipotesis untuk Korelasi
P-value < 0,025
Æ
Tolak H
0Æ
ρ ≠
0
FILM : MENDUGA
KOEFISIEN KORELASI PEARSON dengan
MENGGUNAKAN MINITAB
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
Correlations: Harga Rumah; Luas Lantai
Pearson correlation of Harga Rumah and Luas Lantai = 0,762
P-Value = 0,010
r
XYAPLIKASI DENGAN MINITAB
DUGAAN BAGI KOEFISIEN KORELASI
r
2= 1
Interpretasi beberapa nilai r
2
Y
X
Y
X
r
2= 1
r
2= 1 dapat diinterpretasikan
sbb. :
Adanya hubungan linier
yang tepat antara X dan Y:
100% keragaman Y
Interpretasi beberapa nilai r
2
Y
X
Y
0 < r
2< 1 dapat
diinterpretasi-kan sbb. :
Adanya hubungan linier yang
lemah antara X dan Y:
Interpretasi beberapa nilai r
2
Tidak ada hubungan linier
antara X dan Y:
Nilai Y tidak bergantung pada
nilai X. (Tidak ada keragaman
Y yang dapat diterangkan
oleh keragaman X)
Y
X
r
2= 0
r
2= 0 dapat diinterpretasikan
Korelasi dan Koefisien
Determinasi R
2
Koefisien determinasi, R2, untuk regresi linier sederhana
yang hubungannya linier (ordo X = 1) sama dengan koefisien korelasi kuadrat
Korelasi antara amatan Yi dengan nilai dugaannya untuk sembarang regresi linier dengan berapapun banyaknya peubah bebas
2 / 1 2 1
xy
R
(tanda
b
)(
R
)
r
=
=
2 xy 2
r
R
=
^ i
Y
R
r
^Y
Berbagai Kondisi yg Menggambarkan
Perbedaan antara R
2dan r
XYC1
Scatterplot of Y2 vs C1
C1
Scatterplot of Y1 vs C1
Correlations: X1; Y1
Pearson correlation of X1 and Y1 = 1,000 P-Value = *
Correlations: X2; Y2
Pearson correlation of X2 and Y2 = 0,000 P-Value = 1,000
The regression equation is Y1 = 2,00 + 3,00 X1
S = 0 R-Sq = 100,0% R-Sq(adj) = 100,0%
The regression equation is
Y2 = 4,000 + 0,00 X2 + 1,000 X2**2
S = 0 R-Sq = 100,0% R-Sq(adj) = 100,0%
r
XYFitted Line Plot
R2 = 1
r = 0
Berbagai Kondisi yg Menggambarkan
Perbedaan antara R
2dan r
XYX1
Scatterplot of Y3 vs X1
The regression equation is Y3 = 1,27 + 3,10 X1
S = 1,53396 R-Sq = 97,7%
Correlations: Y3; X1
Pearson correlation of Y3 and X1 = 0,988 R2 = 97,7%
r = 0,988
The regression equation is Y4 = 2,07 + 3,01 X1
Scatterplot of Y4 vs X1
R2 = 88,7%
r = 0,942
Correlations: Y4; X1
Pearson correlation of Y4 and X1 = 0,942
(lanjutan)
Berbagai Kondisi yg Menggambarkan
Perbedaan antara b
1dan r
XYX1
Scatterplot of C7 vs X1
The regression equation is C7 = 37,7 - 3,38 X1
S = 6,09048 R-Sq = 76,0% R-Sq(adj) = 73,0%
Correlations: C7; X1
Pearson correlation of C7 and X1 = -0,872
The regression equation is Y6 = 3,50 + 0,116 X1
S = 0,275434 R-Sq = 64,8% R-Sq(adj) = 60,4%
X1
Scatterplot of Y6 vs X1
Correlations: Y6; X1
Berbagai Kondisi yg Menggambarkan
Perbedaan antara b
1dan r
XY (lanjutan)X
Scatterplot of Y vs X
The regression equation is Y = 1,06 + 4,67 X
S = 2,06491 R-Sq = 53,3% R-Sq(adj) = 52,1%
Analysis of Variance
Source DF SS MS F P
Scatterplot of Y1 vs X1
The regression equation is Y1 = 3,99 + 0,00914 X1 S = 0,0077338 R-Sq = 93,5% R-Sq(adj) = 92,7%
Analysis of Variance
Source DF SS MS F P Regression 1 0,0068911 0,00689 115,21 0,000 Resd Error 8 0,0004785 0,00005
Pearson correlation of X1 and Y1 = 0,967 R2 = 93,5%
Uji Ketidakpasan Model
Harus ada ulangan pengamatan y
ipada nilai x
iyang sama. Mis. :
Untuk data contoh di samping dapat dinotasikan :
Uji ketidakpasan model :
Tabel Sidik Ragam
Sumber
Keragaman
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
Kuadrat
Tengah
(KT)
Regresi
(b1| b0)
1
Sisaan
n-2
Total JKRegresi
(
n 2)
JK sisaan
− Statistik uji-nya :
GM
Ketidakpasan model (KM)
X Y X Y 1 5,135 6 67,586 1 30,846 6 47,441 1 32,977 6 32,919 2 14,142 7 78,804 2 20,785 7 78,202 2 -1,499 7 73,846 3 13,463 8 154,158 3 30,391 8 114,145 3 -21,254 8 110,077 4 31,095 9 139,573 4 6,542 9 154,735 4 35,466 9 151,428 5 -5,419 10 163,649 5 59,32 10 189,114 5 73,178 10 214,504
Contoh : Uji ketidakpasan model
Tabel Sidik Ragam
Untuk data contoh di samping dapat dinotasikan :
m = 10, n1 = n2 =…..= n10 = 3
n = 30
db sisaan = n – 2 = 28 db galat murni =
= 30 – 10 = 20 db ketidakpasan model = 28 – 20
The regression equation is y = - 37,3 + 19,5 x
Predictor Coef SE Coef T P Constant -37,31 11,70 -3,19 0,003 x 19,483 1,885 10,33 0,000
S = 29,6616 R-Sq = 79,2% R-Sq(adj) = 78,5%
Analysis of Variance
Source DF SS MS F P Regression 1 93945 93945 106,78 0,000 Residual Error 28 24635 880
Lack of Fit 8 15272 1909 4,08 0,005 Pure Error 20 9363 468
Total 29 118580
Phit < 0,05
KEPUTUSAN : Tolak H0
KESIMPULAN: H0: model pas H1: model tdk pas
Contoh : Uji ketidakpasan model
Tabel Sidik Ragam
(lanjutan)
Pada contoh tersebut meskipun P-value untuk
pengaruh linier x dan regresi sangat kecil (0,000…)
namun kita tidak memperhatikan hal ini terlebih dahulu.
Kita perhatikan uji ketidakpasan modelnya dulu,
Æ
disimpulkan bahwa model tidak pas.
Selanjutnya kita periksa pola tebaran datanya.
x
y
10 8
6 4
2 0
200 150 100 50 0
Scatterplot of y vs x
Pada tebaran data-nya
ter-lihat adanya pola kuadratik
Æ
model yang digunakan
diubah menjadi :
ε
x
β
x
β
β
x
Scatterplot of y vs x
The regression equation is
y = 28,32 - 13,33 x + 2,983 x**2
S = 19,7555 R-Sq = 91,1% R-Sq(adj) = 90,5% Analysis of Variance
Source DF SS MS F P Regression 2 108043 54021,3 138,42 0,00 Error 27 10538 390,3
Total 29 118580
Sequential Analysis of Variance Source DF SS F P
Fitted Line Plot
Contoh : Uji ketidakpasan model
Tabel Sidik Ragam
(lanjutan)
• Dengan mengubah model
regresi dari linier ke kuadratik, R2
meningkat dari 79,2% menjadi 91,1%
• Dari tabel Sidik Ragam didapat bhw pengaruh X kuadrat nyata
OUTPUT MINITAB
FILM :
MENGUJI
KETIDAKPASAN MODEL
dengan
MENGGUNAKAN MINITAB
Klik di sini
X Y X Y 1 5,135 6 67,586 1 30,846 6 47,441 1 32,977 6 32,919 2 14,142 7 78,804 2 20,785 7 78,202 2 -1,499 7 73,846 3 13,463 8 154,158 3 30,391 8 114,145 3 -21,254 8 110,077 4 31,095 9 139,573 4 6,542 9 154,735 4 35,466 9 151,428 5 -5,419 10 163,649 5 59,32 10 189,114 5 73,178 10 214,504
Langkah-langkah
Pemilihan Model yang Pas
1.
Tentukan model, dapatkan dugaan persamaan garis regresinya,
susun tabel Sidik Ragam, jangan dulu melakukan uji F untuk
regresi keseluruhan
2.
Lakukan uji ketidakpasan model.
Jika tidak ada ulangan, cek secara eksploratif : plot sisaan-nya
(akan dijelaskan pada pokok bahasan: Diagnosa Model).
Jika
nyata
: lanjut ke langkah 3
Jika
tidak nyata
: gunakan KT sisaan s
2sebagai dugaan bagi
Rag(Y) =
σ
2, lakukan uji F secara keseluruhan, hitung R
2,
perik-sa asumsi untuk MKT melalui plot siperik-saan (Diagnoperik-sa Model)
Selang Kepercayaan
bagi koefisien kemiringan
b
1
Selang kepercayaan bagi koefisien
kemiringan adalah :
Output Excel untuk contoh kasus harga rumah:
Pada tingkat kepercayaan 95%, selang kepercayaan
bagi koefisien kemiringan garis adalah (0.0337, 0.1858)
1
1 1 1 n 2,α/2 b
b
α/2 2, n
1
t
s
β
b
t
s
b
−
−<
<
+
−Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Luas Lantai 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Selama satuan peubah tak bebas (harga rumah) dalam juta rupiah, kita percaya 95% bahwa rata-rata pengaruh penambahan harga rumah
berada antara Rp. 0,03374 juta sampai dengan Rp.0,18580 juta setiap penambahan satu m2 luas lantai
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Luas Lantai 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Selang kepercayaan 95% ini tidak memuat angka 0.
Kesimpulan : Ada hubungan linier yang nyata antara harga rumah
dengan luas lantai dengan tingkat nyata sebesar 95%
Selang Kepercayaan
bagi koefisien kemiringan
b
1
Peramalan
Dugaan persamaan garis regresi dapat
digunakan untuk memprediksi/meramal nilai
Y jika x diketahui (
hati-hati hanya untuk x
yang berada dalam selang pengamatan
)
Untuk suatu nilai, x
n+1, nilai prediksi bagi Y
adalah
1
n
1
0
1
n
b
b
x
317.85
0)
0.1098(200
98.25
lantai)
(luas
0.1098
98.25
rumah
harga
=
+
=
+
=
Berapa kira-kira harga rumah yang luas lantainya
2000 m
2! (2000 bukan titik pengamatan, namun
masih dalam selang pengamatan).
Æ
interpolasi
Prediksi harga rumah dengan luas lantai
2000 m
2adalah Rp 317,85 juta
0
0 500 1000 1500 2000 2500 3000
Ha
Selang data yang relevan
Ketika menggunakan garis regresi sebagai alat
untuk memprediksi, x yang boleh digunakan adalah
x yang nilainya dalam selang pengamatan
Selang yang relevan
Sangat riskan untuk melakukan
Selang kepercayaan rataan
respon dan dugaan individu
Y
yi = b0 + b1 xi Selang
kepercayaan bagi rataan Y, untuk xi
Selang kepercaya-an bagi nilai peng-amatan y
,
untuk xSelang Kepercayaan bagi nilai harapan
Y, untuk suatu X
Selang kepercayaan bagi
dugaan nilai harapan/rataan y
jika diketahui x
n+1Perhatikan bahwa rumus tersebut mengandung
Selang Kepercayaan bagi
individu Y, untuk suatu nilai x
Dugaan bagi Nilai Tengah/Rataan:
Contoh harga rumah
Dapatkan selang kepercayaan 95% bagi rataan
harga rumah dengan luas lantai 2.000 m2
harga rumah y
∧
i= 317,85 (Rp. juta)
Selang kepercayaan bagi E(Y
n+1|X
n+1)
37.12
Selang kepercayaan 95% bagi rataan harga rumah
354.900.000,-Predicted Values for New Observations New
Obs Fit SE Fit 95% CI 95% PI 1 317,8 16,1 (280,7; 354,9) (215,5; 420,1) Values of Predictors for New Observations
New Luas Obs Lantai
1 2000
OUTPUT MINITAB
Dugaan bagi Nilai Tengah/Rataan:
Contoh harga rumah
Selang Kepercayaan 95% bagi dugaan nilai tengah/Rataan untuk suatu nilai x tertentu yg tidak ada pada pengamatan, namun masih dalam selang
Æ
Dugaan Nilai Tengah untuk x = 2000
Dugaan bagi individu/respon:
contoh harga rumah
Dapatkan selang kepercayaan 95% bagi respon individu
harga rumah untuk rumah dengan luas lantai 2.000 m2
y
∧
i= 317,85 (Rp. juta)
Selang kepercayaan bagi individu y
n+1102.28
Selang kepercayaan 95% bagi harga rumah dengan luas lantai 2000m2 ialah dari Rp 215.500.000,- sampai Rp 420.070.000,-.
OUTPUT MINITAB
Predicted Values for New Observations New
Obs Fit SE Fit 95% CI 95% PI 1 317,8 16,1 (280,7; 354,9) (215,5; 420,1) Values of Predictors for New Observations
New Luas Obs Lantai
1 2000
Dugaan bagi individu/respon:
contoh harga rumah
(lanjutan)
FILM :
MENGHITUNG
SELANG KEPERCAYAAN BAGI
RAMALAN NILAI TENGAH
&
RAMALAN NILAI INDIVIDU
dengan
MENGGUNAKAN MINITAB
Klik di sini
Data contoh Harga Rumah
Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425