Bab 2.
Bab 2.
MODEL REGRESI LINEAR
MODEL REGRESI LINEAR
SEDERHANA
SEDERHANA
Bab 2.
Bab 2.
MODEL REGRESI LINEAR
MODEL REGRESI LINEAR
SEDERHANA
SEDERHANA
Oleh Oleh Bambang Juanda Bambang JuandaPengertian Model & Tujuan Pemodelan
Pengertian Model & Tujuan Pemodelan
Perumusan masalah
Perumusan masalah
Model
Model
Model: Abstraksi realitas
Model: Abstraksi realitas
dlm pers matematika
dlm pers matematika
Model ekonometrika: model statistik
Model ekonometrika: model statistik
yg mencakup yg mencakuperror
error
Y = f(X1, X2, ..., Xp) + error (2.1) data aktual = dugaan + sisaan (simpangan)
data = komp. sistematik + komp. non-sistematik dugaan Y = f(X1, X2, ..., Xp) (2.2)
diharapkan unsur-unsur ketidak-teraturan nilai Y dapat dijelaskan oleh nilai-nilai dari peubah X1, X2, ..., dan Xp berdasarkan model dugaan dalam persamaan (2.2). Oleh karena itu, komponen sisaan diusahakan menjadi relatif kecil dibandingkan komponen dugaannya.
Y = f(X1, X2, ..., Xp) + error (2.1) data aktual = dugaan + sisaan (simpangan)
data = komp. sistematik + komp. non-sistematik dugaan Y = f(X1, X2, ..., Xp) (2.2)
diharapkan unsur-unsur ketidak-teraturan nilai Y dapat dijelaskan oleh nilai-nilai dari peubah X1, X2, ..., dan Xp berdasarkan model dugaan dalam persamaan (2.2). Oleh karena itu, komponen sisaan diusahakan menjadi relatif kecil dibandingkan komponen dugaannya.
Deskripsi komponen error :
Deskripsi komponen error :
1.
1. Kesalahan pengukuran dan Kesalahan pengukuran dan proxyproxy dari peubah respons dari peubah respons Y maupun peubah penjelas X
Y maupun peubah penjelas X11, X, X22, ..., dan X, ..., dan Xpp..
2.
2. Asumsi bentuk fungsi f yang salah. MAsumsi bentuk fungsi f yang salah. Mungkin ada ungkin ada
bentuk fungsi lainnya yang lebih cocok, linear maupun bentuk fungsi lainnya yang lebih cocok, linear maupun non
non--linear.linear. 3.
3. Omitted variablesOmitted variables.. Peubah (Peubah (variablevariable) yang seharusnya ) yang seharusnya dimasukkan ke dalam model, dikeluarkan karena
dimasukkan ke dalam model, dikeluarkan karena alasan
alasan--alasan tertentu (misalnya penyederhanaan, alasan tertentu (misalnya penyederhanaan, atau data sulit diperoleh dan lain
atau data sulit diperoleh dan lain--lain).lain).
4.
4. Pengaruh faktorPengaruh faktor--faktor lain yang belum terpikirkan atau faktor lain yang belum terpikirkan atau tidak dapat diramalkan (
tidak dapat diramalkan (unpredictable effectsunpredictable effects).).
1.
1. Kesalahan pengukuran dan Kesalahan pengukuran dan proxyproxy dari peubah respons dari peubah respons Y maupun peubah penjelas X
Y maupun peubah penjelas X11, X, X22, ..., dan X, ..., dan Xpp..
2.
2. Asumsi bentuk fungsi f yang salah. MAsumsi bentuk fungsi f yang salah. Mungkin ada ungkin ada
bentuk fungsi lainnya yang lebih cocok, linear maupun bentuk fungsi lainnya yang lebih cocok, linear maupun non
non--linear.linear. 3.
3. Omitted variablesOmitted variables.. Peubah (Peubah (variablevariable) yang seharusnya ) yang seharusnya dimasukkan ke dalam model, dikeluarkan karena
dimasukkan ke dalam model, dikeluarkan karena alasan
alasan--alasan tertentu (misalnya penyederhanaan, alasan tertentu (misalnya penyederhanaan, atau data sulit diperoleh dan lain
atau data sulit diperoleh dan lain--lain).lain).
4.
4. Pengaruh faktorPengaruh faktor--faktor lain yang belum terpikirkan atau faktor lain yang belum terpikirkan atau tidak dapat diramalkan (
Model Regresi Linear Sederhana
Model Regresi Linear Sederhana
i
i
i
X
Y
0
1
intersep Y Slope
• Garis Lurus yg Paling Cocok dgn Data
• Hubungan antar Peubah dlm Fungsi Linear dlm Parameter
Error Acak Model Populasi:
i
i
i
X
Y
0
1
Peubah Respons (dependent) Peubah Penjelas (Independent)akibat; sulit atau mahal diukur
i
i
i
b
b
X
e
Y
0
1
Model Regresi Contoh:
penyebab; mudah atau murah diukur
e
= Error AcakY
Model Regresi Linear
Model Regresi Linear
Populasi
Populasi
Nilai Peng-amatanY
i
b
0
b
1X
i
e
ie
i = Error AcakX
Nilai Pengamatanm
b
b
Y/Xi
0
1X
i DugaanPersamaan Regresi Linear Sederhana
Persamaan Regresi Linear Sederhana
(Teladan)
(Teladan)
Ingin mengkaji hubungan antara luas lantai toko (hasil pertanian) dengan total
penjualan tahunannya. Data contoh utk 7 toko telah
diperoleh. Tentukan
persamaan garis lurus yg paling cocok dgn data tsb
Annual Store Square Sales
Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760
Ingin mengkaji hubungan antara luas lantai toko (hasil pertanian) dengan total
penjualan tahunannya. Data contoh utk 7 toko telah
diperoleh. Tentukan
persamaan garis lurus yg paling cocok dgn data tsb
Annual Store Square Sales
Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760
Diagram Pencar (
Diagram Pencar (Scatter Diagram
Scatter Diagram))
0 2000 4000 6000 8000 10000 12000 0 1000 2000 3000 4000 5000 6000
Luas Lantai (Square Feet )
P e nj ua la n ($ 0 0 0 ) 0 2000 4000 6000 8000 10000 12000 0 1000 2000 3000 4000 5000 6000
Luas Lantai (Square Feet )
P e nj ua la n ($ 0 0 0 )
Model Regresi Linear Contoh
Model Regresi Linear Contoh
i
i
b
b
X
Y
0
1
Y
i
= Nilai dugaan Y utk pengamatan ke-i
i
i
i
b
b
X
e
Y
0
1
Y
i= Nilai dugaan Y utk pengamatan ke-i
X
i= Nilai X utk pengamatan ke-i
b
0= Dugaan bagi koef intersep populasi
0;
rata-rata Y jika X=0
b
1= Dugaan bagi koef slope populasi
1;
rata-rata perbedaan Y jika X berbeda 1 unit
X
Y
Metode (
Metode (
Jumlah
Jumlah
) Kuadrat (
) Kuadrat (
Sisaan
Sisaan
) Terkecil:
) Terkecil:
MKT atau
MKT atau Ordinary Least Squares
Ordinary Least Squares
shg
e
=
q
minimumkan
dan
,
ˆ
ˆ
1 = i 2 i
i i i iY
Y
e
Mencari dugaan koefisien yg menghasilkan jumlah kuadrat simpangan antara data aktual dgn data dugaan MINIMUM
X
b
Y
a
X
X
n
Y
X
Yi
X
n
X
X
Y
Y
X
X
b
n i n i i i n i n i n i i i i n i i n i i i
2 1 1 2 1 1 1 1 2 1Persamaan Garis Lurus “Terbaik”
Persamaan Garis Lurus “Terbaik”
i
i
i
X
X
b
b
Y
487
.
1
415
.
1636
1
0
Predictor Coef SE Coef T P Constant 1636.4 451.5 3.62 0.015 X 1.4866 0.1650 9.01 0.000 S = 611.752 R-Sq = 94.2% R-Sq(adj) = 93.0%
Analysis of Variance
Source DF SS MS F P Regression 1 30380456 30380456 81.18 0.000 Residual Error 5 1871200 374240 Total 6 32251656Predictor Coef SE Coef T P Constant 1636.4 451.5 3.62 0.015 X 1.4866 0.1650 9.01 0.000 S = 611.752 R-Sq = 94.2% R-Sq(adj) = 93.0%
Analysis of Variance
Source DF SS MS F P Regression 1 30380456 30380456 81.18 0.000 Residual Error 5 1871200 374240 Total 6 32251656Grafik Garis Lurus
Terbaik
0 2000 4000 6000 8000 10000 12000 0 1000 2000 3000 4000 5000 6000Luas Lantai (Square Feet )
P e nj ua la n ($ 0 0 0 ) 0 2000 4000 6000 8000 10000 12000 0 1000 2000 3000 4000 5000 6000
Luas Lantai (Square Feet )
P e nj ua la n ($ 0 0 0 )
Interpretasi Koefisien
Interpretasi Koefisien
Y
i= 1636.415 +1.487X
iInterpretasi Nilai slope 1.487 (‘umumnya’): utk kenaikan 1 unit dlm X, diduga Y akan meningkat 1.487unit.
Interpretasi ‘paling tepat’ dlm kasus ini:
• Rata2 perbedaan total penjualan antara toko yg luasnya berbeda 1 square feet adalah $1487 per th
Implikasi dari dugaan slope (dgn asumsi tertentu):
• Jika ukuran lantai toko naik 1 square feet, model tsb memprediksi bahwa total penjualan yg diharapkan akan meningkat $1487 per th.
Interpretasi ‘paling tepat’ dlm kasus ini:
• Rata2 perbedaan total penjualan antara toko yg luasnya berbeda 1 square feet adalah $1487 per th
Implikasi dari dugaan slope (dgn asumsi tertentu):
• Jika ukuran lantai toko naik 1 square feet, model tsb memprediksi bahwa total penjualan yg diharapkan akan meningkat $1487 per th.
Asumsi Model Regresi Linear
Asumsi Model Regresi Linear
Kenormalan & Kebebasan
Kenormalan & Kebebasan
–
–
Nilai
Nilai--nilai
nilai Y
Y Menyebar Normal utk masing
Menyebar Normal utk
masing--masing nilai
masing nilai X;
X; dgn E(Y
i)=b
0+b
1X
idan
Var(Y
i) =
2utk semua i.
–
–
(i)
(i) Sebaran Peluang
Sebaran Peluang Error adalah
Error adalah Normal,
Normal,
Bebas dan Identik
Bebas dan Identik dengan E(e
i)=0 dan
var(e
i)=
2untuk semua i.
–
(ii) Peubah X dan e
ibebas
Homoskedastisitas (Ragam Konstan)
Homoskedastisitas (Ragam Konstan)
Sisaan (
Sisaan (Error
Error) bebas
) bebas
Kenormalan & Kebebasan
Kenormalan & Kebebasan
–
–
Nilai
Nilai--nilai
nilai Y
Y Menyebar Normal utk masing
Menyebar Normal utk
masing--masing nilai
masing nilai X;
X; dgn E(Y
i)=b
0+b
1X
idan
Var(Y
i) =
2utk semua i.
–
–
(i)
(i) Sebaran Peluang
Sebaran Peluang Error adalah
Error adalah Normal,
Normal,
Bebas dan Identik
Bebas dan Identik dengan E(e
i)=0 dan
var(e
i)=
2untuk semua i.
–
(ii) Peubah X dan e
ibebas
Homoskedastisitas (Ragam Konstan)
Homoskedastisitas (Ragam Konstan)
Sisaan (
Ragam Error
Sekitar Garis Regresi
f(e)
Nilai-nilai y menyebar normal di sekitar garis regresi.
Utk masing-masing nilai x,
“sebaran” atau ragam disekitar
garis regresi adalah sama.
X
1X2
X
Y
Nilai-nilai y menyebar normal di sekitar garis regresi.
Utk masing-masing nilai x,
“sebaran” atau ragam disekitar
garis regresi adalah sama.
Dugaan Galat baku (
Dugaan Galat baku (Standard Error
Standard Error))
2
ˆ
/n
JKS
S
y x
2
)
ˆ
(
1 2
n
Y
Y
n i i i Simpangan Baku pengamatan-pengamatan disekitar garis regresiJika asumsi tentang peubah acak tentang peubah acak I dipenuhi maka masing-masing dugaan koefisien akan menyebar normal dgn
E(b0)=b0 dan E(b1)=b1 serta dugaan ragam:
bi
~
N(i;2 ) bi
2 1 2 2 21
0
n i i bX
X
X
n
n i i X Y bX
X
S
S
1 2 /)
(
1Jika asumsi tentang peubah acak tentang peubah acak I dipenuhi maka masing-masing dugaan koefisien akan menyebar normal dgn
E(b0)=b0 dan E(b1)=b1 serta dugaan ragam:
Teladan: Toko Hasil Pertanian
Teladan: Toko Hasil Pertanian
Data utk 7 Toko:Model Regresi yg diperoleh:
Slope model ini adalah
1.487.
•Apakah ada hubungan linear antara ukuran luas toko dgn total penjualan tahunannya? •Apakah total penjualan dpt diprediksi dari ukuran luas lantai tokonya?
Annual Toko Square Sales
Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760
Y
i= 1636.415 +1.487X
iSlope model ini adalah
1.487.
•Apakah ada hubungan linear antara ukuran luas toko dgn total penjualan tahunannya? •Apakah total penjualan dpt diprediksi dari ukuran luas lantai tokonya?
Annual Toko Square Sales
Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760
Inferensia mengenai Slope: Uji
Inferensia mengenai Slope: Uji--tt
• Uji-t utk Slope Populasi
Ada Hubungan Linear antara X dgn Y ?
• Hipotesis Nol dan Alternatif
H
0: b
1= 0 (X tidak dpt menjelaskan Y)
H
1: b
1 0 (
X dapat menjelaskan Y)
i
i
i
X
Y
0
1
• Uji-t utk Slope Populasi
Ada Hubungan Linear antara X dgn Y ?
1 1 1 b
S
b
t
• Statistik Uji:
n i i X Y bX
X
S
S
1 2 /)
(
1dan db = n - 2
• Hipotesis Nol dan Alternatif
H
0: b
1= 0 (X tidak dpt menjelaskan Y)
H
1: b
1 0 (
X dapat menjelaskan Y)
t S tat P-valu e In te rce p t 3.6244333 0.0151488 X V a ria b le 1 9.009944 0.0002812
H
H
00:
: b
b
11= 0
= 0
H
H
11:
: b
b
11
0
0
a
a
.05
.05
db
db
7
7 -- 2 = 5
2 = 5
Nilai
Nilai--nilai kritis :
nilai kritis :
Statistik Uji-t :
Keputusan:
Kesimpulan:
Inferensia ttg Slope: Contoh Uji
Inferensia ttg Slope: Contoh Uji--tt
t S tat P-valu e In te rce p t 3.6244333 0.0151488 X V a ria b le 1 9.009944 0.0002812
H
H
00:
: b
b
11= 0
= 0
H
H
11:
: b
b
11
0
0
a
a
.05
.05
db
db
7
7 -- 2 = 5
2 = 5
Nilai
Nilai--nilai kritis :
nilai kritis :
Statistik Uji-t :
Keputusan:
Kesimpulan:
Terbukti ada hubungan. Makin luas ukuran Toko, makin tinggi penjualannya
t
0 2.5706 -2.5706 .025 Tolak H0 Tolak H0 .025 Tolak H0Selang Kepercayaan Slope
Selang Kepercayaan Slope
b
1
± t
n-2
S
b1
Output Excel masalah Produce Stores
L o w er 95% U p p er 95%
In te rce p t 475.810926 2797.01853 X V a ria b le 11.06249037 1.91077694
95% yakin nilai slope antara 1.062 s/d 1.911. (Selang Kepercayaan ini tdk mencakup nilai 0) Kesimpulan:
Ada hubungan linear yg nyata antara
penjualan tahunan dgn ukuran toko
.
L o w er 95% U p p er 95%
In te rce p t 475.810926 2797.01853 X V a ria b le 11.06249037 1.91077694
Taraf Nyata,
a dan Daerah Penolakan
H
0:
1k
H
1:
1< k
0H
0:
1 k
H
1:
1> k
a
a
Daerah Penolakan (ttk kritis) 1 b1 t b1~
N(I;2 ) b1 0 0H
0:
1 k
H
1:
1> k
H
0:
1k
H
1:
1 k
a
a/2
Daerah Penolakan (ttk kritis) t t0 ei
(i) ei
~
N(0;2 )^
μY/X
Asumsi Model Regresi Linear: Peubah acak εi
menyebar Normal, bebas dan identik utk i=1,.. ,n.
Bebas: Cov(εt, εs)= E(εtεs)=0 untuk t≠s.
Homoskedastisitas: Var(εi)= E(εi2)=2. (ii) X fixed variable
Dugaan Koefisien i dengan OLS bersifat TAK BIAS dgn RAGAM MINIMUM (Best Linear Unbiased Estimator), dan menyebar Normal.
0 + 1Xi μY/X Y/X1 Y/Xi ~ N(0+1Xi;2 ) Yi i ^ ^ ^ ~ N(0+1Xi;2 ) ^ μY/X i μ Yi
Dugaan Rata2 Y utk Xi tertentu menyebar
Normal
Dugaan Individu Y utk Xi ttt sama dgn dugaan
rata2nya, juga
menyebar Normal, dgn ragam lebih besar
Dugaan Selang Nilai
Dugaan Selang Nilai--Nilai Ramalan
Nilai Ramalan
Selang kepercayaan bagi m
YX,
Rataan Y utk X
itertentu
Selang bervariasi sesuai jaraknya terhadap rataan, X.
n
i
i
i
yx
n
i
)
X
X
(
)
X
X
(
n
S
t
Yˆ
1
2
2
2
1
nilai t dari tabel dgn db=n-2
Standard error
dugaan
Selang bervariasi sesuai jaraknya terhadap rataan, X.
Dugaan Selang Nilai-Nilai Ramalan
Selang Kepercayaan bagi Dugaan
Respons individu Y
iutk X
itertentu
Tambahan 1 ini membuat selangnya lebih lebar dari SK bagi rataan Y,
µ
XY
n
i
i
i
yx
n
i
)
X
X
(
)
X
X
(
n
S
t
Yˆ
1
2
2
2
1
1
Tambahan 1 ini membuat selangnya lebih lebar dari SK bagi rataan Y,
µ
XYDugaan Selang utk Nilai-nilai X yang
Berbeda
Y
Selang Kepercayaan utk individu Yi Selang Kepercayaan utk rataan YX
X
X
itertentu
_
Y
i= 1636.415 +1.487X
iData for 7 Toko:
Model Regresi yg diperoleh:
Dugalah penjualan tahunan
utk suatu toko berukuran
2000 square feet.
Annual
Toko Square Sales Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760 Yi = 1636.415 +1.487 (2000) Annual
Toko Square Sales Feet ($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760 Dugaan Penjualan = 4610.45 ($000) Seberapa besar kemungkinan
kesalahan dari dugaan ini??
Yi = 1636.415 +1.487 (2000)
Tk Keyakinan bhw nilai sebenarnya berada dlm selang dugaan Selang kepercayaan (1-)100% bagi nilai sebenarnya
Dugaan Selang Ramalan Rataan Y
Dugaan Selang Ramalan Rataan Y
Tentukan SK 95% bagi rata-rata penjualan tahunan utk toko berukuran 2,000 square feet
Dugaan Selang Kepercayaan bagi m
XY
n i i i yx n i)
X
X
(
)
X
X
(
n
S
t
Yˆ
1 2 2 21
Dugaan Sales Yi = 1636.415 +1.487Xi = 4610.45 ($000) X = 2350.29 SYX = 611.75 tn-2 = t5 = 2.5706 = 4610.45 ± 980.97 SK bagi rataan YDugaan Selang Ramalan Individu Y
Dugaan Selang Ramalan Individu Y
Tentukan SK 95% bagi penjualan tahunan utk suatu toko
berukuran 2,000 square feet
Ramalan Sales Yi = 1636.415 +1.487Xi = 4610.45 ($000)
Selang kepercayaan utk dugaan
Individu
Y
Ramalan Sales Yi = 1636.415 +1.487Xi = 4610.45 ($000) X = 2350.29 SYX = 611.75 tn-2 = t5 = 2.5706 = 4610.45 ± 1853.45 SK bagi individu Y
n i i i yx n i)
X
X
(
)
X
X
(
n
S
t
Yˆ
1 2 2 21
1
ANOVA: Analisis Ragam
ANOVA: Analisis Ragam
Apakah Keragaman Y dapat dijelaskan oleh
Apakah Keragaman Y dapat dijelaskan oleh
(peubah X dlm) Model ?
(peubah X dlm) Model ?
Y
i= b
0+ b
1X
i+ e
iY
i= (Y - b
1X) + b
1X
i+ e
i(Y
i– Y) = b
1(X
i– X) + e
i(Yi – Y)
2= { b
1(X
i– X) + e
i}
2(Y
i– Y)
2= { b
1(X
i– X) + e
i}
2(Y
i– Y)
2= b
12(X
i– X)
2+ e
i2JKT = JKR + JKS
Y
i= b
0+ b
1X
i+ e
iY
i= (Y - b
1X) + b
1X
i+ e
i(Y
i– Y) = b
1(X
i– X) + e
i(Yi – Y)
2= { b
1(X
i– X) + e
i}
2(Y
i– Y)
2= { b
1(X
i– X) + e
i}
2(Y
i– Y)
2= b
12(X
i– X)
2+ e
i2JKT = JKR + JKS
Ukuran Keragaman: Jumlah Kuadrat
Ukuran Keragaman: Jumlah Kuadrat
Y
JKT = (Yi - Y)2 JKS =(Yi - Yi )2_
_
XiY
X
JKR = (Yi - Y)2_
_
JKT
=
Jumlah Kuadrat Total
•mengukur keragaman nilai-nilai Yi sekitar rataan Y
JKR
=
Jumlah Kuadrat Regresi
•Menjelaskan keragaman yg dpt dianggap berasal
dari hubungan antara X dgn Y (model regresi)
JKS
=
Jumlah Kuadrat Sisa (error)
•Keragaman yg dpt dianggap berasal dari
faktor-faktor selain hubungan antara X dgn Y
db
JK
Regresi
1
30380456.12
Sisa
5
1871199.595
Total
6
32251655.71
Tabel
ANOVA
JKR
JKS
JKT
JKS
=
Jumlah Kuadrat Sisa (error)
•Keragaman yg dpt dianggap berasal dari
Sumber
Keragaman Derajat Bebas Kuadrat (JK)Jumlah Tengah (KT)Kuadrat F-hitung
Regresi 1 JKR=JKR= KTR=JKR/1 KTR/KTG
Tabel Analisis Ragam (ANOVA)
Untuk Regresi Linier Sederhana
JKT = (Yi - Y)2
_
JKR = (Yi - Y)2_
JKS =(Yi - Yi )2 Regresi 1 JKR=JKR= KTR=JKR/1 KTR/KTG Galat n-2 JKS=JKS= KTS=JKG/(n-2) Total n-1 JKT=JKT= (n 1)(Sy2 b S2 2x )(
n
1
)
S
y2(
n
1
)
b S
2 2xKoefisien
Koefisien
Determinasi:
Determinasi:
JKR Jumlah Kuadrat Regresi
JKT Jumlah Kuadrat Total
r
2= =
• Mengukur “proporsi keragaman” yg dijelaskan oleh (peubah bebas X dlm) model regresi
• Sering secara “informal” sbg ukuran goodness-of-fit utk membandingkan validitas bbrp spesifikasi model
• 94% keragaman total penjualan tahunan dpt dijelaskan oleh keragaman ukuran toko yg diukur dgn square footage
• Mengukur “proporsi keragaman” yg dijelaskan oleh (peubah bebas X dlm) model regresi
• Sering secara “informal” sbg ukuran goodness-of-fit utk membandingkan validitas bbrp spesifikasi model
• 94% keragaman total penjualan tahunan dpt dijelaskan oleh keragaman ukuran toko yg diukur dgn square footage
Se = 611.752 R-Sq = 94.2% R-Sq(adj) = 93.0%
Analysis of Variance
Source DF SS MS F P Regression 1 30380456 30380456 81.18 0.000 Residual Error 5 1871200 374240 Total 6 32251656Koefisien Determinasi (
Koefisien Determinasi (rr
2
2
)
)
dan Korelasi (
dan Korelasi (rr))
r
2= 1,
Y
r
2= 1,
Yi = b0 + b1XiX
^
Y
Yi = b0 + b1XiX
^
r = +1
r = -1
r
2= .8,
Y
r
2= 0,
Yi = b0 + b1XiX
^
X
Yi = b0 + b1XiX
Y
Yi = b0 + b1XiX
^
r = +0.9
r = 0
Inferensia mengenai Model: Uji
Inferensia mengenai Model: Uji--F
F
• Statistik Uji:
• Hipotesis Statistik
H
0: b
1= 0 (
model tdk dpt menjelaskan keragaman Y)
H
1: b
1 0 (
model dapat menjelaskan keragaman Y)
i
i
i
X
Y
0
1
Apakah Model dptmen-jelaskan keragaman Y?
F = KTR/KTS
~ F
(p, n-1-p) a = 0.05• Statistik Uji:
Analysis of Variance
Source DF SS MS F P Regression 1 30380456 30380456 81.18 0.000 Residual Error 5 1871200 374240 Total 6 32251656F = KTR/KTS
~ F
(p, n-1-p) F(1,5) 0 6.61 a = 0.05Analisis Sisaan (
Analisis Sisaan (Residual
Residual))
Tujuan
Tujuan
–
–
Mengkaji Linearitas
Mengkaji Linearitas
–
–
Evaluasi pelanggaran asumsi
Evaluasi pelanggaran asumsi
Analisis Sisaan dgn Grafik
Analisis Sisaan dgn Grafik
–
–
Plot sisaan Vs. nilai
Plot sisaan Vs. nilai--nilai
nilai X
X
i iatau Y
atau Y
ii(e
(eii,X,Xii) atau (e) atau (eii22 ,X,X
ii) atau (e) atau (ei i /s/see ,X,Xii) )
–
–
Studentized residuals
Studentized residuals: = e
: = e
ii/s
/s
eeMemungkinkan mempertimbangkan besaran Memungkinkan mempertimbangkan besaran sisaan (sisaan
sisaan (sisaan--baku spt Normal baku)baku spt Normal baku)
Tujuan
Tujuan
–
–
Mengkaji Linearitas
Mengkaji Linearitas
–
–
Evaluasi pelanggaran asumsi
Evaluasi pelanggaran asumsi
Analisis Sisaan dgn Grafik
Analisis Sisaan dgn Grafik
–
–
Plot sisaan Vs. nilai
Plot sisaan Vs. nilai--nilai
nilai X
X
i iatau Y
atau Y
ii(e
(eii,X,Xii) atau (e) atau (eii22 ,X,X
ii) atau (e) atau (ei i /s/see ,X,Xii) )
–
–
Studentized residuals
Studentized residuals: = e
: = e
ii/s
/s
eeMemungkinkan mempertimbangkan besaran Memungkinkan mempertimbangkan besaran sisaan (sisaan
sisaan (sisaan--baku spt Normal baku)baku spt Normal baku)
Analisis Sisaan utk Linearitas
Not Linear
Lineare e
X
e e
Analisis Sisaan utk
Analisis Sisaan utk
Homoskedastisitas
Homoskedastisitas
Heteroskedastisitas
Homoscedasticity
SR SR
Menggunakan Standardized Residuals (SR)
SR
X
SR
Analisis Sisaan utk
Kebebasan e
Tidak Bebas
BebasSR SR
X SR
X SR
Standardized Residual P e r c e n t 3.0 1.5 0.0 -1.5 -3.0 99 90 50 10 1 Fitted Value S ta n d a r d iz e d R e s id u a l 10000 8000 6000 4000 1 0 -1 -2 Standardized Residual F r e q u e n c y 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 2.0 1.5 1.0 0.5 0.0 Observation Order S ta n d a r d iz e d R e s id u a l 7 6 5 4 3 2 1 1 0 -1 -2
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for Y
Analisis Sisaan: Output Komputer
Analisis Sisaan: Output Komputer
Standardized Residual P e r c e n t 3.0 1.5 0.0 -1.5 -3.0 99 90 50 10 1 Fitted Value S ta n d a r d iz e d R e s id u a l 10000 8000 6000 4000 1 0 -1 -2 Standardized Residual F r e q u e n c y 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 2.0 1.5 1.0 0.5 0.0 Observation Order S ta n d a r d iz e d R e s id u a l 7 6 5 4 3 2 1 1 0 -1 -2
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Statistik Durbin
Statistik Durbin--Watson
Watson
•Digunakan utk data time series guna mendeteksi
autokorelasi (Sisaan dlm suatu periode
berhubungan dgn sisaan dlm periode lain)
•Mengukur Pelanggaran asumsi kebebasan e
•Digunakan utk data time series guna mendeteksi
autokorelasi (Sisaan dlm suatu periode
berhubungan dgn sisaan dlm periode lain)
•Mengukur Pelanggaran asumsi kebebasan e
n i i n i i ie
)
e
e
(
D
1 2 2 2 1 Seharusnya mendekati 2.Jika tidak, kaji model utk autokorelasi.
Tipe Model Regresi
Tipe Model Regresi
Hubungan Linear Positif Hubungan Tidak Linear