1. Model Regresi Linear dan Penaksir Kuadrat Terkecil 2. Prediksi Nilai Respons
3. Inferensi Untuk Parameter-parameter Regresi 4. Kecocokan Model Regresi
5. Korelasi
Utriweni Mukhaiyar MA 2081 Statistika Dasar 14 April 2014
*
2
*
1. Menentukan/menaksir parameter-
parameter yang terlibat dalam suatu model matematik yang linear terhadap parameter-parameter tersebut.
2. Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai
variabel yang lain , misalkan X, dengan menggunakan model regresi linier
(interpolasi).
Suhu (X) Gula yang Dihasilkan (Y) f(x)
3
X menentukan Y
prediktor respons
bukan peubah acak
peubah
acak Memiliki distribusi
ILUSTRASI
Observasi 1 2 3 … n
X X1 X2 X3 … Xn
Y Y1 Y2 Y3 … Yn
Mana yang merupakan prediktor ??
4
Variabel yang nilainya mempengaruhi variabel yang lainnya.
Variabel yang variansinya terkecil Variabel yang kejadiannya lebih dahulu terjadi.
1
2
3
5
0 1
i i i
Y X e
- 1 dan 0 merupakan parameter-parameter model yang akan ditaksir
- ei adalah galat pada observasi ke-i (acak)
M ODEL R EGRESI L INEAR S EDERHANA
6
*
1.
Ketidakmampuan model regresi dalammemodelkan hubungan prediktor dan respons dengan tepat
2.
Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat3.
Ketidakmampuan model untuk melibatkan semua variabel prediktor7
*
- 1 dan 0 ditaksir dengan metode kuadrat terkecil (least square)
- Asumsi-asumsi :
1. Ada pengaruh X terhadap Y 2.
3. Nilai harapan dari ei adalah 0, atau E[ ei ] = 0
4. Variansi dari ei, sama untuk semua i = 1, 2,…, n 5. ei berdistribusi normal untuk semua i = 1, 2,…, n 6. e1,e2,...,en saling bebas (independen)
0 1
untuk 1,2,...,
i i i
Y X e i n
Misalkan b1 adalah taksiran bagi 1 dan b0 adalah taksiran bagi 0. Maka taksiran bagi model
regresi adalah
Kriteria penaksiran kuadrat terkecil adalah meminimumkan
terhadap b0 dan b1, dengan
8
0 1
i
iY b b X
2
1
n ii
e
0 1
i i i i i
e Y Y Y b b X
Diperoleh
Sedangkan taksiran untuk variansi galat acak adalah
9
1
1 2
1
n
i i
XY i
n XX
i i
X X Y Y b JK
JK X X
0
1b Y b X
22 2
ˆ
1ˆ 2 2 2
i i
G
y y
YY XYJK JK b JK
s n n n
Suhu (X) 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 Logam yg dihasilkan (Y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5
ei
10 6
6.5 7 7.5 8 8.5 9 9.5 10 10.5 11
0.8 1 1.2 1.4 1.6 1.8 2 2.2
Berat logam yang dihasilkan (y)
Suhu (x)
n = 11
Model persamaan regresi
11
11
1
1 11
2
1
1,8091
i i
i
i i
X X Y Y b
X X
11
1
1 1,5
i i
X X
n
11
1
1 9,13
i i
Y Y
n
0 1 6, 4136 b Y b X
6, 4136 1,8091
i i
Y X
12
*
Prediksi model Suhu (xi) Logam yg dihasilkan (yi)
1 8.1 8.22 -0.12
1.1 7.8 8.40 -0.60
1.2 8.5 8.58 -0.08
1.3 9.8 8.77 1.03
1.4 9.5 8.95 0.55
1.5 8.9 9.13 -0.23
1.6 8.6 9.31 -0.71
1.7 10.2 9.49 0.71
1.8 9.3 9.67 -0.37
1.9 9.2 9.85 -0.65
2 10.5 10.03 0.47
Taksiran variansi galat acak 2
ˆ
22 9 0, 4
i i
G y y
s JK n
ˆ
i i i
e y y
ˆi y
Misalkan suhu proses (X) adalah 1.55 satuan suhu.
Maka prediksi berat logam yang dihasilkan pada suhu tersebut adalah
13
6, 4136 1,8091
6, 4136 1,8091 1, 55 9, 2177
Y X
Prediksi Nilai Respons
14
A
SUMSIK
ENORMALAN1
•Asumsi ei berdistribusi normal untuk semua i = 1, 2,…, n
2
•Yi beristribusi normal untuk semua i = 1, 2,…, n
3
•b0 dan b1 berdistribusi normal15
I
NFERENSI UNTUKP
ARAMETER
0berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk 0 :
t/2;n-2 adalah nilai distribusi t dengan derajat kebebasan n-2
0 0
0
2 1
n i XXi
T b
s x nJK
2 2
0 0 0
, 2 , 2
1 1
2 2
n
n i XX
n
n i XXi i
b t s x nJK b t s x nJK
16
I
NFERENSI UNTUKP
ARAMETER
1berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk 1 :
t/2 ; n-2 adalah nilai distribusi t dengan derajat kebebasan n-2
1 1
1
XX
T b
s JK
2; 2 2; 2
1 1 1
n
nXX XX
t s t s
b b
JK JK
Tujuan : menentukan apakah parameter-parameter tersebut dapat diabaikan atau tidak.
17
P
ENGUJIANP
ARAMETERR
EGRESIRumusan Hipotesis
H0 : β0 = 0 H1 : β0 ≠ 0
H0 : β1 = 0
H1 : β1 ≠ 0 0
0 n
2 i i 1
XX
t b
x
ˆ nJK
1 1XX
t b
ˆ
JK
0 0 2
0 XX
ˆY -Y
T ˆ 1+(1/n)+[(x x) / JK ]
berdistribusi t dengan derajat kebebasan n-2.
Selang prediksi (1 – α) bagi y0 adalah
2 2
0 0
0 / 2 0 0 / 2
XX XX
(x x) (x x)
1 1
ˆ ˆ ˆ ˆ
y t 1+ + y y t 1+ +
n JK n JK
18
S
ELANGP
REDIKSIMisalkan nilai respons Y untuk X = X0 adalah Y0, dan misalkan adalah prediksi model regresi bagi Y0. Maka
19
C
ONTOH1
SELANG KEPERCAYAAN 1-b
1=1,8091 b
0=6,4136
0
25.85 25.85
6.4136 (2.26)(0.4) 6.4136 (2.26)(0.4)
(11)(1.1) (11)(1.1)
1
(2.26)(0.4) (2.26)(0.4)
1.8091 1.8091
1.1 1.1
β
β TINJAU CONTOH SEBELUMNYA
20
H0 : β0 = 0 H1 : β0 ≠ 0
H0 : β1 = 0 H1 : β1 ≠ 0
derajat kebebasan n – 2 = 9,
nilai kritis t0.025 = 2.26
t0 > t0.025 &
t1 > t0.025 maka masing- masing H0 ditolak
Kesimpulan β0 dan β1 tidak dapat diabaikan
C
ONTOH2
UJI HIPOTESIS21
*
Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah
koefisien determinasi yaitu
Besaran R2 menunjukkan proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh
2
2 1 2
2
1
ˆ
, dengan 0 1
n
i i
i R
n T
i i
i
y y
R JK R
JK y y
H0 : Model regresi yang diperoleh tidak memadai H1 : Model memadai
Statistik uji
Tolak H0 pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2) adalah nilai distribusi F dengan
derajat kebebasan 1 dan n – 2.
22
U
JIK
EBAIKANM
ODEL
21
ˆ
n i ii R
y y f JK
s s
Untuk contoh sebelumnya diperoleh R2 = 0,499.
Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang
diperoleh adalah 49.9%
Uji kebaikan model
Untuk α = 5%, titik kritis f0.05,(1,9) = 5,12 f > f0.05,(1,9), model memadai. 23
C
ONTOH3
11 2
1
ˆ
8,99
i i
i R
y y f JK
s s
24
*
* Mengukur hubungan linear dua peubah acak
* Misalkan X dan Y adalah dua peubah acak, maka korelasi antara X dan Y dinyatakan dengan
2 2
,
X Y
XY
X Y
X Y
E X Y Cov X Y
E X E Y
Jika nilai korelasi mendekati 1 maka
hubungan kedua peubah “sangat erat” dan searah sedangkan jika nilai korelasi
mendekati –1 maka hubungan kedua
peubah “sangat erat” dan berlawanan arah.
25
Jika nilai korelasi sama dengan nol berarti tidak terdapat hubungan linear antara
kedua peubah acak.
Gambar 1 Korelasi positif Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol Gambar 4 Korelasi nol
26
27
Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu
K ORELASI S AMPEL
1
2 2
1 1
XY
XX YY
n
i i
i
n n
i i
i i
r JK
JK JK
X X Y Y
X X Y Y
Data berikut menggambarkan kenaikan harga minyak dan nilai tukar mata uang di 12 negara terhadap US dollar pada suatu tahun.
Rata-rata kenaikan harga minyak = 60,42 ,
Rata-rata nilai tukar mata uang terhadap US dollar = 84,25 28
C
ONTOH4
Negara Kenaikan harga minyak (x)
Nilai tukar mata uang terhadap US dollar (y)
1 65 85
2 50 74
3 55 76
4 65 90
5 55 85
6 70 87
7 65 94
8 70 98
9 55 81
10 70 91
11 50 76
12 55 74
29 40
50 60 70 80 90 100 110
40 45 50 55 60 65 70 75
Nilai tukar mata uang (y)
Kenaikan harga minyak (x)
12
1
12 12
2 2
1 1
0,863
i i
XY i
XX YY
i i
i i
X X Y Y r JK
JK JK
X X Y Y
30
TUGAS B
Lanjutan Tugas A (Kelompok)
Terapkan minimal satu topik berikut, yang sudah dipelajari dalam
perkuliahan Statdas, ke dalam data kelompok Anda seperti pada Tugas A.
Topik Bahasan :
Uji Hipotesis
ANOVA
Regresi Linier dan Korelasi
Analisis Deret Waktu
Analisis Spasial (Geostatistik)
Tugas diketik rapi dan lengkap (data dan analisisnya) dalam bentuk laporan (style masing-masing) dalam format Mic. Word. Dengan
penamaan file :
“Tugas B - Statdas02 - II.2014 – Kelompok <nomor kelompok>”
Tugas dikumpulkan via email ke [email protected] paling lambat Senin, 5 Mei 2014.
31
Referensi
Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.
Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995.
Walpole, Ronald E., et.al, Statistic for Scientist and Engineering, 8th Ed., 2007.