Analisis Korelasi
dan Regresi
LOGO
dan Regresi
Hazmira Yozza – Izzati Rahmi HG Jurusan Matematika FMIPA Unand
LOGO
Data bivariat
Data bivariat
Data dengan dua variabel
Terhadap satu pengamatan dilakukan
pengukuran/pengamatan terhadap 2 variabel
Sering ditemui
Sering ditemui
Contoh
: Dilakukan pencatatan nilai UN Mtk dan
IPK Smt 1 terhadap mahasiswa Matematika
Analisis yang biasa dilakukan : analisis regresi,
analisis korelasi, diagram pencar
LOGO
1
AN. KORELASI
digunakan untuk mengetahui2
DIAGRAM PENCAR
adalah salah satu teknik penyajian3
AN. REGRESI
digunakan untuk menemukan pola mengetahui derajat hubungan antara dua variabel teknik penyajian grafis data bivariate. menemukan pola hubungan antara dua variabelKompetensi
Kompetensi
menjelaskan pengertian data bivariate, variabel bebas dan variabel terikat
1
menghitung koefisien korelasi linier antara dua variabel dan menginterpretasikan nilai koefisien korelasi linier tersebut
2
menginterpretasikan nilai koefisien korelasi linier tersebut2
3
menggambarkan diagram pencar antara dua variabel danmenginterpretasikan diagram yang terbentuk
menemukan bentuk hubungan antara dua var dengan menggunakan an.regresi serta menginterpretasikan model
4
Kompetensi
Kompetensi
menghitung nilai koef. determinasi dari suatu model regresi dan menginterpretasikan nilai koef. tersebut
5
6
7
menguji hipotesis mengenai parameter populasimembentuk selang kepercayaan bagi penduga parameter regresi dan menginterpretasikan selang yang terbentuk
suatu karakteristik sistem yang nilainya selalu berubah.
VAR. TAK BEBAS
VARIABEL
VAR BEBAS VAR. TAK BEBAS
(RESPONS)
VAR BEBAS (VAR. PENJELAS)
Variabel yang nilai-nya tergantung dari nilai peubah lain
Variabel yang nilai-nya tidak tergantung nilai variabel lain
NILAI UN Matematika Lama belajar
suatu karakteristik sistem yang nilainya selalu berubah.
VAR. TAK BEBAS
VARIABEL
VAR BEBAS VAR. TAK BEBAS
(RESPONS)
VAR BEBAS (VAR.PENJELAS)
Variabel yang nilai-nya tergantung dari nilai peubah lain dalam satu sistem
Variabel yang nilai-nya tidak tergantung nilai variabel lain
dalam satu sistem)
Penjualan es krim Suhu
Analisis Data Bivariat
Analisis Data Bivariat
1. Diagram pencar
•Menggambarkan
hubungan antara variabel
bebas dengan variabel
tak bebas
•Variabel bebas pada
•Variabel bebas pada
sumbu horizontal dan
peubah tak bebas pada
sumbu vertikal
•Dari diagram, dapat
diperkirakan bentuk
hubungan antara kedua
variabel (linier, kuadratik,
dlsb)
2. Koefisien Korelasi
2. Koefisien Korelasi
Suatu ukuran yang mengukur derajat hubungan
linier
antara dua buah peubah
(
)(
)
−
=
−
−
=
∑
∑
∑
∑
= = = =n
y
x
y
x
y
y
x
x
r
n i i n i i n i i i n i i i 1 1 1 1(
)
(
)
−
−
=
−
−
=
∑
∑
∑
∑
∑
∑
= = = = = = = = = =n
y
y
n
x
x
y
y
x
x
r
n i i n i i n i i n i i i i i n i i n i i i xy 2 1 1 2 2 1 1 2 1 1 1 1 2 1 2 1 x y Keterangan :rxy = koefisien korelasi peubah x dan y
xi = nilai x ke-i yi = nilai y ke-i
= nilai rata-rata variabel x = nilai rata-rata variabel y n = banyak pasangan data
Contoh : Data
Contoh : Data
x
40
50
60
70
80
90
40
60
80
50
y
65
475 272 335 490 415
72
265 492 180
Tentukan nilai koefisien korelasinya
620; 3061; 41200; 1178257; 209810 ; 0.776101
Catatan :
Catatan :
-1 ≤ rxy ≤ 1
* Tanda (+ atau -) menunjukkan arah hubungan kedua variabel
rxy < 0 → semakin tinggi nilai x kecendrungan nilai y semakin
rendah.
rxy > 0 → semakin tinggi nilai x kecendrungan nilai y semakin
tinggi. tinggi.
* Besarnya nilai rxy menunjukkan derajat keeratan hubungan
kedua variabel.
Semakin erat hubungan kedua variabel → rxy mendekati -1
atau 1.
Semakin tidak erat hubungan kedua variabel → rxy akan
mendekati 0
INGAT : dalam konteks koefisien korelasi, tidak dikenal istilah var. bebas atau tak bebas. Jadi tidak ada hubungan sebab akibat antar variabel
3. Analisis Regresi Linier Sederhana
3. Analisis Regresi Linier Sederhana
Suatu teknik analisis statistika yang digunakan untuk
memodelkan hubungan antara variabel-variabel dalam
suatu sistem, khususnya 1 var tak bebas dg beberapa var
bebas
AN.REGRESI
AN.REGRESI NON
LINIER : bila pola
hubungan tidak linier AN.REG.LINIER
SEDERHANA :
hubungan 1 var bebas & 1 var tak bebas
AN.REG.LINIER BERGANDA :
hubungan 1 var
bebas dg beberapa var tak bebas
AN.REG.LINIER : bila pola hubungan linier
Garis Regresi
Model / Persamaan Regr Y = β0 + β1 X
ε
β
β
+
+
=
x
y
0 1POPULASI
CONTOH
e
x
b
b
e
x
y
+
+
=
+
+
=
1 0 1 0ˆ
ˆ
β
β
CONTOH
Model Regresi Linier Sederhana
Model Regresi Linier Sederhana
ε
β
β
+
+
=
x
1
Pertanyaan : Garis regresi mana yang paling mewakili
23
Pertanyaan : Garis regresi mana yang paling mewakili
tebaran titik tersebut
Square Method)
Square Method)
Digunakan untuk menduga persamaan regresi linier sederhana
(menduga nilai β0 dan β1)
Dengan meminimumkan JKS, diperoleh model dugaan : Dengan :
i
i
b
b
x
y
ˆ
=
0
+
1
n n n n
−
∑
∑
∑
∑
JKx
JK
x
x
y
y
x
x
n
x
x
n
y
x
y
x
b
n xy i i n i i i n i i n i i n i i n i i n i i i=
−
−
−
=
−
−
=
∑
∑
∑
∑
∑
∑
∑
= = = = = = = 1 2 1 2 1 1 2 1 1 1 1)
(
)
)(
(
/
/
x
b
y
b
0=
−
1No y x No y x 1 10.98 35.3 14 9.57 39.1 2 11.13 29.7 15 10.94 46.8 3 12.51 30.8 16 9.58 46.5 4 8.40 58.8 17 10.09 59.3 5 9.27 61.4 18 8.11 70.0
D
5 9.27 61.4 18 8.11 70.0 6 8.73 71.3 19 6.83 70.0 7 6.36 74.4 20 8.88 74.5 8 8.50 76.7 21 7.68 72.1 9 7.82 70.7 22 8.47 58.1 10 9.14 57.5 23 8.86 44.6 11 8.24 46.4 24 10.36 33.4 12 12.19 28.9 25 11.08 28.6 13 11.88 28.1A
T
A
60
.
235
=
∑
= 25 1 i iy
∑
254320
.
11821
=
+
+
+
(
11
.
13
)(
29
.
7
)
...
(
11
.
08
)(
28
.
6
)
)
3
.
35
)(
98
.
10
(
=
∑
= 25 1 i i iy
x
=
+
+
+
11
.
13
...
11
.
08
98
.
10
=
∑
= 25 1 i ix
60
.
52
25
/
1315
=
=
x
=
+
+
+
2 2 229
.
7
...
28
.
6
3
.
35
=
∑
= 25 1 2 i iy
1315
=
∑
= 25 1 2 i ix
=
+
+
+
2 2 211
.
13
...
11
.
08
98
.
10
424
.
9
25
/
60
.
235
=
=
y
=
+
+
+
29
.
7
...
28
.
6
3
.
35
42
.
76323
11
.
2284
(
)
25 / ) 60 . 235 )( 1315 ( 4320 . 11821 − =60
.
235
=
∑
= 25 1 i iy
=
∑
25 ix
1315
4320
.
11821
=
∑
= 25 1 i i iy
x
n x x n y x y x b n i i n i i n i i n i i n i i i / / 2 1 1 2 1 1 1 1 − − =∑
∑
∑
∑
∑
= = = = =(
1315)
/ 25 42 . 76323 − 2 =60
.
52
25
/
1315
=
=
x
=
∑
=1 i ix
1315
424
.
9
25
/
60
.
235
=
=
y
=
∑
= 25 1 2 i ix
76323
.
42
=
−
0
.
079829
x
b
y
b
0=
−
1)
60
.
52
)(
079829
.
0
(
424
.
9
−
−
=
Ketepatan
Model Regresi
Ketepatan
Model Regresi
%
100
/
%
100
1 2 1 2 2 1 2
−
=
=
∑
∑
= = n i n i i ix
n
x
b
JKR
R
KOEFISIEN DETERMINASI
%
100
/
%
100
1 2 1 2 1 1 2
−
=
=
∑
∑
= = = = n i n i i i i in
y
y
JKT
JKR
R
CATATAN : • 0% ≤ R2 ≤ 100% • Semakin tinggi R2, semakin baik model regresi • R2
Contoh :
Contoh :
∑
25=
∑
= 25 1 2 i ix
76323
.
42
=
∑
= 25 1 2 i iy
2284
.
11
%
100
/
2 1 2 1 2 2 1 2
−
=
∑
∑
∑
∑
= =x
n n n i n i i ix
n
x
b
R
60
.
235
=
∑
= 25 1 i iy
=
∑
= 25 1 i ix
1315
079829 . 0 1 = − b(
)
(
)
%
44
.
71
%
100
25
/
)
60
.
235
(
11
.
2284
25
/
)
1315
(
42
.
76323
)
079829
.
0
(
/
2 2 2 1 2 1 2=
−
−
−
=
−
∑
∑
= =x
n i n i i iy
n
y
Sebaran Penarikan Sampel bagi Parameter Populasi Sebaran Penarikan Sampel bagi Parameter Populasi
bo & b1 : bo & b1 : penduga bagi penduga bagi β β0 dan 0 dan ββ11 bo & b1 : didapat bo & b1 : didapat dari dt sampel dari dt sampel sampel berbeda sampel berbeda bo & b1 bo & b1 juga berbeda
juga berbeda b0 & b1 b0 & b1 Peubah acak Peubah acak
b0 & b1
b0 & b1
punya sebaran
punya sebaran
Asumsi dalam Analisis Regresi Linier
Asumsi dalam Analisis Regresi Linier
Asumsi dalam Analisis Regresi Linier
Asumsi dalam Analisis Regresi Linier
• merupakan peubah acak
• Nilai tengah adalah 0; dituliskan E( ) = 0
• Ragam konstan yang nilainya tidak diketahui ; dituliskan Var( )=σ2.
i ε i ε i ε ε ε
Sebaran Penarikan Sampel bagi Parameter Populasi Sebaran Penarikan Sampel bagi Parameter Populasi
Model Y =
Model Y = β
β0 +
0 + β
β1X +
1X + ε
ε
Model Y =
Model Y = β
β0 +
0 + β
β1X +
1X + ε
ε
• Ragam konstan yang nilainya tidak diketahui ; dituliskan Var( )=σ2.
• menyebar menurut sebaran normal
• Galat pengamatan-pengamatan yang berbeda saling bebas. Akibatnya
Keempat asumsi tersebut dapat diringkas : ~ N(0, σ2 ) untuk I = 1,2,-,n
(bsi = bebas stokastik identik)
• X bukanlah peubah acak, sehingga tidak memiliki sebaran
i ε εi i ε 0 ) , ( i j = Cov ε ε bsi i ε
Sebaran Penarikan Sampel bagi Parameter Populasi Sebaran Penarikan Sampel bagi Parameter Populasi
−
∑
∑
= = n i n i i ix
n
x
N
B
1 2 1 2 2 1 1/
,
~
β
σ
− = B1 β Asumsi
i=1
i=1
) 1 , 0 ( ~ / 1 1 2 1 2 1 N n x x B Z n i n i i i∑
∑
= = − − = σ β 2 2 − = n JKS s e∑
∑
= = − − = n i n i i i e x x n s B T 1 2 1 2 1 / 1 β Tidak diket, hrs diduga2
~
t
n
−
T
) 1 , 0 ( ~ 1 0 2 2 0 N X n B Z n n + − = σ β 2 2 − = n JKS s e
Asumsi Tidak diket, hrs diduga
+ X n N B 2 2 2 0 0 1 , ~ β σ / 1 2 1 2 n x x n n i n i i i
∑
∑
= = − −∑
∑
= = n i n i i i x n x n N B 1 2 1 2 0 0 / , ~ 2 1 2 1 2 2 0 ~ / 1 0 − = =∑
∑
− + − = n n i n i i i e t n x x X n s B Z βSelang Kepercayaan bagi Parameter Regresi
Selang Kepercayaan bagi Parameter Regresi
∑
∑
∑
∑
= = − = = −
−
+
+
<
<
−
+
−
n i n i i i e n n i n i i i e nn
x
x
x
n
s
t
b
n
x
x
x
n
s
t
b
1 2 1 2 2 2 , 2 / 0 0 1 2 1 2 2 2 , 2 / 0/
1
/
1
α αβ
SELANG KEPERCAYAAN (1SELANG KEPERCAYAAN (1--) 100% BAGI ) 100% BAGI ββ00
= = =
=
i
i
i 1 i 1 1 1∑
∑
∑
∑
= = − = = − − + < < − − n i n i i i e n n i n i i i e n n x x s t b n x x s t b 1 2 1 2 2 , 2 / 1 1 1 2 1 2 2 , 2 / 1 / / α α β SELANG KEPERCAYAAN (1SELANG KEPERCAYAAN (1--) 100% BAGI ) 100% BAGI ββ11
Uji Hipotesis mengenai β1
Uji Hipotesis mengenai β1
Hipotesis :
Ho : (Yang paling umum Ho : ) H1 : Statistik uji : 0 . 1 1 = β β 0 . 1 1 ≠ β β b b − β − β 0 1 = β Wilayah kritis : Kesimpulan :
Bila > maka tolak H0 :
Bila ≤ maka tidak tolak H0 :
x b hit JK s b s b t 1 1.0 1 1.0 1 β β − = − = 2 , 2 / n−
t
α hitt
hitt
2 , 2 / n−t
α 2 , 2 / n−t
α 0 . 1 1 = β β 0 . 1 1 = β βUji Hipotesis mengenai β
0Uji Hipotesis mengenai β
0Hipotesis : Ho : H1 : Statistik uji : 0 . 0 0 = β β 0 . 0 0 = β β Wilayah kritis : Kesimpulan :
Bila > maka tolak H0 :
Bila ≤ maka tidak tolak H0
:
0 . 0 0 = β β 2 , 2 / n−