• Tidak ada hasil yang ditemukan

STATISTIKA ANALISIS REGRESI DAN KORELASI LINIER SEDERHANA

N/A
N/A
Protected

Academic year: 2022

Membagikan "STATISTIKA ANALISIS REGRESI DAN KORELASI LINIER SEDERHANA"

Copied!
48
0
0

Teks penuh

(1)

ANALISIS REGRESI DAN

KORELASI LINIER SEDERHANA

(2)

Penentuan garis duga regresi dengan Metode OLS

konstanta a dan koefisien b

Analisis Varians

komposisi variasi sekitar garis

r dan r2

Standard error of estimate

Pendugaan Interval dan Pengujian

parameter (konstanta & koefisien) regresi

prediksi nilai conditional mean (E(Y/X))

& individu (Y)

(3)

REGRESI SEDERHANA  OLS

Tujuan

Mencari garis duga yang paling representatif mewakili pola data

Melihat hubungan antara 2 variabel

Garis duga yang terbaik adalah garis duga yang error = 0  meminimumkan SSE

Ordinary Least Square VS Maximum Likelihood

Min = min = min ei2 (Yi Yi)2

2

1

0 )

(Yi b b Xi

Minimisasi Error Maksimisasi Peluang

(4)

Nilai IPK dan Ujian Masuk 8 siswa

Siswa 1 2 3 4 5 6 7 8

Ujian masuk 74 69 85 63 82 60 79 91 IPK 2.6 2.2 3.4 2.3 3.1 2.1 3.2 2.8

0 1 2 3 4

50 55 60 65 70 75 80 85 90 95 100

Nilai Ujian Masuk

Nilai IPK

(5)

0 1 2 3 4

50 55 60 65 70 75 80 85 90 95 100

Nilai Ujian Masuk

NilaiIPK

?

(6)

Penentuan Garis Regresi

Variabel Dependen

Variabel independen Intercept

Slope garis

bX a

Y ˆ  

Arti dr paramaeter a dan b?

(7)

Linier VS Non Linier

Linier & Non Linier dlm Variabel (disebut juga fungsi)

Linier & Non Linier dlm Parameter

bX a

Y ˆ   Y ˆ  abX

2

bX a

Y ˆ   Y ˆ  ab

2

X

Yg kita pelajari adalah linier dalam variabel & parameternya

(8)

Statistik VS Fungsional/Deterministik

Dlm analisa regresi  hubungan scr statistik, bukan fungsional/deterministik

Hub. Statistik  variabel terikat bersifat random/stokastik (memiliki probabilitas)

Hub. Statistik ditandai dg error term (e) atau penulisan variabel terikat dg menggunakan tanda topi/cap/prime

(9)

Ordinary Least Square

X Y

E[Y]=0 + 1 X

Xi

} }

1= Slope

1

0= Intercept

Yi

{

Error: i

Regression Plot

X Y

E[Y]=0 + 1 X

Xi

} }

1= Slope

1

0= Intercept

Yi

{

Error: i

Regression Plot

(10)

Ordinary Least Square

X

Y

X

Y

X 0

0

0

0

0

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X 0

0

0

0

0

Y

0 0

0

0

0

Y

X

Y

X

Y

X

Y

X

Y

X

Y

X

Y

(11)

Estimasi yang BLUE

Hasil estimasi OLS sering disebut dengan istilah BLUE (Best Linier Unbiased Estimator):

– Best ~ Efisien, artinya hasil nilai estimasi memiliki varians error yang minimum dan tidak bias.

– Linier ~ Linier dalam parameter

– Unbiased ~ Tidak bias, artinya hasil nilai estimasi sesuai dengan nilai parameter.

– Konsisten, artinya jika ukuran sampel ditambah tanpa batas maka hasil nilai estimasi akan mendekati

parameter populasi yang sebenarnya.

(12)

Ordinary Least Square: Asumsi

Untuk dapat menghasilkan nilai parameter yang BLUE (Best Linear Unbiased Estimator) diperlukan asumsi:

– Model regresi adalah linier dalam parameter.

– Error term (e) memiliki distribusi normal.

– Varians error tetap/konstan (homoskedasticity)  menjamin efisien (kalau minimum) & tidak bias

– Tidak ada hubungan antara variabel bebas dan error term

– Tidak ada korelasi serial antara error (no- autocorrelation) (antar observasi)

(13)

Step 1 : Menentukan Variabel X dan Y

Variabel Y (Variabel Dependen)

variabel yang nilai penyelesaiannya dicari melalui model.

Nilai variabel yang ditanyakan soal

Variabel yang dipengaruhi oleh variabel lain.

(14)

Lanjutan

Variabel X (Variabel Independen)

variabel yang nilainya ditentukan oleh kekuatan dari luar model dan nilai-nilai variabel tersebut berasal dari data yang ada.

Variabel yang dianggap mempengaruhi variabel lain.

(15)

lanjutan

Contoh : C = a + bY.

C : konsumsi

Y : Pendapatan

Menurut Teori.

C : Variabel dependent

Y : Variabel independent (pngaruhnya (+))

(16)

lanjutan

Qd = a-bP

Qd : Quantity demand

P : harga

Menurut Teori

Qd : Variabel dependen

P : variabel independen (untuk brng normal, pengaruhnya (-))

(17)

Step 2 : Menghitung Slope dan Intercept

 

2

2

X n X

Y X n

b XY aYb X

(18)

Data Pengeluaran dan Profit (juta $)

Year Expenditure Annual Profit

(X) (Y)

1990 2 20 40 4

1991 3 25 75 9

1992 5 34 170 25

1993 4 30 120 16

1994 11 40 440 121

1995 5 31 155 25

sum 30 180 1000 200

XY X22

(19)

6 30 180 6 5 30

n Y Y

n X X

20

(2)(5) -

30

Y b X a

2

(5) (6)

- 200

(30) (5)

(6) -

1000

2

2 2

 

 

X n X

Y

X

n

b XY

(20)

Lanjutan

X Y   20  2

Persamaan Garis Duga = Persamaan regresi

(21)

16 18 20 22 24 26 28 30 32 34 36 38 40 42

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

X

Y

Y   20  2 X

(22)

Apakah meminimumkan error ?

Year Annual Profit Individual

(Y) 20+2X error

1990 20 24 -4

1991 25 26 -1

1992 34 30 4

1993 30 28 2

1994 40 42 -2

1995 31 30 1

Total Error 0 Y

Y

Minimum error

(23)

ANALISIS VARIANS

Y

X Deviasi yang dapat dijelaskan

Deviasi yang tidak dapat dijelaskan

Nilai Y yang diobservasi

ˆ) (YY

) (YY

Garis regresi

Y

ˆ )

(YY

(24)

Koefisien Determinasi

 

 

 

 

2

2

2

ˆ

1

Y Y

Y r Y

Koefisien determinasi

Variasi Y sekitar

Y

Variasi Y sekitar garis regresi

r

2 2

_ 2

_

) (

) (

)

( Y

i

Y

i

Y

i

Y

i

Y

i

Y

i

TSS = RSS + ESS

1 = RSS/TSS + ESS/TSS

RSS/TSS =

(25)

Koefisien Determinasi

bX a

Y ˆ  

      

 

] ) (

][

) (

[

)]

)(

( [

2 2

2 2

2 2

Y Y

n X

X n

Y X

XY r n

 

 

 

 

2

2

2

ˆ

1

Y Y

Y r Y

r

 

2

2

X n X

Y X n

b XY aYb X

(26)

Koefisien Determinasi

Penambahan variabel bebas, tdk menurunkan koefisien determinasi, tetapi meningkat makin mendekati 1

Kelemahan: koef. Determinasi menyinggung variasi regresi & residual, tetapi tidak memperhitungkan

derajat bebasnya  penafsiran koef. determinasi sulit jika intersept-nya = 0  koef determinasi tidak harus di antara 0 & 1

      

 

] ) (

][

) (

[

)]

)(

( [

2 2

2 2

2 2

Y Y

n X

X n

Y X

XY r n

r

(27)

Koefisien Korelasi (r)

1 ) (

1 ) (

__ 2 __ 2

n

X X

n

Y Y

s r r s b

x y

r 2

r

(28)

STANDARD ERROR OF ESTIMATE

Mengukur variasi titik-titik di sekitar garis regresi

Jika Se = 0:  titik-titik tepat di garis regresi

artinya garis regresi adalah estimator yang sempurna untuk variabel dependen.

Derajat bebasnya n-2 krn ada 2 prmtr yg akan diduga

2

2

n Se e

(29)

Lanjutan

2

2

n Se e

 

2

ˆ 2

n

Y Se Y

2

2

    

n

XY b

Y a

S

e

Y

(30)

Menghitung Standar Error

  

Y Yˆ 2

  Y ˆY

2

Year Annual Profit Individual

(Y) 20+2X error

1990 20 24 -4 16

1991 25 26 -1 1

1992 34 30 4 16

1993 30 28 2 4

1994 40 42 -2 4

1995 31 30 1 1

42

(31)

lanjutan

 

24 . 3

2 6

42

2 ˆ 2

 

n

Y Se Y

(32)

SEE  jika terdistribusi normal

2 2

X n X

S

b

S

e

n X X

S

b

S

e

)

(

2

2

__ 2 2 2

) (

. X X

n

Se Sa X

 

__ 2 2 2

) (

.

X X

n

Se

S

a

X

(33)

Manfaat Standar error

Jika observasi terdistribusi normal disekitar garis regresi maka:

68% obs berada

95.5 % obs berada

99.7 % obs berada

s

e

 2

s

e

 3 s

e

 1

s

e

bX a

Y ˆ    1

se

bX a

Yˆ    2

s

e

bX a

Y ˆ    3

(34)

PENDUGAAN INTERVAL PARAMETER

    

) 1

( b t

(n 2, /2)

s

b

B b t

(n 2, /2)

s

b

P

2 2

X n X

S

b

S

e

Parameter B

(35)

PENDUGAAN INTERVAL PARAMETER

__ 2 2 2

) (

. X X

n

Se Sa X

    

) 1

( a t

(n 2, /2)

s

a

A a t

(n 2, /2)

s

a

P

Parameter A

(36)

n waktu keseluruha

dari 90%

sebanyak diatas

interval dalam

masuk akan

B panjang jangka

dalam maka

berulang dilakukan

persobaan Jika

90%

2.981) 019

. 1 (

019 .

1

) 46 . 0 )(

132 .

2 ( 2

s t b

2.981

) 46 . 0 )(

132 .

2 ( 2

s t b

46 . 0 s

2 b

1 Kasus

b b b

B P

(37)

PENGUJIAN PARAMETER

Dasar: apakah yg diperoleh dr pengamatan, cocok dg yg dihipotesakan?

Asumsi normalitas, maka pengujian menggunakan distribusi t

Dapat dilakukan, untuk parameter a & b

Sb B t b

Sa

A t a

(38)

Pengujian Parameter B (1)

1 . 2

diketahui lalu

masa data

dari Misalkan

1 . 2 :

1 . 2 :

. 1

1

B B

H

B H

o

132 .

2 t

2 - n df

t - atau t

t t

jika Ho

Tolak

Penolakan Daerah

2.

4) (0.1/2,

4) (0.1/2, stat

4) (0.1/2, stat

(39)

lanjutan

lalu.

masa nilai

dengan sama

masih b

Nilai

2.1 yaitu

sama B

dan b

nilai Ho.

Terima

Kesimpulan .

4

217 .

0.46 0 2.1 -

t 2

S B - t b

statistik -

t Menghitung 3.

b

(40)

Pengujian Parameter B (2)

0 :

0 :

. 1

1

B H

B Ho

132 .

2 t

2 - n df

t - atau t

t t

jika Ho

Tolak

Penolakan Daerah

2.

4) (0.1/2,

4) (0.1/2, stat

4) (0.1/2, stat

(41)

lanjutan

Y dan X

antara korelasi

ada

nol dengan

berbeda signifikan

b

Ho.

Tolak

Kesimpulan .

4

35 . 0.46 4

0 - t 2

S B - t b

statistik -

t Menghitung 3.

b

(42)

PREDIKSI

Salah satu manfaat dr regresi masa lalu adalah untuk peramalan/prediksi

Ada 2 prediksi:

1) prediksi nilai conditional mean E(Y/X) (rata-rata Y pada nilai X tertentu) titik pd regresi populasi

=> prediksi rata-rata (variasi relatif kecil)  Confidence Interval

2) Prediksi nilai individu Y pd nilai X tertentu =>

prediksi individu (variasi relatif besar) 

Prediction Interval

(43)

Interval Prediksi Rata-rata Y

1 1

1

1

)

( y

n

X

n

b

o

b X

n

E

 

n e

i

i n n

n

s

X x

X x

t n y

 

 

 

 

 

 

1

2 2 1

, 2 1

) (

 1

(44)

Interval Prediksi Individu Y

e X

b b

y

n1

o

1 n1

 

n e

i

i n n

n

s

X x

X x

t n y

 

 

 

 

 

 

1

2 2 1

, 2 1

) (

1 1

(45)

Kasus 2

X

Y   1 . 923  0 . 3815

Diambil dari 1980-2002 Y : Konsumsi

X : Pendapatan

6501

0) 0.3815(120 1.923

Y maka 12000

X

JIka

2003 2003

 

(46)

Lanjutan  Individu

x

34110178 S 21789.95

10799 X

22

e 2

i

X

n

 

 

153.954

95 . 21789 )

34110178 (

10799 12000

22 1 1

) (

1 1

1

2 2

1

2 2 1

 

n

i n e

i

i

n s

X x

X x

n

086 .

2 2

/ ,

2

tn

- 1 (153.954)) )

086 . 2 ( 501 . 6 ( Y

(153.954)) )

086 . 2 ( 501 . 6

( n1

P

% 95 )

6822 Y

6180

( n1 P

(47)

Lanjutan  Rata-rata

x

34110178 S 21789.95

10799 X

22

e 2

i

X

n

 

 

43.727

95 . 21789 )

34110178 (

10799 12000

22 1 )

( 1

1

2 2

1

2 2 1

n

i n e

i

i

n s

X x

X x

n

086 .

2 2

/ ,

2

tn

- 1 (43.727)) )

086 . 2 ( 501 . 6 ( Y

(43.727)) )

086 . 2 ( 501 . 6

( n1

P

% 95 )

6592 Y

6410

( n1 P

(48)

Terima Kasih

Referensi

Dokumen terkait

Dengan demikian maka penjualan susu ditentukan oleh besarnya permintaan biskuit susu sebesar 96 %, selebihnya 4% ditentukan

Regresi dan korelasi digunakan untuk mempelajari pola dan mengukur hubungan statistik antara dua atau lebih variabel.. Jika digunakan hanya dua variabel disebut regresi dan

 Menggunakan ukuran-ukuran yang diperoleh dari analisis regresi dan korelasi untuk membuat dugaan-dugaan interval dari variabel-variabel terikat bagi keperluan

Pengujian asumsi linieritas menghasilkan nilai signifikansi 0, 213 lebih besar dari 0,1, maka disimpulkan bahwa antara variabel bebas (X ) dan variabel tak bebas (Y ) tidak

Persamaan regresi adalah suatu persamaan matematika yang mendefinisikan hubungan antara dua variabel yaitu hubungan keterkaitan antara satu atau beberapa variabel yang

Secara sederhana adalah bahwa analisis regresi adalah untuk melihat pengaruh antara variabel bebas terhadap variabel terikat, jadi tidak boleh ada korelasi

 Persamaan regresi adalah persamaan matematika yang memungkinkan kita meramalkan nilai-nilai variabel terikat (Y) dari nilai-nilai satu atau lebih variabel

Untuk statistik lima serangkai dari sisaan untuk masing-masing model yang terdiri dari nilai minimum, quartil 1, median, quartil 3 dan nilai maksimum (Lampiran 1), karena