• Tidak ada hasil yang ditemukan

 Linear regression model, including

N/A
N/A
Protected

Academic year: 2023

Membagikan " Linear regression model, including"

Copied!
32
0
0

Teks penuh

(1)

Regression

• Regression analysis, in general sense, means the estimation or prediction of the unknown value of one variable from the known value of the other variable.

• If two variables are significantly correlated, and if there is some theoretical basis for doing so, it is possible to predict values of one variable from the other. This observation leads to a very

important concept known as ‘Regression Analysis’.

• It is specially used in business and economics to study the relationship between two or more

variables that are related causally and for the estimation of demand and supply graphs, cost functions, production and consumption functions and so on.

(2)

 Thus, the general purpose of multiple regression is to learn more about the relationship between several independent or predictor variables and a dependent or output variable.

 Suppose that the Yield in a chemical process depends on Temperature and the Catalyst

concentration, a multiple regression that describe this relationship is,

Y = b0+b1*X1+b2*X2+ € → (a) Where Y = Yield.

X1 = Temp:, X2 = Catalyst cont:.

This is multiple linear regression model with 2 regressors.

 The term linear is used because equation (a) is a linear function of the unknown parameters bi’s.

(3)

Regression Models.

 Depending on nature of relationship regression models are two types.

 Linear regression model, including

a. Simple-linear regression (one indep:

var.)

b. Multiple-linear regression.

 Non-Linear regression model, including

a. Polynomial regression.

b. Exponential regression ,etc.

(4)

Types of multiple regression

• There are three types of multiple regression, each of which is designed to answer a different question:

– Standard multiple regression is used to evaluate the relationships between a set of independent variables and a dependent variable.

– Hierarchical, or sequential, regression is used to examine the relationships between a set of

independent variables and a dependent variable, after controlling for the effects of some other

independent variables on the dependent variable.

– Stepwise, or statistical, regression is used to

identify the subset of independent variables that has the strongest relationship to a dependent variable.

(5)

MODEL

REGRESSI LINIER BERGANDA

Model yg memperlihatkan hubungan antara satu variable terikat (dependent variable) dgn beberapa variabel bebas (independent variables).

Y

i

= 

0

+ 

1

X

1i

+ 

2

X

2i

+ … + 

k

X

ki

+ 

i

dimana: i = 1, 2, 3, …. N (banyaknya pengamatan)

0, 1, 2, …, k adalah parameter yang nilainya diduga melalui model:

Y

i

= b

0

+ b

1

X

1i

+ b

2

X

2i

+ … + b

k

X

ki

(6)

 

0

dan 

1

: parameter dari fungsi yg nilainya akan diestimasi.

 Bersifat stochastik  untuk setiap nilai X terdapat suatu distribusi probabilitas seluruh nilai Y atau Nilai Y tidak dapat diprediksi secara pasti karena ada

faktor stochastik 

i

yang memberikan sifat acak pada Y.

 Adanaya variabel 

i

disababkan karena:

 Ketidak-lengkapan teori

 Perilaku manusia yang bersifat random  Ketidak-sempurnaan spesifikasi model  Kesalahan dalam agregasi

 Kesalahan dalam pengukuran

(7)

Koefisien Regresi Partial (Partial Coefficient of Regression)

Sampel :

Y

i

= b

1

+ b

2

X

2i

+ b

3

X

3i

+ … + b

k

X

ki

Y

i

= b

1.23

+ b

12.3

X

2i

+ b

13.2

X

3i

+ … + b

k

X

ki

b

1.23

= intercept, titik potong antara garis regresi dengan sumbu tegak Y

Nilai perkiraan rata-rata Y kalau X2 = X3 = 0

b

12.3

= Besarnya pengaruh X

2

terhadap Y kalau

X

2

tetap

(8)

Y

i

= b

1.234

+ b

12.34

X

2i

+ b

13.24

X

3i

+ b

14.23

X

4

Misalnya:

Y

i

= Trending Topik

X

2

= Folower influencer X

3

= Kecepatan viral

X

4

=

Y

i

= Prestasi Belajar X

2

= Motivasi

X

3

= Ekonomi

X

4

= Lama Belajar

(9)

.

. . . . . .

.

Ÿi = b0 + b1 Xi

Yi

Ÿi

i

X Y

Y

i

= 

0

+ 

1

X

i

+ 

i

Variation in Y

Systematic Variation

Random Variation

0

X

1

X

2

X

3

E(Y

i

) = 

0

+ 

1

X

i

X Y

Y

i

= 

0

+ 

1

X

i

+ 

i

Nilai rata2 Y

i

:

E(Y

i

) = 

0

+ 

1

X

i

I

= Y

i

- E(Y

i

)

(10)

Asumsi-asumsi

Model Regresi Linier Berganda

 Nilai rata-rata disturbance term adalah nol, E(i) = 0.

Tidak tdpt serial korelasi (otokorelasi) antar i Cov(i,j) = 0 untuk i  j.

 Sifat homoskedastisitas:

Var(i) = 2 sama utk setiap i  Kesalahan Pengganggu Mempunyai Varian Sama

 Covariance antara i dan setiap var bebas adalah nol.

Cov(i,Xi) = 0

 Tidak tdpt multikollinieritas antar variebel bebas.

 Model dispesifikasi dengan baik

(Agar hasil estimasi dapat diinterpretasikan dengan baik - BLUE)

(11)

Interpretasi Persamaan Regresi Berganda

Y

i

= b

1.23

+ b

12.3

X

2i

+ b

13.2

X

3i

+

E (Y

i

/X

2

,X

3

) = b

1.23

+ b

12.3

X

2i

+ b

13.2

X

3i

b

13.2

mengukur besarnya perubahan Y kalau X

3

Berubah sebesar satu satuan, dimana X2 konstan

Yi ei

ui

0 Xi X

Y Y X

^

^

^

X )

Y (

E

SRF

PRF

^

Yi

(12)

Estimasi Koefisien Regresi Parsial Metode Ordinary Least Squares (OLS)

Prinsip: Meminimumkan nilai error – mencari jumlah penyimpangan kuadrat (

i2

) terkecil.

i

= Y

i

- 

0

- 

1

X

i

i2

= (Y

i

- 

0

- 

1

X

i

)

2



i2

=  (Y

i

- 

0

- 

1

X

i

)

2



i2

minimum jika:



i2

/

0

= 0  2 (Y

i

- 

0

- 

1

X

i

) = 0



i2

/

1

= 0  2  X

i

(Y

i

- 

0

- 

1

X

i

) = 0

(13)

Sederhanakan, maka didapat:

 (Xi – X) (Yi – Y) b1 =

 (Xi – X)2 b0 = Y - b1X

dimana

b0 dan b1 nilai penduga untuk 0 dan 1.

X dan Y adlh nilai rata2 pengamatan X dan Y

(14)

ESTIMASI MODEL

REGRESSI LINIER BERGANDA

Model: Y

i

= 

0

+ 

1

X

1i

+ 

2

X

2i

+ 

i

(y

i

x

1i

) (x

22i

) – (y

i

x

2i

) (x

1i

x

2i

) b

1

=

(x

21i

) (x

22i

) – (x

1i

x

2i

)

2

(y

i

x

2i

) (x

21i

) – (y

i

x

1i

) (x

1i

x

2i

) b

2

=

(x

21i

) (x

22i

) – (x

1i

x

2i

)

2

b

0

, b

1

dan b

2

nilai penduga untuk 

0

, 

1

dan 

2

. Model penduga: Ŷ

i

= b

0

+ b

1

X

1i

+ b

2

X

2i

b

0

= Y

i

– b

1

X

1i

– b

2

X

2i

(15)

Standard error of the estimates

Var(2) = 2 /  Xi2

2  Se(2) = Var(2) = =

 Xi2  Xi2

 Xi2

Var(1) = 2

n  xi2

 Xi2

Se(1) = Var(1) = 2

n  xi2  i2

2 =  i2 =  yi2 – 22  xi2 n – 2

 (xi yi)2 =  yi2

 xi2

(16)

ESTIMASI MODEL

REGRESSI LINIER BERGANDA

1 X21 x22i – X22 x21i – 2 X1 X2 x1i x2i

var(b0)= + 2 n (x21i ) (x22i ) – (x1i x2i)2

x

21i

var(b

1

)=

(x

21i

)(x

22i

) – (x

1i

x

2i

)

2

x

21i

var(b

1

)=

(x

21i

)(x

22i

) – (x

1i

x

2i

)

2

2

2

se(b

i

) = var(b

i

) Utk i = 0, 1, 2.



i2

2

=

n – 3



i2

=  y

2i

– b

1

 y

i

x

1i

– b

2

 y

i

x

2i

(17)

Koefisien Determinasi

TSS

RSS

ESS TSS = RSS + ESS

ESS RSS 1 = +

TSS TSS

 (Ŷi - Y)2  i2 = +

 (Yi - Y)2  (Yi - Y)2

ESS  (Ŷ

i

- Y)

2

r

2

= =

TSS  (Y

i

- Y)

2

atau

ESS

 i2

= 1

= 1

TSS  (Y

i

- Y)

2

X Y

Y

1 + 2 Xi

Atau:

 xi2 r2 = 22

 yi2  (xi yi)2 =

 xi2  yi2

(18)

Koefisien Korelasi

(19)
(20)

A NUMERICAL EXAMPLE

(21)
(22)
(23)

ILLUSTRATIVE EXAMPLES

(24)
(25)
(26)
(27)
(28)

Dalam konsep dasarnya pengujian statistik SECARA PARSIAL mendasarkan pada hipotesis :

Uji Konstanta Intersep H0 : ß0 = 0

H1 : ß0 ≠ 0

Uji Koeff. Xi H0 : ßi = 0 H1 : ßi ≠ 0

REGRESI LINEAR BERGANDA

Y = ß0 + ß1 X + ß2 X + …. + ßn Xn

(29)

Tujuan

untuk mengetahui pengaruh (kontribusi) proses/ mekanisme yang disusun dalam praktikum terhadap pencapaian nilai ujian akhir praktikum, yaitu melalui

penilaian atas latihan di kelas dan penilaian atas laporan praktikum.

Dengan demikian dapat dibuat spesifikasi modelnya sebagai berikut :

Y = ß0 + ß1X1 + ß2X2 --- (model 1) Dimana :

Y : Nilai ujian akhir X1 : Nilai pretest X2 : Nilai Laporan

Contoh :

(30)

Dari hasil di atas selanjutnya dapat disusun persamaan berikut :

N_Akhir = -25.450 + 0.542 Latihan + 0.771 Laporan R2 = 0.702 SE (9.351) (0.089) (0.132)

T-Hit. 2.722 6.067 5.828 F-hit = 73,02

Df = 62

Interpretasi Hasil :

Pengujian statistik baik uji keseluruhan (Uji-F) dan uji koefisien variabel dalam model (Uji-t) memiliki kesamaan dengan analisis regresi linear sederhana.

Hipotesis uji-F adalah : H0 : ß0 = ß1 = ß2 = 0 H1 : ß0, ß1, ß2 ≠ 0

Sedangkan uji koefisien atau pengujian secara parsial memiliki hipotesis sebagai berikut :

Pengujian untuk intersep : H0 : ß0 = 0 H1 : ß0 ≠ 0

Pengujian untuk ß1 : H0 : ß1 = 0 H1 : ß1 ≠ 0

Pengujian untuk ß2 : H0 : ß2 = 0 H1 : ß2 ≠ 0

(31)

Hasil analisis di atas menunjukkan bahwa model secara statistik adalah memang dapat digunakan, terbukti dari nilai F-hit sebesar 73.02 yang signifikan pada tingkat alpha 5%

atau 0.05 Artinya bahwa ß0, ß1, ß2 mempengaruhi secara nyata terhadap N_Akhir (nilai Akhir).

Kekuatan pengaruh dari kedua variabel dalam menjelaskan variabel N_Akhir sebesar 70.2 % sedangkan sisanya yaitu sekitar 29.8% merupakan pengaruh dari variabel lain yang tidak dipertimbangkan dalam model.

(32)

Koefisien latihan 0.542 dapat diartikan jika Nilai Laporan tetap maka kenaikan 1 satuan nilai latihan akan cenderung menaikkan nilai ujian sebesar 0.542.

Demikian juga untuk pengaruh nilai Laporan. Jika nilai laporan naik 1 satuan maka akan cenderung meningkatkan nilai ujian Akhir sebesar 0.771.

Hal yang lebih menarik sebenarnya adalah faktor apa yang tersembunyi di balik angka-angka tersebut. Hal ini

memerlukan informasi yang bersifat kualitatif untuk mengungkap :

Referensi

Dokumen terkait

Berdasarkan hasil pemeriksaan terhadap dokumen pengiriman bahan baku dari pemasok yang menyuplai kayu papan (kayu olahan) dalam periode Maret sampai dengan Mei 2016,

Meningkatkan Kemampuan Penalaran dan Pemahaman Matematis Siswa sekolah Lanjutan Tingkat Pertama melalui Pendekatan Pembelajaran Open Ended.. Bandung : Disertasi SPs UPI,

Dua media aplikasi komputer yaitu Microsoft Power Point berbasis tayangan slide dan Windows Movie Maker berbasis tayangan video yang peneliti bandingkan pada

Further, regression analysis may be used to estimate the value of dependent variable at some point of time if the values of independent variables are known.. This is more relevant in

We conducted a simple multiple linear regression test after determining the relationship between the two variables to see the effect of variable IV (resilience) on the DV

PERANAN DALIHAN NATOLU SEBAGAI MEDIATOR DALAM PENYELESAIAN SENGKETA PERKAWINAN ADAT BATAK TOBA.. Permasalahan Yang Sering Timbul dalam Perkawinan Adat

I think we’re going to see that emerging as there’s more access and more tools for people to do stuff with their data once they get it through things like the health data

Variabel bauran promosi, yang terdiri dari periklanan, promosi penjualan, hubungan masyarakat, penjualan personal, dan pemasaran langsung secara serempak berpengaruh