• Tidak ada hasil yang ditemukan

BA 2106 Statistika Pertanian

N/A
N/A
Protected

Academic year: 2022

Membagikan "BA 2106 Statistika Pertanian"

Copied!
84
0
0

Teks penuh

(1)

BA 2106

Statistika Pertanian

Dr. Mia Rosmiati, Ir.,MP

Rekayasa Pertanian – SITH ITB Analisis Regresi dan Korelasi Minggu -11

(2)

Analisis Regresi

• Analisis Regresi adalah metode statistika yang digunakan untuk menentukan kemungkinan bentuk hubungan / pengaruh antara dua atau lebih variabel bebas (X) dengan variabel terikat (Y).

• Regression analysis concerns the study of relationships between variables with the object of identifying, estimating, and validating the relationship. The estimated relationship can be used to predict one variable from the value of the other variable(s).

• Tujuan : Meramalkan/ memperkirakan nilai dari satu variabel (X) dlm

hubungannya dgn variabel lain (Y) yang diketahui melalui persamaan regresi

(3)

Hubungan Fungsional Antara Variabel

Dalam analisis regresi dibedakan dua jenis variabel:

• Variabel bebas / variabel prediktor / variabel yang menjelaskan/causal variable/

input variabel = X

• Variabel tak bebas / variabel terikat / variabel respon = Y

Hubungan fungsional antara X dan Y dinyatakan dalam bentuk matematik yang disebut persamaan regresi.

Hubungan fungsional antara satu variabel prediktor dengan satu variabel respon

disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional

yang lebih dari satu variabel disebut analisis regresi berganda.

(4)

Jenis Analisis Regresi

1. Regresi linier jika hubungan antara variabel bebas terhadap variabel tak bebas berbentuk linier

2. Regresi non linier jika hubungan antara variabel bebas terhadap variabel tak berbentuk linier (kuadratik, logaritmik, eksponensial kubik, hiperbolik, dll)

Regresi linier sederhana , jika hanya terdiri dari satu variabel bebas/ independent →

Regresi linier berganda, jika terdiri lebih dari satu variabel bebas/

independent →

❑ Regresi kuadratik →

❑Regresi kubik →

bX a

Y ˆ = +

3 3 2

2 1

ˆ a b

1

X b X b X

Y = + + +

3 3

2

3 2

2 2

; ˆ ˆ

ˆ

; ˆ ˆ

bX a

Y cX

bX a

Y

dX cX

bX a

Y

bX a

Y cX

bX a

Y

+

= +

+

=

+ +

+

=

+

= +

+

=

(5)

Regression with a single predictor / regresi linear sederhana

Model persamaan :

Model tersebut ditaksir dengan :

Dimana:

– Ŷ adalah nilai-nilai taksiran untuk variabel tak bebas Y – X adalah nilai-nilai variabel bebas

– a adalah intersep bilamana X=0

– b adalah koefisien arah slope dari garis regresi

dalam hal ini a dan b disebut koefisien regresi tersebut

 + +

= X

Y

Dimana:

Y = var tak bebas X = var bebas

 = intercept/konstanta

 = koefisien slope/ gradien

 = error

bX a

Y

= +

(6)

Garis Regresi Linear Sederhana

• Untuk menentukan persamaan garis regresi maka ditentukan koefisien dari a dan b.

• a dan b ditentukan dengan mencari jarak

kuadrat dari masing-masing data dan garis

regresinya (Error) paling kecil atau disebut

metode kuadrat terkecil (Least square

method)

(7)

Garis Regresi Linear Sederhana

y4

y1

y2

y3

x1 x2 x3 x4

e1

e2

e3

e4

X

Y

Y ˆ = a + bX

(8)

Selisih atau error (e) antar nilai-nilai y1,y2,y3,...,yn dari titik-titik tersebut dengan nilai taksiranya, yaitu ŷ1,ŷ2, ŷ3,..., ŷn berturut-turut adalah :

– e1 = y1 - ŷ1 dengan kuadrat e1² = (y1 - ŷ1)² – e2 = y2 - ŷ2 dengan kuadrat e2² = (y2 - ŷ2)² – e3 = y3 - ŷ3 dengan kuadrat e3² = (y3 - ŷ3)² – .

– .

– en = yn - ŷn dengan kuadrat en² = (yn - ŷn)²

Penaksiran dengan persamaan regresi Ŷ= a + bx memberi total kuadrat eror sebesar :

• ∑e² = ∑ ( Y - Ŷ )² = ∑ ( Yi - a - bXi)² atau ∑Yi2 – a∑Yi – b∑XiYi

Bentuk itu disebut juga total kuadrat kesalahan (sum square error=SSE) dari penaksiran Ŷ = a + bX terhadap nilai-nilai Y sesungguhnya.

(9)

dengan metode kuadrat terkecil ini, persamaan regresi linier akan mempunyai total kuadrat eror minimum bilamana koefisien regresi a dan b dihitung dengan rumus berikut.

dan

Pada rumus tersebut, koefisien regresi a dan b dihitung secara terpisah atau sendiri-sendiri. akan tetapi, bisa juga koeisien b dihitung lebih dahulu dan hasil yang diperoleh dipakai untuk menghitung koefisien a dengan memakai rumus berikut.

X b Y

a = −

  

= 

2 2 2

) (

) )(

( )

(

i i

i i i

i

X X

n

Y X X

X a Yi

xx xy n

i

n

i i

i n

i

n

i

n

i i

i i

i

S S x

xy X

X n

Y X

Y X n

b

= =

=

 

 

  

= =

= = =

2

1 1

2 2

1 1 1

) (

(10)

Basic Notation

• Y = α + βX + ε

• ത 𝑋 = σ 𝑋

𝑖

𝑛 ; ത 𝑌 = σ 𝑌

𝑖

𝑛

• 𝑆 𝑥𝑥 = ∑ 𝑋 − ത 𝑋 2 = σ 𝑋 2(σ 𝑋)2

𝑛

• 𝑆 𝑦𝑦 = σ 𝑌 − ത 𝑌 2 = σ 𝑌 2(σ 𝑌)2

𝑛

• 𝑆 𝑥𝑦 = σ 𝑋 − ത 𝑋 (𝑌 − ത 𝑌) = σ 𝑋𝑌 − (σ 𝑋)(σ 𝑌)

𝑛

(11)

Least square estimate of α a = ത 𝑌 − 𝑏 ത 𝑋

Least square estimate of β 𝑏 =

𝑆𝑥𝑦

𝑆𝑥𝑥

Fitted (or estimated) regression line 𝑌 = 𝑎 + 𝑏𝑋 ෠

The residual sum of squares or the sum of squares due to error is:

The estimator of the error variance σ

2

is :

𝑆 2 = 𝑆𝑆𝐸

𝑛−2

xx xy yy

n

i i

S

S S e

SSE

2

1

2

= −

= 

=

ˆ

(12)

Testing the significance of a regression

Uji kelinieran regresi : Analysis-of-variance testing

• Hipotesis:

H

0

: Garis dari persamaan regresinya tidak linear.

H

1

: Garis dari persamaan regresinya linear.

• Taraf Nyata: α = 5% = 0,05

• Statistik uji:

yy i

i i

total

S

n Y Y

y Y

Y

SS =  ()

2

= 

2

= 

2

()

2

=

xx xy i

i

i i

i i i

regression

S S

n X X

n Y Y X

X x

Y xy Y

SS

2

2 2

2

2 2

2

=

 

 

 −

=

=

=

 

  

 

( ˆ ) ( ) ( )

(13)

• Cara Pengambilan Keputusan:

Tolak H

0

apabila nilai Sig. dalam tabel ANOVA ≤ taraf nyata, atau F-hit ≥ F tabel, dan simpulkan bahwa garis dari persamaan regresinya linear ( signifikan ). Berindikasi bahwa alat analisa regresi cocok diterapkan pada data yang dihadapi dan pengujian lainnya dapat dilanjutkan.

Terima H

0

apabila nilai Sig. dalam tabel ANOVA > taraf nyata, atau F-hit < F-tabel, dan nyatakan bahwa garis dari persamaan regresinya tidak linear ( tidak signifikan ). Berindikasi bahwa alat analisa regresi tidak cocok diterapkan pada data yang dihadapi dan segera beralih ke alat analisa lainnya

 

=

= b xy

x

b xy

2

; jadi SS

reg

xx xy yy

reg Total

i i

error

S

S S SS

SS Y

Y SSE

SS

2

2

= − = −

=

=  ˆ )

(14)

Proporsi atau persentase dari total variasi Y yang dijelaskan oleh persamaan linier disebut koefisien determinasi (r2)

n-k- 1

(15)

Pengujian Hipotesis untuk koefisien Regresi (b) pada Persamaan Regresi Linear : Ŷ=a+bX

Hipotesis:

H0: β = 0 (Tidak terdapat pengaruh dari variabel X terhadap variabel Y).

H1: β ≠ 0 (Terdapat pengaruh dari variabel X terhadap variabel Y).

Taraf Nyata: α = 5% = 0,05

Statistik uji : Uji-t

b

hit

S

b t b

0

=

Sb = standard error of the regression coefficient

i xx

b

S

S X

X n

SSE

S

2

2

2

2 =

= −

)

(

b

S

xx

S = S

(16)

Cara Pengambilan Keputusan:

Tolak H0 apabila t-hit ≥ t-tabel (t /2, db=n-2) atau nilai Sig. ≤ taraf nyata, dan simpulkan bahwa terdapat pengaruh yang berbeda nyata (signifikan) dari variabel X terhadap variabel Y.

Terima H0 apabila t-hit < t-tabel (t /2, db=n-2) atau nilai Sig. > taraf nyata, dan nyatakan bahwa pengaruh dari variabel X terhadap variabel Y tidak berbeda nyata (tidak signifikan).

yy xx

xy Total

reg

S S

S SS

R SS

2

2

= =

= i determinas

Koefisien

(17)

Pengujian Hipotesis untuk Konstanta (a) Pada Persamaan Regresi Linier :Ŷ=a+bX

Hipotesis:

H

0

: α = 0.

H

1

: α ≠ 0.

Taraf Nyata: α = 5% = 0,05

Statistik uji

a

hit

S

a t a

0

=



 



 

− + 

=

2

2 2

2

1

) ( X X

X S n

S

i a

𝐒

𝐚

= 𝐬 𝟏

𝐧 + 𝑿 ഥ

𝟐

𝐒

𝐱𝐱

Df = n-2

(18)

Cara Pengambilan Keputusan:

Tolak H 0 apabila t-hit ≥ t-tabel (t /2, db=n-2 ) atau nilai Sig. ≤ taraf nyata, dan simpulkan bahwa nilai konstanta dari persamaan regresinya berbeda nyata ( signifikan ).

Terima H 0 apabila t-hit < t-tabel atau nilai Sig. > taraf

nyata, dan nyatakan bahwa konstanta dari

persamaan regresinya tidak berbeda nyata ( tidak

signifikan ).

(19)

Contoh Soal

• Berikut ini data penelitian mengenai pengaruh jumlah magnesium terhadap rasa air

• X= jumlah magnesium (mg/lt)

• Y= rasa air

• Tentukan nilai a dan b

• Buatkan persamaan regresinya!

X 2 3 2 5 6 1 4 1

Y 5 8 8 7 11 3 10 4

(20)

Penyelesaian :

X Y X2 Y2 XY

2 5 4 25 10

3 8 9 64 24

2 8 4 64 16

5 7 25 49 35

6 11 36 121 66

1 3 1 9 3

4 10 16 100 40

1 4 1 16 4

24 56 96 448 198

8 7 3 56

8

24 ___

___X = = Y = =

25 72 1

96

168 198

8 24

96

8 56

24 198

2

, / ) ( ) (

/ )}

)(

{(

) (

− =

= −

= − b b

 

  

= =

= = =

= n

i

n

i i

i n

i

n

i

n

i i

i i

i

n X

X

n Y

X Y

X b

1 1

2 2

1 1 1

/ ) (

/ ) (

a = ത 𝑌 − 𝑏 ത 𝑋

a = 7 – (1.25* 3)

a= 3.25

(21)

a. Dari cara pengerjaan tersebut diperoleh nilai a = 3,25 dan nilai b = 1,25

b. Persamaan regresi linearnya adalah Y (Y topi) = 3,25+1,25X c. Uji kelinieran regresi:

Hipotesis:

H0 : Garis dari persamaan regresinya tidak linear.

H1 : Garis dari persamaan regresinya linear.

Taraf Nyata: α = 5% = 0,05

Cara Pengambilan Keputusan:

Tolak H0 apabila nilai Sig. dalam tabel ANOVA ≤ taraf nyata atau Fhit ≥ F-tabel (α ; 1, n-2)

Sumber variasi

df SS MS F-hit

Regresi 1

Error 6

Total 7

Tabel ANOVA

(22)

d. Pengujian signifikansi a dan b 1. Pengujian sig koefisien a

• Hipotesis: Ho: tidak terdapat pengaruh konstanta terhadap nilai Y ; H1: terdapat pengaruh konstanta terhadap nilai Y

• Taraf nyata: 5%

• Pengujian:

• Keputusan dan kesimpulan:

a

hit

S

a t a

0

= 

 



 

− + 

=

2

2 2

2

1

) ( X X

X S n

S

i a

(23)

2. Pengujian sig koef reg (b)

• Hipotesis :

• Taraf nyata : 5%

• Pengujian :

• Keputusan dan kesimpulan :

b

hit

S

b t b

0

=

2

2 2

) ( X X S S

i

b

=  −

(24)

Koefisien Determinasi (R 2 )

6696 ,

016 0 . 86

600 . 57 )

448 )(

192 (

) 240 (

) 136 . 3 584 . 3 ( ) 576 768

(

) 344 . 1 584 . 1 (

) ) 56 ( ) 448 ( 8 ( ) 24 ( ) 96 ( 8 (

)) 56 )(

24 ( ) 198 )(

8 ((

) ) (

) (

( ) (

) (

(

)) )(

( ) )(

((

2 2

2 2

2 2

2 2

2 2

2 2

2 2

=

=

=

= −

= −

= 

R R R

Y Y

n X

X n

Y X

XY R n

Nilai determinasi (R2) sebesar 0,6696, artinya variasi Y dapat dijelaskan sebesar 66,96% oleh hubungan linier / model regresi linier

(25)

Langkah-langkah pada program SPSS

Masuk program SPSS

Klik variable view pada SPSS data editor

Pada kolom Name ketik y, kolom Name pada baris kedua ketik x.

Pada kolom Label, untuk kolom pada baris pertama ketik rasa air, untuk kolom pada baris kedua ketik jumlah magnesium

Untuk kolom-kolom lainnya boleh dihiraukan (isian default)

Buka data view pada SPSS data editor, maka didapat kolom variabel y dan x.

Ketikkan data sesuai dengan variabelnya

Klik Analyze - Regression – Linear

Klik variabel rasa air dan masukkan ke kotak Dependent, kemudian klik variabel jumlah magnesium kemudian masukkan ke kotak Independent.

Klik Statistics, klik estimates, klik model fit, klik continue

Klik OK, maka hasil output yang didapat adalah sebagai berikut:

(26)

Penyelesaian

(27)

Penyelesaian dgn SPSS

(28)

Cara membaca output spss hasil uji regresi linier tersebut adalah :

1. Tabel pertama menunjukkan variabel apa saja yang diproses, mana yang menjadi variabel bebas dan variabel terikat.

2. Tabel kedua menampilkan nilai R yang merupakan simbol dari nilai koefisien korelasi. Pada contoh diatas nilai korelasi adalah 0,818.

Nilai ini dapat diinterpretasikan bahwa hubungan kedua variabel penelitian ada di kategori kuat. Melalui tabel ini juga diperoleh nilai R Square atau koefisien determinasi (KD) yang menunjukkan seberapa bagus model regresi yang dibentuk oleh interaksi variabel bebas dan variabel terikat. Nilai KD yang diperoleh adalah 67,0% yang dapat ditafsirkan bahwa variabel bebas X memiliki pengaruh kontribusi sebesar 67,0% terhadap variabel Y dan 33,% lainnya dipengaruhi oleh faktor-faktor lain diluar variabel X1.

Interpretasi nilai adjusted R-square sama dengan nilai R-square, hanya dalam perhitungannya sudah memperhitungkan ukuran sampel dan jumlah variabel independent yang digunakan.

(29)

3. Tabel ketiga digunakan untuk menentukan taraf signifikansi atau linieritas dari regresi. Kriterianya dapat ditentukan berdasarkan uji F atau uji nilai Signifikansi (Sig.). Cara yang paling mudah dengan uji Sig., dengan ketentuan, jika Nilai Sig.

< 0,05, maka model regresi adalah linier, dan berlaku sebaliknya. Berdasarkan tabel ketiga, diperoleh nilai Sig. = 0,013 yang berarti < taraf signifikan (0,05), dengan demikian model persamaan regresi berdasarkan data penelitian adalah signifikan artinya, model regresi linier memenuhi kriteria linieritas.

• Tabel anova digunakan juga untuk mengetahui apakah model

yang terbentuk cukup berguna untuk memprediksi variabel

dependent (Y) dengan informasi berdasarkan variabel

independent (X)

(30)

4. Tabel keempat menginformasikan model persamaan regresi yang diperoleh dengan koefisien konstanta dan koefisien variabel yang ada di kolom Unstandardized Coefficients B. Berdasarkan tabel ini diperoleh

a) model persamaan regresi : Y=3,25+1,25X.

b) Interpretasi :

Berdasarkan tabel tsb diperoleh nilai sig = 0.013 untuk koef. regresi (b), dimana nilai tsb lebih kecil dibandingkan dengan α = 0.05, maka Ho ditolak.

Kesimpulannya : terdapat pengaruh signifikan variabel (X) terhadap variabel (Y),

(31)

Contoh:

• In a study of protein in the oocyte (developing egg cell) of the frog Xenopus laevis , a biologist injected individual oocytes with radioactively labeled leucine.

At various times after injection, he made radioactively measurements and calculated how much of the leucine had been incorporated into protein. The results are given in the accompanying table; each leucine value is the content of labeled leucine in two oocytes. All oocytes were from the same female.

Time Leucine

0 0.02

10 0.25

20 0.54

30 0.69

40 1.07

50 1.50

60 1.74

• Plot the data. Does there appear to be relationship between X and Y?

• Use linear regression to estimate the rate of incorporation of the labeled leucine

(32)

Contoh:

Laetisaric acid is a compound that holds promise for control of fungus diseases in crop plants. The accompanying data show the results of growing the fungus Pythium ultimum in various concentrations of laetisaric acid. Each growth value is the average of four radial measurements of a P. ultimum colony grown in a petridish for 24 hours

Laetisaric Acid

concentration (μG/ml) Fungus Growth (mm)

3 29.8

3 27.8

6 28.0

6 29.0

10 25.5

10 23.8

20 18.3

20 15.5

30 11.7

30 10

• Dengan menggunakan least square method, tentukan nilai a dan b

• Buatkan persamaan regresinya!

• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)

• Ujilah kelinieran garis persamaan regresi pada alpha 5%

• Ujilah signifikansi koefisien regresi pada alpha 5%

(33)

Contoh:

• Induce reversion to independence per 10

7

sel hidup (Y) per dosis (ergs/bakterium) 10

-5

(X) escherichia coli yang tergantung pada streptomisin, yang dikenai radiasi ultraviolet monokromatik dengan panjang gelombang 296 =A

o .

Data sbb

X Y

13.6 52 13.9 48 21.1 72 25.6 89 26.4 80 39.8 130 40.1 139 43.9 173 51.9 208 53.2 225

X Y

65.2 259 66.4 199 67.7 255

• Dengan menggunakan least square method, tentukan nilai a dan b

• Buatkan persamaan regresinya!

• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)

• Ujilah kelinieran garis persamaan regresi pada alpha 5%

• Ujilah signifikansi koefisien regresi pada alpha 5%

(34)

Contoh:

Seorang peneliti akan meneliti apakah ada pengaruh harga terhadap konsumsi buah pisang. Untuk keperluan tersebut diambil sampel secara acak sebanyak 10 rumah tangga

Harga Konsumsi

31 553

38 590

48 608

52 682

63 752

67 725

75 834

84 752

89 845

99 960

• Dengan menggunakan least square method, tentukan nilai a dan b

• Buatkan persamaan regresinya!

• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)

• Ujilah kelinieran garis persamaan regresi pada alpha 5%

• Ujilah signifikansi koefisien regresi pada alpha 5%

(35)

Contoh:

Jml biji

Jml

polong Jml biji Jml polong

120 45 157 52

173 48 177 50

149 63 166 60

166 46 160 55

170 56 155 45

174 52 159 47

156 60 159 53

158 47 172 49

150 56 168 57

160 55 159 58

Seorang peneliti ingin mengetahui apakah ada pengaruh antara jumlah polong terhadap jumlah biji kedelai (gram)

• Dengan menggunakan least square method, tentukan nilai a dan b

• Buatkan persamaan regresinya!

• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)

• Ujilah kelinieran garis persamaan regresi pada alpha 5%

• Ujilah signifikansi koefisien regresi pada alpha 5%

(36)

Contoh:

Suatu penelitian mengenai pengaruh umur pohon (tahun) dan tinggi pohon (m)

Umur pohon

Tinggi pohon

Umur pohon

Tinggi pohon

5 195.07 13 380.5

6 253.29 15 379

7 313.51 17 452

9 325.6 4 155

10 355.5 6 338.1

11 364.42 8 378.59

12 385.59 10 475.76

7 367 14 362.65

9 364 16 344.01

11 365 12 358.5

• Dengan menggunakan least square method, tentukan nilai a dan b

• Buatkan persamaan

regresinya!

• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)

• Ujilah kelinieran garis persamaan regresi pada alpha 5%

• Ujilah signifikansi koefisien regresi pada alpha 5%

(37)

Contoh:

• The rowan (Sorbus aucuparia) is a tree that grows in a wide range of altitude. To study how the tree adapts to its varying habitats, researchers collected twigs with attached buds from 12 tree growing at various altitudes in North Angus, Scotland.

The buds were brought back to the laboratory and measurements were made of the dark respiration rate. The accompanying table shows the altitude of origin ( in meters) of each batch of buds and the dark respiration rate (expressed as µl of oxygen per hour per mg dry weight of tissue)

• Calculate the linear regression of Y on X

• Plot the data and the regression line

• Interpret the value of the slope of the regression line, b1

• Calculate the residual standard deviation

(38)

Altitude of origin (X) (m)

Respiration Rat e (Y) (µl / hr X mg)

90 0.11

230 0.20

240 0.13

260 0.15

330 0.18

400 0.16

410 0.23

550 0.18

590 0.23

610 0.26

700 0.32

790 0.37

(39)

Contoh:

• The following data are the rates of oxygen consumption of birds, measured at different environmental temperature:

Temperature (oC)

Oxygen consumption

(ml/g/hr)

-18 5.2

-15 4.7

-10 4.5

-5 3.6

0 3.4

5 3.1

10 2.7

19 1.8

a. Calculate a and b for the regression of oxygen consumption rate on temperature

b. Test by anova, the hypothesis Ho:β = 0 c. Test by t-test, the hypothesis Ho:β = 0 d. Caculate the coefficient of

determination of the regression

(40)

Analisis Regresi Linier Ganda (multiple linier regression)

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen dengan satu atau lebih variabel independen, dengan tujuan untuk mengestimasi dan atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui (Gujarati, 2003)

Hasil analisis regresi adalah berupa koefisien untuk masing-masing variabel independen. Koefisien ini diperoleh dengan cara memprediksi nilai variabel dependen dengan suatu persamaan. Koefisien regresi dihitung dengan tujuan meminimumkan penyimpangan antara nilai aktual dan nilai estimasi variabel dependen berdasarkan data yang ada (Tabachnick, 1996)

40

(41)

Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan variabel independen. Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik.

Variabel independen diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang)

Teknik estimasi variabel dependen yang melandasi analisis regresi disebut ordinary least square (OLS). Inti metode OLS adalah mengestimasi suatu garis regresi dengan jalan meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis tersebut

41

(42)

Asumsi OLS

Menurut Gujarati (2003) asumsi-asumsi pada model regresi linier berganda adalah:

Model regresinya adalah linier dalam parameter.

Nilai rata-rata dari error adalah nol, E (ui /Xi) = 0.

Variansi dari error adalah konstan (homoskedastik = varians kesalahan sama untuk setiap periode).

Tidak terjadi autokorelasi pada error

Tidak terjadi multikolinieritas pada variabel bebas.

Error berdistribusi normal

42

(43)

MODEL REGRESI BERGANDA

• Model Regresi Linier Berganda

Y =  0 +  1 x 1 +  2 x 2 + … +  n x n + 

• Persamaan Regresi Linier Berganda

E(Y) =  0 +  1 x 1 +  2 x 2 + … +  n x n

• Estimasi Persamaan Regresi Linier Berganda Ŷ = b 0 + b 1 x 1 + b 2 x 2 + … + b

n

x n

dimana

Y = variabel tak bebas (response/dependent variable) xi = variabel bebas (predictor/independent variable) ke-i

 = error/residual

i = koefisien regresi dari variabel bebas ke-I n = banyaknya observasi

(44)

Menilai Goodness of Fit Suatu Model

a. Koefisisen determinasi (R-square)

Koefisien determinasi (R square) pada intinya mengukur seberapa jauh kemampuan model dalam menerangkan variasi variabel dependen. Nilai R

2

adalah antara 0 – 1. Nilai R

2

yang kecil berarti kemampuan variabel-variabel independen dalam menjelaskan variasi variabel dependen sangat terbatas.

Kelemahan mendasar penggunaan R

2

adalah bias terhadap jumlah variabel independen yang dimasukkan ke dalam model.

Setiap penambahan satu variabel independen, maka R

2

pasti meningkat tidak peduli apakah variabel tersebut berpengaruh secara signifikan terhadap variabel dependen.

Oleh karena itu banyak peneliti menganjurkan untuk menggunakan nilai adjusted R

2

pada saat mengevaluasi mana model regresi terbaik

44

(45)

b. Uji signifikansi Simultan (Uji F)

• Menunjukkan apakah semua variabel independen yang dimasukkan dalam model mempunyai pengaruh secara bersama- sama terhadap variabel dependen.

• Ho : b1 = b2 = b3 = ...= bn = 0 (semua parameter secara simultan sama dengan nol)

• H1 : b1 ≠ b2 ≠ b3 ≠ .... ≠ bn ≠ 0 (tidak semua parameter secara simultan sama dengan nol) artinya semua variabel independen secara simultan merupakan penjelas yang signifikan terhadap variabel dependen

• Menentukan daerah penolakan Ho : Ho ditolak jika F hit > F tabel, atau Sig < α (alpha) 5%

45

(46)

c. Uji Signifikansi Parameter Individual (Uji t)

• Menunjukkan seberapa jauh pengaruh satu variabel independen secara individual dalam menerangkan variasi variabel dependen.

• Hipotesis :

Ho : bi = 0 , variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen

H1 : bi ≠ 0 , variabel independen merupakan penjelas yang signifikan terhadap variabel dependen

• Menentukan daerah penolakan Ho : Ho ditolak jika t hit > t- tabel, atau Sig < α (alpha) 5%

46

(47)

Contoh :

Apakah curahan tenaga kerja dan modal mempengaruhi hasil produksi? Untuk tujuan penelitian tersebut diambil 15 orang responden secara acak. Data hasil wawancara disajikan sbb:

Pertanyaan :

1. Tuliskan persamaan regresinya

2. Berapa besar variansi variabel independen menjelaskan variabel dependen

3. Dengan taraf nyata 5%, apakah secara simultan variabel curahan tenaga kerja dan modal mempengaruhi hasil produksi?

4. Berapa besar pengaruh masing-masing variabel independen terhadap variabel dependen

47

(48)

48

No Resp Hasil produksi Curahan tenaga kerja (HKP)

Modal

1 2000 2 2750

2 1500 1.75 1750

3 3000 3.25 4250

4 1250 1 1500

5 2500 2.25 3000

6 3500 3.5 4000

7 2750 2.8 3250

8 1750 2 2250

9 2500 2.5 3000

10 3450 3.6 4000

11 3000 3.3 3750

12 4500 4.2 5000

13 4750 4.5 6000

14 2000 2 2500

15 2500 2.4 3000

(49)

Langkah-Langkah pada Program SPSS

• Buka data view pada SPSS data editor

• Ketikkan data sesuai dengan variabelnya

• Klik Analyze - Regression - Linear

• Klik variabel hasil produksi dan masukkan ke kotak Dependent, kemudian klik variabel

curahan TK dan modal kemudian masukkan ke kotak Independent.

• Klik Statistics, klik Casewise diagnostics, klik All cases. Klik Continue

• Klik OK

49

(50)

Output SPSS

• Berdasarkan tabel model summary diperoleh nilai nilai

adjusted R

2

=0.968 artinya 96.8% hasil produksi dapat

dijelaskan oleh variabel curahan tenaga kerja dan

modal, sedangkan sisanya 3.2% dijelaskan oleh variabel

lain yang tidak dimasukkan dalam model

(51)

Dari uji Anova atau F test, diperoleh F hitung = 211.964 dengan signifikansi 0.000. Karena probabilitas (0.000) jauh lebih kecil dari α

= 0.05, maka model regresi dapat dipakai untuk memprediksi variabel dependent (Y)

Atau variabel bebas/independent variable (curahan TK dan modal) secara bersama-sama berpengaruh terhadap hasil produksi

(52)

Dari kedua variabel bebas yang dimasukkan ke dalam model regresi, keduanya berpengaruh signifikan terhadap hasil produksi, hal ini dilihat dari nilai signifikansi yang lebih kecil dari 0.05

Persamaan regresinya:

Y = -83.742 + 529.159 X1 + 0.410X2

Konstanta sebesar -83.742 menyatakan bahwa jika variabel independen dianggap konstan, maka rata-rata hasil produksi sebesar -83.742 satuan

Koefisien regresi curahan TK sebesar 529.159 menyatakan bahwa setiap penambahan curahan TK sebesar 1 HKP akan meningkatkan hasil produksi sebesar 529.159 satuan

Koefisien regresi modal sebesar 0.410 menyatakan bahwa setiap penambahan modal 1 satuan akan meningkatkan hasil produksi sebesar 0.410 satuan

(53)

Contoh Regresi Berganda

• Sebuah penelitian dilakukan untuk mengetahui apakah ada pengaruh makanan ikan (tiap hari dalam seminggu) [X

1

] dan panjang ikan (mm) [X

2

] terhadap berat ikan (kg) [Y]

No X1 X2 Y

1 8 115 39

2 10 120 42

3 7 100 35

4 12 135 46

5 9 120 40

6 10 125 41

7 7 98 34

8 8 103 37

9 11 131 45

10 8 100 36

11 10 120 41

12 8 105 38

13 12 138 47

14 9 122 40

(54)

Contoh Regresi Berganda :

seorang manajer pemasaran PT “ABC” ingin mengamati hubungan antara HARGA JUAL, BIAYA IKLAN dengan VOLUME PENJUALAN produknya. Untuk itu diamati secara random data tentang harga jual dan volume penjualan selama 10 minggu sbb :

Pertanyaan : (a). Adakah hubungan antara Harga Jual, Biaya Iklan dan Volume Penjualan ?; (b) Bagaimana Pengaruh Harga Jual, Biaya Iklan terhadap Volume Penjualan ?

MINGGU HARGA (RIBUAN RP) IKLAN (RATUSAN RIBU RP) VOLUME (RIBUAN UNIT)

1 1,30 9 10

2 2,00 7 6

3 1,70 5 5

4 1,50 14 12

5 1,60 15 10

6 1,20 12 15

7 1,60 6 5

8 1,40 10 12

9 1,00 15 17

10 1,10 21 20

(55)

Contoh : Faktor utama yang mempengaruhi produktivitas padi tadah hujan adalah curah hujan dan dosis pemupukan. Berbasis data yang telah dikumpulkan, seseorang ingin mengetahui seberapa besar curah hujan dan pemupukan berpengaruh terhadap produktivitas padi.

PRODUKSI PADI (KUINTAL) (Y)

CURAH HUJAN (mm/hari) (X1)

PEMUPUKAN (kg/ha) (X2)

24 80 30

21 75 20

28 120 30

22 60 27

28 110 32

27 105 31

26 80 28

28 110 37

34 150 43

30 100 40

25 83 30

27 97 33

15 42 15

22 70 20

25 75 28

(56)

Analisis Korelasi

Pengertian:

• Analisis Korelasi adalah metode statistika yang digunakan untuk menentukan kuatnya atau derajat hubungan linier antara dua variabel atau lebih. Semakin nyata hubungan linier (garis lurus), maka semakin kuat atau tinggi derajat hubungan garis lurus antara kedua variabel atau lebih.

• Analisis korelasi adalah teknik kuantitatif yang digunakan untuk mengukur keeratan hubungan atau korelasi antara dua variabel atau lebih.

• Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara dua variabel dan jika ada hubungan, bagaimana arah hubungan dan seberapa besar hubungan tersebut

56

(57)

• Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain analisis korelasi tidak membedakan antara variabel dependent dengan variabel independent.

• Ukuran untuk derajat hubungan garis lurus ini dinamakan koefisien korelasi.

• Sama dengan statistika parametrik, analisis korelasi pada Statistika Nonparametrik juga mempelajari apakah ada hubungan antara dua variabel atau lebih. Dan jika ada hubungan yang signifikan, seberapa erat hubungan tersebut . Hanya pada korelasi non parametrik, data atau variabel yang akan diuji dan diukur korelasinya adalah data nominal atau ordinal.

57

(58)

Korelasi diukur dengan dua tahap, yaitu:

1. Tanda (+) atau (–) . Jika korelasi positif, berarti hubungan searah, artinya jika variabel X naik, maka variabel Y akan naik atau jika variabel X turun, maka variabel Y juga turun. Sebaliknya jika tanda (-), artinya jika variabel X naik, maka variabel Y akan turun.

2. Besar korelasi : Besar korelasi berada di antara -1---- 0 ---- +1. Jika 0 berarti tidak ada hubungan sama sekali, sedangkan jika ±1 berarti ada hubungan yang sempurna antara kedua variabel tersebut.

58

(59)

Untuk menentukan keeratan korelasi antar variabel diberikan patokan:

Nilai r Kriteria

0.81 – 1.00 Sangat tinggi 0.61 – 0.80 Tinggi

0.41 – 0.60 Cukup 0.21 – 0.40 Rendah

0.00 – 0.20 Sangat rendah

(60)

Korelasi : hubungan keterkaitan antara dua atau lebih variabel.

Angka koefisien korelasi ( r ) bergerak -1 ≤ r ≤ +1

NOL

tidak ada atau tidak menentunya hubungan dua variabel contoh : pandai biologi dan menyanyi ; pandai biologi dan tidak bisa menyanyi ; tidak pandai biologi dan tidak bisa menyanyi

korelasi nol antara biologi dengan menyanyi POSITIF

makin besar nilai variabel X menyebabkan makin besar pula nilai variabel Y

Contoh : makin tinggi harga barang , makin tinggi jumlah barang yang ditawarkan

NEGATIF

makin besar nilai variabel X menyebabkan makin kecil nilai variabel Y

contoh : makin tinggi harga

barang, Makin sedikit jumlah

barang yang diminta

(61)

Jenis-jenis koefisien korelasi 1. Koefisien korelasi pearson

2. Koefisien korelasi rank spearman 3. Koefisien korelasi kontingensi

4. Koefisien penentu (koef. Determinasi)

(62)

Korelasi Product Moment Pearson

Tujuan :

• Menganalisis apakah di antara kedua variabel terdapat hubungan, dan jika ada hubungan bagaimana arah hubungan dan berapa besar hubungan tersebut. Digunakan jika data variabel kontinyu dan kuantitatif

• Ukuran asosiasi antara dua variabel yang mempunyai skala ukur interval atau rasio

Kegunaan Korelasi Product Moment Pearson :

• Untuk menyatakan ada atau tidaknya hubungan antara variabel X dengan variabel Y.

• Untuk menyatakan besarnya sumbangan variabel satu terhadap yang lainnya yang dinyatakan dalam persen.

(63)

Asumsi :

• Data berdistribusi Normal

• Variabel yang dihubungkan mempunyai data linear.

• Variabel yang dihubungkan mempunyai data yang dipilih secara acak.

• Variabel yang dihubungkan mempunyai pasangan yang sama dari subyek yang sama pula (berpasangan).

• Variabel yang dihubungkan mempunyai data interval atau rasio.

• Koefisien korelasi tidak memperlihatkan adanya

hubungan sebab akibat antara variabel-variabel

yang diukur

(64)

Langkah-langkah Menghitung Koefisien Korelasi Pearson

1. Tulis Ho dan H1 dalam bentuk kalimat.

2. Tentukan taraf signifikansi (α) 3. Statistik uji : korelasi pearson

Buat tabel sebagai berikut:

No X X2 Y Y2 XY

1 2

ΣX ΣX2 ΣY ΣY2 ΣXY

(65)

Cari r hitung

Cari r tabel dengan dk = n-2

4. Tentukan wilayah kritis (daerah penolakan Ho)

Jika r hitung ≥ r tabel , maka Ho ditolak Atau

t < –tα/2(n-2) atau t > tα/2(n-2) → dwi arah

t ≥ tα,(n-2) → eka arah 5. Buatlah kesimpulan.

Dimana :

ΣXY = jumlah perkalian X dan Y ΣX2 = jumlah kuadrat X

ΣY2 = jumlah kuadrat Y N = banyak pasangan nilai

(66)

• Pengujian lanjutan yaitu uji signifikansi yang berfungsi apabila peneliti ingin mencari makna hubungan variabel X terhadap Y, maka hasil korelasi PPM tersebut diuji dengan uji Signifikansi dengan rumus :

• keterangan: thitung = Nilai t

r = Nilai Koefisien korelasi

n = Jumlah Sampel

• Kaidah pengujian :

• Jika thitung ≥ ttabel, maka tolak Ho artinya korelasi kedua variabel signifikan dan

• Jika thitung ttabel, terima Ho artinya korelasi kedua variabel tidak signifikan.

r 2 1

2 n

r hitung

t

= −

(67)

Contoh:

Seorang peneliti ingin mengetahui hubungan/korelasi antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar. C. Kabat et al (11.3) memperoleh data yang berasal dari 14 ayam betina. Hitunglah koefisien korelasinya dan apakah korelasi tsb signifikan pada alpha 5%?

No 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Telur yg dihasilkan

39 29 46 28 31 25 49 57 51 21 42 38 34 47

Ovulated follicles

37 34 52 26 32 25 55 65 44 25 45 26 29 30

(68)

Jawab:

a. Penentuan hipotesis:

Ho: tidak terdapat hubungan / korelasi antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar H1 : Terdapat hubungan antara penggunaan ovulated follicles dalam

penentuan telur yang dihasilkan oleh ayam pegar Atau:

b. Taraf nyata : α = 5%

c. Uji statistik : korelasi pearson d. Wilayah kritis:

Jika r hitung ≥ r tabel , maka Ho ditolak Atau

t < –tα/2(n-2) atau t > tα/2(n-2) → dwi arah

t ≥ tα,(n-2) → eka arah

0 r

:

0 r

:

1 0

=

H

H

(69)

8211 .

0

909 .

25088 20601

=

= r

Uji signifikansi:

r2 1

2 n r hitung t

= −

8211

2

. 0 1

2 14 8211 .

0

= − t

hit

984 .

4 571 .

0

844 .

2

=

hit

= t

e. Keputusan dan kesimpulan :

t-hit = 4.985 dan t-tabel(0.025,12) = 2.179, maka t-hit > t-tab ➔ tolak H0, artinya terdapat hubungan yang signifikan antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar

2 2

( 14 * ( 21807 ) ( 525 ) )

537 (

) 22113 (

* 14 (

) 525 )(

537 (

) 21609 (

14

= − r

r tabel (0.05,db=12) = 0.532

(70)

No X X2 Y Y2 XY

1 39 1521 37 1369 1443

2 29 841 34 1156 986

3 46 2116 52 2704 2392

4 28 784 26 676 728

5 31 961 32 1024 992

6 25 625 25 625 625

7 49 2401 55 3025 2695

8 57 3249 65 4225 3705

9 51 2601 44 1936 2244

10 21 441 25 625 525

11 42 1764 45 2025 1890

12 38 1444 26 676 988

13 34 1156 29 841 986

14 47 2209 30 900 1410

Jml 537 22113 525 21807 21609

(71)

Langkah pengujian dgn SPSS

1) Klik File – New – Data

2) Klik Variabel View (Kanan bawah)

3) Isikan nama variabel pada kolom name (Misal X untuk ovulated follicles dan Y untuk telur yg dihasilkan)

4) Kolom Type, Klik Numeric karena penghitungannya berupa angka.

5) Kolom width isikan 8 dan Decimals isikan 2

6) Kolom Label isikan keterangan untuk melengkapi kolom Name (Misal: ovulated follicles dan telur yg dihasilkan).

7) Klik Data View – Isikan data tersebut diatas, 14 data pada kolom X untuk varibael : ovulated follicles dan 14 data pada kolom Y untuk variabel telur yg dihasilkan.

8) Klik File – Save untuk menyimpan data (beri nama yang anda inginkan, misal : ovulated follicles ).

9) Klik Analyze – Correlation – Bivariate.

10) Klik variabel X dan Y – pindahkan ke kotak Variables 11) Pilih Pearson pada kolom Correlation Coefficents 12) Pilih Two Tailed pada kolom Test of Significant 13) Klik Continue

14) Klik OK

(72)

Dari hasil analisis korelasi (r) didapat korelasi antara ovulated follicles dengan telur yang dihasilkan (r) adalah 0,821. Hal ini menunjukkan bahwa terjadi hubungan yang kuat antara ovulated follicles dengan telur yang dihasilkan . Sedangkan arah hubungan adalah positif karena nilai r positif, berarti semakin tinggi ovulated follicles maka semakin tinggi telur yang dihasilkan

(73)

Contoh

Data penelitian mengenai bunga nicotiana terdiri atas panjang tabung=T dan panjang cabang=L. Hitung koefisien korelasi antara T dan L

T L T L

49 27 41 22

44 24 48 25

32 12 45 23

42 22 39 18

32 13 40 20

53 29 34 15

36 14 37 20

39 20 35 13

37 16 36 15

45 21 41 20

(74)

UJI KORELASI RANK SPEARMAN

(The Spearman Rank Correlation Coefficient : rs)

• Untuk dua variabel berjenis ordinal, ukuran asosiasinya adalah koefisien korelasi rank Spearman

Spesifikasi Uji Korelasi Rank Spearman:

a. Mempunyai keampuhan yang hampir sama dengan korelasi Pearson

b. Nilai koefisien antara -1 s.d +1 c. Skala ukur minimal ordinal

Hipotesis :

Ho : ρ = 0 , tdk ada korelasi H1 : ρ ≠ 0 , terjadi korelasi

74

(75)

Prosedur Analisis:

1. Susun data sebagai berikut :

2. Data X diranking dari 1 s.d. N 3. Data Y diranking dari 1 s.d. N

N = banyaknya sampel

di = selisih ranking X dengan ranking Y

No Data Ranking di di

2

X Y X Y

1 2 . . n

75

(76)

3. Uji Statistik

a. Untuk tanpa rank kembar atau rank kembar hanya sedikit:

b. Untuk rank kembar yang cukup banyak:

t = banyak kembaran data 4. Pengujian Signifikansi

a. Untuk 4≤ N ≤ 30 , pergunakan Tabel rs (eka arah) b. Untuk N > 30, pergunakan Tabel t-student)

N N

di 1 6

rs 3 2

=

x

2

= N

3

12 N T

x

y2 = N312N Ty

12 t T t

3 X

= −

12 t T t

3 y

= −

 

+

=

2 2

2 2

2

*

2 x y

d y

r

s

x

i

76

(77)

5. Kaidah keputusan:

a. Tabel rs akan meragukan dipergunakan jika H1 dwi arah, untuk H1 eka arah:

Tolak Ho jika rs ≥ rs α Terima Ho jika rs < rs α

b. Pergunakan Tabel t, kita harus menghitung dulu nilai t :

Bandingkan dengan tabel t pada db = n-2 dan sesuaikan dengan α serta H1

Eka arah --- baris informasi atas Dwi arah --- baris informasi bawah Tolak Ho jika tr tα (n-2)

Terima Ho jika tr < tα (n-2)

s2

r

1 r

2 t N

= rs

77

Referensi

Dokumen terkait

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen terikat dengan satu atau lebih variabel independen variabel penjelas atau bebas, dengan

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen dengan satu atau lebih variabel independen, dengan tujuan untuk mengestimasikan dan

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (bebas), dengan tujuan untuk

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel bebas) dengan tujuan

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan satu variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel penjelas

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel penjelas/bebas)

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen (terikat) dengan satu atau lebih variabel independen (variabel bebas) dengan tujuan