BA 2106
Statistika Pertanian
Dr. Mia Rosmiati, Ir.,MP
Rekayasa Pertanian – SITH ITB Analisis Regresi dan Korelasi Minggu -11
Analisis Regresi
• Analisis Regresi adalah metode statistika yang digunakan untuk menentukan kemungkinan bentuk hubungan / pengaruh antara dua atau lebih variabel bebas (X) dengan variabel terikat (Y).
• Regression analysis concerns the study of relationships between variables with the object of identifying, estimating, and validating the relationship. The estimated relationship can be used to predict one variable from the value of the other variable(s).
• Tujuan : Meramalkan/ memperkirakan nilai dari satu variabel (X) dlm
hubungannya dgn variabel lain (Y) yang diketahui melalui persamaan regresi
Hubungan Fungsional Antara Variabel
Dalam analisis regresi dibedakan dua jenis variabel:
• Variabel bebas / variabel prediktor / variabel yang menjelaskan/causal variable/
input variabel = X
• Variabel tak bebas / variabel terikat / variabel respon = Y
Hubungan fungsional antara X dan Y dinyatakan dalam bentuk matematik yang disebut persamaan regresi.
Hubungan fungsional antara satu variabel prediktor dengan satu variabel respon
disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional
yang lebih dari satu variabel disebut analisis regresi berganda.
Jenis Analisis Regresi
1. Regresi linier jika hubungan antara variabel bebas terhadap variabel tak bebas berbentuk linier
2. Regresi non linier jika hubungan antara variabel bebas terhadap variabel tak berbentuk linier (kuadratik, logaritmik, eksponensial kubik, hiperbolik, dll)
❑ Regresi linier sederhana , jika hanya terdiri dari satu variabel bebas/ independent →
❑ Regresi linier berganda, jika terdiri lebih dari satu variabel bebas/
independent →
❑ Regresi kuadratik →
❑Regresi kubik →
bX a
Y ˆ = +
3 3 2
2 1
ˆ a b
1X b X b X
Y = + + +
3 3
2
3 2
2 2
; ˆ ˆ
ˆ
; ˆ ˆ
bX a
Y cX
bX a
Y
dX cX
bX a
Y
bX a
Y cX
bX a
Y
+
= +
+
=
+ +
+
=
+
= +
+
=
Regression with a single predictor / regresi linear sederhana
• Model persamaan :
Model tersebut ditaksir dengan :
Dimana:
– Ŷ adalah nilai-nilai taksiran untuk variabel tak bebas Y – X adalah nilai-nilai variabel bebas
– a adalah intersep bilamana X=0
– b adalah koefisien arah slope dari garis regresi
dalam hal ini a dan b disebut koefisien regresi tersebut
+ +
= X
Y
Dimana:
Y = var tak bebas X = var bebas
= intercept/konstanta
= koefisien slope/ gradien
= error
bX a
Y
= +
Garis Regresi Linear Sederhana
• Untuk menentukan persamaan garis regresi maka ditentukan koefisien dari a dan b.
• a dan b ditentukan dengan mencari jarak
kuadrat dari masing-masing data dan garis
regresinya (Error) paling kecil atau disebut
metode kuadrat terkecil (Least square
method)
Garis Regresi Linear Sederhana
y4
y1
y2
y3
x1 x2 x3 x4
e1
e2
e3
e4
X
Y
Y ˆ = a + bX
• Selisih atau error (e) antar nilai-nilai y1,y2,y3,...,yn dari titik-titik tersebut dengan nilai taksiranya, yaitu ŷ1,ŷ2, ŷ3,..., ŷn berturut-turut adalah :
– e1 = y1 - ŷ1 dengan kuadrat e1² = (y1 - ŷ1)² – e2 = y2 - ŷ2 dengan kuadrat e2² = (y2 - ŷ2)² – e3 = y3 - ŷ3 dengan kuadrat e3² = (y3 - ŷ3)² – .
– .
– en = yn - ŷn dengan kuadrat en² = (yn - ŷn)²
• Penaksiran dengan persamaan regresi Ŷ= a + bx memberi total kuadrat eror sebesar :
• ∑e² = ∑ ( Y - Ŷ )² = ∑ ( Yi - a - bXi)² atau ∑Yi2 – a∑Yi – b∑XiYi
• Bentuk itu disebut juga total kuadrat kesalahan (sum square error=SSE) dari penaksiran Ŷ = a + bX terhadap nilai-nilai Y sesungguhnya.
• dengan metode kuadrat terkecil ini, persamaan regresi linier akan mempunyai total kuadrat eror minimum bilamana koefisien regresi a dan b dihitung dengan rumus berikut.
dan
• Pada rumus tersebut, koefisien regresi a dan b dihitung secara terpisah atau sendiri-sendiri. akan tetapi, bisa juga koeisien b dihitung lebih dahulu dan hasil yang diperoleh dipakai untuk menghitung koefisien a dengan memakai rumus berikut.
X b Y
a = −
−
−
=
2 2 2
) (
) )(
( )
(
i i
i i i
i
X X
n
Y X X
X a Yi
xx xy n
i
n
i i
i n
i
n
i
n
i i
i i
i
S S x
xy X
X n
Y X
Y X n
b
= =−
−
=
= =
= = =
2
1 1
2 2
1 1 1
) (
Basic Notation
• Y = α + βX + ε
• ത 𝑋 = σ 𝑋
𝑖𝑛 ; ത 𝑌 = σ 𝑌
𝑖𝑛
• 𝑆 𝑥𝑥 = ∑ 𝑋 − ത 𝑋 2 = σ 𝑋 2 − (σ 𝑋)2
𝑛
• 𝑆 𝑦𝑦 = σ 𝑌 − ത 𝑌 2 = σ 𝑌 2 − (σ 𝑌)2
𝑛
• 𝑆 𝑥𝑦 = σ 𝑋 − ത 𝑋 (𝑌 − ത 𝑌) = σ 𝑋𝑌 − (σ 𝑋)(σ 𝑌)
𝑛
Least square estimate of α a = ത 𝑌 − 𝑏 ത 𝑋
Least square estimate of β 𝑏 =
𝑆𝑥𝑦𝑆𝑥𝑥
Fitted (or estimated) regression line 𝑌 = 𝑎 + 𝑏𝑋
The residual sum of squares or the sum of squares due to error is:
The estimator of the error variance σ
2is :
𝑆 2 = 𝑆𝑆𝐸
𝑛−2
xx xy yy
n
i i
S
S S e
SSE
2
1
2
= −
=
=
ˆ
Testing the significance of a regression
Uji kelinieran regresi : Analysis-of-variance testing
• Hipotesis:
H
0: Garis dari persamaan regresinya tidak linear.
H
1: Garis dari persamaan regresinya linear.
• Taraf Nyata: α = 5% = 0,05
• Statistik uji:
yy i
i i
total
S
n Y Y
y Y
Y
SS = ( − )
2=
2=
2− ( )
2=
xx xy i
i
i i
i i i
regression
S S
n X X
n Y Y X
X x
Y xy Y
SS
2
2 2
2
2 2
2
=
−
−
=
=
−
=
( ˆ ) ( ) ( )
• Cara Pengambilan Keputusan:
Tolak H
0apabila nilai Sig. dalam tabel ANOVA ≤ taraf nyata, atau F-hit ≥ F tabel, dan simpulkan bahwa garis dari persamaan regresinya linear ( signifikan ). Berindikasi bahwa alat analisa regresi cocok diterapkan pada data yang dihadapi dan pengujian lainnya dapat dilanjutkan.
Terima H
0apabila nilai Sig. dalam tabel ANOVA > taraf nyata, atau F-hit < F-tabel, dan nyatakan bahwa garis dari persamaan regresinya tidak linear ( tidak signifikan ). Berindikasi bahwa alat analisa regresi tidak cocok diterapkan pada data yang dihadapi dan segera beralih ke alat analisa lainnya
=
= b xy
x
b xy
2; jadi SS
regxx xy yy
reg Total
i i
error
S
S S SS
SS Y
Y SSE
SS
2
2
= − = −
−
=
= ˆ )
Proporsi atau persentase dari total variasi Y yang dijelaskan oleh persamaan linier disebut koefisien determinasi (r2)
n-k- 1
Pengujian Hipotesis untuk koefisien Regresi (b) pada Persamaan Regresi Linear : Ŷ=a+bX
⚫ Hipotesis:
H0: β = 0 (Tidak terdapat pengaruh dari variabel X terhadap variabel Y).
H1: β ≠ 0 (Terdapat pengaruh dari variabel X terhadap variabel Y).
⚫ Taraf Nyata: α = 5% = 0,05
⚫ Statistik uji : Uji-t
b
hit
S
b t b −
0=
Sb = standard error of the regression coefficienti xx
b
S
S X
X n
SSE
S
22
2
2 =
−
= −
)
(
bS
xxS = S
⚫ Cara Pengambilan Keputusan:
Tolak H0 apabila t-hit ≥ t-tabel (t /2, db=n-2) atau nilai Sig. ≤ taraf nyata, dan simpulkan bahwa terdapat pengaruh yang berbeda nyata (signifikan) dari variabel X terhadap variabel Y.
Terima H0 apabila t-hit < t-tabel (t /2, db=n-2) atau nilai Sig. > taraf nyata, dan nyatakan bahwa pengaruh dari variabel X terhadap variabel Y tidak berbeda nyata (tidak signifikan).
yy xx
xy Total
reg
S S
S SS
R SS
2
2
= =
= i determinas
Koefisien
Pengujian Hipotesis untuk Konstanta (a) Pada Persamaan Regresi Linier :Ŷ=a+bX
⚫
Hipotesis:
H
0: α = 0.
H
1: α ≠ 0.
⚫
Taraf Nyata: α = 5% = 0,05
⚫
Statistik uji
a
hit
S
a t a −
0=
− +
=
22 2
2
1
) ( X X
X S n
S
i a
𝐒
𝐚= 𝐬 𝟏
𝐧 + 𝑿 ഥ
𝟐𝐒
𝐱𝐱Df = n-2
⚫ Cara Pengambilan Keputusan:
Tolak H 0 apabila t-hit ≥ t-tabel (t /2, db=n-2 ) atau nilai Sig. ≤ taraf nyata, dan simpulkan bahwa nilai konstanta dari persamaan regresinya berbeda nyata ( signifikan ).
Terima H 0 apabila t-hit < t-tabel atau nilai Sig. > taraf
nyata, dan nyatakan bahwa konstanta dari
persamaan regresinya tidak berbeda nyata ( tidak
signifikan ).
Contoh Soal
• Berikut ini data penelitian mengenai pengaruh jumlah magnesium terhadap rasa air
• X= jumlah magnesium (mg/lt)
• Y= rasa air
• Tentukan nilai a dan b
• Buatkan persamaan regresinya!
X 2 3 2 5 6 1 4 1
Y 5 8 8 7 11 3 10 4
Penyelesaian :
X Y X2 Y2 XY
2 5 4 25 10
3 8 9 64 24
2 8 4 64 16
5 7 25 49 35
6 11 36 121 66
1 3 1 9 3
4 10 16 100 40
1 4 1 16 4
24 56 96 448 198
8 7 3 56
8
24 ___
___X = = Y = =
25 72 1
96
168 198
8 24
96
8 56
24 198
2
, / ) ( ) (
/ )}
)(
{(
) (
− =
= −
−
= − b b
= =
= = =
−
−
= n
i
n
i i
i n
i
n
i
n
i i
i i
i
n X
X
n Y
X Y
X b
1 1
2 2
1 1 1
/ ) (
/ ) (
a = ത 𝑌 − 𝑏 ത 𝑋
a = 7 – (1.25* 3)
a= 3.25
a. Dari cara pengerjaan tersebut diperoleh nilai a = 3,25 dan nilai b = 1,25
b. Persamaan regresi linearnya adalah Y (Y topi) = 3,25+1,25X c. Uji kelinieran regresi:
• Hipotesis:
H0 : Garis dari persamaan regresinya tidak linear.
H1 : Garis dari persamaan regresinya linear.
• Taraf Nyata: α = 5% = 0,05
• Cara Pengambilan Keputusan:
• Tolak H0 apabila nilai Sig. dalam tabel ANOVA ≤ taraf nyata atau Fhit ≥ F-tabel (α ; 1, n-2)
Sumber variasi
df SS MS F-hit
Regresi 1
Error 6
Total 7
Tabel ANOVA
d. Pengujian signifikansi a dan b 1. Pengujian sig koefisien a
• Hipotesis: Ho: tidak terdapat pengaruh konstanta terhadap nilai Y ; H1: terdapat pengaruh konstanta terhadap nilai Y
• Taraf nyata: 5%
• Pengujian:
• Keputusan dan kesimpulan:
a
hit
S
a t a −
0=
− +
=
22 2
2
1
) ( X X
X S n
S
i a
2. Pengujian sig koef reg (b)
• Hipotesis :
• Taraf nyata : 5%
• Pengujian :
• Keputusan dan kesimpulan :
b
hit
S
b t b −
0=
22 2
) ( X X S S
i
b
= −
Koefisien Determinasi (R 2 )
6696 ,
016 0 . 86
600 . 57 )
448 )(
192 (
) 240 (
) 136 . 3 584 . 3 ( ) 576 768
(
) 344 . 1 584 . 1 (
) ) 56 ( ) 448 ( 8 ( ) 24 ( ) 96 ( 8 (
)) 56 )(
24 ( ) 198 )(
8 ((
) ) (
) (
( ) (
) (
(
)) )(
( ) )(
((
2 2
2 2
2 2
2 2
2 2
2 2
2 2
=
=
=
−
−
= −
−
−
= −
−
−
−
=
R R R
Y Y
n X
X n
Y X
XY R n
Nilai determinasi (R2) sebesar 0,6696, artinya variasi Y dapat dijelaskan sebesar 66,96% oleh hubungan linier / model regresi linier
Langkah-langkah pada program SPSS
• Masuk program SPSS
• Klik variable view pada SPSS data editor
• Pada kolom Name ketik y, kolom Name pada baris kedua ketik x.
• Pada kolom Label, untuk kolom pada baris pertama ketik rasa air, untuk kolom pada baris kedua ketik jumlah magnesium
• Untuk kolom-kolom lainnya boleh dihiraukan (isian default)
• Buka data view pada SPSS data editor, maka didapat kolom variabel y dan x.
• Ketikkan data sesuai dengan variabelnya
• Klik Analyze - Regression – Linear
• Klik variabel rasa air dan masukkan ke kotak Dependent, kemudian klik variabel jumlah magnesium kemudian masukkan ke kotak Independent.
• Klik Statistics, klik estimates, klik model fit, klik continue
• Klik OK, maka hasil output yang didapat adalah sebagai berikut:
Penyelesaian
Penyelesaian dgn SPSS
Cara membaca output spss hasil uji regresi linier tersebut adalah :
1. Tabel pertama menunjukkan variabel apa saja yang diproses, mana yang menjadi variabel bebas dan variabel terikat.
2. Tabel kedua menampilkan nilai R yang merupakan simbol dari nilai koefisien korelasi. Pada contoh diatas nilai korelasi adalah 0,818.
Nilai ini dapat diinterpretasikan bahwa hubungan kedua variabel penelitian ada di kategori kuat. Melalui tabel ini juga diperoleh nilai R Square atau koefisien determinasi (KD) yang menunjukkan seberapa bagus model regresi yang dibentuk oleh interaksi variabel bebas dan variabel terikat. Nilai KD yang diperoleh adalah 67,0% yang dapat ditafsirkan bahwa variabel bebas X memiliki pengaruh kontribusi sebesar 67,0% terhadap variabel Y dan 33,% lainnya dipengaruhi oleh faktor-faktor lain diluar variabel X1.
• Interpretasi nilai adjusted R-square sama dengan nilai R-square, hanya dalam perhitungannya sudah memperhitungkan ukuran sampel dan jumlah variabel independent yang digunakan.
3. Tabel ketiga digunakan untuk menentukan taraf signifikansi atau linieritas dari regresi. Kriterianya dapat ditentukan berdasarkan uji F atau uji nilai Signifikansi (Sig.). Cara yang paling mudah dengan uji Sig., dengan ketentuan, jika Nilai Sig.
< 0,05, maka model regresi adalah linier, dan berlaku sebaliknya. Berdasarkan tabel ketiga, diperoleh nilai Sig. = 0,013 yang berarti < taraf signifikan (0,05), dengan demikian model persamaan regresi berdasarkan data penelitian adalah signifikan artinya, model regresi linier memenuhi kriteria linieritas.
• Tabel anova digunakan juga untuk mengetahui apakah model
yang terbentuk cukup berguna untuk memprediksi variabel
dependent (Y) dengan informasi berdasarkan variabel
independent (X)
4. Tabel keempat menginformasikan model persamaan regresi yang diperoleh dengan koefisien konstanta dan koefisien variabel yang ada di kolom Unstandardized Coefficients B. Berdasarkan tabel ini diperoleh
a) model persamaan regresi : Y=3,25+1,25X.
b) Interpretasi :
Berdasarkan tabel tsb diperoleh nilai sig = 0.013 untuk koef. regresi (b), dimana nilai tsb lebih kecil dibandingkan dengan α = 0.05, maka Ho ditolak.
Kesimpulannya : terdapat pengaruh signifikan variabel (X) terhadap variabel (Y),
Contoh:
• In a study of protein in the oocyte (developing egg cell) of the frog Xenopus laevis , a biologist injected individual oocytes with radioactively labeled leucine.
At various times after injection, he made radioactively measurements and calculated how much of the leucine had been incorporated into protein. The results are given in the accompanying table; each leucine value is the content of labeled leucine in two oocytes. All oocytes were from the same female.
Time Leucine
0 0.02
10 0.25
20 0.54
30 0.69
40 1.07
50 1.50
60 1.74
• Plot the data. Does there appear to be relationship between X and Y?
• Use linear regression to estimate the rate of incorporation of the labeled leucine
Contoh:
Laetisaric acid is a compound that holds promise for control of fungus diseases in crop plants. The accompanying data show the results of growing the fungus Pythium ultimum in various concentrations of laetisaric acid. Each growth value is the average of four radial measurements of a P. ultimum colony grown in a petridish for 24 hours
Laetisaric Acid
concentration (μG/ml) Fungus Growth (mm)
3 29.8
3 27.8
6 28.0
6 29.0
10 25.5
10 23.8
20 18.3
20 15.5
30 11.7
30 10
• Dengan menggunakan least square method, tentukan nilai a dan b
• Buatkan persamaan regresinya!
• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)
• Ujilah kelinieran garis persamaan regresi pada alpha 5%
• Ujilah signifikansi koefisien regresi pada alpha 5%
Contoh:
• Induce reversion to independence per 10
7sel hidup (Y) per dosis (ergs/bakterium) 10
-5(X) escherichia coli yang tergantung pada streptomisin, yang dikenai radiasi ultraviolet monokromatik dengan panjang gelombang 296 =A
o .Data sbb
X Y
13.6 52 13.9 48 21.1 72 25.6 89 26.4 80 39.8 130 40.1 139 43.9 173 51.9 208 53.2 225
X Y
65.2 259 66.4 199 67.7 255
• Dengan menggunakan least square method, tentukan nilai a dan b
• Buatkan persamaan regresinya!
• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)
• Ujilah kelinieran garis persamaan regresi pada alpha 5%
• Ujilah signifikansi koefisien regresi pada alpha 5%
Contoh:
• Seorang peneliti akan meneliti apakah ada pengaruh harga terhadap konsumsi buah pisang. Untuk keperluan tersebut diambil sampel secara acak sebanyak 10 rumah tangga
Harga Konsumsi
31 553
38 590
48 608
52 682
63 752
67 725
75 834
84 752
89 845
99 960
• Dengan menggunakan least square method, tentukan nilai a dan b
• Buatkan persamaan regresinya!
• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)
• Ujilah kelinieran garis persamaan regresi pada alpha 5%
• Ujilah signifikansi koefisien regresi pada alpha 5%
Contoh:
Jml biji
Jml
polong Jml biji Jml polong
120 45 157 52
173 48 177 50
149 63 166 60
166 46 160 55
170 56 155 45
174 52 159 47
156 60 159 53
158 47 172 49
150 56 168 57
160 55 159 58
Seorang peneliti ingin mengetahui apakah ada pengaruh antara jumlah polong terhadap jumlah biji kedelai (gram)
• Dengan menggunakan least square method, tentukan nilai a dan b
• Buatkan persamaan regresinya!
• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)
• Ujilah kelinieran garis persamaan regresi pada alpha 5%
• Ujilah signifikansi koefisien regresi pada alpha 5%
Contoh:
• Suatu penelitian mengenai pengaruh umur pohon (tahun) dan tinggi pohon (m)
Umur pohon
Tinggi pohon
Umur pohon
Tinggi pohon
5 195.07 13 380.5
6 253.29 15 379
7 313.51 17 452
9 325.6 4 155
10 355.5 6 338.1
11 364.42 8 378.59
12 385.59 10 475.76
7 367 14 362.65
9 364 16 344.01
11 365 12 358.5
• Dengan menggunakan least square method, tentukan nilai a dan b
• Buatkan persamaan
regresinya!
• Berapa besar variabel Y dapat dijelaskan oleh variabel X (koefisien determinasi)
• Ujilah kelinieran garis persamaan regresi pada alpha 5%
• Ujilah signifikansi koefisien regresi pada alpha 5%
Contoh:
• The rowan (Sorbus aucuparia) is a tree that grows in a wide range of altitude. To study how the tree adapts to its varying habitats, researchers collected twigs with attached buds from 12 tree growing at various altitudes in North Angus, Scotland.
The buds were brought back to the laboratory and measurements were made of the dark respiration rate. The accompanying table shows the altitude of origin ( in meters) of each batch of buds and the dark respiration rate (expressed as µl of oxygen per hour per mg dry weight of tissue)
• Calculate the linear regression of Y on X
• Plot the data and the regression line
• Interpret the value of the slope of the regression line, b1
• Calculate the residual standard deviation
Altitude of origin (X) (m)
Respiration Rat e (Y) (µl / hr X mg)
90 0.11
230 0.20
240 0.13
260 0.15
330 0.18
400 0.16
410 0.23
550 0.18
590 0.23
610 0.26
700 0.32
790 0.37
Contoh:
• The following data are the rates of oxygen consumption of birds, measured at different environmental temperature:
Temperature (oC)
Oxygen consumption
(ml/g/hr)
-18 5.2
-15 4.7
-10 4.5
-5 3.6
0 3.4
5 3.1
10 2.7
19 1.8
a. Calculate a and b for the regression of oxygen consumption rate on temperature
b. Test by anova, the hypothesis Ho:β = 0 c. Test by t-test, the hypothesis Ho:β = 0 d. Caculate the coefficient of
determination of the regression
Analisis Regresi Linier Ganda (multiple linier regression)
Analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependen dengan satu atau lebih variabel independen, dengan tujuan untuk mengestimasi dan atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui (Gujarati, 2003)
Hasil analisis regresi adalah berupa koefisien untuk masing-masing variabel independen. Koefisien ini diperoleh dengan cara memprediksi nilai variabel dependen dengan suatu persamaan. Koefisien regresi dihitung dengan tujuan meminimumkan penyimpangan antara nilai aktual dan nilai estimasi variabel dependen berdasarkan data yang ada (Tabachnick, 1996)
40
Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan variabel independen. Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik.
Variabel independen diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang)
Teknik estimasi variabel dependen yang melandasi analisis regresi disebut ordinary least square (OLS). Inti metode OLS adalah mengestimasi suatu garis regresi dengan jalan meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis tersebut
41
Asumsi OLS
Menurut Gujarati (2003) asumsi-asumsi pada model regresi linier berganda adalah:
Model regresinya adalah linier dalam parameter.
Nilai rata-rata dari error adalah nol, E (ui /Xi) = 0.
Variansi dari error adalah konstan (homoskedastik = varians kesalahan sama untuk setiap periode).
Tidak terjadi autokorelasi pada error
Tidak terjadi multikolinieritas pada variabel bebas.
Error berdistribusi normal
42
MODEL REGRESI BERGANDA
• Model Regresi Linier Berganda
Y = 0 + 1 x 1 + 2 x 2 + … + n x n +
• Persamaan Regresi Linier Berganda
E(Y) = 0 + 1 x 1 + 2 x 2 + … + n x n
• Estimasi Persamaan Regresi Linier Berganda Ŷ = b 0 + b 1 x 1 + b 2 x 2 + … + b
nx n
dimana
Y = variabel tak bebas (response/dependent variable) xi = variabel bebas (predictor/independent variable) ke-i
= error/residual
i = koefisien regresi dari variabel bebas ke-I n = banyaknya observasi
Menilai Goodness of Fit Suatu Model
a. Koefisisen determinasi (R-square)
Koefisien determinasi (R square) pada intinya mengukur seberapa jauh kemampuan model dalam menerangkan variasi variabel dependen. Nilai R
2adalah antara 0 – 1. Nilai R
2yang kecil berarti kemampuan variabel-variabel independen dalam menjelaskan variasi variabel dependen sangat terbatas.
Kelemahan mendasar penggunaan R
2adalah bias terhadap jumlah variabel independen yang dimasukkan ke dalam model.
Setiap penambahan satu variabel independen, maka R
2pasti meningkat tidak peduli apakah variabel tersebut berpengaruh secara signifikan terhadap variabel dependen.
Oleh karena itu banyak peneliti menganjurkan untuk menggunakan nilai adjusted R
2pada saat mengevaluasi mana model regresi terbaik
44
b. Uji signifikansi Simultan (Uji F)
• Menunjukkan apakah semua variabel independen yang dimasukkan dalam model mempunyai pengaruh secara bersama- sama terhadap variabel dependen.
• Ho : b1 = b2 = b3 = ...= bn = 0 (semua parameter secara simultan sama dengan nol)
• H1 : b1 ≠ b2 ≠ b3 ≠ .... ≠ bn ≠ 0 (tidak semua parameter secara simultan sama dengan nol) artinya semua variabel independen secara simultan merupakan penjelas yang signifikan terhadap variabel dependen
• Menentukan daerah penolakan Ho : Ho ditolak jika F hit > F tabel, atau Sig < α (alpha) 5%
45
c. Uji Signifikansi Parameter Individual (Uji t)
• Menunjukkan seberapa jauh pengaruh satu variabel independen secara individual dalam menerangkan variasi variabel dependen.
• Hipotesis :
Ho : bi = 0 , variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen
H1 : bi ≠ 0 , variabel independen merupakan penjelas yang signifikan terhadap variabel dependen
• Menentukan daerah penolakan Ho : Ho ditolak jika t hit > t- tabel, atau Sig < α (alpha) 5%
46
Contoh :
Apakah curahan tenaga kerja dan modal mempengaruhi hasil produksi? Untuk tujuan penelitian tersebut diambil 15 orang responden secara acak. Data hasil wawancara disajikan sbb:
Pertanyaan :
1. Tuliskan persamaan regresinya
2. Berapa besar variansi variabel independen menjelaskan variabel dependen
3. Dengan taraf nyata 5%, apakah secara simultan variabel curahan tenaga kerja dan modal mempengaruhi hasil produksi?
4. Berapa besar pengaruh masing-masing variabel independen terhadap variabel dependen
47
48
No Resp Hasil produksi Curahan tenaga kerja (HKP)
Modal
1 2000 2 2750
2 1500 1.75 1750
3 3000 3.25 4250
4 1250 1 1500
5 2500 2.25 3000
6 3500 3.5 4000
7 2750 2.8 3250
8 1750 2 2250
9 2500 2.5 3000
10 3450 3.6 4000
11 3000 3.3 3750
12 4500 4.2 5000
13 4750 4.5 6000
14 2000 2 2500
15 2500 2.4 3000
Langkah-Langkah pada Program SPSS
• Buka data view pada SPSS data editor
• Ketikkan data sesuai dengan variabelnya
• Klik Analyze - Regression - Linear
• Klik variabel hasil produksi dan masukkan ke kotak Dependent, kemudian klik variabel
curahan TK dan modal kemudian masukkan ke kotak Independent.
• Klik Statistics, klik Casewise diagnostics, klik All cases. Klik Continue
• Klik OK
49
Output SPSS
• Berdasarkan tabel model summary diperoleh nilai nilai
adjusted R
2=0.968 artinya 96.8% hasil produksi dapat
dijelaskan oleh variabel curahan tenaga kerja dan
modal, sedangkan sisanya 3.2% dijelaskan oleh variabel
lain yang tidak dimasukkan dalam model
• Dari uji Anova atau F test, diperoleh F hitung = 211.964 dengan signifikansi 0.000. Karena probabilitas (0.000) jauh lebih kecil dari α
= 0.05, maka model regresi dapat dipakai untuk memprediksi variabel dependent (Y)
• Atau variabel bebas/independent variable (curahan TK dan modal) secara bersama-sama berpengaruh terhadap hasil produksi
• Dari kedua variabel bebas yang dimasukkan ke dalam model regresi, keduanya berpengaruh signifikan terhadap hasil produksi, hal ini dilihat dari nilai signifikansi yang lebih kecil dari 0.05
• Persamaan regresinya:
Y = -83.742 + 529.159 X1 + 0.410X2
• Konstanta sebesar -83.742 menyatakan bahwa jika variabel independen dianggap konstan, maka rata-rata hasil produksi sebesar -83.742 satuan
• Koefisien regresi curahan TK sebesar 529.159 menyatakan bahwa setiap penambahan curahan TK sebesar 1 HKP akan meningkatkan hasil produksi sebesar 529.159 satuan
• Koefisien regresi modal sebesar 0.410 menyatakan bahwa setiap penambahan modal 1 satuan akan meningkatkan hasil produksi sebesar 0.410 satuan
Contoh Regresi Berganda
• Sebuah penelitian dilakukan untuk mengetahui apakah ada pengaruh makanan ikan (tiap hari dalam seminggu) [X
1] dan panjang ikan (mm) [X
2] terhadap berat ikan (kg) [Y]
No X1 X2 Y
1 8 115 39
2 10 120 42
3 7 100 35
4 12 135 46
5 9 120 40
6 10 125 41
7 7 98 34
8 8 103 37
9 11 131 45
10 8 100 36
11 10 120 41
12 8 105 38
13 12 138 47
14 9 122 40
Contoh Regresi Berganda :
seorang manajer pemasaran PT “ABC” ingin mengamati hubungan antara HARGA JUAL, BIAYA IKLAN dengan VOLUME PENJUALAN produknya. Untuk itu diamati secara random data tentang harga jual dan volume penjualan selama 10 minggu sbb :
Pertanyaan : (a). Adakah hubungan antara Harga Jual, Biaya Iklan dan Volume Penjualan ?; (b) Bagaimana Pengaruh Harga Jual, Biaya Iklan terhadap Volume Penjualan ?
MINGGU HARGA (RIBUAN RP) IKLAN (RATUSAN RIBU RP) VOLUME (RIBUAN UNIT)
1 1,30 9 10
2 2,00 7 6
3 1,70 5 5
4 1,50 14 12
5 1,60 15 10
6 1,20 12 15
7 1,60 6 5
8 1,40 10 12
9 1,00 15 17
10 1,10 21 20
Contoh : Faktor utama yang mempengaruhi produktivitas padi tadah hujan adalah curah hujan dan dosis pemupukan. Berbasis data yang telah dikumpulkan, seseorang ingin mengetahui seberapa besar curah hujan dan pemupukan berpengaruh terhadap produktivitas padi.
PRODUKSI PADI (KUINTAL) (Y)
CURAH HUJAN (mm/hari) (X1)
PEMUPUKAN (kg/ha) (X2)
24 80 30
21 75 20
28 120 30
22 60 27
28 110 32
27 105 31
26 80 28
28 110 37
34 150 43
30 100 40
25 83 30
27 97 33
15 42 15
22 70 20
25 75 28
Analisis Korelasi
Pengertian:
• Analisis Korelasi adalah metode statistika yang digunakan untuk menentukan kuatnya atau derajat hubungan linier antara dua variabel atau lebih. Semakin nyata hubungan linier (garis lurus), maka semakin kuat atau tinggi derajat hubungan garis lurus antara kedua variabel atau lebih.
• Analisis korelasi adalah teknik kuantitatif yang digunakan untuk mengukur keeratan hubungan atau korelasi antara dua variabel atau lebih.
• Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara dua variabel dan jika ada hubungan, bagaimana arah hubungan dan seberapa besar hubungan tersebut
56
• Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain analisis korelasi tidak membedakan antara variabel dependent dengan variabel independent.
• Ukuran untuk derajat hubungan garis lurus ini dinamakan koefisien korelasi.
• Sama dengan statistika parametrik, analisis korelasi pada Statistika Nonparametrik juga mempelajari apakah ada hubungan antara dua variabel atau lebih. Dan jika ada hubungan yang signifikan, seberapa erat hubungan tersebut . Hanya pada korelasi non parametrik, data atau variabel yang akan diuji dan diukur korelasinya adalah data nominal atau ordinal.
57
Korelasi diukur dengan dua tahap, yaitu:
1. Tanda (+) atau (–) . Jika korelasi positif, berarti hubungan searah, artinya jika variabel X naik, maka variabel Y akan naik atau jika variabel X turun, maka variabel Y juga turun. Sebaliknya jika tanda (-), artinya jika variabel X naik, maka variabel Y akan turun.
2. Besar korelasi : Besar korelasi berada di antara -1---- 0 ---- +1. Jika 0 berarti tidak ada hubungan sama sekali, sedangkan jika ±1 berarti ada hubungan yang sempurna antara kedua variabel tersebut.
58
• Untuk menentukan keeratan korelasi antar variabel diberikan patokan:
Nilai r Kriteria
0.81 – 1.00 Sangat tinggi 0.61 – 0.80 Tinggi
0.41 – 0.60 Cukup 0.21 – 0.40 Rendah
0.00 – 0.20 Sangat rendah
Korelasi : hubungan keterkaitan antara dua atau lebih variabel.
Angka koefisien korelasi ( r ) bergerak -1 ≤ r ≤ +1
NOL
tidak ada atau tidak menentunya hubungan dua variabel contoh : pandai biologi dan menyanyi ; pandai biologi dan tidak bisa menyanyi ; tidak pandai biologi dan tidak bisa menyanyi
→ korelasi nol antara biologi dengan menyanyi POSITIF
makin besar nilai variabel X menyebabkan makin besar pula nilai variabel Y
Contoh : makin tinggi harga barang , makin tinggi jumlah barang yang ditawarkan
NEGATIF
makin besar nilai variabel X menyebabkan makin kecil nilai variabel Y
contoh : makin tinggi harga
barang, Makin sedikit jumlah
barang yang diminta
Jenis-jenis koefisien korelasi 1. Koefisien korelasi pearson
2. Koefisien korelasi rank spearman 3. Koefisien korelasi kontingensi
4. Koefisien penentu (koef. Determinasi)
Korelasi Product Moment Pearson
Tujuan :
• Menganalisis apakah di antara kedua variabel terdapat hubungan, dan jika ada hubungan bagaimana arah hubungan dan berapa besar hubungan tersebut. Digunakan jika data variabel kontinyu dan kuantitatif
• Ukuran asosiasi antara dua variabel yang mempunyai skala ukur interval atau rasio
Kegunaan Korelasi Product Moment Pearson :
• Untuk menyatakan ada atau tidaknya hubungan antara variabel X dengan variabel Y.
• Untuk menyatakan besarnya sumbangan variabel satu terhadap yang lainnya yang dinyatakan dalam persen.
Asumsi :
• Data berdistribusi Normal
• Variabel yang dihubungkan mempunyai data linear.
• Variabel yang dihubungkan mempunyai data yang dipilih secara acak.
• Variabel yang dihubungkan mempunyai pasangan yang sama dari subyek yang sama pula (berpasangan).
• Variabel yang dihubungkan mempunyai data interval atau rasio.
• Koefisien korelasi tidak memperlihatkan adanya
hubungan sebab akibat antara variabel-variabel
yang diukur
Langkah-langkah Menghitung Koefisien Korelasi Pearson
1. Tulis Ho dan H1 dalam bentuk kalimat.
2. Tentukan taraf signifikansi (α) 3. Statistik uji : korelasi pearson
Buat tabel sebagai berikut:
No X X2 Y Y2 XY
1 2
ΣX ΣX2 ΣY ΣY2 ΣXY
Cari r hitung
Cari r tabel dengan dk = n-2
4. Tentukan wilayah kritis (daerah penolakan Ho)
• Jika r hitung ≥ r tabel , maka Ho ditolak Atau
• t < –tα/2(n-2) atau t > tα/2(n-2) → dwi arah
• t ≥ tα,(n-2) → eka arah 5. Buatlah kesimpulan.
Dimana :
ΣXY = jumlah perkalian X dan Y ΣX2 = jumlah kuadrat X
ΣY2 = jumlah kuadrat Y N = banyak pasangan nilai
• Pengujian lanjutan yaitu uji signifikansi yang berfungsi apabila peneliti ingin mencari makna hubungan variabel X terhadap Y, maka hasil korelasi PPM tersebut diuji dengan uji Signifikansi dengan rumus :
• keterangan: thitung = Nilai t
• r = Nilai Koefisien korelasi
• n = Jumlah Sampel
• Kaidah pengujian :
• Jika thitung ≥ ttabel, maka tolak Ho artinya korelasi kedua variabel signifikan dan
• Jika thitung ≤ ttabel, terima Ho artinya korelasi kedua variabel tidak signifikan.
r 2 1
2 n
r hitung
t
−
= −
Contoh:
• Seorang peneliti ingin mengetahui hubungan/korelasi antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar. C. Kabat et al (11.3) memperoleh data yang berasal dari 14 ayam betina. Hitunglah koefisien korelasinya dan apakah korelasi tsb signifikan pada alpha 5%?
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Telur yg dihasilkan
39 29 46 28 31 25 49 57 51 21 42 38 34 47
Ovulated follicles
37 34 52 26 32 25 55 65 44 25 45 26 29 30
Jawab:
a. Penentuan hipotesis:
Ho: tidak terdapat hubungan / korelasi antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar H1 : Terdapat hubungan antara penggunaan ovulated follicles dalam
penentuan telur yang dihasilkan oleh ayam pegar Atau:
b. Taraf nyata : α = 5%
c. Uji statistik : korelasi pearson d. Wilayah kritis:
• Jika r hitung ≥ r tabel , maka Ho ditolak Atau
• t < –tα/2(n-2) atau t > tα/2(n-2) → dwi arah
• t ≥ tα,(n-2) → eka arah
0 r
:
0 r
:
1 0
=
H
H
8211 .
0
909 .
25088 20601
=
= r
Uji signifikansi:
r2 1
2 n r hitung t
−
= −
8211
2. 0 1
2 14 8211 .
0
−
= − t
hit984 .
4 571 .
0
844 .
2
=
hit
= t
e. Keputusan dan kesimpulan :
t-hit = 4.985 dan t-tabel(0.025,12) = 2.179, maka t-hit > t-tab ➔ tolak H0, artinya terdapat hubungan yang signifikan antara penggunaan ovulated follicles dalam penentuan telur yang dihasilkan oleh ayam pegar
2 2
( 14 * ( 21807 ) ( 525 ) )
537 (
) 22113 (
* 14 (
) 525 )(
537 (
) 21609 (
14
−
−
= − r
r tabel (0.05,db=12) = 0.532
No X X2 Y Y2 XY
1 39 1521 37 1369 1443
2 29 841 34 1156 986
3 46 2116 52 2704 2392
4 28 784 26 676 728
5 31 961 32 1024 992
6 25 625 25 625 625
7 49 2401 55 3025 2695
8 57 3249 65 4225 3705
9 51 2601 44 1936 2244
10 21 441 25 625 525
11 42 1764 45 2025 1890
12 38 1444 26 676 988
13 34 1156 29 841 986
14 47 2209 30 900 1410
Jml 537 22113 525 21807 21609
Langkah pengujian dgn SPSS
1) Klik File – New – Data
2) Klik Variabel View (Kanan bawah)
3) Isikan nama variabel pada kolom name (Misal X untuk ovulated follicles dan Y untuk telur yg dihasilkan)
4) Kolom Type, Klik Numeric karena penghitungannya berupa angka.
5) Kolom width isikan 8 dan Decimals isikan 2
6) Kolom Label isikan keterangan untuk melengkapi kolom Name (Misal: ovulated follicles dan telur yg dihasilkan).
7) Klik Data View – Isikan data tersebut diatas, 14 data pada kolom X untuk varibael : ovulated follicles dan 14 data pada kolom Y untuk variabel telur yg dihasilkan.
8) Klik File – Save untuk menyimpan data (beri nama yang anda inginkan, misal : ovulated follicles ).
9) Klik Analyze – Correlation – Bivariate.
10) Klik variabel X dan Y – pindahkan ke kotak Variables 11) Pilih Pearson pada kolom Correlation Coefficents 12) Pilih Two Tailed pada kolom Test of Significant 13) Klik Continue
14) Klik OK
Dari hasil analisis korelasi (r) didapat korelasi antara ovulated follicles dengan telur yang dihasilkan (r) adalah 0,821. Hal ini menunjukkan bahwa terjadi hubungan yang kuat antara ovulated follicles dengan telur yang dihasilkan . Sedangkan arah hubungan adalah positif karena nilai r positif, berarti semakin tinggi ovulated follicles maka semakin tinggi telur yang dihasilkan
Contoh
• Data penelitian mengenai bunga nicotiana terdiri atas panjang tabung=T dan panjang cabang=L. Hitung koefisien korelasi antara T dan L
T L T L
49 27 41 22
44 24 48 25
32 12 45 23
42 22 39 18
32 13 40 20
53 29 34 15
36 14 37 20
39 20 35 13
37 16 36 15
45 21 41 20
UJI KORELASI RANK SPEARMAN
(The Spearman Rank Correlation Coefficient : rs)
• Untuk dua variabel berjenis ordinal, ukuran asosiasinya adalah koefisien korelasi rank Spearman
Spesifikasi Uji Korelasi Rank Spearman:
a. Mempunyai keampuhan yang hampir sama dengan korelasi Pearson
b. Nilai koefisien antara -1 s.d +1 c. Skala ukur minimal ordinal
Hipotesis :
Ho : ρ = 0 , tdk ada korelasi H1 : ρ ≠ 0 , terjadi korelasi
74
Prosedur Analisis:
1. Susun data sebagai berikut :
2. Data X diranking dari 1 s.d. N 3. Data Y diranking dari 1 s.d. N
N = banyaknya sampel
di = selisih ranking X dengan ranking Y
No Data Ranking di di
2X Y X Y
1 2 . . n
75
3. Uji Statistik
a. Untuk tanpa rank kembar atau rank kembar hanya sedikit:
b. Untuk rank kembar yang cukup banyak:
t = banyak kembaran data 4. Pengujian Signifikansi
a. Untuk 4≤ N ≤ 30 , pergunakan Tabel rs (eka arah) b. Untuk N > 30, pergunakan Tabel t-student)
N N
di 1 6
rs 3 2
− −
=
x
2= N
312 − N − T
x
y2 = N312−N − Ty12 t T t
3 X
= −
12 t T t
3 y
= −
+ −
=
2 22 2
2
*
2 x y
d y
r
sx
i76
5. Kaidah keputusan:
a. Tabel rs akan meragukan dipergunakan jika H1 dwi arah, untuk H1 eka arah:
Tolak Ho jika rs ≥ rs α Terima Ho jika rs < rs α
b. Pergunakan Tabel t, kita harus menghitung dulu nilai t :
Bandingkan dengan tabel t pada db = n-2 dan sesuaikan dengan α serta H1
Eka arah --- baris informasi atas Dwi arah --- baris informasi bawah Tolak Ho jika tr ≥ tα (n-2)
Terima Ho jika tr < tα (n-2)
s2
r
1 r
2 t N
−
= rs −
77