BAB V
ANALISIS REGRESI
Setelah mempelajari mahasiswa diharapkan dapat : (1) Menghitung parameter regresi
(2) Melakukan estimasi dan uji parameter regresi (3) Menemukan model regresi yang tepat
Dalam kehidupan sering ditemukan adanya sekelompok peubah yang diantaranya terdapat hubungan, misalnya Kadar ter dari suatu proses kimia tergantung temperatur, panjang berat bayi yang baru lahir tergantung dari berat badanya ketika lahir. Hubungan yang umum terjadi antara peubah bebas xi yang galat pengukurannya dapat diabaikan atau dikendalikan dalam percobaan dengan peubah terikat (respon Y) tunggal yang tidak dapat dikontrol. Persoalan utama dalam bidang statistika adalah menemukan taksiran terbaik peubah terikat apabila diketahui nilai dari perubah bebasnya.
A. REGRESI SEDERHANA
Setiap nilai peubah bebas xi terdapat satu nilai yi tunggal tetapi bila sampel
ditambah dengan nilai
x
i yang sama dapat diyakini terdapat nilaiy
i yang belumtentu sama. Hasil survey untuk meneliti hubungan antara tinggi badan dengan berat badan mendapatkan bahwa tinggi badan A 160 cm berat badannya 52 kg, tetapi si B yang memiliki tinggi badan yang sama dengan B memiliki berat badan 49 kg. Dalam hal ini yi merupakan nilai peubah acak berat badan (Yi) atau Y|xi dengan nilai
rata-rata
µ
Y|x dan variansiσ
Y2|x. Apabila terdapat hubungan linier antarax
i dany
i, dinyatakan dalam hubunganµ
Y|x=α
+β
x. Koefisienα
danβ
merupakan dua parameter yang ditaksir dari data sampelY
ˆ
=
a
+
bx
(lihat gambar).
(
x
i,
y
i)
Y
ˆ
=
a
+
bx
Dari setiap hasil pengamatan (
x
i,
y
i) dapat ditarik sebuah garisY
ˆ
=
a
+
bx
yang dianggap cocok untuk menggambarkan hubungan antara kedua variabel. Beberapa titik pengamatan akan memiliki galat terhadap model yang diperkirakan tersebut. Garis yang dianggap paling tepat menggambarkan hubungan kedua variabel tersebut adalah yang memiliki Jumlah Kuadrat Galat/Eror (JKG) minimun atau∑
∑
∑
= = = − − = − = = n i n i i i i n i i y y y a bx e JKG 1 1 2 2 1 2 ) ( ) ˆ ( )( minimum. Kondisi tersebut
tercapai apabila ( )=0 ∂ ∂ a JKG dan ( )=0 ∂ ∂ b JKG .
Dari keduua persamaan yang dihasilkan akan dapat dihasilkan parameter a dan b. ( ) 0 1 1
∑
∑
= = = − − = ∂ ∂ n i n i i i an b x y a JKG ... (1) ( ) 0 1 1 1 2∑
∑
∑
= = = = − − = ∂ ∂ n i n i n i i i i iy a x b x x b JKG ... (2)1. Menetapkan Nilai Parameter
Bila diketahui sampel
{
(
x
i,
y
i),
i
=
1
,
2
,
,
,
,
,
n
}
maka taksiran kuadrat terkecil a dan b dari koefisien regresiα
danβ
dihitung dengan menggunakan rumus
∑
∑
∑
∑
∑
= = = = = − − = n i i n i i n i n i n i i i i i x x n y x y x n b 1 2 1 2 1 1 1 ) ( ) )( ( , dan n x b y a n i n i i i∑
∑
= = − = 1 1 Bukti :Persamaan awal Dikali dengan Persamaan Baru 0 1 1
∑
∑
= = = − − n i n i i i an b x y∑
= n i i x 1 0 ) ( 1 1 2 1 1∑
∑
∑
∑
= = = = = − − n i n i i n i i i n i i y an x b x x 0 1 1 1 2∑
∑
∑
= = = = − − n i n i n i i i i iy a x b x x n 0 1 1 1 2∑
∑
∑
= = = = − − n i n i n i i i i iy an x bn x x n 0 ) ( 1 1 2 2 1 1∑
∑
∑
∑
∑
= = = = = + − − n i n i n i i i i n i i i n i i y n x y b x bn x x
∑
∑
∑
∑
∑
= = = = = − − = n i i n i i n i n i n i i i i i x x n y x y x n b 1 2 1 2 1 1 1 ) ( ) )( ( ………..> (terbukti) Jika 0 1 1∑
∑
= = = − − n i n i i i an b x y y b x an n i n i i i∑
∑
= = = − 1 1 n x b y a n i n i i i∑
∑
= = − = 1 1 …………..> (Terbukti)Apabila digunakan notasi berikut ini,
∑
∑
∑
∑
∑
− = − = − = = = = 2 1 2 2 1 1 2 2 ) ( n i i i n i i n i i i xx n x x n x x x x J 2 1 1 2 2 1 1 1 2 2)
(
∑
∑
∑
∑
∑
= = = = =
−
=
−
=
−
=
n i n i i i n i i n i n i i i yyn
y
y
n
y
y
y
y
J
∑
∑
∑
∑
∑
∑
∑
= = = = = = − = − = − − = n i n i i n i i i i n i i n i i n i i i i i xy n x y x y n y x y x y y x x J 1 1 1 1 1 1 ) )( ( , maka∑
∑ ∑
∑
∑
= = = = − = + − n i n i i i i i n i i n i i bn x n x y x y x b 1 1 1 2 2 1 ) (Teorema 1. Parameter b dari regersi y= ax + b dapat dihitung dari xx xy J J b=
Teorema 2. Galat akan memiliki distribusi dengan Variansi 2 2 2 − − = − = n bJ J n JKG S yy xy Bukti :
∑
∑
∑
= = = − − = − = = n i n i i i i n i i y y y a bx e JKG 1 1 2 2 1 2 ) ( ) ˆ ( = − − − =∑
= n i i i y b x x y JKG 1 2 )] ( ) [(∑
∑
∑
= = = − + − − − − = n i n i n i i i i i y b x x y y b x x y JKG 1 1 1 2 2 2 2 ( )( ) ( ) ) ( xy yy xx xx xy xy xx xy yy xx xy yy J J bJ J J J J J J J b bJ J JKG = − + − = + − = 2 2 2 2 Contoh V.1Hasil Ujian Tengah Semester matakuliah Kesehatan Mental semester ganjil 2006 dan Prestasi Akademik yang diukur dari Indeks Prestasi Kumlatif (IPK) sampai dengan semester genap 2005/06 mahasiswa Psikologi Universitas X ditunjukkan dalam Tabel V-6
Tabel V-1 Nilai UTS Matakuliah Kesehatan Mental dan IPK
Nama Nilai UTS IPK Nama Nilai UTS IPK
Rorial 40 1.99 Elisabeth 72 3.55
Erlinda 24 2.68 Yuliani 60 3.61
Mardani 36 189 Lauren Ranum 52 3.08
Dwi Novilia 60 3.0 Janti Ria 52 2.99
Deni Romdoni 36 2.68 Sawitri 56 2.44
Winarni Zulkarnaen 56 2.05 Syahnu Widjaja 52 2.36
Helen 52 3.10 Eka Persiti 60 3.15
Masroni 44 2.92 Ninia Wula 60 2.96
Indah Puspita 68 3.41 Emilia Novianti 28 2.88
Wahyu Dwi 28 2.10 Raja Sapta 28 2.80
Wahyudin 44 2.42
Apabila diasumsikan bahwa perolehan nilai UTS (
y
1) dipengaruhi oleh nilai IPK (i
x ) dalam hubungan yang linier y =a+bx, maka dapat dihitung parameter 18 . 15 17 . 105 84 , 596 . 1 96 . 370 . 3 13 . 476 . 3 48 . 524 . 58 32 , 121 . 60 ) 06 . 58 ( ) 53 , 165 ( 21 ) 008 . 1 )( 06 . 58 ( ) 92 , 862 . 2 ( 21 2 − = = − = − − = b
sehingga persamaan regresi menjadi y=6.03+15.18x. Dengan persamaan ini, dapat diperkirakan perolehan nilai UTS matakuliah kesehatan mental apabila IPK seorang mahasiswa 4, yaitu y =6.03+15.18(4)=66.75
Nomor
Sampel IPK (X) UTS (Y) X Y X
2 Y2 1 1.99 40 79.60 3.96 1600 2 2.68 24 64.32 7.18 576 3 1.89 36 68.04 3.57 1296 4 3.0 60 180.00 9.00 3600 5 2.68 36 96.48 7.18 1296 6 2.05 56 114.80 4.20 3136 7 3.10 52 161.20 9.61 2704 8 2.92 44 128.48 8.53 1936 9 3.41 68 231.88 11.63 4624 10 2.10 28 58.80 4.41 784 11 2.42 44 106.48 5.86 1936 12 3.55 72 255.60 12.60 5184 13 3.61 60 216.60 13.03 3600 14 3.08 52 160.16 9.49 2704 15 2.99 52 155.48 8.94 2704 16 2.44 56 136.64 5.95 3136 17 2.36 52 122.72 5.57 2704 18 3.15 60 189.00 9.92 3600 19 2.96 60 177.60 8.76 3600 20 2.88 28 80.64 8.29 784 21 2.80 28 78.40 7.84 784 Jumlah 58.06 1008 2.862.92 165.53 52.288 Rata-rata 2.76 48
Kuat hubungan antara variabel IPK dengan UTS matakuliah kesehatan mental adalah = − = − − − = 984 . 81 17 . 105 48 . 524 . 58 32 , 121 . 60 ) 008 . 1 288 . 52 21 )( 06 . 58 53 . 165 21 ( ) 008 . 1 )( 06 . 58 ( ) 92 , 862 . 2 ( 21 2 2 x x x r 0.54 36 . 2936 84 . 1596 = =
r (hubungan agak rendah).
1. Menetapkan selang kepercayaan
α
danβ
Suatu selang kepercayaan (1-
α
)100% untuk parameterα
dalam persamaan garis regresiµ
Y|x =α
+β
xadalahxx n i i xx n i i nJ x s t a nJ x s t a
∑
∑
= = + < < − 1 2 2 / 1 2 2 / α αα
Dalam rumus ini tα/2menyatakan nilai distribusi t dengan derajat kebebasan n-2
Suatu selang kepercayaan (1-
α
)100% untuk parameterβ
dalam persamaan garis regresiµ
Y|x =α
+β
xadalahxx xx J s t b J s t b− α/2 <
β
< + α/2Dalam rumus ini tα/2menyatakan nilia distribusi t dengan derajat kebebasan n-2
Dalam contoh IV-1 diatas, diperoleh nilai 5.01
21 06 . 58 53 . 165 2 = − = xx J , 04 . 76 21 ) 008 . 1 )( 06 . 58 ( 92 , 862 . 2 − = = xy J dan 3.904 21 008 . 1 288 . 52 2 = − = yy J ,
sehingga diperoleh besaran
12
.
03
2
21
04
.
76
18
.
15
904
.
3
=
−
−
=
x
s
. Dengandemikian estimasi parameter
α
dari contoh IV-1 dengan taraf siginifikasi10
.
0
=
α
dan dengan derajat kebebasanν
=
21
−
2
=
19
adalah01 . 5 21 53 . 165 03 . 12 328 . 1 27 . 10 01 . 5 21 53 . 165 03 . 12 328 . 1 27 . 10 x x x x + < < −
α
,atau31
.
30
76
.
9
<
<
−
α
Estimasi parameter
β
untuk contoh IV-1 dengan taraf siginifikasi dan derajat kebebasan yang sama adalah01
.
5
)
07
.
12
(
328
.
1
18
.
15
01
.
5
)
07
.
12
(
328
.
1
18
.
15
−
<
β
<
+
, atau 8.02<β
<22.34Suatu selang kepercayaan (1-
α
)100% untuk rataan respon0 |x Y
µ
diberikan oleh xx x Y xx J x x n t y J x x n t y 2 0 2 / 0 | 2 0 2 / 0 ) ( 1 ˆ ) ( 1 ˆ 0 − + + < < − + − αµ
α2. Uji Hipotesa
α
danβ
Untuk menguji H0:
α
=α
0 dibandingH
1:α
≠α
0 digunakan distribusi t dengan derajat kebebasan n-2 untuk mendapatkan daerah kritis dan kemudian mendasarkan keputusan pada nilai∑
=−
=
n i xx inJ
x
s
a
a
t
1 2 0/
Untuk menguji H0:
β
=β
0 dibandingH
1: sesuaipersoalan digunakan distribusi t dengan derajat kebebasan n-2 untuk mendapatkan daerah kritis dan kemudian mendasarkan keputusan pada nilaixx J s b t / 0