ANALISIS
REGRESI DAN KORELASI
PS ITP FP UNS Semester Genap 2019/2020
Dalam ilmu statistika, teknik yang umum digunakan untuk
menganalisis hubungan antara dua atau lebih variabel adalah analisis regresi.
Model matematis dalam
menjelaskan hubungan antar variabel dalam analisis regresi menggunakan persamaan
regresi.
Perbedaan dasar antara korelasi dan regresi
Korelasi hanya menunjukkan sekedar
hubungan.
Dalam korelasi variabel tidak ada istilah
tergantung dan variabel bebas.
Regresi
menunjukkan hubungan
pengaruh.
Dalam regresi
terdapat istilah
tergantung dan
variabel bebas.
Dalam suatu persamaan regresi terdapat 2 macam variabel, yaitu:
VARIABEL DEPENDEN (variabel tak bebas) adalah variabel yang nilainya bergantung dari variabel lain.
Biasanya dinyatakan dengan Y.
VARIABEL INDEPENDEN (variabel bebas) adalah variabel yang nilainya tidak bergantung dari variabel lain.
Biasanya dinyatakan dengan X.
PRINSIP DASAR
Dalam membangun suatu persamaan regresi
antara variabel dependen dengan variabel independennya mempunyai sifat hubungan sebab akibat
(hubungan kausalitas = causal
relationship), baik yang didasarkan pada teori, hasil penelitian
sebelumnya, ataupun yang
didasarkan pada penjelasan logis tertentu.
ANALISIS KORELASI SEDERHANA
Adalah teknik statistik yang digunakan untuk mengukur keeratan hubungan (korelasi)
antara dua variabel.
Ukuran yang menyatakan keeratan
hubungan adalah koefisien korelasi.
Koefisien ini bernilai antara –1 sampai dengan +1.
Sebuah langkah awal yang sangat
bermanfaat dalam melihat hubungan antara dua variabel adalah menampilkan informasi data ke dalam bentuk diagram pencar.
Koefisien korelasi:
dimana xx yy
xy
J J
r J
n
Y XY X
Jxy
(
)(
)n X X
Jxx
2
2 (
)
n Y Y
J yy
2
2 (
)
Koefisien Determinasi
Dihitung dengan mengkuadratkan koefisien korelasi (r
2).
Menyatakan besarnya kontribusi
variabel X terhadap perubahan
variabel Y.
Uji signifikansi koefisien korelasi
Hipotesis nol dan hipotesis alternatifnya adalah:
H
0: = 0 H
1: 0 Statistik uji :
dengan
1 2
2 r n t r
2
n
v
• Daerah kritis, H
0ditolak bila atau t t / 2 , v
• Kesimpulan
t v
t / 2 ,
Analisis Regresi Linier Sederhana
Adalah suatu teknik yang digunakan untuk
membangun suatu persamaan garis lurus dan menentukan nilai perkiraannya
Hanya ada 1 variabel X dan 1 variabel Y.
Suatu persamaan garis lurus yang menyatakan hubungan antara variabel bebas X dan
variabel tidak bebas Y, dan digunakan untuk memperkirakan nilai Y berdasarkan nilai X disebut sebagai persamaan regresi
Metode kuadrat terkecil
Digunakan untuk menentukan persamaan linier estimasi, berarti memilih satu garis linier dari beberapa kemungkinan garis linier yang dapat dibuat dari data yang ada yang mempunyai
kesalahan (error) paling kecil dari data aktual dengan data estimasinya.
Kriteria ini dikenal dengan prinsip kuadrat terkecil (principle of least square).
Prinsip pemilihan garis regresi ini adalah “pilih garis yang mempunyai jumlah kuadrat deviasi nilai observasi Y terhadap nilai Y prediksinya yang minimum sebagai garis regresi yang paling baik”
Persamaan regresi estimasi yang baik secara umum
dimana
bX a
Y ˆ
adalah nilai estimasi Y berdasarkan X yang dipilih.
a adalah titik potong Y, merupakan nilai perkiraan bagi Y ketika X = 0.
b adalah kemiringan garis, atau perubahan rata-rata pada setiap satu unit perubahan (baik naik atau turun) pada variabel X.
X adalah sembarang nilai variabel bebas yang dipilih
Y ˆ
Nilai a dan b adalah:
n X X
n Y XY X
J b J
xx xy
2
2
( )
) )(
(
n
) X b(
Y
Y b X
a
Pengujian terhadap Koefisien Regresi
Menentukan H
0dan H
1
H
0: = 0.
H
1: 0.
Taraf nyata
Statistik uji : Tabel Anova
Daerah kritis : jika F hitung > F
; (1, n-2)maka H
0ditolak
Kesimpulan
Tabel Anova
Sumber Variasi db Jumlah Kuadrat
Kuadrat rata-rata
F hitung
Regresi 1 JKR JKR / 1 JKR / s2
Galat n – 2 JKG s2 = JKG / (n-
2)
Total n - 1 JKT
JKR = b J
XY
JKT = J
YY
JKG = JKT - JKR
Seorang manajer pemasaran akan meneliti apakah terdapat pengaruh iklan terhadap penjualan pada perusahaan-perusahaan di Kabupaten Sukoharjo.
Untuk kepentingan penelitian tersebut, diambil 8 perusahaan sejenis yang telah melakukan promosi.
Latihan 1
Penjualan (Y) 64 61 84 70 88 92 72 77
Promosi (X) 20 16 34 23 27 32 18 22
Dalam suatu praktikum Fisika Dasar diperoleh data yang menghubungkan variabel bebas X dan variabel terikat Y seperti ditunjukkan dalam tabel dibawah ini:
Latihan 2
Uji ke- X Y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
Analisis Regresi Linier Berganda
Bentuk umum:
k k
X b X
b X
b a
Y ˆ ...
2 2
1 1
Membangun Persamaan Regresi Linier Berganda dengan Manual
Besarnya koefisien a , b
1, dan b
2dapat ditentukan dengan
menggunakan tiga persamaan berikut ini
Y na b1 X1 b2 X2
X1Y a X1 b1 X12 b2 X1X22 2 2
2 1 1
2
2
X Y a X b X X b X
Persamaan di atas dapat dinyatakan dalam persamaan matriks
Y X
Y X
Y
b b
a
X X
X X
X X X
X
X X
n
2 1 2
1 2
2 2
1 2
2 1 2
1 1
2 1
A b H
Jadi A b = H b = A
-1H ,
dimana A
-1adalah invers dari A.
Hubungan antara pendapatan, pengeluaran, dan banyaknya anggota keluarga
Contoh 1:
VARIABEL RUMAH TANGGA
I II III IV V VI VII
Pengeluaran (Y) 3 5 6 7 4 6 9
Pendapatan (X1) 5 8 9 10 7 7 11
Jumlah Anggota Keluarga (X2) 4 3 2 3 2 4 5
Membangun Persamaan Regresi Linier Berganda dengan Komputer
The regression equation is
y = - 11.5 + 1.47 x1 + 6.59 x2
Predictor Coef StDev T P Constant -11.452 9.231 -1.24 0.255 x1 1.4671 0.5491 2.67 0.032 x2 6.588 4.550 1.45 0.191 S = 7.889 R-Sq = 88.7% R-Sq(adj) = 85.5%
Analysis of Variance
Source DF SS MS F P Regression 2 3427.9 1714.0 27.54 0.000
Error 7 435.7 62.2
Total 9 3863.6
Koefisien Korelasi Linier Berganda (KKLB)
Jika ingin diketahui kuatnya hubungan antara variabel Y dengan beberapa
variabel X lainnya.
Apabila KKLB dikuadratkan, maka akan diperoleh Koefisien Penentuan
(Koefisien Determinasi), yaitu suatu nilai untuk mengukur besarnya
sumbangan dari beberapa variabel X terhadap variasi (naik turunnya)
variabel Y.