Korelasi & Regresi
Oleh:
Klasifikasi Pemodelan Regresi
REGRESI
NOMINAL, ORDINAL INTERVAL, RASIO
REGRESI LOGISTIK REGRESI LINIER SEDERHANA
SKALA PENGUKURAN DATA PADA VARIABEL RESPON
REGRESI ORDINAL/ MULTINOMIAL LOGIT
REGRESI BETA BINOMIAL
REGRESI LINIER BERGANDA
REGRESI PROBIT
Probabilistic interpretation
0 20
0
Model Regresi:
Satu variabel independent Regresi Linear Sederhana
Lebih dari satu variabel independent Regresi Linear Berganda.
Tujuan:
•
mendapatkan pola hubungan secara
matematis antara variabel X dan Y
•
mengetahui besarnya perubahan variabel X
terhadap Y
Tahap-Tahap dalam Analisis Regresi
1. Plot data
identifikasi bentuk hubungan secara grafik
2. Koefisien Korelasi
identifikasi hubungan linear dengan suatu angka
3. Pendugaan (estimasi) model regresi
4. Evaluasi (diagnostic check) kesesuain model regresi 5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu
n i i n i i n i i i xy
y
y
x
x
y
y
x
x
r
1 2 1 2 1)
(
)
(
)
)(
(
, -1 rxy 1Korelasi :
. Hubungan antara dua variabel (misal X dengan Y)
Nilai Korelasi:
• Bila r = 0, atau mendekati 0,
Berarti hubungan antara variabel independen dengan variabel dependen sangat lemah atau tidak terdapat hubungan sama sekali.
• Bila r = 1, atau mendekati 1,
Berarti terdapat hubungan positif antara variabel independen dengan variabel dependen yang sangat kuat.
• Bila r = –1, atau mendekati – 1,
Berarti terdapat hubungan negatif antara variabel independen dengan variabel dependen yang sangat kuat.
n i i n i i n i i i y x xy xy Y n Y X n X Y X n Y X S S S r 1 2 2 1 2 2 1
Pengujian Koefisien Korelasi ( r ) Hipotesis Ho : = 0 H1 : 0 Statistik Uji
t
r n
r
o2
1
2 dimana : r = koefisien korelasin = jumlah sampel
Daerah Penolakan
Mencari nilai t tabel untuk tingkat signifikansi ( ) dan derajat bebas sebesar n-2. Sehingga | t0 | > t ( /2, n-2)
Kesimpulan:
Ho ditolak jika t0 > t ( /2, n-2) atau t0 < t ( /2,n-2) Ho diterima jika t0 > t ( /2,n-2) atau t0 < t ( /2,n-2)
Korelasi
n i i n i i n i i i y x xy xy Y n Y X n X Y X n Y X S S S r 1 2 2 1 2 2 1 0 10 20 0 20 40[start Matlab demo lecture2.m]
Plot antara X dengan Y
Korelasi
t
r n
r
o2
1
2Uji Korelasi
i
i
X
i
Y
dimana:
Y
i= variabel dependent/respon/output
X
i= variabel independent/prediktor/input/fixed
= intercept
i= slope/gradien/koefisien regresi
i
= unsur gangguan yang diasumsikan identik,
independen dan berdistribusi normal atau
i
~ IIDN(0,
2)
DENGAN Ordinary Least Squares (OLS):
Persamaan Regresi:
i
i
X
PENGUJIAN KOEFISIEN REGRESI SECARA SERENTAK
H
O: model tidak signifikan
H
1: model signifikan
Statistik Uji:
13
Problem
: Regresi Linear Sederhana
Process
(Model Regresi)
Input (X)
Output (Y)
Z1, Z2, …, Zq
F1, F2, …, Fq
Uncontrollable Factors
Controllable Factors
Harga Produk
Biaya Iklan, Jumlah Outlet, Area
Pema-saran dan faktor lain
yang dapat dikontrol dalam kondisi TETAP
Sales Produk
Bagaimana pengaruh harga terhadap sales suatu produk ?
Dapatkah meramal sales suatu produk berdasarkan harganya ?
Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain
Regresi Linier
0 10 20 30 40 0 10 20 30 20 22 24 26 T emp era ture 0 10 20 0 20 40[start Matlab demo lecture2.m]
Given examples
0 20 0 20 40 0 10 20 30 40 0 10 20 30 20 22 24 26 T emp era ture
Prediction
Ordinary Least Squares (OLS)
0 20 0Error or “residual”
Prediction
Observation
Probabilistic interpretation
0 20
0
Minimize the sum squared error
Sum squared error
Linear equation
Problem
: Data hasil pengamatan …
(continued) Minggu Sales (ribu unit) Harga (ribu rupiah) 1. 10 1.3 2. 6 2.0 3. 5 1.7 4. 12 1.5 5. 10 1.6 6. 15 1.2 7. 5 1.6 8. 12 1.4 9. 17 1.0 10. 20 1.1Pengamatan dilakukan dengan mengambil secara random data 10 minggu penjualan
Problem
:
MINITAB output …
(continued)MTB > Correlation 'Harga' 'Sales'.
Pearson correlation of Harga and Sales = -0.863
P-Value = 0.001
MTB > Regress 'Sales' 1 'Harga'
The regression equation is
Sales = 32.1 – 14.5 Harga
Predictor Coef SE Coef T P Constant 32.136 4.409 7.29 0.000 Harga -14.539 3.002 -4.84 0.001 S = 2.725 R-Sq = 74.6% R-Sq(adj) = 71.4% Analysis of Variance Source DF SS MS F P Regression 1 174.18 174.18 23.45 0.001 Residual Error 8 59.42 7.43 Total 9 233.60
Model Regresi Linier Berganda
)
X
,...,
X
,
X
(
f
Y
)
X
(
f
Y
n 2 1 i ki k i 2 2 i 1 1 0 iX
X
X
Y
...
dimana:
Y
i= variabel dependent/respon/output
X
i= variabel independent/prediktor/input/fixed
i= parameter/koefisien regresi
i
= unsur gangguan yang diasumsikan identik,
independen dan berdistribusi normal atau
R
SSR
SST
x
2100%
%
)
(
1
R
x
100
1
R
2 2 nnk11 KEGUNAAN:• Mengukur ketepatan atau kecocokan suatu garis regresi yang diterapkan terhadap suatu kelompok data hasil observasi. Makin besar nilai R2 dikatakan model regresi semakin tepat atau cocok,
sebaliknya makin kecil nilai R2 dikatakan model regresi tidak
tepat untuk mewakili data hasil observasi.
• Mengukur proporsi atau prosentase dari jumlah variasi Y yang dapat diterangkan oleh model regresi.
ry r r r r r y y y 1 2 1 1 1 2 12 2 2 122 , ( )( ) ry r r r r r y y y 2 1 1 1 2 1 12 1 2 122 , ( )( )
Korelasi parsial merupakan ukuran hubungan linier antara
variabel Y dengan X1 dan X2 dibuat tetap atau sebaliknya.
Nilai koefisien korelasi parsial r
y1,2artinya korelasi Y
dengan X1 dikontrol dengan X2.
r
y r r r r r y y y 1 2 1 1 1 2 12 2 2 122 , ( )( )r
y r r r r r y y y 2 1 1 1 2 1 12 1 2 122 , ( )( )IDENTIK
INDEPENDEN
RESIDUAL
i
i
i
Y
Y
e
DISTRIBUSI
NORMAL
• Penerapan metode kuadrat terkecil (Ordinary Least Squares/OLS) tidak memerlukan / membuat asumsi apapun mengenai distribusi pada residualnya. Asumsi pada residual yang diperoleh diharapkan mempunyai nilai (rata-rata) nol, tak berkorelasi dan mempunyai varians konstan. Dengan adanya asumsi ini, penaksir OLS memenuhi beberapa sifat statistik yang diinginkan, seperti ketidakbiasan (unbiased) dan varians minimum.
• Karena hal tersebut di atas dan tujuan penarikan kesimpulan mengenai persamaan regresi populasi, dalam konteks regresi biasanya resudal diasumsikan mengikuti distribusi normal.
• Pengujian ini dilakukan untuk mengetahui apakah residual dari model berdistribusi normal dengan mean nol dan varians 2.
DISTRIBUSI NORMAL
)
,
(
~
2
i
N
0
PEMERIKSAAN DISTRIBUSI NORMAL
1.
Tentukan residual e
idari persamaan regresi
2. Sortir e
idari urutan yang terkecil sampai yang besar
3. Hitung P
iyang sesuai dengan e
iyang telah disortir
%
)
,
(
100
n
5
0
i
P
i4. Plot P
idengan e
iJika pola tersebut membentuk sudut mendekati
PEMERIKSAAN IDENTIK (HOMOSKEDASTISITAS)
HETEROSKEDASTISITAS
Des criptive Statistics 1.19808 2.998614 104 .29611 .299745 104 .12470 .094526 104 .96362 .407539 104 .16785 .157325 104
Perubahan Laba Bank Gros s Prof it Margin
Interes t Margin on Loans Operating Ef f ic iency Ratio Ratio Non Perf orming
Loans to Total Loans
Mean Std. Deviation N
Apakah Y=Perubahan Laba Bank dipengaruhi
Oleh:X1 = Gross Profit Margin
X2 = Interest Margin on Loans
X3 = Operating Efficiency Ratio
Cor relations 1.000 .915 .873 .972 .854 .915 1.000 .984 .951 .967 .873 .984 1.000 .915 .990 .972 .951 .915 1.000 .881 .854 .967 .990 .881 1.000 . .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 . 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104 104
Perubahan Laba Bank Gros s Prof it Margin Interes t Margin on Loans Operating Ef f ic iency Ratio Ratio Non Perf orming Loans to Total Loans Perubahan Laba Bank Gros s Prof it Margin Interes t Margin on Loans Operating Ef f ic iency Ratio Ratio Non Perf orming Loans to Total Loans Perubahan Laba Bank Gros s Prof it Margin Interes t Margin on Loans Operating Ef f ic iency Ratio Ratio Non Perf orming Loans to Total Loans Pearson Correlation Sig. (1-tailed) N Perubahan Laba Bank Gros s Prof it Margin Interes t Margin on Loans Operating Ef f icienc y Ratio Ratio Non Perf orming Loans to Total Loans
ANOV Ab 889.232 4 222.308 596.244 .000a 36.912 99 .373 926.144 103 Regression Residual Total Model 1 Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), Ratio Non Perf orming Loans to Total Loans, Operating Ef f icienc y Ratio, Gross Prof it Margin, Interest Margin on Loans
a.
Dependent Variable: Perubahan Laba Bank b.
Model Sum m aryb
.980a .960 .959 .610612 .960 596.244 4 99 .000 2.120 Model 1 R R Square A djusted R Square Std. Error of the Estimate R Square
Change F Change df 1 df 2 Sig. F Change Change Statis tics
Durbin-Wats on Predictors: (Constant), Ratio Non Perf orming Loans to Total Loans, Operating Ef f iciency Ratio, Gros s Prof it Margin, Interes t Margin on Loans a.
Dependent V ariable: Perubahan Laba Bank b.
Coe fficientsa -5.633 .373 -15.094 .000 -6.373 -4.892 .637 1.574 .064 .405 .687 -2.486 3.759 .915 .041 .008 .016 61.470 -37.410 6.611 -1.179 -5.659 .000 -50.527 -24.293 .873 -.494 -.114 .009 107.871 8.680 .549 1.180 15.816 .000 7.591 9.769 .972 .846 .317 .072 13.820 17.531 2.990 .920 5.864 .000 11.599 23.463 .854 .508 .118 .016 61.114 (Cons tant) Gros s Profit Margin Interes t Margin on Loans Operating Effic iency Ratio Ratio Non Performing Loans to Total Loans Model 1 B Std. Error Unstandardiz ed Coefficients Beta Standardized Coefficients
t Sig. Low er Bound Upper Bound
95% Confidence Interval for B
Zero-order Partial Part Correlations
Toleranc e VIF Collinearity Statis tics
Dependent Variable: Perubahan Laba Bank a.
Persamaan Regresi:
6 4 2 0 -2 -4
Regression Standardized Residual 40 30 20 10 0 Frequency Mean = 8E-15 Std. Dev. = 0.98 N = 104
Dependent Variable: Perubahan Laba Bank Histogram 1.0 0.8 0.6 0.4 0.2 0.0
Observed Cum Prob
1.0 0.8 0.6 0.4 0.2 0.0 Ex pec ted C um P rob
Dependent Variable: Perubahan Laba Bank Normal P-P Plot of Regression Standardized Residual
20.000 15.000 10.000 5.000 0.000 -5.000
Perubahan Laba Bank 6 4 2 0 -2 -4 Re gres sio n S tud ent iz ed Re sid ual
Dependent Variable: Perubahan Laba Bank Scatterplot