ANALISIS REGRESI
REGRESI LINEAR REGRESI NONLINEAR
REGRESI LINEAR SEDERHANA
REGRESI LINEAR BERGANDA
REGRESI
KUADRATIK REGRESI KUBIK
• Regresi non linier adalah suatu metode untuk
mendapatkan model non linier yang menyatakan hubungan variabel dependen dan variabel
independen
• Regresi nonlinier dapat mengestimasi model
hubungan variabel dependen dan independen dalam bentuk non linier dengan keakuratan yang lebih baik daripada regresi linier, karena dalam mengestimasi model dipakai iterasi algoritma
• Secara umum model regresi non linear dapat
dinyatakan dalam persamaan :
f
(x
,
)
Langkah Analisis
1. Melakukan penaksiran garis regresi untuk memprediksi pola hubungan antara variabel respon (y) dan variabel prediktor (x). Hal ini dapat dilakukan dengan melihat scatter plot antara y dan x. Model linear memiliki kurva yang membentuk garis lurus, sedangkan untuk model non linear memiliki kurva yang membentuk garis lengkung.
Bentuk persamaan matematis model regresi non linear ada beberapa jenis, diantaranya :
Polinomial, contoh : (kuadratik)
(kubik) Exponensial, contoh :
2. Melakukan transformasi dari bentuk non linier ke bentuk linier untuk mendapatkan linieritas dari hubungan non linier
2 2 1 0x
x
y
3 3 2 2 1 0x
x
x
y
xe
y
1 0Continued…
Beberapa bentuk model nonlinier yang dapat dan tidak dapat ditransformasikan ke model linier adalah sebagai berikut :
Model Persamaan Bentuk Linier
Linear Y = a + bx - Quadratik Y = a + bx + cx2 - Cubic Y = a + bx + cx2 + dx3 - Logarithm Y = a + b ln x - Inverse Y = a + b/x - Compound Y = abx ln Y = ln a + x ln b Power Y = axb ln Y = ln a + b ln x S Y = ea+b/t ln Y = a + b/t Growth Y = ea+bx ln Y = a + bx Exponential Y = a(ebx) ln Y = ln a + bx
Continued…
• Selanjutnya setelah diperoleh persamaan linier dari
hasil transformasi maka langkah analisisnya sama dengan regresi linier.
Namun Jika suatu model tidak dapat dilinearkan, maka nilai β dapat diduga dengan dengan cara meminimumkan jumlah kuadrat residual. Jumlah kuadrat ini dapat diminimukan jika turunan pertama terhadap β sama dengan nol atau
(
,
)
(
,
)
0
)
,
(
1 2 1
i n i i i n i i ix
f
x
f
y
SSE
x
f
y
SSE
Continued…
• Hasil turunan pertama terhadap β sama dengan nol
membentuk suatu sistem persamaan non-linear
yang tidak dapat diselesaikan secara langsung tetapi dapat didekati secara iteratif dengan menggunakan metode numerik, salah satu metode numerik yang dapat menyelesaikan hal ini adalah metode Gauss-Newton.
• Metode Gauss-Newton ini bekerja dengan
menggunakan pendekatan deret Taylor dari fungsi
sampai suku kedua.
SSE
Continued…
• Nilai dugaan β pada iterasi ke i+1 adalah :
dimana i i i i i i
ˆ
(
)
'
e
ˆ
' 1 1
k n n n k k x f x f x f x f x f x f x f x f x f ) , ( ... ) , ( ) , ( ... ) , ( ... ) , ( ) , ( ) , ( ... ) , ( ) , ( 1 0 2 1 2 0 2 1 1 1 0 1Iterasi dihentikan jika nilai :
i
i
Continued…
• Levenberg-Marquardt menyempurnakan metode
Gauss-Newton dengan memasukkan konstanta β (nilai awal βi+1 yang besarnya berubah-ubah
mengikuti perubahan SSE. Nilai β akan diperkecil sepersepuluh kali dan iterasi diteruskan jika SSE turun serta nilai β akan meningkat sepuluh kali dan kembali ke iterasi awal jika SSE meningkat. Formula Levenberg-Marquardt adalah :
Analisis ini bisa dilakukan dengan bantuan macro Minitab atau SPSS i i i i i i i i
ˆ
(
diag
'
)
'
e
ˆ
' 1 1
Prosedur linearisasi ini memiliki kelemahan untuk masalah-masalah tertentu, yaitu:
1. Proses kekonvergenannya mungkin berjalan sangat lambat, dengan kata lain dibutuhkan langkah iterasi yang sangat banyak sebelum solusinya stabil. Perilaku ini tidak sering, namun dapat terjadi.
2. Adakalanya solusinya berosilasi, terus berganti-ganti arah, dan sering menaik turunkan jumlah kuadrat tersebut, walaupun pada akhirnya solusi mencapai kestabilan.
3. Proses iterasi tidak konvergen sama sekali atau bahkan divergen sehingga jumlah kuadrat galat ini naik terus tanpa batas.
Contoh 1
• Suatu penelitian mengetahui bahwa nikotin menyebabkan gangguan kesehatan berupa karbon monoksida yang merupakan racun bagi manusia. Kandungan nikotin dalam rokok digunakan untuk mengukur karbon monoksida. Oleh karena itu, nikotin bertindak sebagai variabel prediktor (x) dan karbon monoksida sebagai variabel respons (y). Berikut adalah data mengenai jumlah nikotin dalam rokok dan karbon monoksida yang dihasilkan rokok pada 25 merek rokok.
Data
y
x
y
x
y
x
y
x
y
x
13.6
0.86
15.0
1.04
13.0
1.01
1.5
0.13
15.9
1.01
16.6
1.06
9.0
0.76
14.4
0.90
18.5
1.26
8.5
0.61
23.5
2.03
12.3
0.95
10.0
0.57
12.6
1.08
10.6
0.69
10.2
0.67
16.3
1.12
10.2
0.78
17.5
0.96
13.9
1.02
5.4
0.40
15.4
1.02
9.5
0.74
4.9
0.42
14.9
0.82
Y = karbon monoksida
X = kadar nikotin
Penyelesaian
• Membuat plot antara variabel dependen dan variabel
independen nikotin (mg) ka rb o n m o n o ks id a ( m g ) 2.0 1.5 1.0 0.5 0.0 30 25 20 15 10 5 0 S 1.82845 R-Sq 85.7% R-Sq(adj) 85.1%
Fitted Line Plot
Model Kuadratik
n iko t in ( m g ) k a rb o n m o n o k s id a ( m g ) 2 .0 1 .5 1 .0 0 .5 0 .0 2 5 2 0 1 5 1 0 5 0 S 1.58336 R - S q 89.8% R - S q ( a d j) 88.8% F i tte d L i n e P l o t ka r b o n m o n o ks id a (m g ) = - 1 .7 8 4 + 2 0 .1 1 n iko tin (m g ) - 3 .7 3 0 n iko tin (m g )* * 2Model Kubik
n iko t in ( m g ) k a r b o n m o n o k s id a ( m g ) 2 .0 1 .5 1 .0 0 .5 0 .0 2 5 2 0 1 5 1 0 5 0 S 1.61137 R - S q 89.9% R - S q ( a d j) 88.4% F itte d L in e P lo t ka r b o n m o n o ks id a (m g ) = - 0 .8 5 8 + 1 5 .9 5 n iko tin (m g ) + 1 .0 3 7 n iko tin (m g )* * 2 - 1 .4 7 1 n iko tin (m g )* * 3Continued…
• Dari fitted line plot di atas dapat diketahui
nilai-nilai sebagai berikut :
Dari hasil fitted line plot diatas dapat diketahui bahwa model terbaik adalah model kuadratik dengan nilai S yang paling kecil dan nilai R-Sq (adj) yang besar.
Statistik linier Kuadratik Kubik
S 1.82845 1.58336 1.61137
R-Sq 85.7% 89.8% 89.9%
Continued…
• Untuk tahapan pada ANOVA adalah sebagai
berikut :
1. mendapatkan nilai kuadrat dari variabel
nikotin.
2. meregresikan variabel karbon monoksida
dengan variabel nikotin dan nikotin^2
• Hasil dari output minitab adalah sebagai
Continued…
Regression Analysis: karbon monoksida versus nikotin (mg), nikotin^2
The regression equation is
karbon monoksida (mg) = - 1.78 + 20.1 nikotin (mg) - 3.73 nikotin^2
Predictor Coef SE Coef T P Constant -1.784 1.453 -1.23 0.233 nikotin (mg) 20.111 2.775 7.25 0.000 nikotin^2 -3.730 1.267 -2.94 0.007 S = 1.58336 R-Sq = 89.8% R-Sq(adj) = 88.8% Analysis of Variance Source DF SS MS F P Regression 2 484.00 242.00 96.53 0.000 Residual Error 22 55.15 2.51 Total 24 539.15 Source DF Seq SS nikotin (mg) 1 462.26 nikotin^2 1 21.74 Unusual Observations karbon nikotin monoksida
Obs (mg) (mg) Fit SE Fit Residual St Resid 3 2.03 23.500 23.670 1.536 -0.170 -0.44 X 16 0.13 1.500 0.768 1.136 0.732 0.66 X 19 0.96 17.500 14.086 0.371 3.414 2.22R
R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence.
Continued…