Modul 3:
Regresi Linier untuk Persamaan Garis Lurus dan Kuadratis A. Pendahuluan Regresi Linier dan Metode Kuadrat Terkecil
Istilah atau pengertian regresi (yang berarti: prediksi atau taksiran) pertama kali diperkenalkan oleh Sir Francis Galton (1877) dalam suatu karya ilmiah atau penelitiannya tentang korelasi antara tinggi anak dan tinggi orang tuanya. Pada penelitiannya tersebut, Galton mendapatkan bahwa tinggi anak dari orang tua yang tinggi cenderung meningkat atau menurun sebagai fungsi atau model hubungan dari berat rata-rata populasi. Garis yang menunjukkan hubungan seperti di atas, disebut juga garis regresi.
Regresi linear adalah metode, perangkat atau kelengkapan ilmu statistik yang digunakan untuk mengetahui korelasi atau pengaruh parametrik antara satu atau beberapa variabel terhadap satu buah variabel yang membentuk suatu korelasi dalam sebuah persamaan aljabar. Di sisi lain, analisis regresi mempelajari korelasi atau hubungan yang diperoleh yang dinyatakan dalam suatu persamaan matematika (umumnya, sebagai suatu persamaan aljabar) yang menyatakan hubungan fungsional antara variabel-variabel.
Variabel-variabel (peubah-peubah) yang memiliki pengaruh terhadap lainnya disebut juga variabel bebas (variabel independen atau variabel
penjelas). Di sisi lain, suatu variabel yang dipengaruhi sering disebut sebagai variabel terikat (variabel dependen). Regresi linear hanya dapat digunakan
pada skala interval dan atau yang berbentuk nisbah (perbandingan atau rasio).
Dengan melakukan pendekatan-pendekatan secara kaidah statistik, analisis regresi linier yang dipelajari dalam Mata Kuliah Komputasi Numerik ini dilakukan dengan bantuan analisis Metode Kuadrat Terkecil (Least-Squares
Method). Metode Kuadrat Terkecil tersebut dapat dianggap sebagai suatu
metode ‘pendekatan’ yang paling praktis dalam dunia keteknikan untuk: (a). Regresi ataupun pembentukan persamaan dari titik-titik data diskretnya
(dalam suatu aktivitas pemodelan), dan atau untuk
(b). Analisis galat (sesatan) dari suatu pengukuran atau penelitian teoretis (untuk validasi model).
Metode kuadrat terkecil ini juga memainkan peranan penting dalam metode aplikasi secara statistik, karena metode ini seringkali digunakan dalam penyelesaian problem-problem yang melibatkan kumpulan data yang tersusun secara acak, seperti dalam sesatan-sesatan percobaan. Namun demikian, hal-hal yang berhubungan dengan teori statistik tidak akan dibahas secara khusus dalam modul ini.
Analisis regersi dapat digunakan untuk memeperoleh korelasi matematis (hubungan fungsional) antara dua buah variabel atau lebih. Selain itu juga, analisis regersi ini dapat digunakan pula untuk mendapatkan pengaruh antar
variabel-variabel prediktor terhadap variabel kriteriumnya atau memprediksi pengaruh variabel prediktor terhadap variabel kriteriumnya (Usman dan Akbar, 2006). Secara empirik, korelasi antara satu atau beberapa variabel bebas (sebagai prediktor) dengan satu variabel terikatnya (sebagai variabel respon atau kriterium) dapat dibedakan atas:
1. Analisis regresi linier sederhana (tunggal) atau Simple Analysis Regression: yaitu bila hanya terbentuk korelasi atau hubungan fungsional
antara sebuah variabel bebas (tunggal) dengan sebuah variabel terikat; dan
2. Analisis regresi linear berganda atau Multiple Analysis Regression: yaitu
bila beberapa variabel bebas dan satu buah variabel terikat membentuk suatu hubungan fungsional berbentuk persamaan aljabar atau korelasi matematis.
Analisis regresi linier merupakan metode statistik yang paling umum dan banyak digunakan dalam studi parametrik dari penelitian-penelitian sosial, terutama penelitian ekonomi. Dalam studi ekonomi tersebut, piranti lunak atau program komputer yang paling banyak digunakan adalah SPSS (Statistical Package For Service Solutions).
B. Analisis Regresi Linier Sederhana
Secara teoretis, regresi linier sederhana merupakan suatu aktivitas analisis statistika yang dapat digunakan untuk memprediksi korelasi atau hubungan matematis dalam bentuk suatu persamaan (model) antara variabel terikat (tak bebas) tunggal sebagai fungsi dari variabel bebas (independen) tunggal. Analisis regresi linier sederhana hanya memiliki satu variabel (peubah) yang dihubungkan dengan satu variabel tidak bebas. Bentuk umum dari persamaan regresi linier untuk populasi adalah sebagai berikut:
y
f x
A x
B
dengan
:
x
berperan sebagai variabel bebas
:
y
f x
berperan sebagai variabel terikat:
A
parameter kelandaian (slope) garis lurus:
B
parameter perpotongan (intercept) dengan variabel terikatSeperti telah dijelaskan di atas, penentuan dari koefisien-koefisien persamaan
A
danB
dapat dilakukan dengan menggunakan metode kuadrat terkecil(least-square), yaitu metode pendekatan yang dipakai untuk menentukan koefisien persamaan dan dari jumlah pangkat dua (kuadrat) antara titik-titik dengan garis regresi yang dicari pada nilai (harga) yang terkecil, dalam suatu rangkaian pasangan data (set
x
y
) yang berjumlahN
.Sebagai contoh, di bawah ini diberikan 1 set data (
x
y
) sebanyak 7 buahTabel 1. Set data regresi linier.
n
x
y
1 -3 0,22 2 -2 0,67 3 -1 1,55 4 0 1,99 5 1 2,55 6 2 3,25 7 3 4,11Hasil pengaluran kurva (plotting) titik-titik tersebut di atas dapat dilihat seperti pada Gambar 1 di bawah ini.
Gambar 1. Kurva regresi linier, dengan N 7.
Persamaan sebaran ( = deviasi standar atau kadang disebut sebagai
distribusi) yang menyatakan galat (sesatan) terdistribusi dari persamaan linier
tersebut, yang dapat juga dinyatakan sebagai:
S
2S
y
A x
B
Persyaratan yang harus dipenuhi untuk dapat menentukan
A
danB
adalahminimisasi turunan persamaan di atas terhadap tetapan
S
A
danB
(dalamhal ini, koefisien-koefisien
A
danB
dianggap sebagai variabel-variabel(a). agar dapat menentukan koefisien
A
, makad S
0
d A
dan(b). agar dapat menentukan koefisien
B
, makad S
0
d B
Rician untuk memperjelas penurunan dari kedua persamaan di atas adalah sebagai berikut:
•
20
d
y
A x
B
d A
, sehingga didapat persamaan berikut:
2
yA xB x 0, atau 2A
x
B
x
x
y
(1) •
20
d
y
A x
B
d B
, sehingga didapatkan:0
2
y
A x
B
1
, atauA
x
N B
y
2 (2) Kedua persamaan (1) dan (2) seperti di atas adalah suatu Sistem PersamaanAljabar Linier (SPAL), bila disusun ulang sebagai berikut:
A
x y
x
x
B
y
x
N
yang identik dengan persamaan matriks
[ ]
A
[
x
ˆ
]
=[
b
]
. Solusi SPAL tersebutsebenarnya relatif cukup mudah bila dilakukan dengan menggunakan metode analitis.
Dengan menggunakan aturan Cramer, maka solusi parameter- parameter
A
dan
B
adalah: 2 2 det det x y x x y x y N y N A x x x x x N x
N dan 2 2 2 2 det det x x y x x y x y x B y x x x x x N x
NKarena hanya membentuk persamaan matriks berorder 2, maka determinan-determinan matriks di atas dapat langsung dihitung, dengan rincian sebagai berikut: •
2 2det
x
x
x
N
x
x
N
x
•det
x y
x
x y N
x
y
y
N
•
2 2det
x
x y
x
y
x
x
x
y
y
Sehingga, diperoleh harga parameter
A
dan parameterB
sebagai berikut:
2
x y N x y A x N x x
0,684143; dan
2 2 x y x x y B x N x x
1,985000C. Analisis Regresi Linier Persamaan Parabola
Persamaan Parabola atau Persamaan Kuadrat merupakan pengembangan model korelasi fungsi polinomial antara variabel bebas (
x
) dengan variabelterikatnya ( ), yang mempunyai bentuk umum sebagai berikut:
y
2y
f x
p x
q x
r
Regresi yang dimaksudkan disini adalah: pencarian harga-harga tetapan
p
,dan
r
berdasarkan set data yang diberikan (ingat: jumlah atau pasangandata
q
x
y
sebanyakN
buah !).Persamaan sebaran atau deviasi standar ( ) yang menyatakan galat atau sesatan terdistribusi dari persamaan linier tersebut di atas, dapat dinyatakan sebagai:
S
22
S
y
p x
q x
r
Persyaratan yang harus dipenuhi untuk dapat menghitung
p
, danadalah minimisasi turunan persamaan di atas terhadap tetapan p q dan r (dalam hal ini,
q
r
p
, dan dianggap sebagai variabel-variabel semu),sehingga membentuk persamaan-persamaan minimisasi berikut:
q
r
•
d S
0
•
d S
0
d q
; dan•
d S
0
d r
Tahapan penurunan ketiga persamaan-persamaan di atas terhadap
p
,dan
r
adalah sebagai berikut:q
•d
y
p x
2q x
r
20
d p
•d
y
p x
2q x
r
20
d q
; dan •d
y
p x
2q x
r
20
d r
yang ketiganya dapat membentuk SPAL (Sistem Persamaan Aljabar Linier) seperti berikut ini:
4 3 2
p
x
q
x
r
x
x
2y
(3) 3 2p
x
q
x
r
x
x y
(4) 2p
x
q
x
N r
y
(5)Seperti halnya pada regresi persamaan linier sebelumnya, ketiga persamaan (3), (4), dan (5) di atas juga membentuk suatu Sistem Persamaan Aljabar Linier (SPAL) dengan order 3, yang bila disusun ulang akan terbentuk sebagai berikut: 4 3 2 2 3 2 2
x
x
x
p
x y
x
x
x
q
x y
x
x
N
r
y
(6)Solusi SPAL di atas dapat dilakukan melalui 2 cara, yaitu: (a). analitis (aljabar) dan (b). numeris. Berbagai solusi SPAL (dengan menggunakan metode numeris) dapat dipelajari pada Bab 4 di buku ajar (Metode Numerik). Sebagai catatan, determinan dari matriks bujur-sangkar dengan rank 3 dapat dihitung sebagai berikut:
Dengan menggunakan metode analitis, sebenarnya SPAL di atas masih relatif cukup mudah diselesaikan, yaitu dengan menggunakan aturan Cramer untuk mencari solusi konstanta atau parameter-parameter
p
,q
dan .r
Berdasarkan catatan tentang determinan matriks berorder 3 seperti di atas, maka determinan-determinan matriks di atas berturut-turut adalah sebagai berikut:
dan
D. Analisis Regresi Linier Berganda (Regresi Multi Linier)
Beberapa persamaan aljabar dapat membentuk suatu ‘relasi linier’ atau yang sejenisnya, antara beberapa variabel bebas (independent variables) dengan sebuah variabel terikat (dependent variable). Relasi tersebut seringkali dijumpai dalam dunia keteknikan, termasuk hasil logaritmik dari persamaan-persamaan analisis adimensional ataupun relasi analogi bilangan-bilangan tak berdimensi.
Bentuk umum dari persamaan multilinier seperti di atas dapat disederhanakan dalam relasi fungsi matematis berikut:
Bila persamaan multilinier tersebut memiliki jumlah variabel bebas yang lebih besar lagi, maka secara sistematis dapat dituliskan sebagai berikut:
Persamaan sebaran ( ) yang menyatakan ‘galat terdistribusi’ dari persamaan multilinier tersebut di atas dapat dinyatakan sebagai:
S
Menarik untuk dicatat, bahwa jumlah konstanta atau parameter (
c
1 sampaidengan
c
n) yang dimiliki suatu persamaan multilinier sekurang-kurangnyasama dengan jumlah variabel bebasnya.
Seperti biasanya, persyaratan yang harus dipenuhi untuk dapat menghitung konstanta-konstanta
c
1 sampai denganc
n, adalah minimisasi turunanpersamaan di atas terhadap masing-masing konstanta (dalam hal ini, semua konstanta dianggap sebagai variabel-variabel semu), sehingga membentuk persamaan-persamaan berikut:
Tahapan diferensiasi persamaan-persamaan di atas terhadap masing-masing parameternya (dari
c
1 sampai denganc
n) dapat disajikan sebagaiberikut:
membentuk bersamaan berikut:
(7)
membentuk bersamaan berikut:
(8) sampai, akhirnya
akan membentuk bersamaan ke-
n
dalam bentuk berikut:(9) Sistem Persamaan Aljabar Linier (SPAL) yang terbentuk dari persamaan-persamaan (7), (P), (8), dan (9) adalah sebagai berikut:
Sebagai catatan, metode penyelesaian dari SPAL yang terakhir seperti di atas akan lebih baik jika dipilih secara numerik (komputasi numerik), misalnya adalah Metode Eliminasi Gauss atau dengan menggunakan spreadsheet (worksheet) MS-EXCEL. Penyelesaian secara analitis tampaknya akan sangat kompleks sekaligus tidak praktis.
E. Contoh: Regresi Linier suatu Garis Lurus dari Pasangan Data x-y
Diketahui bahwa pasangan data (variabel bebas dengan variabel terikat
x
y
) berikut ini:memiliki korelasi kurva garis lurus, dengan model persamaannya sebagai berikut:
y
A
x
B
Dengan menggunakan analisis regresi linier yang telah saudara pelajari, tentukanlah harga-harga koefisien dan
A
B
dari korelasi model di atas!Jawab:
Untuk memudahkan penyelesaiannya, dapat digunakan worksheet MS-EXCEL yang penyusunan kolom-kolomnya disesuaikan dengan bentuk SPAL dari regresi linier tersebut.
adalah sebagai berikut:
Dari uraian pada halaman 4 seperti di atas, diketahui bahwa untuk koefisien-koefisien dan
A
B
dapat dihitung sebagai “vektor jawab” dari SPAL berikut:2
x y
x
x
y
x
N
A
B
Jika menggunakan acuan pada worksheet MS-EXCEL seperti di atas, maka bentuk SPAL yang dimaksud dapat disusun sebagai worksheet berikut:
11
11
11
11
10
11
A
B
F
E
D
B
C
C
diperoleh8
60 12
120
12
4
A
B
Maka, jika kita gunakan Aturan Cramer atau pun Metode Eliiminasi Gauss, akan diperoh:
A =
-3B =
5Sehingga, Persamaan Model yang dimaksud adalah: