BAB 2
LANDASAN TEORI
2.1 Pengertian Regresi
Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir Francis Galton. Beliau memperkenalkan model peramalan, penaksiran, atau
pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan penelitiannya terhadap tinggi badan manusia. Galton melakukan suatu penelitian
dimana penelitian tersebut membandingkan antara tinggi anak laki-laki dan tinggi badan ayahnya. Galton menunjukan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (Regressed) pendek
cenderung lebih tinggi dari ayahnya, jadi seolah-olah semua anak laki-laki yang tinggi dan anak laki-laki yang pendek bergerak menuju kerata-rata tinggi dari
seluruh anak laki-laki yang menurut istilah Galton disebut dengan “Regression to mediocrity”. Dari uraian tersebut dapat disimpulkan bahwa pada umumnya tinggi
anak mengikuti tinggi orang tuanya.
Istilah “regresi” pada mulanya bertujuan untuk membuat perkiraan nilai
suatu variabel (tinggi badan anak) terhadap variabel yang lain (tinggi badan orang
variabel lain yang berhubungan dengan variabel tersebut. Jadi prinsip dasar yang
harus dipenuhi dalam membangun suatu persamaan regresi adalah bahwa antara suatu variabel tidak bebas (Dependent variable) dengan variabel-variabel bebas
(Independent variable) lainnya memiliki sifat hubungan sebab akibat hubungan kasualitas, baik didasarka pada penjelasan logis tertentu.
2.2 Analisis Regresi Linier
Analisis regresi linier merupakan teknik yang digunakan dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel.
Analisis regresi linier atau regresi garis lurus digunakan untuk:
1. Menentukan hubungan fungsional antar variabel dependen dengan
independen. Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang berbentuk linier.
2. Meramalkan atau menduga nilai dari satu variabel dalam hubungannya
dengan variabel lain yang diketahui melalui persamaan garis regresinya.
Analisis regresi terdiri dari dua bentuk, yaitu: 1. Analisis Regresi Linier Sederhana 2. Analisis Regresi Linier Berganda
Analisis regresi linier sederhana adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel
berganda adalah bentuk regresi dengan model yang memiliki hubungan antara
satu variabel dependen dengan dua atau lebih variabel independen.
Analisis regresi dipergunakan untuk menelaah hubungan antara dua
variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu
fenomena yang kompleks. Jika, X1, X2,…, Xk adalah variabel-variabel independen
dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan
Y, dimana variasi dari X akan diiringi pula oleh variasi dari Y. jika dibuat secara matematis hubungan itu dapat dijabarkan sebagai berikut:
Dengan: Y= f (X1, X2,…, X , e)
Y adalah variabel dependen (tak bebas) X adalah variabel Independen (bebas)
e adalah variabel residu (disturbace term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang
lazim dilaksanakan yakni:
1. Mengadakan estimasi terhadap parameter berdasarkan data empiris.
2. Menguji seberapa besar variasi variabel dependen dapat diterangkan oleh
variasi independen.
3. Menguji apakah estimasi parameter tersebut signifikan atau tidak.
2.2.1 Analisis Regresi Linier Sederhana
Regresi linier sederhana digunakan untuk memperkirakan hubungan antara dua variabel dimana hanya terdapat satu variabel/peubah bebas X dan satu peubah tak
bebas Y.
Dalam bentuk persamaan, model regresi sederhana adalah :
Y = a + bX (2.1)
Dengan:
Y adalah variabel dependen (tak bebas)
X adalah variabel Independen (bebas) a adalah penduga bagi intercept (α)
b adalah penduga bagi koefisien regresi (β)
Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sebagai berikut:
1. Model regresi harus linier dalam parameter.
2. Variabel bebas tidak berkorelasi dengan disturbance term (error).
3. Nilai disturbace term sebesar 0 atau dengan symbol sebagai berikut: (E (U/X)) = 0.
4. Varian untuk masing-masing error term (kesalahan) konstan.
5. Tidak terjadi auto korelasi.
6. Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi
Dalam model yang digunakan dalam analisis empiris.
2.2.2 Analisis Regresi Linier Berganda
Untuk memperkirakan nilai variabel tak bebas Y, akan lebih baik apabila ikut memperhitungkan variabel-variabel bebas lain yang ikut mempengaruhi nilai Y.
dengan demikian dimiliki hubungan antara satu variabel tidak bebas Y dengan
beberapa variabel lain yang bebas X1, X2, dan X3,…, Xk. Untuk itulah digunakan regresi linear berganda. Dalam pembahasan mengenai regresi sederhana, simbol
yang digunakan untuk variabel bebasnya adalah X. dalam regresi berganda, persamaan regresinya memiliki lebih dari satu variabel bebas maka perlu
menambah tanda bilangan pada setiap variabel tersebut, dalam hal ini X1, X2,…, Xk.
Secara umum persamaan regresi berganda dapat ditulis sebagai berikut:
�= � + � �+ � �+ …+ �� �+ �� (2.2)
Dengan :
= Variabel tidak bebas
= Variabel bebas
0 1,…, = koefisien regresi
Dalam penelitian ini, digunakan tiga variabel yang terdiri dari satu variabel bebas Y dan tiga variabel X yaitu X1, X2, dan X3. Maka persamaan regresi
bergandanya adalah:
Persamaan 2.3 diatas dapat diselesaikan dengan empat bentuk yaitu:
∑ � = � �+ � ∑ �+ � ∑ �+ � ∑ � (2.4)
∑ � �= � ∑ �+ � ∑ �+ � ∑ � �+� ∑ � � (2.5)
∑ � �= � ∑ �+ � ∑ � �+ � ∑ �+� ∑ � � (2.6)
∑ � �= � ∑ �+ � ∑ � �+� ∑ � �+ � ∑ � (2.7)
2.3 Kesalahan Standar Estimasi
Dalam persamaan model regresi linear yang diperoleh, maka antara nilai Y dan akan menimbulkan perbedaan hasil yang sering disebut sebagai kekeliruan.
Ukuran tersebut dapat dihitung oleh kekeliruan baku taksiran. Untuk mengetahui ketepatan persamaan estimasi dapat digunakan kesalahan standar estimasi
(standard error of estimate). Besarnya kesalahan standar estimasi menunjukkan
ketepatan persamaan estimasi untuk menjelaskan nilai variabel dependen yang
sesungguhnya.
Semakin kecil nilai kesalahan standar estimasi, makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variable dependen
sesungguhnya. Dan sebaliknya semakin, semakin besar nilai kesalahan standar estimasi, makin rendah ketepatan persamaan estimasi yang dihasilkan untuk
Kesalahan standar estimasi dapat ditentukan dengan rumus:
k = banyak variabel independen
2.4 Koefisien Determinasi
Koefisien determinasi yang dinyatakan dengan R2 untuk pengujian regresi linear berganda yang mencakup lebih dari dua variabel adalah untuk mengetahui proporsi keragaman total dalam variabel tak bebas(Y) yang dapat dijelaskan untuk
diterangkan oleh variabel-variabel bebas (X) yang ada dalam model persamaan
regresi linear berganda secara bersama-sama.
Maka R2 akan ditentukan dengan rumus, yaitu :
2.5 Uji Korelasi
Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang tidak menunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji
korelasi tidak membedakan jenis variabel (tidak ada variabel dependen maupun independen). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji korelasi terdiri dari Pearson, Spearman, dan Kendall. Jika sampel data lebih
dai 30 (sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson (karena memenuhi asumsi parametrik). Jika jumlah sampel kurang dari
30 (sampel kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman atau Kendall (karena memenuhi asumsi non-parametrik).
Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur kekuatan (keeratan) suatu hubungan antar variabel. Koefisien korelasi biasanya disimbolkan dengan r.
Koefisien korelasi dapat dirumuskan sebagai berikut:
�= �∑ � �− ( ∑ �) (∑ �)
{�∑ �− (∑ �) }{ �∑ �− (∑ �) }
(2.10)
1. Untuk menghitung koefisien korelasi antara variabel tak bebas Y dengan
2. Koefisien korelasi antara Y dengan X1
�� = �∑ � �− ( ∑ �) (∑ �)
{�∑ �− (∑ �) }{ �∑ �− (∑ �) }
(2.11)
3. Koefisien korelasi antara Y dengan X2
�� = �∑ � �− ( ∑ �) (∑ �)
{�∑ �− (∑ �) }{ �∑ �− (∑ �) }
(2.12)
4. Koefisien korelasi antara Y dengan X3
�yX 3 =
n ∑X3iYi− ( ∑X3i) (∑Yi)
{n ∑ X3i2− (∑ X3i)2}{ n ∑ Yi2− (∑ Yi)2}
(2.13)
Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi adalah plus (+) atau minus (-) yang menunjukan arah korelasi. Makna sifat korelasi:
1. Tanda positif (+) pada koefisien korelasi menunjukkan hubungan yang searah (korelasi positif). Artinya jika suatu nilai variabel mengalami
kenaikan maka nilai variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya.
2. Tanda negatif (-) pada koefisien korelasi menunjukkan hubungan yang
berlawanan arah (korelasi negatif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai variabel yang lain juga mengalami
Tabel 2.1. Interpretasi Koefisien Korelasi Nilai r
R Interpretasi
0
0,01 – 0,20
0,21 – 0,40
0,41 – 0,60
0,61 – 0,80
0,81 – 0,99
1
Tidak berkorelasi
Sangat rendah
Rendah
Agak rendah
Cukup
Tinggi
Sangat tinggi
Analisis ini bertujuan untuk mengukur kekuatan dan derajat hubungan antar dua variabel. Derajat hubungan antara dua variabel disebut korelasi sederhana sedangkan derajat yang berkaitan dengan tiga atau lebih variabel disebut sebagai korelasi berganda. Korelasi dapat bersifat linier atau non linier.
2.6 Uji Regresi Linier Berganda
Langkah Pertama Perumusan hipotesa :
Langkah ketiga menentukan nilai F hitung dengan formulasi sebagai berikut :
Langkah keempat membuat keputusan terhadap hipotesis dengan membandingkan nilai F hitung dengan Ftabel.
Langkah kelima membuat keputusan berdasarkan keputusan yang diambil.
2.7 Uji Koefisien Regresi Ganda
Pengujian ini bersifat individu, melihat hubungan antara variabel independent terhadap variabel dependent.
Langkah Pertama Perumusan hipotesa :
Ho : Tidak terdapat hubungan fungsional yang signifikan antara faktor-faktor
yang mempengaruhi terhadap faktor yang dipengaruhi.
0 4 3 2
1
(X1, X2, X3, X4 tidak mempengaruhi Y)H1 : Minimal ada satu parameter koefisien regresi yang tidak sama dengan nol
atau berpengaruh signifikan terhadap Y.
Dengan :
H0 diterima jika thit≤ ttab.
Langkah kedua Penentuan nilai kritis. Nilai kritis dalam distribusi t dengan tingkat signifikan (�) dan derajat kebebasan v1= k dan v2= n-k-1 Di mana :
t( V1,V2, �
2 )
(2.17)
Langkah ketiga menentukan nilai t hitung dengan formulasi sebagai berikut:
thitung = (2.18)
Langkah keempat menentukan kekeliruan baku taksiran dari koefisien bi
= ..
2
∑ 2−
(1− 2)
(2.19)
Dengan : 2 … = ∑( − )2
�− −1 (2.20)
Langkah kelima membuat keputusan terhadap hipotesis dengan membandingkan nilai t hitung dengan ttabel.