BAB 2
LANDASAN TEORI
2.1Pengertian Regresi
Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir
Francis Galton. Beliau memperkenalkan model peramalan, penaksiran, atau
pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan penelitiannya
terhadap tinggi badan manusia. Galton melakukan suatu penelitian dimana penelitian
tersebut membandingkan antara tinggi anak lakilaki dan tinggi badan ayahnya. Galton
menunjukan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa
generasi cenderung mundur (Regressed) pendek cenderung lebih tinggi dari ayahnya,
jadi seolah-olah semua anak laki-laki yang tinggi dan anak laki-laki yangpendek
bergerak menuju kerata-rata tinggi dari seluruh anak laki-laki yang menurut istilah
Galton disebut dengan “Regression to mediocrity”. Dari uraian tersebut dapat
disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tuanya.
Istilah “regresi” pada mulanya bertujuan untuk membuat perkiraan nilai suatu
variabel (tinggi badan anak) terhadap variabel yang lain (tinggi badan orang tua). Pada
membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain
yang berhubungan dengan variabel tersebut.
Jadi prinsip dasar yang harus dipenuhi dalam membangun suatu persamaan
regresi adalah bahwa antara suatu variabel tidak bebas (Dependent variable) dengan
variabel-variabel bebas (Independent variable) lainnya memiliki sifat hubungan sebab
akibat hubungan kasualitas, baik didasarkan pada penjelasan logis tertentu.
2.2Analisis Regresi Linier
Analisis regresi linier merupakan teknik yang digunakan dalam persamaan matematik
yang menyatakan hubungan fungsional antara variabel-variabel. Analisis regresi linier
atau regresi garis lurus digunakan untuk:
1. Menentukan hubungan fungsional antar variabel dependen dengan independen.
Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang
berbentuk linier.
2. Meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan
variabel lain yang diketahui melalui persamaan garis regresinya.
Analisis regresi terdiri dari dua bentuk, yaitu:
1. Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana adalah bentuk regresi dengan model yang
bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel dependent
(terikat) dan variabel independent (bebas). Sedangkan analisis regresi berganda adalah
bentuk regresi dengan model yang memiliki hubungan antara satu variabel dependent
dengan dua atau lebih variabel independent.
Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau
lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui
dengan baik. Jika, 𝑋1,𝑋2, … ,𝑋𝑘 adalah variabel-variabel independent dan Y adalah
variabel dependent, maka terdapat hubungan fungsional antara X dan Y, dimana
variasi dari X akan diiringi pula oleh variasi dari Y. jika dibuat secara matematis
hubungan itu dapat dijabarkan sebagai berikut:
dimana: Y = f (𝑋1,𝑋2, … ,𝑋𝑘 , e)
Y = variabel dependent (terikat)
X = variabel Independent (bebas)
e = variabel residu (disturbace term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang
lazim dilaksanakan yaitu:
1. Mengadakan estimasi terhadap parameter berdasarkan data empiris.
2. Menguji seberapa besar variasi variabel dependent dapat diterangkan oleh variasi
3. Menguji apakah estimasi parameter tersebut signifikan atau tidak.
4. Melihat apakah tanda magnitude dari estimasi parameter cocok dengan teori.
2.2.1 Analisis Regresi Linier Sederhana
Regresi linier sederhana digunakan untuk memperkirakan hubungan antara dua
variabel dimana hanya terdapat satu variabel atau peubah bebas X dan satu peubah
terikat Y.
Dalam bentuk persamaan, model regresi sederhana adalah sebagai berikut:
𝑌= 𝑎 +𝑏𝑋
dimana:
Y = variabel dependen (terikat)
X = variabel Independen (bebas)
a = penduga bagi intercept
b = penduga bagi koefisien regresi (β)
Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sebagai
berikut:
1. Model regresi harus linier dalam parameter.
3. Nilai disturbace term sebesar 0 atau dengan simbol sebagai berikut:
(E (U/X)) = 0.
4. Varian untuk masing-masing error term (kesalahan) konstan.
5. Tidak terjadi auto korelasi.
6. Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam
model yang digunakan dalam analisis empiris.
7. Jika variabel bebas lebih dari datu, maka antara variabel bebas (explanatory) tidak
ada hubungan linier yang nyata.
2.2.2 Analisis Regresi Linier Berganda
Untuk memperkirakan nilai variabel terikat Y, akan lebih baik apabila ikut
memperhitungkan variabel-variabel bebas lain yang ikut mempengaruhi nilai Y.
dengan demikian dimiliki hubungan antara satu variabel terikat Y dengan beberapa
variabel lain yang bebas 𝑋1,𝑋2 dan 𝑋3, … ,𝑋4. Untuk itulah digunakan regresi linear
berganda.
Dalam pembahasan mengenai regresi sederhana, simbol yang digunakan untuk
variabel bebasnya adalah X. dalam regresi berganda, persamaan regresinya memiliki
lebih dari satu variabel bebas maka perlu menambah tanda bilangan pada setiap
Secara umum persamaan regresi berganda dapat ditulis sebagai berikut:
𝑌𝑖 = 𝛽0+𝛽1𝑋1𝑖+𝛽2𝑋2𝑖+⋯+𝛽𝑘𝑋𝑘+𝜀𝑘 (Untuk Populasi)
𝑌𝑖 = 𝑏0+𝑏1𝑋1𝑖+𝑏2𝑋2𝑖+⋯+𝑏𝑘𝑋𝑘+𝜀𝑘 (Untuk Sampel)
dimana:
Y = Variabel terikat
X = Variabel bebas
𝑏0,𝑏1,𝑏2, … ,𝑏𝑘 = Koefisien regresi untuk data populasi
𝛽0,𝛽1,𝛽2, … ,𝛽𝑘 = Koefisien regresi untuk data sampel
𝜀 = Variabel kesalahan (galat)
Dalam penelitian ini, digunakan empat variabel yang terdiri dari satu variabel
bebas Y dan tiga variabel X yaitu 𝑋1,𝑋2,𝑋3. Maka persamaan regresi bergandanya
adalah:
𝑌𝑖 = 𝑏0+𝑏1𝑋1𝑖+𝑏2𝑋2𝑖+𝑏3𝑋3
dimana:
Y = Variabel terikat
X = Variabel bebas
Persamaan diatas dapat diselesaikan dengan empat bentuk yaitu:
∑𝑌𝑖 = 𝑏0𝑛+𝑏1∑𝑋1𝑖+𝑏2∑𝑋2𝑖+𝑏3∑𝑋3𝑖
∑𝑌𝑖𝑋1𝑖 =𝑏𝑜∑𝑋1𝑖+ 𝑏1∑𝑋1𝑖2 +𝑏2∑𝑋1𝑖𝑋2𝑖+𝑏3∑𝑋1𝑖𝑋3𝑖
∑𝑌𝑖𝑋2𝑖 = 𝑏𝑜∑𝑋2𝑖+𝑏1∑𝑋1𝑖𝑋2𝑖+ 𝑏2∑𝑋2𝑖2 +𝑏3∑𝑋2𝑖𝑋3𝑖
∑𝑌𝑖𝑋3𝑖 = 𝑏𝑜∑𝑋3𝑖+𝑏1∑𝑋1𝑖𝑋3𝑖+ 𝑏2∑𝑋2𝑖𝑋3𝑖+ 𝑏3∑𝑋3𝑖2
dan harga-harga 𝑏0,𝑏1,𝑏2,𝑏3 didapat dengan menggunakan persamaan diatas, dengan
menggunakan metode eliminasi atau subtitusi. Dalam penelitian ini penulis
menggunakan software dari computer.
2.3Uji Keberartian Regresi
Sebelum persamaan regresi yang diperoleh digunakan untuk membuat kesimpulan
terlebih dahulu diperiksa setidak-tidaknya mengenai kelinieran dan keberartiannya.
Pemeriksaan ini ditempuh melalui pengujian hipotesis. Uji keberartian dilakukan
untuk meyakinkan diri apakah regresi yang didapat berdasarkan penelitian ada artinya
bila dipakai untuk membuat kesimpulan mengenai hubungan sejumlah peubah yang
sedang dipelajari.
Untuk itu diperlukan dua macam jumlah kuadrat (JK) sebagai berikut:
1. Jumlah Kuadrat untuk regresi yang ditulis JKreg dan
Jika x1i= X1i− X1, x2i= X2i− X2,…, xki= Xki− Xk dan yi= Yi-Ymaka secara
umum jumlah kuadrat-kuadrat tersebut dapat dihitung dari:
𝐽𝐾𝑟𝑒𝑔 = 𝑏1∑𝑥1𝑖𝑦𝑖 +𝑏2∑𝑥2𝑖𝑦𝑖 +𝑏3∑𝑥3𝑖𝑦𝑖
𝐽𝐾𝑟𝑒𝑠 = ∑(𝑌𝑖− Ŷ1)2
dengan derajat kebebasan 𝑑𝑘 = (𝑛 − 𝑘 −1) untuk sampel berukuran 𝑛.
Dengan demikian uji keberartian regresi berganda dapat dihitung dengan:
𝐹
ℎ𝑖𝑡𝑢𝑛𝑔=
𝐽𝐾𝑟𝑒𝑔/ 𝑘
𝐽𝐾𝑟𝑒𝑠/ (𝑛−𝑘−1)
dimana stastistik F yang menyebar mengikuti distribusi F dengan derajat kebebasan
pembilang 𝑉1 = 𝑘 dan penyebut 𝑉2 = 𝑛 − 𝑘 −1.
2.4 Uji Koefisien Regresi Linier Berganda
Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu
diadakan pengujian tersendiri mengenai koefisien-koefisien regresi.
Misalkan populasi memilih model regresi linier berganda:
𝜇𝑦.𝑥1,𝑥2,…,𝑥𝑛 = 𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑘𝑋𝑘
yang berdasarkan sebuah sampel acak berukuran n ditaksir oleh regresi berbentuk:
Akan dilakukan pengujian hipotesis dalam bentuk sebagai berikut:
𝐻0:𝛽1 = 0,1,2, … ,𝑘
𝐻𝑎:𝛽1 ≠ 0,1,2, … ,𝑘
Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran 𝑆𝑦1,2,…,𝑘,
jumlah kuadrat-kuadrat ∑𝑋𝑖𝑗2 dengan 𝑥𝑖𝑗 = 𝑋𝑗− Xj
dan koefisien korelasi ganda
antara masing-masing variabel bebas 𝑋 dengan variabel tak bebas 𝑌 dalam regresi
yaitu 𝑅𝑖.
Dengan besaran-besaran ini dibentuk kekeliruan baku koefisien b, yaitu:
𝑠𝑏𝑖 = � 𝑆𝑦,1,2,…,𝑘
Selanjutnya dapat dihitung dalam statistik:
dengan demikian kriteria pengujian: jika 𝑡𝑖 > 𝑡𝑡𝑎𝑏𝑒𝑙 maka 𝐻𝑜ditolak dan jika
𝑡𝑖 < 𝑡𝑡𝑎𝑏𝑒𝑙 maka 𝐻𝑜 diterima, yang akan berdistribusi t dengan derajat kebebasan
𝑑𝑘 = (𝑛 − 𝑘 −1) dan 𝑡𝑡𝑎𝑏𝑒𝑙 = 𝑡𝑛−𝑘−𝑖,𝑎/2.
2.5 Uji Koefisien Korelasi
Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang
tidakmenunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji
korelasi tidak membedakan jenis variabel (tidak ada variabel dependent maupun
independent). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji
korelasi terdiri dari Pearson, Spearman, dan Kendall. Jika sampel data lebih dai 30
(sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson
(karena memenuhi asumsi parametrik). Jika jumlah sampel kurang dari 30 (sampel
kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman
atau Kendall (karena memenuhi asumsi non-parametrik).
Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur
kekuatan (keeratan) suatu hubungan antar variabel. Koefisien korelasi biasanya
Koefisien korelasi dapat dirumuskan sebagai berikut:
𝑟= 𝑛∑𝑋𝑖𝑌𝑖−(∑𝑋𝑖)(∑𝑌𝑖)
�√{𝑛∑𝑋𝑖2−(∑𝑋𝑖)2}{𝑛∑𝑌𝑖2 −(∑𝑌𝑖)2}
dimana:
𝑛 = banyaknya pasangan data 𝑋dan 𝑌
∑𝑋𝑖 = jumlah nilai dari variabel 𝑋𝑖
∑𝑌𝑖 = jumlah nilai dari variabel 𝑌𝑖
∑𝑋𝑖2 = jumlah nilai kuadrat dari variabel 𝑋𝑖
∑𝑌𝑖2 = jumlah nilai kuadrat dari variabel 𝑌𝑖
∑𝑋𝑖𝑌𝑖 = jumlah hasil kali nilai variavel 𝑋𝑖 dan 𝑌𝑖
Untuk menghitung koefisien korelasi antara variabel tak bebas Y dengan tiga variabel
bebas 𝑋1,𝑋2,𝑋3, yaitu:
1. Koefisien korelasi antara 𝑌 dengan 𝑋1
𝑟𝑦1= 𝑛∑𝑋1𝑖𝑌𝑖 −(∑𝑋1𝑖)(∑𝑌𝑖)
�{𝑛∑𝑋1𝑖2 −(∑𝑋1𝑖)2}{𝑛∑𝑌𝑖2−(∑𝑌𝑖)2}
2. Koefisien korelasi antara 𝑌 dengan 𝑋2
𝑟𝑦2= 𝑛∑𝑋2𝑖𝑌𝑖 −
(∑𝑋2𝑖)(∑𝑌𝑖)
3. Koefisien korelasi antara 𝑌 dengan 𝑋3
𝑟𝑦3= 𝑛∑𝑋3𝑖𝑌𝑖 −
(∑𝑋3𝑖)(∑𝑌𝑖)
�{𝑛∑𝑋3𝑖2 −(∑𝑋3𝑖)2}{𝑛∑𝑌𝑖2−(∑𝑌𝑖)2}
Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi
adalah plus (+) atau minus (-) yang menunjukan arah korelasi. Makna sifat korelasi:
1. Tanda positif (+) pada koefisien korelasi menunjukkan hubungan yang searah
(korelasi positif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai
variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya.
2. Tanda negatif (-) pada koefisien korelasi menunjukkan hubungan yang berlawanan
arah (korelasi negatif). Artinya jika suatu nilai variabel mengalami kenaikan maka
nilai variabel yang lain juga mengalami penurunan dan demikian juga sebaliknya.
Sifat korelasi akan menentukan arah dari korelasi. Untuk mengetahui keeratan
antara variabel-variabel tersebut, keeratan korelasi dapat dikelompokkan sebagai
berikut:
1. -1,00 ≤ r ≤ -0,80 berarti korelasi memiliki keeratan sangat kuat.
2. -0,79 ≤ r ≤ -0,50 berarti korelasi memiliki keeratan kuat.
3. -0,49 ≤ r ≤ 0,49 berarti korelasi memiliki keeratan lemah.
4. 0,50 ≤ r ≤ 0,79 berarti korelasi memiliki keeratan kuat.
5. 0,80 ≤ r ≤ 1,00 berarti korelasi memiliki keeratan sangat kuat.
Analisis ini bertujuan untuk mengukur kekuatan dan derajat hubungan antar
dua variabel. Derajat hubungan antara dua variabel disebut korelasi sederhana
sedangkan derajat yang berkaitan dengan tiga atau lebih variabel disebut sebagai
korelasi berganda. Korelasi dapat bersifat linier atau non linier.
2.5 Uji Koefisien Determinasi
Koefisien determinasi yang disimbolkan dengan 𝑅2 bertujuan untuk mengetahui seberapa besar kemampuan variabel independen menjelaskan variabel dependent.
Nilai 𝑅2 dikatakan baik jika berada diatas 0,5 karena nilai 𝑅2 berkisar antara 0 dan 1. Pada umumnya model regresi linier berganda dapat dikatakan layak dipakai untuk
penelitian, karena sebagian besar variabel dependen dijelaskan oleh variabel
independent yang digunakan dalam model.
Maka rumus koefisien determinasi dapat dihitung dari:
𝑅2 =𝑏1∑𝑋1𝑖𝑦𝑖 +𝑏1∑𝑋2𝑖𝑌𝑖 +⋯+𝑏𝑘∑𝑋𝑘𝑖𝑦𝑖 ∑(𝑌𝑖 − Ŷ1)2
sehingga rumus umum koefisien determinasi yaitu:
Harga 𝑅2 diperoleh sesuai dengan variansi yang dijelaskan oleh masing-masing
variabelyang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan
penduga hanya disebabkan oleh variabel yang berpengaruh saja.
2.6 Pengujian Hipotesis
Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu: tingkat
signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval.
Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran
tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat
signifikansi adalah probabilitas menggunakan kesalahan tipe I, yaitu kesalahan
menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada
umumnya sebesar 95%, yang dimaksud dengan tingkat kepercayaan adalah tingkat
dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel berasal.
Dalam melakukan uji hipotesis terdapat dua hipotesis yaitu: 𝐻0 (Hipotesis nol) dan Ha
(hipotesis alternatif). 𝐻0 bertujuan untuk memberikan usulan dugaan kemungkinan
tidak adanya perbedaan antara perkiraan penelitian dengan keadaan yang
sesungguhnya yang diteliti. Ha bertujuan memberikan usulan dugaan adanya
perbedaan perkiraan dengan keadaan sesungguhnya yang diteliti.
Pembentukan suatu hipotesis memerlukan teori-teori maupun hasil penelitian
terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam
membentuk hipotesis ada beberapa hal yang dipertimbangkan:
2. Daerah penerimaan dan penolakan serta teknik arah pengujian (one tailed atau two
tailed).
3. Penentuan nilai hitung statistik.
4. Menarik kesimpulan apakah menerima atau menolak hipotesis yang diusulkan.
Dalam uji keberartian regresi, langkah-langkah yang dibutuhkan untuk pengujian
hipotesis ini antara lain:
1. 𝐻0: 𝛽0 = 𝛽1 = ⋯= 𝛽𝑘 = 0
Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan
variabel tak bebas.
𝐻𝑎: Minimal satu parameter koefisien regresi 𝛽𝑘 yang ≠0
Terdapat hubungan fungsional yang signifikan antara variabel bebas dengan
variabel terikat.
2. Pilih taraf α yang diinginkan
3. Hitung statistik 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 dengan menggunakan persamaan:
𝐹
ℎ𝑖𝑡𝑢𝑛𝑔=
𝐽𝐾𝐽𝐾𝑟𝑒𝑔/ 𝑘𝑟𝑒𝑠/ (𝑛−𝑘−1)
4. Nilai 𝐹𝑡𝑎𝑏𝑒𝑙 menggunakan daftar tabel F dengan taraf signifikansi α
𝐹
𝑡𝑎𝑏𝑒𝑙=
𝐹
(1−𝛼)(𝑘),(𝑛−𝑘−1)5. Kriteria pengujian:
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝐹𝑡𝑎𝑏𝑒𝑙 , maka 𝐻0ditolak dan 𝐻𝑎diterima.