BAB 2 LANDASAN TEORI - Analisis Beberapa Faktor Pengemudi yang Mempengaruhi Tingkat Kecelakaan Lalu Lintas di Provinsi Sumatera Utara Tahun 2013

(1)

BAB 2

LANDASAN TEORI

2.1Pengertian Regresi

Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir

Francis Galton. Beliau memperkenalkan model peramalan, penaksiran, atau

pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan penelitiannya

terhadap tinggi badan manusia. Galton melakukan suatu penelitian dimana penelitian

tersebut membandingkan antara tinggi anak lakilaki dan tinggi badan ayahnya. Galton

menunjukan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa

generasi cenderung mundur (Regressed) pendek cenderung lebih tinggi dari ayahnya,

jadi seolah-olah semua anak laki-laki yang tinggi dan anak laki-laki yangpendek

bergerak menuju kerata-rata tinggi dari seluruh anak laki-laki yang menurut istilah

Galton disebut dengan “Regression to mediocrity”. Dari uraian tersebut dapat

disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tuanya.

Istilah “regresi” pada mulanya bertujuan untuk membuat perkiraan nilai suatu

variabel (tinggi badan anak) terhadap variabel yang lain (tinggi badan orang tua). Pada

(2)

membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain

yang berhubungan dengan variabel tersebut.

Jadi prinsip dasar yang harus dipenuhi dalam membangun suatu persamaan

regresi adalah bahwa antara suatu variabel tidak bebas (Dependent variable) dengan

variabel-variabel bebas (Independent variable) lainnya memiliki sifat hubungan sebab

akibat hubungan kasualitas, baik didasarkan pada penjelasan logis tertentu.

2.2Analisis Regresi Linier

Analisis regresi linier merupakan teknik yang digunakan dalam persamaan matematik

yang menyatakan hubungan fungsional antara variabel-variabel. Analisis regresi linier

atau regresi garis lurus digunakan untuk:

1. Menentukan hubungan fungsional antar variabel dependen dengan independen.

Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang

berbentuk linier.

2. Meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan

variabel lain yang diketahui melalui persamaan garis regresinya.

Analisis regresi terdiri dari dua bentuk, yaitu:

1. Analisis Regresi Linier Sederhana

(3)

Analisis regresi linier sederhana adalah bentuk regresi dengan model yang

bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel dependent

(terikat) dan variabel independent (bebas). Sedangkan analisis regresi berganda adalah

bentuk regresi dengan model yang memiliki hubungan antara satu variabel dependent

dengan dua atau lebih variabel independent.

Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau

lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui

dengan baik. Jika, 𝑋1,𝑋2, … ,𝑋𝑘 adalah variabel-variabel independent dan Y adalah

variabel dependent, maka terdapat hubungan fungsional antara X dan Y, dimana

variasi dari X akan diiringi pula oleh variasi dari Y. jika dibuat secara matematis

hubungan itu dapat dijabarkan sebagai berikut:

dimana: Y = f (𝑋₁,𝑋₂, … ,𝑋_𝑘 , e)

Y = variabel dependent (terikat)

X = variabel Independent (bebas)

e = variabel residu (disturbace term)

Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang

lazim dilaksanakan yaitu:

1. Mengadakan estimasi terhadap parameter berdasarkan data empiris.

2. Menguji seberapa besar variasi variabel dependent dapat diterangkan oleh variasi

(4)

3. Menguji apakah estimasi parameter tersebut signifikan atau tidak.

4. Melihat apakah tanda magnitude dari estimasi parameter cocok dengan teori.

2.2.1 Analisis Regresi Linier Sederhana

Regresi linier sederhana digunakan untuk memperkirakan hubungan antara dua

variabel dimana hanya terdapat satu variabel atau peubah bebas X dan satu peubah

terikat Y.

Dalam bentuk persamaan, model regresi sederhana adalah sebagai berikut:

𝑌= 𝑎 +𝑏𝑋

dimana:

Y = variabel dependen (terikat)

X = variabel Independen (bebas)

a = penduga bagi intercept

b = penduga bagi koefisien regresi (β)

Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sebagai

berikut:

1. Model regresi harus linier dalam parameter.

(5)

3. Nilai disturbace term sebesar 0 atau dengan simbol sebagai berikut:

(E (U/X)) = 0.

4. Varian untuk masing-masing error term (kesalahan) konstan.

5. Tidak terjadi auto korelasi.

6. Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam

model yang digunakan dalam analisis empiris.

7. Jika variabel bebas lebih dari datu, maka antara variabel bebas (explanatory) tidak

ada hubungan linier yang nyata.

2.2.2 Analisis Regresi Linier Berganda

Untuk memperkirakan nilai variabel terikat Y, akan lebih baik apabila ikut

memperhitungkan variabel-variabel bebas lain yang ikut mempengaruhi nilai Y.

dengan demikian dimiliki hubungan antara satu variabel terikat Y dengan beberapa

variabel lain yang bebas 𝑋₁,𝑋2 dan 𝑋3, … ,𝑋4. Untuk itulah digunakan regresi linear

berganda.

Dalam pembahasan mengenai regresi sederhana, simbol yang digunakan untuk

variabel bebasnya adalah X. dalam regresi berganda, persamaan regresinya memiliki

lebih dari satu variabel bebas maka perlu menambah tanda bilangan pada setiap

(6)

Secara umum persamaan regresi berganda dapat ditulis sebagai berikut:

𝑌𝑖 = 𝛽0+𝛽1𝑋1𝑖+𝛽2𝑋2𝑖+⋯+𝛽𝑘𝑋𝑘+𝜀𝑘 (Untuk Populasi)

𝑌𝑖 = 𝑏0+𝑏1𝑋1𝑖+𝑏2𝑋2𝑖+⋯+𝑏𝑘𝑋𝑘+𝜀𝑘 (Untuk Sampel)

dimana:

Y = Variabel terikat

X = Variabel bebas

𝑏0,𝑏1,𝑏2, … ,𝑏𝑘 = Koefisien regresi untuk data populasi

𝛽0,𝛽1,𝛽2, … ,𝛽𝑘 = Koefisien regresi untuk data sampel

𝜀 = Variabel kesalahan (galat)

Dalam penelitian ini, digunakan empat variabel yang terdiri dari satu variabel

bebas Y dan tiga variabel X yaitu 𝑋₁,𝑋₂,𝑋₃. Maka persamaan regresi bergandanya

adalah:

𝑌𝑖 = 𝑏0+𝑏1𝑋1𝑖+𝑏2𝑋2𝑖+𝑏3𝑋3

dimana:

Y = Variabel terikat

X = Variabel bebas

(7)

Persamaan diatas dapat diselesaikan dengan empat bentuk yaitu:

∑𝑌𝑖 = 𝑏0𝑛+𝑏1∑𝑋1𝑖+𝑏2∑𝑋2𝑖+𝑏3∑𝑋3𝑖

∑𝑌𝑖𝑋1𝑖 =𝑏𝑜∑𝑋1𝑖+ 𝑏₁∑𝑋_1𝑖2 +𝑏2∑𝑋1𝑖𝑋2𝑖+𝑏3∑𝑋1𝑖𝑋3𝑖

∑𝑌𝑖𝑋2𝑖 = 𝑏𝑜∑𝑋2𝑖+𝑏1∑𝑋1𝑖𝑋2𝑖+ 𝑏2∑𝑋_2𝑖2 +𝑏3∑𝑋2𝑖𝑋3𝑖

∑𝑌𝑖𝑋3𝑖 = 𝑏𝑜∑𝑋3𝑖+𝑏1∑𝑋1𝑖𝑋3𝑖+ 𝑏2∑𝑋2𝑖𝑋3𝑖+ 𝑏3∑𝑋3𝑖2

dan harga-harga 𝑏0,𝑏1,𝑏2,𝑏3 didapat dengan menggunakan persamaan diatas, dengan

menggunakan metode eliminasi atau subtitusi. Dalam penelitian ini penulis

menggunakan software dari computer.

2.3Uji Keberartian Regresi

Sebelum persamaan regresi yang diperoleh digunakan untuk membuat kesimpulan

terlebih dahulu diperiksa setidak-tidaknya mengenai kelinieran dan keberartiannya.

Pemeriksaan ini ditempuh melalui pengujian hipotesis. Uji keberartian dilakukan

untuk meyakinkan diri apakah regresi yang didapat berdasarkan penelitian ada artinya

bila dipakai untuk membuat kesimpulan mengenai hubungan sejumlah peubah yang

sedang dipelajari.

Untuk itu diperlukan dua macam jumlah kuadrat (JK) sebagai berikut:

1. Jumlah Kuadrat untuk regresi yang ditulis JK_reg dan

(8)

Jika x1i= X1i− X1, x2i= X2i− X2,…, xki= Xki− Xk dan yi= Yi-Ymaka secara

umum jumlah kuadrat-kuadrat tersebut dapat dihitung dari:

𝐽𝐾𝑟𝑒𝑔 = 𝑏1∑𝑥1𝑖𝑦𝑖 +𝑏2∑𝑥2𝑖𝑦𝑖 +𝑏3∑𝑥3𝑖𝑦𝑖

𝐽𝐾𝑟𝑒𝑠 = ∑(𝑌𝑖− Ŷ1)2

dengan derajat kebebasan 𝑑𝑘 = (𝑛 − 𝑘 −1) untuk sampel berukuran 𝑛.

Dengan demikian uji keberartian regresi berganda dapat dihitung dengan:

𝐹

ℎ𝑖𝑡𝑢𝑛𝑔

=

𝐽𝐾𝑟𝑒𝑔

/ 𝑘

𝐽𝐾𝑟𝑒𝑠/ (𝑛−𝑘−1)

dimana stastistik F yang menyebar mengikuti distribusi F dengan derajat kebebasan

pembilang 𝑉₁ = 𝑘 dan penyebut 𝑉₂ = 𝑛 − 𝑘 −1.

2.4 Uji Koefisien Regresi Linier Berganda

Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu

diadakan pengujian tersendiri mengenai koefisien-koefisien regresi.

Misalkan populasi memilih model regresi linier berganda:

𝜇𝑦.𝑥_1,𝑥_2,…,𝑥_𝑛 = 𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑘𝑋𝑘

yang berdasarkan sebuah sampel acak berukuran n ditaksir oleh regresi berbentuk:

(9)

Akan dilakukan pengujian hipotesis dalam bentuk sebagai berikut:

𝐻0:𝛽₁ = 0,1,2, … ,𝑘

𝐻𝑎:𝛽1 ≠ 0,1,2, … ,𝑘

Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran 𝑆𝑦₁_,₂_,…,_𝑘,

jumlah kuadrat-kuadrat ∑𝑋_𝑖𝑗2 dengan 𝑥_𝑖𝑗 = 𝑋_𝑗− X_j

dan koefisien korelasi ganda

antara masing-masing variabel bebas 𝑋 dengan variabel tak bebas 𝑌 dalam regresi

yaitu 𝑅_𝑖_.

Dengan besaran-besaran ini dibentuk kekeliruan baku koefisien b, yaitu:

𝑠𝑏𝑖 = � 𝑆𝑦,1,2,…,𝑘

Selanjutnya dapat dihitung dalam statistik:

(10)

dengan demikian kriteria pengujian: jika 𝑡𝑖 > 𝑡𝑡𝑎𝑏𝑒𝑙 maka 𝐻𝑜ditolak dan jika

𝑡𝑖 < 𝑡𝑡𝑎𝑏𝑒𝑙 maka 𝐻𝑜 diterima, yang akan berdistribusi t dengan derajat kebebasan

𝑑𝑘 = (𝑛 − 𝑘 −1) dan 𝑡_{𝑡𝑎𝑏𝑒𝑙} = 𝑡_{𝑛−𝑘−𝑖}_,_𝑎_/₂_.

2.5 Uji Koefisien Korelasi

Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang

tidakmenunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji

korelasi tidak membedakan jenis variabel (tidak ada variabel dependent maupun

independent). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji

korelasi terdiri dari Pearson, Spearman, dan Kendall. Jika sampel data lebih dai 30

(sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson

(karena memenuhi asumsi parametrik). Jika jumlah sampel kurang dari 30 (sampel

kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman

atau Kendall (karena memenuhi asumsi non-parametrik).

Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur

kekuatan (keeratan) suatu hubungan antar variabel. Koefisien korelasi biasanya

(11)

Koefisien korelasi dapat dirumuskan sebagai berikut:

𝑟= 𝑛∑𝑋𝑖𝑌𝑖−(∑𝑋𝑖)(∑𝑌𝑖)

�√{𝑛∑𝑋_𝑖2−(∑𝑋𝑖)2}{𝑛∑𝑌_𝑖2 −(∑𝑌_𝑖)2}

dimana:

𝑛 = banyaknya pasangan data 𝑋dan 𝑌

∑𝑋𝑖 = jumlah nilai dari variabel 𝑋𝑖

∑𝑌𝑖 = jumlah nilai dari variabel 𝑌𝑖

∑𝑋𝑖2 = jumlah nilai kuadrat dari variabel 𝑋𝑖

∑𝑌𝑖2 = jumlah nilai kuadrat dari variabel 𝑌𝑖

∑𝑋𝑖𝑌𝑖 = jumlah hasil kali nilai variavel 𝑋𝑖 dan 𝑌𝑖

Untuk menghitung koefisien korelasi antara variabel tak bebas Y dengan tiga variabel

bebas 𝑋1,𝑋₂,𝑋3, yaitu:

1. Koefisien korelasi antara 𝑌 dengan 𝑋₁

𝑟𝑦1= 𝑛∑𝑋1𝑖𝑌𝑖 −(∑𝑋1𝑖)(∑𝑌𝑖)

�{𝑛∑𝑋_1𝑖2 −(∑𝑋_1𝑖)2}{𝑛∑𝑌_𝑖2−(∑𝑌_𝑖)2}

2. Koefisien korelasi antara 𝑌 dengan 𝑋₂

𝑟𝑦2= 𝑛∑𝑋2𝑖𝑌𝑖 −

(∑𝑋2𝑖)(∑𝑌_𝑖)

(12)

3. Koefisien korelasi antara 𝑌 dengan 𝑋₃

𝑟𝑦3= 𝑛∑𝑋3𝑖𝑌𝑖 −

(∑𝑋3𝑖)(∑𝑌_𝑖)

�{𝑛∑𝑋_3𝑖2 −(∑𝑋3𝑖)2}{𝑛∑𝑌_𝑖2−(∑𝑌_𝑖)2}

Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi

adalah plus (+) atau minus (-) yang menunjukan arah korelasi. Makna sifat korelasi:

1. Tanda positif (+) pada koefisien korelasi menunjukkan hubungan yang searah

(korelasi positif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai

variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya.

2. Tanda negatif (-) pada koefisien korelasi menunjukkan hubungan yang berlawanan

arah (korelasi negatif). Artinya jika suatu nilai variabel mengalami kenaikan maka

nilai variabel yang lain juga mengalami penurunan dan demikian juga sebaliknya.

Sifat korelasi akan menentukan arah dari korelasi. Untuk mengetahui keeratan

antara variabel-variabel tersebut, keeratan korelasi dapat dikelompokkan sebagai

berikut:

1. -1,00 ≤ r ≤ -0,80 berarti korelasi memiliki keeratan sangat kuat.

2. -0,79 ≤ r ≤ -0,50 berarti korelasi memiliki keeratan kuat.

3. -0,49 ≤ r ≤ 0,49 berarti korelasi memiliki keeratan lemah.

4. 0,50 ≤ r ≤ 0,79 berarti korelasi memiliki keeratan kuat.

5. 0,80 ≤ r ≤ 1,00 berarti korelasi memiliki keeratan sangat kuat.

(13)

Analisis ini bertujuan untuk mengukur kekuatan dan derajat hubungan antar

dua variabel. Derajat hubungan antara dua variabel disebut korelasi sederhana

sedangkan derajat yang berkaitan dengan tiga atau lebih variabel disebut sebagai

korelasi berganda. Korelasi dapat bersifat linier atau non linier.

2.5 Uji Koefisien Determinasi

Koefisien determinasi yang disimbolkan dengan 𝑅2 bertujuan untuk mengetahui seberapa besar kemampuan variabel independen menjelaskan variabel dependent.

Nilai 𝑅2 dikatakan baik jika berada diatas 0,5 karena nilai 𝑅2 berkisar antara 0 dan 1. Pada umumnya model regresi linier berganda dapat dikatakan layak dipakai untuk

penelitian, karena sebagian besar variabel dependen dijelaskan oleh variabel

independent yang digunakan dalam model.

Maka rumus koefisien determinasi dapat dihitung dari:

𝑅2 ₌𝑏1∑𝑋1𝑖𝑦𝑖 +𝑏1∑𝑋2𝑖𝑌𝑖 +⋯+𝑏𝑘∑𝑋𝑘𝑖𝑦𝑖 ∑(𝑌_𝑖 − Ŷ₁)2

sehingga rumus umum koefisien determinasi yaitu:

(14)

Harga 𝑅2 diperoleh sesuai dengan variansi yang dijelaskan oleh masing-masing

variabelyang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan

penduga hanya disebabkan oleh variabel yang berpengaruh saja.

2.6 Pengujian Hipotesis

Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu: tingkat

signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval.

Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran

tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat

signifikansi adalah probabilitas menggunakan kesalahan tipe I, yaitu kesalahan

menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada

umumnya sebesar 95%, yang dimaksud dengan tingkat kepercayaan adalah tingkat

dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel berasal.

Dalam melakukan uji hipotesis terdapat dua hipotesis yaitu: 𝐻₀ (Hipotesis nol) dan Ha

(hipotesis alternatif). 𝐻0 bertujuan untuk memberikan usulan dugaan kemungkinan

tidak adanya perbedaan antara perkiraan penelitian dengan keadaan yang

sesungguhnya yang diteliti. Ha bertujuan memberikan usulan dugaan adanya

perbedaan perkiraan dengan keadaan sesungguhnya yang diteliti.

Pembentukan suatu hipotesis memerlukan teori-teori maupun hasil penelitian

terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam

membentuk hipotesis ada beberapa hal yang dipertimbangkan:

(15)

2. Daerah penerimaan dan penolakan serta teknik arah pengujian (one tailed atau two

tailed).

3. Penentuan nilai hitung statistik.

4. Menarik kesimpulan apakah menerima atau menolak hipotesis yang diusulkan.

Dalam uji keberartian regresi, langkah-langkah yang dibutuhkan untuk pengujian

hipotesis ini antara lain:

1. 𝐻0: 𝛽₀ = 𝛽₁ = ⋯= 𝛽_𝑘 = 0

Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan

variabel tak bebas.

𝐻𝑎: Minimal satu parameter koefisien regresi 𝛽_𝑘 yang ≠0

Terdapat hubungan fungsional yang signifikan antara variabel bebas dengan

variabel terikat.

2. Pilih taraf α yang diinginkan

3. Hitung statistik 𝐹_{ℎ𝑖𝑡𝑢𝑛𝑔} dengan menggunakan persamaan:

𝐹

ℎ𝑖𝑡𝑢𝑛𝑔

=

_𝐽𝐾𝐽𝐾𝑟𝑒𝑔/ 𝑘

𝑟𝑒𝑠/ (𝑛−𝑘−1)

4. Nilai 𝐹_{𝑡𝑎𝑏𝑒𝑙} menggunakan daftar tabel F dengan taraf signifikansi α

𝐹

𝑡𝑎𝑏𝑒𝑙

=

𝐹

(1−𝛼)(𝑘),(𝑛−𝑘−1)

5. Kriteria pengujian:

𝐹ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝐹𝑡𝑎𝑏𝑒𝑙 , maka 𝐻0ditolak dan 𝐻𝑎diterima.