14. Uji Regresi dan Korelasi
MK Biostatistika Prodi Pendidikan Biologi
Murni Ramli@2021
Tujuan Perkuliahan
• Menjelaskan pengertian dan kegunaan regresi, korelasi
• Menjelaskan jenis regresi
• Menerapkan teknik menghitung regresi linier, dan regresi berganda
• Menerapkan uji korelasi
Brainstorming
• Apakah dosis pupuk urea memiliki hubungan yang linier terhadap pertumbuhan vegetative tanaman?
• Apakah dengan penambahan dosis pupuk, tanaman akan bertambah tinggi?
• Apakah dosis atau konsentrasi auksin memiliki hubungan linier dengan jumlah tunas pada explan kentang?
Kasus
• Setiap penambahan dosis atau pengurangan dosis urea akan
langsung berpengaruh terhadap kecepatan pertumbuhan vegetatif tanaman padi yang bersangkutan.
• Dalam kisaran dosis tertentu mungkin hubungannya linier, artinya setiap penambahan dosis urea dengan satuan tertentu akan diikuti dengan peningkatan pertumbuhan yang tertentu pula dari tanaman padi yang bersangkutan.
• Namun demikian, jika dosis urea terus diperbesar, boleh jadi
penambahannya mulai menunjukkan pengaruh yang tidak efektif.
Bahkan pada dosis yang terlalu tinggi justru akan menghambat pertumbuhan tanaman padi.
Contoh
• Hubungan fungsional antara variabel bebas berupa dosis tepung daun lamtoro sebagai substitusi
ransum bungkil kelapa, dengan variabel tak bebas berupa pertumbuhan berat badan ayam pedaging juga merupakan hubungan regresi.
• Dalam hal ini, substitusi atau penggantian bungkil kelapa dengan tepung daun lamtoro dalam dosis rendah tidak akan mempengaruhi pertumbuhan badan ayam pedaging, namun semakin diperbesar dosis substitusinya akan semakin menghambat pertumbuhannya.
• Boleh jadi, hubungan antara dosis substitusi dengan pertumbuhan ayam pedaging tersebut tidak
mutlak linier (dapat kuadratik atau kubik) karena pada dosis rendah mula-mula tidak
menghambat, tetapi pada dosis tinggi akan sangat menghambat. Hal tersebut dicurigai sebagai akibat dari adanya perbedaan daya cerna terhadap protein yang ada dalam tepung daun lamtoro jika dibandingkan dengan daya cerna terhadap protein yang berada dalam bungkil kelapa. Protein dalam tepung daun lamtoro tidak difermentasikan, sebaliknya protein dalam bungkil kelapa
sudah difermentasikan.
• para peneliti harus memiliki kerangka teoretik yang kuat untuk menduga ada tidaknya hubungan fungsional antara variabel bebas dengan variabel tak bebasnya. Dengan demikian, tidak akan terjadi dua variabel bebas yang secara teoritik tidak memiliki hubungan fungsional dicari model regresinya.
Definisi Uji Regresi
Apa itu analisis regresi?
• uji statistika untuk mencari model matematika yang dapat dipakai untuk menjelaskan hubungan fungsional antara variabel bebas dengan variabel tak bebasnya.
• Analisis statistika yang memanfaatkan hubungan
antara dua atau lebih peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya.
• Hubungan fungsional tersebut dinyatakan dalam suatu garis
regresi yang memiliki parameter-parameter sebagai penentu
arah dari garis regresi yang bersangkutan.
• Parameter regresi meliputi intersep yang menunjukkan titik
perpotongan antara garis regresi dengan sumbu Y, dan koefisien regresi yang menunjukkan derajat kemiringan (slope) garis regresi yang bersangkutan.
• Garis regresi akan diperoleh jika hubungan antara variabel bebas dengan variabel tak bebas merupakan hubungan stimulus-respons, jadi merupakan hubungan kausatif. Artinya, setiap perubahan yang terjadi pada variabel bebas akan berpengaruh terhadap variabel tak bebas. Oleh karenanya, variabel bebas dalam hubungan regresi
berkedudukan sebagai variabel prediktor atau sebagai argumen,
sedangkan variabel tak bebas berkedudukan sebagai variabel respon.
lanjutan
• Analisis Regresi : Menguji/mengukur/menganaisis ketergantungan variabel dependen dg variabel bebasnya
• Ketergantungan tsb dapat terjadi antara satu variabel dependen dengan lebih dari satu variabel independen
• Mengukur besarnya pengaruh variabel independen terhadap variabel bebasnya, dan memprediksi variabel tergantung dg menggunakan variabel bebasnya
Kegunaan
• Analisis regresi berguna untuk :
a. mendeskripsikan data yang dimiliki
b. menjadi pengendali (kontrol) thd kasus yang sedang diteliti
c. menjadi prediksi variabel dependen untuk waktu yg akan datang
Tujuan
• Tujuan menggunakan analisis regresi ialah : - Membuat
estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.
- Menguji hipotesis karakteristik dependensi
- Untuk meramalkan nilai rata-rata variabel bebas dengan
didasarkan pada nilai variabel bebas diluar jangkauan sample.
Persyaratan Penggunaan Model Regresi
Model kelayakan regresi linear didasarkan pada hal-hal sebagai berikut:
a. Model regresi dikatakan layak jika angka signifikansi pada ANOVA sebesar < 0.05
b. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika angka Standard Error of Estimate < Standard Deviation
c. Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji t.
Koefesien regresi signifikan jika t hitung > t table (nilai kritis) d. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi
korelasi yang sangat tinggi atau sangat rendah antar variabel bebas.
Syarat ini hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih dari satu.
lanjutan
• f. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r
2semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin baik. Nilai r
2mempunyai karakteristik
diantaranya: 1) selalu positif, 2) Nilai r
2maksimal sebesar 1.
Jika Nilai r
2sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel Y
dapat diterangkan oleh model regresi. Sebaliknya jika r
2sama dengan 0, maka tidak ada hubungan linier antara X
dan Y.
lanjutan
• g. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)
h. Data harus berdistribusi normal i. Data berskala interval atau rasio
j. Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas (disebut juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung (disebut juga sebagai variabel response)
Apa perbedaan analisis korelasi &
regresi?
• Korelasi : melihat hubungan antarvariabel
• Regresi : melihat bentuk hubungan variabel bebas (X) thd variabel terikat (Y), dan memprediksi nilai variable terikat dengan
menggunakan variable bebas.
• analisis regresi : variable bebas berfungsi untuk menerangkan (explanatory) sedang variable terikat berfungsi sebagai yang diterangkan (the explained).
• analisis regresi : data harus berskala interval atau rasio. Hubungan dua variable bersifat dependensi.
Jenis Regresi
• Regresi Linier Sederhana (Bivariate regression) : variabel bebas hanya satu faktor
• Regresi Linier Berganda (multivariate regression) : variabel bebas lebih dari satu faktor
Uji Regresi Linier Sederhana
Langkah Uji
• mencari model regresi (mencari nilai b0 dan b1)
• menguji model regresi yang diperoleh menggunakan uji F
• Mencari koefisien determinasi
• encarian galat baku (pure error) dan tuna cocok (lack of fit)
Contoh
• Suatu penelitian ingin mengetahui seberapa jauh ketebalan seresah (dalam dm) berpengaruh terhadap kadar organik tanah di lantai
hutan (dalam %). Pemikiran untuk mencari model regresi dari kedua variabel tersebut mengingat seresah akan diurai menjadi humus sehingga akan meningkatkan kadar organik tanah di lantai hutan.
Semakin tebal seresah akan semakin tinggi kadar organik tanah jika dekomposisi berjalan wajar. Pengambilan data dilakukan pada 24 titik pengamatan yang dibuat dari tepi hutan sampai ke tengah hutan.
Tugas
UJI REGRESI GANDA (MULTIPLE)
DENGAN DUA VARIABEL BEBAS X1 DAN X2
• Model regresi dengan lebih dari satu variabel bebas disebut dengan regresi ganda atau regresi multipel.
• Ada banyak kemungkinan model regresi ganda.
• Pertama, model regresi ganda tergantung pada banyaknya variabel bebas, apakah dua, tiga, empat dan seterusnya.
• Kedua, model regresi ganda juga tergantung kepada asal variabel bebasnya.
• Sebagai contoh, regresi ganda dengan dua variabel bebas memang benar- benar memiliki dua variabel bebas, di mana variabel bebas yang pertama tidak ada kaitannya dengan variabel bebas yang kedua.
• Misal Anda dapat mencari model hubungan regresi antara ketebalan seresah (variabel bebas pertama) dan kandungan air tanah (variabel bebas kedua) dengan banyaknya kadar organik tanah.
• Namun demikian, Anda dapat pula mencari model hubungan ketebalan seresah dengan kadar organik tanah, dengan menjadikan kuadrat dari ketebalan seresah sebagai variabel bebas kedua.
• Dalam hal ini, ingin diuji apakah model hubungan regresi antara ketebalan seresah dengan kadar organik tanah semata-mata berupa model linier sederhana berupa model Yi = β0 + β1Xi ataukah model regresi kuadratik dengan persamaan dasar berupa Y = β + β x + β x i 2 atau bahkan io1i2 berupa model regresi kubik dengan persamaan dasar Y = β +β x +β x 2 +β x 3 . i o1i2i 3i
Pengujian Model
Tugas
Relationship
Regresi dan korelasi digunakan untuk mengetahui hubungan dua atau lebih kejadian (variabel) yang dapat diukur secara matematis.
Ada dua hal yang diukur atau dianalisis, yaitu : 1. Hubungan fungsional (persamaan
matematis)
2. Kekuatan atau keeratan hubungan
ANALISIS REGRESI
• Hubungan Antarpeubah:
• Fungsional (deterministik) Y=f(X) ; misalnya: Y=10X
• Statistik amatan tidak jatuh pas pada kurva
Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi
• Model regresi sederhana:
n i
X
Y
i
0
1 i
i; 1 , 2 ,...,
Regresi
Makna
0&
1?
Regresi
Analisis Regresi
• Pendugaan terhadap koefisien regresi:
b
0penduga bagi
0dan b
1penduga bagi
1Bagaimana Pengujian terhadap model regresi ??
• parsial (per koefisien) uji-t
• bersama uji-F (Anova)
Bagaimana menilai kesesuaian model ??
R
2(
Koef. Determinasi:
% keragaman Y yang mampu dijelaskan oleh X)
Metode Kuadrat Terkecil
x b y
b
n x x
n
y xy x
b
1 0
2 2
1 ( )
) )(
(
Contoh Data
Jarak Emisi 31 553
38 590 48 608 52 682 63 752 67 725 75 834 84 752 89 845 99 960
Percobaan dalam bidang lingkungan Apakah semakin tua mobil semakin besar juga emisi HC yang dihasilkan?
Diambil contoh 10 mobil secara
acak, kemudian dicatat jarak tempuh yang sudah dijalani mobil (dalam ribu kilometer) dan diukur Emisi HC-nya (dalam ppm)
Emisi = 382 + 5.39 Jarak
Analisis Regresi
100 90
80 70
60 50
40 30
950
850
750
650
550
Jarak
Emisi
Plot antara Emisi Hc (ppm) dg
Jarak Tempuh Mobil (ribu kilometer)
Analisis Regresi
Contoh output regresi dengan Minitab (1)
Regression Analysis (Emisi Hc vs Jarak Tempuh Mobil)
The regression equation is Emisi = 382 + 5.39 Jarak Predictor Coef StDev T P Constant 381.95 42.40 9.01 0.000 Jarak 5.3893 0.6233 8.65 0.000 S = 42.01 R-Sq = 90.3% R-Sq(adj) = 89.1%
Analysis of Variance
Source DF SS MS F P Regression 1 131932 131932 74.76 0.000 Error 8 14118 1765
Total 9 146051 Unusual Observations
Obs Jarak Emisi Fit StDev Fit Residual St Resid 8 84.0 752.0 834.7 18.0 -82.7 -2.18R R denotes an observation with a large standardized residual
Analisis Regresi
Bagaimana Pengujian terhadap model regresi ??
• parsial (per koefisien) uji-t
• bersama uji-F (Anova)
Bagaimana menilai kesesuaian model ??
R
2 Koef. Determinasi
(% keragaman Y yang mampu dijelaskan oleh
X)
Uji Hipotesis
Sumber db JK KT F
Regresi 1 JKR KTR KTR/KTE
Error n - 2 JKE KTE
Total n - 1 JKT
H
0:
1=0 vs H
1:
10
ANOVA (Analysis of Variance) Uji F
JK total = JK regresi + JK error
Keragaman total = keragaman yang dapat dijelaskan oleh model + keragaman yang tidak dapat dijelaskan oleh model
Anova
F ~ F (1,n-2)
ni
i i
n i
i n
i
i
y y y y y
y
1
2 1
2 1
2
( ˆ ) ( ˆ )
)
(
Uji Hipotesis Regresi
H
0:
1≤0 vs H
1:
1>0
Uji Parsial
Statistik uji:
2 ˆ ) (
) (
2 2 1
1
1
n
y s y
x x
S s
S T b
i i
i b
b
Uji Korelasi Parametrik
• Uji Korelasi Parametrik digunakan untuk mencari derajat hubungan antara dua variabel yang memenuhi persyaratan keparametrikan, yakni data harus berasal dari populasi yang terdistribusi normal dan skala pengukuran yang digunakan berupa skala interval atau skala rasio.
• Pada dasarnya ada dua model hubungan korelasional.
• Pertama adalah model hubungan korelasi linier dan kedua model hubungan korelasi non-linier.
• Korelasi linier ditandai adanya persebaran pasangan-pasangan nilai pengamatan antara variabel bebas dan tak bebas/tergayutnya di sekitar garis lurus, sedangkan korelasi nonlinier ditandai adanya persebaran pasangan-pasangan nilai pengamatan antara variabel bebas dan tak bebasnya di sekitar garis lengkung (kurve).
• Dilihat dari banyaknya variabel yang dikorelasikan, dikenal adanya uji korelasi sederhana jika hanya melibatkan dua variabel, dan uji korelasi multiple atau
korelasi ganda jika melibatkan lebih dari dua variabel. Dalam uji korelasi multiple, Anda juga dapat mencari derajat hubungan tiap pasang variabel melalui uji
korelasi parsial.
• Hubungan antara variabel bebas dengan variabel tak bebasnya dinyatakan dalam bentuk koefisien korelasi, yang pada tingkat populasi dinyatakan dengan lambang ρ (baca rho) yang diestimasi berdasarkan koefisien korelasi sampel sebesar r.
• Koefisien korelasi berkisar antara harga –1 sampai dengan +1.
• Jika mendekati harga –1 maka dikatakan bahwa kedua variabel memiliki derajat hubungan yang tinggi yang bersifat negatif atau berkebalikan. Artinya, semakin besar nilai-nilai pengamatan suatu variabel (variabel bebas X) akan diikuti dengan semakin kecilnya nilai-nilai pengamatan dari variabel pasangannya (variabel tak bebas/tergayut Y).
• Sebaliknya, jika mendekati harga +1 maka dikatakan bahwa kedua variabel
memiliki derajat hubungan yang tinggi yang bersifat positif atau selaras. Artinya, semakin besar nilai-nilai pengamatan dari suatu variabel (variabel bebas X) juga diikuti dengan semakin besarnya nilai-nilai pengamatan dari variabel
pasangannya (variabel tergayut atau variabel tak bebas Y).
• Dalam hubungan regresi, dari setiap pasangan nilai pengamatan hanya variabel tak bebasnya yang harus berasal dari populasi yang tersebar normal dan harus acak,
sedangkan untuk hubungan korelasi, setiap pasangan nilai pengamatan keduanya berasal dari populasi tersebar normal yang merupakan pasangan yang acak.
• Dua variabel yang memiliki hubungan regresi memiliki sifat hubungan kausatif sehingga pasti memiliki hubungan korelasi, sebaliknya, dua variabel yang memiliki hubungan korelasi belum tentu memiliki hubungan yang sifatnya regresi.
• Pasangan variabel yang hanya memiliki hubungan korelasi adalah pasangan variabel yang memiliki hubungan simetris.
• Pasangan variabel dikatakan memiliki hubunga
• n simetris jika keduanya dipengaruhi secara kausatif oleh variabel lain. Dengan demikian, dua variabel yang memiliki hubungan simetris hanya menunjukkan hubungan fungsional.
• Walaupun kedua variabel memiliki hubungan yang simetris, namun yang satu tetap
disebut sebagai variabel bebas dan pasangannya didudukkan sebagai variabel tak bebas, tetapi variabel bebas bukan sebagai kausal atau prediktor (predictor) dari variabel tak bebas/tergayutnya.
Kasus
• akibat tanaman diberi pupuk, terjadi pertambahan tinggi, pertambahan berat basah, pertambahan berat kering dan pertambahan diameter batang.
• Apakah pertambahan berat basah, pertambahan berat kering, pertambahan diameter batang dan pertambahan tinggi batang
berkorelasi positif satu sama lain dan korelasinya benar-benar sangat bermakna?
• Jika pertambahan tinggi dan pertumbuhan diameter berkorelasi positif atau sejalan dengan pertambahan berat basah namun tidak sejalan dengan pertambahan berat kering, ada dugaan telah terjadi pertumbuhan yang tidak wajar dan mengarah ke gejala etiolasi.
• Contoh lain, akibat pemupukan diharapkan ada pertambahan diameter cabang serta pertambahan produksi getah lateks pada pohon karet.
Oleh karena itu, diperlukan penyelidikan apakah terdapat korelasi yang positif antara ukuran diameter cabang dengan banyaknya produksi
getah lateks yang dihasilkan oleh pohon karet.
• Anda tidak dapat menjamin bahwa setiap pertambahan diameter tertentu dari cabang pohon karet akan diikuti dengan naiknya getah lateks yang dihasilkan dalam bentuk hubungan regresi.
• Artinya bahwa setiap pertambahan ukuran diameter tertentu pasti akan menyebabkan meningkatnya produksi lateks dengan jumlah tertentu.
• Namun demikian, Anda berharap bahwa ada kecenderungan
pertambahan diameter cabang diikuti dengan naiknya getah latek yang dihasilkan, mengingat semakin besar diameter berarti saluran getah yang ada pada kortek di dalam cabang pohonnya semakin banyak.
Korelasi Hasil Kali Momen Pearson
• Uji Korelasi sederhana
• Digunakan untuk mencari besarnya derajat hubungan korelasi linier dari dua pasang data yang memenuhi persyaratan parametrik. Untuk kepentingan uji korelasi ini, ulangan minimum idealnya sebanyak 30.
Organisasi Data
Perhutungan koefisien r
Pengujian signifikansi koefisien korelasi
• Untuk mengetahui apakah koefisien korelasi yang Anda peroleh benar-benar bermakna pada tingkat populasi maka Anda dapat
membandingkan harga koefisien korelasi hasil perhitungan {rhitung}
dengan koefisien korelasi pada tabel (rtabel) dengan taraf kesalahan yang ditetapkan dan derajat bebas (db) sebesar n-2.
• Taraf kesalahan digunakan pada uji korelasi adalah 5% atau 1%.
• Anda dapat melakukan uji dua pihak jika Anda tidak punya hipotesis penelitian bahwa variabel bebas dan variabel tak bebasnya pasti memiliki hubungan korelasi yang signifikan.
• Sebaliknya, jika Anda memiliki hipotesis penelitian bahwa kedua variabel yang Anda teliti pasti memiliki hubungan korelasional yang bermakna maka lakukan uji satu pihak (pihak kiri) jika dipastikan korelasi negatif atau uji pihak kanan jika korelasi dipastikan positif.
Pengujian hipotesis
• Jika Anda menggunakan uji dua pihak maka rumusan hipotesis nihil (H0) adalah ρ = 0, lawan hipotesis tandingan (Ha); ρ ≠ 0. Jika Anda menggunakan uji satu pihak berupa pihak kiri maka H0 : ρ ≥ 0 lawan Ha : ρ < 0. Jika Anda menggunakan uji satu pihak berupa pihak kanan maka H0 : ρ≤0 lawan Ha : ρ> 0.
• Anda juga dapat mengonversi harga rhitung menjadi nilai thitung yang kemudian dibandingkan dengan ttabel dengan derajat bebas (db) sebesar n-2. Adapun rumus konversinya adalah sebagai berikut.
Tugas
Uji Korelasi Non Parametrik
Uji Korelasi Berjenjang/Berperingkat Spearman
• Uji korelasi berjenjang/berperingkat Spearman digunakan untuk mencari derajat hubungan korelasional dua variabel yang tidak memenuhi persyaratan keparametrikan.
• Artinya, pemasangan-pemasangan nilai pengamatan tidak berasal dari populasi yang tersebar normal walaupun skala pengukuran yang digunakan merupakan skala interval atau skala rasio.
• Uji korelasi ini juga digunakan untuk mencari derajat hubungan korelasional dua variabel yang datanya diukur menggunakan skala ordinal.
• Disebut uji korelasi berjenjang atau berperingkat karena data mentah yang ada harus diubah ke skala ordinal dengan cara memberikan
peringkat terhadap data mentah yang akan diolah.