• Tidak ada hasil yang ditemukan

Bagian 5 Korelasi & Regresi Linear

5.2 Regresi

5.2 Regresi

Y = a + biXi + ε Keterangan:

Y = variabel tergantung (dependent variable) Xi = variabel bebas (independent variable) ke i bi = koefisien regresi variabel bebas ke i a = konstan atau intercept

ε = residu (eror) 4. Persyaratan

Validitas hasil analisis regresi diragukan atau bias bila asumsi analisis regresi seperti berikut tidak terpenuhi.

1. Homoskedastik

Data dari variabel outcome Y, untuk setiap nilai variabel prediktor X, harus berdistribusi normal dan memiliki varian yang sama (homogen) serta memiliki nilai rerata yang terletak dalam satu garis lurus atau disebut Homoskedastik.

2. Tidak terdapat multikolinearitas

Tidak terdapat korelasi yag kuat antara variabel prediktor atau tidak tedapat multikolinearitas.

3. Tidak terdapat otokorelasi

Tidak terdapat korelasi berseri antara variabel prediktor (pada data time series).

4. Linearitas

Terdapat hubungan linear dari semua variabel prediktor Xi dengan variabel outcome Y.

5. Koefisien regresi

Koefisien regresi menyatakan besarnya perubahan yang terjadi pada nilai variabel tergantung Y sebagai pengaruh dari setiap perubahan satu unit nilai variabel bebas X dan koefisien regresi diberi simbol “b”. Misalnya dari hasil analisis pengaruh variabel bebas X terhadap variabel tergantung Y mempunyai nilai b = 3, maka ini berarti kalau nilai nilai X berubah satu unit maka nilai Y akan berubah 3 unit. Koefisien regresi dapat dihitung dengan rumus sebagai berikut:

∑ ∑ ∑

= −

n X X

n Y X b XY

/ ) (

/ ) )(

(

2 2

Keterangan:

b = koefisien regresi

∑XY = jumlah hasil kali nilai var bebas (X) dengan nilai var tak bebas (Y)

∑X = jumlah nilai variabel bebas (X)

∑Y = jumlah nilai var tak bebas (Y)

∑X2 = jumlah kwadrat nilai var bebas (X) n = jumlah sampel

6. Koefisien determinasi R2 (explanatory Power)

Besar pengaruh variabel bebas X terhadap variabel tergantung Y dinyatakan dengan besarnya nilai koefisien determinan R2. Nilai R2 menyatakan proporsi variasi variabel tergantung Y yang dapat dijelaskan oleh nilai variabel bebas X. Nilai R2 dapat bervariasi antara 0 sampai 1. Bilai nilai R2 = 1, berarti semua variasi nilai variabel tergantung Y dapat dijelaskan oleh variabel bebas X berarti tidak ada faktor lain yang ikut mempengaruhi nilai variabel tergantung Y tersebut. Sebaliknya, bila nilai R2 = 0 menunjukkan bahwa variabel bebas X sama sekali tidak berpengaruh terhadap variabel tergantung Y. Apabila persamaan regresi linear antara variabel bebas X dan variabel tergantung Y adalah: Y’ = a + bX, maka besar nilai R2 dapat dihitung sebagai berikut.

7. Metode seleksi variabel prediktor

Metode seleksi variabel prediktor terdiri dari metode Enter, Backward, Forward, dan Stepwise. Berikut adalah penjelasan singkat dari masing-masing metode.

1) Method Enter

Pada metode ini, semua variabel dipilih sekaligus sehingga hanya ada satu model. Pada pilihan ini, hanya R2 gabungan yang dihitung sedangkan R2 dari masing-masing prediktor tidak dihitung.

2) Method Backward

Pada metode ini seleksi dilakukan secara bertahap. Tahap pertama, semua variabel dimasukan ke dalam model, kemudian variabel prediktor yang tidak berhubungan dengan variabel outcome, satu-persatu dikeluarkan dari model.

Pada model ini juga tidak dihitung R2 dari masing-masing variabel yang berpengaruh.

3) Method Forward

Berlawanan dengan metode Backward, pada metode ini, variabel prediktor yang berpengaruh akan dimasukan ke dalam model secara bertahap mulai dari

yang pengaruhnya paling besar sampai yang paling kecil. Pada model ini akan dihitung R2 dari masing-masing prediktor yang ada di dalam model.

4) Method Stepwise

Metode ini merupakan gabungan dari Forward dengan Backward. Pada metode ini, semua prediktor yang ada di dalam model dapat dihitung R2nya.

8. Prosedur Regresi

Sebagai bahan latihan akan dipakai data hasil penelitian cross-sectional hubungan TNF_α, sTNF-R1, RBP4, HOMa-IR dan imt terhadap kadar gula darah penderita DM. Data disimpan dalam file: latihan regresi linier.dta

Prosedure Regresi adalah sbb:

1) Buka file : latihan regresi linear.dta 2) Analisis Regresi Linear

Untuk memulai analisis regresi, pilih menu “Statistic”, “Linier models and related”, kemudian klik “Linear Regression”, maka akan muncul box dialog sbb:

Masukkan variabel gd_puasa ke dependent variable sedangkan tnf_a, stnfr1, rbp4, homa_ir dan imt ke Independent variable. Setelah itu klik OK, maka akan muncul hasil:

Hasil yang sama didapat dengan mengetik perintah:

regress gd_puasa tnf_a stnfr1 rbp4 homa_ir imt

Sebelum membaca hasil analisis regresi linier maka terlebih dahulu dilakukan diagnostik untuk menilai apakah model sudah memenuhi persyaratan (lihat sub bab 5.2.3).

a. Asumsi yang dapat dinilai dari hasil analisis regresi linier diatas adalah linearitas. Linearitas hubungan antara variabel prediktor terhadap variabel outcome Y dapat dilihat dari hasil analisis Anova. Dinyatakan terdapat hubungan linear bila nilai p (Prob>F) dari analisis Anova < α. Pada hasil Anova di atas didapatkan nilai p < 0,05 (<0,001), berarti terdapat hubungan yag linear antara prediktor dengan outcome.

b. Untuk menilai apakah asumsi homoskedastik terpenuhi maka dilakukan test for heteroskedasticity dengan cara: pilih menu “Statistic”, “Linier models and related”, kemudian pilih “Regression diagnostic” selanjutnya klik

“Spesification tests and etc”, maka akan muncul box dialog sbb:

Pilihlah “Tests for heteroskedasticity (httest), kemudian centang “Use fitted values of the regression”. Setelah itu klik OK maka akan muncul hasil sbb:

Hasil yang sama akan didapat jika menegtik perintah: estat hettest

Interpretasi: Berdasarkan hasil Tests for heteroskedasticity didapatkan nilai p (Prob>chi2) < 0,001 maka dapat disimpulkan bahwa model yang dibuat tidak fit dengan asumsi heteroskedasticity, dengan kata lain asumsi homoskedasticity terpenuhi.

c. Selanjutnya dilakukan uji asumsi multikolinearitas, dengan cara: pilih menu

“Statistic”, “Linier models and related”, kemudian pilih “Regression diagnostic” selanjutnya klik “Spesification tests and etc”, maka akan muncul box dialog sbb:

Pilihlah Variance inflation factor for the independent variable (vif) kemudian klik OK, maka akan muncul hasil sbb:

Hasil yang sama akan didapat jika menegtik perintah: estat vif

Interpretasi: Adanya multikolinearitas antar variabel prediktor ditentukan dari nilai VIF (Variance Inflation Factors). Dinyatakan terdapat multikoliearitas bila nilai VIF > 10. Pada output STATA di atas didapatkan nilai VIF untuk masing-masing predictor ≤ 10, maka dapat disimpulkan bahwa tidak terdapat multikolinearitas antara variabel prediktor.

d. Otokorelasi atau korelasi berseri hanya mungkin terjadi pada data time series, oleh karena data penelitian ini bukan data time series maka penilaian terhadap adanya otokorelasi tidak perlu dilakukan atau dengan kata lain tidak terdapat otokorelasi.

9. Interpretasi Persyaratan

Berdasarkan hasil regression diagnostic diatas maka dapat dikatakan bahwa semua persyaratan untuk uji regressi linier telah terpenuhi.

Hasil analisis regresi linier

Apakah variabel prediktor Xi berpengaruh terhadap variabel outcome Y, dilihat dari hasil analisis Anova. Variabel prediktor dinyatakan ada yang berpengaruh secara linear bila nilai p dari Anova < 0,05. Pada hasil analisis di atas didapatkan nilai p dari hasil Anova < 0,05, berarti ada variabel prediktor Xi yang berpengaruh terhadap Y.

Kalau menggunakan metode ENTER dalam seleksi variabel prediktor, dari hasil analisi Anova belum dapat diketahui variabel prediktor mana saja yang berpengaruh.

Untuk mengetahuinya dapat dilihat dari koefisien regresinya. Sebaliknya, kalau metode seleksi menggunakan metode Stepwise, forward atau backward, akan diketahui variabel prediktor mana yang berpengaruh.

Besar pengaruh dari variabel yang terdapat di dalam model regresi dapat dilihat dari nilai R2 yang terdapat pada model summary. Bila menggunakan metode seleksi ENTER, nilai R2 yang diberikan merupakan nilai R2 gabungan dari semua variabel prediktor. Bila menggunakan metode Stepwise atai Forward, R2 dari masing-masing variabel prediktor yang berpengaruh dapat dilihat dari nilai R2 change.

Analisis di atas menggunakan metode enter dan berdasarkan hasil analisis diketahui kelima prediktor tersebut memberikan pengaruh sebesar 60,1% terhadap variasi outcome (kadar gula darah puasa). Hanya 2 prediktor yang berpengaruh secara bermakna terhadap kadar gula darah puasa, yaitu RBP4 dengan koefesien β sebesar 1,2 dan HOMA IR dengan koefesien β sebesar 14,7.

Dalam dokumen MODUL MANAJEMEN DATA DAN STATISTIKA DASAR (Halaman 56-64)

Dokumen terkait