LAPORAN
ANALISIS REGRESI
TUGAS UJIAN AKHIR SEMESTER
(PEMILIHAN MODEL REGRESI TERBAIK dan UJI ASUMSI KLASIK)
Dosen Pengampu:
Naomi Nessyana Debataraja, M.Si
LAILI IZZATI
NIM H1091141041
JURUSAN MATEMATIKA
PROGRAM STUDI STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS TANJUNGPURA
PONTIANAK
BAB I PENDAHULUAN 1.1 Latar Belakang
Statistik merupakan data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Statistik juga dapat digunakan untuk menguji suatu hipotesis dengan kebenaran secara ilmiah yang sering disebut dengan statistik inferensial. Statistik parametrik merupakan salah satu macam statistik, yang salah satu fungsinya untuk menghitung korelasi atau pengaruh suatu variabel terhadap variabel lainnya yang tercakup dalam regresi linear berganda. Tujuannya adalah agar bisa menjalankan bisnis dengan efektif dan efisien. Dan salah satu dari ilmu statistik yang mendukung hal tersebut adalah statistik parametrik pada regresi linear berganda .
Dalam kehidupan sehari-hari, sering kali kita temui bahwa nilai suatu variabel (Y) dipengaruhi oleh nilai variabel lain (X), atau berkaitan dengan nilai variabel lain. Bentuk hubungan antar kedua variabel tersebut adalah persoalan yang akan kita bahas dalam analisis regresi dan korelasi. Sebagai contoh, kita mungkin tertarik untuk meneliti hubungan antara pola konsumsi seseorang dalam suatu komunitas tertentu (Y) dengan penghasilannya per bulan (X). Dalam setiap kasus di atas, variabel Y merupakan variabel dependen atau variabel respons yang nilai-nilainya tergantung pada nilai-nilai variabel X, yang disebut sebagai variabel independen atau variabel bebas. Analisis regresi digunakan untuk membangun suatu model matematis untuk menjelaskan bentuk hubungan antar kedua variabel tersebut (jika hubungan tersebut ada). Terkait permasalahan yang melatarbelakangi permasalahan tersebut penulis ingin melakukan sebuah pengkajian pada sebuah kasus terhadap faktor yang mempengaruhi Berat Badan terhadap komposisi tubuh. Dari permasalahan tersebut kemudian akan dilakukan pemilihan model regresi terbaik dan uji asumsi klasik.
1.2 Rumusan Masalah
Bagaimana penerapan Analisis Regresi Berganda terhadap Pemilihan Model Regresi terbaik dan Uji Asumsi Klasik pada sebuah kasus pengaruh hubungan berat badan pada seseorang melalui monitoring evaluasi komposisi tubuh terhadap beberapa variabel dengan menggunakan acuan monitoring pada sebuah Independent Distributor Agent HERBALIFE Nutrition.
1.3 Tujuan Penulisan
BAB II PEMBAHASAN 2.1 Regresi Berganda
Dalam hal ini analisis regresi berganda merupakan teknik statistik yang dapat digunakan untuk menganalisis hubungan antara 1 variabel terikat (variabel dependen/variable kriterian = Y) dengan beberapa variabel bebas/independen/prediktor (X1, X2, X3, ...Xn).
Penyimpangan yang sering terjadi pada analisis regresi linear berganda adalah eror yang tidak berdistribusi normal dan adanya gejala heterokedastisitas. Estimasi yang peneliti ciptakan melalui model regresi linier berganda (multiple regression) yang akan memberikan hubungan antar beberapa variabel lainnya. Tetapi hasil regresi tidak secara otomatis dapat memberikan hubungan yang signifikan. Model regresi linier berganda (multiple regression) dapat disebut sebagai model yang baik jika model tersebut memenuhi Kriteria BLUE (Best Linear Unbiased Estimator). BLUE dapat dicapai bila memenuhi Asumsi Klasik. Peneliti harus mengetahui sifat - sifat estimator dan menunjukkan beberapa asumsi dasar di dalam dataset. Sebuah model disebut sebagai model yang baik jika memenuhi beberapa asumsi yang disebut dengan asumsi klasik (classical assumptions).
Dengan demikian ada beberapa uji yang harus dilakukan sebelum pengujian hipotesis dalam model regresi yaitu :
1. Uji Normalitas
1. Carilah data yang terdiri dari 1 variabel tidak bebas ( Y ) dan minimal 4 variabel bebas (X1,
X2, X3, X4. Dengan banyaknya data minimal 30 ( Data Kuantitatif )
2. Lakukanlah pemilihan model terbaik.
3. Lakukan uji asumsi klasik pada data tersebut (uji normalitas eror, uji autokorelasi, uji heterokedastisitas, dan uji multikolinearitas)
KASUS
Ingin diprediksi mengenai pengaruh hubungan yang terjadi pada berat badan seseorang melalui monitoring evaluasi komposisi tubuh terhadap beberapa variabel dengan menggunakan acuan monitoring pada sebuah Independent Distributor Agent HERBALIFE Nutrition. Berdasarkan hasil survei terhadap 30 responden, terkait beberapa variabel yang memenuhi diantaranya:
1. Y adalah Berat Badan
2. X1 adalah Kadar Lemak yang mana merupakan faktor yang dapat mempengaruhi berat badan serta fungsi kerja sistem pada tubuh melalui penumpukan lemak yang terjadi dalam tubuh seseorang (dalam %)
4. X3 adalah Massa Otot yang dapat mempengaruhi berat badan pada seseorang dengan tetap memperhatikan kadar lemak secara rendah,tinggi, maupun normal (dalam kilogram)
5. X4 adalah Tinggi Badan seseorang yang dalam hal ini diukur menggunakan (cm)
DATA
Berikut merupakan hasil data Berat Badan seseorang yang dilakukan terhadap 30 responden:
Tabel.1. Berat Badan Terhadap Monitoring Komposisi tubuh
Dengan data yang ada, kita dapat
mengestimasi fungsi berat badan terhadap evaluasi monitoring adalah:
Ŷi = a+ b1 X1 + b2 X2 + b3 X3 + b4 X4 + error
Berdasarkan data yang telah kita peroleh tersebut langkah selanjutnya yang akan dilakukan terhadap beberapa analisis regresi pada SPSS ialah seperti berikut :
1. Statistik Deskriptif
Berdasarkan data yang telah diperoleh sebelumnya , diperoleh statistik deskriptif-nya yakni sebagai berikut :
Tabel.1.1. Descriptive Statistics 2. Persamaan Regresi Linear
Coefficientsa
Model Unstandardized Coefficients Standardized
Coefficients
t Sig.
B Std. Error Beta
1
(Constant) -122.377 44.294 -2.763 .011
Kadar Lemak (%) .165 .352 .101 .469 .643
Kadar Air (%) -.979 .401 -.555 -2.441 .022
Massa Otot (kg) .023 .135 .024 .173 .864
Tinggi Badan (cm) 1.474 .263 .938 5.607 .000
a. Dependent Variable: Berat Badan (kg)
Tabel.2.1. Menentukan Persamaan Regresi
Selanjutnya dari keempat variabel yang telah dilakukan pada SPSS tersebut, maka diperoleh persamaan regresi : Y = -122,337 + 0,165X1 – 0,979X2 +0,023X3 + 1.474X4
3. Pemilihan Model Terbaik
Dalam studi kasus yang dilakukan, maka pemilihan model terbaik yang digunakan adalah dengan menggunakan model Backward Elimination, sehingga diperoleh hasil outputnya sebagai berikut :
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Berat Badan (kg) 30 35.30 81.30 63.2767 12.92623
Kadar Lemak (%) 30 16.40 43.60 28.5400 7.92302
Kadar Air (%) 30 37.70 62.10 54.6767 7.33134
Massa Otot (kg) 30 17.50 58.60 35.5867 13.47692
Tinggi Badan (cm) 30 140 171 158.47 8.224
Tabel.3.1 Pemilihan Model Regresi Terbaik
Dari tabel diatas, diketahui variabel yang mempengaruhi yaitu variabel X2 dan X4 dimana X2 merupakan Kadar Air dan X4 merupakan Tinggi Badan .
Tabel.3.2 Pengaruh Nilai R
Berdasarkan tabel tersebut dapat ditunjukkan beberapa hal yakni :
Variables Entered/Removeda
Model Variables Entered Variables Removed Method
1
Tinggi Badan (cm), Massa Otot (kg), Kadar Lemak (%), Kadar Air (%)b
. Enter
2 . Massa Otot (kg)
Backward (criterion: Probability of F-to-remove >= .100).
3 . Kadar Lemak (%)
Backward (criterion: Probability of F-to-remove >= .100).
a. Dependent Variable: Berat Badan (kg) b. All requested variables entered.
Model Summary
Model R R Square Adjusted R Square Std. Error of the
Estimate
1 .809a .655 .600 8.18035
2 .809b .654 .614 8.02631
3 .807c .651 .626 7.90947
a. Predictors: (Constant), Tinggi Badan (cm), Massa Otot (kg), Kadar Lemak (%), Kadar Air (%) b. Predictors: (Constant), Tinggi Badan (cm), Kadar Lemak (%), Kadar Air (%)
a. Angka R sebesar 0,807 menunjukan bahwa hubungan antara berat badan dengan variable Kadar Air dan berat badan.
b. Angka R square sebesar 0,651 atau sebesar 65,1% menunjukkan bahwa hubungan antara Berat Badan dengan variable Kadar Air dan Berat Badan seseorang tidak begitu kuat. Karena masih banyak factor atau sebesar 34,9% dipengaruhi oleh factor-faktor diluar itu.
Tabel.3.3 Hasil Output pada Regresi Residual Total
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1
Regression 3172.582 4 793.146 11.852 .000b
Residual 1672.951 25 66.918
Total 4845.534 29
2
Regression 3170.570 3 1056.857 16.405 .000c
Residual 1674.964 26 64.422
Total 4845.534 29
3
Regression 3156.420 2 1578.210 25.227 .000d
Residual 1689.114 27 62.560
Total 4845.534 29
a. Dependent Variable: Berat Badan (kg)
b. Predictors: (Constant), Tinggi Badan (cm), Massa Otot (kg), Kadar Lemak (%), Kadar Air (%) c. Predictors: (Constant), Tinggi Badan (cm), Kadar Lemak (%), Kadar Air (%)
Dengan uji F tersebut ternyata diperoleh nilai F-hitungnya ialah sebesar 25,227 dengan signifikansi uji sebesar 0,000. Karena signifikansi uji nilainya lebih kecil dari 0,05 maka terdapat hubungan antara Berat Badan dengan variable Komposisi Jumlah Persentase Kadar Air dan Tinggi Badan pada berat badan seseorang.
Berdasarkan tabel diatas, maka diperoleh persamaan regresi :
^
Y = -110,538 -1,134X2+ 1.488X4 + e UJI ASUMSI KLASIK
a. Uji Normalitas Eror
One-Sample Kolmogorov-Smirnov Test
Unstandardized Residual
N 30
Normal Parametersa,b Mean 0E-7
Std. Deviation 7.63186062
Coefficientsa
Model Unstandardized Coefficients Standardized
Coefficients
t Sig.
B Std. Error Beta
1
(Constant) -122.377 44.294 -2.763 .011
Kadar Lemak (%) .165 .352 .101 .469 .643
Kadar Air (%) -.979 .401 -.555 -2.441 .022
Massa Otot (kg) .023 .135 .024 .173 .864
Tinggi Badan (cm) 1.474 .263 .938 5.607 .000
2
(Constant) -124.510 41.752 -2.982 .006
Kadar Lemak (%) .162 .345 .099 .469 .643
Kadar Air (%) -.995 .384 -.564 -2.593 .015
Tinggi Badan (cm) 1.499 .217 .954 6.917 .000
3
(Constant) -110.538 28.806 -3.837 .001
Kadar Air (%) -1.134 .238 -.643 -4.761 .000
Tinggi Badan (cm) 1.488 .212 .947 7.009 .000
Most Extreme Differences
Absolute .089
Positive .070
Negative -.089
Kolmogorov-Smirnov Z .486
Asymp. Sig. (2-tailed) .972
a. Test distribution is Normal. b. Calculated from data.
Berdasarkan tabel diatas, diperoleh nilai signifikansi uji sebesar 0,972 > 0,05 yang berarti dapat dikategorikan data tersebut berdistribusi secara normal.
b. Autokorelasi
Model Summaryb
Model R R Square Adjusted R Square Std. Error of the
Estimate
Durbin-Watson
1 .807a .651 .626 7.90947 .912
a. Predictors: (Constant), Tinggi Badan (cm), Kadar Air (%)
b. Dependent Variable: Berat Badan (kg)
Karena nilai durbin-Watson diperoleh sebesar 0,912 maka dapat dikatakan data tersebut tidak terjadi Autokorelasi
c. Multikolinearitas
Coefficientsa
Model Unstandardized Coefficients Standardized
Coefficients
t Sig. Collinearity
Statistics
B Std. Error Beta Tolerance VIF
1
(Constant) -110.538 28.806 -3.837 .001
Kadar Air (%) -1.134 .238 -.643 -4.761 .000 .707 1.414
Tinggi Badan
(cm) 1.488 .212 .947 7.009 .000 .707 1.414
Berdasarkan tabel diatas dapat dilihat pada kolom VIF, dari semua variable tidak terdapat nilai yang lebih besar dari 10. Sehingga dapat dikatakan pada kasus tersebut tidak terjadi masalah multikolinearitas.
d. Heterokedastisitas
Coefficientsa
Model Unstandardized Coefficients Standardized
Coefficients
t Sig.
B Std. Error Beta
1
(Constant) 3.555 15.616 .228 .822
Kadar Air (%) .078 .129 .137 .602 .552
Tinggi Badan (cm) -.010 .115 -.019 -.083 .934
a. Dependent Variable: ABRESID
Berdasarkan tabel diatas pada nilai signifikansi uji semua variable diatas 0,05. Sehingga dapat disimpulkan bahwa data tersebut tidak terjadi heterokedastisitas.
INTERPRETASI DATA
Berikut merupakan hasil interpretasi berdasarkan hasil ouput yang diperoleh.
Dari persamaan regresi linear berganda dengan model terbaik maka diperoleh nilai estimasi seperti berikut :
^
Y = -110,538 -1,134X2+ 1.488X4 + e
Dengan persamaan tersebut berarti dapat kita artikan bahwa:
Berat Badan = -110,538 -1,134 (Kadar Air) +1,488 (Tinggi Badan) + e - Nilai a= -110,538
Tanpa adanya kadar air (X2) dan Tinggi Badan (X4), maka besarnya output (Y) adalah -110.538 satuan.
- Nilai b1= -1,134
Hubungan antara nilai kadar air (X2) dengan hasil output (Y) jika tinggi badan (X4) konstan adalah negatif, atau setiap kenaikan kadar air sebesar satu satuan, maka output akan mengalami penurunan sebesar – 1,134 satuan.
air putih yang banyak (bukan air berkalori). Nah ini juga salah satu cara untuk menahan diri untuk tidak ngemil di luar jam makan. Pertambahan 1% Kadar Air seseorang maka akan mengurangi 1,134 berat badannya.
- Nilai b2= +1,488