REGRESI LINIER SEDERHANA
Tugas Disusun Untuk Memenuhi Tugas Analisis Regresi Disusun Oleh :
Zaki Hidayat (3115106662)
PROGRAM STUDI PENDIDIKAN MATEMATIKA NON REGULER 2010
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI JAKARTA
JAKARTA 2013
A. PENDAHULUAN
Dalam mengolah data si peneliti akan selalu berkepentingan menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin renggang, seperti dalam asosiasi, atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada pihak yang lain, kedua peubah bergantung sepenuhnya pada yang lain. Bila hubungan kedua peubah tersebut linier (keduanya disebut kolinier) maka harga mutlak korelasinya satu.
Dalam asosiasi kita hanya memasangkan nilai x dengan nilai y tanpa mempersoalkan bentuk hubungan tersebut. Hubungan seperti ini merupakan yang terlemah. Dalam penelitian, orang biasa bekerja menggunakan model, suatu hubungan fungsional antara peubah. Dengan model itu kita berusaha memahami, menerangkan, mengendalikan dan kemudian memprediksikan kelakuan sistem yang kita teliti. Di sini digunakan istilah memprediksi dan bukan meramalkan. Prediksi mempunyai arti yang khusus, yaitu inter atau ekstrapolasi. Model juga menolong peneliti dalam menentukan hubungan kausal (sebab akibat) antara dua atau lebih peubah.
Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan kemampuan kita menelitinya secara keseluruhan amat terbatas, karena itu kita perlu menyederhanakannya sesuai dengan kemampuan akal kita menghadapinya. Dari pengalaman di masa lalu atau dari dugaan mengenai hubungan antara peubah dalam sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai situasi. Si peneliti mengharapkan bahwa model tersebut merupakan
teori tentang cara kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya dinyatakan dalam bentuk hipotesis, seterusnya di uji berdasarkan data statistik yang dikumpulkan kemudian. Pendekatan seperti ini sering disebut bersifat induksi, sebagai lawan dari yang bersifat aksioma (deduksi).
Model yang dibicarakan di sini akan selalu berbentuk fungsi dan regresi merupakan alat yang ampuh dalam pembentukannya. Analisis regresi yang akan dibahas di sini, yaitu analisis regresi sederhana. Dimana, analisis regresi linier sederhana yaitu berfungsi untuk mengetahui hubungan linier antara dua variabel, satu variabel dependen dan satu variabel independen.
Dalam regresi linier sederhana, metode yang biasa digunakan dalam mengestimasi parameter regresi adalah metode kuadrat terkecil atau Ordinary Least Squares (OLS). Konsep metode ini adalah untuk mengestimasi parameter dengan memilih garis regresi yang terdekat dengan garis dari semua data. Secara matematika penentuan parameter regresi ini dengan cara meminimumkan jumlah kuadrat dari residualnya (Walpole dan Myers, 1986).
B. TUJUAN
Tujuan menggunakan analisis regresi linier sederhana ialah
1. Untuk mengetahui asumsi yang digunakan dalam regresi linier sederhana
2. Untuk memprediksikan nilai variabel regresi
3. Untuk mengetahui ditolak atau diterima H0 dengan uji hipotesis.
1. ASUMSI LINIER REGRESI SEDERHANA
Regresi linear sederhana didasarkan pada asumsi uji, diantaranya sebagai berikut :
a. Uji Normalitas.
Uji normalitas adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya. Sering terjadi kesalahan yang jamak yaitu bahwa uji normalitas dilakukan pada masing-masing variabel. Hal ini tidak dilarang tetapi model regresi memerlukan normalitas pada nilai residualnya bukan pada masing-masing variabel penelitian.
Pengertian normal secara sederhana dapat dianalogikan dengan sebuah kelas. Dalam kelas siswa yang bodoh sekali dan pandai sekali jumlahnya hanya sedikit dan sebagian besar berada pada kategori sedang atau rata-rata. Jika kelas tersebut bodoh semua maka tidak normal, atau sekolah luar biasa. Dan sebaliknya jika suatu kelas banyak yang pandai maka kelas tersebut tidak normal atau merupakan kelas unggulan. Pengamatan data yang normal akan memberikan nilai ekstrim rendah dan ekstrim tinggi yang sedikit dan kebanyakan mengumpul di tengah. Demikian juga nilai rata-rata, modus dan median relatif dekat.
Uji normalitas dapat dilakukan dengan uji histogram, uji normal P Plot, uji Chi Square, Skewness dan Kurtosis atau uji Kolmogorov Smirnov. Tidak ada metode yang paling baik atau paling tepat. Tipsnya adalah bahwa pengujian dengan metode grafik sering menimbulkan perbedaan persepsi di antara beberapa pengamat, sehingga penggunaan uji normalitas dengan uji statistik bebas dari
keragu-raguan, meskipun tidak ada jaminan bahwa pengujian dengan uji statistik lebih baik dari pada pengujian dengan metode grafik.
Jika residual tidak normal tetapi dekat dengan nilai kritis (misalnya signifikansi Kolmogorov Smirnov sebesar 0,049) maka dapat dicoba dengan metode lain yang mungkin memberikan justifikasi normal. Tetapi jika jauh dari nilai normal, maka dapat dilakukan beberapa langkah yaitu: melakukan transformasi data, melakukan trimming data outliers atau menambah data observasi. Transformasi dapat dilakukan ke dalam bentuk Logaritma natural, akar kuadrat, inverse, atau bentuk yang lain tergantung dari bentuk kurva normalnya, apakah condong ke kiri, ke kanan, mengumpul di tengah atau menyebar ke samping kanan dan kiri. b. Uji Multikolinearitas.
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear berganda. Jika ada korelasi yang tinggi di antara variabel-variabel bebasnya, maka hubungan antara variabel bebas terhadap variabel terikatnya menjadi terganggu. Sebagai ilustrasi, adalah model regresi dengan variabel bebasnya motivasi, kepemimpinan dan kepuasan kerja dengan variabel terikatnya adalah kinerja. Logika sederhananya adalah bahwa model tersebut untuk mencari pengaruh antara motivasi, kepemimpinan dan kepuasan kerja terhadap kinerja. Jadi tidak boleh ada korelasi yang tinggi antara motivasi dengan kepemimpinan, motivasi dengan kepuasan kerja atau antara kepemimpinan dengan kepuasan kerja.
Alat statistik yang sering dipergunakan untuk menguji gangguan multikolinearitas adalah dengan variance inflation factor (VIF), korelasi pearson antara variabel-variabel bebas, atau dengan melihat eigenvalues dan condition index (CI).
Beberapa alternatif cara untuk mengatasi masalah multikolinearitas adalah sebagai berikut:
• Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang tinggi.
• Menambah jumlah observasi.
• Mentransformasikan data ke dalam bentuk lain, misalnya logaritma natural, akar kuadrat atau bentuk first difference delta. • Dalam tingkat lanjut dapat digunakan metode regresi bayessian
yang masih jarang sekali digunakan.
c. Uji Heteroskeditas.
Uji heteroskedastisitas adalah untuk melihat apakah terdapat ketidaksamaan varians dari residual satu ke pengamatan ke pengamatan yang lain. Model regresi yang memenuhi persyaratan adalah di mana terdapat kesamaan varians dari residual satu pengamatan ke pengamatan yang lain tetap atau disebut homoskedastisitas.
Deteksi heteroskedastisitas dapat dilakukan dengan metode scatter plot dengan memplotkan nilai ZPRED (nilai prediksi) dengan SRESID (nilai residualnya). Model yang baik didapatkan jika tidak terdapat pola tertentu pada grafik, seperti mengumpul di tengah, menyempit kemudian melebar atau sebaliknya melebar kemudian
menyempit. Uji statistik yang dapat digunakan adalah uji Glejser, uji Park atau uji White.
Beberapa alternatif solusi jika model menyalahi asumsi heteroskedastisitas adalah dengan mentransformasikan ke dalam bentuk logaritma, yang hanya dapat dilakukan jika semua data bernilai positif. Atau dapat juga dilakukan dengan membagi semua variabel dengan variabel yang mengalami gangguan heteroskedastisitas.
d. Uji Autokorelasi.
Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu periode t dengan periode sebelumnya (t -1). Secara sederhana adalah bahwa analisis regresi adalah untuk melihat pengaruh antara variabel bebas terhadap variabel terikat, jadi tidak boleh ada korelasi antara observasi dengan data observasi sebelumnya. Sebagai contoh adalah pengaruh antara tingkat inflasi bulanan terhadap nilai tukar rupiah terhadap dollar. Data tingkat inflasi pada bulan tertentu, katakanlah bulan Februari, akan dipengaruhi oleh tingkat inflasi bulan Januari. Berarti terdapat gangguan autokorelasi pada model tersebut. Contoh lain, pengeluaran rutin dalam suatu rumah tangga. Ketika pada bulan Januari suatu keluarga mengeluarkan belanja bulanan yang relatif tinggi, maka tanpa ada pengaruh dari apapun, pengeluaran pada bulan Februari akan rendah.
Uji autokorelasi hanya dilakukan pada data time series (runtut waktu) dan tidak perlu dilakukan pada data cross section seperti pada kuesioner di mana pengukuran semua variabel dilakukan secara serempak pada saat yang bersamaan. Model regresi pada
penelitian di Bursa Efek Indonesia di mana periodenya lebih dari satu tahun biasanya memerlukan uji autokorelasi.
Beberapa uji statistik yang sering dipergunakan adalah uji Durbin-Watson, uji dengan Run Test dan jika data observasi di atas 100 data sebaiknya menggunakan uji Lagrange Multiplier. Beberapa cara untuk menanggulangi masalah autokorelasi adalah dengan mentransformasikan data atau bisa juga dengan mengubah model regresi ke dalam bentuk persamaan beda umum (generalized difference equation). Selain itu juga dapat dilakukan dengan memasukkan variabel lag dari variabel terikatnya menjadi salah satu variabel bebas, sehingga data observasi menjadi berkurang. e. Uji Linearitas.
Uji linearitas dipergunakan untuk melihat apakah model yang dibangun mempunyai hubungan linear atau tidak. Uji ini jarang digunakan pada berbagai penelitian, karena biasanya model dibentuk berdasarkan telaah teoretis bahwa hubungan antara variabel bebas dengan variabel terikatnya adalah linear. Hubungan antar variabel yang secara teori bukan merupakan hubungan linear sebenarnya sudah tidak dapat dianalisis dengan regresi linear, misalnya masalah elastisitas.
Jika ada hubungan antara dua variabel yang belum diketahui apakah linear atau tidak, uji linearitas tidak dapat digunakan untuk memberikan adjustment bahwa hubungan tersebut bersifat linear atau tidak. Uji linearitas digunakan untuk mengkonfirmasikan apakah sifat linear antara dua variabel yang diidentifikasikan secara teori sesuai atau tidak dengan hasil observasi yang ada. Uji
linearitas dapat menggunakan uji Durbin-Watson, Ramsey Test atau uji Lagrange Multiplier.
2. METODE KUADRAT TERKECIL
Misalkan untuk menentukan koefisien regresi sedemikian sehingga
minimum. dan berubah bila garis regresinya berubah. Ini berarti kita haru mencari turunan J terhadap dan turunan terhadap .
Terhadap menjadi
Terhadap menjadi
Kemudian dan diganti dengan taksirannya yaitu dan . Sehingga menjadi
Diketahui dan sehingga persamaan diatas dapat ditulis
dan bagian kedua menjadi
Sehingga dapat disederhanakan menjadi
Taksiran persamaan regresi dapat ditulis
Contoh soal :
Data berikut adalah nilai rapor Zaki pada bidang studi Fisika (X) dan Kimia (Y), Selama 6 semester :
Fisika (X) Kimia (Y)
70 80 88 87 73 90 80 93 75 90 85 95
a. Tentukan persamaan garis regresi linear pada data tersebut b. Taksirlah nilai Kimia yang didapatkan oleh Zaki, bila ia
mendapatkan nilai Fisika di rapor adalah 77 Jawaban : a. Buatlah tabel : X Y X2 XY 70 80 4900 5600 88 87 7744 7656 73 90 5329 6570 80 93 6400 7440 75 90 5625 6750 85 95 7225 8075 ƩX = 471 ƩY = 535 ƩX2 = 37223 ƩXY = 42091 1 1 1 2 2 1 1 n n n i i i i i i i n n i i i i n x y x y b n x x = = = = = − ÷ ÷ = − ÷
∑
∑
∑
∑
∑
dan 1 1 n n i i i i y b x a n = = − =∑
∑
( ) (
) ( ) (
)
(
)
(
2)
6 42091 471 535 0,374 6 37223 471 b= − = − dan(
) ( )
535 0,374 471 59,807 6 a= − =Jadi Persamaan garis regresinya adalah : ˆ 59,807 0,374
y= + x
b. Nilai prediksi kimia zaki yang didapatkan adalah
(
) ( )
ˆ 59,807 0,374 77 88,605 89
y= + = ≈
3. UJI HIPOTESIS PARAMETER REGRESI
Uji ini digunakan untuk mengetahui apakah variabel independen (X) berpengaruh secara signifikan terhadap variabel dependen (Y). Signifikan berarti pengaruh yang terjadi dapat berlaku untuk populasi (dapat digeneralisasikan).
Untuk menguji hipotesis nol (H0) bahwa β = 0 lawan suatu
tandingan yang sesuai dengan persoalan, kembali digunakan distribusi-t dengan derajat kebebasan n-2 untuk mendapatkan suatu daerah kritis dan kemudian mendasarkan keputusan atas nilai / hit xx b t s J = dimana : 2 yy xy J bJ s n − = −
s = jumlah tak bias
b = gradien persamaan regresi linier n = jumlah populasi
Jxx, Jxy, Jyy adalah simpangan kuadrat
(
)
2 1 1 2 2 1 1 − = − = =∑
∑
∑
= = = n i i n i n i i xx xx x n x x x S J i(
)
2 1 1 2 2 1 1 − = − = =∑
∑
∑
= = = n i i n i n i i yy yy S y y y n y J i(
)(
)
∑
∑
∑
∑
= − − = = − = = = = n i i n i i n i i i n i i i xy xy x y n y x y y x x S J 1 1 1 1 1Jika harga mutlak t-hitung lebih besar dari t tabel, maka tolak H0
Contoh soal :
Dengan memperhatikan tabel pada contoh sebelumnya, ujilah hipotesis bahwa β = 0 pada taraf keberartian 0,05 lawan tandingan bahwa β ≠ 0. Jawab : 2 2 1 1 2 1 471 37223 249,5 6 n n xx i i i i J x x n = = = − ÷ = − =
∑
∑
2 2 1 1 2 1 535 47843 138,333 6 n n yy i i i i J y y n = = = − ÷ = − =
∑
∑
( ) (
)
1 1 1 1 471 535 42091 93,5 6 n n n xy i i i i i i i J x y x y n = = = = − ÷ ÷ = − =∑
∑
∑
Simpangan bakunya(
) (
)
2 138,333 0,374 93,5 5,083 6 2 yy xy J bJ s n − = − − = = −Proses Uji hipotesis : 1. H0 : β = 0 2. H1 : β ≠ 0 3. Taraf keberartian 0,05 4. T-tabel 2,776 5. Cari t-hitung :
(
)
/ 0,374 1,617 5,083 / 249,5 hit xx b t s J = = =6. Karena harga mutlak t-hitung lebih kecil dari t-tabel, maka dapat disimpulkan terima H0
RANGKUMAN
1. Pengujian estimasi dan hipotesis membentuk dua cabang utama statistika klasik.
2. Terdapata lima asumsi dalam regresi linier sederhana yaitu dengan asumsi uji normalitas, heteroskeditas, linieritas, autokorelasi dan multikolinearitas
3. Yang mendasari pendekatan interval kepercayaan adalah konsep dari estimasi interval. Sebuah estimasi interval adalah sebuah interval atau jarak yang dibentuk dengan memilki probabilitas yang telah dibentuk, termasuk mencakup batasan dari nilai parameter yang tidak diketahui.
4. Dalam prosedur pengujian signifikansi, seseorang menyusun sebuah pengujian statistik dan memeriksa distribusi sampling dibawah hipotesis nol.
TES FORMATIF
1. Diketahui data di bawah ini, carilah persamaan regresinya
1 2 2 1 3 4 4 5 5 3 Jawab : 1 2 2 1 2 1 2 4 3 4 12 9 4 5 20 16 5 3 15 25 15 15 51 55
Jadi persamaan regresinya
2. Berdasarkan data diatas, tentukan apakah variabel x
mempengaruhi variabel y ( H0 : β = 0, taraf keberartian 0,05
2 2 1 1 2 1 15 55 10 5 n n xx i i i i J x x n = = = − ÷ = − =
∑
∑
2 2 1 1 2 1 15 55 10 5 n n yy i i i i J y y n = = = − ÷ = − =∑
∑
( ) ( )
1 1 1 1 15 15 51 6 5 n n n xy i i i i i i i J x y x y n = = = = − ÷ ÷ = − =∑
∑
∑
Simpangan bakunya( ) ( )
2 10 0,6 6 1, 460 5 2 yy xy J bJ s n − = − − = = −Proses Uji hipotesis : 1. H0 : β = 0 2. H1 : β ≠ 0 3. Taraf keberartian 0,05 4. T-tabel 3,182 5. Cari t-hitung :
(
)
/ 0,6 1, 299 1, 460 10 hit xx b t s J = = =6. Karena harga mutlak t-hitung lebih kecil dari t-tabel, maka dapat disimpulkan terima H0 maka tidak ada pengaruh antara
3. Nilai 9 murid dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir (y) sebagai berikut.
X 77 50 71 72 81 94 96 99 67
Y 82 66 78 34 47 85 99 99 68
Taksirlah garis regresi linear. Jawab : X Y XY X2 77 82 6314 5929 50 66 3300 2500 71 78 5538 5041 72 34 2448 5184 81 47 3807 6561 94 85 7990 8836 96 99 9504 9216 99 99 9801 9801 67 68 4556 4489 ƩX = 707 ƩY = 658 ƩXY = 53258 ƩX2 = 57557 1 1 1 2 2 1 1 n n n i i i i i i i n n i i i i n x y x y b n x x = = = = = − ÷ ÷ = − ÷
∑
∑
∑
∑
∑
dan 1 1 n n i i i i y b x a n = = − =∑
∑
( ) (
) (
) (
)
(
)
(
2)
9 53258 707 568 0,777 9 57557 707 b= − = − dan(
) (
)
658 0,777 707 12,062 6 a= − =Jadi Persamaan garis regresinya adalah : ˆ 12, 062 0,777
DAFTAR PUSTAKA
Aunuddin. 2005. Rancangan dan Analisis Data. Bogor : IPB Press. (Hal. 108-110 , 171-202)
Jonathan Sarwono. Regresi Linear Sederhana
http://www.jonathansarwono.info/regresi/regresi.htm. (online) ( diakses 16 Februari 2013)
Kismiantini. Handout Analisis Regresi. (online). http//staff.uny.ac.id/sites/default/files/Handout
%20Analisis%20Regresi.pdf (diakses 25 September 2012)
Sembiring, S.K. 1995. Analisis Regresi. Bandung : Penerbit ITB. (Hal. 35-90)
Uswatun Khasanah. Regresi Linear Sederhana. (online).
http//elearning.uad.ac.id/file.php/kuliah1.ppt (diakses 16 Februari
2013)
Walpole, Ronald E. Dan Myers, Raymond H. 1995 Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: