dan b^
2, Teorema 3.1. Ingat, ketidakberpihakan berarti E1b^
upah 5 b0 1 b1educ 1 b2abil 1 u.
1 berasal dari model yang tidak ditentukan.
kamu 5 b0 1 b1x1 1 b2x2 1 kamu,
|
istilah kesalahan:
Bahasa Indonesia:
[3.42]
Sekarang anggaplah, daripada memasukkan variabel yang tidak relevan, kita menghilangkan variabel yang sebenarnya termasuk dalam model (atau populasi) yang sebenarnya. Hal ini sering disebut dengan masalah pengecualian variabel yang relevan atau spesifikasi model yang terlalu rendah. Kami menyatakan di Bab 2 dan awal bab ini bahwa masalah ini umumnya menyebabkan penduga OLS menjadi bias. Inilah saatnya untuk menunjukkan hal ini secara eksplisit dan, yang sama pentingnya, mengetahui arah dan besarnya bias tersebut.
[3.39]
2 5 b0, E1b^ 1
[3.41]
dan kami berasumsi bahwa model ini memenuhi Asumsi MLR.1 hingga MLR.4.
akan kita lihat di Bagian 3-4, memasukkan variabel yang tidak relevan dapat menimbulkan dampak yang tidak diinginkan pada varian penduga OLS.
Karena kita tidak mengetahui bahwa b3 5 0, kita cenderung mengestimasi persamaan yang memuat x3:
tidak ada efeknya. Kesimpulan ini tidak memerlukan penurunan khusus, karena langsung mengikuti dari 2 5 bj untuk setiap nilai bj , termasuk bj 5 0. Jadi, 2 5 0 (untuk
setiap nilai b0, b1, dirinya sendiri tidak akan pernah tepat nol, nilai rata-ratanya di semua sampel acak
|kamu 5b|
Saat pertama kali mempelajari masalah variabel yang dihilangkan, mungkin sulit untuk membedakan antara model sebenarnya yang mendasarinya, (3.40) dalam kasus ini, dan model yang sebenarnya kita perkirakan, yang ditangkap oleh regresi pada (3.41). Mungkin tampak konyol untuk menghilangkan variabel x2 jika variabel tersebut termasuk dalam model, namun sering kali kita tidak punya pilihan. Misalnya, upah ditentukan oleh
Karena kemampuan tidak diamati, kami malah mengestimasi modelnya
[3.40]
Kami telah memasukkan variabel yang tidak relevan, x3, dalam regresi kami. Apa pengaruh memasukkan x3 ke dalam (3,39) ketika koefisiennya dalam model populasi (3,38) adalah nol? Dalam hal ketidakberpihakan b^ 1
berkorelasi dengan x1 atau x2; yang penting adalah, ketika x1 dan x2 dikontrol, x3 tidak berpengaruh pada y.
akan menjadi nol.
kita dapat menyimpulkan bahwa E1b^
Kami menggunakan simbol “|” daripada “^” untuk menekankan bahwa b
1.
dimana v 5 b2abil 1 u. Penduga b1 dari regresi sederhana upah terhadap pendidikan disebut b 2 5 b1, E1b^ 2 2 5 b2, E1b^
Mendapatkan bias yang disebabkan oleh penghilangan variabel penting adalah contoh analisis kesalahan spesifikasi. Kita mulai dengan kasus dimana model populasi sebenarnya mempunyai dua variabel penjelas dan
kamu^ 5 b^
1b| 1x1.
upah 5 b0 1 b1pendidikan 1 v, 1 b^ 1x1 1 b^ 2x2 1 b^ 3x3.
dan b2). Meskipun b^
Dalam kaitannya dengan ekspektasi bersyarat, E1y0x1, x2, x3 2 5 E1y0x1, x2 2 5 b0 1 b1x1 1 b2x2.
Kesimpulan dari contoh sebelumnya jauh lebih umum: memasukkan satu atau lebih variabel yang tidak relevan ke dalam model regresi berganda, atau menentukan model secara berlebihan, tidak mempengaruhi ketidakbiasan penduga OLS. Apakah ini berarti memasukkan variabel yang tidak relevan tidak berbahaya? Tidak. Seperti kita
Misalkan minat utama kita adalah pada b1, pengaruh parsial x1 terhadap y. Misalnya, y adalah upah per jam (atau log upah per jam), x1 adalah pendidikan, dan x2 adalah ukuran kemampuan bawaan. Untuk mendapatkan penduga b1 yang tidak bias, kita harus menjalankan regresi y pada x1 dan x2 (yang menghasilkan penduga b0, b1, dan b2 yang tidak bias). Namun karena ketidaktahuan kami atau tidak tersedianya data, kami memperkirakan model dengan
mengecualikan x2. Dengan kata lain, kita melakukan regresi sederhana y pada x1 saja, sehingga diperoleh persamaannya
3-3b Bias Variabel yang Dihilangkan: Kasus Sederhana
0 3
J 0
0 3
78 BAGIAN 1 Analisis Regresi dengan Data Cross-Sectional
Hak Cipta 2016 Pembelajaran Cengage. Semua Hak Dilindungi Undang-undang. Tidak boleh disalin, dipindai, atau diduplikasi, seluruhnya atau sebagian. Karena hak elektronik, beberapa konten pihak ketiga mungkin disembunyikan dari eBook dan/atau eChapter.
Tinjauan editorial menganggap bahwa konten apa pun yang disembunyikan tidak berdampak signifikan terhadap pengalaman belajar secara keseluruhan. Cengage Learning berhak menghapus konten tambahan kapan saja jika pembatasan hak selanjutnya mengharuskannya.
Machine Translated by Google
1
1 1
1 1
1
1
1
1 1
1 1
&
1
1 1 1
1
1 1
1 1
1
1
1
b2 . 0 b2 , 0
Kor1x1, x2 2 . 0
Bias negatif Kor1x1, x2 2 , 0 Bias positif
Bias negatif Bias positif
N.
jelas: jika b2 5 0—sehingga x2 tidak muncul pada model sebenarnya (3.40)—maka b penduga b
|
|
Bias1b
2 5 E1b^ 1
positif jika b2 . 0 (x2 berpengaruh positif terhadap y) dan x1 dan x2 berkorelasi positif, biasnya negatif jika b2 . 0 dan x1 dan x2 berkorelasi negatif, dan seterusnya.
|
tidak memihak tanpa
|
|
|
jika x1 dan x2 berkorelasi positif dan d
|
Karena d
yang menyiratkan bias pada b
|
1 hanya bergantung pada variabel independen dalam sampel, kami memperlakukannya sebagai variabel tetap (nonran-dom) saat menghitung E(b
|
2 2 b1 5 b2d E1b
adalah kemiringan dari regresi sederhana Kami memperoleh nilai yang diharapkan dari b
sama ketika x1 dan x2 tidak berkorelasi dalam sampel. [Kami juga dapat menunjukkan bahwa b
|
jika, dan hanya jika, x1 dan x2 tidak berkorelasi dalam sampel. Jadi, kita mempunyai kesimpulan penting bahwa, jika x1 dan x2 dalam sampel tidak berkorelasi, maka b
Dari persamaan (3.46), kita melihat ada dua kasus dimana b
|
[3.44]
1 b^ 2d
dan dirangkum dalam Tabel 3.2 untuk empat kemungkinan kasus ketika terdapat bias. Tabel 3.2 memerlukan kajian yang cermat. Misalnya bias pada b
|
1.
|
|
N
Jika x1 dan x2 dikorelasikan, d 5 0, lalu b
|
Karena d
|
kami menunjukkan bahwa penduga regresi sederhana b
Bahasa Indonesia:
2 5 E1b
|
|
yi pada xi1, xi2, i 5 1, p,
|
|
adalah kovarians sampel antara x1 dan x2 terhadap varians sampel x1, d Karena bias dalam hal ini muncul dari penghilangan variabel penjelas x2, maka suku di sebelah kanan persamaan (3.46) sering disebut bias variabel yang dihilangkan.
[3.45]
Ternyata, kita telah melakukan hampir semua upaya untuk mendapatkan bias dalam regresi sederhana 5 b^ 1 di mana b^ 1
1 bergantung pada tanda b2 dan d
tidak memihak. Yang pertama cantik tidak memihak. Kami
1 adalah
2 5 E1b^ 1 1 b^ 2dDari persamaan (3.23) kita mempunyai hubungan aljabar b
[3.46]
Bahasa Indonesia:
[3.43]
hanyalah penduga kemiringan OLS dari regresi sederhana, dan kita telah mempelajari penduga ini secara mendalam di Bab 2. Perbedaannya di sini adalah kita harus menganalisis sifat-sifatnya ketika model regresi sederhana salah ditentukan karena adanya variabel yang dihilangkan.
Tabel 3.2 Ringkasan Bias pada b1 Ketika x2 Dihilangkan dalam Persamaan Estimasi (3.40)
. 0 sudah mengetahui hal ini dari analisis regresi sederhana di Bab 2. Kasus kedua lebih menarik.
Jika d
1,
dan b^ 2 adalah penduga kemiringan (jika kita dapat memilikinya) dari regresi berganda
|
Tabel 3.2 merangkum arah bias, namun besarnya bias juga sangat penting. Bias kecil pada salah satu tanda tidak perlu menjadi perhatian. Misalnya, jika tingkat pengembalian terhadap pendidikan dalam populasi adalah 8,6% dan bias dalam penduga OLS adalah 0,1% (sepersepuluh poin persentase), maka
|
2 1 E1b^ 2 2d
1,
|
|
1.
dan d
, 0 jika x1 dan x2 berkorelasi negatif. Tanda bias pada b
tidak memihak. Hal ini tidak mengherankan: pada Bagian 3-2, dan penduga regresi berganda b
| adalah
1). Selanjutnya, karena model pada (3.40) memenuhi Asumsi MLR.1 hingga MLR.4, kita mengetahui bahwa b^ 1 dan b^ 2 masing-masing tidak bias untuk b1 dan b2 . Karena itu,
|
|
pengkondisian pada xi2 jika E1x2 0x1 2 5 E1x2 2; kemudian, untuk memperkirakan b1, membiarkan x2 dalam istilah kesalahan tidak melanggar asumsi rata-rata bersyarat nol untuk kesalahan tersebut, setelah kita menyesuaikan intersepnya.]
tidak bias untuk b1, meskipun b2 2 0.
|
xi2 pada xi1, saya 5 1, hal,
tergantung pada nilai sampel x1 dan x2. Mendapatkan harapan ini tidaklah sulit karena b
|
&
mempunyai tanda yang sama dengan korelasi antara x1 dan x2: d
5 0 5 b1 1 b2d
BAB 3 Analisis Regresi Berganda: Estimasi 79
Tinjauan editorial menganggap bahwa konten apa pun yang disembunyikan tidak berdampak signifikan terhadap pengalaman belajar secara keseluruhan. Cengage Learning berhak menghapus konten tambahan kapan saja jika pembatasan hak selanjutnya mengharuskannya.
Hak Cipta 2016 Pembelajaran Cengage. Semua Hak Dilindungi Undang-undang. Tidak boleh disalin, dipindai, atau diduplikasi, seluruhnya atau sebagian. Karena hak elektronik, beberapa konten pihak ketiga mungkin disembunyikan dari eBook dan/atau eChapter.
Machine Translated by Google
Misalkan model log1wage2 5 b0 1 b1educ 1 b2abil 1 u memenuhi Asumsi MLR.1 hingga MLR.4.
Kumpulan data di WAGE1 tidak berisi data kemampuan, jadi kami memperkirakan b1 dari regresi sederhana
memiliki bias ke atas.
|
dimana expend adalah pengeluaran persiswa dan povrate adalah angka kemiskinan anak di sekolah tersebut.
|
skor rata-rata 5 b0 1 b1menghabiskan 1 b2povrate 1 u,
Definisi-definisi ini sama apakah b1 positif atau negatif. Ungkapan tersebut bias menuju nol
2. b1, maka kita katakan bahwa b
bias menuju nol jika itu mengacu pada kasus di mana E1b
Saat membaca dan melakukan pekerjaan empiris di bidang ekonomi, penting untuk menguasai terminologi yang terkait dengan penduga yang bias. Dalam konteks menghilangkan variabel dari model
(3.40), jika 2 , b1, b |1 memiliki bias ke bawah.
Dalam persamaan upah (3.42), menurut definisi, kemampuan yang lebih tinggi akan menghasilkan produktivitas yang lebih tinggi dan karenanya upah yang lebih tinggi: b2 . 0. Selain itu, ada alasan untuk percaya bahwa pendidikan dan kemampuan berkorelasi positif: rata-rata, individu dengan kemampuan bawaan lebih memilih tingkat pendidikan yang lebih tinggi. Dengan demikian, perkiraan OLS dari persamaan regresi sederhana upah 5 b0 1 b1pendidikan 1 v rata-rata terlalu besar .
Contoh kedua, misalkan pada tingkat sekolah dasar, nilai rata-rata siswa
|
menuju nol jika memiliki bias ke bawah. Sebaliknya jika b1 , 0, maka b
1.Pertama, b2 mungkin negatif: terdapat banyak bukti bahwa anak-anak yang hidup dalam kemiskinan rata-rata mendapat nilai lebih rendah pada tes standar. Kedua, rata-rata pengeluaran per siswa kemungkinan berkorelasi negatif dengan angka kemiskinan: Semakin tinggi angka
kemiskinan, maka semakin rendah pula rata-rata pengeluaran per siswa, sehingga Corr1x1, x2 2 , 0. Dari Tabel 3.2, b 1.
[3.47]
|
bias [3.48]
log1wage2 5 .584 1 .083 pendidikan
kami tidak akan terlalu khawatir. Di sisi lain, bias pada angka tiga poin persentase akan jauh lebih serius. Besar kecilnya bias ditentukan oleh besar kecilnya b2 dan d
Dengan menggunakan data distrik sekolah, kami hanya melakukan observasi terhadap persentase siswa yang memiliki nilai kelulusan dan pengeluaran per siswa; kami tidak memiliki informasi mengenai tingkat kemiskinan. Jadi, kami memperkirakan b1 dari regresi sederhana rata-rata pengeluaran .
memiliki bias ke atas. Ketika E1b
|
pada ujian standar ditentukan oleh
E1b
Hal ini tidak berarti perkiraan yang diperoleh dari sampel kami terlalu besar. Kita hanya dapat mengatakan bahwa jika kita mengumpulkan banyak sampel acak dan memperoleh estimasi regresi sederhana setiap saat, maka rata- rata estimasi tersebut akan lebih besar dari b1.
2 lebih dekat ke nol daripada b1. Oleh karena itu, jika b1 positif, maka b
|
Ini adalah hasil dari satu sampel saja, jadi kita tidak bisa mengatakan bahwa 0,083 lebih besar dari b1; tingkat pengembalian pendidikan yang sebenarnya bisa lebih rendah atau lebih tinggi dari 8,3% (dan kita tidak akan pernah tahu secara pasti). Namun demikian, kita tahu bahwa rata-rata estimasi seluruh sampel acak akan terlalu besar.
Dalam prakteknya, karena b2 adalah parameter populasi yang tidak diketahui, kita tidak dapat memastikan apakah b2 positif atau negatif. Meskipun demikian, kita biasanya mempunyai gagasan yang cukup bagus tentang arah pengaruh parsial x2 terhadap y. Lebih lanjut, meskipun tanda korelasi antara x1 dan x2 tidak dapat diketahui jika x2 tidak diamati, dalam banyak kasus, kita dapat membuat tebakan apakah x1 dan x2 berkorelasi positif atau negatif.
akan mempunyai bias positif. Pengamatan ini mempunyai implikasi penting. Bisa jadi dampak belanja sebenarnya adalah nol;
yaitu, b1 5 0. Namun, estimasi regresi sederhana dari b1 biasanya akan lebih besar dari nol, dan hal ini dapat membawa kita pada kesimpulan bahwa pengeluaran itu penting padahal sebenarnya tidak penting.
|
n 5 526, R2 5 .186.
|
Kita dapat memperoleh kembali kemungkinan bias pada b
|
Persamaan Upah Per Jam
80 BAGIAN 1 Analisis Regresi dengan Data Cross-Sectional
Tinjauan editorial menganggap bahwa konten apa pun yang disembunyikan tidak berdampak signifikan terhadap pengalaman belajar secara keseluruhan. Cengage Learning berhak menghapus konten tambahan kapan saja jika pembatasan hak selanjutnya mengharuskannya.
Hak Cipta 2016 Pembelajaran Cengage. Semua Hak Dilindungi Undang-undang. Tidak boleh disalin, dipindai, atau diduplikasi, seluruhnya atau sebagian. Karena hak elektronik, beberapa konten pihak ketiga mungkin disembunyikan dari eBook dan/atau eChapter.
1
1 1
1
1 1
1
Contoh 3.6
Machine Translated by Google
pengecualiannya adalah ketika x1 dan x2 juga tidak berkorelasi.
dan b 1b| 1x1 1b| 2x2.
|
|
2 5 b1 1 b3
|
|
.
|
Dan
|
memiliki bias ke atas atau ke bawah karena kemampuan yang dihilangkan. Kesimpulan ini tidak mungkin terjadi tanpa asumsi lebih lanjut. Sebagai perkiraan, misalkan, selain exper dan abil tidak berkorelasi, educ dan exper juga tidak berkorelasi. (Pada kenyataannya, keduanya berkorelasi negatif.) Sejak b3 . 0 dan educ dan abil berkorelasi positif, b
akan memilikinyakami juga memiliki ukuran penyebaran dalam distribusi pengambilan sampelnya. Sebelum
menemukan variansnya, kami menambahkan asumsi homoskedastisitas, seperti pada Bab 2. Kami melakukan ini karena dua alasan.
|
[3.49]
tidak bias karena x2 tidak berkorelasi dengan x3. Sayangnya, hal ini tidak terjadi secara umum: keduanya b
B
positif, dan seterusnya.
bias ke atas, seolah-olah ahli tidak ada dalam model.
memenuhi Asumsi MLR.1 sampai MLR.4. Namun kami menghilangkan x3 dan memperkirakan modelnya sebagai
Bahkan dalam model yang cukup sederhana di atas, sulit untuk mendapatkan arah bias di b
E1b
biasanya akan menjadi bias. Satu-satunya
seolah-olah x2 tidak ada pada populasi dan model estimasi. Faktanya, jika x1 dan x2 tidak berkorelasi, dapat ditunjukkan bahwa
Ini sama seperti persamaan (3.45), tetapi b3 menggantikan b2, dan x3 menggantikan x2 dalam regresi (3.44). Oleh karena itu, bias dalam b
Jika abil dihilangkan dari model, penduga b1 dan b2 menjadi bias, bahkan jika kita mengasumsikan pengalaman
J ,
|kamu 5b|
Hal ini karena x1, x2, dan x3 semuanya dapat dikorelasikan berpasangan. Namun demikian, ada perkiraan
diperoleh dengan mengganti b2 dengan b3 dan x2 dengan x3 pada Tabel 3.2. Jika b3 . 0 dan Koreksi 1x1, x3 2 . 0, bias di b
2.
|
tidak berkorelasi dengan kemampuan. Kami sebagian besar tertarik untuk kembali ke dunia pendidikan, jadi alangkah baiknya jika Sekarang, misalkan x2 dan x3 tidak berkorelasi, namun x1 berkorelasi dengan x3. Dengan kata lain, x1 berkorelasi dengan variabel yang dihilangkan, namun x2 tidak. Sangat menggoda untuk berpikir bahwa, sementara b
|
[3.50]
Sekarang kita memperoleh varians dari penduga OLS sehingga, selain mengetahui sepuluh- densi sentral dari b^
kita dapat menyimpulkan bahwa b
Sebagai contoh, misalkan kita menambahkan exper pada model upah:
1xi1 2 x1 2
Alasan yang digunakan dalam contoh sebelumnya sering kali diikuti sebagai panduan kasar untuk mendapatkan kemungkinan bias pada penduga dalam model yang lebih rumit. Biasanya, fokusnya adalah pada hubungan antara variabel penjelas tertentu, misalnya x1, dan faktor kunci yang dihilangkan. Sebenarnya, mengabaikan semua variabel penjelas lainnya adalah praktik yang valid hanya jika masing-masing variabel tidak berkorelasi dengan x1, namun tetap merupakan panduan yang berguna. Lampiran 3A berisi analisis yang lebih cermat terhadap bias variabel yang dihilangkan dengan beberapa variabel penjelas.
mungkin bias berdasarkan derivasi pada subbab sebelumnya, b
Mendapatkan tanda bias variabel yang dihilangkan ketika terdapat banyak regresi dalam model estimasi adalah hal yang lebih sulit. Kita harus ingat bahwa korelasi antara satu variabel penjelas dan kesalahan umumnya mengakibatkan semua penduga OLS menjadi bias. Misalnya saja model populasi
|
|
upah 5 b0 1 b1educ 1 b2exper 1 b3abil 1 u.
|
kamu 5 b0 1 b1x1 1 b2x2 1 b3x3 1 kamu
seringkali berguna secara praktis. Jika kita asumsikan x1 dan x2 tidak berkorelasi, maka kita dapat mempelajari bias pada b 1
N 2
i51
1
i511xi1 2x1 2xi3
1
1 2
N
1
0
1
1
1
1 2
3-3c Bias Variabel yang Dihilangkan: Kasus yang Lebih Umum
A
BAB 3 Analisis Regresi Berganda: Estimasi 81
A
3-4 Varians Estimator OLS
Tinjauan editorial menganggap bahwa konten apa pun yang disembunyikan tidak berdampak signifikan terhadap pengalaman belajar secara keseluruhan. Cengage Learning berhak menghapus konten tambahan kapan saja jika pembatasan hak selanjutnya mengharuskannya.
Hak Cipta 2016 Pembelajaran Cengage. Semua Hak Dilindungi Undang-undang. Tidak boleh disalin, dipindai, atau diduplikasi, seluruhnya atau sebagian. Karena hak elektronik, beberapa konten pihak ketiga mungkin disembunyikan dari eBook dan/atau eChapter.
Machine Translated by Google