ANALISIS ESTIMASI MODEL REGRESI DATA
PANEL DENGAN PENDEKATAN
COMMON EFFECT
MODEL
(CEM),
FIXED EFFECT MODEL
(FEM), DAN
RANDOM EFFECT MODEL
(REM)
Skripsi
disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
Program Studi Matematika
oleh
Styfanda Pangestika 4111411057
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
iv
“Barangsiapa yang menapaki suatu jalan dalam rangka mencari ilmu maka Allah
akan memudahkan baginya jalan ke Surga.
(H. R. Ibnu Majah & Abu Dawud)
Maka nikmat Tuhan kamu yang manakah yang kamu dustakan?
(QS. Ar Rahman [55])
Life is what you make it. Always has been, always will be
(Eleanor Roosevelt)
PERSEMBAHAN
Untuk ayah dan ibu saya tercinta
Untuk adik saya tersayang
v
Alhamdulillah, puji syukur senantiasa penulis panjatkan ke hadirat Allah
SWT atas limpahan karunia-Nya sehingga penulis dapat menyelesaikan skripsi
yang berjudul “Analisis Estimasi Model Regresi Data Panel dengan Pendekatan Common Effect Model (CEM), Fixed Effect Model (FEM), dan
Random Effect Model (REM).”
Penulis menyadari dalam penyusunan skripsi ini penulis telah mendapat
banyak bantuan, bimbingan, dan dorongan dari berbagai pihak. Oleh karena itu,
penulis menyampaikan terima kasih kepada:
1. Prof. Dr. Fathur Rokhman, M.Hum., Rektor Universitas Negeri Semarang.
2. Prof. Dr. Wiyanto, M.Si., Dekan Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Negeri Semarang.
3. Drs. Arief Agoestanto, M.Si., Ketua Jurusan Matematika Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang.
4. Dr.Scolastika Mariani, M.Si., selaku dosen pembimbing utama, yang telah
menuntun, memberikan arahan dan bimbingan dalam penyelesaian skripsi ini.
5. Prof. Dr. Zaenuri, S.E, M.Si,Akt., selaku dosen pembimbing pendamping,
yang telah menuntun, memberikan arahan dan bimbingan dalam penyelesaian
skripsi ini.
6. Drs. Sugiman, M.Si., selaku ketua penguji, yang telah berkenan untuk
menguji skripsi ini.
7. Alamsyah, S.Si., M.Kom., selaku dosen wali yang telah membimbing dan
vi
9. Keluarga besarku yang selalu mendoakan dan menjadi motivasku dalam
menyelesaikan skripsi ini.
10. Teman-teman M2M, KKN Lolipop dan teman-teman trouble maker kos yang telah memberikan motivasinya.
11. Sahabat-sahabatku, Elok, Danang, Arya, Puji, Ari, Iin, Bravura, Mila, Rizky,
Mira, Rangga, Rifan, dan Taufiq yang selalu memberikan dukungan dan
motivasinya.
12. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah
membantu dalam penyelesaian skripsi ini.
Penulis menyadari, bahwa masih banyak keterbatasan pengetahuan dan
kemampuan yang penulis miliki. Penulis mengharapkan kritik dan saran yang bisa
membangun penelititan-penelitian yang lain. Semoga skripsi ini dapat berguna
dan bermanfaat bagi pembaca.
Semarang, September 2015
vii
Pendekatan Common Effect Model (CEM), Fixed Effect Model (FEM), dan Random Effect Model (REM). Skripsi. Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang. Pembimbing Utama Dr. Scolastika Mariani, M.Si., dan Pembimbing Pendamping Prof. Dr. Zaenuri, S.E, M.Si,Akt.
Kata kunci : Regresi Data Panel, Fixed Effect Model, Random Effect Model. Penelitian ini mengkaji tentang estimasi parameter model regresi data panel. Penelitian ini bertujuan untuk (1) menjelaskan estimasi parameter model regresi data panel dengan pendekatan Common Effect Model (CEM),Fixed Effect Model (FEM) dan Random Effect Model (REM) untuk data pengaruh angka melek huruf, rata-rata lama sekolah, dan pengeluaran riil per kapita disesuaikan terhadap Indeks Pembangunan Manusia (IPM) di seluruh Kabupaten/Kota di Jawa Tengah dari tahun 2008 sampai dengan 2012; (2) mengetahui estimasi parameter model regresi data panel terbaik; dan (3) menganalisis estimasi parameter model regresi data panel terbaik dengan menggunakan kriteria uji diagnostik. Pengambilan data dilakukan dengan cara mendokumentasikan data di Badan Pusat Statistik (BPS) Jawa Tengah.
Data yang diambil berupa Angka Melek Huruf, Rata-rata Lama Sekolah, Pengeluaran Riil Per Kapita Disesuaikan dan Indeks Pembangunan Manusia (IPM). Untuk selanjutnya dilakukan estimasi model regresi data panel terbaik. Analisis data dilakukan dengan menggunakan penghitungan manual dan dengan menggunakan software R.
Dari tahapan analisis yang dilakukan, yaitu mengestimasi parameter model regresi data panel, melakukan uji pemilihan model terbaik, uji diagnostik pada model terbaik, pemeriksaan persamaan regresi, menguji signifikansi parameter regresi data panel, menguji asumsi regresi data panel, dan interpretasi model regresi maka diperoleh kesimpulan yaitu estimasi model regresi data panel terbaik dengan pendekatan fixed effect model dengan efek individu dengan nilai dan model persamaan hasil estimasi sebagai berikut:
viii
HALAMAN JUDUL ... i
PERNYATAAN KEASLIAN TULISAN ... ii
HALAMAN PENGESAHAN ... iii
MOTTO DAN PERSEMBAHAN ... iv
PRAKATA ... v
ABSTRAK ... vii
DAFTAR ISI ... viii
DAFTAR TABEL ... xiv
DAFTAR GAMBAR ... xv
DAFTAR LAMPIRAN ... xvi
BAB 1. PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Batasan Masalah ... 7
1.3 Rumusan Masalah ... 7
1.4 Tujuan Penelitian ... 8
1.5 Manfaat Penelitian ... 8
1.6 Sistematika Penulisan ... 9
2. TINJAUAN PUSTAKA ... 11
2.1 Model Regresi Linear ... 11
ix
2.2.1 Common Effect Model (CEM) ... 16
2.2.1.1 Ordinary Least Square (OLS) ... 17
2.2.2 Fixed Effect Model (FEM) ... 18
2.2.2.1 Least Square Dummy Variable (LSDV) ... 19
2.2.3 Random Effect Model (REM) ... 21
2.2.3.1 Generalized Least Square (GLS) ... 23
2.3 Pemilihan Model Estimasi Regresi Data Panel ... 24
2.3.1 Uji Chow ... 24
2.3.2 Uji Haussman ... 25
2.3.3 Uji Breusch-Pagan ... 26
2.4 Uji Diagnostik ... 27
2.4.1 Uji Korelasi Serial ... 27
2.4.1.1 Uji Breusch-Godfrey ... 27
2.4.2 Tests for Cross Sectional Dependence ... 28
2.4.2.1 Pesaran’s CD Test ... 29
2.4.3 Unit Root Tests ... 31
2.4.4 Uji Heterokedastisitas ... 32
2.5 Struktur Variance-Covariance Residual Fixed Effect Model ... 33
2.5.1 Struktur Homokedastik dan Tidak Ada Korelasi Serial ... 34
2.5.2 Struktur Heterokedastik dan Tidak Ada Korelasi Serial ... 34
x
Estimastor ... 35
2.6 Pemeriksaan Persamaan Regresi ... 38
2.6.1 Standard Error ... 38
2.6.2 Uji Hipotesis ... 39
2.6.2.1 Uji Serentak (Uji F) ... 39
2.6.2.2 Uji Parsial (Uji t) ... 40
2.6.2.3 Koefisien Determinasi ... 42
2.7 Uji Asumsi Model Regresi Data Panel ... 42
2.7.1 Uji Normalitas ... 43
2.7.2 Uji Linearitas ... 45
2.7.3 Multikolinearitas... 46
2.8 Pembangunan Manusia ... 47
2.9 Indeks Pembangunan Manusia ... 48
2.10 Komponen Pembangunan Manusia ... 48
2.11 Penelitian Terdahulu ... 50
3. METODE PENELITIAN ... 53
3.1 Fokus Penelitian ... 53
3.2 Klasifikasi Penelitian Berdasarkan Tujuan dan Pendekatan ... 54
3.3 Pengumpulan Data ... 54
3.4 Pemecahan Masalah ... 55
xi
4.1.1 Estimasi Model Regresi Data Panel ... 59
4.1.1.1 Common Effect Model (CEM) ... 60
4.1.1.2 Fixed Effect Model (FEM) ... 63
4.1.1.3 Random Effect Model (REM) ... 68
4.1.2 Pemilihan Model Estimasi Regresi Data Panel ... 71
4.1.2.1 Uji Chow ... 71
4.1.2.2 Uji Haussman ... 72
4.1.2.3 Uji Breusch-Pagan ... 73
4.1.3 Uji Diagnostik ... 75
4.1.3.1 Uji Korelasi Serial ... 75
4.1.3.2 Tests for Cross-Sectional Dependence ... 76
4.1.3.2.1 Pesaran’s CD Test ... 76
4.1.3.3 Unit Root Tests ... 77
4.1.3.4 Uji Heterokedastisitas ... 78
4.1.4 Serial Correlation and the Robust Variance Matrix Estimator .. 79
4.1.5 Pemeriksaan Persamaan Regresi ... 83
4.1.5.1 Standard Error ... 83
4.1.5.2 Uji Hipotesis ... 84
4.1.5.2.1 Uji Serentak (Uji F) ... 84
4.1.5.2.2 Uji Parsial (Uji t) ... 85
xii
4.1.6.2 Uji Linearitas ... 88
4.1.6.3 Uji Multikolinearitas ... 93
4.2 Pembahasan ... 94
4.2.1 Model Regresi Data Panel ... 94
4.2.1.1 Common Effect Model (CEM) ... 96
4.2.1.2 Fixed Effect Model (FEM) ... 96
4.2.1.3 Random Effect Model (REM) ... 97
4.2.2 Pemilihan Model Estimasi Regresi Data Panel ... 97
4.2.2.1 Uji Chow ... 97
4.2.2.2 Uji Hausman ... 97
4.2.2.3 Uji Breusch-Pagan ... 98
4.2.3 Uji Diagnostik ... 98
4.2.3.1 Uji Korelasi Serial ... 98
4.2.3.2 Tests for Cross-Sectional Dependence ... 99
4.2.3.2.1 Pesaran’s CD Test ... 99
4.2.3.3 Unit Root Tests ... 100
4.2.3.4 Uji Heterokedastisitas ... 100
4.2.4 Struktur Variance-Covariance Residual Fixed Effect Model .... 101
4.2.5 Serial Correlation and the Robust Variance Matrix Estimator 101 4.2.6 Pemeriksaan Persamaan Regresi ... 102
xiii
4.2.6.2.2 Uji Parsial (Uji t) ... 102
4.2.6.2.3 Koefisien Determinasi ... 103
4.2.7 Uji Asumsi Model Regresi Data Panel ... 103
4.2.7.1 Uji Normalitas ... 103
4.2.7.2 Uji Linearitas ... 104
4.2.7.3 Uji Multikolinearitas ... 104
4.2.8 Interpretasi Hasil ... 104
5. PENUTUP ... 107
5.1 Kesimpulan ... 107
5.2 Saran ... 108
DAFTAR PUSTAKA ... 109
xiv
Tabel Halaman
4.1 Hasil Estimasi dengan Common Effect Model ... 61
4.2 Nilai Statistik dengan Common Effect Model ... 62
4.3 Hasil Estimasi dengan Fixed Effect Model ... 67
4.4 Nilai Statistik dengan Fixed Effect Model ... 68
4.5 Hasil Estimasi dengan Random Effect Model ... 69
4.6 Nilai Statistik dengan Random Effect Model ... 70
4.7 Nilai Hasil Uji Chow ... 72
4.8 Rangkuman Hasil Uji Breusch-Pagan ... 74
4.9 Hasil Estimasi dengan the Robust Variance Matrix Estimator ... 80
4.10 Tabel Nilai untuk Setiap Wilayah ... 81
4.11 Nilai Standard Error Fixed Effect Model ... 83
xv
Gambar Halaman
4.1 Plot Residual ( ) dengan ̂ ... 89
4.2 Plot dengan ... 90
4.3 Plot dengan ... 90
4.4 Plot dengan ... 91
4.5 Plot Residual dengan ... 92
4.6 Plot Residual dengan ... 92
xvi
Lampiran Halaman
1. Data untuk Estimasi Model dengan Regresi Data Panel ... 112
2. Estimasi Common Effect Model ... 117
3. Estimasi Fixed Effect Model ... 118
4. Estimasi Random Effect Model ... 122
5. Uji Chow ... 125
6. Uji Hausman ... 126
7. Uji Breusch-Pagan ... 128
8. Uji Korelasi Serial ... 129
9. Pesaran’s CD Test ... 130
10. Unit Root Tests ... 131
11. Uji Heterokedastisitas ... 132
12. Residual Fixed Effect Model ... 133
1
PENDAHULUAN
1.1
Latar Belakang
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan sebab-akibat antara satu variabel dengan variabel atau variabel-variabel
yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah seperti
variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas dinamakan dengan variabel (karena seringkali digambarkan dalam grafik
sebagai absis, atau sumbu ). Variabel terkena akibat dikenal sebagai variabel
yang dipengaruhi, dependen, variabel terikat, atau variabel . Kedua variabel ini
dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak.
Regresi pertama kali diperkenalkan oleh Sir Francis Galton pada tahun 1886
(Mudrajat Kuncoro, 2001: 91). Analisis regresi adalah salah satu analisis yang
paling popular dan luas pemakaiannya. Analisis regresi dipakai secara luas untuk
melakukan prediksi dan ramalan. Analisis ini juga digunakan untuk memahami
variabel bebas mana saja yang berhubungan dengan variabel terikat dan untuk
mengetahui bentuk-bentuk hubungan tersebut.
Data panel adalah gabungan antara data runtun waktu (time series) dan data silang (cross section). Data runtun waktu biasanya meliputi satu objek tetapi meliputi beberapa periode (bisa harian, bulanan, kuartalan, atau tahunan). Data
(misalnya perusahaan) dengan beberapa jenis data (misalnya laba, biaya iklan,
laba ditahan, dan tingkat investasi) dalam suatu periode waktu tertentu.
Karena data panel merupakan gabungan dari data cross section dan data time series maka tentunya akan mempunyai observasi lebih banyak dibanding data cross section atau time series saja. Akibatnya, ketika digabungkan menjadi pool data, guna membuat regresi maka hasilnya cenderung akan lebih baik dibanding
regresi yang hanya menggunakan data cross section atau time series saja (Nachrowi & Usman, 2006). Analisis regresi data panel adalah analisis regresi
dengan struktur data merupakan data panel. Umumnya pendugaan parameter
dalam analisis regresi dengan data cross section dilakukan dengan pendugaan Metode Kuadrat Terkecil (MKT). metode ini akan memberikan hasil pendugaan
yang bersifat Best Linear Unbiased Estimator (BLUE) jika semua asumsi Gauss Markov terpenuhi diantaranya adalah non-autocorrelation. Kondisi terakhir ini tentunya sulit terpenuhi pada saat kita berhadapan dengan data panel. Sehingga
pendugaan parameter tidak lagi bersifat BLUE. Jika data panel dianalisis dengan
pendekatan model-model time series seperti fungsi transfer, maka ada informasi keragaman dari unit cross section yang diabaikan dalam pemodelan. Salah satu keuntungan dari analisis regresi data panel adalah mempertimbangkan keragaman
yang terjadi dalam unit cross section (Jaya & Sunengsih, 2009).
Dalam suatu penelitian ada kalanya seorang peneliti tidak dapat melakukan
analisis hanya dengan menggunakan data time series maupun data cross section. Misalnya seorang peneliti hendak membuat model tentang keuntungan suatu
banyaknya pekerja, dan total penjualan. Kalau peneliti hanya menggunakan data
cross section yang diamati hanya pada suatu saat (misalnya satu tahun), maka peneliti tersebut tidak dapat melihat bagaimana pertumbuhan keuntungan
perusahaan tersebut dari waktu ke waktu pada suatu periode tertentu (katakanlah
dalam kurun waktu 10 tahun). Padahal sangat mungkin kondisi antara suatu tahun
dengan tahun lainnya berbeda. Dengan menggunakan data panel, maka peneliti
dapat melihat fluktuasi keuntungan satu perusahaan pada periode waktu tertentu
dan perbedaan keuntungan beberapa perusahaan pada suatu waktu (Nachrowi &
Usman, 2006).
Menurut Hsiao (1992), keuntungan-keuntungan menggunakan analisis regresi
data panel adalah memperoleh hasil estimasi yang lebih baik karena seiring
dengan peningkatan jumlah observasi yang otomatis berimplikasi pada
peningkatan derajat kebebasan (degree of freedom) dan menghindari kesalahan penghilangan variabel (omitted variable problem).
Selain itu, keunggulan regresi data panel menurut Wibisono (2005) antara
lain :
(1) Data Panel mampu memperhitungkan heterogenitas individu secara ekspilisit
dengan mengizinkan variabel spesifik individu;
(2) Kemampuan mengontrol heterogenitas ini selanjutnya menjadikan data panel
dapat digunakan untuk menguji dan membangun model perilaku lebih
(3) Data panel mendasarkan diri pada observasi cross-section yang berulang-ulang (time series), sehingga metode data panel cocok digunakan sebagai study of dynamic adjustment;
(4) Tingginya jumlah observasi memiliki implikasi pada data yang lebih
informative, lebih variatif, dan kolinearitas (multiko) antara data semakin berkurang, dan derajat kebebasan (degree of freedom/ df) lebih tinggi sehingga dapat diperoleh hasil estimasi yang lebih efisien;
(5) Data panel dapat digunakan untuk mempelajari model-model perilaku yang
kompleks; dan
(6) Data panel dapat digunakan untuk meminimalkan bias yang mungkin
ditimbulkan oleh agregasi data individu.
Beberapa penelitian yang telah dilakukan menggunakan data panel
(Chadidjah & Elfiyan, 2009) antara lain (1) penelitian yang dilakukan oleh Pujiati
(2007) mengenai analisis pertumbuhan ekonomi di Karesidenan Semarang Era
Kebijakan Fiskal yaitu 6 kabupaten/kota di wilayah Karesidenan Semarang dari
tahun 2002-2006. Dalam analisisnya menggunakan pooled model, fixed effect model, dan random effect model. Hasilnya bahwa fixed effect model lebih baik sehingga efek dari perbedaan wilayah berarti, akan tetapi dalam pemilihan model
terbaik antara fixed effect model, dan random effect model hanya menggunakan perbandingan nilai goodness of fit tanpa pengujian; (2) penelitian yang dilakukan oleh Sugiharso dan Ester (2007) mengenai determinan investasi portofolio
internasional negara-negara ASEAN, Amerika Serikat dan Jepang menggunakan
yang menentukan aliran investasi portofolio internasional dan bagaimana investor
masing-masing negara-negara anggota ASEAN (yaitu Filipina, Malaysia,
singapura, dan Thailand), Amerika Serikat dan Jepang melakukan pilihan dalam
Internasional Portfolio Holding dengan menggunakan Gravity Model. Data yang digunakan adalah data sekunder tahun 1992-2005. Penelitian ini menggunakan
pooled model yang mempunyai asumsi intercept dan slope dari persamaan regresi dianggap konstan untuk daerah dan antar waktu. Padahal pada kenyataannya,
kondisi ini kurang bias mencerminkan keadaan sebenarnya dimana
masing-masing Negara mempunyai kondisi yang berbeda secara ekonomi maupun
geografis.
Beberapa penelitian lain antara lain penelitian oleh Rafael E. De Hoyos dan
Vasilis Sarafidis (2006), menjelaskan bahwa perintah xtcsd pada software Stata digunakan untuk menguji adanya ketergantungan cross-sectional (cross-sectional dependence) dalam model data panel dengan menggunakan Fixed Effect Model (FEM) dan Random Effect Model (REM) dengan banyak unit cross sectional dan beberapa pengamatan time series. Xtcsd dapat menjelaskan tiga prosedur uji berbeda, yaitu Friedman’s test statistic, the statistic proposed by Frees, dan the cross-sectional dependence (CD) test of Pesaran dengan menggunakan berbagai macam contoh empiris.
Penelitian oleh David M. Drukker (2003), menjelaskan bahwa adanya
korelasi serial pada model data panel linear bias terhadap standard errors dan menyebabkan hasil menjadi kurang efisien. Uji untuk mengidentifikasi adanya
(2002) dapat diterapkan dalam kondisi umum dan mudah untuk diterapkan.
Penelitian didukung dengan menggunakan program Stata.
Manusia adalah kekayaan bangsa yang sesungguhnya. Tujuan utama
pembangunan adalah menciptakan lingkungan yang memungkinkan rakyat
menikmati umur panjang, sehat, dan menjalankan kehidupan yang produktif. Hal
ini nampaknya sederhana. Tetapi seringkali terlupakan oleh kesibukan jangka
pendek untuk mengumpulkan harta dan uang. (UNDP: Humant Development Report,2000: 16).
Untuk melihat sejauh mana keberhasilan pembangunan dan
kesejahteraan manusia, UNDP telah menerbitkan suatu indikator yaitu Indeks
Pembangunan Manusia (IPM) untuk mengukur kesuksesan pembangunan dan
kesejahteraan suatu negara. IPM adalah suatu tolak ukur angka kesejahteraan
suatu daerah atau negara yang dilihat berdasarkan tiga dimensi yaitu: angka
harapan hidup pada waktu lahir (life expectancy at birth), angka melek huruf (literacy rate) dan rata-rata lama sekolah (mean years of schooling), dan kemampuan daya beli (purchasing power parity). Indikator angka harapan hidup mengukur kesehatan, indikator angka melek huruf penduduk dewasa dan rata-rata
lama sekolah mengukur pendidikan dan terakhir indikator daya beli mengukur
standar hidup. Ketiga indikator tersebut saling mempengaruhi satu sama lain,
selain itu dapat dipengaruhi oleh faktor-faktor lain seperti ketersediaan
kesempatan kerja yang ditentukan oleh pertumbuhan ekonomi, infrastruktur, dan
kebijakan pemerintah sehingga IPM akan meningkat apabila ketiga unsur tersebut
pembangunan ekonomi suatu negara. (United Nation Development Programme, UNDP, 1990).
Dengan kata lain Indeks Pembangunan Manusia dapat dipengaruhi oleh
beberapa faktor antara lain angka melek huruf, rata-rata lama sekolah dan
pengeluaran riil per kapita disesuaikan yang dapat digunakan sebagai contoh
penerapan dalam analisis regresi data panel.
1.2
Batasan Masalah
Ruang lingkup pembahasan dalam penulisan ini membahas tentang metode
estimasi parameter pada data panel, pemodelan regresi data panel dan penerapan
model regresi data panel terbaik pada pengaruh angka melek huruf, rata-rata lama
sekolah, dan pengeluaran riil per kapita disesuaikan terhadap Indeks
Pembangunan Manusia (IPM) di seluruh Kabupaten/Kota di Jawa Tengah dari
tahun 2008 sampai dengan 2012.
1.3
Rumusan Masalah
Berdasarkan latar belakang di atas dapat dirumuskan beberapa masalah yaitu:
a. Bagaimana estimasi parameter model regresi data panel dengan pendekatan
Common Effect Model (CEM), Fixed Effect Model (FEM) dan Random Effect Model (REM) untuk data pengaruh angka melek huruf, rata-rata lama sekolah, dan pengeluaran riil per kapita disesuaikan terhadap Indeks
Pembangunan Manusia (IPM) di seluruh Kabupaten/Kota di Jawa Tengah
dari tahun 2008 sampai dengan 2012?
c. Bagaimana menganalisis estimasi parameter model regresi data panel terbaik
dengan menggunakan kriteria uji diagnostik?
1.4
Tujuan Penelitian
a. Menjelaskan estimasi parameter model regresi data panel dengan pendekatan
Common Effect Model (CEM),Fixed Effect Model (FEM) dan Random Effect Model (REM) untuk data pengaruh angka melek huruf, rata-rata lama sekolah, dan pengeluaran riil per kapita disesuaikan terhadap Indeks
Pembangunan Manusia (IPM) di seluruh Kabupaten/Kota di Jawa Tengah
dari tahun 2008 sampai dengan 2012.
b. Untuk mengetahui estimasi parameter model regresi data panel terbaik.
c. Untuk menganalisis estimasi parameter model regresi data panel terbaik
dengan menggunakan kriteria uji diagnostik.
1.5
Manfaat Penelitian
Manfaat yang diharapkan dari hasil penulisan ini adalah sebagai berikut:
a. Bagi Penulis
1) Untuk mengembangkan dan mengaplikasikan pengetahuan dan keilmuan
di bidang matematika.
2) Dapat menjelaskan model estimasi regresi data panel dengan pendekatan
common effect model, fixed effect model dan random effect model.
3) Dapat mengaplikasikan estimasi model regresi data panel hingga
b. Bagi Pembaca
Sebagai bahan informasi dan tambahan pengetahuan pada bidang matematika
khususnya estimasi model regresi data panel dan diharapkan kepada pembaca
untuk melakukan penelitian selanjutnya.
c. Bagi Lembaga
Sebagai bahan informasi dan tambahan referensi pada bidang matematika.
1.6
Sistematika Penulisan
BAB 1 : Pendahuluan yang berisi latar belakang, rumusan masalah, batasan
masalah, tujuan penelitian, manfaat penelitian, metode penelitian, dan
sistematika penulisan.
BAB 2 : Kajian teori berisi dasar-dasar teori sebagai acuan dalam penulisan
antara lain: model regresi linear, model regresi data panel, pemilihan
model estimasi regresi data panel, uji diagnostik, struktur variance-covariance residual fixed effect model, pemeriksaan persamaan regresi, uji asumsi model regresi data panel, pembangunan manusia, indeks
pembangunan manusia, komponen pembangunan manusia,dan
penelitian terdahulu.
BAB 3 : Metode penelitian menyajikan gagasan pokok yang terdiri dari tahap
permasalahan, investigasi awal, persiapan penelitian, penyelesaian,
tahap pelaporan hasil, dan penarikan kesimpulan.
BAB 4 : Hasil dan pembahasan berisi hasil dan pembahasan dalam menjelaskan
(CEM), Fixed Effect Model (FEM) dan Random Effect Model (REM) untuk data pengaruh angka melek huruf, rata-rata lama sekolah, dan
pengeluaran riil per kapita disesuaikan terhadap Indeks Pembangunan
Manusia (IPM) di seluruh Kabupaten/Kota di Jawa Tengah dari tahun
2008 sampai dengan 2012.
11
TINJAUAN PUSTAKA
2.1
Model Regresi Linear
2.1.1 Model Regresi Linear Sederhana
Menurut Sumodiningrat (1994, 100), hubungan atau persamaan dalam teori
ekonomi biasanya mempunyai spesifikasi hubungan yang pasti (exact) atau hubungan deterministic di antara variabel-variabel. Mengingat bahwa hubungan
yang tidak exact tidak pernah ada dalam ekonomi maka faktor-faktor stokastik harus ada dalam hubungan ekonomi. Dengan semakin banyaknya tuntutan akan
perlunya menguji teori-teori ekonomi, variabel stokastik juga perlu diuji
keberadaannya di dalam hubungan ekonomi.
Bentuk paling sederhana dari hubungan stokastik antara dua variabel dan
disebut “model regresi linear”.
(2.1)
disebut variabel terikat (dependent variable), adalah variabel bebas (Independent variable) atau variabel penjelas (explanatory variable), adalah variabel gangguan stokastik (stochastic disturbance), dan adalah parameter-parameter regresi. Subskrip menunjukan pengamatan yang ke- . Parameter
dan ditaksir atas dasar data yang tersedia untuk variabel dan .
2.1.2 Model Regresi Linear Ganda
(2.2)
Dengan
= intercept
= slope
= error,
= observasi (pengamatan) ke –i = banyaknya observasi
Oleh karena i menunjukan observasi maka terdapat n persamaan: (2.3)
Model regresi dapat ditulis dalam matriks sebagai berikut.
(2.4)
Dengan
(2.5)
( )
( )
Beberapa asumsi yang penting dalam regresi linear ganda (Widarjono,
2005:78) antara lain:
a. Hubungan antara Y (variabel dependen) dan X (variabel independen) adalah linear dalam parameter.
b. Tidak ada hubungan linear antara variabel independen atau tidak ada
multikolinearitas antara variabel independen.
c. Nilai rata-rata dari adalah nol.
(2.6)
Dalam bentuk matriks:
(2.7)
[
] [ ]
vektor nol
d. Tidak ada korelasi antara dan ( . (
e. Variansi setiap adalah sama (homoskedastisitas).
(2.8)
Apabila ditulis dalam bentuk matriks:
(2.9)
[
]
[
]
2.2
Model Regresi Data Panel
Data panel adalah data yang merupakan hasil dari pengamatan pada beberapa
individu atau (unit cross-sectional) yang merupakan masing-masing diamati dalam beberapa periode waktu yang berurutan (unit waktu) (Baltagi, 2005).
Menurut Wanner & Pevalin sebagaimana dikutip oleh Sembodo (2013)
menyebutkan bahwa regresi panel merupakan sekumpulan teknik untuk
memodelkan pengaruh peubah penjelas terhadap peubah respon pada data panel.
Ada beberapa model regresi panel, salah satunya adalah model dengan slope konstan dan intercept bervariasi. Model regresi panel yang hanya dipengaruhi oleh salah satu unit saja (unit cross-sectional atau unit waktu) disebut model komponen satu arah, sedangkan model regresi panel yang dipengaruhi oleh kedua
unit (unit cross-sectional dan unit waktu) disebut model komponen dua arah. Secara umum terdapat dua pendekatan yang digunakan dalam menduga model
dari data panel yaitu model tanpa pengaruh individu (common effect) dan model dengan pengaruh individu (fixed effect dan random effect).
Menurut Jaya & Sunengsih (2009), analisis regresi data panel adalah analisis
variabel terikat (dependent variable) dengan satu atau lebih variabel bebas (independent variable). Beberapa alternatif model yang dapat diselesaikan dengan data panel yaitu,
Model 1: semua koefisien baik intercept maupun slope koefisien konstan. (2.10)
∑
Model 2: slope koefisien konstan, tetapi intercept berbeda akibat perbedaan unit cross section.
(2.11)
∑
Model 3: slope koefisien konstan, tetapi intercept berbeda akibat perbedaan unit cross section dan berubahnya waktu.
(2.12)
∑
Model 4: intercept dan slope koefisien berbeda akibat perbedaan unit cross section.
(2.13)
∑
Model 5: intercept dan slope koefisien berbeda akibat perbedaan unit cross section dan berubahnya waktu.
(2.14)
∑
Dengan,
Banyak unit cross section Banyak data time series
Nilai variabel terikat cross section ke-i time serieske-t Nilai variabel bebas ke-k untuk cross section ke-i tahun ke-t Parameter yang ditaksir
Unsur gangguan populasi
Banyak parameter regresi yang ditaksir
2.2.1 Common Effect Model (CEM)
Menurut Baltagi (2005) model tanpa pengaruh individu (common effect) adalah pendugaan yang menggabungkan (pooled) seluruh data time series dan cross section dan menggunakan pendekatan OLS (Ordinary Least Square) untuk menduga parameternya. Metode OLS merupakan salah satu metode populer untuk
menduga nilai parameter dalam persamaan regresi linear. Secara umum,
persamaan modelnya dituliskan sebagai berikut.
(2.15)
Dengan:
= Variabel respon pada unit observasi ke-i dan waktu ke-t = Variabel prediktor pada unit observasi ke-i dan waktu ke-t = Koefisien slope atau koefisien arah
= Intercept model regresi
= Galat atau komponen error pada unit observasi ke-i dan waktu ke-t
2.2.1.1 Ordinary Least Square (OLS)
Menurut Nachrowi & Usman (2006, 312) bahwa data panel tentunya akan
mempunyai observasi lebih banyak dibanding data cross section atau time series saja. Akibatnya, ketika data digabungkan menjadi pooled data, guna membuat regresi maka hasilnya cenderung akan lebih baik dibanding regresi yang hanya
menggunakan data cross section atau time series saja. Dipunyai model berikut. (2.16)
Bila ( dan
kita dapat estimasi model tersebut dengan memisahkan waktunya sehingga ada
regresi dengan pengamatan. Atau dapat dituliskan dengan:
(2.17)
Model juga dapat diestimasi dengan memisahkan cross section-nya sehingga didapat regresi dengan masing-masing pengamatan. Atau dapat ditulis
dengan:
(2.18)
Bila dipunyai asumsi bahwa dan akan sama (konstan) untuk setiap data
time series dan cross section, maka dan dapat diestimasi dengan model berikut. dengan menggunakan x pengamatan.
(2.19)
2.2.2 Fixed Effect Model (FEM)
Pendugaan parameter regresi panel dengan Fixed Effect Model menggunakan teknik penambahan variabel dummy sehingga metode ini seringkali disebut
dengan Least Square Dummy Variable model. Persamaan regresi pada Fixed Effect Model adalah
(2.20)
∑
2.2.2.1 Least Square Dummy Variable (LSDV)
Menurut Greene (2007), secara umum pendugaan parameter model efek tetap
dilakukan dengan LSDV (Least Square Dummy Variable), dimana LSDV merupakan suatu metode yang dipakai dalam pendugaan parameter regresi linear
dengan menggunakan Metode Kuadrat Terkecil (MKT) pada model yang
melibatkan variabel boneka sebagai salah satu variabel prediktornya. MKT
merupakan teknik pengepasan garis lurus terbaik untuk menghubungkan variabel
prediktor dan variabel respon . Berikut. adalah prinsip dasar MKT:
(2.21)
Sehingga didapatkan Jumlah Kuadrat Galat sebagai berikut.
(2.22)
Dimana, jika matriks transpose , maka scalar . Untuk mendapatkan penduga parameter yang menyebabkan jumlah kuadrat
galat minimum, yaitu dengan cara menurunkan persamaan (1) terhadap parameter
yang kemudian hasil turunan tersebut disamakan dengan nol atau ,
sehingga diperoleh:
(2.23)
̂
̂
̂
̂
̂
Pada pemodelan efek tetap grup, variabel boneka yang dibentuk adalah
sebanyak , sehingga model yang akan diduga dalam pemodelan efek tetap
adalah sebagai berikut.
(2.24)
Sedangkan untuk pemodelan efek tetap waktu, variabel boneka yang dibentuk
bedasarkan unit waktu, dimana variabel boneka yang terbentuk yang terbentuk
sebanyak , sehingga model yang akan diduga dalam pemodelan efek tetap
waktu adalah sebagai berikut.
(2.25)
Hun (2005) juga mengemukakan bahwa pada model regresi panel dengan
intercept bervariasi dan slope konstan, pemodelan efek tetap komponen dua arah secara umum dilakukan dengan Least Square Dummy Variable (LSDV) dimana model dengan peubah dummy seperti berikut.
(2.26)
= peubah boneka ke-j unit cross-sectional ke-i dan unit waktu ke-t. bernilai satu jika dan bernilai nol jika .
= peubah boneka ke-k unit cross-sectional ke-i dan unit waktu ke-t. bernilai satu jika dan benilai nol jika .
= rata-rata peubah respon jika peubah boneka ke-j bernilai satu dan peubah penjelas bernilai nol.
= rata-rata nilai peubah respon jika peubah boneka ke-k bernilai satu dan peubah penjelas bernilai nol.
2.2.3 Random Effect Model (REM)
Menurut Nachrowi & Usman (2006, 315) sebagaimana telah diketahui bahwa
pada Model Efek Tetap (MET), perbedaan karakteristik-karakteristik individu dan
waktu diakomodasikan pada intercept sehingga intercept-nya berubah antar waktu. Sementara Model Efek Random (MER) perbedaan karakteristik individu dan waktu diakomodasikan pada error dari model. Mengingat ada dua komponen yang mempunyai kontribusi pada pembentukan error, yaitu individu dan waktu, maka random error pada MER juga perlu diurai menjadi error untuk komponen waktu dan error gabungan.
Dengan demikian persamaan MER diformulasikan sebagai berikut.
(2.27)
Dimana:
: Komponen error gabungan.
Adapun asumsi yang digunakan untuk komponen error tersebut adalah: (2.28)
Melihat persamaan di atas, maka dapat dinyatakan bahwa MER menganggap
efek rata-rata dari data cross section dan time series direpresentasikan dalam intercept. Sedangkan deviasi efek secara random untuk data time series direpresentasikan dalam dan deviasi untuk data cross section dinyatakan dalam
.
, dengan demikian varians dari error tersebut dapat dituliskan dengan:
(2.29)
Hal ini tentunya berbeda dengan Model OLS yang diterapkan pada data panel
(pooled data), yang mempunyai varian error sebesar: (2.30)
Dengan demikian, MER bisa diestimasi dengan OLS bila .
Jika tidak demikian, MER perlu diestimasi dengan metode lain. Adapun metode
2.2.3.1 Generalized Least Square (GLS)
Untuk Random Effect Model (REM), pendugaan parameternya dilakukan menggunakan Generalized Least Square jika matriks diketahui, namun jika tidak diketahui dilakukan dengan FGLS yaitu menduga elemen matriks . Pada
REM ketidaklengkapan informasi untuk setiap unit cross section dipandang sebagai error sehingga adalah bagian dari unsur gangguan. Model REM dapat dituliskan dapat dituliskan sebagai berikut.
(2.31)
∑
Asumsi:
(
( (
Untuk data cross section ke-i persamaan di atas dapat ditulis . Varians komponen dari unsur gangguan untuk unit cross
section ke-i adalah: (2.32)
[
]
(2.33)
Jika nilai diketahui maka persamaan dapat diduga menggunakan
Generalized Least Square (GLS) dengan ̂ Jika tidak diketahui maka perlu diduga dengan menduga ̂ dan ̂ , sehingga
persamaan di atas diduga dengan ̂ ( ̂ ̂ dimana ̂
̂ ̂
dengan ̂ ̂ adalah residu dari Least Square Dummy Variable
(LSDV). Sedangkan ̂ ̂ ̂ .
2.3
Pemilihan Model Estimasi Regresi Data Panel
2.3.1 Uji Chow
Uji ini digunakan untuk memilih salah satu model pada regresi data panel,
yaitu antara model efek tetap (fixed effect model) dengan model koefisien tetap (common effect model). Prosedur pengujiannya sebagai berikut (Baltagi, 2005). Hipotesis:
(efek unit cross section secara keseluruhan tidak
berarti)
Minimal ada satu ; (efek wilayah berarti)
Statistik uji yang digunakan merupakan uji F, yaitu
(2.34)
Keterangan:
Jumlah individu (cross section) Jumlah periode waktu (time series) Jumlah variabel penjelas
restricted residual sums of squares yang berasal dari model koefisien
tetap
unrestricted residual sums of squares yang berasal dari model efek tetap
Jika nilai atau p-value < (taraf signifikansi/alpha),
maka tolak hipotesis awal sehingga model yang terpilih adalah model efek
tetap.
2.3.2 Uji Hausman
Uji ini digunakan untuk memilih model efek acak (random effect model) dengan model efek tetap (fixed effect model). Uji ini bekerja dengan menguji apakah terdapat hubungan antara galat pada model (galat komposit) dengan satu
atau lebih variabel penjelas (independen) dalam model. Hipotesis awalnya adalah
tidak terdapat hubungan antara galat model dengan satu atau lebih variabel
penjelas. Prosedur pengujiannya sebagai berikut (Baltagi, 2008: 310).
Hipotesis:
Korelasi (efek cross-sectional tidak berhubungan dengan regresor lain)
Statistik uji yang digunakan adalah uji chi-squared berdasarkan kriteria Wald, yaitu
(2.35)
̂ [ ̂ ] ̂
( ̂ ̂ [ ( ̂ ̂ ] ̂ ̂
Keterangan:
̂ vektor estimasi slope model efek tetap
̂ vektor estimasi slope model efek acak
Jika nilai atau nilai p-value kurang dari taraf signifikansi yang
ditentukan, maka tolak hipotesis awal sehingga model yang terpilih adalah
model efek tetap.
Menurut Rosadi (2011, 274) uji ini bertujuan untuk melihat apakah terdapat
efek random di dalam panel data.
Dalam perhitungan statistik Uji Hausman diperlukan asumsi bahwa
banyaknya kategori cross section lebih besar dibandingkan jumlah variabel independen (termasuk konstanta) dalam model. Lebih lanjut, dalam estimasi
statistik Uji Hausman diperlukan estimasi variansi cross section yang positif, yang tidak selalu dapat dipenuhi oleh model. Apabila kondisi-kondisi ini tidak dipenuhi
maka hanya dapat digunakan model fixed effect. 2.3.3 Uji Breusch-Pagan
Menurut Rosadi (2011, 264) Uji Breusch-Pagan digunakan untuk menguji
adanya efek waktu, individu atau keduanya.
atau tidak terdapat efek cross-section maupun waktu atau tidak terdapat efek cross-section atau terdapat efek cross-section
atau tidak terdapat efek waktu
atau terdapat efek waktu
Statistik uji: Uji Breusch-Pagan
Taraf signifikansi: 5%
Wilayah Kritik: Jika nilai p-value kurang dari taraf signifikansi yang ditentukan, maka tolak hipotesis awal .
2.4
Uji Diagnostik
2.4.1 Uji Korelasi Serial
Menurut Supranto (1995), korelasi serial yaitu korelasi (hubungan) antara
nilai-nilai pengamatan yang tersusun dalam rangkaian waktu (seperti pada data
runtun waktu atau time series) atau korelasi diantara nilai-nilai pengamatan yang terurut dalam ruang (data pengamatan merupakan cross-sectional).
2.4.1.1 Uji Breusch-Godfrey
Uji ini dikembangkan oleh Breusch-Godfrey. Hipotesis null berarti tidak adanya korelasi serial pada komponen galat (Rosadi, 2011: 277).
(2.36)
Berdasarkan model tersebut, Breusch-Godfrey mengasumsikan bahwa
̂ ̂ ̂ ̂
Hipotesis:
(tidak ada korelasi serial orde p) (ada korelasi serial)
Statistik Uji:
(2.38)
Keputusan tolak jika atau p-value < 5%.
2.4.2 Pengujian Ketergantungan Cross-Sectional (Tests for Cross-Sectional Dependence)
Menurut Baltagi, ketergantungan cross-sectional merupakan masalah pada
data panel makro (macro panels) dengan data runtun waktu jangka panjang.
Namun tidak terdapat masalah pada panel mikro (beberapa tahun).
Menurut Hoyos & Sarafidis (2006) secara umum model data panel dituliskan
sebagai berikut.
(2.39)
and
Dimana
= Variabel respon pada unit observasi ke-i dan waktu ke-t = Variabel prediktor pada unit observasi ke-i dan waktu ke-t
= Koefisien slope atau koefisien arah
= perbedaan intercept akibat perbedaan unit cross section
menyatakan bahwa diasumsikan independent and identically distributed (i.i.d) pada periode waktu dan diseluruh unit cross-sectional. Berdasarkan hipotesis alternatif, mungkin dapat berkorelasi pada unit cross-sections tetapi berasumsi bahwa tidak ada korelasi serial.
(
dimana adalah koefisien korelasi product-moment dari gangguan yang
diberikan
(2.40)
∑
∑ ⁄ (∑ ⁄
2.4.2.1 Pesaran’s CD Test
Dalam estimasi seemingly unrelated regression, Breusch dan Pagan (1980)
mengusulkan Lagrange Multiplier (LM) statistik, yang valid untuk model efek
tetap dengan prosedur sebagai berikut.
(2.41)
∑ ∑ ̂
Dimana ̂ adalah estimasi sederhana korelasi residual pair-wise (2.42)
̂ ̂ ∑ ̂ ̂
Statistik uji yang digunakan merupakan uji LM yang mengikuti distribusi chi-squared dengan derajat bebas . Namun demikian, uji ini mungkin menunjukan distorsi ukuran yang besar dalam kasus dimana berukuran besar
dan terbatas yang merupakan situasi yang biasa ditemui dalam kasus empiris,
karena terutama bahwa statistik LM tidak tepat berpusat pada nilai yang terbatas
dan cendurung tidak bias dengan yang besar.
Pesaran (2004) menyediakan alternatif berikut. ini
(2.43)
√ ∑ ∑ ̂
Dan menyatakan bahwa adalah tidak adanya cross-sectional dependence
untuk dan cukup besar.
Tidak seperti statistik LM, statistik CD mempunyai mean 0 untuk nilai yang
tepat pada dan , untuk berbagai macam model data panel, termasuk model
heterogen, model non-stasioner dan panel dinamis.
Dalam kasus panel yang tidak seimbang, Pesaran (2004) mengusulkan sedikit
modifikasi dari persamaan sebelumnya, yaitu
(2.44)
√ ∑ ∑ √ ̂
Dimana jumlah yang sama dari pengamatan unit time series antara i dan j.
̂ ̂
∑ ̂ ̂̅ ̂ ̂̅
∑ ̂ ̂̅ ⁄
∑ ̂ ̂̅ ⁄
Dan
(2.46)
̂̅ ∑ ̂
Statistik yang telah diubah menjelaskan fakta bahwa residuals untuk subset
dari t belum tentu 0 (Hoyos & Sarafidis, 2006). 2.4.3 Unit Root Tests
Menurut Enders, sebagaimana dikutip oleh Ma’aruf & Wihastuti (2008), unit
root tests adalah pengujian terhadap serangkaian data ditahap awal yang bertujuan untuk mengetahui statsioneritas data. Data yang stasioner dibutuhkan agar hasil
estimasi tidak bersifat lancung (spurious regression).
Menurut Croissant & Millo (2008) diketahui model berikut.
(2.47)
∑
Hipotesis unit root tests adalah . Model dapat ditulis ulang sebagai berikut.
(2.48)
∑
Beberapa unit root tests untuk data panel didasarkan pada hasil awal yang diperoleh dari Augmented Dickey Fuller regression.
Pertama, harus menentukan jumlah optimal dari lags untuk setiap time-series. Beberapa kemungkinan yang tersedia memiliki kesamaan bahwa jumlah maksimum dari lags harus dipilih pertama kali. Kemudian dapat dipilih dengan menggunakan:
1. Swartz Information Criteria (SIC) 2. Akaike Information Criteria (AIC)
3. Hall Method, yang dipilih dengan menghilangkan lags yang tertinggi ketika nilai tidak signifikan
ADF regression berjalan pada observasi untuk setiap individu, sehingga jumlah seluruh observasi adalah ̃ dimana ̃ , ̅ adalah
rata-rata dari lags. adalah vektor residual. Estimasi variansi adalah sebagai berikut.
(2.49)
̂ ∑
2.4.4 Uji Heterokedastisitas
Uji ini digunakan untuk mengetahui apakah matriks struktur variance-covariance residual bersifat homokedastik atau heterokedastisitas. Pengujiannya sebagai berikut. (Greene, 2003).
Hipotesis:
minimal ada satu (struktur variance-covariance residual
heterokedastisitas);
Statistik uji yang digunakan merupakan uji LM yang mengikuti distribusi chi-squared, yaitu
(2.50)
∑
Keterangan:
T = Banyaknya data time series N = Banyaknya data cross section
variance residual persamaan ke-i variance residual persamaan sistem
Jika nilai atau p-value kurang dari taraf signifikansi maka tolak hipotesis awal sehingga struktur variance-covariance residual bersifat heterokedastisitas.
2.5
Struktur
Variance-Covariance
Residual
Fixed Effect Model
Jika model yang terpilih atau yang digunakan adalah fixed effect model (model efek tetap), maka haruslah dilihat struktur variance-covariance residual dari modelnya (Gujarati, 2004). Ada tiga pembagian model struktur variance-covariance dari residual untuk fixed effect model yaitu struktur homokedastik dan tidak ada korelasi serial, struktur heterokedastisitas dan tidak ada korelasi serial,
2.5.1 Struktur Homokedastik dan Tidak Ada Korelasi Serial
Struktur variance-covariance residual yang bersifat homokedastik dan tidak ada serial correlation adalah sebagai berikut.
(2.51)
[
]
Untuk struktur seperti ini metode estimasi yang digunakan adalah Ordinary Least Square (OLS).
2.5.2 Struktur Heterokedastik dan Tidak Ada Korelasi Serial
Struktur variance-covariance residual yang bersifat heterokedastik dan tidak ada korelasi serial adalah sebagai berikut.
(2.52)
[
]
Untuk struktur seperti ini metode estimasi yang digunakan adalah
Generalized Least Square (GLS) atau Weighted Least Square (WLS) Cross-Sectional Weight.
2.5.2.1 Weighted Least Square (WLS)
Disebut Weighted Least Square (WLS) karena pada metode ini digunakan
“weight” atau pembobot yang proporsional terhadap inverse (kebalikan) dari
seperti pada regresi dengan OLS. Formula yang digunakan untuk mengestimasi
parameter regresi dengan metode ini adalah sebagai berikut.
(2.53)
Dimana matriks adalah matriks diagonal dengan pembobot pada
diagonal utama. Karena itu, matriks ini disebut matriks pembobot.
Dalam prektek, pembobot adalah nilai-nilai populasi yang tidak diketahui
secara langsung sehingga di estimasi berdasarkan data sampel.
2.5.3 Struktur Heterokedastik dan Ada Serial Korelasi
Struktur variance-covariance residual yang bersifat heterokedastik dan ada korelasi serial adalah sebagai berikut.
(2.54)
[
]
Untuk struktur seperti ini estimasi yang digunakan adalah Robust Variance Matrix Estimator.
2.5.3.1 Serial Correlation and the Robust Variance Matrix Estimator
Model efek linear teramati untuk periode waktu sebagai berikut.
(2.55)
and
Ketika heterokedastisitas pada terdeteksi, maka itu merupakan potensi
pada aplikasi tertentu. Ketika menerapkan perkiraan fixed effect, perlu diingat bahwa tidak ada aturan untuk korelasi serial pada { }. Ketika benar
bahwa observasi korelasi serial pada komposisi errors, , didominasi oleh adanya , maka korelasi serial dapat juga hilang dari waktu ke waktu.
Terkadang, { } mempunyai ketergantungan serial yang sangat kuat, dalam hal
ini kesalahan standar fixed effect biasa diperoleh dari persamaan ̂ ( ̂ ̂ (∑ ̈ ̈ ̂ (∑ ∑ ̈ ̈ dapat disalahartikan. Kemungkinan ini
cenderung menjadi masalah yang lebih besar dengan nilai yang besar.
Menguji kesalahan fatal pada error, { } untuk korelasi serial agak sulit. Intinya adalah bahwa tidak dapat memperkirakan dikarenakan time demeaning yang digunakan pada fixed effect, hanya dapat memperkirakan time demeaning dalam errors. Seperti apa yang telah ditunjukkan di persamaan ̈ ̈ , time-demeaned errors berkorelasi negatif jika tidak berkorelasi.
Ketika , ̈ ̈ untuk semua , maka itu adalah korelasi negatif yang
sempurna. Kesimpulan ini menunjukkan bahwa untuk jadilah tak berarti
untuk penggunaan ̈ sebagai uji berbagai macam korelasi serial parental.
Ketika , dapat digunakan persamaan ̈ ̈
untuk memutuskan apakah terdapat korelasi serial pada { }. Secara natural,
dapat digunakan residual dari fixed effect, ̂ . Pengujian sangatlah kompleks dari fakta bahwa { ̈ } berkorelasi serial pada hipotesis nol. Ada dua kemungkinan
untuk menentukannya. Pertama, hanya dapat menggunakan dua waktu periode
untuk menguji persamaan ̈ ̈ menggunakan regresi
(2.56)
̂ pada ̂
dan gunakan ̂, koefisien pada ̂ , bersama dengan standard error-nya, untuk menguji , dimana ( ̈ ̈ . (Hal itu adalah cara
yang sepele untuk membuat uji ini tegar pada heterokedastisitas).
Alternatifnya, dapat digunakan lebih banyak periode waktu jika membuat t statistik tegar pada korelasi serial yang sewenang-wenang. Dengan kata lain,
jalankan pooled OLS regression (2.57)
̂ pada ̂
dan gunakan robust standard error secara penuh untuk pooled OLS.
Jika ditemukan korelasi serial, haruslah pada tingkat minimal, sesuaikan
varians estimator matriks asymptotic dan uji statistik. ̂ ̈ ̈ ̂ , tunjukan vektor fixed effect residuals. The robust variance matrix
estimator dari ̂ adalah (2.58)
̂ ( ̂ ( ̈ ̈ (∑ ̈ ̂ ̂ ̈
) ( ̈ ̈
yang disarankan oleh Arellano (1987) dan mengikuti dari kesimpulan umum
White (1984, chapter 6). The robust variance matrix estimator valid untuk semua heterokedastisitas atau serial korelasi di { }, tersedia pada nilai
2.6
Pemeriksaan Persamaan Regresi
Menurut Nachrowi & Usman (2006), baik atau buruknya regresi yang dibuat
dapat di lihat berdasarkan beberapa indikator, yaitu meliputi standard error, uji hipotesis dan koefisien determinasi (
2.6.1 Standard Error
Metode yang digunakan untuk menduga model dilandasi pada prinsip
meminimalkan error. Oleh karena itu, ketepatan dari nilai dugaan sangat ditentukan oleh standard error dari masing-masing penduga. Adapun standard error dirumuskan sebagai berikut.
(2.59)
∑ ̅
⁄
(2.60)
∑ ∑ ̅
⁄
Oleh karena merupakan penyimpangan yang terjadi dalam populasi, yang
nilainya tidak diketahui, maka biasanya diduga berdasarkan data sampel.
Adapun penduganya adalah sebagai berikut.
(2.61)
∑
⁄
(2.62)
Terlihat hubungan error yang minimal akan mengakibatkan standard error koefisien minimal pula. Dengan minimalnya standard error koefisien berarti, koefisien yang didapat cenderung mendekati nilai sebenarnya. Bila rasio tersebut
bernilai 2 atau lebih, dapat dinyatakan bahwa nilai standard error relatif kecil dibanding parameternya. Rasio inilah yang menjadi acuan pada Uji t.
2.6.2 Uji Hipotesis
Uji hipotesis ini berguna untuk memeriksa atau menguji apakah koefisien
regresi yang didapat signifikan. Maksud dari signifikan ini adalah suatu nilai
koefisien regresi yang secara statistik tidak sama dengan nol. Jika koefisien slope sama dengan nol, berarti dapat dikatakan bahwa tidak cukup bukti untuk
menyatakan variabel bebas mempunyai pengaruh terhadap variabel terikat.
Untuk kepentingan tersebut, maka semua koefisien regresi harus di uji. Ada
dua jenis uji hipotesis terhadap koefisien regresi yang dapat dilakukan, yang
disebut Uji F dan Uji t. Uji F digunakan untuk menguji koefisien (slope) regresi secara bersama-sama, sedang Uji t untuk menguji koefisien regresi, termasuk
intercept secara individu.
2.6.2.1 Uji Serentak (Uji F)
Uji-F diperuntukan guna melakukan uji hipotesis koefisien (slope) regresi secara bersamaan. Dengan demikian, secara umum hipotesisnya dituliskan
sebagai berikut.
Statistik uji:
(2.63)
Dengan
= koefisien determinasi
= jumlah cross section = jumlah time series
= jumlah variabel independen
Kriteria uji: ditolak jika , artinya bahwa
hubungan antara semua variabel independen dan variabel dependen berpengaruh
signifikan (Gujarati, 2004).
2.6.2.2 Uji Parsial (Uji t)
Adapun hipotesis dalam uji ini adalah sebagai berikut.
( adalah koefisien slope)
Dari hipotesis tersebut dapat terlihat arti dari pengujian yang dilakukan, yaitu
berdasarkan data yang tersedia, akan dilakukan pengujian terhadap (koefisien
regresi populasi), apakah sama dengan nol, yang berarti variabel bebas tidak
mempunyai pengaruh signifikan terhadap variabel terikat, atau tidak sama dengan
nol, yang berarti variabel bebas mempunyai pengaruh signifikan terhadap variabel
Untuk regresi sederhana, yang mempunyai dua koefisien regresi (intercept dan sebuah slope), tentu hipotesis yang dibuat akan sebanyak dua buah, yaitu (2.64)
(2.65)
Uji t didefinisikan sebagai berikut.
(2.66)
Tetapi, karena akan diuji apakah sama dengan 0 ( ), maka nilai
dalam persamaan harus diganti dengan nol. Maka formula Uji t menjadi
(2.67)
Nilai t diatas akan dibandingkan dengan nilai t Tabel. Bila ternyata setelah dihitung | | ⁄ , maka nilai t berada dalam daerah penolakan,
sehingga hipotesis nol ditolak pada tingkat kepercayaan
Khusus untuk Uji t ini dapat dibuat batasan daerah penolakan secara praktis,
yaitu bila derajat bebas atau lebih dan , maka hipotesis akan
ditolak jika
(2.68)
| |
2.6.2.3 KoefisienDeterminasi
Menurut Nachrowi & Usman (2006), Koefisien Determinasi (Goodness of Fit), yang dinotasikan dengan , merupakan suatu ukuran yang penting dalam regresi, karena dapat menginformasikan baik atau tidaknya model regresi yang
terestimasi. Atau dengan kata lain, angka tersebut dapat mengukur seberapa
dekatkah garis regresi yang terestimasi dengan data sesungguhnya.
Nilai Koefisien Determinasi ini mencerminkan seberapa besar variasi
dari variabel terikat dapat diterangkan oleh variabel bebas . Bila nilai
Koefisien Determinasi sama dengan 0 , artinya variasi dari tidak dapat
diterangkan oleh sama sekali. Sementara bila , artinya variasi secara
keseluruhan dapat diterangkan oleh . Dengan kata lain , maka semua
pengamatan berada tepat pada garis regresi. Dengan demikian baik atau buruknya
suatu persamaan regresi ditentukan oleh -nya yang mempunyai nilai antara nol
dan satu.
2.7
Uji Asumsi Model Regresi Data Panel
Menurut Yudiatmaja (2013), model regresi data panel dapat disebut sebagai
dan Estimator (BLUE). BLUE dapat dicapai bila memenuhi asumsi klasik.
Apabila persamaan yang terbentuk tidak memenuhi kaidah BLUE, maka
persamaan tersebut diragukan kemampuannya dalam menghasilkan nilai-nilai
prediksi yang akurat. Tetapi bukan berarti persamaan tersebut tidak bisa
digunakan untuk memprediksi. Agar suatu persamaan tersebut dapat
dikategorikan memenuhi kaidah BLUE, maka data yang digunakan harus
memenuhi beberapa asumsi yang sering dikenal dengan istilah uji asumsi klasik.
Uji asumsi klasik mencakup uji normalitas, uji multikolinearitas, uji
linearitas, uji heterokedastisitas dan uji autokorelasi. Persamaan yang terbebas
dari kelima masalah pada uji asumsi klasik akan menjadi estimator yang tidak bias
(Widarjono, 2007).
2.7.1 Uji Normalitas
Data klasifikasi kontinu dan data kuantitatif yang termasuk dalam pengukuran
data skala interval atau ratio agar dapat dilakukan uji statistik parametrik
dipersyaratkan berdistribusi normal. Pembuktian data berdistribusi normal
tersebut perlu dilakukan uji normalitas terhadap data. Uji normalitas berguna
untuk membuktikan data dari sampel yang dimiliki berasal dari populasi
berdistribusi normal atau data populasi yang dimiliki berdistribusi normal. Banyak
cara yang dapat dilakukan untuk membuktikan suatu data berdistribusi normal
atau tidak.
Metode klasik dalam pengujian normalitas suatu data tidak begitu rumit.
lebih dari 30 angka , maka sudah dapat diasumsikan berdistribusi
normal. Biasa dikatakan sebagai sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal
atau tidak, sebaiknya digunakan uji statistik normalitas. Karena belum tentu data
yang lebih dari 30 bisa dipastikan berdistribusi normal, demikian sebaliknya data
yang banyaknya kurang dari 30 belum tentu tidak berdistribusi normal, untuk itu
perlu suatu pembuktian. Pembuktian normalitas dapat dilakukan dengan manual,
yaitu dengan menggunakan kertas peluang normal, atau dengan menggunakan uji
statistik normalitas.
Banyak jenis uji statistik normalitas yang dapat digunakan diantaranya
Kolmogorov Smirnov, Lilliefors, Chi-Square, Shapiro Wilk atau menggunakan software komputer. Software komputer dapat digunakan misalnya SPSS, Minitab, Simstat, Microstat, dsb. Pada hakekatnya software tersebut merupakan hitungan uji statistik Kolmogorov Smirnov, Lilliefors, Chi-Square, Shapiro Wilk, dsb yang telah diprogram dalam software komputer. Masing- masing hitungan uji statistik normalitas memiliki kelemahan dan kelebihannya, pengguna dapat memilih sesuai
dengan keuntungannya.
Pengujian asumsi ini menguji normalitas pada residualnya yang dihasilkan
dari model regresinya. Untuk menguji normalitas ini menggunakan Uji Jarque-Bera. Uji Jarque-Bera ini menggunakan perhitungan skewness dan kurtosis dengan hipotesis:
Residual berdistribusi normal
Statistik uji:
(2.69)
Dengan:
N : Banyaknya data
: Skewness (kemencengan) Kurtosis (peruncingan)
Dengan
(2.70)
̂
̂ ∑
̅
∑ ̅
(2.71)
̂ ̂ ⁄
∑ ̅
∑ ̅ ⁄
Kriteria uji: ditolak jika artinya residual tidak berdistribusi normal
(Jarque and Bera, 1987).
2.7.2 Uji Linearitas
Menurut Siswandari sebagaimana dikutip oleh Arifin (2010), Uji Linearitas
digunakan untuk mendeteksi adanya hubungan linear antara variabel dan
yang bisa dilakukan, sebagai berikut. :
Jika plot yang bersangkutan menggambarkan suatu scatter diagram (diagram pencar) dalam arti tidak berpola maka dapat dikatakan tidak terjadi
mispesifikasi pada fungsi regresi, hal ini bararti bahwa hubungan antara
variabel dan adalah linear.
(2) Plot antara variabel versus
Jika plot menggambarkan garis lurus maka asumsi pertama ini telah
terpenuhi.
(3) Plot antara residu versus
Jika plot menggambarkan diagram pencar maka linearitas ini sudah
terpenuhi.
2.7.3 Multikolinearitas
Istilah multikolinearitas mula-mula ditemukan oleh Ragnar Frisch. Pada
mulanya multikoliearitas berarti adanya hubungan linear yang “sempurna” atau
pasti, di antara beberapa atau semua variabel yang menjelaskan dari model
regresi. Istilah kolinearitas (collinearity) sendiri berarti hubungan linear tunggal (single linear relationship), sedangkan kolinearitas ganda (multikolinearity) menunjukkan adanya lebih dari satu hubungan linear yang sempurna.
Asumsi multikolinearitas adalah asumsi yang menunjukan adanya hubungan
linear yang kuat diantara beberapa variabel prediktor dalam suatu model regresi
linear berganda. Model regresi yang baik memiliki variabel-variabel prediktor
yang independen atau tidak berkorelasi. Penyebab terjadinya kasus
multikolinearitas adalah terdapat korelasi atau hubungan linear yang kuat diantara
Multikolinearitas digunakan untuk menguji suatu model apakah terjadi
hubungan yang sempurna atau hampir sempurna antara variabel bebas, sehingga
sulit untuk memisahkan pengaruh antara variabel-variabel itu secara individu
terh