III. METODE PENELITIAN
3.1. Jenis dan Sumber Data
Penelitian ini menggunakan data sekunder tahun 2001 – 2009, yang terdiri dari:
1. PDRB kabupaten/kota atas dasar harga konstan 2000.
2. Pengeluaran rumah tangga yang diagregasi dari data KOR Susenas untuk wilayah kabupaten/kota dan telah dideflasi dengan menggunakan tahun dasar 2000, yang diperoleh dari deflator PDRB.
3. Investasi kabupaten/kota, yang merupakan penggabungan dua variabel: i. Investasi pemerintah berupa belanja barang modal pemerintah
kabupaten/kota
ii. Investasi perumahan yang dilakukan oleh rumah tangga, yang diperoleh dari data KOR Susenas untuk wilayah kabupaten/kota. 4. Jumlah tenaga kerja kabupaten/kota.
5. PDRB perkapita kabupaten/kota dan provinsi atas dasar harga konstan 2000, yang dihitung dengan membagi nilai PDRB dengan jumlah penduduk.
6. Pengeluaran rumah tangga perkapita kabupaten/kota dan provinsi, yang dihitung dengan cara membagi pengeluaran rumah tangga dengan jumlah penduduk.
7. Kontribusi sektor pertanian terhadap PDRB total kabupaten/kota sebagai variabel instrumen untuk analisis konvergensi dan data kontribusi sektor pertanian terhadap PDRB total pada level provinsi untuk analisis ketimpangan.
8. Kontribusi sektor manufaktur terhadap PDRB total kabupaten/kota sebagai variabel instrumen untuk analisis konvergensi dan data kontribusi sektor manufaktur terhadap PDRB total pada level provinsi untuk analisis ketimpangan.
9. Tingkat pendidikan tenaga kerja kabupaten/kota dan provinsi, yang diproksi dengan share tenaga kerja yang berpendidikan SMA ke atas terhadap jumlah tenaga kerja. Alasan penggunaan variabel ini
digunakan sebagai variabel instrumen untuk analisis konvergensi adalah adanya hubungan yang langsung antara kualitas tenaga kerja dengan produktivitas dalam kegiatan produksi. Sedangkan dalam analisis ketimpangan, share tenaga kerja yang berpendidikan SMA ke atas digunakan untuk menghilangkan bias yang disebabkan adanya lag variabel pendidikan dalam kegiatan ekonomi.
10. Pengeluaran rutin pemerintah kabupaten/kota yang digunakan sebagai variabel instrumen untuk analisis konvergensi dan data pada level provinsi untuk analisis ketimpangan. Variabel ini terdiri dari belanja pegawai, belanja barang dan jasa, belanja perjalanan dinas, belanja pemeliharaan, belanja bunga, belanja subsidi, belanja bantuan keuangan, belanja bantuan sosial, belanja bagi hasil, belanja tak terduga dan belanja lain-lain.
11. Pajak daerah kabupaten/kota, hanya digunakan sebagai variabel instrumen untuk analisis konvergensi.
12. Jumlah puskesmas pada level provinsi, sebagai proksi variabel infrastruktur kesehatan yang menjangkau seluruh masyarakat sampai ke level kecamatan.
13. Jumlah energi listrik yang terjual kepada konsumen pada level provinsi. Pemilihan variabel ini mengacu pada konsumsi konsumen, bukan pada jumlah energi listrik yang diproduksi.
14. Volume air bersih PDAM yang disalurkan kepada konsumen pada level provinsi. Pemilihan variabel ini juga mengacu pada konsumsi konsumen, bukan pada volume air bersih yang diproduksi.
15. Panjang jalan yang kondisinya baik dan sedang, baik jalan negara, jalan provinsi maupun jalan kabupaten/kota di masing-masing provinsi. Kondisi jalan yang baik dan sedang diharapkan lebih menentukan kelancaran kegiatan ekonomi dibandingkan jalan yang rusak, sehingga panjang jalan yang digunakan dalam penelitian ini tidak memasukkan jalan yang rusak.
Sumber data yang digunakan tersebut diperoleh dari Badan Pusat Statistik (BPS), Departemen Keuangan, PLN, PDAM, Dinas Kesehatan, BKPM dan data-data pendukung lainnya.
3.2. Metode Analisis
3.2.1. Koefisien Variasi Williamson
Koefisien variasi Williamson digunakan untuk mengukur perbedaan nilai output rata-rata yang dihasilkan suatu wilayah. Ukuran ini biasanya menggunakan data PDRB perkapita untuk mengukur ketimpangan pembangunan antar wilayah, yang dinyatakan dengan rumus:
𝐶𝑉� =
����∑����(�����)�
�� , 0 < CVw < 1………...(3.1)
Dimana:
𝑦� : PDRB perkapita wilayah ke-i
𝑦� : PDRB perkapita seluruh wilayah 𝑓� : jumlah penduduk wilayah ke-i
𝑛 : jumlah penduduk seluruh wilayah
Penelitian ini juga menghitung koefisien variasi Williamson untuk mengukur perbedaan nilai pengeluaran rumah tangga rata-rata yang dihasilkan suatu wilayah secara agregat. Selanjutnya pengeluaran rumah tangga tersebut dibagi dengan jumlah penduduk untuk mendapatkan nilai pengeluaran rumah tangga perkapita dan digunakan sebagai variabel y.
3.2.2. Analisis Data Panel Statis
Data panel adalah data yang memiliki dimensi ruang (individu) dan waktu, yang merupakan gabungan antara data silang (cross section) dengan data runtut waktu (time series). Jika setiap unit cross section memiliki jumlah observasi time
series yang sama maka disebut sebagai balanced panel. Sebaliknya jika jumlah
observasi berbeda untuk setiap unit cross section maka disebut unbalanced panel. Keunggulan dari penggunaan data panel dalam analisis ekonometrik antara lain: (i) mampu mengontrol heterogenitas individu; (ii) memberikan informasi yang lebih banyak dan beragam, meminimalkan masalah kolinieritas
(collinearity), meningkatkan jumlah derajat bebas dan lebih efisien; (iii) data panel umumnya lebih baik bila digunakan dalam studi dynamics of adjustment; (iv) data panel lebih baik dalam mengukur dan mengidentifikasi serta mengukur efek yang tidak dapat dideteksi apabila menggunakan data cross section atau time
series murni; dan (v) data panel dapat digunakan untuk mengonstruksi dan
menguji model perilaku yang lebih kompleks dibandingkan data cross section atau time series murni.
Meskipun demikian, analisis data panel juga memiliki beberapa kelemahan dan keterbatasan dalam penggunaannya khususnya apabila data panel dikumpulkan atau diperoleh dengan metode survei. Permasalahan tersebut antara lain: (i) relatif besarnya data panel karena melibatkan komponen cross section dan
time series menimbulkan masalah disain survei panel, pengumpulan dan
manajemen data (masalah yang umumnya dihadapi di antaranya: coverage,
nonresponse, kemampuan daya ingat responden (recall), frekuensi, dan waktu
wawancara; (ii) distorsi kesalahan pengamatan (measurement error) yang umumnya terjadi karena kegagalan respon (contoh: pertanyaan yang tidak jelas, ketidaktepatan informasi, dan lain-lain); (iii) masalah selektivitas, yakni:
selfselectivity, nonresponse, attrition (jumlah responden yang terus berkurang
pada survey lanjutan); dan (iv) cross section dependence (contoh: apabila macro
panel data dengan unit analisis negara atau wilayah dengan deret waktu yang
panjang mengabaikan cross-country dependence maka dapat mengakibatkan kesimpulan-kesimpulan yang tidak tepat (miss leading inference).
Data panel dapat didefinisikan sebagai observasi berulang pada setiap unit
cross section yang sama, yang memiliki karakteristik di mana N > 1 dan T > 1.
Misalkan yit merupakan nilai varabel dependen untuk unit cross section ke-i pada waktu ke-t dengan i = 1, 2,…, N dan t = 1, 2,…,T. Dan misalkan terdapat K variabel penjelas yang masing-masing diberi indeks j = 1, 2,…,K serta dinotasikan sebagai 𝑋���, yang menyatakan nilai variabel penjelas ke-j untuk unit ke-i pada waktu ke-t. Cara yang sering digunakan untuk mengorganisir data panel adalah dengan menuliskannya ke dalam bentuk matriks sebagai berikut:
𝑦� = � 𝑦�� 𝑦�� ⋮ 𝑦�� �; 𝑋� = ⎣ ⎢ ⎢ ⎡𝑋��� 𝑋��� ⋯ 𝑋��� 𝑋��� ⋮ 𝑋�� � ⋯ ⋮ ⋱ 𝑋�� � ⋮ 𝑋��� 𝑋��� ⋯ 𝑋���⎦ ⎥ ⎥ ⎤ ; 𝜀� = � 𝜀�� 𝜀�� ⋮ 𝜀�� � ...(3.2) dengan 𝜀�� menyatakan gangguan acak untuk unit ke-i pada waktu ke-t. Selanjutnya data tersebut disederhanakan dalam bentuk stack sebagai berikut:
𝑦 = � 𝑦� 𝑦� ⋮ 𝑦� �; 𝑋 = � 𝑋� 𝑋� ⋮ 𝑋� �; 𝜀 = � 𝜀� 𝜀� ⋮ 𝜀� � ...(3.3) dengan y adalah matriks berukuran NTx1, X adalah matriks berukuran NTxK, dan
ε adalah matriks berukuran NTx1. Model standar data panel linier dapat
diekspresikan sebagai
y = X 'β + ε ...(3.4)
dengan β adalah matriks berukuran NT x 1 yang diekspresikan sebagai 𝛽 = � 𝛽� 𝛽� ⋮ 𝛽� � ...(3.5) Ada beberapa metode yang sering digunakan untuk mengestimasi parameter model data panel statis. Metode sederhana yang sering digunakan adalah pooled
estimator atau dikenal sebagai metode least square yang umumnya digunakan
pada model cross section dan time series murni. Sebagaimana dibahas sebelumnya bahwa data panel memiliki jumlah observasi lebih banyak dibandingkan data cross section dan time series murni. Akibatnya, ketika data digabungkan menjadi pool data, regresi yang dihasilkan cenderung lebih baik dibandingkan regresi yang menggunakan data cross section dan time series murni. Akan tetapi, dengan mengabungkan data, maka variasi atau perbedaan baik antara individu dan waktu tidak dapat terlihat. Hal ini tentunya kurang sesuai dengan tujuan dari digunakannya data panel. Lebih jauh lagi, dalam beberapa kasus, penduga yang dihasilkan melalui least square dapat menjadi bias akibat kesalahan spesifikasi data.
Untuk mengatasi permasalahan tersebut, ada dua metode yang biasanya digunakan dalam pemodelan data panel, yakni metode efek tetap (fixed effects
𝑦�� = 𝑋��′ 𝛽 + 𝜀�� ...(3.6)
dengan gangguan acak diasumsikan mengikuti one-way error component model sebagai berikut:
𝜀�� = 𝛼�+ 𝑢�� ...(3.7)
dan diasumsikan bahwa uit merupakan gangguan acak yang tidak berkorelasi dengan Xit . Sedangkan αi disebut sebagai efek individual (time invariantperson
specific effect). Beberapa aplikasi empiris data panel umumnya melibatkansatu di
antara asumsi mengenai efek individual.
Pertama, bila αi diperlakukan sebagai parameter tetap, namun bervariasi
antar i = 1,2,…, N , maka model ini disebut sebagai fixed effects model (FEM). Model efek tetap umumnya digunakan ketika terdapat korelasi antara intersep individual dan variabel independen r. Secara umum model ini dapat diekspresikan sebagai
𝑦�� = 𝛼�+ 𝑋��′ 𝛽 + 𝑢�� ...(3.8)
dengan asumsi bahwa uit ~ iid (0,𝜎��). Penduga dari model ini mampu menjelaskan perbedaan atau variasi antar individu (differences within individual), karena model ini memungkinkan adanya perbedaan intersep α pada setiap i. Penduga dari model ini ditentukan sebagaimana penduga least square dalam regresi namun dalam bentuk deviasi rata-rata individual. Menurut Verbeek (2000), dugaan untuk paremeter β dengan menggunakan FEM dapat diformulasikan sebagai
𝛽��� = (∑����∑ (𝑋���� ��− 𝑋��)′ )�� (∑����∑ (𝑋���� ��− 𝑋��)(𝑦�� − 𝑦��) ...(3.9)
Sedangkan estimasi untuk intersep α dituliskan sebagai
𝛼��= 𝑦��− 𝑋�� ′ 𝛽��� ; 𝑖 = 1, . . , 𝑁 ...(3.10)
Matriks kovarian untuk fixed effect estimator 𝛽���, dengan uit ~ iid (0,𝜎��) diberikan oleh:
𝑉 [𝛽���] = 𝜎��(∑���� ∑ (𝑋���� �� − 𝑋��)(𝑋��− 𝑋��)′ )�� ...(3.11)
dengan
𝜎�� = �(���)� ∑����∑ (𝑦���� �� − 𝑦��− (𝑋��− 𝑋��)′𝛽���)� ……….…...…(3.12)
Pada dasarnya, FEM lebih menekankan pada perbedaan di antara individu, yakni menjelaskan bagaimana 𝑦�� berbeda dari 𝑦��, dan tidak menjelaskan kenapa
bahwa perubahan yang terjadi dalam X memiliki pengaruh yang sama, apakah perubahan dari satu periode ke periode lainnya atau perubahan dari satu individu ke individu lainnya.
Kedua, bila 𝛼� diperlakukan sebagai parameter random, maka model disebut
sebagai random effects model (REM). Dalam REM, perbedaan karakeristik individu diakomodasi oleh error dalam model. Secara umum model ini dapat diekspresikan sebagai:
𝑦�� = 𝛼 + 𝑋��′ 𝛽 + 𝑢��+ 𝜏� ...(3.13)
dengan 𝛼� = 𝛼 + 𝜏� dan memiliki rata-rata nol. Di sini, 𝜏� merepresentasikan
gangguan individu (individual disturbance) yang tetap sepanjang waktu. Beberapa asumsi yang melekat dalam REM antara lain:
𝐸 (𝑢��|𝜏�) = 0 ...(3.14) 𝐸 (𝑢����𝜏�) = 𝜎�� ...(3.15) 𝐸 (𝜏�|𝑥��) = 0; ∀ 𝑖, 𝑡 ...(3.16) 𝐸 (𝜏����𝑥 ��) = 𝜎�� ...(3.17) 𝐸 �𝑢�� 𝜏�� = 0; ∀ 𝑖, 𝑡, 𝑗 ...(3.18) 𝐸 �𝑢�� 𝑢��� = 0; 𝑖 ≠ 𝑗 𝑎𝑡𝑎𝑢 𝑡 ≠ 𝑠 ... (3.19) 𝐸 �𝑢�� 𝜏�� = 0; ∀ 𝑖, 𝑡, 𝑗 ...(3.20)
Untuk menduga REM umumnya digunakan metode generalized least square (GLS). Misalkan kombinasi error pada persamaan (3.13) dituliskan menjadi 𝑤�� = 𝑢��+ 𝜏�, dengan
𝐸 (𝑤��) = 0 ...(3.21)
𝐸 (𝑤���) = 𝜎��+ 𝜎��; ∀ 𝑖, 𝑡 ...(3.22)
𝐸 �𝑤�� 𝑤��� = 𝜎��; ∀ 𝑡 ≠ 𝑠 ...(3.23)
𝐸 �𝑤�� 𝑤��� = 0; 𝑢𝑛𝑡𝑢𝑘 𝑖 ≠ 𝑗 𝑎𝑡𝑎𝑢 𝑡 ≠ 𝑠 ...(3.24)
Apabila gangguan sejumlah T untuk individu i dikumpulkan dalam bentuk vektor 𝑤� = (𝑤��, 𝑤��, … , 𝑤��)’ maka dapat dituliskan bahwa
𝐸 �𝑤�𝑤�′� = Ω ...(3.25)
Ω = ⎝ ⎜ ⎜ ⎛ 𝜎��+ 𝜎�� 𝜎�� 𝜎�� ⋯ 𝜎�� 𝜎�� 𝜎�� ⋮ 𝜎�� 𝜎��+ 𝜎�� 𝜎�� ⋮ 𝜎�� 𝜎�� 𝜎�� + 𝜎�� ⋮ 𝜎�� ⋯ ⋯ ⋱ ⋯ 𝜎�� 𝜎�� ⋮ 𝜎��+ 𝜎��⎠ ⎟ ⎟ ⎞ ...(3.26)
Untuk keseluruhan observasi panel, matriks kovarian error 𝑤 = (𝑤�, 𝑤�, … , 𝑤�)′ dapat diturunkan sebagai
𝑉 𝑁𝑇𝑥𝑁𝑇 = ⎝ ⎜ ⎛Ω 0 0 ⋯ 00 0 ⋮ 0 Ω 0 ⋮ 0 0 Ω ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ Ω⎠ ⎟ ⎞ = 𝐼�⊗ Ω ...(3.27)
dengan 𝐼� menyatakan matriks identitas berdimensi N dan ⊗ merepresentasikan Kronecker product. Misalkan Y pada persamaan (3.14) direpresentasikan sebagai
vektor stack dari 𝑦�� yang dibentuk dengan pola yang sama dengan w (dengan
struktur yang sama untuk X). Selanjutnya keseluruhan sistem yang dituliskan sebagai
Y = Xβ + w ...(3.28)
dapat diestimasi dengan menggunaan metode GLS. Secara umum pendugaan GLS untuk persamaan regresi (3.28) memerlukan transformasi untuk menghilangkan struktur yang tidak baku dari matriks kovarian 𝐸(𝑤′𝑤) = 𝑉. Kemudian dengan mendefinisikan matriks penimbang 𝑃 = 𝑉��/� dan mengalikannya ke kedua ruas pada persamaan (3.38) diperoleh hasil transformasi sebagai berikut:
𝑃𝑌 = 𝑃𝑋𝛽 + 𝑃𝑤 ...(3.29) atau 𝑌∗ = 𝑋∗𝛽 + 𝑤∗ ...(3.30) sekarang 𝐸(𝑤∗𝑤∗�) = 𝐸(𝑃𝑤𝑤′𝑃) = PE (ww’)P = PVP = 𝐼��
Sehingga, penduga GLS pada persamaan regresi (3.38) dapat dituliskan sebagai 𝛽���� = (𝑋′𝑉��𝑋)��𝑋′𝑉��𝑌 ...…...(3.31)
3.2.3. Data Panel Dinamis
Relasi di antara variabel-variabel ekonomi pada kenyataannya banyak yang bersifat dinamis. Analisis data panel dapat digunakan pada model yang bersifat dinamis dalam kaitannya dengan analisis penyesuaian dinamis (dynamic of
adjustment). Hubungan dinamis ini dicirikan oleh keberadaan lag variabel
dependen di antara variabel-variabel regresor. Sebagai ilustrasi, model data panel dinamis adalah sebagai berikut:
𝑦�� = 𝛿𝑦�,���+ 𝑥��′ 𝛽 + 𝑢��; 𝑖 = 1, … , 𝑁; 𝑡 = 1, . . , 𝑇 ...(3.32)
dengan 𝛿 menyatakan suatu skalar, 𝑥��′ menyatakan matriks berukuran 1xK dan 𝛽
matriks berukuran Kx1. Dalam hal ini, 𝑢�� diasumsikan mengikuti model oneway error component sebagai berikut:
𝑢�� = 𝜇�+ 𝑣�� ...(3.33)
dengan 𝜇�~ 𝑖𝑖𝑑 (0, 𝜎��) menyatakan pengaruh individu dan 𝑣��~ 𝑖𝑖𝑑 (0, 𝜎��) menyatakan gangguan yang saling bebas satu sama lain atau dalam beberapa literatur disebut sebagai transient error.
Dalam model data panel statis, dapat ditunjukkan adanya konsistensi dan efisiensi baik pada FEM maupun REM terkait perlakuan terhadap 𝜇�. Dalam model dinamis, situasi ini secara substansi sangat berbeda, karena 𝑦�� merupakan
fungsi dari 𝜇� maka 𝑦�,��� juga merupakan fungsi dari 𝜇�. Karena 𝜇� adalah fungsi
dari 𝑢�� maka akan terjadi korelasi antara variabel regresor 𝑦�,��� dengan 𝑢��. Hal ini akan menyebabkan penduga least square (sebagaimana digunakan pada model data panel statis) menjadi bias dan inkonsisten, bahkan bila 𝑣�� tidak berkorelasi
serial sekalipun.
Untuk mengilustrasikan kasus tersebut, berikut diberikan model data panel autoregresif (AR(1)) tanpa menyertakan variabel eksogen:
𝑦�� = 𝛿𝑦�,���+ 𝑢��; |𝛿| < 1; 𝑡 = 1, . . , 𝑇 ...(3.34)
dengan 𝑢�� = 𝜇�+ 𝑣�� di mana 𝜇�~ 𝑖𝑖𝑑 (0, 𝜎��) dan 𝑣��~ 𝑖𝑖𝑑 (0, 𝜎��) saling bebas
satu sama lain. Penduga fixed effect bagi 𝛿 diberikan oleh 𝛿��� =∑ ∑ (�������)(��,�������,��) � ��� � ��� ∑����∑����(��,�������,��)� ...(3.35)
dengan 𝑦�� = 1/𝑇 ∑����𝑦�� dan 𝑦��,�� = 1/𝑇 ∑����𝑦�,���. Untuk menganalis sifat dari 𝛿���, dapat disubstitusi persamaan (3.44) ke (3.45) untuk memperoleh:
𝛿��� = 𝛿 +(
�
��) ∑����∑����(�������)(��,�������,��)
(���) ∑����∑����(��,�������,��)
� ...(3.36) Penduga ini bersifat bias dan inkonsisten untuk 𝑁 → ∞ dan T tetap, bentuk pembagian pada persamaan (3.46) tidak memiliki nilai harapan nol dan tidak konvergen menuju nol bila 𝑁 → ∞. Secara khusus, hal ini dapat ditunjukkan bahwa: 𝑝𝑙𝑖𝑚 𝑁 → ∞ � � ��� ∑����∑ (𝑣���� ��− 𝑣̅�)�𝑦�,���− 𝑦��,���= − ��� ��(���)����� � (���)� ≠ 0 ....(3.37) sehingga, untuk T tetap, akan dihasilkan penduga yang inkonsisten.
Untuk mengatasi masalah ini, pendekatan method of moments dapat digunakan. Arrelano dan Bond menyarankan suatu pendekatan generalized
method of moments (GMM). Pendekatan GMM merupakan salah satu yang
populer. Setidaknya ada dua alasan yang mendasari, pertama, GMM merupakan
common estimator dan memberikan kerangka yang lebih bermanfaat untuk
perbandingan dan penilaian. Kedua, GMM memberikan alternatif yang sederhana terhadap estimator lainnya, terutama terhadap maximum likelihood..
Namun demikian, penduga GMM juga tidak terlepas dari kelemahan. Adapun beberapa kelemahan metode ini, yaitu: (i) GMM estimator adalah
asymptotically efficient dalam ukuran contoh besar tetapi kurang efisien dalam
ukuran contoh yang terbatas (finite); dan (ii) estimator ini terkadang memerlukan sejumlah implementasi pemrograman sehingga dibutuhkan suatu perangkat lunak (software) yang mendukung aplikasi pendekatan GMM.
Ada dua jenis prosedur estimasi GMM yang umumnya digunakan untuk mengestimasi model linear autoregresif, yakni:
(i) First-difference GMM (FD-GMM atau AB-GMM); dan (ii) System GMM (SYS-GMM).
Penelitian ini hanya menggunakan pendekatan First-difference GMM (FD-GMM atau AB-(FD-GMM) yaitu menggunakan transformasi first difference untuk pendekatan variabel instrumen untuk mendapatkan estimasi 𝛿 yang konsisten di mana 𝑁 → ∞ dengan T tertentu dengan mengeliminasi pengaruh individual (𝜇�) sebagai berikut:
𝑦��− 𝑦�,��� = 𝛿�𝑦�,���− 𝑦�,���� + �𝑣��− 𝑣�,����; 𝑡 = 2, . . , 𝑇...(3.38)
namun, pendugaan dengan least square akan menghasilkan penduga 𝛿 yang inkonsisten karena 𝑦�,��� dan 𝑣�,��� berdasarkan definisi berkorelasi, bahkan bila 𝑇 → ∞. Untuk itu, transformasi dengan menggunakan first difference ini dapat menggunakan suatu pendekatan variabel instrumen (Baum, et al., 2003). Sebagai contoh, 𝑦�,��� akan digunakan sebagai instrumen. Di sini, 𝑦�,��� berkorelasi dengan �𝑦�,���− 𝑦�,���� tetapi tidak berkorelasi dengan 𝑣�,���, dan 𝑣�� tidak
berkorelasi serial. Di sini, penduga variabel instrumen bagi 𝛿 disajikan sebagai 𝛿��� = ∑ ∑ ��,���(������,���) � ��� � ��� ∑����∑������,���(��,������,���) ...(3.39) syarat perlu agar penduga ini konsisten adalah
𝑝𝑙𝑖𝑚 𝑁 → ∞
𝑇 → ∞�
�
�(���)� ∑����∑ �𝑣���� ��− 𝑣�,����𝑦�,��� = 0 ...(3.40)
Penduga (3.39) merupakan penduga alternatif dimana 𝑦�,���− 𝑦�,��� digunakan sebagai instrumen. Penduga variabel instrumen bagi 𝛿 disajikan sebagai
𝛿���(�)= ∑ ∑ (��,������,���)(������,���) � ��� � ��� ∑����∑����(��,������,���)(��,������,���) ...(3.41) syarat perlu agar penduga ini konsisten adalah
𝑝𝑙𝑖𝑚 𝑁 → ∞
𝑇 → ∞�
�
�(���)� ∑����∑ �𝑣���� ��− 𝑣�,����(𝑦�,���− 𝑦�,���) = 0 ...(3.42)
Penduga variabel instrumen yang kedua memerlukan tambahan lag variabel untuk membentuk instrumen, sehingga jumlah amatan efektif yang digunakan untuk melakukan pendugaan menjadi berkurang (satu periode sampel “hilang”). Dalam hal ini pendekatan metode momen dapat menyatukan penduga dan mengeliminasi kerugian dari pengurangan ukuran sampel. Langkah pertama dari pendekatan metode ini adalah mencatat bahwa
𝑝𝑙𝑖𝑚 𝑁 → ∞ 𝑇 → ∞� 1 𝑁(𝑇 − 1)� � ��𝑣�� − 𝑣�,����𝑦�,��� = 𝐸��𝑣��− 𝑣�,����𝑦�,���� = 0 � ��� � ��� ...(3.43) yang merupakan kondisi momen (moment condition). Dengan cara yang sama dapat diperoleh
𝑝𝑙𝑖𝑚 𝑁 → ∞ 𝑇 → ∞� � �(���)� ∑����∑ (𝑣���� ��− 𝑣�,���)(𝑦�,���− 𝑦�,���) = 𝐸[(𝑣��− 𝑣�,���)(𝑦�,���− 𝑦�,���)] = 0 ...……….…….(3.44)
yang juga merupakan kondisi momen. Kedua estimator (IV dan IV(2)) selanjutnya dikenakan kondisi momen dalam pendugaan. Sebagaimana diketahui penggunaan lebih banyak kondisi momen meningkatkan efisiensi dari penduga. Arellano dan Bond (1991) dalam Verbeek (2000) menyatakan bahwa daftar instrumen dapat dikembangkan dengan cara menambah kondisi momen dan membiarkan jumlahnya bervariasi berdasarkan t. Untuk itu, mereka mempertahankan T tetap. Sebagai contoh, ketika T = 4 diperoleh
𝐸[(𝑣��− 𝑣��)𝑦��] = 0, untuk t = 2
𝐸[(𝑣��− 𝑣��)𝑦��] = 0 𝑑𝑎𝑛 𝐸[(𝑣��− 𝑣��)𝑦��] = 0, untuk t = 3
𝐸[(𝑣��− 𝑣��)𝑦��] = 0, 𝐸[(𝑣��− 𝑣��)𝑦��] = 0 𝑑𝑎𝑛 𝐸[(𝑣��− 𝑣��)𝑦��],
untuk t = 4
Semua kondisi momen dapat diperluas ke dalam GMM. Selanjutnya, untuk memperkenalkan penduga GMM, misalkan didefinisikan ukuran sampel yang lebih umum sebanyak T, sehingga dapat dituliskan
∆𝑣� = �
𝑣��− 𝑣��
⋮ 𝑣�,� − 𝑣�,���
� ...(3.45) sebagai vektor tranformasi error, dan
𝑍�= ⎣ ⎢ ⎢ ⎡[𝑦0��] [𝑦 0 ⋯ 0 ��, 𝑦��] ⋯ 0 ⋮ 0 0⋮ ⋯⋱ �𝑦��, … , 𝑦⋮ �,����⎦ ⎥ ⎥ ⎤ ...(3.46)
sebagai matriks instrumen. Setiap baris pada matriks 𝑍� berisi instrumen yang
valid untuk setiap periode yang diberikan. Konsekuensinya, himpunan seluruh kondisi momen dapat dituliskan secara ringkas sebagai
𝐸�𝑍�′∆𝑣�� = 0 ...(3.47)
yang merupakan kondisi bagi 1+2+…+T-1. Untuk menurunkan penduga GMM, persamaan (3.47) dituliskan sebagai
Karena jumlah kondisi momen umumnya akan melebihi jumlah koefisien yang belum diketahui, 𝛿 akan diduga dengan meminimumkan kuadrat momen sampel yang bersesuaian, yakni
min [1/𝑁 ∑����𝑍�′(∆𝑦�− ∆𝑦�,��)]′𝑊�[1/𝑁 ∑����𝑍�′(∆𝑦�− ∆𝑦�,��)] ....(3.49)
dengan 𝑊� adalah adalah matriks penimbang definit positif yang simetris.
Dengan mendifrensiasikan persamaan (3.59) terhadap 𝛿 akan diperoleh penduga GMM sebagai
𝛿����((∑����∆𝑦�,��′ 𝑍�)𝑊�(∑����𝑍�′∆𝑦�,��))��𝑥 ((∑����∆𝑦�,��′ 𝑍�)𝑊�(∑����𝑍�′∆𝑦�))
...(3.50) Sifat dari penduga GMM (3.50) bergantung pada pemilihan 𝑊� yang konsisten
selama 𝑊� definit positif, sebagai contoh 𝑊� = 𝐼 yang merupakan matriks
identitas.
Matriks penimbang optimal (optimal weighting matrix) akan memberikan penduga yang paling efisien karena menghasilkan matriks kovarian asimtotik terkecil bagi 𝛿����. Sebagaimana diketahui dalam teori umum GMM (Verbeek, 2000), diketahui bahwa matriks penimbang optimal proposional terhadap matriks kovarian invers dari momen sampel. Dalam hal ini, matriks penimbang optimal seharusnya memenuhi
𝑝𝑙𝑖𝑚
𝑁 → ∞𝑊� = 𝑉[𝑍�′∆𝑣�]�� = 𝐸[𝑍�′∆𝑣�𝑣�′𝑍�]�� ...(3.51) Dalam kasus biasa, dimana tidak ada restriksi yang dikenakan terhadap matriks kovarian 𝑣�, matriks penimbang optimal dapat diestimasi menggunakan first-step
consistent estimator bagi 𝛿 dan mengganti operator ekspektasi dengan rata-rata
sampel yakni two step estimator
𝑊����� = [1/𝑁 ∑����𝑍�′∆𝑣��∆𝑣��′𝑍�]�� ...(3.52)
Dengan ∆𝑣�� menyatakan vektor residual yang diperoleh dari first-step consistent estimator.
Pendekatan GMM secara umum tidak menekankan bahwa 𝑣��~ 𝑖𝑖𝑑 pada seluruh individu dan waktu, dan matriks penimbang optimal kemudian diestimasi tanpa mengenakan restriksi. Sebagai catatan bahwa, ketidakberadaan autokorelasi dibutuhkan untuk menjamin validitas kondisi momen. Oleh karena pendugaan matriks penimbang optimal tidak terestriksi, maka dimungkinkan (dan sangat
dianjurkan bagi sampel berukuran kecil) menekankan ketidakberadaan autokorelasi pada 𝑣�� dan juga dikombinasikan dengan asumsi homoskedastis.
Dengan catatan di bawah restriksi
𝐸�∆𝑣�𝑣�′� = 𝜎��𝐺 = 𝜎��� 2 −1 0 … −1 2 ⋱ 0 0 ⋮ ⋱0 −1⋱ −12 � ...(3.53) matriks penimbang optimal dapat ditentukan sebagai (one step estimator)
𝑊����� = [1/𝑁 ∑����𝑍�′𝐺𝑍�]�� ...(3.54)
Sebagai catatan bahwa (3.54) tidak mengandung parameter yang tidak diketahui, sehingga penduga GMM yang optimal dapat dihitung dalam satu langkah bila
error 𝑣�� diasumsikan homoskedastis dan tidak mengandung autokorelasi.
Jika model data panel dinamis mengandung variabel eksogenus, maka persamaan (3.34) dapat dituliskan kembali menjadi
𝑦�� = 𝑥��′ 𝛽 + 𝛿𝑦�,���+ 𝜇�+ 𝑣�� ...(3.55)
Parameter persamaan (3.55) juga dapat diestimasi menggunakan generalisasi variabel instrumen atau pendekatan GMM. Bergantung pada asumsi yang dibuat terhadap 𝑥��, sekumpulan instrumen tambahan yang berbeda dapat dibangun. Bila
𝑥�� strictly exogenous dalam arti 𝑥�� tidak berkorelasi dengan sembarang error 𝑣��,
akan diperoleh
𝐸[𝑥��, ∆𝑣��] = 0; untuk setiap s dan t ...(3.56)
sehingga 𝑥�, … , 𝑥�� dapat ditambah ke dalam daftar instrumen untuk persamaan
first difference setiap periode. Hal ini akan membuat jumlah baris pada 𝑍� menjadi
besar. Selanjutnya, dengan mengenakan kondisi momen
𝐸[∆𝑥��, ∆𝑣��] = 0; untuk setiap t ...(3.57)
Matriks instrumen dapat dituliskan sebagai
𝑍�= ⎣ ⎢ ⎢ ⎢ ⎡�𝑦��, ∆𝑥��′ � 0 ⋯ 0 0 �𝑦��, 𝑦��, ∆𝑥��′ � ⋯ 0 ⋮ 0 0⋮ ⋯⋱ �𝑦��, … , 𝑦 ⋮�,���, ∆𝑥���⎦⎥ ⎥ ⎥ ⎤ ...(3.58)
Bila variabel 𝑥�� tidak strictly exogenous melainkan predetermined, dalam kasus
di mana 𝑥�� dan lag 𝑥�� tidak berkorelasi dengan bentuk error saat ini, akan
instrumen yang valid bagi persamaan first difference pada periode t, kondisi momen dapat dikenakan sebagai
𝐸�𝑥�,���∆𝑣��� = 0; 𝑗 = 1, … , 𝑡 − 1, ∀𝑡 ...(3.59)
Dalam prakteknya, kombinasi variabel x yang strictly exogenous dan
predetermined dapat terjadi lebih dari sekali. Matriks 𝑍� kemudian dapat
disesuaikan.
3.3. Spesifikasi Model 3.3.1. Konvergensi Wilayah
Kajian ini dilakukan dengan mengasumsikan fungsi Cobb-Douglas constant
return to scale dengan output (Y) dan tiga input, yaitu kapital (K), tenaga kerja (L)
dan Labor augmenting technological progress (A):
𝑌(𝑡) = 𝐾(𝑡)�(𝐴(𝑡)𝐿(𝑡))���, 0 < α < 1 ...(3.60)
Angkatan kerja dan pertumbuhan teknologi pada tingkat konstan dan eksogen: 𝐿(𝑡) = 𝐿(0)𝑒�� ...(3.61)
𝐴(𝑡) = 𝐴(0)𝑒�� ...(3.62)
Dimana n adalah tingkat pertumbuhan tenaga kerja dan g adalah tingkat pertumbuhan kemajuan teknologi. L(0) adalah kondisi semula dari tenaga kerja dan A(0) adalah kondisi semula dari teknologi. Jika:
𝑦� =� �(�)�(�)�(�) adalah output per efektif dari unit tenaga kerja
𝐾� =� �(�)�(�)�(�) adalah kapital per efektif dari unit tenaga kerja
Maka: 𝑦�(𝑡) = 𝑓 �𝑘�(𝑡)� = 𝑘�(𝑡)� ...(3.63) Sehingga evolusi dari kapital dinotasikan dengan:
𝑘�(𝑡)𝑠𝑘��(𝑡) − 𝑘�(𝑡)(𝑛 + 𝑔 + 𝛿) ...(3.64)
Dimana s adalah saving rate dan δ adalah tingkat depresiasi kapital.
The steady state capital stock (𝐾�∗) dapat ditentukan dengan membuat
persamaan (3.64) sama dengan nol, sehingga: 𝐾�∗(𝑡) = ( �
�����)
�
Dengan mensubstitusikan persamaan (3.65) ke dalam fungsi produksi, maka the
steady state output per effective unit tenaga kerja dapat diturunkan. Dalam bentuk
logaritma natural dapat dituliskan sebagai berikut: ln 𝑦�∗ = � �
���� [ln 𝑠 − ln (𝑛 + 𝑔 + 𝛿)] ...(3.66)
Tingkat konvergensi (λ) adalah tingkat dimana output per efektif unit tenaga kerja mendekati nilai steady state-nya, dan dinyatakan dengan:
� �� ��(�)
�� = 𝜆[ln( 𝑦�∗) − ln 𝑦�(𝑡)] ...(3.67)
ln 𝑦�(𝑡�) = (1 − 𝜍) ln 𝑦�∗− (1 − 𝜍)𝑙𝑛 𝑦�(𝑡�)] ...(3.68)
Dimana λ = (1 − α)(n + t + δ), 𝜍 = 𝑒��𝑑𝑎𝑛 𝜏 = (𝑡�− 𝑡�).
Persamaan (3.46) mewakili proses partial adjustment dimana nilai target optimal variabel dependen ditentukan oleh variabel independen periode saat ini. Jika output dihitung dalam per efektif unit, persamaan tersebut dapat ditulis:
ln 𝑦�(𝑡) = ln(�(�)�(�)�(�) ) = ln(�(�)��(�)���(�)) atau
ln y(t) = ln[�(�)�(�)] − 𝑙𝑛𝐴(0) − 𝑔𝑡 ...(3.69) Jika ln y(t) disubstitusikan ke dalam persamaan (3.68) dan kedua ruas dikurangkan dengan 𝑙𝑛𝑦�(𝑡�) maka diperoleh:
ln y(t�) − ln y(t�) = −(1 − 𝜍) ln 𝑦(𝑡�) + (1 − 𝜍) ln 𝐴(0) + 𝑔(𝑡�− 𝜍𝑡�) +
(1 − 𝜍)1 − 𝛼 ln(𝑠) −𝛼 (1 − 𝜍) ln1 − 𝛼 (𝑛 + 𝑔 + 𝛿)𝛼 ...(3.70) Dimana 𝑦(𝑡) =�(�)
�(�) sama dengan output perkapita dan z sebagai log output
perkapita pada steady state.
Misalkan β = – (1 – ς) sebagai parameter pendapatan pada t1, maka
kecepatan konvergensi dapat ditulis: 𝜆 =�� (���)
� ...(3.71)
Persamaan (3.70) dapat ditulis sebagai model autoregressive dari model pertumbuhan menjadi:
ln y(t�) = 𝜍 ln 𝑦(𝑡�) + (1 − 𝜍) ln 𝐴(0) + 𝑔(𝑡�− 𝜍𝑡�) + (1 − 𝜍)1 − 𝛼 ln(𝑠)𝛼
− (1 − 𝜍) ln���� (𝑛 + 𝑔 + 𝛿) ...(3.72) Atau dalam literatur data panel ditulis:
ln 𝑦�� = 𝛾 ln 𝑦�,���+ 𝛽�ln 𝑠�,���+ 𝛽�ln(𝑛 + 𝑔 + 𝛿)�,�+ 𝜂�+ 𝜐�,� ...(3.73) Dimana 𝑥�� = (ln(𝑠��), ln(𝑛�� + 𝑔 + 𝛿), 𝜃 = ((1 − 𝜍) � ���, −(1 − 𝜍) � ���) dan 𝛾 = 1 + 𝛽 = 𝜍.
Persamaan akhir untuk (3.73) merupakan model yang digunakan dalam literatur tentang konvergensi pendapatan yang dilakukan oleh Firdaus (2006), ditulis sebagai berikut:
∆z��= (1 − 𝛼) ∆ 𝑧�,���+ 𝛽′ ∆ 𝑥��+ 𝐷�+ ∆𝑢 ...(3.74)
Dengan i = 1, 2,…, N dan t = 1, 2,…,T.
Penelitian ini membandingkan dua model yang masing-masing variabel independennya sama, sedangkan variabel dependennya berbeda untuk melihat konvergensi dari pendekatan pendapatan wilayah dan pengeluaran rumah tangga. Model penelitian tersebut adalah:
ln 𝑦�� = (1 − 𝛼) ln 𝑦�,���+ 𝛽�ln 𝑖𝑛𝑣�� + 𝛽�ln 𝑙𝑎𝑏𝑜𝑢𝑟��+ 𝜐�� ...(3.75)
Dimana yit dalam masing-masing model adalah variabel dependen yaitu:
(i) PDRB per kapita atas dasar harga konstan 2000 untuk melihat pendapatan wilayah setelah meniadakan unsur inflasi.
(ii) Pengeluaran rumah tangga per kapita yang telah dideflasi menggunakan harga tahun 2000, yang merupakan proksi untuk melihat pendapatan rumah tangga.
Proses konvergensi terjadi apabila koefisien dari (1 – α) kurang dari satu, dengan tingkat konvergensi dinyatakan sebagai – ln (α).
Adanya lag variabel dependen (𝑦�,���) pada ruas kanan menunjukkan bahwa model yang digunakan adalah model dinamis. Tambahan variabel instrumen yang dipilih selain yang dilakukan program Stata v.10 juga menggunakan data kabupaten/kota, yaitu pajak, investasi, pendidikan tenaga kerja dan share sektor pertanian. Variabel independen yang diteliti adalah investasi dan tenaga kerja. Variabel investasi merupakan gabungan investasi yang dilakukan pemerintah kabupaten/kota untuk pembangunan dan investasi rumah tangga untuk perumahan yang diagregatkan untuk wilayah kabupaten/kota. Oleh karena itu penelitian ini dilakukan dengan cross section sebanyak 105 kabupaten/kota di Pulau Jawa, dengan menggabungkan daerah-daerah yang dimekarkan setelah tahun 2001 agar dapat dilakukan analisis balance panel. Kabupaten/kota di DKI Jakarta tidak
dapat dimasukkan dalam analisis karena bukan merupakan daerah otonomi. Keuangan daerah bahkan sampai pada tingkat kabupaten/kota di DKI Jakarta ditentukan oleh pemerintah pusat.
3.3.2. Faktor-faktor yang Memengaruhi Ketimpangan Wilayah
Permasalahan ketiga penelitian ini dijawab menggunakan dua model dengan variabel independen yang sama namun variabel dependennya berbeda, dilihat dari dua pendekatan yaitu pendekatan pendapatan regional dan pengeluaran rumah tangga. Model penelitian dinyatakan dengan:
ln 𝑦�� = 𝛾 + 𝜃�ln 𝑔𝑜𝑣𝑒𝑥𝑝��+ 𝜃�ln 𝑎𝑔𝑟𝑖�� + 𝜃�ln 𝑚𝑎𝑛𝑢�� + 𝜃�ln 𝑒𝑑𝑢��+
𝜃�ln 𝑝𝑢𝑠𝑘𝑒𝑠�� + 𝜃�ln 𝑒𝑙𝑒𝑐𝑡𝑟𝑖𝑐��+ 𝜃�ln 𝑤𝑎𝑡𝑒𝑟��+ 𝜃�ln 𝑟𝑜𝑎𝑑�� + 𝑣�� (3.76)
Dimana:
y : koefisien variasi Williamson, yang dihitung dengan menggunakan dua pendekatan:
(i) cvpdrb : PDRB per kapita atas dasar harga konstan 2000 (ii) cvcons : pengeluaran rumah tangga yang telah dideflasi
menggunakan harga tahun 2000
govexp : pengeluaran rutin pemerintah
agri : share pertanian terhadap PDRB atas dasar harga konstan 2000
manu : share manufaktur terhadap PDRB atas dasar harga konstan 2000
edu : share jumlah tenaga kerja yang berpendidikan SMA ke atas terhadap jumlah tenaga kerja
puskes : jumlah puskesmas
electric : jumlah energi listrik yang terjual kepada konsumen
water : volume air bersih PDAM yang disalurkan kepada konsumen
road : panjang jalan yang kondisinya baik dan sedang, baik jalan
negara, jalan provinsi, maupun jalan kabupaten/kota yang berada di masing-masing provinsi
i : provinsi di Pulau Jawa (kecuali DKI Jakarta)
3.4. Prosedur Analisis
Parameter model pada persamaan (3.76) akan diestimasi dengan menggunakan data panel statis. Pemilihan model yang terbaik dilakukan dengan uji Hausman. Ide dasar uji Hausman adalah pengomparasi dua penduga, yaitu penduga FEM dan REM. Hipotesis nol menyatakan bahwa Xit dan αi tidak berkorelasi dan hipotesis alternatif menyatakan yang sebaliknya (berkorelasi). Uji Hausman mengasumsikan bahwa 𝐸(𝑢��𝑋��) = 0 untuk setiap s dan t sedemikian sehingga penduga REM (𝛽���) akan konsisten dan efisien jika Xit dan αi tidak berkorelasi dan penduga penduga FEM (𝛽���) konsisten bagi β jika kondisi penduga REM (𝛽���) yang konsisten tidak berlaku.
Pendugaan uji Hausman dilakukan dengan pembedaan (difference) antara penduga FEM dan penduga REM yang dinyatakan sebagai vektor difference (𝛽��� − 𝛽���). Suatu kovarian bagi vektor difference tersebut diperlukan untuk mengevaluasi signifikansinya. Secara umum, hal ini memerlukan suatu estimasi kovarian antara 𝛽��� dan 𝛽���. Karena penduga bersifat efisien jika kondisinya seperti pada hipotesis nol, dapat ditunjukkan bahwa matriks kovarian bagi vektor
difference (𝛽��� − 𝛽���) adalah:
𝑉(𝛽��� − 𝛽���) = 𝑉�𝛽���� − 𝑉(𝛽���) ...(3.77) Nilai statistik uji Hausman menggunakan statistik Wald sebagai berikut:
𝜉 = (𝛽��� − 𝛽���)′�𝑉��𝛽���� − 𝑉��𝛽�������(𝛽���− 𝛽���) ...(3.78) dengan 𝑉� menyatakan penduga bagi matriks kovarian. Pada kondisi hipotesis nol, statistik 𝜉 mengikuti sebaran Chi-square (χ2) dengan derajat bebas k, dimana k merupakan jumlah parameter dalam β.
Analisis model pada persamaan (3.75) dilakukan dengan menggunakan data panel dinamis pendekatan First Difference Generalized Method of Moment (FD-GMM). Kriteria pemeriksaan model yang dilakukan adalah validitas dan konsistensi model. Uji Sargan untuk overidentifying restriction merupakan suatu pendekatan untuk mendeteksi masalah validitas instrumen. Hipotesis nol menyatakan bahwa tidak ada masalah dengan validitas instrumen (instrumen valid), artinya variabel instrumen yang digunakan tidak berkorelasi dengan error pada persamaan FD-GMM. Nilai statistik uji Sargan dihitung sebagai berikut:
𝑆 = 𝑁 ��
�∑����𝑍�′∆𝑣���� �
𝑊�����∑����𝑍�′∆𝑣���� ...(3.79)
Pada kondisi hipotesis nol, nilai statistik tersebut mengikuti sebaran Chi-square 𝜒��, dengan q menyatakan jumlah instrumen dikurangi jumlah parameter yang
digunakan dalam model.
Uji autokorelasi untuk melihat konsistensi hasil estimasi yang dihasilkan FD-GMM dilakukan dengan statistik Arellano-Bond (AB) m1 dan m2. Model yang
konsisten ditunjukkan dengan p-value m1 yang signifikan dan p-value m2 yang