• Tidak ada hasil yang ditemukan

Jenis dan Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder dari Badan Pusat Statistik (BPS) dan instansi terkait lainnya, dengan time series tahun 2007-2011 dan cross section kabupaten/kota wilayah perbatasan darat Indonesia. Data yang digunakan meliputi pendapatan per kapita, gini rasio, infrastruktur ekonomi antara lain jalan, listrik, telekomunikasi, dan transportasi udara, infrastruktur sosial yaitu pendidikan dan kesehatan. Selain itu digunakan juga data sekunder lainnya yang berkaitan.

Pengolahan data dalam penelitian ini menggunakan software Microsoft Excel 2010, ArcView 3.3, dan Eviews 6.0. Software Microsoft Excel digunakan sebagai sarana untuk input data dan analisis deskriptif, ArcView 3.3 digunakan untuk membuat analisis deskriptif dalam bentuk peta, Eviews 6.0 untuk analisis empirisnya. Kawasan perbatasan Kawasan lainnya Perbatasan darat Perbatasan laut Sisi hankam Sisi sosial ekonomi

Percepatan dan pembangunan ekonomi Indonesia Visi pembangunan nasional 2025

Visi pengelolaan kawasan perbatasan Pembangunan Ketimpangan Implikasi kebijakan Peningkatan pendapatan Penyediaan infrastruktur Infrastruktur ekonomi Infrastruktur sosial Infrastruktur administrasi

19

Metode Analisis Data Analisis Deskriptif

Analisis deskriptif digunakan untuk menggambarkan keadaan secara umum dan perkembangan pembangunan ekonomi di wilayah perbatasan darat. Dalam analisis ini akan dibahas bagaimana kondisi infrastruktur, ketimpangan, dan perekonomian setiap wilayah.

Analisis Regresi Data Panel Statis

Ketersediaan data seringkali menjadi kendala dalam suatu penelitian. Data dengan series yang pendek menjadi permasalahan dalam pengolahan data time series karena akan mempengaruhi validitas analisis. Permasalahan lain juga terjadi apabila penelitian memiliki jumlah unit cross section yang terbatas sehingga menyulitkan analisis perilaku dari model yang diteliti.

Teori ekonometrika memberikan solusi untuk permasalahan tersebut, salah satunya dengan menggunakan data panel (pooled data). Menurut Gujarati (2004) data panel (pooled data) atau yang disebut juga data longitudinal merupakan gabungan antara data cross section dan data time series. Data cross section adalah data yang dikumpulkan dalam satu waktu terhadap banyak individu. Data time series adalah data satu obyek yang meliputi beberapa periode waktu. Metode data panel merupakan suatu metode yang digunakan untuk melakukan analisis empirik yang tidak mungkin dilakukan jika hanya menggunakan data time series atau

cross section.

Penggunaan data panel telah memberikan banyak keuntungan secara statistik maupun menurut teori ekonomi diantaranya sebagai berikut:

1. Mampu mengontrol heterogenitas individu. Dengan metode ini estimasi yang dilakukan dapat secara eksplisit memasukkan unsur heterogenitas individu. 2. Dengan mengkombinasikan data time series dan cross section, data panel

dapat memberikan data yang informatif, mengurangi kolinearitas antar peubah, meningkatkan derajat bebas, dan lebih efisien.

3. Lebih baik untuk studi dynamics of adjustment. Data panel lebih baik dalam mempelajari perubahan dinamis karena berkaitan dengan observasi cross section yang berulang.

4. Lebih baik dalam mengidentifikasi dan mengukur efek yang secara sederhana tidak dapat diatasi dalam data cross section saja atau data time series saja. 5. Lebih sesuai untuk mempelajari dan menguji model prilaku (behavioral

models) yang kompleks dibandingkan dengan model data cross section atau

time series.

Selain manfaat yang diperoleh dengan penggunaan panel data metode ini juga memiliki keterbatasan di antaranya adalah:

1. Masalah dalam desain survei panel, pengumpulan, dan manajemen data. Masalah yang umum dihadapi diantaranya: cakupan (coverage), nonresponse, kemampuan daya ingat responden (recall), frekuensi, dan waktu wawancara. 2. Distorsi kesalahan pengamatan (measurement errors). Measurement errors

umumnya terjadi karena respon yang tidak sesuai.

20

a. Self-selectivity, permasalahan ini muncul karena data-data yang

dikumpulkan untuk suatu penelitian tidak sepenuhnya dapat menangkap fenomena yang ada.

b. Nonresponse, permasalahan ini muncul dalam data panel ketika ada ketidaklengkapan jawaban yang diberikan oleh responden (rumah tangga). c. Attrition, yaitu jumlah responden yang cenderung berkurang pada survei

lanjutan yang biasanya terjadi karena responden pindah, meninggal dunia atau biaya menemukan responden yang terlalu tinggi.

4. Dimensi waktu (time series) yang pendek. Jenis panel mikro biasanya mencakup data tahunan yang relatif pendek untuk setiap individu.

5. Cross-section dependence. Sebagai contoh, apabila macro panel dengan unit analisis negara atau wilayah dengan deret waktu yang panjang mengabaikan

cross-country dependence akan mengakibatkan inferensi yang salah

(misleading inference) (Baltagi 2007).

Analisis data panel secara garis besar dibedakan menjadi dua macam yaitu statis dan dinamis. Pada analisis data panel dinamis, regressor-nya mengandung variabel lag dependent-nya, sedangkan pada analisis data panel statis tidak.

Dalam analisis data panel, jika T adalah jumlah observasi dan N adalah jumlah unit cross section, maka panel data terjadi jika T >1 dan N> 1. Jika observasi untuk setiap unit cross section sama banyaknya disebut balance panels sedangkan jika tidak sama banyak disebut unbalance panels. Proses mengkombinasi data cross section dan time series untuk membentuk panel disebut

pooling. Bentuk model umum regresi data panel dapat dinotasikan sebagai berikut:

'( = < + >( ? + @( ... (3.1)

dimana :

i : 1, 2, ... , N, menunjukkan individu, perusahaan, dan lainnya (dimensi

cross section)

t : 1, 2, ... , T, menunjukkan dimensi deret waktu (time series)

< : koefisien intersep yang merupakan skalar

? : koefisien slope dengan dimensi K x 1, dimana K adalah banyaknya peubah bebas atau variabel penjelas

Yit : peubah tak bebas (dependent variabel) untuk unit individu i dan unit waktu ke-t

>( : peubah bebas (independent variabel) untuk unit individu i dan unit waktu ke- t

@( : komponen error, yang dibedakan menjadi

- untuk one way error component models @( = A( + 0(

- untuk two way error component models @( = A( + B + 0( A( adalah efek dari individu dan B adalah efek dari waktu.

Dalam melakukan estimasi untuk persamaan (3.1), tergantung pada asumsi yang dibuat mengenai intersep, slope, dan sisaan 0( . Terdapat beberapa kemungkinan untuk hal tersebut, yaitu:

1. Intersep dan slope adalah konstan menurut waktu dan individu, sedangkan sisaan berbeda antar waktu dan individu.

2. Slope adalah tetap, tetapi intersep berbeda antar individu.

3. Slope adalah tetap, tetapi intersep berbeda antar individu dan antar waku. 4. Semua koefisien (slope dan intersep) berbeda antar individu.

21 5. Semua koefisien (slope dan intersep) berbeda antar individu dan antar waktu. Berdasarkan variasi-variasi asumsi yang dibentuk, terdapat dua pendekatan dalam tehnik estimasi model regresi data panel statis yaitu:

1. Pendekatan Efek Tetap (Fixed Effect Model / FEM) 2. Pendekatan Efek Acak (Random Effect Model / REM)

Kedua pendekatan tersebut dibedakan berdasarkan pada asumsi ada atau tidaknya korelasi antara komponen error dengan peubah bebas. Jadi yang membedakan antara FEM dan REM terletak pada ada tidaknya korelasi antara A( dan B dengan >( .

a. Pendekatan Efek Tetap (Fixed Effect Model / FEM)

Pendekatan FEM ini muncul ketika antara efek individu dan peubah penjelas memiliki korelasi >( atau memiliki pola yang sifatnya tidak acak. Asumsi ini membuat komponen error dari efek individu dan waktu dapat menjadi bagian dari intersep, yaitu:

- Untuk one way komponen error : C( = <( + A(+ >( ? + 0( - Untuk two way komponen error : C( = <( + A(+ B + >( ? + 0( Penduga pada FEM dapat dihitung dengan beberapa tehnik yaitu :

i. Pooled Least Square (PLS)

Tehnik ini menggunakan gabungan dari seluruh data, model yang digunakan adalah : C( = <( + >( ? + 0( , dimana <( adalah konstan untuk semua observasi. Dengan menggunakan metode ini heterogenitas individu akan terjaga, tetapi estimasinya akan biased.

ii Within Group (WG)

Tehnik ini digunakan dengan menggunakan data deviasi dari rata-rata individu. Tehnik ini menghasilkan parameter ? yang unbiased tetapi akan menghilangkan intersep.

iii Least Square Dummy Variable (LSDV)

Tehnik ini digunakan dengan menambahkan dummy variable sebanyak n- 1, tetapi akan mengurangi derajat bebas dan membuat ketidakefisienan.

iv Two Way Error Component FEM

Tehnik ini memasukkan variasi antar waktu sehingga model dasarnya menjadi C( = <(+ D + >( ? + 0( .

b. Pendekatan Efek Acak ( Random Effect Model / REM)

REM muncul ketika antara efek individu dan regresor tidak ada korelasi. Asumsi ini membuat komponen error dari efek individu dan waktu dimasukkan ke dalam error, sehingga:

- Untuk one way komponen error : C( = <( + >( ? + 0( + A( - Untuk two way komponen error : C( = <( + >( ? + 0( + A( + B

Beberapa asumsi yang biasa digunakan dalam REM adalah : E (0( | E( ) = 0

E (0(F| E( ) = GF

E (E( | H( ) = 0 ; untuk semua i dan t

E (E(F| H( ) = GIFOne way error component: i = i E (0( EJ) = 0 untuk semua i,t, dan j

E (0( 0J& ) = 0 untuk i j atau t s

22

Dimana : One way error component:E(= A(

Two way error component:E(= A(+B

Terdapat 2 (dua) jenis pendekatan yang digunakan untuk menghitung estimator REM, yaitu:

i Between Estimator

Tehnik ini mengasumsikan bahwa peubah bebas dengan error tidak saling berkorelasi.

ii Generalized Least Square (GLS)

Tehnik ini mengombinasikan informasi antar dan dalam data secara efisien. GLS dipandang sebagai rata-rata yang dibobotkan dari estimasi

between dan within, dengan persamaan: ? K = L? + /M# − L2?O

Pemilihan Model Data Panel Statis

Pemilihan antara model efek tetap dengan efek acak dapat dilakukan dengan pengujian terhadap asumsi ada tidaknya korelasi antara regressor dan efek individu. Pengujian tersebut adalah Uji Chow untuk memilih antara PLS dan FEM, Uji Hausman untuk memilih antara FEM dan REM serta Uji Lagrange Multiplier untuk memilih antara REM dan PLS.

a. Uji Chow

Beberapa buku menyebut uji Chow dengan pengujian F statistik. Dalam pengujian ini dilakukan hipotesis sebagai berikut:

H0 : Model Pooled Least Square (PLS)

H1 : Fixed Effect Model (FEM)

F Statistik seperti yang dirumuskan:

P1QR =/ SS T SS2//V ,2T SS//VI V W2 ... (3.2) dimana:

RRSS = Restricted Residual Sum Square yaitu jumlah error kuadrat yang diperoleh dari estimasi data panel dengan metode Pooled Least Square.

URSS = Unrestricted Residual Sum Square yaitu jumlah error kuadrat yang diperoleh dari estimasi data panel dengan metode fixed effect.

N = Jumlah data cross section

T = Jumlah data time series K = Jumlah variabel penjelas

Pengujian ini mengikuti distribusi F dengan derajat bebas N-1 dan NT-N-K. Jika nilai Chow Statistics (F stat) hasil pengujian lebih besar dari F tabel, maka cukup bukti bagi kita untuk melakukan penolakan terhadap hipotesis nol sehingga model yang digunakan adalah model fixed effect, begitu juga sebaliknya.

b. Uji Hausman

Dalam uji ini dirumuskan hipotesis sebagai berikut: H0: E( i xit) = 0 atau REM adalah model yang tepat

H1: E( i xit) 0 atau FEM adalah model yang tepat

Sebagai dasar penolakan H0 maka digunakan statistik Hausman dan

membandingkannya dengan chi square. Statistik Hausman dirumuskan dengan:

23 dimana:

M= matriks kovarians untuk parameter

k = degrees of freedom

Jika nilai H hasil pengujian lebih besar dari 2 tabel, maka cukup bukti untuk melakukan penolakan terhadap H0 sehingga model yang digunakan adalah

model fixed effects, begitu juga sebaliknya.

c. Uji Lagrange Multiplier (LM)

Pengujian ini didasarkan pada nilai residual dari model PLS. Hipotesis nol (H0)

yang digunakan adalah intersep bukan merupakan peubah acak atau stokastik, dengan kata lain varian dari residual bernilai nol.

Nilai statistik LM dihitung berdasarkan formula :

+Y =F/I ,2!I Z[ \[b]_ ^_ ]`a [b [^_ ]a ]_ c F ... (3.4) dimana :

n : jumlah individu atau cross section

T : jumlah periode waktu atau time series

( : residual model PLS

Uji LM ini mengikuti distribusi 2 dengan derajat bebas sebesar 1. Jika nilai statistik LM lebih besar dari nilai kritis statistik 2, maka hipotesis nol akan ditolak, yang berarti estimasi yang tepat untuk regresi data panel adalah metode REM.

Estimasi 2SLS

Permasalahan endogenitas dari regressor yang berada pada sisi kanan merupakan masalah yang serius dalam ekonometrik. Endogenitas bisa diartikan sebagai hubungan antara regressor yang ada di sisi kanan persamaan dengan sisaan. Hal tersebut kemungkinan disebabkan oleh adanya omitted variable, kesalahan pengukuran, dan masalah selektifitas. Endogenitas menyebabkan estimasi dengan OLS menjadi tidak konsisten, sehingga diperlukan metode

instrument variable (IV) seperti two-stage least square (2SLS) untuk

menghasilkan dugaan yang konsisten (Baltagi 2007).

Instrumen variabel dalam persamaan sederhana '( = ?d+ ?,>( + 0( merupakan informasi tambahan, berupa variabel baru, yang tidak mempunyai korelasi dengan 0( namun berkorelasi dengan >( . Dalam konteks omitted variable, informasi tambahan tersebut harus tidak mempunyai hubungan dengan faktor lain yang mempengaruhi '( . Setelah estimasi dengan IV selesai dilakukan biasanya dihitung nilai R-squared dengan menggunakan formula standar yaitu:

F = 1 −ff

ffg

dimana:

SSR : sum squared IV residual

SST : sum squared total.

Tidak seperti dalam OLS, R-squared dari estimasi menggunakan IV dapat bernilai negatif, karena secara aktual SSR lebih besar daripada SST, sehingga dalam estimasi IV nilai R-squared tidak mempunyai interpretasi sebagaimana aslinya (Wooldridge 2004).

24

Estimasi sistem persamaan yang menggunakan banyak variabel instrumen sering disebut sebagai estimasi 2SLS. Untuk menduga persamaan data panel dengan IV yang banyak, dilakukan melalui pendekatan metode 2SLS konvensional (Panel 2SLS) atau Fixed Effect Two Stage Least Square (Within 2SLS/W2SLS) maupun penduga Random Effect Two Stage GLS (EC2SLS/Error Component 2SLS) (Baltagi 2007).

Uji Asumsi

Uji asumsi dilakukan untuk memenuhi persyaratan sebuah model yang akan digunakan. Jika model yang terpilih berdasarkan Uji Hausman adalah REM maka estimasi dari model diasumsikan best linier unbiased estimator (BLUE) dan tidak perlu dilakukan pengujian terhadap tiga asumsi utama model BLUE. Hal tersebut dikarenakan dua alasan, yaitu sifat data panel adalah bebas dari gejala multikolinearitas dan REM adalah model generalized least square (GLS) sehingga estimasi dengan menggunakan GLS secara otomatis sudah mampu mengurangi gejala autokorelasi, bahkan terbebas dari gejala heteroskedastisitas yang disebabkan variansi sisaan tidak konstan (Gujarati 2004). Jika model yang terpilih adalah FEM maka perlu dilakukan pengujian asumsi klasik sebagai berikut:

a. Uji Multikolinearitas

Salah satu asumsi dari model regresi ganda adalah bahwa tidak ada hubungan linear sempurna antar peubah bebas dalam model tersebut, jika hubungan tersebut ada maka peubah bebasnya dikatakan multikolinearitas sempurna. Apabila hal tersebut terjadi maka dugaan parameter koefisien regresi masih mungkin dapat diperoleh, tapi interpretasinya menjadi sulit. Untuk mendeteksi adanya multikolinearitas dapat dilakukan dengan uji koefisien korelasi sederhana antar peubah bebas dalam model, jika korelasinya sangat tinggi dan nyata maka berarti terjadi multikolinearitas. Selain itu juga dapat dilihat dari statistik uji F dan nilai koefisien determinasi, apabila nilai Rj2

tinggi atau dari uji F modelnya signifikan tetapi hanya sedikit variabel independen yang signifikan berarti ada multikolinearitas.

b. Uji Heteroskedastisitas

Salah satu aumsi yang harus dipenuhi dalam persamaan regresi adalah taksiran parameter dalam model regresi bersifat BLUE, maka var (0() harus sama dengan 2 (konstan), atau semua error mempunyai varians yang sama. Kondisi ini disebut dengan homoskedastisitas. Sedangkan bila varian tidak konstan atau berubah-ubah disebut heteroskedastisitas. Untuk mendeteksi adanya heteroskedastisitas dapat menggunakan metode General Least Square (Cross Section Weights) yaitu dengan membandingkan Sum Square Residu

pada Weighted Statistics dengan Sum Square Residu Unweighted Statistics. Jika Sum Square Residu pada Weighted Statistics lebih besar dari Sum Square Residu Unweighted Statistics, maka terjadi heteroskedastisitas. Metode lain dengan uji Goldfeld-Quandt, uji Breusch-Pagan dan uji White.

c. Uji Autokorelasi

Autokorelasi adalah korelasi yang terjadi antar observasi dalam satu peubah atau korelasi antar error masa yang lalu dengan error masa sekarang. Uji autokorelasi yang dilakukan tergantung pada jenis data dan sifat model yang

25 digunakan. Tata cara untuk mendeteksi adanya korelasi serial adalah dengan melihat nilai Durbin Watson (DW). Cara untuk melihat ada/tidaknya autokorelasi dilakukan dengan membandingkan DW statistik dengan DW tabel. Adapun kerangka identifikasi terangkum dalam tabel 1. Korelasi serial ditemukan jika error dari periode waktu yang berbeda saling berkorelasi. Hal ini bisa dideteksi dengan melihat pola random error dari hasil regresi.

Tabel 3.1 Kerangka indentifikasi autokorelasi

Nilai DW Hasil 4 – dl < DW < 4 4 – du < DW < 4 – dl 2 < DW < 4 – du Du < DW < 2 dl < DW< du 0 < DW < dl

Terdapat korelasi serial regresi Hasil tidak dapat ditentukan Tidak ada korelasi serial Tidak ada korelasi serial Hasil tidak dapat ditentukan Terdapat korelasi serial regresi Sumber : Gujarati, 2004

Evaluasi Model a. Uji-F

Uji-F digunakan untuk melakukan uji hipotesis koefisien (slope) regresi secara bersamaan. Jika nilai probabilitas F-statistic < taraf nyata, maka tolak H0 dan itu artinya minimal ada satu peubah bebas yang berpengaruh nyata

terhadap peubah terikat, dan berlaku sebaliknya.

b. Uji-t

Setelah melakukan uji koefisien regresi secara keseluruhan, maka langkah selanjutnya adalah menghitung koefisien regresi secara individu dengan menggunakan uji-t. Hipotesis pada uji-t adalah:

H0 : i = 0

H1 : i 0

Jika t-hitung > t-tabel maka tolak H0 yang berarti peubah bebas secara

statistik nyata pada taraf nyata yang telah ditentukan dalam penelitian dan berlaku hal yang sebaliknya. Jika nilai probabilitas t-statistik < taraf nyata, maka tolak H0 dan berarti bahwa peubah bebas nyata secara statitik.

c. Koefisien Determinasi (R2)

Koefisien determinasi (Goodness of Fit) merupakan suatu ukuran yang penting dalam regresi, karena dapat menginformasikan baik atau tidaknya model regresi yang terestimasi. Nilai R2 mencerminkan seberapa besar variasi daripeubah terikat Ydapat diterangkan oleh peubah bebas X. Jika R2 = 0, maka variasi Y tidak dapat diterangkan oleh X sama sekali. Jika R2 = 1, artinya bahwa variasi dari Y secara keseluruhan dapat diterangkan oleh X.

d. Uji Normalitas

Uji normalitas dilakukan untuk memeriksa apakah error term

mendekati distribusi normal atau tidak. Jika asumsi tidak terpenuhi maka prosedur pengujian menggunakan statistik t menjadi tidak sah. Uji normalitas

26

nilai probabilitas Jarque Bera yang lebih besar dari taraf nyata 5 persen, maka dapat disimpulkan bahwa error term terdistribusi normal.

Spesifikasi Model

Model yang digunakan dalam penelitian ini merupakan pengembangan dari model neoklasik Solow dengan asumsi teknologi dianggap konstan. Kapital hanya memasukkan modal publik, yaitu infrastruktur berupa jalan, listrik, air bersih, sanitasi, gedung sekolah, sarana telekomunikasi, dan sarana kesehatan.

Proses estimasi yang digunakan untuk mengetahui pengaruh variabel independen terhadap variabel dependen dalam penelitian ini adalah penggabungan data antar waktu dengan data antar individu yang disebut dengan pooling. Sedangkan data yang dihasilkan disebut dengan pooled data atau panel data atau longitudinal data.

Model untuk mengetahui dampak infrastruktur terhadap pertumbuhan yang didekati dengan pendapatan per kapita mengacu pada penelitian Calderon dan Serven (2004) yang telah dimodifikasi menjadi:

+7). ( = <d+ <,+7h+i( + <F +7fYj( + <k+7)lf( + <m.M ( + <n+Mf(

+ <of.i( + <p)QY( + <q ( + <r+s( + <,d 6( + @(

Model ketimpangan mengacu pada penelitian Seneviratne dan Sun (2013) yang telah dimodifikasi menjadi:

8 7 ( = <d+ <,+7 ). ( + <F+sM( + @(

Dimana:

Ln : logaritma natural

KAP : pendapatan per kapita (juta rupiah) Gini : angka gini rasio

LFI : jumlah tenaga kerja di sektor industri (persen)

JLN : rasio panjang jalan baik dan sedang terhadap jumlah penduduk (km/jiwa) SMU : rasio jumlah SMU sederajat terhadap jumlah penduduk (unit/jiwa)

KES : rasio sarana kesehatan yang didekati dengan jumlah puskesmas, puskesmas pembantu, dan puskesmas keliling terhadap jumlah penduduk (unit/jiwa)

AIR : rumah tangga yang mengakses air bersih (persen) LIS : rumah tangga yang mengakses listrik (persen) SAN : rumah tangga yang mempunyai septik tank (persen) KOM : rumah tangga yang mempunyai telpon seluler (persen)

BDR : aksesibilitas yang diproksi dengan arus penumpang, baik datang maupun berangkat, yang menggunakan sarana penerbangan (persen terhadap jumlah penduduk)

LF : jumlah angkatan kerja

DBatas : dummy perbatasan, bernilai 1 jika berbatasan dengan negara lebih maju dan bernilai 0 untuk lainnya

@ : error term

i : kabupaten/kota kawasan perbatasan darat t : tahun

27

Dokumen terkait