• Tidak ada hasil yang ditemukan

Lampiran 1.1: Catatan Teknis mengenai Small Area Estimation (SAE) Annex 1.1: Technical Note on Small Area Estimation (SAE) 1. Pendahuluan

Catatan teknis ini menyediakan informasi mengenai latar belakang metode Small Area

Estimation (SAE). Metode ini digunakan untuk mengestimasi beberapa indikator yang digunakan

dalam pengembangan FSVA provinsi pada tingkat kecamatan.

SAE merupakan suatu metode matematika yang menggunakan modeling untuk mengestima-si karakteristik suatu data somengestima-sial ekonomi yang memiliki tingkat agregamengestima-si tinggi (provinmengestima-si atau kabupaten) ke tingkat agregasi yang lebih rendah (tingkat kecamatan atau desa) karena terbatasnya ketersediaan data primer pada tingkat agregasi rendah. Kebutuhan terhadap metode SAE telah meningkat secara signifikan selama kurun waktu 10 tahun terakhir dan metode ini telah digunakan dan di akui secara internasional. Di Indonesia, metode SAE telah digunakan Bank Dunia dan SMERU untuk menghitung Peta Kemiskinan/Poverty Map (2000) serta pengembangan Peta Gizi (Nutrition Map) oleh BPS dan WFP (2006).

Untuk FSVA provinsi, metode SAE menjadi hal yang sangat penting karena beberapa indikator hanya tersedia pada tingkat kabupaten untuk beberapa indikator seperti angka kemiskinan, angka harapan hidup dan perempuan buta huruf.

Metode SAE digunakan untuk mengagregasi data dari beberapa indikator di bawah ini: Persentase penduduk hidup di bawah garis kemiskinan;

Persentase rumah tangga tanpa akses listrik; Persentase rumah tangga tanpa akses ke air bersih; Perempuan Buta Huruf; dan

Angka harapan hidup pada saat lahir.

Metode SAE tidak digunakan untuk menghitung indikator dibawah ini karena indikator-indikator tersebut telah tersedia pada tingkat kecamatan:

Rasio konsumsi normatif per kapita terhadap ketersediaan bersih ‘padi + jagung + ubi kayu + ubi jalar’;

Persentase desa tanpa akses penghubung yang memadai;

Persentase desa dengan jarak lebih dari 5 km dari fasilitas kesehatan; Berat badan balita di bawah standar (Underweight);

Frekuensi bencana alam; Penyimpangan curah hujan; Persentase daerah puso; dan Deforestasi hutan.

2. Metodologi

Kajian ini menggunakan metode yang dikembangkan oleh Fay Herriot (1997) dan Elbers et.al (2002), karena metode ini menyediakan aplikasi interaktif yang efisien yang memungkinkan

1. Introduction

This technical note provides background information about Small Area Estimation (SAE), the method used to produce the estimates of some variables used in the Provincial FSVA at sub-district level. SAE is a mathematical technique to disaggregate data for certain socio-economic indicators at a higher/bigger level (provincial or district) to a lower level (sub-district or village level) when primary data collection at the lower level is impossible and/or quality is unreliable with high standard errors. The requirement for the SAE is significantly increasing during the last 10 years and its application nowadays is internationally accepted. In Indonesia, the SAE was applied by the Word Bank/SMERU Poverty Map (2000) and WFP/BPS Nutrition Map (2006).

For Provincial FSVA, SAE is an important technique since reliable information is available only at district level for the some variables needed such as poverty, life expectancy and female illiteracy.

SAE technique was applied to dissagregate the data for the following indicators: Percentage of people below poverty line;

Percentage of households without access to electricity;

Percentage households without access to improved drinking water; Percentage of female illiteracy; and

Life expectancy at birth.

SAE technique was NOT applied for the following indicators, as the data was available at sub-district level:

Ratio of per capita normative consumption to net ‘rice + maize + cassava + sweet potato’ availability;

Percentage of villages with inadequate connectivity;

Percentage of villages located more than 5 km away from health facilities; The prevalence of underweight children under-five years of age;

Frequency of natural disasters; Rainfall deviation;

Percentage of damaged area; and Deforestation.

2. Methodology

The study utilizes the methodology developed by Fay and Herriot (1979) and Elbers et.al (2002) because the method provides an efficient interactive application which enables to combine informa

untuk menggabungkan informasi dari berbagai sumber data yang relevan dan memiliki kelengkapan informasi seperti survei. Survei, walaupun tidak dapat mengestimasi data pada ting-katan rendah akan tetapi dapat menyediakan cakupan informasi yang luas contohnya mengenai pengeluaran atau pendapatan. Di sisi lain, sensus walaupun hanya memuat informasi yang terbatas akan tetapi dapat menyediakan data mengenai karakteristik dasar untuk setiap populasi individu sehingga dapat mengestimasi sampai pada tingkat administrasi yang paling rendah. Oleh karena itu, metode yang digunakan dalam kajian ini menggabungkan kelebihan dari data survei dan data sensus.

3. Dataset

Model SAE menggunakan 3 sumber data yaitu:

Survei Sosial Ekonomi (SUSENAS) KOR Juli 2007, Juli 2008 dan Juli 2009: untuk menyediakan data tentang karakteristik individu dan rumah tangga. Beberapa variabel atau karakteristik individu dan rumah tangga tersebut selanjutnya digunakan sebagai variabel penjelas (explanatory variables) atau variabel terikat (dependent variable) dalam model. Kombinasi kedua jenis variabel tersebut digunakan untuk mengembangkan model. Jumlah sampel SUSENAS KOR adalah sekitar 270.000 rumah tangga yang ditujukan untuk estimasi kabupaten/kota. Jumlah sampel masing-masing kabupaten/kota berbeda-beda.

SUSENAS Modul Konsumsi Juli 2008: untuk menyediakan data tentang rata-rata pengeluaran makanan dan rata-rata konsumsi kalori/protein per kapita yang digunakan sebagai variabel target (target variable). Jumlah sampel SUSENAS Modul adalah sekitar 270,000 rumah tangga untuk seluruh Indonesia. Jumlah sampel masing-masing kabupaten/ kota dan provinsi berbeda-beda. Estimasi ditujukan sampai tingkat kabupaten/kota dan provinsi.

Potensi Desa (PODES) 2008: untuk menyediakan data pada tingkat masyarakat (desa/ kelurahan) yang digunakan sebagai informasi mengenai lokasi (locational information). PODES mencakup seluruh desa di seluruh Indonesia. Khusus PODES 2008 ditujukan untuk persiapan Sensus Penduduk 2010.

4. Prosedur

Proses analisis SAE untuk FSVA provinsi melalui beberapa tahapan di bawah ini: 1. Pengembangan Beta model (lihat persamaan (2));

2. Penghitungan locational effects (3);

3. Pernghitungan keragaman estimator (variance of estimators) (4); 4. Penyiapan ech Tsisa residual untuk menghasilkan Alpha Model (6); dan 5. Pengembangan GLS estimate model.

tion from various relevant surveys and complete enumeration data such as census. The survey, even though it is unable to estimate the data at lower level, provides a wider range of information such as expenditure and income. The census, on the other hand, although it collects limited information, provides data on basic characteristics of individual population that enables estimation until the lowest level of administrative areas. Therefore, the method utilized in this study combines the strength of both survey and census data.

3. Dataset

The following three data sources are used for the SAE:

• Socioeconomic Survey (SUSENAS) CORE July 2007, July 2008 and July 2009 is to provide data on individual and household characteristics. Some variables were utilized as explanatory variables or dependent variables, for developing the models. The total sample of SUSENAS Core is about 270,000 households; estimation is possible to the district level. The sample also varies by district.

• SUSENAS Consumption Module July 2008 is to provide data on average food expenditure and average calorie/protein consumption per capita served as target variables. The total sample of the survey is about 270,000 households throughout the country; the sample varies by district and province. The estimation is possible to the district and province level.

• Village Potential (PODES) 2008 is to provide community (i.e., village) data, used to identify so-called locational effects. PODES covers all villages throughout the country. The PODES 2008 is applied for the preparation of Population Cencus (SP) 2010.

4. Procedures

The process for running the SAE for the Provincial FSVA is carried out in accordance with the following steps:

1. Developing Beta model (see equation (2)); 2. Calculating locational effects (3);

3. Calculating variance of estimators (4);

4. Preparing ech term residual to run Alpha model (6); and 5. Developing GLS estimate model.

(1) ln ych = E [ln ych / xch] + μch

dimana c : subscript untuk cluster c (desa)

h : subscript untuk rumah tangga-h pada cluster c ych : besaran indikator y pada rumah tangga-h dan cluster c xch : karakteristik rumah tangga pada rumah tangga-h dalam cluster c Aproksimasi linear dari model (1) kemudian ditulis seperti berikut:

(2) ln ych = xchâ + μch juga disebut sebagai Beta model dimana merupakan variabel residu (disturbance terms).

Data SUSENAS tidak menyediakan informasi mengenai lokasi (locational

information). Dengan kata lain, variabel residu seperti pada persamaan 2 diatas, memerlukan

informasi mengenai variabel lokasi. Persamaan dibawah ini digunakan untuk mengestimasi efek dari lokasi:

(3) μch = ηc + εch

Di sini ηc adalah komponen cluster kecamatan dan εch adalah komponen desa/kelurahan. Secara rata-rata, pada tingkat desa, variabel residu (disturbance terms) menggunakan persamaan sebagai berikut:

(4) μc. = ηc + εc. maka E[μc2] = ση2 + var (εc.) = ση2 + τc2

Diasumsikan ηc dan εch berdistribusi normal dan independen satu sama lain. Elbers et.al (2002) memberi suatu estimasi keragaman dari distribusi locational effect:

(5)

Ketika locational effect ηc tidak ada, persamaan (3) kemudian menjadi μch = + εch. Akan tetapi, ini biasanya asumsi yang tidak realistik. Sesuai dengan Elbers et.al (2002), sisa residual εch dapat dijelaskan dengan suatu model logistik yang meregresikan transformasi εch dengan karakteristik rumah tangga (h):

(6) juga disebut Alpha model.

Dimana A ekuivalen dengan 1.05*max{εch 2}. Estimator variansi untuk εch dapat dihitung dengan: (7)

(1) ln ych = E [ln ych / xch] + μch where c : cluster c (village) h : household h in cluster c

ych : value of indicator for household h and cluster c xch : socio-economic characteristic of household h in cluster c The linear approximation of model (1) can be expressed as follows: (2) ln ych = xchâ + μch (Beta model)

where μch isdisturbance terms.

SUSENAS data does not provide locational information. In other words, disturbance terms as shown in equation (2), includes locational variables needing to be identified. The following formula is used to estimate locational effects:

(3) μch = ηc + εch

Here ηc is cluster components and εch is household components. On the average at village level, distribution terms can be expressed as follows:

(4) μc. = ηc + εc. , and then

E[μc2] = ση2 + var (εc.) = ση2 + τc2

In the above equation ηc and εch are assumed to be normally distributed and independent of each other. Following Elbers et al (2002), the estimated variance of locational effects can be expressed as follows:

(5)

In the absence of locational effect, ηc, equation (3) becomes simpler, μch = + εch. However, this is normally an unrealistic assumption. Following Elbers et al (2002) residual εch can be explained by a logistic model that regresses transformed εch with household characteristics:

(6) (Alpha model)

Here A is set as A= 1.05*max{εch 2}.

Estimated variance of εch can be calculated using the following equation:

Dalam persamaan model (2) metode OLS digunakan untuk mengestimasi parameter model dengan asumsi klasik bahwa sisaan bersifat homocedasticity. Persamaan model (7) dapat mengindikasikan pengingkaran asumsi penggunaan OLS dalam model (2), sehingga diperlukan regresi GLS. Dalam GLS variance-covariance matrix merupakan suatu diagonal block matrix. Seluruh proses analisis dan simulasi untuk indikator FSVA ini menggunakan paket program yang pernah digunakan untuk poverty mapping yaitu Povmap.Exe/PovmapPacker.Exe.

In the model equation (2), OLS method is used to estimate the parameters of the model with the classical assumption that “residual” is a homocedasticity nature. The model equations (7) indicate the denial assuming the use of OLS in model (2), necessitating GLS regression. In GLS variance-covariance matrix is a diagonal block matrix.

All analysis and simulation process utilized a software package for poverty mapping (Povmap.Exe/ PovmapPacker.Exe).

Tabel 1: Daftar Variabel yang digunakan untuk mengagregasi data untuk setiap indikator

Nama Variabel dari kuesioner Sumber Data

1. Hubungan anggota keluarga dengan Kepala rumah tangga 2. Tingkat pendidikan Kepala rumah tangga

3. Lapangan pekerjaan Kepala rumah tangga 4. Sumber penerangan

5. Status penguasaan bangunan tempat tinggal 6. Jenis atap terluas (beton, genteng, seng, asbes) 7. Jenis dinding terluas (tembok, kayu, bambu) 8. Fasilitas tempat buang air besar

9. Jumlah Kepala Keluarga pengguna listrik 10. Ketinggian dari permukaan laut

11. Wilayah desa berada dalam/sekitar/luar hutan

12. Jumlah pasar dengan bangunan permanent/tidak permanen 13. Jumlah minimarket/restoran/toko,dll

14. Jumlah Rumah Tangga yang menggunakan telepon

A. Persentase rumah tangga tanpa akses listrik

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Podes 08 Podes 08 Podes 08 Podes 08 Podes 08 Podes 08

1. Sumber air minum (air bersih = air kemasan/ air isi ulang/leding meteran/leding eceran/ sumur bor,pompa/sumur terlindung) 2. Sumber penerangan

3. Status penguasaan bangunan tempat tinggal 4. Fasilitas tempat buang air besar

5. Jumlah Kepala Keluarga pengguna listrik 6. Ketinggian dari permukaan laut

7. Wilayah desa berada dlm/sekitar/luar hutan

1. Umur

2. Dapat membaca dan menulis

3. Hubungan anggota keluarga dengan Kepala rumah tangga

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Podes 08

Podes 08 Podes 08

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli

Table 1: List of variables used to dissaggregate data for each Indicators

Variable name and questioner Data Source

1. Head of household status in relation with other household members 2. Education level of the head of household

3. Occupation type of head of household 4. Lighting source

5. Home ownership status

6. Main Roof Material (concrete, pentile, zinc, asbestos) 7. Main Wall Material (brick, wood, bamboo)

8. Latrine facilities

9. Number of household using electricity 10. Elevation from sea level

11. Rural areas in/or around the outside forest

12. Number of marketplace consist of permanent or non permanent building within the village

13. Number of minimarket/restaurant/shops/etc. 14. Number of household using telephone

A. Percentage of households without access to electricity

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Podes 08 Podes 08 Podes 08 Podes 08 Podes 08 Podes 08 1. Source of drinking water (clean water = bottled water/water refill/ crane retail /borehole, pump/protected well)

2. Lighting source 3. Home ownership status 4. Latrine facilities

5. Number of household using electricity 6. Elevation from sea level

7. Rural areas in/or around the outside forest C. Female Illiteracy

1. Age

2. Able to read and write

3. Head of household status in relation with other household members

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Podes 08

Podes 08 Podes 08

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July

B. Persentase rumah tangga tanpa akses ke air bersih

C. Perempuan Buta Huruf

Tabel 1 (lanjutan): Daftar Variabel yang digunakan untuk mengagregasi data

untuk setiap indikator Table 1 (contd): IndicatorsList of variables used to dissaggregate data for each

Variable name and questioner Data Source

C. Female Illiteracy

D. Percentage of people below poverty line 4. Education level of the head of household 5. Main jobs field of the head of household 6. Lighting source

7. Home ownership status

8. Main Roof Material (concrete, pentile, zinc, asbestos) 9. Main Wall Material (brick, wood, bamboo)

10. Latrine facilities

11. Number of household using electricity 12. Elevation from sea level

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Podes 08

Podes 08

Nama Variabel dari kuesioner Sumber Data

C. Perempuan Buta Huruf

D. Persentase penduduk hidup di bawah garis kemiskinan

4. Tingkat pendidikan Kepala rumah tangga 5. Lapangan pekerjaan Kepala rumah tangga 6. Sumber penerangan

7. Status penguasaan bangunan tempat tinggal 8. Jenis atap terluas (beton, genteng, seng, asbes) 9. Jenis dinding terluas (tembok, kayu, bambu) 10. Fasilitas tempat buang air besar

11. Jumlah Kepala Keluarga pengguna listrik 12. Ketinggian dari permukaan laut

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Podes 08

Podes 08

1. Jenjang pendidikan yg pernah/sedang diduduki 2. Jenis kelamin

3. Hubungan anggota keluarga dengan Kepala rumah tangga 4. Jumlah anggota rumahtangga

5. Apakah melakukan kegiatan smg terakhir

6. Apakah punya pekerjaan/usaha, sementara tidak bekerja 7. Lapangan usaha utama

8. Status/kedudukan dalam pekerjaan utama 9. Rata-rata pengeluaran makanan/kapita/bulan 10. Rata-rata konsumsi kalori/kapita/bulan 11. Rata-rata konsumsi protein/kapita/bulan 12. Rata-rata pengeluaran non makanan/kpt/bln

13. Proporsi penduduk/Kepala Keluarga bekerja di pertanian 14. Jumlah keluarga penerima ASKESKIN 1 tahun yang lalu

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Modul 08 Juli Susenas Modul 08 Juli Susenas Modul 08 Juli Susenas Modul 08 Juli Podes 08

Podes 08

E. Angka harapan hidup pada saat lahir

1. Umur saat perkawinan pertama

2. Jumlah anak kandung dilahirkan, lahir hidup 3. Jumlah anak kandung dilahirkan, masih hidup 4. Jumlah anak kandung dilahirkan, sdh meninggal 5. Penolong kelahiran pertama

6. Penolong kelahiran terakhir 7. Berapa kali mendapat imunisasi

Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli Susenas Kor 07,08,09 Juli

1. Education level 2. Gender

3. Head of household status in relation with other household members

4. Number of family member

5. Whether has activities over the last 7 days 6. Wheter has any job/businesses while not working 7. Main business field

8. Position in the main job

9. Average food expenditure/capita/month 10. Average calorie consumption/capita/month 11. Average protein consumption/capita/month 12. Average non food expenditure/capita/month

13. Proportion of people/head of household working in agriculture 14. Number of household received ASKESKIN one year ago

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Module 08 July Susenas Module 08 July Susenas Module 08 July Susenas Module 08 July Podes 08

Podes 08 E. Life Expectancy at birth

1. Age at first marriage 2. Number of children born, alive 3. Number of children born, still alive 4. Number of children born, passed away 5. First birth attendant

6. Last birth attendant

7. Number of completed immunization

Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July Susenas Core 07,08,09 July

Sampling Error and Non Sampling Error in Surveys The following errors can arise in the data from surveys:

Sampling error: errors arises from the use of sampling method to estímate values in a larger population;

Non Sampling error: errors arises from other factors such as mistake in recording, misreporting etc.

The sampling error of a complete census should be zero, whereas both sampling error and non-sampling error can arise in non-sampling surveys. The balance between two errors should be considered in designing a survey, especially in the determination of sample size in order to describe the population. The increase in sample size will reduce sampling errors but instead will increase non-sampling errors due to a greater possibility of human errors.

Standard Errors

As presented in 4. Proceddure, a statistical technique called ‘bootstrapping’ was used to improve the accuracy of the estimation. Most of the bootstrap procedure used the models that have been estimated in the first stage. The procedure was applied for different random components to bootstrap dependent variables.

The bootstrap variables are the dependent variables or estimated indicator variables such as the percentage of households with no access to electricity, the percentage of households without clean water. Standard Error estimator was obtained from the standard deviation of all possible indicators of the simulated samples.

Table 2 below shows some examples of the range of standard errors of some indicators in 4 provinces.

5. Hasil dan Realibilitas

Sampling Error dan Non Sampling Error dalam Survei

Ada beberapa kesalahan (Error) dapat terjadi dalam kegiatan survei, seperti:

Sampling Error: kesalahan karena metode sampling yang digunakan untuk mengestimasi nilai

populasi yang besar;

Non Sampling Error: kesalahan karena faktor dari luar seperti kesalahan dalam pencatatan

data, laporan yang salah dll.

Kesalahan sampling (sampling error) dari sensus yang lengkap seharusnya tidak ada (nol), karena umumnya sampling error dan non sampling error terjadi di sampling survei. Keseimbangan antara error keduanya perlu dipertimbangkan dalam mendesain sebuah survei terutama dalam penentuan besarnya sampel sehingga dapat menggambarkan populasi. Kenaikan besaran sampel akan menurunkan sampling error tetapi sebaliknya akan memperbesar non sampling error karena besarnya kemungkinan kesalahan manusia (human error).

Standard Error

Seperti yang dijelaskan pada poin 4-Prosedur, salah satu teknik statistik yang disebut “bootstrapping” digunakan untuk meningkatkan akurasi hasil estimasi. Sebagian besar metode

bootstrap menggunakan model yang telah diestimasi pada tahap pertama. Prosedur ini digunakan

untuk pengambilan berulang komponen random yang berbeda untuk mem-bootstrap dependent variables.

Variabel yang dibootstrap adalah variabel dependent atau variabel indikator yang diestimasi seperti persentase rumah tangga yang tidak ada akses listrik dan persentase rumah tangga tanpa air bersih. Penduga untuk nilai Standard Error yang merupakan indikator untuk Sampling Error diperoleh dari nilai standard deviasi dari indikator seluruh kemungkinan sampel yang disimulasi. Tabel 2 dibawah ini menunjukkan beberapa contoh dari range standard error dari beberapa indikator di 4 provinsi.

Tabel 2: Jumlah Kecamatan berdasarkan Range Standard Error (2 SD)

Provinsi/Kabupaten/Kota Range Standard Error

Dokumen terkait