NAMA : Michael Jonas.S NIM : 212011493
Kelas : 4SE4
Kontribusi saya pada tugas kelompok :
• Mengabungkan data berupa 4 Auxiliary Variabel pada excel berupa data Jumlah aparatur pemerintahan, Banyaknya penyandang disabilitas di desa/kelurahan, Persentase ruta yang dengan status kepemilikan tanah dari bangunan tempat tinggal yang ditempati milik sendiri (1) dan Persentase ruta yang dengan status kepemilikan tanah dari bangunan tempat tinggal yang ditempati bukan milik sendiri (2)
• Kemudian membuat matriks korelasi pada 4 auxiliary variabel pada bagian ke empat dengan menginterpretasikan nya
• Membuat Bivariate Scatter Plot pada 4 auxiliary variabel yang diberikan oleh kelompok
No. Anggota Kelompok 6 NIM
1 Ragil Novia Ramadhani 212011410
2 Renaldi Ade Permana 212011435
3 Milie Diarty 212011491
4 Michael Jonas S. 212011493
5 Evita Khairunnisa 212011734
Eksplorasi Data
1. Buat eksplorasi data tentang :
- direct estimate: cek sebarannya, RSE, kasus nirsample, dll
- auxiliary variabel: buat matriks korelasi, scatter plot bivariate antara direct estimate dan auxiliary variable, cek multikolinieritas
- buat model regresi linier berganda dengan variabel responnya berupa direct estimate, dan variabel independennya berupa auxiliary variabel kandidat --> lalu pemilihan auxiliary variabel yang akan digunakan dalam model SAE
2. Buat pembahasan hasil eksplorasinya dan rencana model SAE yang digunakan pada MS.Word.
===
Direct Estimate
Pulau Sulawesi memiliki 6 provinsi yaitu, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, dan Sulawesi Barat. Total kabupaten/kota di Pulau Sulawesi terdiri dari 81 kabupaten/kota.
Eksplorasi Direct Estimate pada setiap provinsi, yaitu:
Provinsi Rata-rata Direct Estimate
Rata-rata RSE Persentase kabupaten/kot a dengan RSE lebih dari 25%
RSE tertinggi
Sulawesi Utara 7,46 30,41% 60% 50,86% -
Minahasa Tenggara Sulawesi
Tengah
18,62 19,48% 15,38% 37,51% -
Donggala Sulawesi
Selatan
12,81 18,63% 16,67% 35,36% - Luwu
Utara Sulawesi
Tenggara
16,01 19,10% 23,53% 26,90% -
Kolaka
Gorontalo 24,61 23,09% 50% 31,09% -
Boalemo
Sulawesi Barat 15,40 18,20% 0% 22,27% -
Polewali Mandar
Eksplorasi Direct Estimate pada Pulau Sulawesi:
Secara keseluruhan rata-rata direct estimate di Pulau Sulawesi adalah sebesar 13,29. Rata-rata RSE dari direct estimate adalah sebesar 21,34%. Walaupun secara rata-rata sudah berada di bawah 25%, namun masih terdapat 27,16% kabupaten/kota di Pulau Sulawesi yang memiliki RSE lebih dari 25%. RSE tertinggi ditunjukkan oleh Kabupaten Minahasa Tenggara di Sulawesi Utara, dengan RSE sebesar 50,86% dan direct estimate sebesar 2,50. Selain itu, juga terdapat dua kabupaten/kota yang tidak memiliki sampel (nirsample) yaitu Kabupaten Sinjai dan Pangkajene Kepulauan. Keduanya terletak di Sulawesi Selatan.
Dari boxplot di atas dapat terlihat sebaran dari direct estimate yang menceng kanan. Selain itu, juga terdapat satu amatan yang merupakan pencilan atau outlier, yaitu pada Toli-Toli di Sulawesi Tengah dengan direct estimate sebesar 35,43.
Summary Statistic Direct Estimate Pulau Sulawesi
Summary Statistic RSE Pulau Sulawesi
Uji Non-Formal : QQ-Plot
Berdasarkan QQ-Plot terlihat bahwa sebaran direct estimate tidak berada di sepanjang garis. Sehingga diindikasikan distribusi dari direct estimate tidak berdistribusi normal.
Uji Formal: Pengujian Asumsi Normalitas pada Direct Estimate
● Hipotesis
● Tingkat signifikansi
● Statistik Uji
Dengan menggunakan Jarque Berra test dan Shapiro Wilk test:
● Wilayah Kritis
● Keputusan
● Kesimpulan
Dengan tingkat signifikansi 5%, cukup membuktikan bahwa direct estimate tidak berdistribusi normal.
Eksplorasi Auxiliary Variable
Matriks Korelasi
Gambar 1. Matriks Korelasi Auxiliary Variable Bagian Pertama
Gambar 2. Matriks Korelasi Auxiliary Variable Bagian Kedua
Gambar 3. Matriks Korelasi Auxiliary Variable Bagian Ketiga
Gambar 4. Matriks Korelasi Auxiliary Variable Bagian Keempat
Interpretasi:
Berdasarkan Gambar 1 hingga Gambar 4, seluruh variabel yang digunakan memiliki korelasi yang sangat lemah terhadap variabel persentase anak berusia 0-17 tahun yang konsumsi kalorinya < 1400 kkal.
Bivariate Scatter Plot
Multicolinearity Test
Berdasarkan output di atas, terlihat bahwa terdapat tiga variabel yang memiliki nilai centered VIF lebih dari 10, yaitu V_R501A1A2 (jumlah keluarga yang menggunakan listrik), persentase desa/kelurahan yang memiliki kelas ibu hamil, dan persentase desa/kelurahan yang memiliki kelas ibu balita.
Regresi Linear Berganda
Estimasi regresi linier berganda dilakukan untuk menyeleksi auxiliary variabel yang dapat menghasilkan prediksi yang akurat. tiga metode seleksi diaplikasikan pada data yang telah dikumpulkan yaitu metode forward linkage, backward dan stepwise.
Metode Forward Linkage
Metode Stepwise
Metode Backward
Berdasarkan seleksi variabel yang telah dilakukan menggunakan metode forward linkage, stepwise, dan backward elimination, didapatkan beberapa auxiliary variabel yang dapat digunakan. Melalui metode forward dan stepwise, auxiliary variabel yang terpilih hanyalah 2 yakni Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota dan Dependency ratio tahun 2021 dengan nilai adjusted R square sebesar 0,170. Sedangkan melalui metode backward elimination, terpilih 8 variabel dengan nilai adjusted R square sebesar 0,273, yang lebih tinggi dibandingkan dengan dua metode seleksi sebelumnya. sehingga auxiliary variabel yang dipilih adalah variabel hasil seleksi berdasarkan metode backward elimination. Metode backward elimination menghasilkan model dengan variabel independen yang paling banyak. Variabel-variabel yang dimasukkan pun kebanyakan memiliki korelasi yang cukup besar dibanding variabel lainnya. Dengan menggunakan auxiliary variabel yang banyak dan korelasinya lumayan tinggi, diharapkan estimasi yang lebih baik untuk variabel persentase anak berusia 0-17 tahun yang konsumsi kalorinya < 1400 kkal.
Dari metode backward elimination, diperoleh bahwa auxiliary variabel yang dapat digunakan adalah sebagai berikut:
- Jumlah pasar yang tersedia
- Jumlah desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir
- Persentase desa/kelurahan yang memiliki kelas ibu balita - jumlah warga yang menderita kekurangan gizi selama 2020
- Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota
- Persentase desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir
- Dependency ratio tahun 2021 - Jumlah aparatur pemerintah Rencana model SAE
Berdasarkan eksplorasi data yang telah dilakukan, model SAE yang akan digunakan adalah model Fay-Heriot dengan metode pendugaan EBLUP (The Empirical Best Linear Unbiased Predictor). Hal ini karena metode penghitungannya yang mudah dan variabel yang akan diestimasi merupakan variabel kontinu. Asumsi dalam estimasi dengan EBLUP adalah pengaruh acaknya berdistribusi normal. Jika ternyata pengaruh acaknya tidak berdistribusi normal, maka metode pendugaannya akan menggunakan metode HB (Hierarchical Bayesian) Variabel yang diestimasi adalah persentase anak berusia 0-17 tahun yang konsumsi kalorinya
< 1400 kkal pada tingkat kabupaten/kota di Pulau Sulawesi.
Jadi, model yang diajukan adalah model berbasis level area yakni sebagai berikut : 𝑦𝑖 = 𝑥𝑖𝑇 𝛽 + 𝑏𝑖 𝑣𝑖 + 𝑒𝑖 , 𝑖 = 1, . . . , 𝑚
dengan asumsi 𝑣𝑖 dan 𝑒𝑖 saling independen. Dengan auxiliary variabel yang diajukan dan akan digunakan adalah :
- Jumlah pasar yang tersedia
- Jumlah desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir
- Persentase desa/kelurahan yang memiliki kelas ibu balita - jumlah warga yang menderita kekurangan gizi selama 2020
- Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota
- Persentase desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir
- Dependency ratio tahun 2021 - Jumlah aparatur pemerintah