• Tidak ada hasil yang ditemukan

Kontribusi Michael Jonas dalam Eksplorasi Data Kelompok

N/A
N/A
Michael Jonas.S

Academic year: 2024

Membagikan "Kontribusi Michael Jonas dalam Eksplorasi Data Kelompok"

Copied!
13
0
0

Teks penuh

(1)

NAMA : Michael Jonas.S NIM : 212011493

Kelas : 4SE4

Kontribusi saya pada tugas kelompok :

• Mengabungkan data berupa 4 Auxiliary Variabel pada excel berupa data Jumlah aparatur pemerintahan, Banyaknya penyandang disabilitas di desa/kelurahan, Persentase ruta yang dengan status kepemilikan tanah dari bangunan tempat tinggal yang ditempati milik sendiri (1) dan Persentase ruta yang dengan status kepemilikan tanah dari bangunan tempat tinggal yang ditempati bukan milik sendiri (2)

• Kemudian membuat matriks korelasi pada 4 auxiliary variabel pada bagian ke empat dengan menginterpretasikan nya

• Membuat Bivariate Scatter Plot pada 4 auxiliary variabel yang diberikan oleh kelompok

No. Anggota Kelompok 6 NIM

1 Ragil Novia Ramadhani 212011410

2 Renaldi Ade Permana 212011435

3 Milie Diarty 212011491

4 Michael Jonas S. 212011493

5 Evita Khairunnisa 212011734

Eksplorasi Data

1. Buat eksplorasi data tentang :

- direct estimate: cek sebarannya, RSE, kasus nirsample, dll

- auxiliary variabel: buat matriks korelasi, scatter plot bivariate antara direct estimate dan auxiliary variable, cek multikolinieritas

- buat model regresi linier berganda dengan variabel responnya berupa direct estimate, dan variabel independennya berupa auxiliary variabel kandidat --> lalu pemilihan auxiliary variabel yang akan digunakan dalam model SAE

2. Buat pembahasan hasil eksplorasinya dan rencana model SAE yang digunakan pada MS.Word.

===

(2)

Direct Estimate

Pulau Sulawesi memiliki 6 provinsi yaitu, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, dan Sulawesi Barat. Total kabupaten/kota di Pulau Sulawesi terdiri dari 81 kabupaten/kota.

Eksplorasi Direct Estimate pada setiap provinsi, yaitu:

Provinsi Rata-rata Direct Estimate

Rata-rata RSE Persentase kabupaten/kot a dengan RSE lebih dari 25%

RSE tertinggi

Sulawesi Utara 7,46 30,41% 60% 50,86% -

Minahasa Tenggara Sulawesi

Tengah

18,62 19,48% 15,38% 37,51% -

Donggala Sulawesi

Selatan

12,81 18,63% 16,67% 35,36% - Luwu

Utara Sulawesi

Tenggara

16,01 19,10% 23,53% 26,90% -

Kolaka

Gorontalo 24,61 23,09% 50% 31,09% -

Boalemo

Sulawesi Barat 15,40 18,20% 0% 22,27% -

Polewali Mandar

Eksplorasi Direct Estimate pada Pulau Sulawesi:

Secara keseluruhan rata-rata direct estimate di Pulau Sulawesi adalah sebesar 13,29. Rata-rata RSE dari direct estimate adalah sebesar 21,34%. Walaupun secara rata-rata sudah berada di bawah 25%, namun masih terdapat 27,16% kabupaten/kota di Pulau Sulawesi yang memiliki RSE lebih dari 25%. RSE tertinggi ditunjukkan oleh Kabupaten Minahasa Tenggara di Sulawesi Utara, dengan RSE sebesar 50,86% dan direct estimate sebesar 2,50. Selain itu, juga terdapat dua kabupaten/kota yang tidak memiliki sampel (nirsample) yaitu Kabupaten Sinjai dan Pangkajene Kepulauan. Keduanya terletak di Sulawesi Selatan.

(3)

Dari boxplot di atas dapat terlihat sebaran dari direct estimate yang menceng kanan. Selain itu, juga terdapat satu amatan yang merupakan pencilan atau outlier, yaitu pada Toli-Toli di Sulawesi Tengah dengan direct estimate sebesar 35,43.

Summary Statistic Direct Estimate Pulau Sulawesi

Summary Statistic RSE Pulau Sulawesi

Uji Non-Formal : QQ-Plot

(4)

Berdasarkan QQ-Plot terlihat bahwa sebaran direct estimate tidak berada di sepanjang garis. Sehingga diindikasikan distribusi dari direct estimate tidak berdistribusi normal.

Uji Formal: Pengujian Asumsi Normalitas pada Direct Estimate

Hipotesis

Tingkat signifikansi

Statistik Uji

Dengan menggunakan Jarque Berra test dan Shapiro Wilk test:

(5)

Wilayah Kritis

Keputusan

Kesimpulan

Dengan tingkat signifikansi 5%, cukup membuktikan bahwa direct estimate tidak berdistribusi normal.

Eksplorasi Auxiliary Variable

Matriks Korelasi

Gambar 1. Matriks Korelasi Auxiliary Variable Bagian Pertama

(6)

Gambar 2. Matriks Korelasi Auxiliary Variable Bagian Kedua

Gambar 3. Matriks Korelasi Auxiliary Variable Bagian Ketiga

Gambar 4. Matriks Korelasi Auxiliary Variable Bagian Keempat

Interpretasi:

Berdasarkan Gambar 1 hingga Gambar 4, seluruh variabel yang digunakan memiliki korelasi yang sangat lemah terhadap variabel persentase anak berusia 0-17 tahun yang konsumsi kalorinya < 1400 kkal.

(7)

Bivariate Scatter Plot

(8)
(9)

Multicolinearity Test

Berdasarkan output di atas, terlihat bahwa terdapat tiga variabel yang memiliki nilai centered VIF lebih dari 10, yaitu V_R501A1A2 (jumlah keluarga yang menggunakan listrik), persentase desa/kelurahan yang memiliki kelas ibu hamil, dan persentase desa/kelurahan yang memiliki kelas ibu balita.

Regresi Linear Berganda

(10)

Estimasi regresi linier berganda dilakukan untuk menyeleksi auxiliary variabel yang dapat menghasilkan prediksi yang akurat. tiga metode seleksi diaplikasikan pada data yang telah dikumpulkan yaitu metode forward linkage, backward dan stepwise.

Metode Forward Linkage

Metode Stepwise

(11)

Metode Backward

Berdasarkan seleksi variabel yang telah dilakukan menggunakan metode forward linkage, stepwise, dan backward elimination, didapatkan beberapa auxiliary variabel yang dapat digunakan. Melalui metode forward dan stepwise, auxiliary variabel yang terpilih hanyalah 2 yakni Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota dan Dependency ratio tahun 2021 dengan nilai adjusted R square sebesar 0,170. Sedangkan melalui metode backward elimination, terpilih 8 variabel dengan nilai adjusted R square sebesar 0,273, yang lebih tinggi dibandingkan dengan dua metode seleksi sebelumnya. sehingga auxiliary variabel yang dipilih adalah variabel hasil seleksi berdasarkan metode backward elimination. Metode backward elimination menghasilkan model dengan variabel independen yang paling banyak. Variabel-variabel yang dimasukkan pun kebanyakan memiliki korelasi yang cukup besar dibanding variabel lainnya. Dengan menggunakan auxiliary variabel yang banyak dan korelasinya lumayan tinggi, diharapkan estimasi yang lebih baik untuk variabel persentase anak berusia 0-17 tahun yang konsumsi kalorinya < 1400 kkal.

(12)

Dari metode backward elimination, diperoleh bahwa auxiliary variabel yang dapat digunakan adalah sebagai berikut:

- Jumlah pasar yang tersedia

- Jumlah desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir

- Persentase desa/kelurahan yang memiliki kelas ibu balita - jumlah warga yang menderita kekurangan gizi selama 2020

- Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota

- Persentase desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir

- Dependency ratio tahun 2021 - Jumlah aparatur pemerintah Rencana model SAE

Berdasarkan eksplorasi data yang telah dilakukan, model SAE yang akan digunakan adalah model Fay-Heriot dengan metode pendugaan EBLUP (The Empirical Best Linear Unbiased Predictor). Hal ini karena metode penghitungannya yang mudah dan variabel yang akan diestimasi merupakan variabel kontinu. Asumsi dalam estimasi dengan EBLUP adalah pengaruh acaknya berdistribusi normal. Jika ternyata pengaruh acaknya tidak berdistribusi normal, maka metode pendugaannya akan menggunakan metode HB (Hierarchical Bayesian) Variabel yang diestimasi adalah persentase anak berusia 0-17 tahun yang konsumsi kalorinya

< 1400 kkal pada tingkat kabupaten/kota di Pulau Sulawesi.

Jadi, model yang diajukan adalah model berbasis level area yakni sebagai berikut : 𝑦𝑖 = 𝑥𝑖𝑇 𝛽 + 𝑏𝑖 𝑣𝑖 + 𝑒𝑖 , 𝑖 = 1, . . . , 𝑚

dengan asumsi 𝑣𝑖 dan 𝑒𝑖 saling independen. Dengan auxiliary variabel yang diajukan dan akan digunakan adalah :

- Jumlah pasar yang tersedia

- Jumlah desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir

- Persentase desa/kelurahan yang memiliki kelas ibu balita - jumlah warga yang menderita kekurangan gizi selama 2020

- Persentase desa/kelurahan yang mengalami kejadian Covid-19 pada setiap kabupaten/kota

- Persentase desa/kelurahan yang mengalami pencemaran lingkungan hidup (polusi udara) selama setahun terakhir

- Dependency ratio tahun 2021 - Jumlah aparatur pemerintah

(13)

Referensi

Dokumen terkait

Sumber data primer ini dapat diperoleh melalui pengamatan langsung dan wawancara kepada narasumber-narasumber yang terkait dengan Kelompok Ternak Hidayah Alam, antara lain

Kelompok Sasaran Kegiatan : 8 Kelompok Data di Unit Kerja/Instansi Terkait Pemerintah Pusat, Pemprov dan Pem Kab/Kota Rincian Dokumen Pelaksanaan Anggaran Belanja Langsung.

Tujuan Tugas Akhir ini adalah membuat program yang dapat menyembunyikan suatu data rahasia baik dalam bentuk data citra digital, data teks, data audio, atau data video ke

Tujuan dari Tugas Akhir ini adalah untuk membuat suatu sistem monitoring suhu dari suatu plant yang dapat diakses melalui web dengan akuisisi data dari port paralel pada

REKAPITULASI DATA KEPENDUDUKAN MENURUT KELOMPOK UMUR DAN JENIS KELAMIN TAHUN 2016 SEMESTER I1.

Data hasil penelitian ini dapat dijadikan sebagai suatu proses analisis kebutuhan bagi Guru BK di dalam membuat program BK untuk mengentaskan permasalahan siswa yang terkait

Bagan Alir Mulai mengumpulkan data dari pihak terkait yang memohon surat keputusan atau surat tugas membuat rancangan surat pengantar yang akan diajukan ke Fakultas

Data yang digunakan untuk pengelompokan kemampuan siswa ini adalah data rapor semester 1 sampai dengan semester 5 dan nilai tes tulis, sehingga akan terbentuk kelompok belajar yang