• Tidak ada hasil yang ditemukan

RATIO ESTIMATOR, DIFFERENCE ESTIMATOR, & REGRESSION ESTIMATOR

N/A
N/A
Protected

Academic year: 2021

Membagikan "RATIO ESTIMATOR, DIFFERENCE ESTIMATOR, & REGRESSION ESTIMATOR"

Copied!
16
0
0

Teks penuh

(1)

RATIO ESTIMATOR, DIFFERENCE ESTIMATOR, & REGRESSION

ESTIMATOR

OLEH: ADHI KURNIAWAN

STAF DIREKTORAT PENGEMBANGAN METODOLOGI SENSUS DAN SURVEI

BADAN PUSAT STATISTIK RI

(2)

adhikurnia22@gmail.com 1 RATIO ESTIMATOR, DIFFERENCE ESTIMATOR, DAN REGRESSION ESTIMATOR

Variabel pendukung (auxiliary variable) merupakan variabel yang mempunyai hubungan (korelasi) yang kuat dengan variabel yang diteliti (𝑦) pada suatu survei. Pada tahap estimasi, variabel pendukung (𝑥) dapat digunakan untuk memperkecil nilai varians sampling sehingga akan meningkatkan presisi pendugaan parameter. Prosedur ini mensyaratkan nilai rata-rata (𝑋̅) atau total populasi (𝑋) dari variabel pendukung harus diketahui. Bentuk umum dari pendugaan rata-rata dengan memanfaatkan variabel pendukung dirumuskan:

𝑦̅𝑐= 𝑦̅ + 𝑐(𝑋̅ − 𝑥̅) Keterangan:

𝑦̅ : estimasi rata-rata karakteristik berdasarkan prosedur penarikan sampel yang digunakan

𝑥̅ : estimasi rata-rata dari variabel pendukung berdasarkan prosedur penarikan sampel yang digunakan 𝑋̅ : nilai rata-rata populasi dari variabel pendukung

𝑐 : suatu konstanta tertentu

Estimasi varians sampling untuk 𝑦̅𝑐 : 𝑣(𝑦̅𝑐) = 𝑣[𝑦̅ + 𝑐(𝑋̅ − 𝑥̅)]

= 𝑣(𝑦̅ − 𝑐𝑥̅ + 𝑐𝑋̅)

= 𝑣(𝑦̅ − 𝑐𝑥̅)

𝑣(𝑦̅𝑐) = 𝑣(𝑦̅) − 2𝑐 𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑐2 𝑣(𝑥̅)

Dalam hal ini, terdapat beberapa alternatif dalam menentukan nilai 𝑐 yaitu:

1. Jika 𝑐 = 0 maka 𝑦̅𝐺= 𝑦̅ ----> (rata-rata sederhana) 2. Jika 𝑐 = 𝑟 (𝑟 = 𝑦̅ 𝑥̅⁄ ), maka

𝑦̅𝑅= 𝑦̅ + 𝑟(𝑋̅ − 𝑥̅) = 𝑟𝑋̅ ----> (ratio estimator)

3. Jika 𝑐 = 𝑘 (𝑘 adalah konstanta, tidak tergantung pada sampel), maka 𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅) ----> (difference estimator)

4. Jika 𝑐 = 𝛽 (𝛽 adalah konstanta, koefisien regresi populasi), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝛽(𝑋̅ − 𝑥̅) ----> (regression estimator)

5. Jika 𝑐 = 𝑏 (𝑏 adalah random variable, estimator untuk 𝛽), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅) ----> (regression estimator)

Notasi yang digunakan:

𝑦𝑖 : nilai karakteristik yang diteliti dari unit sampel ke-i 𝑥𝑖 : nilai variabel pendukung dari unit sampel ke-i 𝑦 : total nilai karakteristik yang diteliti dari data sampel

𝑦 = ∑ 𝑦𝑖 𝑛

𝑖=1

𝑥 : total nilai variabel pendukung dari data sampel 𝑥 = ∑ 𝑥𝑖

𝑛

𝑖=1

𝑌 : total nilai karakteristik yang diteliti untuk populasi 𝑌 = ∑ 𝑦𝑖

𝑁

𝑖=1

𝑋 : total nilai variabel pendukung untuk populasi

(3)

adhikurnia22@gmail.com 2 𝑋 = ∑ 𝑥𝑖

𝑁

𝑖=1

1. Penduga rasio (ratio estimator)

Dari persamaan 𝑦̅𝑐= 𝑦̅ + 𝑐(𝑋̅ − 𝑥̅), jika nilai 𝑐 = 𝑅̂ =𝑦̅

𝑥̅ , maka akan diperoleh formulasi penduga rasio untuk rata-rata karakteristik, yaitu:

𝑦̅𝑅= 𝑦̅ + 𝑅̂(𝑋̅ − 𝑥̅)

= 𝑦̅ +𝑦̅

𝑥̅(𝑋̅ − 𝑥̅)

= 𝑦̅ +𝑦̅

𝑥̅𝑋̅ − 𝑦̅

=𝑦̅

𝑥̅𝑋̅

𝑦̅𝑅= 𝑅̂𝑋̅

Estimator total 𝑌̂𝑅= 𝑅̂𝑋

Estimasi varians rata-rata:

𝑣(𝑦̅𝑅) = 𝑣(𝑦̅) − 2𝑅̂ 𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑅̂2 𝑣(𝑥̅) Untuk desain SRS WOR:

𝑣(𝑦̅𝑅) = 1 − 𝑓

𝑛(𝑛 − 1)∑(𝑦𝑖− 𝑅̂𝑥𝑖)2

𝑛

𝑖=1

Rumus di atas dapat dijabarkan menjadi:

𝑣(𝑦̅𝑅) = 1 − 𝑓

𝑛(𝑛 − 1)∑[(𝑦𝑖− 𝑦̅) + (𝑦̅ − 𝑅̂𝑥𝑖)]2

𝑛

𝑖=1

= 1 − 𝑓

𝑛(𝑛 − 1)∑ [(𝑦𝑖− 𝑦̅)2+ 2(𝑦𝑖− 𝑦̅)(𝑦̅ − 𝑅̂𝑥𝑖) + (𝑦̅ − 𝑅̂𝑥𝑖)2]

𝑛

𝑖=1

= 1 − 𝑓

𝑛(𝑛 − 1)∑[(𝑦𝑖− 𝑦̅)2+ 2𝑅̂(𝑦𝑖− 𝑦̅)(𝑥̅ − 𝑥𝑖) + 𝑅̂2(𝑥̅ − 𝑥𝑖)2]

𝑛

𝑖=1

= 1 − 𝑓

𝑛(𝑛 − 1)∑[(𝑦𝑖− 𝑦̅)2− 2𝑅̂(𝑦𝑖− 𝑦̅)(𝑥𝑖− 𝑥̅) + 𝑅̂2(𝑥𝑖− 𝑥̅)2]

𝑛

𝑖=1

=1 − 𝑓 𝑛 [{ 1

𝑛 − 1∑(𝑦𝑖− 𝑦̅)2

𝑛

𝑖=1

} − 2𝑅̂ { 1

𝑛 − 1∑(𝑦𝑖− 𝑦̅)(𝑥𝑖− 𝑥̅)

𝑛

𝑖=1

} + { 1

𝑛 − 1∑(𝑥𝑖− 𝑥̅)2

𝑛

𝑖=1

}]

𝑣(𝑦̅𝑅) =(1 − 𝑓)

𝑛 (𝑠𝑦2− 2𝑅̂𝑠𝑦𝑥+ 𝑅̂2𝑠𝑥2)

=(1 − 𝑓)

𝑛 (𝑠𝑦2− 2𝑅̂𝜌𝑠𝑦𝑠𝑥+ 𝑅̂2𝑠𝑥2) Estimasi varians rasio:

𝑣(𝑅̂) =𝑣(𝑦̅𝑅) 𝑋̅2

=1 − 𝑓

𝑛𝑋̅2 (𝑠𝑦2− 2𝑅̂𝑠𝑦𝑥+ 𝑅̂2𝑠𝑥2)

(4)

adhikurnia22@gmail.com 3 Estimasi varians total:

𝑣(𝑌̂𝑅) = 𝑁2𝑣(𝑦̅𝑅)

=𝑁2(1 − 𝑓)

𝑛 (𝑠𝑦2− 2𝑅̂𝑠𝑦𝑥+ 𝑅̂2𝑠𝑥2) Soal Latihan 1:

Dari data Sensus Ternak tahun lalu diperoleh informasi bahwa jumlah peternak sapi di suatu wilayah sebanyak 82.688 rumah tangga peternak dan rata-rata jumlah sapi untuk tiap peternak sebanyak 9 ekor. Sebuah sampel acak sederhana sebanyak 5.168 peternak diambil dari populasi tersebut untuk memperkirakan produksi susu yang dihasilkan. Jumlah sapi yang diperoleh dari hasil observasi adalah 48.450 ekor dan rata-rata produksi susu untuk tiap peternak sebanyak 300 liter per hari. Informasi lain yang diperoleh sebagai berikut:

𝑠𝑦= 28,8 𝑠𝑥 = 1,25 𝜌 = 0,875 Dengan menggunakan ratio estimator,

a. Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh satu ekor sapi beserta standar error, rse, dan 95% Confidence Interval-nya !

b. Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh rumah tangga peternak beserta standar error, rse, dan 95% Confidence Interval-nya !

c. Perkirakan total produksi susu per hari di wilayah tersebut beserta standar error, rse, dan 95% Confidence Interval-nya !

d. Interpretasikan hasil yang diperoleh ! 2. Penduga beda (difference estimator)

Jika nilai 𝑐 = 𝑘 , di mana 𝑘 adalah suatu nilai konstanta yang ditetapkan tanpa mempertimbangkan nilai yang diperoleh dari data sampel, maka akan diperoleh formulasi untuk penduga beda, yaitu:

𝑦̅𝐷= 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅) 𝑌̂𝐷 = 𝑁𝑦̅𝐷

Estimasi varians:

𝑣(𝑦̅𝐷) = 𝑣(𝑦̅) − 2𝑘 𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑘2 𝑣(𝑥̅) 𝑣(𝑌̂𝐷) = 𝑁2 𝑣(𝑦̅𝐷)

Soal Latihan 2:

Sebuah pengamatan dilakukan terhadap 100 lahan yang ditanami pohon cabai merah di suatu desa. Dari hasil pengamatan dengan eye estimate diperoleh total produksi dari 100 lahan tersebut sebanyak 12500 kg. Sebuah random sampel sebanyak 10 lahan diambil secara SRS WOR dan setiap lahan terpilih dilakukan pemanenan cabai merah dan selanjutnya dilakukan pengukuran terhadap berat dari cabai yang dihasilkan. Data produksi cabai (kg) dari lahan terpilih yang diperoleh dari hasil pengamatan (eye estimate) dan hasil pengukuran sebagai berikut:

No 1 2 3 4 5 6 7 8 9 10

Produksi

(pengukuran) 51 42 46 39 71 61 58 57 58 67

Produksi

(pengamatan) 56 47 48 40 78 59 52 58 55 67

Perkirakan total produksi cabai merah di desa tersebut dengan menggunakan difference estimator (𝑘 = 1) beserta standar error, RSE, dan 95% confidence interval-nya !

3. Penduga regresi (regression estimator)

Bentuk umum dari estimasi regresi untuk menduga nilai rata-rata adalah:

𝑦̅𝑙𝑟= 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅)

Dengan unbiased sampling variance estimator adalah:

𝑣(𝑦̅𝑙𝑟) = 𝑣(𝑦̅) − 2𝑏𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑏2𝑣(𝑥̅) Estimasi total karakteristik:

𝑌̂𝑙𝑟 = 𝑁𝑦̅𝑙𝑟 = 𝑌̂𝑙𝑟+ 𝑏(𝑋 − 𝑋̂) 𝑣(𝑌̂𝑙𝑟) = 𝑁2𝑣(𝑦̅𝑙𝑟)

Dari rumus varians di atas, nilai koefisien regresi (𝑏) yang meminimumkan varians bisa diperoleh dengan mendiferensialkan 𝑣(𝑦̅𝑙𝑟) terhadap 𝑏 dan mempersamakan hasilnya dengan nol, yaitu:

𝑑 𝑣(𝑦̅𝑙𝑟) 𝑑 𝑏 = 0

(5)

adhikurnia22@gmail.com 4 𝑑 [𝑣(𝑦̅) − 2𝑏𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑏2𝑣(𝑥̅)]

𝑑 𝑏 = 0

−2𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 2𝑏 𝑣(𝑥̅) = 0 𝑏 =𝑐𝑜𝑣(𝑦̅, 𝑥̅)

𝑣(𝑥̅)

Dengan substitusi nilai 𝑏 =𝑐𝑜𝑣(𝑦̅,𝑥̅)

𝑣(𝑥̅) terhadap 𝑣(𝑦̅𝑙𝑟) akan diperoleh formulasi varians yang lebih sederhana yaitu:

𝑣(𝑦̅𝑙𝑟) = 𝑣(𝑦̅) − 2𝑏 𝑐𝑜𝑣(𝑥̅, 𝑦̅) + 𝑏2𝑣(𝑥̅)

= 𝑣(𝑦̅) − 2𝑐𝑜𝑣(𝑦̅, 𝑥̅)

𝑣(𝑥̅) 𝑐𝑜𝑣(𝑦̅, 𝑥̅) + (𝑐𝑜𝑣(𝑦̅, 𝑥̅) 𝑣(𝑥̅) )

2

𝑣(𝑥̅)

= 𝑣(𝑦̅) −(𝑐𝑜𝑣(𝑦̅, 𝑥̅))2 𝑣(𝑥̅)

= 𝑣(𝑦̅) −𝜌2𝑣(𝑥̅)𝑣(𝑦̅) 𝑣(𝑥̅) 𝑣(𝑦̅𝑙𝑟) = 𝑣(𝑦̅)(1 − 𝜌2)

Beberapa hal yang bisa disimpulkan dari rumus varians tsb:

Bila regresi linier, dan b adalah Least Square Estimate bagi , maka 𝑦̅𝑙𝑟 presisinya lebih tinggi daripada 𝑦̅𝐷. – Bila regresi y dalam x linier sempurna sehingga |𝜌| ≈ 1, maka 𝑣(𝑦̅𝑙𝑟) ≈ 0.

Bila bila y dan x tak berkorelasi (𝜌 = 0), maka 𝑦̅𝑙𝑟= 𝑦̅ (penduga regresi sama dengan penduga SRS).

Jika penarikan sampel dilakukan secara SRS WOR 𝑣(𝑦̅𝑙𝑟) = 𝑣(𝑦̅) − 2𝑏𝑐𝑜𝑣(𝑦̅, 𝑥̅) + 𝑏2𝑣(𝑥̅)

𝑏 =𝑠𝑦𝑥

𝑠𝑥2 =∑(𝑦𝑖− 𝑦̅)(𝑥𝑖− 𝑥̅)

∑(𝑥𝑖− 𝑥̅)2 𝑣(𝑦̅𝑙𝑟) =(1 − 𝑓)

𝑛 (𝑠𝑦2− 2𝑏𝑠𝑦𝑥+ 𝑏2𝑠𝑥2)

=(1 − 𝑓)

𝑛 (𝑠𝑦2− 2𝑏𝜌𝑠𝑦𝑠𝑥+ 𝑏2𝑠𝑥2)

=1 − 𝑓

𝑛 [𝑠𝑦2− 2𝑠𝑦𝑥

𝑠𝑥2 𝑠𝑦𝑥+ (𝑠𝑦𝑥 𝑠𝑥2)

2

𝑠𝑥2]

=1 − 𝑓

𝑛 (𝑠𝑦2−𝑠𝑦𝑥2 𝑠𝑥2)

=1 − 𝑓

𝑛 (𝑠𝑦2−𝜌2𝑠𝑥2𝑠𝑦2 𝑠𝑥2 )

=1 − 𝑓

𝑛 (𝑠𝑦2− 𝜌2𝑠𝑦2) 𝑣(𝑦̅𝑙𝑟) =(1 − 𝑓)

𝑛 𝑠𝑦2(1 − 𝜌2) Keterangan:

𝑠𝑦= √ 1

𝑛 − 1∑(𝑦𝑖− 𝑦̅)2

𝑛

𝑖=1

𝑠𝑥= √ 1

𝑛 − 1∑(𝑥𝑖− 𝑥̅)2

𝑛

𝑖=1

𝑠𝑦𝑥= 1

𝑛 − 1∑(𝑦𝑖− 𝑦̅)(𝑥𝑖− 𝑥̅)

𝑛

𝑖=1

𝜌 = ∑(𝑦𝑖− 𝑦̅)(𝑥𝑖− 𝑥̅)

√(∑(𝑦𝑖− 𝑦̅)2)(∑(𝑥𝑖− 𝑥̅)2)

Soal Latihan 3:

Dalam rangka Praktik Kerja Lapangan, mahasiswa Tingkat 3 STIS melakukan penelitian kondisi kesehatan masyarakat di suatu wilayah. Dari hasil pemutakhiran (updating) rumah tangga yang dilakukan secara sensus (complete enumeration) di blok sensus terpilih diperoleh informasi bahwa jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu sebanyak 248 orang. Dari populasi eligible rumah tangga sebanyak 120 rumah tangga yang diperoleh dari hasil pemutakhiran, diambil sampel sebanyak 10 rumah tangga secara SRS WOR untuk dilakukan pencacahan yang lebih rinci. Data yang diperoleh:

(6)

adhikurnia22@gmail.com 5

No urut ruta sampel 1 2 3 4 5 6 7 8 9 10

Jumlah ART mengalami keluhan

(hasil updating) 3 0 3 0 3 0 2 4 4 1

Jumlah ART mengalami keluhan

(hasil pencacahan) 4 1 4 1 3 1 2 4 4 1

Dengan menggunakan penduga regresi (regression estimator), perkirakan jumlah penduduk yang mengalami keluhan kesehatan selama sebulan yang lalu beserta standar error, rse, dan 95% Confidence Interval-nya !.

Interpretasikan hasil yang diperoleh.

Soal Latihan 4:

Untuk meneliti kondisi pendidikan para penyandang cacat, dilakukan suatu survei disabilitas di pulau Jawa. Dari 118 kabupaten/kota diambil sampel sebanyak 30 kabupaten/kota secara SRS WOR, kemudian dilakukan pencacahan ke semua Sekolah Luar Biasa (SLB) yang ada di kabupaten/kota terpilih. Untuk setiap SLB yang dikunjungi, dilakukan tes terhadap para penyandang cacat yang belajar di sekolah tersebut. Misalkan, 𝑥𝑖

merupakan jumlah guru yang mengajar di SLB untuk kabupaten/kota ke-i, 𝑦𝑖 merupakan jumlah penyandang cacat yang nilai tesnya berada di atas standar nilai minimal yang ditetapkan. Ringkasan data yang diperoleh sebagai berikut:

∑ 𝑥𝑖= 225

𝑛

𝑖=1

, ∑ 𝑦𝑖= 1127

𝑛

𝑖=1

, ∑ 𝑥𝑖𝑦𝑖= 14977

𝑛

𝑖=1

, ∑ 𝑥𝑖2= 3005

𝑛

𝑖=1

, ∑ 𝑦𝑖2= 75281

𝑛

Dengan regression estimator, perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di atas 𝑖=1

standar minimal beserta standar error, RSE, dan 95% Confidence Interval-nya ! Jika penarikan sampel secara PPS WR

Estimasi total:

𝑌̂𝑙𝑟(𝑝𝑝𝑠)= 𝑌̂𝑝𝑝𝑠+ 𝑏(𝑋 − 𝑋̂𝑝𝑝𝑠)

𝑣(𝑌̂𝑙𝑟(𝑝𝑝𝑠)) = 𝑣(𝑌̂𝑝𝑝𝑠) − 2𝑏 𝑐𝑜𝑣(𝑋̂𝑝𝑝𝑠, 𝑌̂𝑝𝑝𝑠) + 𝑏2𝑣(𝑋̂𝑝𝑝𝑠)

= 𝑣(𝑌̂𝑝𝑝𝑠)[1 − 𝜌2] Estimasi rata-rata:

𝑦̅𝑙𝑟(𝑝𝑝𝑠)=𝑌̂𝑙𝑟(𝑝𝑝𝑠) 𝑁

𝑣(𝑌̂𝑙𝑟(𝑝𝑝𝑠)) =𝑣(𝑌̂𝑙𝑟(𝑝𝑝𝑠)) 𝑁2 Keterangan:

𝑌̂𝑝𝑝𝑠 =1 𝑛∑𝑦𝑖

𝑝𝑖=1 𝑛∑𝑍𝑦𝑖

𝑍𝑖

𝑛

𝑖=1 𝑛

𝑖=1

𝑋̂𝑝𝑝𝑠=1 𝑛∑𝑥𝑖

𝑝𝑖

=1 𝑛∑𝑍𝑥𝑖

𝑍𝑖 𝑛

𝑖=1 𝑛

𝑖=1

𝑝𝑖=𝑍𝑖

𝑍

𝑍 merupakan nilai dari variabel pendukung yang digunakan sebagai size (dasar peluang) dalam pengambilan sampel secara PPS

𝑋 merupakan variabel pendukung yang digunakan pada tahap estimasi regresi.

𝑏 =

∑ (𝑦𝑖

𝑝𝑖− 𝑌̂𝑝𝑝𝑠) (𝑥𝑖

𝑝𝑖− 𝑋̂𝑝𝑝𝑠)

∑ (𝑥𝑖

𝑝𝑖− 𝑋̂𝑝𝑝𝑠)2

(7)

adhikurnia22@gmail.com 6 𝜌 =

∑ (𝑦𝑖

𝑝𝑖− 𝑌̂𝑝𝑝𝑠) (𝑥𝑖

𝑝𝑖− 𝑋̂𝑝𝑝𝑠)

√(∑ (𝑥𝑖

𝑝𝑖− 𝑋̂𝑝𝑝𝑠)2) (∑ (𝑦𝑖

𝑝𝑖− 𝑌̂𝑝𝑝𝑠)2) Soal Latihan 5:

Berdasarkan hasil pencacahan Potensi Desa (Podes) 2011, jumlah tindak kriminalitas di suatu kecamatan mencapai 775 kasus. Suatu survei dilakukan di kecamatan tersebut pada akhir tahun 2012 dengan mengambil sampel sebanyak 12 desa dari 30 desa secara PPS WR dengan size jumlah rumah tangga. Jumlah rumah tangga di kecamatan tersebut sebanyak 69.875 rumah tangga. Dari setiap desa terpilih diteliti jumlah kasus kriminalitas yang terjadi selama tahun 2012.

No Jumlah ruta

Jumlah Kriminalitas 2011

(Podes) 2012 (survei)

1 1750 19 14

2 1500 16 9

3 2625 28 21

4 2000 28 14

5 3000 24 21

6 1000 6 9

7 3000 38 21

8 1250 12 10

9 3625 38 29

10 3250 48 26

11 3875 35 31

12 1000 8 7

a. Perkirakan total tindak kriminalitas di kecamatan tsb tahun 2012 dengan estimasi PPS beserta standar error, RSE, dan 95% Confidence interval-nya!

b. Jika jumlah tindak kriminalitas tahun 2011 dijadikan sebagai auxiliarry variable, perkirakan total kasus kriminalitas yang terjadi di kecamatan tsb pada tahun 2012 dengan estimasi regresi beserta standar error, RSE, dan 95% Confidence interval-nya !

c. Hitung relative efficiency estimasi regresi terhadap estimasi PPS ! d. Interpretasikan hasil yang diperoleh

Bias dari estimasi regresi

Regression estimator merupakan penduga yang bias karena:

– 𝛽 adalah merupakan nilai rasio dari dua buah nilai estimasi c𝑜𝑣(𝑦̅, 𝑥̅)dan 𝑉(𝑥̅) – mengandung perkalian dua buah nilai estimasi, yaitu 𝑏𝑥̅

Estimasi regresi merupakan penduga yang bias konsisten, artinya semakin besar jumlah sampel maka biasnya akan semakin kecil. Bias dari estimasi regresi akan bernilai nol jika joint distribution dari 𝑦 dan 𝑥 mengikuti distribusi bivariate normal. Bias dari 𝑦̅𝑙𝑟 bisa diapproksimasi dengan rumus:

𝐵(𝑦̅𝑙𝑟) = −𝑐𝑜𝑣(𝑥̅, 𝑏) Bukti:

Terlebih dahulu kita definisikan:

𝑒 =𝑦̅ − 𝑌̅

𝑌̅ , 𝑒1=𝑥̅ − 𝑋̅

𝑋̅ , 𝑒2=𝑏 − 𝛽 𝛽

𝑦̅ = 𝑌̅(1 + 𝑒), 𝑥̅ = 𝑋̅(1 + 𝑒1), 𝑏 = 𝛽(1 + 𝑒2) Keterangan: 𝐸(𝑒) = 𝐸(𝑒1) = 𝐸(𝑒2) = 0

Penjabaran dari rumus estimasi regresi:

𝑦̅𝑙𝑟= 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅)

= 𝑌̅(1 + 𝑒) + 𝛽(1 + 𝑒2)[𝑋̅ − 𝑋̅(1 + 𝑒1)]

= 𝑌̅ + (𝑒𝑌̅ − 𝑒1𝛽𝑋̅) − 𝑒1𝑒2𝛽𝑋̅

Bias:

𝐵(𝑦̅𝑙𝑟) = 𝑌̅𝐸(𝑒) − 𝛽𝑋̅𝐸(𝑒1) − 𝛽𝑋̅𝐸(𝑒1𝑒2)

(8)

adhikurnia22@gmail.com 7

= −𝛽𝑋̅𝐸(𝑒1𝑒2) = −𝛽𝑋̅ 𝐸 [(𝑥̅ − 𝑋̅

𝑋̅ ) (𝑏 − 𝛽 𝛽 )]

= −𝐸[(𝑥̅ − 𝑋̅)(𝑏 − 𝛽)] = −𝑐𝑜𝑣(𝑥̅, 𝑏) Soal latihan 6:

Diketahui populasi hipotetis sebagai berikut:

No 𝑥𝑖 𝑦𝑖

1 2 5

2 3 6

3 1 3

4 5 9

5 4 7

Dari populasi di atas diambil sampel sebanyak 2 unit secara SRS WOR. Berdasarkan all possible sample, hitunglah besarnya varians, bias, dan mean square error (MSE) dari 𝑦̅𝑙𝑟 !

Catatan: 𝑦̅𝑙𝑟= 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅)

Perbandingan Estimasi Regresi dengan Estimasi SRS

Secara umum, regression estimator akan selalu lebih efisien daripada estimator rata-rata per unit yang diperoleh dari penghitungan sampel acak sederhana (SRS). Regression estimator akan mempunyai efisiensi yang sama dengan penduga SRS hanya jika variabel 𝑥 dan 𝑦 tidak berkorelasi (𝜌 = 0).

Bukti:

𝑣(𝑦̅𝑙𝑟) 𝑣(𝑦̅) =

1 − 𝑓

𝑛 𝑠𝑦2(1 − 𝜌2) 1 − 𝑓

𝑛 𝑠𝑦2

= (1 − 𝜌2)

Nilai (1 − 𝜌2) akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama efisien dengan penduga regresi hanya jika 𝜌 = 0.

Perbandingan Estimasi Regresi dengan Estimasi Rasio

Secara umum, regression estimator akan lebih efisien daripada ratio estimator. Regression estimator akan mempunyai efisiensi yang sama dengan ratio estimator hanya 𝑏 = 𝑅̂ atau 𝜌 =𝐶𝑥

𝐶𝑦. Bukti:

𝑣(𝑦̅𝑙𝑟) 𝑣(𝑦̅𝑟) =

1 − 𝑓

𝑛 𝑠𝑦2(1 − 𝜌2) 1 − 𝑓

𝑛 (𝑠𝑦2− 2𝜌𝑅̂𝑠𝑦𝑠𝑥+ 𝑅̂2𝑠𝑥2)

=

1 − 𝑓

𝑛 𝑠𝑦2(1 − 𝜌2) 1 − 𝑓

𝑛 𝑠𝑦2(1 − 2𝜌𝑦̅

𝑥̅

𝑠𝑥

𝑠𝑦+ (𝑦̅

𝑥̅)

2

(𝑠𝑥

𝑠𝑦)

2

)

= (1 − 𝜌2) (1 − 2𝜌𝐶𝑥

𝐶𝑦+ (𝐶𝑥

𝐶𝑦)

2

)

= (1 − 𝜌2)

(1 − 2𝜌𝐶𝑥 𝐶𝑦+ (𝐶𝑥

𝐶𝑦)

2

+ 𝜌2− 𝜌2)

= (1 − 𝜌2)

(𝜌2− 2𝜌𝐶𝑥 𝐶𝑦+ (𝐶𝑥

𝐶𝑦)

2

+ 1 − 𝜌2)

= (1 − 𝜌2) ((𝐶𝑥

𝐶𝑦− 𝜌)

2

+ (1 − 𝜌2))

(9)

adhikurnia22@gmail.com 8 𝑣(𝑦̅𝑙𝑟)

𝑣(𝑦̅𝑟) = (1 − 𝜌2) ((𝐶𝑥

𝐶𝑦− 𝜌)

2

+ (1 − 𝜌2))

Persamaan di atas selalu bernilai kurang dari atau sama dengan 1 sehingga secara umum regresi lebih efisien daripada ratio estimator.

Regresi akan sama efisien dengan rasio jika 𝑣(𝑦̅𝑙𝑟)

𝑣(𝑦̅𝑟) = (1 − 𝜌2) ((𝐶𝑥

𝐶𝑦− 𝜌)

2

+ (1 − 𝜌2))

= 1

(1 − 𝜌2) = (𝐶𝑥 𝐶𝑦− 𝜌)

2

+ (1 − 𝜌2)

(𝐶𝑥 𝐶𝑦− 𝜌)

2

= 0 ↔𝐶𝑥

𝐶𝑦− 𝜌 = 0 ↔ 𝝆 =𝑪𝒙 𝑪𝒚 Persamaan 𝝆 =𝑪𝑪𝒙

𝒚 sebagai kondisi di mana ratio sama efisien dengan regresi bisa dinyatakan dalam bentuk lain yaitu:

𝝆 =𝑪𝒙

𝑪𝒚 𝑠𝑦𝑥

𝑠𝑥𝑠𝑦= 𝑠𝑥

⁄𝑥̅

𝑠𝑦

⁄𝑦̅

↔ 𝑠𝑦𝑥

𝑠𝑥𝑠𝑦=𝑠𝑥

𝑠𝑦 𝑦̅

𝑥̅

𝑠𝑦𝑥

𝑠𝑥2 =𝑦̅

𝑥̅

𝒃 = 𝑹̂ Soal Latihan 7:

Sebuah random sampel sebanyak 20 hotel diambil secara SRS WOR dari populasi sebanyak 80 hotel di suatu kota. Data yang dikumpulkan adalah jumlah kamar dan jumlah pengunjung hotel tersebut selama sebulan yang lalu. Dari hasil pendataan lengkap tahun lalu, diketahui rata-rata jumlah kamar hotel di kota tersebut sebanyak 64 kamar per hotel.

Data yang diperoleh dari survei sebagai berikut:

No Jumlah

kamar Jumlah

pengunjung No Jumlah

kamar Jumlah pengunjung

1 20 377 11 60 1428

2 10 250 12 50 840

3 30 636 13 30 526

4 40 824 14 80 1220

5 20 560 15 50 1275

6 15 348 16 30 752

7 25 520 17 40 810

8 30 696 18 90 1743

9 20 320 19 60 1270

10 20 548 20 70 857

(10)

adhikurnia22@gmail.com 9 a. Perkirakan jumlah pengunjung hotel di kota tersebut dengan penduga sampel acak sederhana (SRS)

beserta standar error dan RSE-nya

b. Perkirakan jumlah pengunjung hotel di kota tersebut dengan penduga rasio beserta standar error dan RSE-nya

c. Perkirakan jumlah pengunjung hotel di kota tersebut dengan penduga regresi beserta standar error dan RSE-nya

d. Bandingkan efisiensi dari ketiga metode tersebut.

Estimasi Regresi Pada Desain Stratified Sampling

Di dalam desain stratified sampling, populasi sebanyak 𝑁 unit dikelompokkan menjadi beberapa strata sehingga setiap strata memuat populasi sebanyak 𝑁 unit, kemudian dari setiap strata diambil random sampel sebanyak 𝑛 unit secara independen. Untuk desain ini, perkiraan nilai rata-rata dan total karakteristik 𝑦 dengan menggunakan estimasi regresi juga dapat dilakukan. Ada 2 metode yang bisa digunakan yaitu separate regression estimator dan combined regression estimator.

1. Separate Regression Estimator

Dalam metode ini penghitungan estimasi koefisien regresi dilakukan terpisah untuk masing-masing strata.

Misalkan populasi sebanyak 𝑁 dikelompokkan menjadi 3 strata (𝑁1, 𝑁2, 𝑁3) maka setiap strata akan mempunyai nilai estimasi koefisien regresi yang berbeda. Koefisien regresi ini dihitung dari nilai karakteristik 𝑦 dan 𝑥 yang berasal dari data sampel pada strata tersebut. Separate regression estimator akan tepat digunakan jika true regression coefficient (𝛽) nilainya bervariasi antarstrata dan jumlah sampel untuk setiap strata (𝑛) relatif besar.

Estimasi koefisien regresi untuk masing-masing strata

𝑏=𝑐𝑜𝑣(𝑦̅, 𝑥̅) 𝑣(𝑥̅)

Jika penarikan sampel secara SRS maka:

𝑏=𝑠𝑦𝑥

𝑠𝑥2 =∑𝑛𝑖=1(𝑦ℎ𝑖− 𝑦̅)(𝑥ℎ𝑖− 𝑥̅)

𝑛𝑖=1(𝑥ℎ𝑖− 𝑥̅)2

Estimasi rata-rata karakteristik di strata ke-h 𝑦̅𝑙𝑟ℎ= 𝑦̅+ 𝑏(𝑋̅− 𝑥̅)

Varians strata:

𝑣(𝑦̅𝑙𝑟ℎ) =1 − 𝑓

𝑛 (𝑠𝑦ℎ2 − 2𝑏𝑠𝑦𝑥+ 𝑏2𝑠𝑥2)

Estimasi rata-rata karakteristik populasi dirumuskan:

𝑦̅𝑙𝑟𝑠= ∑ 𝑊𝑦̅𝑙𝑟ℎ 𝐿

ℎ=1

Rumus di atas dapat dijabarkan menjadi:

𝑦̅𝑙𝑟𝑠= ∑𝑁 𝑁 𝑦̅𝑙𝑟ℎ 𝐿

ℎ=1

= 1

𝑁[∑ 𝑌̂+ 𝑏(𝑋− 𝑋̂)

𝐿

ℎ=1

] = 1

𝑁∑ 𝑌̂𝑙𝑟ℎ=

𝐿

ℎ=1

𝑌̂𝑙𝑟𝑠 𝑁 Varians :

𝑣(𝑦̅𝑙𝑟𝑠) = ∑ 𝑊2 𝑣(𝑦̅𝑙𝑟ℎ)

𝐿

ℎ=1

= ∑𝑊2(1 − 𝑓)

𝑛 (𝑠𝑦ℎ2 − 2𝑏𝑠𝑦𝑥+ 𝑏2𝑠𝑥2)

𝐿

ℎ=1

(11)

adhikurnia22@gmail.com 10 Estimasi total karakteristik populasi

𝑌̂𝑙𝑟𝑠 = 𝑁𝑦̅𝑙𝑟𝑠 = ∑ 𝑌̂𝑙𝑟ℎ 𝐿

ℎ=1

Varians :

𝑣(𝑌̂𝑙𝑟𝑠) = 𝑁2 𝑣(𝑦̅𝑙𝑟𝑠) = ∑ 𝑣(𝑌̂𝑙𝑟ℎ)

𝐿

ℎ=1

= ∑ 𝑁2 𝑣(𝑦̅𝑙𝑟ℎ)

𝐿

ℎ=1

= ∑𝑁2(1 − 𝑓)

𝑛 (𝑠𝑦ℎ2 − 2𝑏𝑠𝑦𝑥+ 𝑏2𝑠𝑥2)

𝐿

ℎ=1

Soal Latihan 8:

Untuk mengetahui dampak krisis Eropa 2012 terhadap industri tekstil, diadakan Survei Deteksi Dini Dampak Krisis terhadap Industri Tekstil dan Pengolahan Tekstil (TPT) di salah satu provinsi di Indonesia. Populasi industri TPT di provinsi tersebut dikelompokkan menjadi 2 strata:

Strata 1: Industri TPT yang berorientasi pasar ekspor Strata 2: Industri TPT yang berorientasi pasar domestik.

Untuk strata 1 dilakukan pendataan secara sensus karena populasi industri TPT yang berorientasi pasar ekspor jumlahnya kecil, tetapi diperkirakan industri ini berpotensi terkena dampak yang lebih besar dari adanya krisis.

Untuk strata 2 dilakukan survei dengan pengambilan sampel secara SRS WOR. Data yang diperoleh sebagai berikut:

Strata

Populasi Sampel

Jumlah Industri

Nilai Output

2011 Tahun

Nilai Output (juta Rp) Sampel

1 Sampel

2 Sampel

3 Sampel

4 Sampel

5 Sampel

6 Sampel

7 Sampel 8

1 4 352 2011 96 64 120 72

2012 84 72 114 60

2 20 348 2011 16 24 8 12 4 32 28 12

2012 15 20 10 9 4 36 30 8

a. Dengan menggunakan metode separate regression estimator, perkirakan nilai rata-rata dan total output tahun 2012 beserta standar error, RSE dan 95% Confidence Interval-nya.

b. Interpretasikan hasil yang diperoleh ! 2. Combined Regression Estimator

Dalam metode ini, estimasi koefisien regresi diperoleh dari nilai karakteristik 𝑦 dan 𝑥 untuk keseluruhan sampel. Metode ini tepat digunakan jika true regression coefficient (𝛽) diasumsikan sama untuk semua strata.

Sebelum melakukan penghitungan combined regression coefficient, terlebih dahulu dihitung nilai estimasi rata- rata atau estimasi total karakteristik 𝑦 dan 𝑥 beserta varians dan covariansnya berdasarkan desain stratified sampling. Jika penarikan sampel secara SRS WOR, estimasi rata-rata karakteristik 𝑦 dan 𝑥 dirumuskan:

𝑦̅𝑠𝑡= ∑ 𝑊𝑦̅ 𝐿

ℎ=1

, 𝑥̅𝑠𝑡= ∑ 𝑊𝑥̅ 𝐿

ℎ=1

Sampling variance dan sampling covariance:

𝑣(𝑦̅𝑠𝑡) = ∑ 𝑊2(1 − 𝑓) 𝑛 𝐿

ℎ=1

𝑠𝑦ℎ2

𝑣(𝑥̅𝑠𝑡) = ∑ 𝑊2(1 − 𝑓) 𝑛

𝐿

ℎ=1

𝑠𝑥ℎ2

(12)

adhikurnia22@gmail.com 11 𝑐𝑜𝑣(𝑦̅𝑠𝑡, 𝑥̅𝑠𝑡) = ∑ 𝑊2

𝐿

ℎ=1

(1 − 𝑓) 𝑛 𝑠𝑦𝑥ℎ Estimasi combined regression coefficient

𝑏𝑐=𝑐𝑜𝑣(𝑦̅𝑠𝑡, 𝑥̅𝑠𝑡) 𝑣(𝑥̅𝑠𝑡)

Estimasi rata-rata karakteristik 𝑦̅𝑙𝑟𝑐 = 𝑦̅𝑠𝑡+ 𝑏𝑐(𝑋̅ − 𝑥̅𝑠𝑡) Unbiased sampling variance:

𝑣(𝑦̅𝑙𝑟𝑠) = ∑𝑊2(1 − 𝑓)

𝑛 (𝑠𝑦ℎ2 − 2𝑏𝑐𝑠𝑦𝑥+ 𝑏𝑐2𝑠𝑥2)

𝐿

ℎ=1

Estimasi total karakteristik 𝑌̂𝑙𝑟𝑐 = 𝑁𝑦̅𝑙𝑟𝑐

Unbiased sampling variance:

𝑣(𝑌̂𝑙𝑟𝑐) = 𝑁2 𝑣(𝑦̅𝑙𝑟𝑐) Soal Latihan 9:

Suatu survei stratified random sampling dilakukan di suatu desa untuk mengetahui pengeluaran untuk bidang pendidikan di desa tersebut. RW dianggap sebagai strata dan setiap RW diambil sampel sebanyak 8 rumah tangga. Data yang diperoleh:

Strata

Populasi Sampel

Ruta Penduduk Variabel Ruta

1 Ruta

2 Ruta

3 Ruta

4 Ruta

5 Ruta

6 Ruta

7 Ruta 8

RW 1 62 210

Pengeluaran

(000 rupiah) 1000 1250 1400 1325 1174 1100 1450 1549 ART usia

sekolah 2 2 3 2 1 3 4 2

RW 2 90 288

Pengeluaran

(000 rupiah) 2250 1846 2094 2400 2350 1975 2000 2125 ART usia

sekolah 3 1 2 2 3 1 2 4

RW 3 88 352

Pengeluaran

(000 rupiah) 1500 1650 1742 1725 1792 1575 1850 1450 ART usia

sekolah 3 4 4 3 4 2 5 1

Jika diketahui proporsi penduduk usia sekolah di desa tersebut sebesar 44%, maka:

a. Perkirakan pengeluaran rata-rata per rumah tangga di desa tsb beserta standar error, RSE, dan 95%CI- nya dengan metode combined regression estimator.

b. Perkirakan pengeluaran total di desa tsb beserta standar error, RSE, dan 95%CI-nya dengan metode combined regression estimator.

Perbandingan Separate Regression Estimator dan Combined Regression Estimator

Dalam praktiknya, tidak ada aturan yang pasti apakah separate atau combined yang lebih baik (lebih akurat) untuk digunakan pada kondisi tertentu. Konsekuensi dari separate regression estimator adalah biasnya akan besar jika jumlah sampel dalam tiap strata kecil, sedangkan penggunaan combined regression estimator akan

(13)

adhikurnia22@gmail.com 12 menghasilkan varians yang besar jika koefisien regresi populasi tiap strata (𝛽) berbeda antarstrata. Beberapa pertimbangan dalam pemilihan metode estimasi regresi dalam desain stratified sampling dapat dirinci sebagai berikut:

› Jika garis regresi adalah linear dan 𝛽 diperkirakan sama untuk semua strata, combined regression estimator lebih direkomendasikan.

› Jika garis regresi adalah linear (sehingga nilai bias diperkirakan kecil)dan 𝛽 berbeda antarstrata, separate regression estimator lebih baik untuk digunakan.

› Jika garis regresi cenderung curvilinear (agak melengkung) lebih baik menggunakan combined regression estimator , kecuali jika jumlah sampel di setiap strata besar.

Soal Latihan 10:

Dari all possible sample, bandingkan mean square error (MSE) dari separate dan combined regression estimator untuk total 𝑌 dari populasi di bawah ini jika dilakukan pengambilan sampel secara SRS WOR sebanyak 𝑛= 2.

Untuk setiap metode, hitunglah besarnya relatif bias terhadap MSE !

Strata 1 Strata 2

𝑥1𝑖 𝑦1𝑖 𝑥2𝑖 𝑦2𝑖

3 0 4 7

5 2 6 13

7 4 8 15

Bivariate Regression Estimator

Dua atau lebih variabel pendukung dapat dikaji untuk menghasilkan estimasi regresi yang lebih efisien. Bivariate Regression Estimator adalah penduga regresi yang memanfaatkan dua variabel pendukung untuk memaksimalkan ketelitian dari estimasi nilai karakteristik yang diteliti. Misalkan 𝑦̅ adalah estimasi rata-rata dari variabel 𝑦 yang diteliti, 𝑥̅𝑘 adalah penduga yang tidak bias dari rata-rata populasi 𝑋̅𝑘, dan bk adalah koefisien regresi dari y pada 𝑥𝑘, di mana k=1,2. Formulasi untuk estimasi adalah

𝑦̅𝐵𝑅= 𝑤1𝑦̅𝑙𝑟1+ 𝑤2𝑦̅𝑙𝑟2

= 𝑦̅ + 𝑤1𝑏1(𝑋̅1− 𝑥̅1) + 𝑤2𝑏2(𝑋̅2− 𝑥̅2) Unbiased sampling varians:

𝑣(𝑦̅𝐵𝑅) = 𝑤12𝑣(𝑦̅𝑙𝑟1) + 𝑤22𝑣(𝑦̅𝑙𝑟2) + 2𝑤1𝑤2𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2)

= 𝑣(𝑦̅) + 𝑤12𝑏12𝑣(𝑥̅1) + 𝑤22𝑏22𝑣(𝑥̅2) − 2𝑤1𝑏1𝑐𝑜𝑣(𝑦̅, 𝑥̅1) − 2𝑤2𝑏2𝑐𝑜𝑣(𝑦̅, 𝑥̅2) + 2𝑤1𝑤2𝑏1𝑏2𝑐𝑜𝑣(𝑥̅1, 𝑥̅2) Dengan substitusi 𝑤2= 1 − 𝑤1 dalam rumus varians di atas, kemudian melakukan diferensiasi terhadap 𝑤1

dan mempersamakan hasilnya dengan nol, didapatkan penimbang yang akan meminimumkan varians, yaitu:

𝑤1= 𝑣(𝑦̅𝑙𝑟2) − 𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2) 𝑣(𝑦̅𝑙𝑟1) + 𝑣(𝑦̅𝑙𝑟2) − 2𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2)

𝑤2= 𝑣(𝑦̅𝑙𝑟1) − 𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2) 𝑣(𝑦̅𝑙𝑟1) + 𝑣(𝑦̅𝑙𝑟2) − 2𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2) Keterangan:

𝑣(𝑦̅𝑙𝑟1) = 𝑣(𝑦̅) − 2𝑏1𝑐𝑜𝑣(𝑦̅, 𝑥̅1) + 𝑏12𝑣(𝑥̅1) 𝑣(𝑦̅𝑙𝑟2) = 𝑣(𝑦̅) − 2𝑏2𝑐𝑜𝑣(𝑦̅, 𝑥̅2) + 𝑏22𝑣(𝑥̅2)

𝑐𝑜𝑣(𝑦̅𝑙𝑟1, 𝑦̅𝑙𝑟2) = 𝑣(𝑦̅) − 𝑏1𝑐𝑜𝑣(𝑦̅, 𝑥̅1) − 𝑏2𝑐𝑜𝑣(𝑦̅, 𝑥̅2) + 𝑏1𝑏2𝑐𝑜𝑣(𝑥̅1, 𝑥̅2)

(14)

adhikurnia22@gmail.com 13 Soal Latihan 11:

Berikut ini adalah data yang diperoleh dari penarikan sampel industri kerajinan rumah tangga di suatu kecamatan.

No Tenaga kerja Input Output

1 2 12 14

2 3 14 14

3 5 15 24

4 4 15 16

5 2 10 10

6 3 12 15

7 4 10 11

8 1 12 16

Jika sampel di atas diambil secara SRS WOR dari populasi N=64 industri dan diketahui jumlah tenaga kerja industri kerajinan rumah tangga di kecamatan tersebut sebanyak 264 orang, serta jumlah input industri kerajinan rumah tangga sebanyak 1200, maka:

a. Perkirakan rata-rata output dengan metode regression estimator berdasarkan variabel pendukung jumlah tenaga kerja, beserta standar error, dan RSE-nya.

b. Perkirakan rata-rata output dengan metode regression estimator berdasarkan variabel pendukung jumlah input, beserta standar error, dan RSE-nya.

c. Perkirakan rata-rata output dengan metode bivariate regression estimator berdasarkan variabel pendukung jumlah tenaga kerja dan jumlah input, beserta standar error, dan RSE-nya.

d. Bandingkan efisiensi dari ketiga metode di atas.

Penghitungan Estimasi Regresi dengan SPSS Bentuk lain dari varians regression estimator:

𝑣(𝑦̅) =1 − 𝑓

𝑛 𝑠𝑦2(1 − 𝜌2) =1 − 𝑓

𝑛 (𝑠𝑦2− 𝑠𝑦2𝜌2)

=1 − 𝑓

𝑛 (𝑠𝑦2− 𝑠𝑦2 𝑠𝑦𝑥2

𝑠𝑦2𝑠𝑥2) =1 − 𝑓

𝑛 (𝑠𝑦2−𝑠𝑦𝑥2

𝑠𝑥2)

=1 − 𝑓

𝑛 (𝑠𝑦2− 𝑏𝑠𝑦𝑥) = 1 − 𝑓

𝑛(𝑛 − 1)(∑(𝒚𝒊− 𝒚̅)𝟐− 𝒃 ∑(𝒚𝒊− 𝒚̅)(𝒙𝒊− 𝒙̅)

𝒏

𝒊=𝟏 𝒏

𝒊=𝟏

)

= 1 − 𝑓

𝑛(𝑛 − 1)∑[(𝒚𝒊− 𝒚̅) − 𝒃(𝒙𝒊− 𝒙̅)]𝟐

𝒏

𝒊=𝟏

= 1 − 𝑓

𝑛(𝑛 − 1)∙ 𝑺𝑺𝑹𝒆𝒔 Keterangan:

𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝒆𝒊= (𝒚𝒊− 𝒚̅) − 𝒃(𝒙𝒊− 𝒙̅)

𝑆𝑢𝑚 𝑂𝑓 𝑆𝑞𝑢𝑎𝑟𝑒 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝑆𝑆𝑅𝑒𝑠 = ∑[(𝒚𝒊− 𝒚̅) − 𝒃(𝒙𝒊− 𝒙̅)]𝟐

𝒏

𝒊=𝟏

Contoh:

Sebuah pengamatan dilakukan terhadap 100 lahan yang ditanami pohon cabai merah di suatu desa. Dari hasil pengamatan dengan eye estimate diperoleh total produksi dari 100 lahan tersebut sebanyak 12500 kg. Sebuah random sampel sebanyak 10 lahan diambil secara SRS WOR dan setiap lahan terpilih dilakukan pemanenan cabai merah dan selanjutnya dilakukan pengukuran terhadap berat dari cabai yang dihasilkan. Data produksi cabai

(15)

adhikurnia22@gmail.com 14 (kg) dari lahan terpilih yang diperoleh dari hasil pengamatan (eye estimate) dan hasil pengukuran sebagai berikut:

No 1 2 3 4 5 6 7 8 9 10

Produksi

(pengukuran) 51 42 46 39 71 61 58 57 58 67

Produksi

(pengamatan) 56 47 48 40 78 59 52 58 55 67

Perkirakan rata-rata produksi cabai tiap lahan dan total produksi cabai merah di desa tersebut dengan menggunakan regression estimator beserta standar error-nya !

Penyelesaian dengan SPSS:

Syntax SPSS REGRESSION /MISSING LISTWISE

/STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN

/DEPENDENT Produksi_pengukuran /METHOD=ENTER Produksi_pengamatan.

Output SPSS berdasarkan syntax di atas

Koefisien korelasi (𝝆)

Koefisien regresi (𝒃)

𝒚

̅ − 𝒃𝒙̅ SSRes

(16)

adhikurnia22@gmail.com 15 Berdasarkan output SPSS tersebut, dapat dihitung estimasi rata-rata dan total produksi cabai yaitu:

Estimasi rata-rata 𝑦̅𝑙𝑟= 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅)

= 𝑦̅ + 𝑏𝑋̅ − 𝑏𝑥̅

= 𝑦̅ − 𝑏𝑥̅ + 𝑏𝑋̅

= 4,405 + 0,903 × 125

= 117,28 𝑣(𝑦̅𝑙𝑟) = 1 − 𝑓

𝑛(𝑛 − 1)× 𝑆𝑆𝑅𝑒𝑠

= 1 − 0,1

10(10 − 1)× 134,347

= 1,34347 𝑠𝑒(𝑦̅𝑙𝑟) = 1,15908 Estimasi total 𝑌̂𝑙𝑟 = 𝑁𝑦̅𝑙𝑟

= 100 × 117,28

= 11.728 𝑣(𝑌̂𝑙𝑟) = 𝑁2𝑣(𝑦̅𝑙𝑟)

= 1002× 1,34347

= 13.434,7 𝑠𝑒(𝑌̂𝑙𝑟) = 115,908

Referensi

Dokumen terkait

(iii) Fraksi sampling rumah tangga merupakan hasil bagi antara banyaknya sampel rumah tangga di blok sensus j desa i pada strata h (mhij) dengan banyaknya rumah tangga

Estimasi total karakteristik Y berdasarkan hasil pencacahan sampel rumah tanggaMisalkan Yhij adalah nilai karakteristik Y hasil rumah tangga pada terpilih ke-j pada blok sensus

Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari

Pelaksanaan pencacahan rumah tangga dilakukan oleh Pencacah berdasarkan identitas rumah tangga sampel pada VSEN2010.DSRT, maupun SP2010-L1, dan sketsa peta blok sensus, dengan cara:

Apabila rumah tangga terpilih benar-benar tidak dapat ditemui saat pencacahan, maka penggantian rumah tangga sampel dapat dilakukan dengan rumah tangga dari kelompok pengeluaran

Pemutakhiran nomor urut sampel rumah tangga Panel [Isikan “00” jika bukan sampel rumah tangga Panel, dan lanjutkan ke Rincian 11]2. 10 Jika isian Rincian 8 tidak sama dengan

Dengan menggunakan sampel hasil penarikan sampel acak sederhana (SRS), penaksir GREG menghasilkan nilai estimasi yang lebih mendekati terhadap total populasi sebenarnya dengan nilai

= persentase penduduk usia 10 tahun ke atas yang tidak bisa baca tulis huruf. = persentase rumah tangga yang status rumah yang ditempati bukan milik