Tugas 5 Komputasi Statistika Bootstrapping dan Jackknife
Tugas ini dikerjakan per kelompok. Masing-masing individu harus terlibat dalam mengerjakan tugas ini. Tuliskan semua nama dan NIM. Tidak diperbolehkan copy-paste jawaban dari kelompok lain.
Gunakan set.seed(2019).
1. Apakah pria mengalami lebih banyak risiko fisik di hadapan seorang wanita yang menarik? Dua psikolog di Australia melakukan percobaan untuk mengeksplorasi pertanyaan ini (Ronay dan von Hippel (2009)). Pemain skateboard pria berusia antara 18 dan 35 tahun secara acak ditugaskan untuk melakukan trik di hadapan penonton perempuan berusia 18 tahun yang menarik dan penonton laki-laki berusia 18 tahun. Kedua peneliti merekam sesi ini. Pada akhir percobaan, para peneliti mengumpulkan sampel air liur dari para peserta dan mengukur kadar testosteron. Pada pria dewasa normal, kadar testosteron berkisar 270 hingga 1070 nanogram per desiliter (ng / dl).
Dari penelitian ini, rata-rata (sd) tingkat testosteron dari 49 pria yang bermain skateboard di depan perempuan adalah 295.95 (143.69) ng / dl dan 212.88 (101.62) ng / dl bagi 22 pria yang bermain skateboard di depan laki=laki. Apakah perbedaan dua rata-rata kadar testosteron 83,07 ng / dl signifikan secara statistik? Buat bootstrap interval kepercayaan 95% bagi beda dua rata- rata untuk menjawab pertanyaan tersebut.
> Skateboard <- read.csv(file="C:/data/Skateboard.csv")
> str(Skateboard)
'data.frame': 71 obs. of 3 variables:
$ Age : int 18 18 18 18 19 19 18 18 18 19 ...
$ Experimenter: Factor w/ 2 levels "Female","Male": 1 1 1 1 1 1 1 1 1 1 ...
$ Testosterone: num 206 197 136 170 107 ...
> head(Skateboard, n=3)
Age Experimenter Testosterone 1 18 Female 206.0 2 18 Female 197.0 3 18 Female 135.8
2. Kumpulan data FishMercury mengandung kadar merkuri (bagian per juta) untuk 30 ikan yang ditangkap di danau di Minnesota.
a) Buat histogram atau boxplot dari data tersebut. Jelaskan apa yang diamati?
b) Buat bootstrap interval kepercayaan 95% bagi rata-rata dan berikan interpretasi.
> FishMercury <- read.csv(file="C:/data/FishMercury.csv")
> str(FishMercury)
'data.frame': 30 obs. of 1 variable:
$ Mercury: num 1.87 0.16 0.088 0.16 0.145 0.099 0.101 0.18 0.187 0.097 ...
> head(FishMercury,n=3) Mercury
1 1.870 2 0.160 3 0.088
3. Dari data nc.csv.
(a) Buat tabel kontingensi lowbirthweight vs habit.
(b) Buat bootstrap interval kepercayaan 95% bagi beda dua proporsi bayi berat lahir rendah (lowbirthweight) yang lahir dari ibu yang bukan perokok dan perokok. Berikan interpretasinya.
1
> nc <- read.csv(file="C:/data/nc.csv")
> str(nc)
'data.frame': 1000 obs. of 13 variables:
$ fage : int NA NA 19 21 NA NA 18 17 NA 20 ...
$ mage : int 13 14 15 15 15 15 15 15 16 16 ...
$ mature : Factor w/ 2 levels "mature mom","younger mom": 2 2 2 2 2 2 2 2 2 2 ...
$ weeks : int 39 42 37 41 39 38 37 35 38 37 ...
$ premie : Factor w/ 2 levels "full term","premie": 1 1 1 1 1 1 1 2 1 1 ...
$ visits : int 10 15 11 6 9 19 12 5 9 13 ...
$ marital : Factor w/ 2 levels "married","not married": 1 1 1 1 1 1 1 1 1 1 ...
$ gained : int 38 20 38 34 27 22 76 15 NA 52 ...
$ weight : num 7.63 7.88 6.63 8 6.38 5.38 8.44 4.69 8.81 6.94 ...
$ lowbirthweight: Factor w/ 2 levels "low","not low": 2 2 2 2 2 1 2 1 2 2 ...
$ gender : Factor w/ 2 levels "female","male": 2 2 1 2 1 2 2 2 2 1 ...
$ habit : Factor w/ 2 levels "nonsmoker","smoker": 1 1 1 1 1 1 1 1 1 1 ...
$ whitemom : Factor w/ 2 levels "not white","white": 1 1 2 2 1 1 1 1 2 2 ...
> head(nc,n=3)
fage mage mature weeks premie visits marital gained weight lowbirthweight gender habit whitemom 1 NA 13 younger mom 39 full term 10 married 38 7.63 not low male nonsmoker not white 2 NA 14 younger mom 42 full term 15 married 20 7.88 not low male nonsmoker not white 3 19 15 younger mom 37 full term 11 married 38 6.63 not low female nonsmoker white
4. Dari data soal nomor 1.
a) Hitung rata-rata kadar testosteron dengan eksperimenter perempuan dan rata-rata kadar testosteron dengan eksperimenter laki-laki.
b) Tentukan interval kepercayaan 95% bagi rata-rata populasi kadar testosteron dengan eksperimenter perempuan dan interval kepercayaan 95% bagi rata-rata populasi kadar testosteron dengan eksperimenter laki-laki. Berikan interpretasinya.
c) Gunakan metode Jackknife untuk memperoleh θ^jack , bias^
(
θ^)
, s . e(
θ^jack)
, daninterval kepercayaan 95% bagi θ untuk setiap jenis eksperimenter. ( θ=μ ).
d) Bagaimana hasil interval kepercayaan 95% bagi μ dari pendekatan frekuentis dan Jackknife? Jelaskan secara singkat.
2