SELAMAT DATANG SAHABAT VARIANS
MENTORING BIOSTATISTIK SESI 2 KELAS B ( 15 Desember 2023)
FOLLOW US ON INSTAGRAM @varians_id
Materi UAS
SESI 2
Jenis Uji Statistik
Uji Hubungan
1. Rokok (Y/T) - → BBLR (Y/T) 2. Rokok (Y/T) → BBL (gram)
3. Pendidikan ibu (SD, SMP, SMA) → Berat bayi (gram)
4. Jumlah batang rokok (batang) → BBL (gram)
5. Berat badan sebelum (kg) → berat badan sesudah (kg)
Jenis Uji
Chi-Square T Independen
Anova
Korelasi
T dependen
1. Regresi linier Ganda
var dependen = numerik
var independen = numerik dan kategorik
2. Regresi logistik Ganda
var dependen = kategorik
var independen = kategorik dan numerik
ANALISIS MULTIVARIAT
REGRESI LINIER
5
Regresi linier sederhana: (satu var independen)
Y = a + bx
Regresi linier ganda: (lebih dari satu var independen)
Y = a +b
1x
1+ b
2x
2+ …. + b
nx
nRegresi linier digunakan untuk mengetahui pengaruh
variabel independen (x) terhadap variabel dependen (y)
FUNGSI REGRESI LINIER GANDA
6
✔
Menetapkan model matematik yang paling baik utk menggambarkan hubungan var. indep dan var dep.Y= a +b1x1 + b2x2 + …. + bnxn
✔
Menggambarkan hubungan kuantitatif antara var. indep (x) dg var dep (y) setelah dikontrol var. lainSig < 0,05
✔
Mengetahui variabel x yang dominan dlm memprediksi var. dep Standardized Beta✔
Mengetahui adanya interaksi pada dua atau lebih var.independen thd variabel dependen
R2 (Koefisien Determinasi)
→ Seberapa vesar variasi Y dapat dijelaskan oleh variabel X
Keterangan:
Y = variabel dependen a = intercept
b = slope, koefisien dari x x = variabel independen
LANGKAH
1. Melakukan seleksi bivariat
Menghubungkan masing2 independen dengan dependen, bila hasil uji didapatkan p value < 0,25 maka dapat lanjut ke multivariat. Namun kalau ada variabel yang secara substansi penting walaupun p valuenya > 0,25 maka variabel tsb dapat masuk ke multivariat.
2. Memasukkan secara bersamaan seluruh var independen ke model multivariat.
▪ Variabel yang p- valuenya besar dikeluarkan dari model multivariat.
Ketentuannya : variabel yg p valuenya < 0,05 yang dapat tetap di model. Variabel yg p valuenya > 0,05 dikeluarkan dari model satu persatu dimulai dari variabel yg p- valuenya terbesar.
▪ Bila variabel yang dikeluarkan tsb mengakibatkan perubahan besar koefisien (koef B) variabel yg masih ada di model (berubah > 10 %), maka variabel tsb dimasukkan kembali dalam model.
Sebaliknya kalau berubahnya < 10% maka variabel tsb tetap dikeluarkan dari model.
3. Melakukan uji asumsi dan diagnostik regresi linier a. Pengujian asumsi
b. Pengujian Kolinearitas, antar independen terjadi hub yg sangat kuat : r ≥ 0,8. Atau nilai VIF > 10
PEMODELAN REGRESI LINIER GANDA
ASUMSI REGRESI LINIER GANDA
“ HEIL – GAUSS “
▪ Varian nilai variabel Y sama untuk semua nilai variabel X
▪ Homoscedasticity : Plot residual membentuk tebaran merata diatas dan dibawah garis tengah nol
▪ Heteroscedasticity: Tebaran residual mengelompok dibawah/diatas garis tengah nol
▪ Variabel dependen Y merupakan variabel random pada setiap nilai var. independen X.
▪ Sampel diambil random, asumsi ini terpenuhi bila residual menunjukan nilai : mean menghasilkan nilai 0 1. HOMOSCEDASTICITY
2 . EKSISTENSI
▪ Masing-masing var Y bebas satu sama lain, tidak boleh diukur dua kali.
▪ Asumsi terpenuhi : angka Durbin Watson antara -2 s/d 2
▪ Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, dst terletak pada grs linier yg dibentuk persamaan regresi
▪ Asumsi terpenuhi: Hasil Uji Anova regresi hasilnya signifikan (p < 0,05)
▪ Variabel Y berdistribusi normal untuk setiap pengamatan variabel X.
▪ Asumsi terpenuhi bila Grafik Normal P-P plot residual, titik tebarannya menyebar sekitar garis diagonal. Sebaliknya bila tebaran data menjauhi garis diagonal maka asumsi tidak terpenuhi
3. INDEPENDENSI
5. GAUSS /NORMALITAS
4. LINEARITAS
Regresi Logistik Ganda
Untuk memprediksi variabel dependen (Y) dari beberapa variabel independen (X)
Syarat :
INDEPENDEN
(penyebab, factor risiko, bebas) Boleh kategorik & numerik
(dominan kategorik)
DEPENDEN (akibat, terikat)
Bersifat kategorik & dikotom (2
kategori)
Reg Logistik → Logit (Y) = a+bx 1. Menetapkan model
matematik paling baik 2. Hub kuantitatif X dan
Y setelah dikontrol var lain
3. X mana yang paling dominan
4. Interaksi
• Regresi logistic berganda:
1. Signifikansi → pengaruh X terhadap Y, yang lain confounding
2. Nilai OR → exp(B), dilihat paling dominan
3. Koef determinasi (R2) → Nagelkerke R square
FUNGSI REGRESI LOGISTIK GANDA
Regresi Logistik Ganda
Model Prediksi
• “Faktor2”
• Indep > 1 dengan 1 dependen
Model Faktor Risiko/Kausal
• Satu independent dan satu dependen dengan
confound/covariate/perancu
Langkah Regresi Logistik Multi/Ganda
1. Seleksi Bivariate, p >= 0,25 keluar dari pemodelan kecuali dianggap variabel penting
2. Pemodelan Multivariate → masukan semua variabel dari seleksi bivariate
3. Lihat nilai p-value >0,05 dikeluarkan satu persatu mulai dari yang terbesar.
4. Hitung berubahan OR nya setelah satu var dikeluarkan (>10%?) → Bila
>10% dimasukkan kembali ke pemodelan, bila <10% var tersebut dikeluarkan dari pemodelan
5. RUMUS : ((OR Lama-OR Baru)/OR Lama) *100%
6. Lakukan no 2 sampai 5 hingga semua p value < 0.05
7. Cek interaksi (p value < 0.05 → interaksi)
Soal 1
Berikut adalah tabel hasil multivariat yang bertujuan mengetahui hubungan shift kerja, masa kerja, dan budaya K3 dengan fungsi paru pekerja tambang batu bara di PT X. Kapasitas paru dinilai normal apabila ≥ 80% kapasitas fungsi paru dan tidak normal <80% kapasitas fungsi paru.
a. Uji apakah yang digunakan pada studi ini?
Uji regresi logistik ganda, karena variabel dependen kategorik dan ketiga variable independent bersifat kategori
a. Apa arti Exp(B) = 3.934 pada shift kerja malam?
Pekerja dengan shift kerja malam beresiko 3.9 kali lebih tinggi untuk mengalami kapasitas paru yang tidak normal dibandingkan shift kerja tidak malam setelah mengendalikan variable masa kerja dan budaya K3
Kalau interpretasi multivariat, jangan lupakan setelah
dikontrol/mengendalikan variable ….
Soal 2
Suatu penelitian ingin mengetahui apakah lama pemakaian kontrasepsi hormonal berhubungan dengan kejadian kanker serviks. Apa Jenis analisis statistic multivariat yang digunakan?
a. Regresi linier multivariable b. Korelasi regresi
c. Anova
d. Independen t test
e. Regresi logistic multivariabel
JAWABAN : E
Dependen = Kanker Serviks (ya, tidak)
Independen = penggunaan kontrasepsi, umur pertama menikah, paritas (kategorik)
Multivariat → ada banyak variable yg diuji bersamaan
Soal 3
Apa kesimpulan dari hasil penelitian tersebut terkait dengan lama pemakaian kontrasepsi hormonal?
a. Lama pemakaian kontrasepsi hormonal tidak berhubungan dengan kanker serviks
b. Lama pemakaian kontrasepsi hormonal memiliki hubungan negatif dengan kanker serviks
c. Pemakaian kontrasepsi hormonal lebih dari lima tahun berisiko 4.2 kali lebih tinggi untuk mengalami kanker serviks
d. Pemakaan kuntrasepsi hormonal lebih dari lima tahun berisiko 4.2 kali lebih rendah untuk mengalami kanker serviks setelah dikontrol umur pertama menikah dan paritas
e. Pemakaian kontrasepsi hormonal lebih dari lima tahun berisiko 4.2 kali lebih tinggi untuk mengalami kanker serviks setelah dikontrol umur pertama menikah dan paritas
Suatu penelitian ingin mengetahui apakah lama pemakaian kontrasespsi hormonal berhubungan dengan kejadian kanker serviks. Berikut hasil analisis datanya.
JAWABAN : E
Soal 4
Studi bertujuan mengetahui hubungan antara sikap terhadap vaksin COVID-19 dengan perilaku vaksinasi pada mahasiswa fakultas kesehatan; Diambil sampel random pada 100 mahasiswa; Hasil menunjukkan bahwa OR = 2,1 dengan selang kepercayaan OR 95% antara 0,7 sampai 6,6dengan nilai p = 0,185; Apa interpretasi hasil statistik tersebut?
a. Mahasiswa yang memiliki sikap negative terhadap vaksin cenderung 2 kali lebih besar untuk vaksinasi
b. Mahasiswa yang memiliki sikap positif terhadap vaksin cenderung 2 kali lebih besar untuk vaksinasi
c. Mahasiswa yang memiliki sikap positif terhadap vaksin cenderung 2 kali lebih tinggi untuk tidak vaksinasi
d. Tidak ada asosiasi antara sikap dengan kepatuhan vaksinasi pada mahasiswa kesehatan e. Mahasiswa yang memiliki sikap positif terhadap vaksin berpeluang 18,5% untuk vaksinasi
Soal 5
Apa arti 0.222 pada variable stress terhadap kejadian kanker paru?
Pasien yang mengalami stres beresiko 0,222 kali lebih rendah terkena kanker paru dibandingkan orang yang tidak stres setelah dikontrol oleh variabel pola hidup dan merokok.
Variabel mana yang paling berpengaruh terhadap kanker paru?
Merokok → OR paling besar
Pasien yang merokok berisiko 5,1 kali lebih tinggi untuk terkena kanker paru
dibandingkan yang tidak merokok setelah dikontrol variable stres dan pola hidup
Faktor Risiko OR 95% CI P-value
Merokok (Ya) 5.111 2.174 – 8.715 0.000
Stres (Ya) 0.222 0.089 – 0.258 0.002
Pola hidup (Buruk) 3.444 1.333 – 4.222 0.003
Tabel 1. Faktor Risiko Kejadian Kanker Paru pada Pasien di RS X Tahun 2023
Soal 6
Menganalisis factor-factor yang berhubungan dengan perilaku seksual mahasiswa
▪ Variabel manakah yang paling dominan terhadap perilaku seksual mahasiswa?
Variabel taat beragama → OR paling besar
Mahasiswa yang kurang taat agama memiliki risiko 4.4 kali lebih besar utk
mengalami perilaku seksual setelah dikontrol oleh variable aktif organisasi dan pengetahuan. Variabel dominan/paling berpengaruh dilihat
dari nilai OR/Exp(B) paling besar
Tabel output & Regresi
logistic ganda
Soal 7
Sebuah studi bertujuan mengetahui faktor apa saja yang berhubungan dengan prevalensi depresi (depresi ringan atau berat diberi kode 1; dan tidak depresi diberi kode 0) pada penderita Diabetes Mellitus (DM) Type 2; Diambil sampel random pada penderita DM Type 2; Hasil analisis disajikan pada tabel berikut; Faktor apa yang paling dominan berhubungan dengan kejadian depresi pada penderita DM Type 2?
a. Comorbidity b. Age (year) c. Sex
d. Nutritional status e. Duration of medication
Soal 8
Mahasiswa melakukan survei dengan meminta pengunjung Mall di sebuah kabupaten untuk mengisi kuisioner tentang HIV/AIDS. Dari 400 kuisioner yang disebarkan, sebanyak 250 Kembali, sebanyak 200 terisi lengkap, dan ada 20 responden masuk kategori memiliki pengetahuan baik. Manakah yang benar pernyataan berikut?
a. Sebanyak 10% penduduk di Kabupaten tersebut memiliki pengetahuan HIV yang baik
b. Partisipasi responden dalam mengisi kuisioner sangat baik
c. Sebanyak 10% pengunjung Mall memiliki pengetahuan HIV baik
d. Sebanyak 5% pengunjung Mall memiliki pengetahuan HIV yang baik e. Sebanyak 5% penduduk di Kabupaten tersebut memiliki pengetahuan
HIV yang baik
JAWABAN : C
Pengetahuan baik = (20/200)x100% = 10%
Soal 9
Tabel berkut menyajikan hasil analisis multivariat hubungan umur ibu (tahun), berat badan ibu (Kg) dan rokok (Ya, Tidak) dengan berat bayi lahir (gram).
Apa jenis analisis statistik multivariat yang digunakan pada penelitian ini?
a. Korelasi regresi b. Independen t-test
c. Regresi liner multivariat
d. Regresi logistic multivariable e. Anova multiway
JAWABAN : C
Soal 10
Tabel berikut menyajikan hasil analisis multivariat hubungan umur ibu (tahun), berat ibu (kg), dan rokok (Ya. Tidak) dengan berat bayi lahir (gram)
Apa arti nilai B = 113.98 pada variabel berat ibu (kg)?
Select one:
a. Setiap kenaikan berat badan ibu 1 kg maka berat bayi bertambah 113.98 gram
b. Berat badan ibu tidak memiliki hubungan yang signifikan dengan berat bayi sebesar 113,98 gram c. Hubungan berat badan ibu dengan berat bayi dapat dijelaskan sebesar 113,98 persen
d. Setiap kenaikan berat badan ibu 1 kg maka berat bayi berbeda 113.98 gram e. Setiap kenaikan berat badan ibu 1 kg maka berat bayi berkurang 113.98 gram
Jawaban: A
Y=Dependen, X = Independen
B= Slope, Besarnya perubahan nilai Y bila X berubah setiap satu satuan
- Umur ibu (B=-2,48)
→ Setiap kenaikan umur ibu 1 th maka bb bayi berkurang 2,48 gr - Rokok (B= -411.67)
→ Ibu yang merokok memiliki bb bayi lebih rendah sebesar 411.67 gr dibandingkan ibu yang tidak merokok
Y (gram) = 2869,73 – 2,48 (tahun) + 113.98 (kg) – 411,67 (rokok)
Soal 11
Seorang mahasiswa mengembangkan aplikasi untuk memperkirakan rata-rata berat badan bayi lahir dengan menggunakan rata rata berat badan ibu dan rata rata kadar hemoglobin. Pada grafik membentuk kecenderungan mengikuti arah garis lurus.
Apa uji statistic yang digunakan pada aplikasi tersebut?
a. Statistik regresi cox b. Statistik regresi linier c. Statistik regresi logistik d. Statistik regresi non linier
Diketahui:
Variabel independent : Berat badan ibu (numerik) Kadar hemoglobin (numerik) Variabel dependen:
Berat bayi lahir (numerik)
Numerik – numerik → regresi linier ganda
Soal 12
Dari satu penelitian tentang Skor-Burnout pekerja, diperoleh hasil berikut: skor Bo = 36.04 -0.28 Umur + 1.9 jeniskelamin + 1,02 Tempatbekerja. Nilai R-square 5 persen. Apa kesimpulan dari nilai 5 persen ini?
a. Korelasi antara Skor-burnout dengan variable umur. jenis kelamin, dan tempat bekerja termasuk tinggi b. Korelasi antara Skor-burnout dengan variable umur termasuk sedang/moderate
c. Ada 95 persen variasi Skor-bumout yang belum dijelaskan oleh ketiga variable independen tersebut d. Ada 5 persen variasi Skor-burnout yang sudah dijelaskan oleh ketiga variable independen tsb
e. Ada sekitar 95 persen jumlah variable lain mempengaruhi Skor-burnout belum diteliti
JAWABAN : D
• R square itu tujuannya untuk melihat persentase variasi dependen yang sudah dijelaskan oleh variable-variable independent.
Soal 13
Satu penelitian pada ODHA (Orang Dengan HIV dan AIDS) bertujuan melihat hubungan antara CD4 sebagai pencermin tingkat imunitas tubuh dengan beberapa faktor; Keluaran analisis disajikan sebagai berikut: Apa arti hasil tersebut?
a. Variabel yang paling dominan efeknya terhadap CD4 adalah jenis kelamin
b. Peningkatan CD4 sebesar 0,144 di setiap peningkatan hitung limfosit (TLC) 1 unit c. Semakin meningkatnya umur ODHA satu tahun, CD4 turun sebesar 59,439
d. CD4 besarnya 1543,472 bila semua variable independent sama kondisinya e. Total hitung limfosit (TLC) meningkat 0,144 setiap peningkatan 1 unit CD4
Standardized koeff B
Soal 14
Satu penelitian ingin mengetahui efektifitas dan efisiensi sistem informasi KB, berdasarkan persepsi petugas kesehatan (diukur dengan skor antara 0-100); Hasil analisis data disajikan pada table berikut; Apa simpulan yang tepat untuk efisiensi sistem informasi KB?
a. Tidak cukup bukti untuk menyimpulkan bahwa efisiensi system informasi KB berbeda menurut provinsi
b. Ada perbedaan signifikan efisiensi sistem informasi KB antara DKI dengan Lampung
c. Tidak ada perbedaan signifikan efisiensi sistem informasi KB antara Lampung dengan Kalteng d. Efisiensi sistem informasi KB berbeda signifikan menurut provinsi
e. Efisiensi sistem informasi KB sama menurut provinsi
Soal 15
Sebuah studi bertujuan mengetahui prediktor kecemasan petugas kesehatan terhadap COVID-19 (cemas ringan atau tinggi diberi kode 1 dan tidak cemas diberi kode 0); Diambil sampel secara random pada 100 petugas kesehatan;
Hasil analisis disajikan pada table berikut; Apa interpretasinilai Exp(B): 0,617 dengan 95% CI: 0,425-0,896?
a. Tidak ada perbedaan kecemasan antara petugas yang bekerja di RS/puskesmas dengan bekerja di tempat lain
b. Petugas kesehatan yang bekerja di rumah sakit/puskesmas berisiko mengalami kecemasan 0,617 lebih rendah dibandingkan bekerja di tempat lain setelah mengendalikan variable lainnya
c. Petugas kesehatan yang bekerja di rumah sakit/puskesmas beresiko sama mengalami kecemasan dibandingkan di tempat lain setelah mengabaikan variable lainnya
d. Petugas yang bekerja selain di RS/puskesmas beresiko kecemasan 0,617 lebih rendah dibandingkan mereka yang bekerja di RS/puskesmas
e. Petugas kesehatan yang bekerja di rumah sakit/puskesmas beresiko mengalami kecemasan 0,617 lebih tinggi dibandingkan di tempat lain setelah mengendalikan variable lainnya
Soal 16
Mahasiswa meneliti untuk mengetahui prevalensi anemia ibu hamil di Kota Padang. Rumus besar sampel mana yang cocok untuk tujuan penelitian tersebut?
a. Estimasi rata-rata b. Uji korelasi
c. Estimasi proporsi d. Uji beda proporsi e. Uji beda rata-rata
Soal 17
Mahasiswa meneliti untuk mengetahui rerata kadar HB ibu hamil di Kota Padang. Rumus besar sampel mana yang cocok untuk tujuan penelitian tersebut?
a. Estimasi rata-rata b. Uji korelasi
c. Estimasi proporsi d. Uji beda proporsi e. Uji beda rata-rata
Soal 18
Peneliti bertujuan untuk melihat hubungan riwayat BBLR dengan kejadian stunting pada balita di Kota Padang. Rumus besar sampel mana yang cocok untuk tujuan penelitian tersebut?
a. Estimasi rata-rata b. Uji korelasi
c. Estimasi proporsi d. Uji beda proporsi e. Uji beda rata-rata
Stunting (kategorik)→ Stunting, tidak stunting BBLR (kategorik) → BBLR, Normal
Soal 19
Suatu penelitian bertujuan mengetahui prevalensi stunting pada Balita di suatu wilayah; Perlu dihitung besar sampel minimal yang dibutuhkan untuk mendapatkan prevalensi stunting yang akurat; Informasi apa dari penelitian terhadulu yang diperlukan untuk menentukan besar sampel minimum pada studi ini?
a. Karakteristik Balita b. Kekuatan uji
c. Prevalensi stunting
d. Jumlah variabel yang diteliti
e. Desain penelitian
Soal 20
Peneliti bertujuan untuk melihat hubungan riwayat BBLR dengan kejadian stunting pada balita di Kota Padang, menggunakan desain cross sectional. Data apakah yg paling dibutuhkan agar dapat dihitung besar sampel pd penelitian ini?
a. Prevalensi kejadian stunting pada balita b. Prevalensi riwayat BBLR pada balita c. Proporsi stunting pada balita BBLR
d. Proporsi riwayat BBLR pada balita tidak stunting e. Proporsi riwayat BBLR pada balita tidak stunting
Peneliti bertujuan untuk melihat hubungan riwayat BBLR dengan kejadian stunting pada balita di Kota Padang, menggunakan desain case control. Data apakah yg paling dibutuhkan agar dapat dihitung besar sampel pd penelitian ini?
a. Prevalensi kejadian stunting pada balita b. Prevalensi riwayat BBLR pada balita c. Proporsi stunting pada balita BBLR
d. Proporsi stunting pada balita tidak BBLR
e. Proporsi riwayat BBLR pada balita tidak stunting
Soal 21
Soal 22
Mahasiswa meneliti untuk hubungan perilaku merokok ibu (Ya,Tidak) dengan berat bayi lahir (gr). Rumus besar sampel mana yang cocok untuk tujuan penelitian tersebut?
a. Estimasi rata-rata b. Uji korelasi
c. Estimasi proporsi d. Uji beda proporsi e. Uji beda rata-rata
Penelitian terdahulu:
▪ μ1: rata-rata berat bayi lahir pd ibu yang merokok)
▪ μ2: rata-rata berat bayi lahir pd ibu yang tidak merokok)
Soal 23
Mahasiswa ingin meneliti apakah ada perbedaan perilaku merokok pd mahasiswa yg terdaftar di fakultas rumpun ilmu Kesehatan, rumpun science dan rumpun humaniora. Peneliti akan merancang metode sampling untuk penelitiannya. Metode sampling apa yg paling sesuai untuk digunakan?
a. Sistematik random sampling b. Stratifikasi random sampling
c. Cluster random sampling d. Quota sampling
e. Purposive sampling
JAWABAN : B
Kenapa Jawabannya Stratafikasi karena:
- “Perbedaan” perilaku merokok pada strata rumpun ilmu, yang menyiratkan bahwa peneliti menganggap terdapat perbedaan perilaku merokok dari 3 rumpun imu tsb
- Antar strata heterogen→ Bahwa antar ketiga rumpun tsb berbeda perilaku merokoknya
- Dalam strata homogen→ Bahwa di dalam rumpun masing-masing, memiliki kondisi atau karekteristik mirip.
- Perwakilan sampel harus ada di ketiga rumpun ilmu tsb.
- Generalisasi akan dibuat pada masing- masing rumpun ilmu
Soal 24
Seorang peneliti ingin mengetahui prevalensi karies gigi pada siswa SMP di suatu sekolah; Seluruh 300 siswa terdistribusi dengan jumlah yang masing-masing sama pada 10 kelas, kemudian diambil sampel 50 siswa; Sampel yang terpiih diharapkan merata di seluruh kelas;
Prosedur sampling probabilitas apa yang paling tepat?
a. Sampel acak sistematik b. Sampel acak klister
c. Sampel purposive
d. Sampel acak sederhana e. Sampel acak stratifikasi
▪ INTERVAL= N/n = 300/50= 6
▪ RANDOM SAMPEL PERTAMA MISAL DAPAT ANGKA: 6
▪ MAKA SAMPEL TERPILIH:
6, 12, 18, 24, 30…..DST
Simple Random Sampling
→ Metode pengambilan sampel terbaik dan paling mudah untuk dimengerti, yang memberikan kesempatan yang sama kepada unit sampel untuk terpilih sebagai sampel.
Tersedia kerangka sampel
Area tidak luas
Prosedur Simple Random Sampling
Nama Nomor Nama Nomor Dini
Ella Rita Tris Budi Rina Santi
Alan Joni Jacub
1 2 3 4 5 6 7 8 9 10
Toha Lukman
Susi Vivi Badu Yusrizal
Tanto Wawan
Wita Dedi
11 12 13 14 15 16 17 18 19 20
Ex:
Peneliti ingin mengetahui berat badan rata-rata mahasiswa FKM UI. Peneliti hanya ingin mengukur 5 mahasiswa.
1. Lakukan random (table random, undian, software)
2. Sampel terpilih (1, 4, 7, 9, 16) Dini, Tris, Santi, Joni, Yusrizal
Systematic Random Sampling
→ Metode pengambilan sampel, dimana hanya unsur pertama saja dari sampel dipilih secara acak, selanjutnya diambil secara sistematik menurut pola tertentu .
Tersedia kerangka sampel/
Dapat diperkirakan Area tidak luas
Tidak ada efek kelipatan (siklus)
Prosedur Systematic Random Sampling
Nama Nomor Nama Nomor Dini
Ella Rita Tris Budi Rina Santi
Alan Joni Jacub
1 2 3 4 5 6 7 8 9 10
Toha Lukman
Susi Vivi Badu Yusrizal
Tanto Wawan
Wita Dedi
11 12 13 14 15 16 17 18 19 20
Ex: Peneliti ingin mengetahui berat badan rata-rata mahasiswa FKM UI. Peneliti hanya ingin mengukur 5 mahasiswa.
1. Hitung Interval (i) = N / n i = 20/5 = 4
2. Pilih angka pertama secara acak antara 1 sampai i, misal: 1
3. Tandai Sampel Terpilih 1, (1+4) 5, (5+4) 9, (9+4) 13, (13+4) 17
Dini, Budi, Joni, Susi, Tanto
Stratified Sampling
Suatu metode pengambilan sampel dimana populasi yang bersifat heterogen dibagi dalam lapisan-lapisan (strata) dengan tujuan ingin membuat generalisasi pada sub-populasi.
Dibutuhkan kerangka sampel
Populasi tidak homogen
Prosedur Stratified Sampling
Ex: Mengetahui rata-rata berat badan pada 20 mahasiswa FKM UI. Peneliti hanya ingin mengukur 5 mahasiswa berdasarkan strata jenis kelamin.
Stratum Perempuan
▪ N=8
▪ Besar sample n = 8/20*5 = 2
▪ Probabilitas = 2/8 = 0.25
▪ Ambil acak: Angka: 1, 4
▪ Sampel terpilih:
Dini, Rina
Stratum Laki-Laki
▪ N = 12
▪ Besar sample n = 12/20* 5 = 3
▪ Probabilitas = 3/12 = 0.25
▪ Ambil acak: Angka: 1, 4, 9
▪ Sampel terpilih:
Joni, Lukman, Dedi
Cluster Sampling
Teknik pengambilan sampel yang membagi populasi menjadi beberapa kelompok (cluster).
Tidak tersedia kerangka sampel Populasi besar/wilayah geografis
yang sulit dijangkau
Prosedur Cluster Sampling
Tiap Kelas @ 5 Mahasiswa
Ex: Peneliti ingin mengetahui rata-rata berat badan pada 20 mahasiswa FKM UI (ada 4 klaster). Peneliti hanya ingin mengukur 5 mahasiswa.
1. Pilih 1 angka acak, dari 1 – 4 klaster.
2. Klaster terpilih: # 4 3. Mahasiswa terpilih:
Yusrizal, Tanto, Wawan, Wita, Dedi
Klaster # 1 = Kelas 1
Klaster # 2 = Kelas 2
Klaster # 3 = Kelas 3
Klaster # 4 =
Kelas 4
Soal 25
Seorang peneliti ingin mengetahui rata-rata lama tunggu pasien yang berobat di poliklinik penyakit dalam. Peneliti melakukan pengamatan pada semua pasien yang datang sebelum pukul 12 siang hari pada 10 hari pertama di bulan Januari. Bagaimana kesimpulan saudara tentang cara pengambilan sampel ini?
a. Sambil diambil dengan cara agak random
b. Sampel cukup mewakili populasi karena dipiilih dari pasien yang datang berkunjung ke poliklinik tsb
c. Sampel kurang mewakili karena tidak valid d. Sampel diambil dengan cara multistage
e. Sampel cukup mempunyai presisi yang baik karena dilakukan pada 10 hari pertama di bulan Januari
JAWABAN : C
Soal 26
Seorang peneliti seringkali dalam menganalisis data sekunder menjumpai data hilang.
Bagaimana cara mengatasi masalah data hilang?
a. Imputasi data
b. Amputasi data c. Generalisasi d. Reliabilitas data e. Validasi data
JAWABAN : A
Soal 27
Variabel pendapatan per bulan dari keluarga yang ditanyakan pada satu survei ditampilkan datanya pada tabel berikut; Apa implikasi dari kondisi hasil tersebut?
a. Melakukan imputasi terhadap data yang hilang b. Menghilangkan variable penghasilan utama tersebut
c. Menyerahkan analisis kepada aplikasi statistic computer yang dipakai d. Tetap menyertakan variable tersebut dalam analisis
e. Menghilangkan kasus yang tidak lengkap