Population & Sampling
• Population
• Sampling Method & Techniques
• Sampling Size
Oleh : Imam Safi’i, ST.
Sumber : Prof. Samuel, MT.
Populasi adalah kumpulan atau jumlah keseluruhan dari unit analisa yang memiliki ciri-ciri/karakteristik tertentu.
Ciri-ciri/karakteristik tertentu inilah yang disebut dengan variabel; yang ingin diketahui atau diteliti.
Dua cara pengumpulan informasi mengenai populasi:
1. Mencari informasi dari tiap unit analisa dalam populasi
sensus
2. Mencari informasi hanya dari sebagian anggota populasi.
“Wakil” populasi inilah yang disebut sampel.
Proses pengambilan sampel dari populasi disebutsampling
2
Idealnya penelitian dilakukan terhadap populasi (penelitian populasi = studi populasi = sensus).
Namun, dalam kenyataan, tidaklah selalu perlu untuk
meneliti semua individu dalam populasi (melakukan sensus), karena memakan biaya dan tenaga yang besar serta waktu yang lama.
Dengan meneliti sebagian dari populasi (dari sampel), kita mengharapkan hasil yang diperoleh akan dapat
menggambarkan sifat populasi yang bersangkutan sehingga dapat dilakukan generalisasi.
3
Populasi dan Sampel
Generalisasi/Inferensi statistik penarikan kesimpulan atas suatu hal dari unit analisa yang jumlahnya lebih sedikit (sampel) ke unit analisa yang jumlahnya lebih banyak atau lebih luas (populasi)
Agar dapat dilakukan generalisasi, sampel harus benar-benar dapat mewakili populasi.
Oleh sebab itu, harus diperhatikan beberapa hal yaitu besarnya sampel (sample size) dan metode serta teknik pengambilan sampelnya (sampling technique).
Berdasarkan jumlahnya, dibedakan menjadi: 1. Populasi terbatas/finit (
definite
)Jumlah unit analisisnya dapat dihitung.
misal: mahasiswa UNIK, pemilik KARTU HALO di Indonesia.
2. Populasi tidak terbatas/infinit (
indefinite
)Jumlah unit analisisnya tidak dapat dihitung, karena terlalu banyak atau karena tak terdefinisi.
misal: pengunjung restoran KFC di Surabaya, pemilik HP Nokia di kalangan mahasiswa
Jumlah populasi akan mempengaruhi metode pengambilan sampel yang dapat digunakan.
5
Populasi dan Sampel
Populasi
Sampel
Parameter
Statistik
SAMPEL PARAMETER
Besaran, nilai, atau harga dari populasi
STATISTIK
Besaran, nilai, atau harga dari sampel
2 x ss2 r SAMPLING GENERALISASI/ INFERENSI POPULASI
Mean µ X
Proportion p
Variance 2 s2
Standard deviation s
Size N n
Standard error of the mean x Sx
Standard error of the proportion p Sp
Standardized variate (z) (X-µ)/ (X-X)/S Coefficient of variation (C) /µ S/X
-3. Pilih teknik pengambilan sampel
5. Lakukan proses sampling 2. Tentukan kerangka sampling
1. Definisikan Target Populasi
4. Pilih besar sampel yg akan diteliti
9
Target populasi harus didefinisikan secara jelas dengan memperhatikan:
a) unit analisis/satuan amatan; b) elemen;
c) tingkatan (extent) atau ruang lingkup (scope); d) kisaran waktu.
Misal penelitian mengenai respons terhadap lipstik baru.
Populasi adalah semua pemakai lipstik
Kata “semua” memiliki batasan yang tidak jelas. Apabila ada anak perempuan berusia 12 tahun memakai lipstik, apakah ia termasuk populasi penelitian? Kalau termasuk, apakah anak semuda itu sudah bisa menyatakan pendapat yang akurat?
Jadi, diperlukan batasan-batasan target populasi yang jelasperlu didefinisikan.10
Pendefinisian Target Populasi
–
ctd’ Dari contoh di atas, maka target populasi dapat ditetapkan sebagai berikut:
Unit analisis/satuan amatan : semua wanita pemakai lipstik
Elemen : wanita berusia 17 s.d. 60 thn
Ruang lingkup geografis : Surabaya
Ruang lingkup waktu : tahun 2007 Jadi bila dirumuskan dalam kalimat, maka target populasi dapat didefinisikan sebagai berikut:
“Semua wanita pemakai lipstik yang berusia 17-60 tahun di Surabaya,
pada tahun 2007”.
11
Unit analisis / Satuan Amatan
Unit analisis/satuan amatan adalah objek atau subjek penelitian yang diteliti.
Yang dapat termasuk unit analisis, misalnya:
o
Individuo
Groupso
Rumah tangga (households)o
Organizationso
Geographical units (eg. town, region)o
Transactions/occasions dst…o Responden adalah unit amatan/unit analisis dimana kepada mereka, kuesioner kita berikan. Responden bisa = unit amatan (tapi bisa juga berbeda)
2. Menentukan Kerangka Sampling
(Sampling Frame)
Kerangka sampling berisikan daftar atau petunjuk untuk mengidentifikasi target populasi.
Kerangka sampling bisa tersedia atau tidak tersedia.
Untuk populasi yang terbatas (
definite population
), biasanya kerangka sampling tersedia. Demikian juga sebaliknya. Ketersediaan kerangka sampling akan mempengaruhi metode pengambilan sampel yang digunakan.
13
3. Memilih Teknik Sampling
Teknik Sampling adalah tatacara penarikan sampel agar efisien dalam pelaksanaannya dan hasilnya efektif (akurat dan valid) dalam merepresentasikan
karakteristik populasinya.
Secara umum, ada 2 teknik sampling:
1. Probability sampling
Setiap anggota populasi memiliki kesempatan (chance) atau peluang (probability) yang sama untuk dipilih sebagai sampel.
2. Non-probability sampling
Setiap anggota populasi tidak memiliki peluang yang sama untuk dipilih.
Sampling Techniques
Classification of Sampling Techniques
Non-probability Sampling Techniques Convenience Sampling Probability Sampling Techniques Judgmental Sampling Quota Sampling Snowball Sampling Systematic Sampling Stratified Sampling Cluster Sampling Other sampling Techniques Simple random Sampling Unrestricted Restricted
1.
Simple
random sample (SRS) – Acak
Sederhana
2.Systematic sampling
3.Stratified sampling
4.Cluster sampling
15Probability Sampling
Setiap elemen populasi harus diketahui lebih dulu (ada kerangka sampling-nya)
Dalam pemilihan sampel, setiap elemen memiliki peluang yang sama untuk terpilih
Caranya bisa menggunakan undian.
Meskipun mudah dimengerti, namun sulit diterapkan, terutama bila target populasi jumlahnya sangat besar dan tersebar secara geografis sehingga sulit dijangkau. Biaya yang diperlukan akan sangat besar.
Simple Random Sampling (Acak
Sederhana)
Pengambilan sampel dilakukan dengan sistematika tertentu.
Misalnya, kerangka sampling berisikan 10.000 elemen target populasi. Peneliti ingin mengambil sampel 500 elemen. Dari kedua data, dapat ditetapkan sampling interval 10.000/500=20.
Sampel nomor 1 dipilih secara acak satu elemen. Misalkan terpilih nomor 8061, maka, elemen berikutnya yang dipilih adalah nomor 8081, 8101, 8121, 8141, 8161, dst, sampai didapat jumlah sampel seperti yang ditetapkan.
17
Systematic Sampling
Dengan teknik ini, pertama-tama populasi
disegmentasi/dibagi dulu dalam variabel segmentasi yang dianggap relevan oleh peneliti.
Lalu dari setiap segmen, pengambilan sampel dilakukan dengan teknik probability.
Dasar penentuan variabel segmentasi:
1. Terdapat homogenitas elemen dalam tiap segmen; sedangkan
antar segmen terdapat heterogenitas elemen.
2. Pengelompokan harus berhubungan dengan masalah yang
diteliti. Jadi harus ada pengujian hipotesis atas pengelompokan
yang dilakukan
18
19
Stratified Sampling
Target Populasi yang belum disegmentasi
Sub-populasi segmen A Sub-populasi segmen B Sub-populasi segmen C
Dalam tiap segmen, antar elemen memiliki ciri yg homogen, Tapi antar segmen A, B, dan C; memiliki ciri yg heterogen.
Setiap segmen yg terbentuk, harus diambil wakil/sampel atasnya untuk diteliti.
Pertama, populasi harus dibagi dalam sub-populasi atau cluster lebih dulu.
Umumnya cluster adalah wilayah (area).
Kebalikan dari stratified sampling. Anggota dalam cluster harus heterogen; sedangkan antar cluster harus homogen/ada kesamaan ciri.
Dengan demikian, melakukan penelitian pada 1 cluster saja, peneliti sudah bisa menarik kesimpulan tentang target populasi secara keseluruhan (tidak harus semua cluster dipilih sebagai sampel).
21
Cluster Sampling
Target Populasi yang belum disegmentasi
Sub-populasi Cluster A Sub-populasi Cluster B Sub-populasi Cluster C
Dalam tiap cluster, antar elemen memiliki ciri yg heterogen, Tapi antar cluster A, B, dan C; memiliki ciri yg homogen.
22
Types of Cluster Sampling
Cluster Sampling One-Stage
Sampling Two-StageSampling MultistageSampling
Cluster sampling 1 tahap
(one-stage cluster sampling)
,cluster yang akan diteliti, dipilih secara random; kemudian seluruh elemen dari cluster terpilih dijadikan sampel.Cluster sampling 2 tahap
(two-stages cluster sampling)
,
cluster yang akan diteliti, dipilih secara random;kemudian dari cluster terpilih, sampel diambil secara random (tidak semua elemen dipilih).Pada
cluster sampling multi-stages
, proses awal =two-stages
cluster sampling
,namun proses pemilihan sampel lebihbertingkat lagi. Biasanya untuk area/wilayah yang lebih luas.
23
Cluster Sampling
Tahap I : Memilih secara acak wilayah sampel dari 5 wilayah di Surabaya: Sby Selatan, Sby Utara, Sby Barat, Sby Timur, dan Sby Pusat. Misalnya terpilih Sby Selatan.
Tahap II : Memilih secara acak kecamatan dari wilayah Sby Selatan. Misal ada 20 kecamatan di Sby Selatan, terpilih kecamatan Wonocolo.
Tahap III : Memilih secara acak kelurahan dari wilayah kecamatan Tegalsari. Misal ada 15 kelurahan di kecamatan Wonocolo, terpilih kelurahan Jemursari.
Tahap IV : Memilih blok pemukiman dari kelurahan Jemursari. Misalkan terpilih komplek perumahan Jemur Andayani.
Tahap V : Memilih secara acak 100 KK dari perumahan Jemur Andayani.
1.
Convenience
sampling/Accidental
sampling
2.
Judgement
sampling/Purposive sampling
3.Quota
sampling
4.
Snowball
sampling
25
Dengan teknik ini, peneliti berusaha memperoleh sampel dari
elemen-elemen yang convenience, yaitu yang paling mudah dihubungi, dikenal, dan mau bekerja sama.
Kadang disebut sebagai
haphazard
sampling
atau
accidental
sampling
, karena sampel yang dipilih adalah orang-orang yang kebetulan(accidentally)
ditemui di jalan. Cross the mall sampling masuk kategori
convenience sampling
,karena sampel adalah orang-orang yang kebetulan dijumpai di mal (pusat perbelanjaan).
26
Convenience sampling merupakan teknik yang paling
mudah, murah, tidak butuh waktu lama.
Kelemahannya, keterwakilan populasi oleh sampel
dipertanyakan.
Kesimpulan yang dibuat tidak dapat digeneralisasi.
Tidak disarankan untuk studi deskriptif atau kausal, namun
untuk riset eksploratori atau untuk pre-test (uji validitas kuesioner) boleh digunakan teknik ini.
27
Convenience Sampling
Elemen populasi dipilih berdasarkan pertimbangan
(judgement)peneliti.
Oleh sebab itu, keahlian peneliti sangat penting, sebab
peneliti harus mampu menilai apakah seseorang mewakili populasi atau tidak.
Untuk mengurangi bias, peneliti perlu menetapkan
syarat-syarat elemen terlebih dulu.
Sebelum pemilihan sampel dan pengambilan data
dilakukan, syarat-syarat harus dipenuhi dulu. Bila tidak, maka tidak boleh dipilih sebagai responden.
Disebut juga dengan purposive sampling.
29
Quota Sampling -- contoh
Variabel Segmentasi KomposisiPopulasi (%) Komposisi Responden (%) Jumlah Responden JENIS KELAMIN Wanita Pria 55 45 55 45 1100 900 USIA (Tahun) 18-30 31-45 46-60 Di atas 60 24 36 25 15 24 36 25 15 480 720 500 300 PENDAPATAN/BLN < 2 juta rupiah 2-5 rupiah > 5 juta rupiah 15 60 25 15 60 25 300 1200 500
•Jumlah pelanggan FEMINA se Indonesia – populasi tidak terbatas
•Besar sampel ditentukan 2000 orang
Tahap pertama, peneliti memilih responden awal. Setelah
diwawancara, maka responden awal diminta menunjuk (merekomendasikan) orang lain yang memenuhi syarat-syarat target populasi untuk diwawancara berikutnya oleh peneliti.
Proses bergulir terus seperti bola salju.
30
Nonprobability Sampling
Convenience sampling
Least expensive, least time-consuming, most convenient
Selection bias, sample not
representative, not recommended for descriptive or causal research Judgmental sampling Low cost, convenient,
not time-consuming
Does not allow generalization, subjective
Quota sampling Sample can be controlled
for certain characteristics
Selection bias, no assurance of representativeness
Snowball sampling Can estimate rare
characteristics
Time-consuming
Probability sampling
Simple random sampling (SRS)
Easily understood, results projectable
Difficult to construct sampling frame, expensive, lower precision, no assurance of representativeness.
Systematic sampling Can increase
representativeness, Easier to implement than SRS, sampling frame not necessary
Can decrease representativeness
Stratified sampling Include all important subpopulations, precision
Difficult to select relevant stratification variables, not feasible to stratify on many variables, expensive
Cluster sampling Easy to implement, cost
effective
Imprecise, difficult to compute and interpret results
Conditions Favoring the Use of Factors Nonprobability
sampling
Probability sampling Nature of research Exploratory Conclusive
Relative magnitude of sampling and nonsampling errors Nonsampling errors are larger Sampling errors are larger Variability in the population Homogeneous
(low)
Heterogeneous (high)
Statistical considerations Unfavorable Favorable
Memilih Nonprobability vs. Probability
33
(Sample Size)
Faktor-faktor yang harus dipertimbangkan dalam menentukan besar sampel:
1. Derajat keseragaman (
degree of homogeneity)
dari populasi* Makin seragam populasi, makin kecil sampel yang dapat diambil, demikian sebaliknya.
34 Faktor-faktor yang harus dipertimbangkan dalam menentukan besar sampel:
2. yang dikehendaki dari penelitian
* Merupakan perbedaan maksimal antara statistik sampel & parameter
populasi yang dapat ditoleransi.
* Makin tinggi presisi yang dikehendaki, makin besar sampel yang harus diambil. Sampel yang besar cenderung memberikan
penduga yang lebih mendekati nilai sesungguhnya. * Terdapat hubungan/korelasi yang negatif antara besarnya
sampel yang diambil dengan besarnya kesalahan (error). * Semakin besar sampel yang diambil, semakin kecil kesalahan
(penyimpangan terhadap nilai populasi) yang diperoleh.
35
Faktor-faktor yang harus dipertimbangkan dalam menentukan besar sampel:
3. Derajat Keyakinan
(Confidence Level)
* sebuah interval antara dua angka, dimana peneliti yakin bahwa nilai parametersebuah populasi terletak dalam interval tersebut. * Confidence Levelyang umum dipilih 95% atau 90%
* Terdapat hubungan antara confidence level dengan alpha (
α
) tingkat kesalahan.*Confidence level = 1 -
α
, maka bilaα
= 5%,confidence level
95%. * Makin besar derajat keyakinan, jumlah sampel yang diambilsemakin besar.
Standard Errors Associated with
Areas under Normal Curve
Standard Errors Percent of area Approximate Degree of Confidence
1.00
68.27
68 %
1.65
90.10
90
1.96
95.00
95
37
Faktor-faktor yang harus dipertimbangkan dalam menentukan besar sampel:
4. Rencana Analisa
Adakalanya besar sampel sudah mencukupi sesuai dengan presisi yang dikehendaki, namun bila dikaitkan dengan kebutuhan analisa, maka jumlah sampel masih belum mencukupi
Beberapa pedoman umum:
Untuk studi deskriptif, sampel minimal 10% dari populasi (n=0.1xN)
Untuk studi eksperimen, minimal 15 subjek per grup yang dipakai sebagai eksperimen
Untuk analisa faktor (factor analysis), sampel (n) = 10x variabel38
Faktor-faktor yang harus dipertimbangkan dalam menentukan besar sampel:
5. Tenaga, biaya, dan waktu
Apabila menginginkan presisi yang tinggi, maka jumlah sampel
harus besar. Namun bila dana, tenaga dan waktu terbatas,
maka tidaklah mungkin untuk mengambil sampel yang besar.
Konsekuensi, presisi akan menurun
kemungkinan error
lebih besar.
39 2
E
zs
n
n = jumlah sampelZ = tingkat kepercayaan dugaan/confidence level (1- ) p = proporsi sampel
e = kesalahan dugaan (sampling error) s = standard deviasi/penyimpangan baku
Sample Size Formula -
ExampleSuppose a survey researcher, studying
expenditures on lipstick, wishes to have a
95% confident level (Z) and a range of error
(e) of less than $2.00. The estimate of the
standard deviation is $29.00.
41 2
E
zs
n
200
.
2
00
.
29
96
.
1
200
.
2
84
.
56
242
.
28
808
Sample Size Formula - Example
42
Calculating Sample Size
The higher the level of confidence…the more sample
units must be obtained.
200
.
2
00
.
29
96
.
1
200
.
2
84
.
56
242
.
28
808
[
]
265
.
37
2
2
53
.
74
2
2
)
29
)
57
.
2
(
n
2
1389
95% 99%43
The higher level of tolerance/range of error accepted… the
less sample units must be obtained.
[
37
.
265
]
2
2
53
.
74
2
2
)
29
)
57
.
2
(
n
2
1389
Sample error = $2 Sample error = $4
]
[
18
.
6325
2
4
53
.
74
2
4
)
29
)(
57
.
2
(
n
2
347
Contoh Tabel Sample Size:
Jumlah Sampel Populasi Terhingga / Finit
N n 5.000 1.622 10.000 1.936 20.000 2.143 40.000 2.265 100.000 2.344 500.000 2.389 1.000.000 2.395 10.000.000 2.400 100.000.000 2.400 Sumber: Suharjo, B (2005)
Jumlah Sampel dengan faktor koreksi
Infinit Sumber: Suharjo, B (2005) Sampling Error 50% 75% 80% 85% 90% 95% 99% 99.9% 1% 1140 3307 4096 5184 6766 9604 16590 19741 2% 285 827 1024 1296 1692 2401 4148 4936 3% 127 358 456 576 752 1068 1844 2194 4% 72 207 256 324 423 601 1037 1234 5% 40 199 191 246 271 385 664 790 7.5% 21 59 73 93 121 171 296 351 10% 12 34 41 2 68 97 166 198 15% 6 15 19 24 31 43 74 88 20% 3 9 11 13 17 25 42 50 Level of Confidence
Construct Validity &
Reliability
in Questionaire Design
PENGUJIAN TERHADAP INSTRUMEN PENGUKURAN
Problem Symptoms Asumption Last experience Theory Knowledge On-hand Information Rumors Possible Problem Hypotesa Data colection Measurement Representativeness DC forms DC method DC management Analysis/ Test Conclusion Possible Solution 3 INLINE
The Indonesia Learning Institute
Construct Validity dan Perannya
Construct (Concept)
•
Merupakan kerangka atau abstraksi dari suatu teori yang bertujuan untuk mengorganisir pemahaman terhadap suatu fenomena untuk mendapatkan atau meningkatkan makna (arti) yang umumnya tersembunyi. (Pedhazur et al. 1991)
Peran Validity dalam Kuesioner:
•
Untuk menjamin agar kuesioner (alat ukur) mampu mengukur substansi yang sebenarnya.Construct
Construct
dapat diibaratkan sebagai
seorang sutradara yang mengatur
sebuah peran atau seorang pelatih yang
mengatur strategi suatu permainan.
Construct Validation
akan
menitikberatkan pada peran (
inference
)
sebuah
concept
yang melatarbelakangi
munculnya suatu aktivitas yang dapat
diukur.
Memahami Construct
Brand Concern Quality Concern Attention Concern Motivation PerformanceMerk merupakan sst yang penting bagi saya
Kualitas bagi saya lebih penting daripada harga
Saya selalu ingin menjadi pusat perhatin
Sense data without concept are blind Concept without
Level of Validity
Validitas Kriteria (Kategori)
Validitas Substansi
Validitas Sistem
Membangun Construct
A1 X1 X2 X3 X4 A2 Korelasi Error 1 Error 2 Error 3 Error 4Reliability