BAB III
POPULASI, SAMPEL DAN PENGUJIAN NORMALITAS DATA
A. Populasi
Populasi adalah wilayah generalisasi yang terdiri atas; obyek/subyek yang mempunyai kuantitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya.
Jadi populasi bukan hanya orang, tetapi juga benda-benda alam yang lain.
Populasi juga bukan sekedar jumlah yang ada pada obyek/subyek yang dipelajari, tetapi meliputi seluruh karateristik/sifat yang dimiliki oleh obyek atau subyek itu.
Misalnya akan melakukan penelitian di lembaga X, maka lembaga X ini merupakan populasi. Lembaga X mempunyai sejumlah orang/subyek dan obyek yang lain. Hal ini berarti populasi dalam arti jumlah/kuantitas. Tetapi lembaga X juga mempunyai karateristik orang-orangnya, misalnya motivasi kerjanya, disiplin kerjanya.
kepemimpinannya, iklim organisasinya, dan lain-lain; dan juga mempunyai karateristik obyek yang lain, misalnya kebijakan, prosedur kerja, tata ruang, produk yang dihasilkan dan lain-lain. Yang terakhir berarti populasi dalam arti karateristik.
Satu orangpun dapat digunakan sebagai populasi, karena satu orang itu mempunyai berbagai karateristik, misalnya gaya bicaranya, disiplin pribadi, hobi, cara bergaul, kepemimpinannya dan lain-lain. Misalnya akan melakukan penelitian kepemimpinan presiden Y, maka kepemimpmnan itu merupakan sampel dan semua karateristik yang dimiliki presiden Y.
Dalam bidang kedokteran, satu orang sering bertindak sebagai populasi. Darah yang ada pacla setiap orang adalah populasi, kalau akan diperiksa cukup diambil sebagian yang ada pada orang tersebut
B. Sampel
Sampel adalah sebagian dan jumlah dan karateristik yang dimiliki oleh populasi tersebut. Bila populasi besar, dan peneliti tidak mungkin memperlajari semua yang ada pada populasi, misalnya karena keterbatasan dana, tenaga dan waktu, maka peneliti dapat menggunakan sampel yang diambil dari populasi itu. Apa yang dipelajari dari sampel itu, kesimpulannya akan diberlakukan untuk populasi. Untuk itu sampel yang diambil dari populasi harus betul-betul representatif (mewakili).
Bila sampel tidak representatif, ibarat orang buta disuruh menyimpulkan karateristik gajah. Satu orang memegang telinga gajah, maka ia menyimpulkan gajah itu seperti kipas. Orang kedua memegang badan gajah, maka ia menyimpulkan gajah itu seperti tembok besar. Satu orang lagi memegang ekornya, maka ia menyimpulkan gajah itu kecil bulat seperti seutas tali. Begitulah kalau sampel yang dipilih tidak representatif, maka ibarat 3 orang buta itu yang membuat kesimpulan yang salah tentang gajah.
C. Teknik Sampling
Teknik sampling adalah merupakan teknik pengambilan sampel. Untuk menentukan sampel yang akan digunakan dalam penelitian, terdapat berbagai teknik sampling yang digunakan. Secara skematis, teknik sampling ditunjukkan pada gambar 3.1.
Gambar 3.1 Teknik Sampling
Dari gambar tersebut terlihat bahwa, teknik sampling pada dasarnya dapat dikelompokkan menjadi dua yaitu Probability Sampling dan Nonprobability Sampling.
Probability sampling meliputi, simple random, proportionate stratified random, dispropotionate stratified random, dan area random. Non-probability sampling meliputi, sampling sistematis, sampling kuota, sampling aksidental, purposive sampling, sampling jenuh dan snowball sampling.
1. Probability Sampling
Probability sampling adalah teknik sampling yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi anggota sampel.
Teknik ini meliputi :
a. Simple Random Sampling
Dikatakan simple (sederhana) karena pengambilan sampel anggota populasi dilakukan secara acak tanpa memperhatikan strata yang ada dalam populasi itu. Cara demikian dilakukan bila anggota populasi dianggap homogen. Teknik ini dapat digambarkan seperti gambar 3.2 berikut.
Gambar 3.2 Teknik Simple Random Sampling
b. Proportionate Stratified Random Sampling
Teknik ini digunakan bila populasi mempunyai anggota/unsur yang tidak homogen dan berstrata secara proporsional. Suatu organisasi yang mempunyai pegawai dari latar belakang pendidikan, maka populasi pegawai itu berstrata. Misalnya jumlah pegawai yang lulus S1 = 45, S2 = 30, STM = 800, ST = 900, SMEA = 400, SD = 300.
Jumlah sampel yang harus diambil meliputi strata pendidikan tersebut yang diambil secara proporsional jumlah sampel dan teknik pengambilan sampel diberikan setelah bab mi. Teknik Proportionate Stratified Random Sampling dapat digambarkan seperti gambar 3.3 berikut.
Gambar 3.3 Teknik Stratified Random Sampling
c. Disproportionate Stratified Random Sampling
Teknik ini digunakan untuk menentukan jumlah sampel, bila populasi berstrata tetapi kurang proporsinal. Misalnya pegawai dari PT tertentu mempunyai; 3 orang lulusan S3, 4 orang lulusan S2, 90 orang S1 , 800 orang SMU, 700 orang SMP, maka tiga orang lulusan S3 dan empat orang S2 itu diambil semuanya sebagai sampel. Karena dua kelompok ini terlalu kecil bila dibandingkan dengan kelompok S1, SMU, dan SMP.
d. Cluster Sampling (Area Sampling)
Teknik sampling daerah digunakan untuk menentukan sampel bila obyek yang akan diteliti atau sumber data sangat luas, misal penduduk dari suatu negara, propinsi atau kabupaten. Untuk menentukan penduduk mana yang akan dijadikan sumber data, maka pengambilan sampelnya berdasarkan daerah populasi yang telah ditetapkan.
Misalnya di Indonesia terdapat 27 propinsi, dan sampelnya akan menggunakan 10 propinsi, maka pengambilan 10 propinsi itu dilakukan secara random. Tetapi perlu diingat, karena propinsi-propinsi di Indonesia itu berstrata maka pengambilan sampelnya perlu menggunakan stratified random sampling.
Teknik sampling daerah ini sering digunakan melalui dua tahap, yaitu tahap pertama menentukan sampel daerah, dan tahan berikutnya menentukan orang-orang yang ada pada daerah itu secara sampling juga. Teknik ini dapat digambarkan seperti gambar 3.4 berikut.
Gambar 3.4 Teknik Cluster Random Sampling
2. Nonprobability Sampling
Nonprobability Sampling adalah teknik yang tidak memberi peluang/
kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel.
Teknik sampel ini meliputi :
a. Sampling Sistematis
Sampling Sistematis adalah teknik penentuan sampel berdasarkan urutan dari anggota populasi yang telah dibeli nomor urut. Misalnya anggota populasi yang terdiri dari 100 orang. Dari semua anggota itu diberi nomor unit, yaitu nomor 1 sampal dengan nomor 100. Pengambilan sampel dapat dilakukan dengan nomor ganjil saja, genap saja, atau kelipatan dan bilangan tententu, misalnya kelipatan dari bilangan lima. Untuk ini maka yang diambil sebagai sampel adalah nomor 5, 10, 15, 20, dan seterusnya sampai 100.
b. Sampling Kuota
Sampling Kuota adalah teknik untuk menentukan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diiginkan. Sebagai contoh, akan melakukan penelitian terhadap pegawai golongan II, dan penelitian dilakukan secara kelompok. Setelah jumlah sampel ditentukan 100, dan jumlah anggota peneliti berjumlah 5 orang, maka setiap anggota peneliti dapat memilih sampel secara bebas sesuai dengan karateristik yang ditentukan (golongan II) sebanyak 20 orang.
c. Sampling Aksidental
Sampling Aksidental adalah teknik penentuan sampel berdasarkan kebetulan, yaitu siapa saja yang secara kebetulan bertemu dengan peneliti dapat digunakan sebagai sampel, bila dipandang orang yang kebetulan ditemui itu cocok sebagai sumber data.
d. Sampling Purposive
Sampling Purposive adalah teknik penentuan sampel dengan pertimbangan tertentu. Misalnya akan melakukan penelitian tentang disiplin pegawai, maka sampel yang dipilih adalah orang yang ahli dalam bidang kepegawaian saja.
e. Sampling Jenuh
Sampling Jenuh adalah teknik penentuan sampel bila semua anggota populasi digunakan sebagai sampel. Hal ini sering dilakukan bila jumlah populasi relatif kecil, kurang dari 30 orang. Istilah lain sampel jenuh adalah sensus, dimana semua anggota populasi dijadikan sampel.
f. Snowball Sampling
Snowball sampling adalah teknik penentuan sampel yang mula-mula jumlahnya kecil, kemudian sampel ini disuruh memilih teman-temannya untuk dijadikan sampel.
Begitu seterusnya, sehingga jumlah sampel semakin banyak. Ibarat bola salju yang menggelinding, makin lama semakin besar. Teknik sampel ditunjukkan pada gambar 3.5 berikut. Pada penelitian kualitatif banyak menggunakan sampel Purposive dan Snowball.
Gambar 3.5 Snowball Sampling
3. Menentukan Ukuran Sampel
Jumlah anggota sampel sering dinyatakan dengan ukuran sampel. Jumlah sampel yang 100% mewakili populasi adalah sama dengan populasi. Jadi bila jumlah populasi 1000 dan hasil penelitian itu akan diberlakukan untuk 1000 orang tersebut tanpa ada kesalahan, maka jumlah sampel yang diambil sama dengan jumlah populasi tersebut yaitu 1000 orang. Makin besar jumlah sampel mendekati populasi, maka peluang kesalahan generalisasi semakin kecil dan sebaliknya makin kecil jumlah sampel menjauhi populasi, maka makin besar kesalahan generalisasi (diberlakukan umum).
Pada buku ini diberikan dua rumus yang dapat digunakan untuk menghitung besarnya sampel yang diperlukan dalam penelitian. Selain itu juga diberikan cara menentukan ukuran sampel yang sangat praktis, yaitu dengan tabel dan nomogram.
Tabel yang digunakan adalah tabel Krejcie dan Nomogram Harry King. Dengan kedua cara tersebut tidak perlu dilakukan perhitungan yang rumit.
Krecjie dalam melakukan perhitungan ukuran sampel didasarkan atas kesalahan 5%. Jadi sampel yang diperoleh itu mempunyai kepercayaan 95% terhadap populasi.
Tabel Krecjie ditunjukkan pada tabel 3.1. Dari tabel itu terlihat bila jumlah populasi 100 maka sampelnya 80, bila populasi 1000 maka sampelnya 278, bila populasinya 1000
maka sampelnya 370, dan bila jumlah populasi 100.000 maka jumlah sampelnya 384.
Dengan demikian makin besar populasi makin kecil prosentase sampel. Oleh karena itu tidak tepat bila ukuran populasinya berbeda prosentase sampelnya sama, misalnya 10%.
Harry King menghitung sampel tidak hanya didasarkan atas kesalahan 5% saja, tetapi bervariasi sampai 15%. Tetapi jumlah populasi paling tinggi hanya 2000.
Nomogram ini ditunjukkan pada gambar 3.6. Dari gambar tersebut diberikan contoh bila populasi 200, kepercayaan sampel dalam mewakili populasi 95%, maka jumlah sampelnya sekitar 58% dari populasi. Jadi 0,58 x 200 116. Bila populasi 800, kepercayaan sampel 90% atau kesalahan 10 %, maka jumlah sampel = 7,5% dari populasi. Jadi 0,075 x 800 = 60. Terlihat disini semakin besar kesalahan akan semakin kecil jumlah sampel. Contoh mencari ukuran sampel diberikan di bawah nomogram (gambar 3.6).
Tabel 3.1 Table For Determining Needed Size S Of A Randomly Chosen Sample From A Given Finite Population Of N Cases Such That Sample Proportion Will Be Within
+.05 Of The Population Proportion P With A 95 Percent Level Of Confidence
N S N S N S
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 110 120 130 140 150 160 170 180 190 200 210
10 14 19 24 28 32 36 40 44 48 52 56 59 63 66 70 73 76 80 86 92 97 103 108 113 118 123 127 132 136
220 230 240 250 260 270 280 290 300 320 340 360 380 400 420 440 460 480 500 550 600 650 700 750 800 850 900 950 1000 1100
140 144 148 152 155 159 162 165 169 175 181 186 191 196 201 205 210 214 217 226 234 242 248 254 260 265 269 274 278 285
1200 1300 1400 1500 1600 1700 1800 1900 2000 2200 2400 2600 2800 3000 3500 4000 4500 5000 6000 J000 8000 9000 10000 15000 20000 30000 40000 50000 75000 100000
291 297 302 306 310 313 317 320 322 327 331 335 338 341 346 351 354 357 361 364 367 368 370 375 377 379 380 381 382 384
Catatan : N = jumlah populasi S = sampel
Contoh : Bila populasi 200 sampelnya 132. Tabel ini khusus untuk tingkat kesalahan 5%.
Gambar 3.6 Nomogram Harry King Untuk Menentukan Ukuran Sampel Dari Populasi Sampai 2.000
Contoh :
Misal populasi berjumlah 200. Bila dikehendaki kepercayaan sampel terhadap populasi 95% atau tingkat kesalahan 5%, maka jumlah sampel yang diambil 0,58 x 200 = 16 orang. (Tarik dari angka 200 melewati taraf kesalahan 5%, maka akan ditemukan titik di atas angka 60. Titik itu kurang lebih 58).
Cara menentukan ukuran sampel seperti yang dikemukakan didasarkan atas asumsi bahwa populasi berdistribusi normal. Bila sampel tidak berdistribusi normal, misalnya populasi homogen maka cara-cara tersebut tidak perlu dipakai. Misalnya
populasinya benda, katakan logam dimana susunan molekulnya homogen, maka jumlah sampel yang diperlukan 1% saja sudah mewakili.
a. Contoh Menentukan Ukuran Sampel dengan Tabel Krecjie dan Nomogram Harry King.
Penelitian akan dilakukan terhadap iklim kerja suatu organisasi. Sumber data yang digunakan adalah para pegawai yang ada pada organisasi tersebut (populasi).
Jumlah pegawainya 1000 terdiri atas lulusan S1 = 50, Sarjana Muda = 300, SMK = 100, SD = 50 (populasi berstrata).
Jumlah populasi = 1000. Bila kesalahan 5%, maka jumlah sampelnya = 278.
Karena populasi berstrata, maka sampelnya juga berstrata. Stratanya menurut tingkat pendidikan. Dengan demikian masing-masing sampel untuk tingkat pendidikan harus proporsional sesuai dengan populasi. Jadi jumlah sampel untuk :
S1 = 1000
50 x 278 = 13,90 = 14
SM =
1000
300 x 278 = 83,40 = 83 SMK =
1000
500 x 278 = 139,00 = 139 SMP =
1000
50 x 278 = 13,90 = 14 SD =
1000
100 x 278 = 27,80 = 28
Jadi jumlah sampelnya = 14 + 83 + 139 + 28 + 14 = 278
Pada perhitungan yang terdapat koma dibulatkan ke atas sehingga jumlah sampelnya lebih 278 yaitu 280. Hal ini lebih aman daripada kurang dari 278. Gambaran jumlah populasi dan sampel dapat ditunjukkan pada gambar 3.7 berikut:
Gambar 3.7 Sampel yang diambil dari populasi berstrata dengan kesalahan 5%
b. Contoh Menentukan Ukuran Sampel dengan Perhitungan
Bila ukuran sampel lebih dari 100.000, maka peneliti tidak bisa melihat tabel lagi, oleh karena itu peneliti harus dapat menghitung sendiri. Ada dua rumus yang dikemukakan disini yaitu yang tidak diketahui simpangan bakunya dan yang kedua yang diketahui simpangan bakunya.
Contoh 1:
Misal seorang peneliti ingin mengetahui produktivitas kerja pegawai di lembaga A.
peneliti berhipotesis bahwa produktivitas kerja pegawai di lembaga A paling sedikit 70% dari tolok ukur ideal yang ditetapkan. Untuk itu diperlukan ukuran sampel sebagai sumber datanya. Untuk menghitung ukuran sampel diperlukan rumus sebagai berikut:
Rumus 3.1 Dimana :
n = Ukuran sampel yang diperlukan
p = Prosentase hipotesis (Ho) dinyatakan dalam peluang yang besamya = 0,50 q = 1 - 0,50 = 0,50
p = Perbedaan antara yang ditaksir pada hipotesis kerja (Ha) dengan hipotesis nol (Ho), dibagi dengan z pada tingkat kepercayaan tertentu.
Misalnya tingkat kepercayaan 68%, z = 1; 95%, z = 1,96; 99%, z = 2,58.
Untuk contoh di atas misal taraf kepercayaan 95% berarti z = 1,96 maka :
p =
2
96 , 1
% 50
%
70
=
2
96 , 1
20 , 0
(0,1020)2 = 0,0104
Dengan demikian maka besarnya ukuran sampel yang diperlukan sebagai sumber data pada taraf kepercayaan 95% adalah :
n ≥ 0,0104
25 , 0 0104
, 0
) 50 , 0 )(
50 , 0
( =24,0292
Atau 25 orang, jadi paling sedikit diperlukan 25 orang sebagai sumber data.
Misalnya taraf kepercayaan yang dikehendaki 99% maka harga z = 2,58, maka sampel yang diperlukan adalah :
n ≥ 0,006
25 , 0 58
, 2
5 , 0 7 , 0
) 50 , 0 )(
50 , 0 (
2
= 41,60 = 42
Jadi diperlukan paling sedikit 42 orang.
Contoh 2 :
Untuk menaksir berapa tingkat kepuasan kerja pegawai di lembaga B diperlukan sebuah sampel. Taraf kepercayaan yang dikehendaki 99%. Perbedaan antara yang ditaksir dengan tolok ukur yang ditetapkan tidak lebih dari 10%. Jika diketahui simpangan bakunya 20% maka ukuran sampel dapat dihitung dengan rumus sebagai berikut :
Rumus 3.2 Dimana :
n = Ukuran sampel yang diperlukan
b = Perbedaan antara yang ditaksir dengan tolok ukur penafsiran
z = Harganya tergantung pada taraf kepercayaan yang ditetapkan. (lihat keterangan pada contoh pertama). Pada taraf kepercayaan 68%, z = 1; 95%, z = 1,96; 99%, z
= 2,58. Untuk harga-harga yang lain bisa dilihat pada tabel kurve normal standard didasarkan pada z½ taraf kercayaan. Taraf kepercayaan 95% berarti z½ . 95% = z0,475
dalam tabel ditemukan 1,96.
u = Simpangan baku
Untuk contoh di atas maka besarnya sampel dapat dihitung.
n ≥
2 2
10 , 0
516 , 0 10
, 0
58 , 2 . 20 ,
0
= 5,162 = 26,63
Ukuran sampelnya paling sedikit 27 orang.
Misalnya pegawai di lembaga B itu terdiri atas : 1. Golongan I = 15 orang
2. Golongan II = 30 orang 3. Golongan III = 15 orang
Maka jumlah sampel yang diperlukan :
1. Untuk golongan I = 15/60 x 27 = 6,75 = 7 orang 2. Untuk golongan II = 30/60 x 27 = 13,5 = 14 orang 3. Untuk golongan III = 15/60 x 27 = 6,75 = 7 orang –––––––––
Jumlah = 28 orang
4. Menentukan Anggota Sampel
Di bagian depan bab ini telah dikemukakan terdapat dua teknik sampling, yaitu probability sampling dan nonprobability sampling. Probability sampling adalah teknik sampling yang memberi peluang sama kepada anggota populasi untuk dipilih menjadi anggota sampel. Cara demikian sering disebut dengan random sampling, atau cara pengambilan sampel secara acak.
Pengambilan sampel secara random/acak dapat dilakukan dengan bilangan random, komputer, maupun dengan undian. Bila pengambilan dilakukan dengan undian, maka setiap anggota populasi diberi nomor terlebih dahulu, sesuai dengan jumlah anggota populasi.
Misalnya jumlah anggota populasi = 100, maka setiap anggota diberi nomor dari 1 sampai 100. Selanjutnya bila kesalahan 5%, maka jumlah sampelnya 80.
Bila sampel tidak berstrata, maka pengambilan sampel tidak perlu memperhatikan strata yang ada pada populasi, karena teknik pengarnbilan sampel adalah random, nk setiap anggota populasi mempunyai peluang sama untuk dipilih menjadi anggota sampel. Untuk contoh di atas peluang setiap anggota populasi 1/100.
Dengan demikian cara pengambilannya bila nomor satu telah diambil, maka perlu
dikembalikan lagi, kalau tidak dikembalikan peluangnya menjadi tidak sama lagi. Misal nomor pertama tidak dikembalikan lagi maka peluang berikutnya menjadi 1 : (100 - 1)
= 1/99. Peluang akan semakin besar bila yang telah diambil tidak dikembalikan. Bila yang telah diambil keluar lagi, dianggap tidak sah dan dikembalikan lagi.
D. Normalitas Data 1. Kurve Normal
Seperti dikemukanan bahwa, penggunaan Statistik Parametris, bekerja dengan asumsi bahwa data setiap variabel penelitian yang akan dianalisis membentuk distribusi normal. Bila data tidak normal, maka teknik Statistik Parametris tidak dapat digunakan untuk alat analisis. Sebagai gantinya digunakan teknik statistik lain, yang tidak harus berasumsi bahwa data berdistribusi normal. Teknik statistik itu adalah Statistik Nonparametris. Untuk itu sebelum peneliti akan menggunakan teknik statistik parametris sebagai analisisnya, maka peneliti harus membuktikan terlebih dahulu, apakah data yang akan dianalisis itu berdistribusi normal atau tidak.
Suatu data yang membentuk distribusi normal bila jumlah data di atas dan di bawah rata-rata adalah sama, demikian juga simpangan bakunya.
Dari gambar 3.8 di bawah terlihat bahwa nilai rata-rata 190 mahasiswa adalah 6.
Jumlah mahasiswa di atas dan di bawah rata-rata adalah sama yaitu (40 + 20 + 5) = 65.
Demikian juga simpangan di bawah dan di atas rata-rata adalah sama, yaitu 3,6. Di atas rata-rata = 96 - 65 = 30. Di bawah rata-rata 65 - 35 = 30. Dari gambar terlihat bahwa suatu kurve normal terjadi setelah titik pertemuan antar nilai dengan frekuensinya dihubungkan. Lihat gambar 3.8 berikut :
Gambar 3.8 Distribusi Nilai Salah Satu Matakuliah yang Membentuk Kurve Normal Luas kurve normal dapat terbagi berdasarkan jumlah standard deviasi dan data kelompok yang membentuk distribusi normal itu. Luas antara rata-rata (mean) terhadap satu standard seviasi (1s) ke kiri dan ke kanan masing-masing 34,13%; luas aritara satu
standard deviasi (1s) ke dua standard deviasi (2s) masing-masing adalah 13,59%, dan luas antara dua standard deviasi (2s) sampai tiga standard deviasi (3s) masing-masing adalah 2,27%. Lihat gambar 3.9 berikut. Jumlah standard deviasi dari suatu kelompok tidak terhingga, oleh karena itu secara teoritis kurve normal tidak akan pernah menyentuh garis dasar, sehingga luasnyapun tidak sampal 100% hanya mendekati 100%
(99,999999999%).
Kurve normal yang telah dibicarakan adalah kurve normal umum. Nilai rata-rata (X) dan simpangan baku (1s, 2s, 3s dst) yang ada pada kurve normal ini tergantung pada nilai yang ada dalam kelompok itu yang telah diperoleh melalui pengumpulan data.
Bentuk kurve adalah simetris, sehingga luas rata-rata (mean) X ke kanan dan kiri masing-masing mendekati 50% (dalam prakteknya langsung dinyatakan 50%).
Gambar 3.9 Prosetase Luas Kurve Normal
Selain terdapat kurve normal umum, juga terdapat kurve normal yang lain, disebut dengan Kurve Normal Standard. Dikatakan standard, karena nilai rata-ratanya adalah 0 dan simpangan bakunya adalah 1,2,3,4 dst. Nilai simpangan baku selanjutnya dinyatakan dalam simbul Z. Kurve normal umum dapat dirubah ke dalam kurve normal standard, dengan menggunakan rumus 3.3.
Rumus 3.3
Dimana :
Z = Simpangan baku untuk kurve normal standacl xi = Data ke i dari suatu kelompok data
X = Rata-rata kelompok s = Simpangan baku
Harga-harga z ada kaitannya dengan prosentase daerah kurve itu. Prosentase daerah dihitung dari rata-rata. Dalam hal ini rata-ratanya adalah 0. Misalnya z = 1,0 maka luas kurve dari 0 sampai 1 = 34,13%. Lihat tabel kurve normal di belakang.
Gambar kurve normal standard ditunjukkan pada gambar 3.10.
Gambar 3.10. Kurve Normal Standard. Rata-rata 0, Simpangan Baku 1, 2, 3.
2. Contoh Penggunaan Kurve Normal
Terdapat 200 mahasiswa yang ikut ujian mata kuliah statistik. Nilai rata-rata adalah 6 dan simpangan bakunya adalah 2. Beberapa orang yang mendapat nilai 8 ke atas?
Jawab : Rata-rata klas (X) = 6, dan simpangan baku (s) = 2. Dan rumus 4.5 dapat dihitung harga z.
z = 2
) 6 8 ( )
(
s X
Xi = 1
Dari tabel kurve normal dapat dilihat bahwa daerah 0 sampai dengan 1, luasnya
= 34,13. Ini adalah antara mean (rata-rata) dengan suatu titik yang jauhnya 1 SD di atas mean. Harga ini menunjukkan prosentase jumlah mahasiswa yang mendapat nilai antara 6 s/d 8. Dengan demikian prosentase yang mendapat nilai 8 ke atas adalah 50% - 34,13% = 15,87% (50% adalah setengah kurve di atas mean, dimana nilai 8 ke alas berada). Jadi mahasiswa yang mendapat nilai 8 keatas = 15,87 x 200 = 31,74 orang atau sekitar 32 orang. (200 jumlah seluruh mahasiswa). Lihat gambar 3.11.
Gambar 3.11. Jumlah Mahasiswa yang Mendapat Nilai 8 ke Atas
3. Pengujian Normalitas Data
Seperti dikemukakan dimuka bahwa Statistik Parametris itu bekerja berdasarkan asumsi bahwa data setiap variabel yang akan dianalisis berdistribusi normal. Untuk itu sebelum peneliti menggunakan teknik Statistik Parametris maka kenormalan data harus diuji terlebih dahulu. Bila data tidak normal, maka statistik parametris tidak dapat digunakan, untuk itu perlu digunakan statistik nonparametris. Tetapi perlu diingat bahwa yang menyebabkan tidak normal itu apanya. Misalnya ada kesalahan instrumen dan pengumpulan data, maka dapat mengakibatkan data yang diperoleh menjadi tidak akan normal. Tetapi bila sekelompok data memang betul-betul sudah valid, tetapi distribusinya tidak membentuk distribusi normal, maka peneliti baru membuat keputusan untuk menggunakan teknik statistik nonparametris.
Pada buku ini diberikan teknik pengujian normalitas data dengan menggunakan Kertas Peluang Normal dan Chi Kuadrad (2).
a. Pengujian dengan Kertas Peluang Normal
Terdapat beberapa teknik untuk menguji normalitas data antara lain dengan menggunakan Uji Liliefors, Chi Kuadrad (2) dan dengan menggunakan Kertas Peluang Normal. Pada kesempatan ini hanya akan disajikan cara uji normalitas data dengan Kertas Peluang Normal dan 2. Kertas ini berupa grafik yang khusus dibuat untuk keperluan itu (jadi bukan kertas mm).
Kertas peluang normal untuk keperluan pengujian normalitas data diberikan pada lampiran. Garis mendatar pada kertas itu menunjukkan batas kelas interval, sedangkan garis yang vertikal menunjukkan prosentase kumulatif.
Contoh dan Langkah-langkah Pengujian :
a. Yang akan diuji adalah data nilai ujian statistik 150 mahasiswa yang ada pada tabel 2.7 halaman 32;
b. Susunlah data tersebut ke dalam distribusi frekuensi kumulatif. Dalam hal ini telah tersusun pada halaman 32, dan dapat dipindah menjadi tabel 2.8;
c. Susunlah tabel distribusi frekuensi tersebut menjadi distribusi kumulatif. Dalam hal ini ditunjukkan pada tabel 3.3;
d. Susunlah tabel distribusi frekuensi kumulatif itu, menjadi distribusi frekuensi kumulatif relatif kurang dari.
Untuk kepertuan ini, nilai “kurang dari” digunakan nilai rata-rata antara batas atas dan suatu klas interval dengan batas bawah dari klas interval berikutnya. Misalnya nilai 19,5 adalah rata-rata dari 19+20.
Tabel 3.2
Distribusi Frekuensi Nilai Statistik 150 Mahasiswa
Tabel 3.3 Distribusi Frekuensi Kumulatif Nilai Statistik
150 Mahasiswa
Interval Data f Data fk
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
1 6 9 31 42 32 17 10 2
Kurang dari 19,5 Kurang dari 29,5 Kurang dari 39,5 Kurang dari 49,5 Kurang dari 595 Kurang dari 69,5 Kurang dari 79,5 Kurang dari 69,5 Kurang dari 99,5
1 7 16 47 89 121 138 148 150
e. Letakkan nilai data kurang dari pada garis horizontal bagian bawah kertas peluang normal, dan letakkan titik yang ditarik dan frekuensi kumulatifnya;
f. Hubungkan setiap titik yang telah dibuat, dan buatlah keputusan tentang normal- tidaknya data. Bila garis yang ditemukan membentuk garis lurus, atau mendekati maka data tersebut normal, bila membentuk menjadi tidak lurus, berarti tidak normal. Lihat gambar berikut.
Dari gambar itu, terlihat titik-titik yang dihubungkan membentuk garis lurus, dengan demikian dapat disimpulkan bahwa, data nilai statistik 150 mahasiswa tersebut berdistribusi normal.
b. Chi Kuadrad (2)
Pengujian normalitas data dengan (2) dilakukan dengan cara membandingkan kurve normal yang terbentuk dari data yang telah terkumpul (B) dengan kurve
normal baku/standard (A). Jadi membandingkan antara (B : A). Bila B tidak berbeda secara signifikan dengan A, maka B merupakan data yang berdistribusi normal.
Seperti ditunjukkan pada gambar 3.10, (halaman 72) bahwa kurve normal baku yang luasnya mendekati 100% itu dibagi menjadi 6 bidang berdasarkan simpangan bakunya, yaitu tiga bidang di bawah rata-rata (mean) dan tiga bidang di atas rata-rata.
Luas 6 bidang dalam kurve normal baku adalah : 2,27%; 13,53%; 34,13%; 34,13%;
13,53%; 2,27% (gambar bawah : A)
Contoh :
Data nilai ujian Mata Kuliah Statistik 150 mahasiswa, seperti yang tertera dalam halaman 29, setelah diuji dengan Kertas peluang Normal, akan diuji normalitasnya dengan Chi Kuadrad (2).
Langkah-langkah yang diperlukan adalah:
1. Menentukan jumlah klas interval. Untuk pengujian normalitas dengan Chi Kuadrad ini, jumlah klas interval ditetapkan = 6. Hal ini sesuai dengan 6 bidang yang ada pada Kurve Normal Baku.
2. Menentukan panjang klas interval.
Data Terbesar - Data terkeci) Panjang klas = –––––––––––––––––––––––––
6 (Jml klas interval)
PK = 6
13 94
= 13,5 dibulatkan menjadi 14
3. Menyusun ke dalam tabel distribusi frekuensi, sekaligus tabel penolong untuk menghitung harga Chi kuadrad Hitung. Lihat tabel 3.4
Tabel 3.4 Tabel Penolong Untuk Pengujian Normalitas Data Dengan Chi Kuadrad
Interval f0 fh f0.fh (f0 - fh)
n h
f f
f0 )2
(
13 - 27 28 - 42 43 - 57 58 - 72 72 - 86 87 -101
3 21 56 45 21 4
4 20 51 51 20 4
-1 1 5 -6
1 0
1 1 25 36 1 0
1: 4 = 0,25 0,05 0,49 0,70 0,05 0
Jumlah 150 150 0 1,54
fo = frekuensi/jumlah data hasil observasi
fh = jumlah/frekuensi yang diharapkan (prosentase luas tiap bidang dikalikan dengan n)
fo - fh = selisih data fo dengan fh
4. Menghitung fh (frekuensi yang diharapkan)
Cara menghitung fh, didasarkan pada prosentasi luas tiap bidang kurve normal dikalikan jumlah data observasi (jumlah individu dalam sampel). Dalam hal ini jumlah individu dalam sampel = 150. Jadi :
a. Baris pertama dan atas 2,7% x 150 = 4,05 dibulatkan menjadi 4 b. Baris kedua 13,53% x 150 = 20,29, dibulatkan menjadi 20 c. Baris ketiga 34,13% x 150 = 51,19 dibulatkan menjadi 51 d. Baris keempat 34,13% x 150 = 51,19 dibulatkan menjadi 51 e. Baris kelima 13,53% x 150 = 20,29 dibulatkan menjadi 20 f. Baris keenam 2,7% x 150 4,05 dibulatkan menjadi 4
5. Memasukkan harga-harga fh ke dalam tabel kolom fh, sekaligus menghitung harga- harga (fo - fh)2 dan
h h
f f
f0 )2
(
menjumlahkannya.
Harga
h h
f f
f0 )2
(
adalah merupakan harga Chi Kuadrad (2) hitung.
6. Membandingkan harga Chi Kuadrad Hitung dengan Chi Kuadrad Tabel. Bila harga Chi Kuadrad Hitung lebih kecil dari pada Harga Chi Kuadrad Tabel, maka distribusi data dinyatakan normal, dan bila lebih besar dinyatakan tidak normal.
Dalam perhitungan ditemukan Chi Kuadrad hitung = 1,54. Selanjutnya harga ini dibandingkan dengan harga Chi Kuadrad tabel dengan dk (derajad kebebasan) 6 - 1 = 5.
Berdasarkan Tabel Chi Kuadrad yang ada pada tabel VI, dapat diketahui bahwa bila dk 5 dan kesalahan yang ditetapkan = 5%, maka harga Chi Kuadrad tabel = 11,070. Karena harga Chi Kuadrad Hitung (1,54) lebih kecil dari harga Chi Kuadrad Tabel (11,070), maka distribusi data nilai statistik 150 mahasiswa tersebut dapat dinyatakan berdistribusi normal.
Soal Latihan :
1. Apakah yang dimaksud populasi dan sampel dalam suatu penelitian. Dapatkah satu orang digunakan sebaga populasi?
2. Sebutkan teknik-teknik sampling (teknik pengambilan sampel) yang anda ketahui?
3. Apakah perbedaan Nomogram Harry King bila dibandingkan dengan Tabel Krejcie dalam pengambilan sampel?
4. Seseorang peneliti bermaksud mengetahui kekuatan berdiri pelayan toko di Jakarta.
Dalam penelitian ini diajukan hipotesis bahwa kekuatan berdiri pelayan toko di Jakarta paling sedikit 10 jam per hari. Berapa ukuran sampel yang akan digunakan?
5. Untuk menguji hipotesis berapa lama daya tahan Batu Baterai merk tertentu diperlukan sebuah sampel. Taraf kepercayaan yang dikehendaki adalah 95%.
Perbedaan antara yang ditaksir (dihipotesiskan) dengan tolok ukur yang ditetapkan dari pabrik tidak lebih dari 10%. Jika simpangan baku daya tahan Batu Baterai telah diketahui sebesar 15%, berapa jumlah umur sampel yang akan digunakan untuk penelitian?
6. Gunakan Tabel Krejcie untuk menentukan berapa besar anggota sampel, bila populasi berjumlah 55.000 dan taraf kesalahan 5%.
7. Gunakan Nomogram Harry King untuk menentukan jumlah anggota sampel, bila populasi berjumlah 1.700 orang dengan taraf kesalahan, 1%, 5%, dan 12%.
Mengapa makin besar kesalahan jumlah sampel makin kecil?
8. Mengapa dalam statistik perlu mempelajari kurve normal. Kapan kita perlu membuktikan bahwa data yang akan dianalisis harus berdistribusi normal?
9. Teknik statistik apa saja yang dapat digunakan untuk menguji normalitas data?
10. Buktikan apakah data berikut membentuk kurve normal atau tidak : 78 23 45 67 87 23 45 68 90 87 13 45 67 89 45 67 34 56 78 67 56 49 56 78 29 67 45 65 45 67 87 67 78 34 89 98 67 45 65 76
74 83 87 65 34 43 23 34 45 67 87 56 76 89 76 45 56 78 67 54 56 78 90 87 43 54 32 34 23 45 67 87 65 45 89 96 56 23 54 34 56 34 67 56 54 45 56 67 78 67 56 45 58 78 45 78 98 76 75 64 56 35 33 45 56 78 45 78 89 76 56 45 89 70 98 87 65 25 36 71