statistika untuk
penelitian
Kelompok Ilmiah Remaja (KIR)
Delayota Experiment Team (D’Expert) 2013
Apa itu Statistika ?
• Statistika adalah ilmu yang mempelajari cara pengumpulan, pengolahan, penyajian, dan pengambilan kesimpulan berdasarkan data.
• Ilmu Statistika berperan penting dalam peneli-tian-penelitian kuantitatif, yakni sebagai dasar dalam melakukan analisis hingga pengambilan kesimpulan untuk memecahkan masalah.
Cabang Statistika
• STATISTIKA DESKRIPTIF merupakan cabang
statistika yang secara khusus mempelajari cara pengumpulan, pengolahan, hingga penyajian data.
• STATISTIKA INFERENSI merupakan cabang
statistika yang secara khusus mempelajari cara penarikan kesimpulan dari sekumpulan data. • Kedua cabang statistika ini saling berkaitan
Ilustrasi (1)
• Fino ingin mengetahui pengaruh Bantuan
Program Nasional Pemberdayaan Masyarakat (PNPM) Mandiri di DIY terhadap laba usaha para penerimanya.
• Lihat kembali materi tentang populasi dan sampel penelitian!
– Populasi dalam penelitian ini adalah seluruh
masyarakat DIY yang menerima bantuan PNPM Mandiri.
– Populasi ini tersebar di berbagai kecamatan di DIY, sehingga perlu dilakukan pengambilan sampel.
• Fino mengumpulkan data penerima bantuan PNPM Mandiri di DIY.
• Fino mengambil beberapa penerima bantuan PNPM Mandiri sebagai
sampel penelitian.
• Fino mengumpulkan data penghasilan sampel sebelum dan sesudah adanya bantuan PNPM Mandiri.
• Fino menghitung rata-rata dan
simpangan baku penghasilan sampel.
• Fino menarik kesimpulan tentang
kondisi populasi berdasarkan sampel: menjawab pertanyaan apakah laba usaha populasi dipengaruhi oleh adanya bantuan PNPM Mandiri.
Ranah
Statistika
deskriptif
Ranah
Statistika
inferensi
Ilustrasi (2)
• Aga ingin mengetahui pengaruh pemberian ekstrak buah kluwih
terhadap kadar glukosa darah pada mencit (tikus). • Untuk itu, ia melakukan
percobaan pengukuran kadar gula darah mencit sebelum dan sesudah pemberian ekstrak buah kluwih pada dosis tertentu.
• Bagaimana cara Aga mengetahui
adanya perubahan kadar gula darah mencit sebelum dan sesudah
pemberian ekstrak buah kluwih ? • Berapa banyak mencit yang harus
digunakan sebagai “bahan” dalam percobaan ini ?
• Bagaimana Aga menjamin bahwa perubahan kadar gula darah pada mencit (bila ada) merupakan akibat dari pemberian ekstrak buah kluwih ? • Seandainya Budi mengulangi
percobaan Aga ini, apakah ia juga akan mendapatkan kesimpulan yang sama dengan Aga ?
Ranah
Statistika
deskriptif
Ranah
Statistika
inferensi
STATISTIKA DESKRIPTIF
Ringkasan Data
• Pada umumnya, orang tidak dapat mengambil kesimpulan apapun hanya dengan melihat atau membaca sekumpulan angka.
• Agar kumpulan angka tersebut dapat memiliki makna dan dapat digunakan untuk menarik kesimpulan, angka-angka tersebut haruslah
diringkas, diolah, atau disajikan sedemikian rupa dengan bantuan statistika deskriptif.
• Teknik penyajian data telah dibahas pada slide lain berjudul “Penyajian Data”, sehingga tidak akan dibahas lagi pada slide ini.
Ukuran Kecenderungan Data
• Para ahli statistika umumnya menggunakan beberapa ukuran di bawah ini untuk
menggambarkan karakteristik suatu data.
– Ukuran kecenderungan memusat
– Ukuran kecenderungan memencar / menyebar – Ukuran letak
– Ukuran kelancipan
– Ukuran kemencengan
Ukuran Kecenderungan Memusat
• Pada umumnya, hasil amatan berada di sekitar nilai-nilai tertentu. Nilai tertentu inilah yang
dinamakan ukuran kecenderungan memusat. • Beberapa contoh ukuran kecenderungan
memusat yang dapat digunakan:
– Rata-rata hitung (arithmatic mean) – Rata-rata ukur (geometric mean)
– Rata-rata harmonis (harmonic mean) – Modus
Rata-rata Hitung
• Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata hitung didefinisikan sebagai
• Bila tidak disebutkan lain, maka yang
dimaksud dengan “rata-rata” biasanya adalah rata-rata hitung (arithmatic mean) di atas.
n i i x 1 n 1 hitung rata -rataRata-rata Ukur
• Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata ukur didefinisikan sebagai
• Rata-rata ukur pada umumnya digunakan bila perbandingan tiap dua data berurutan tetap atau hampir tetap (lihat Sudjana, 1992:72).
n 2 1 ... ukur rata -rata x x x n
Rata-rata Harmonis
• Misal dimiliki n buah data, x1, x2, ..., xn. Rata rata harmonis didefinisikan sebagai
• Rata-rata harmonis dapat digunakan misalnya pada ukuran rasio / perbandingan (lihat
Sudjana, 1992:75; Dajan, 1995:159).
n 1 i 1 n harmonis rata -rata i xModus
• Modus didefinisikan sebagai data yang paling sering muncul atau data dengan frekuensi
kemunculan tertinggi.
• Pada data kuantitatif, modus jarang digunakan sebagai ukuran kecenderungan memusat
karena suatu kumpulan data
• Bisa tidak memiliki modus, atau
• Bisa memiliki tepat satu modus, atau • Bisa memiliki lebih dari satu modus.
Median
• Misal dimiliki statistik peringkat atau order
statistics, yakni data yang telah diurutkan dari
yang terkecil hingga terbesar. Median merupakan nilai yang membagi statistik peringkat tersebut menjadi dua kumpulan yang jumlah anggotanya sama.
• Ilustrasi:
Ukuran Kecenderungan Menyebar
• Ukuran kecenderungan menyebar / memencar menunjukkan persebaran data di sekitar nilai tengah (ukuran kecenderungan memusat).
• Beberapa ukuran yang sering digu-nakan: - jangkauan (range) - ragam (variance) - simpangan baku Same center, different variation
Jangkauan
• Jangkauan (range) menyatakan selisih datum terbesar (xmax) dengan datum terkecil (xmin). • Meskipun paling mudah dihitung, jangkauan
jarang digunakan karena sangat dipengaruhi oleh nilai-nilai ekstrim. Selain itu, jangkauan tidak dipengaruhi oleh data di antara datum terbesar dan datum terkecil itu.
Ragam
• Ragam atau varians (variance) didefinisikan
sebagai rata-rata kuadrat jarak masing-masing datum terhadap nilai tengah (rata-rata).
• Misal dimiliki n buah data, x1, x2, ..., xn, dan x menyatakan rata-rata sampel, ragam sampel didefinisikan sebagai:
• Akar kuadrat dari ragam disebut simpangan baku
atau deviasi standar.
n
-
1
)
x
(x
s
n 1 i 2 i 2
Ukuran Kemencengan
• Ukuran kemencengan (skewness)
menunjukkan bentuk distribusi data; suatu
data dapat berdistribusi simetris, menceng ke kanan, maupun menceng ke kiri.
Ukuran Kelancipan
• Ukuran kelancipan suatu distribusi data disebut
kurtosis. Berdasarkan nilai kurtosis, kita mengenal
tiga macam distribusi.
• Dalam analisis statistika sehari-hari, kurtosis maupun ukuran kemencengan jarang digunakan.
STATISTIKA INFERENSI
Mengapa diperlukan Inferensi ?
• Dalam penelitian, seringkali kita berhadapan dengan penentuan sifat-sifat populasi, yang meliputi:
– Rata-rata populasi (biasa dilambangkan μ)
– Simpangan baku populasi (biasa dilambangkan σ) – Proporsi dalam populasi (biasa dilambangkan π)
• Baik μ, σ, maupun π tidak dapat diketahui
atau dihitung secara langsung, namun dapat dipelajari melalui proses inferensi
• Contoh 1:
• Dalam kasus I di muka, seharusnya Fino membandingkan rata-rata penghasilan
populasi, yakni seluruh penerima bantuan PNPM Mandiri, sebelum dan sesudah
penyaluran bantuan. Fino tidak mungkin menanyai seluruh penerima bantuan ini,
sehingga rata-rata penghasilan populasi tidak dapat diketahui. Yang dapat Fino kumpulkan hanyalah data penghasilan sebagian penerima bantuan PNPM Mandiri sebagai sampel. Dari data sampel inilah Fino harus menyelidiki rata-rata penghasilan populasi.
• Contoh 2:
• Menanggapi ide penggunaan hasil UN sebagai syarat masuk Perguruan Tinggi, ingin diketahui persepsi siswa SMA di Indonesia (setuju/tidak setuju) terhadap ide tersebut. Untuk itu,
seharusnya dilakukan referendum kepada
seluruh siswa SMA, namun hal ini tidak dapat dilakukan mengingat banyaknya jumlah siswa dan distribusi sekolah dari kota hingga pelosok. Oleh karena itu, tidak dapat diketahui besarnya bagian (proporsi) keseluruhan siswa SMA yang setuju terhadap wacana tersebut. Yang dapat diketahui hanyalah proporsi dari sampel siswa-siswi SMA.
• Dalam ilustrasi di atas, parameter populasi θ
dapat berupa rata-rata (μ), simpangan baku (σ), maupun proporsi (π) akan dipelajari melalui
Alur Berpikir dalam Inferensi
populasi sampel Diambil sebagian (secara acak) Dianalisis untuk memperoleh statistik sampel PROSES INFERENSI Parameter populasiProsedur Inferensi
• Menduga nilai-nilai parameter populasi
berdasarkan informasi atau data statistik sampel
Estimasi
• Menentukan apakah
hipotesis tentang parameter populasi didukung oleh
informasi sampel.
Uji
Estimasi
• Estimasi atau pendugaan dapat dilakukan dengan dua cara, yakni estimasi titik dan estimasi
interval.
• Pada estimasi titik, nilai statistik sampel langsung digunakan sebagai penduga (estimator)
parameter populasi.
• Pada estimasi interval, statistik sampel digunakan membentuk suatu selang (interval) yang memuat parameter populasi dengan probabilitas tertentu. Hasil estimasi interval disebut “selang
– Contoh: Diketahui 60% sampel siswa SMA menolak ide penggunaan hasil UN sebagai syarat masuk
perguruan tinggi.
– Hasil estimasi titik: 60% siswa SMA di Indonesia (populasi) menolak ide tersebut.
– Hasil estimasi interval: Peluang bahwa 55%
sampai 65% siswa SMA di Indonesia menolak ide tersebut adalah sebesar 0,95. Interval 55% - 65% ini merupakan suatu “interval konfidensi”.
(rata-rata, μ, tidak diketahui) populasi Rata-rata X = 50 Sampel acak Saya 95% yakin bahwa rata-rata populasi μ di antara 40 & 60.
Permasalahan yang timbul pada estimasi interval adalah bagaimana menentukan batas keyakinan dengan peluang tertentu.
Uji Hipotesis
• Dalam pengujian hipotesis, mula-mula peneliti menyusun hipotesis statistik, yakni dugaan
tentang nilai parameter populasi.
• Suatu hipotesis statistik selalu dinyatakan dalam bentuk pasangan
– Hipotesis nol (H0): hipotesis yang tidak memihak – Hipotesis alternatif (H1 atau Ha): lawan dari
hipotesis nol.
• Contoh pembentukan hipotesis statistik dari masalah nyata dapat dilihat pada slide berikut.
• Dalam kasus 1 di muka, misal μ1 menyatakan rata-rata laba usaha masyarakat penerima
PNPM Mandiri sebelum bantuan diberikan dan μ2 menyatakan rata-rata laba usaha
masyarakat penerima PNPM Mandiri setelah bantuan diberikan.
• Hipotesis nol dan hipotesis alternatif dapat disusun sebagai berikut:
– H0: μ1 - μ2 ≤ 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan tidak lebih besar daripada setelah penerimaan bantuan)
– H1: μ1 - μ2 > 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan lebih besar
• Selanjutnya, dari data sampel akan dihitung
rata-rata selisih laba usaha sampel penerima bantuan
PNPM Mandiri sebleum dan sesudah pemberian bantuan. Rata-rata selisih laba usaha sampel ini akan dibandingkan dengan nilai tertentu.
• Bila nilainya jauh lebih besar daripada nol,
maka kita akan menolak Hipotesis nol (dengan demikian menerima hipotesis alternatif).
• Bila nilainya lebih kecil atau berada di sekitar nol, kita akan menerima hipotesis nol (dengan demikian menolak hipotesis alternatif).
• Aturan penerimaan atau penolakan hipotesis nol ini dinamakan daerah kritik.
Kesalahan dalam Uji Hipotesis
Kesimpulan yang diambil
Kondisi Populasi Sebenarnya
Sesuai H0 Tidak sesuai H0
H0 tidak ditolak Keputusan Tepat Keputusan salah (tipe II) H0 ditolak Keputusan salah (tipe I) Keputusan tepat
• Dalam pengujian hipotesis, kesimpulan yang diambil berdasarkan sampel belum tentu cocok dengan kondisi populasi, namun kita tak pernah tahu kondisi populasi tersebut. Yang dapat kita ketahui mengenai tepat tidaknya kesimpulan pada uji hipotesis adalah sebagai berikut.
• Pandang suatu kasus persidangan seseorang yang diduga melakukan tindak pidana korupsi.
• H0: terdakwa tidak bersalah • H1: terdakwa bersalah
• Bila H0 benar, tentu terdakwa harus dinyatakan bebas, sebaliknya bila H1 benar, terdakwa akan dihukum.
• Dalam analogi di atas, kesalahan tipe I adalah menghukum terdakwa yang tidak bersalah, sedang kesalahan tipe II adalah membebaskan terdakwa yang bersalah. Kesalahan tipe I dipandang lebih serius daripada tipe II, sehingga perlu diperhatikan
peluang terjadinya kesalahan tipe I (biasa dilambangkan dengan huruf yunani α).
• Nilai α selalu dibuat kecil, namun tidak pernah sama dengan nol karena kesalahan tipe I akan selalu ada. Oleh karena itu,
• Pada penelitian-penelitian kedokteran atau
farmasi (yang berkaitan dengan nyawa manusia), umumnya diambil α sebesar 0,01.
• Pada penelitian-penelitian pertanian, sosial
budaya, kependidikan, umumnya diambil α yang lebih besar, yakni 0,05.
• Penentuan nilai α akan berpengaruh terhadap
Contoh Prosedur Uji Hipotesis
Populasi
Claim: rata-rata usia populasi penduduk suatu daerah adalah 50 tahun. H0: μ = 50 REJECT Misalkan rata-rata usia sampel adalah 20 tahun, x = 20 Sampel Null Hypothesis 20 likely if μ = 50? Is If not likely, Ambil sampel acak X
SEBARAN PELUANG
Mengapa Perlu Sebaran Peluang ?
• Melalui proses inferensi, seorang peneliti akan menarik kesimpulan mengenai keadaan atau sifat-sifat populasi berdasarkan informasi dari sampel.
• Proses inferensi tidak pernah lepas dari
kesalahan. Oleh karena itu, diperlukan cara untuk mengukur peluang atau probabilitas terjadinya kesalahan tersebut.
• Mengingat sifat data populasi yang
bermacam-macam, peluang dalam inferensi akan ditentukan dengan memodelkan data populasi mengikuti
Apa itu Sebaran Peluang?
• Sebaran peluang atau probability distribution merupakan suatu fungsi yang digunakan untuk menyatakan peluang suatu variabel (random) memiliki suatu nilai tertentu.
• Contoh:
– Variabel tinggi badan siswa peluang terdapat siswa dengan tinggi badan 160 cm – 180 cm.
– Variabel jenis kelamin siswa dari 5 siswa yang diambil secara acak di suatu SMU, peluang bahwa seluruhnya duduk di kelas X program MIPA.
Sebaran Binomial
• Sebaran Binomial digunakan untuk memodelkan peluang data hasil percobaan binomial, yakni:
– Hanya dapat menjalani tepat satu dari dua hasil yang mungkin.
– Peluang terjadinya hasil-hasil tersebut selalu tetap.
– Percobaan (upaya) dilakukan berulang sebanyak n kali.
• Contoh: Memodelkan banyaknya anak yang
terkena penyakit cacar air di suatu daerah: hasil yang mungkin adalah “anak terkena cacar air” dan “anak sehat”.
• Bila percobaan dalam peluang distribusi
binomial diulang n kali, peluang mendapatkan x hasil “sukses” dapat dihitung dengan:
Dalam model ini p menyatakan peluang
tercapainya “sukses” dalam setiap ulangan. • Sebaran binomial umumnya digunakan pada
inferensi tentang proporsi populasi
(banyaknya anggota populasi yang termasuk dalam suatu kategori / kelompok tertentu) dan uji independensi antarvariabel kategorik.
P(x) n x ! n x P (1- P) X n X ! ( )!
• Selain menggunakan rumus, peluang suatu sebaran binomial juga dapat ditentukan
dengan bantuan tabel distribusi binomial atau dengan bantuan Microsoft Excel.
Sebaran Normal
• Sebaran normal lebih umum dijumpai
daripada sebaran
binomial, karena banyak sekali distribusi data
dalam kehidupan sehari-hari yang mengikuti pola distribusi normal.
• Ide dasar distribusi
normal adalah data yang sedikit memiliki ekstrem namun tinggi di bagian tengah.
• Bentuk kurva distribusi normal bergantung pada mean (μ) dan simpangan baku (σ) pada persamaan berikut: 2 2/2σ μ) (x e 2π 1 f(x) • Secara khusus didefinisikan distribusi normal standar yakni distribusi normal dengan nilai μ = 0 dan σ = 1.
• Peluang pada sebaran normal ekuivalen dengan luas daerah yang berada di bawah kurva normal, sehingga dapat dihitung dengan kalkulus integral.
• Perhitungan nilai probabilitas dengan pengintegralan fungsi distribusi normal di atas sangat merepotkan, sehingga digunakan transformasi berikut
untuk “membawa” distribusi normal N (μ,σ2) ke
distribusi normal standard N(0,1).
• Peluang distribusi normal standard dapat ditentukan menggunakan tabel distribusi peluang normal
standard atau sering disebut tabel Z.
σ
μ
X
Sebaran Student-t
• Dibandingkan sebaran normal, distribusi student-t memiliki ujung (ekor) yang lebih tinggi. Bentuk kurva
student-t ditentukan oleh derajat bebas (degree of freedom) sebesar k, dengan persamaan:
• Perhitungan peluang dengan mengintegralkan fungsi di atas sangat sulit, sehingga digunakan tabel.
2 1 2 1 1 2 2 1 k) f(x; k k x k k k
• Perbandingan bentuk kurva distribusi student-t dengan berbagai nilai derajat bebas.
• Catatan: nama “student-t” merupakan samaran dari William Searly Gosset, penemu distribusi ini.
RUJUKAN
• Dajan, Anto. 1991. Pengantar Metode
Statistika II. Jakarta: LP3ES.
• Gunardi. 1999. Diktat Kuliah Metode
Statistika. Yogyakarta: Fakultas Matematika
dan Ilmu Pengetahuan Alam Universitas Gadjah Mada.
• Subanar. 2013. Statistika Matematika. Yogyakarta: Graha Iklmu
• Sudjana. 1989. Metode Statistika. Bandung: Tarsito