statistika untuk penelitian

(1)

statistika untuk

penelitian

Kelompok Ilmiah Remaja (KIR)

Delayota Experiment Team (D’Expert) 2013

(2)

Apa itu Statistika ?

• Statistika adalah ilmu yang mempelajari cara pengumpulan, pengolahan, penyajian, dan pengambilan kesimpulan berdasarkan data.

• Ilmu Statistika berperan penting dalam peneli-tian-penelitian kuantitatif, yakni sebagai dasar dalam melakukan analisis hingga pengambilan kesimpulan untuk memecahkan masalah.

(3)

Cabang Statistika

• STATISTIKA DESKRIPTIF merupakan cabang

statistika yang secara khusus mempelajari cara pengumpulan, pengolahan, hingga penyajian data.

• STATISTIKA INFERENSI merupakan cabang

statistika yang secara khusus mempelajari cara penarikan kesimpulan dari sekumpulan data. • Kedua cabang statistika ini saling berkaitan

(4)

Ilustrasi (1)

• Fino ingin mengetahui pengaruh Bantuan

Program Nasional Pemberdayaan Masyarakat (PNPM) Mandiri di DIY terhadap laba usaha para penerimanya.

• Lihat kembali materi tentang populasi dan sampel penelitian!

– Populasi dalam penelitian ini adalah seluruh

masyarakat DIY yang menerima bantuan PNPM Mandiri.

– Populasi ini tersebar di berbagai kecamatan di DIY, sehingga perlu dilakukan pengambilan sampel.

(5)

• Fino mengumpulkan data penerima bantuan PNPM Mandiri di DIY.

• Fino mengambil beberapa penerima bantuan PNPM Mandiri sebagai

sampel penelitian.

• Fino mengumpulkan data penghasilan sampel sebelum dan sesudah adanya bantuan PNPM Mandiri.

• Fino menghitung rata-rata dan

simpangan baku penghasilan sampel.

• Fino menarik kesimpulan tentang

kondisi populasi berdasarkan sampel: menjawab pertanyaan apakah laba usaha populasi dipengaruhi oleh adanya bantuan PNPM Mandiri.

Ranah

Statistika

deskriptif

Ranah

Statistika

inferensi

(6)

Ilustrasi (2)

• Aga ingin mengetahui pengaruh pemberian ekstrak buah kluwih

terhadap kadar glukosa darah pada mencit (tikus). • Untuk itu, ia melakukan

percobaan pengukuran kadar gula darah mencit sebelum dan sesudah pemberian ekstrak buah kluwih pada dosis tertentu.

(7)

• Bagaimana cara Aga mengetahui

adanya perubahan kadar gula darah mencit sebelum dan sesudah

pemberian ekstrak buah kluwih ? • Berapa banyak mencit yang harus

digunakan sebagai “bahan” dalam percobaan ini ?

• Bagaimana Aga menjamin bahwa perubahan kadar gula darah pada mencit (bila ada) merupakan akibat dari pemberian ekstrak buah kluwih ? • Seandainya Budi mengulangi

percobaan Aga ini, apakah ia juga akan mendapatkan kesimpulan yang sama dengan Aga ?

Ranah

Statistika

deskriptif

Ranah

Statistika

inferensi

(8)

STATISTIKA DESKRIPTIF

(9)

Ringkasan Data

• Pada umumnya, orang tidak dapat mengambil kesimpulan apapun hanya dengan melihat atau membaca sekumpulan angka.

• Agar kumpulan angka tersebut dapat memiliki makna dan dapat digunakan untuk menarik kesimpulan, angka-angka tersebut haruslah

diringkas, diolah, atau disajikan sedemikian rupa dengan bantuan statistika deskriptif.

• Teknik penyajian data telah dibahas pada slide lain berjudul “Penyajian Data”, sehingga tidak akan dibahas lagi pada slide ini.

(10)

Ukuran Kecenderungan Data

• Para ahli statistika umumnya menggunakan beberapa ukuran di bawah ini untuk

menggambarkan karakteristik suatu data.

– Ukuran kecenderungan memusat

– Ukuran kecenderungan memencar / menyebar – Ukuran letak

– Ukuran kelancipan

– Ukuran kemencengan

(11)

Ukuran Kecenderungan Memusat

• Pada umumnya, hasil amatan berada di sekitar nilai-nilai tertentu. Nilai tertentu inilah yang

dinamakan ukuran kecenderungan memusat. • Beberapa contoh ukuran kecenderungan

memusat yang dapat digunakan:

– Rata-rata hitung (arithmatic mean) – Rata-rata ukur (geometric mean)

– Rata-rata harmonis (harmonic mean) – Modus

(12)

Rata-rata Hitung

• Misal dimiliki n buah data, x₁, x₂, ..., x_n. Rata rata hitung didefinisikan sebagai

• Bila tidak disebutkan lain, maka yang

dimaksud dengan “rata-rata” biasanya adalah rata-rata hitung (arithmatic mean) di atas.



  n i i x 1 n 1 hitung rata -rata

(13)

Rata-rata Ukur

• Misal dimiliki n buah data, x₁, x₂, ..., x_n. Rata rata ukur didefinisikan sebagai

• Rata-rata ukur pada umumnya digunakan bila perbandingan tiap dua data berurutan tetap atau hampir tetap (lihat Sudjana, 1992:72).

n 2 1 ... ukur rata -rata  x x x _n

(14)

Rata-rata Harmonis

• Misal dimiliki n buah data, x₁, x₂, ..., x_n. Rata rata harmonis didefinisikan sebagai

• Rata-rata harmonis dapat digunakan misalnya pada ukuran rasio / perbandingan (lihat

Sudjana, 1992:75; Dajan, 1995:159).



  _n 1 i 1 n harmonis rata -rata i x

(15)

Modus

• Modus didefinisikan sebagai data yang paling sering muncul atau data dengan frekuensi

kemunculan tertinggi.

• Pada data kuantitatif, modus jarang digunakan sebagai ukuran kecenderungan memusat

karena suatu kumpulan data

• Bisa tidak memiliki modus, atau

• Bisa memiliki tepat satu modus, atau • Bisa memiliki lebih dari satu modus.

(16)

Median

• Misal dimiliki statistik peringkat atau order

statistics, yakni data yang telah diurutkan dari

yang terkecil hingga terbesar. Median merupakan nilai yang membagi statistik peringkat tersebut menjadi dua kumpulan yang jumlah anggotanya sama.

• Ilustrasi:

(17)

Ukuran Kecenderungan Menyebar

• Ukuran kecenderungan menyebar / memencar menunjukkan persebaran data di sekitar nilai tengah (ukuran kecenderungan memusat).

• Beberapa ukuran yang sering digu-nakan: - jangkauan (range) - ragam (variance) - simpangan baku Same center, different variation

(18)

Jangkauan

• Jangkauan (range) menyatakan selisih datum terbesar (x_max) dengan datum terkecil (x_min). • Meskipun paling mudah dihitung, jangkauan

jarang digunakan karena sangat dipengaruhi oleh nilai-nilai ekstrim. Selain itu, jangkauan tidak dipengaruhi oleh data di antara datum terbesar dan datum terkecil itu.

(19)

Ragam

• Ragam atau varians (variance) didefinisikan

sebagai rata-rata kuadrat jarak masing-masing datum terhadap nilai tengah (rata-rata).

• Misal dimiliki n buah data, x₁, x₂, ..., x_n, dan x menyatakan rata-rata sampel, ragam sampel didefinisikan sebagai:

• Akar kuadrat dari ragam disebut simpangan baku

atau deviasi standar.

_n

_-

₁

)

x

(x

s

n 1 i 2 i 2









(20)

Ukuran Kemencengan

• Ukuran kemencengan (skewness)

menunjukkan bentuk distribusi data; suatu

data dapat berdistribusi simetris, menceng ke kanan, maupun menceng ke kiri.

(21)

Ukuran Kelancipan

• Ukuran kelancipan suatu distribusi data disebut

kurtosis. Berdasarkan nilai kurtosis, kita mengenal

tiga macam distribusi.

• Dalam analisis statistika sehari-hari, kurtosis maupun ukuran kemencengan jarang digunakan.

(22)

STATISTIKA INFERENSI

(23)

Mengapa diperlukan Inferensi ?

• Dalam penelitian, seringkali kita berhadapan dengan penentuan sifat-sifat populasi, yang meliputi:

– Rata-rata populasi (biasa dilambangkan μ)

– Simpangan baku populasi (biasa dilambangkan σ) – Proporsi dalam populasi (biasa dilambangkan π)

• Baik μ, σ, maupun π tidak dapat diketahui

atau dihitung secara langsung, namun dapat dipelajari melalui proses inferensi

(24)

• Contoh 1:

• Dalam kasus I di muka, seharusnya Fino membandingkan rata-rata penghasilan

populasi, yakni seluruh penerima bantuan PNPM Mandiri, sebelum dan sesudah

penyaluran bantuan. Fino tidak mungkin menanyai seluruh penerima bantuan ini,

sehingga rata-rata penghasilan populasi tidak dapat diketahui. Yang dapat Fino kumpulkan hanyalah data penghasilan sebagian penerima bantuan PNPM Mandiri sebagai sampel. Dari data sampel inilah Fino harus menyelidiki rata-rata penghasilan populasi.

(25)

• Contoh 2:

• Menanggapi ide penggunaan hasil UN sebagai syarat masuk Perguruan Tinggi, ingin diketahui persepsi siswa SMA di Indonesia (setuju/tidak setuju) terhadap ide tersebut. Untuk itu,

seharusnya dilakukan referendum kepada

seluruh siswa SMA, namun hal ini tidak dapat dilakukan mengingat banyaknya jumlah siswa dan distribusi sekolah dari kota hingga pelosok. Oleh karena itu, tidak dapat diketahui besarnya bagian (proporsi) keseluruhan siswa SMA yang setuju terhadap wacana tersebut. Yang dapat diketahui hanyalah proporsi dari sampel siswa-siswi SMA.

(26)

• Dalam ilustrasi di atas, parameter populasi θ

dapat berupa rata-rata (μ), simpangan baku (σ), maupun proporsi (π) akan dipelajari melalui

(27)

Alur Berpikir dalam Inferensi

populasi sampel Diambil sebagian (secara acak) Dianalisis untuk memperoleh statistik sampel PROSES INFERENSI Parameter populasi

(28)

Prosedur Inferensi

• Menduga nilai-nilai parameter populasi

berdasarkan informasi atau data statistik sampel

Estimasi

• Menentukan apakah

hipotesis tentang parameter populasi didukung oleh

informasi sampel.

Uji

(29)

Estimasi

• Estimasi atau pendugaan dapat dilakukan dengan dua cara, yakni estimasi titik dan estimasi

interval.

• Pada estimasi titik, nilai statistik sampel langsung digunakan sebagai penduga (estimator)

parameter populasi.

• Pada estimasi interval, statistik sampel digunakan membentuk suatu selang (interval) yang memuat parameter populasi dengan probabilitas tertentu. Hasil estimasi interval disebut “selang

(30)

– Contoh: Diketahui 60% sampel siswa SMA menolak ide penggunaan hasil UN sebagai syarat masuk

perguruan tinggi.

– Hasil estimasi titik: 60% siswa SMA di Indonesia (populasi) menolak ide tersebut.

– Hasil estimasi interval: Peluang bahwa 55%

sampai 65% siswa SMA di Indonesia menolak ide tersebut adalah sebesar 0,95. Interval 55% - 65% ini merupakan suatu “interval konfidensi”.

(31)

(rata-rata, μ, tidak diketahui) populasi _Rata-rata X = 50 Sampel acak Saya 95% yakin bahwa rata-rata populasi μ di antara 40 & 60.

 Permasalahan yang timbul pada estimasi interval adalah bagaimana menentukan batas keyakinan dengan peluang tertentu.

(32)

Uji Hipotesis

• Dalam pengujian hipotesis, mula-mula peneliti menyusun hipotesis statistik, yakni dugaan

tentang nilai parameter populasi.

• Suatu hipotesis statistik selalu dinyatakan dalam bentuk pasangan

– Hipotesis nol (H₀): hipotesis yang tidak memihak – Hipotesis alternatif (H₁ atau H_a): lawan dari

hipotesis nol.

• Contoh pembentukan hipotesis statistik dari masalah nyata dapat dilihat pada slide berikut.

(33)

• Dalam kasus 1 di muka, misal μ₁ menyatakan rata-rata laba usaha masyarakat penerima

PNPM Mandiri sebelum bantuan diberikan dan μ₂ menyatakan rata-rata laba usaha

masyarakat penerima PNPM Mandiri setelah bantuan diberikan.

• Hipotesis nol dan hipotesis alternatif dapat disusun sebagai berikut:

– H₀: μ₁ - μ₂ ≤ 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan tidak lebih besar daripada setelah penerimaan bantuan)

– H1: μ₁ - μ₂ > 0 (rata-rata laba usaha masyarakat sebelum penerimaan bantuan lebih besar

(34)

• Selanjutnya, dari data sampel akan dihitung

rata-rata selisih laba usaha sampel penerima bantuan

PNPM Mandiri sebleum dan sesudah pemberian bantuan. Rata-rata selisih laba usaha sampel ini akan dibandingkan dengan nilai tertentu.

• Bila nilainya jauh lebih besar daripada nol,

maka kita akan menolak Hipotesis nol (dengan demikian menerima hipotesis alternatif).

• Bila nilainya lebih kecil atau berada di sekitar nol, kita akan menerima hipotesis nol (dengan demikian menolak hipotesis alternatif).

• Aturan penerimaan atau penolakan hipotesis nol ini dinamakan daerah kritik.

(35)

Kesalahan dalam Uji Hipotesis

Kesimpulan yang diambil

Kondisi Populasi Sebenarnya

Sesuai H₀ Tidak sesuai H₀

H₀ tidak ditolak Keputusan Tepat Keputusan salah (tipe II) H₀ ditolak Keputusan salah (tipe I) Keputusan tepat

• Dalam pengujian hipotesis, kesimpulan yang diambil berdasarkan sampel belum tentu cocok dengan kondisi populasi, namun kita tak pernah tahu kondisi populasi tersebut. Yang dapat kita ketahui mengenai tepat tidaknya kesimpulan pada uji hipotesis adalah sebagai berikut.

(36)

• Pandang suatu kasus persidangan seseorang yang diduga melakukan tindak pidana korupsi.

• H₀: terdakwa tidak bersalah • H₁: terdakwa bersalah

• Bila H₀ benar, tentu terdakwa harus dinyatakan bebas, sebaliknya bila H₁ benar, terdakwa akan dihukum.

• Dalam analogi di atas, kesalahan tipe I adalah menghukum terdakwa yang tidak bersalah, sedang kesalahan tipe II adalah membebaskan terdakwa yang bersalah. Kesalahan tipe I dipandang lebih serius daripada tipe II, sehingga perlu diperhatikan

peluang terjadinya kesalahan tipe I (biasa dilambangkan dengan huruf yunani α).

(37)

• Nilai α selalu dibuat kecil, namun tidak pernah sama dengan nol karena kesalahan tipe I akan selalu ada. Oleh karena itu,

• Pada penelitian-penelitian kedokteran atau

farmasi (yang berkaitan dengan nyawa manusia), umumnya diambil α sebesar 0,01.

• Pada penelitian-penelitian pertanian, sosial

budaya, kependidikan, umumnya diambil α yang lebih besar, yakni 0,05.

• Penentuan nilai α akan berpengaruh terhadap

(38)

Contoh Prosedur Uji Hipotesis

Populasi

Claim: rata-rata usia populasi penduduk suatu daerah adalah 50 tahun. H₀: μ = 50 REJECT Misalkan rata-rata usia sampel adalah 20 tahun, x = 20 Sampel Null Hypothesis 20 likely if μ = 50?  Is If not likely, Ambil sampel acak X

(39)

SEBARAN PELUANG

(40)

Mengapa Perlu Sebaran Peluang ?

• Melalui proses inferensi, seorang peneliti akan menarik kesimpulan mengenai keadaan atau sifat-sifat populasi berdasarkan informasi dari sampel.

• Proses inferensi tidak pernah lepas dari

kesalahan. Oleh karena itu, diperlukan cara untuk mengukur peluang atau probabilitas terjadinya kesalahan tersebut.

• Mengingat sifat data populasi yang

bermacam-macam, peluang dalam inferensi akan ditentukan dengan memodelkan data populasi mengikuti

(41)

Apa itu Sebaran Peluang?

• Sebaran peluang atau probability distribution merupakan suatu fungsi yang digunakan untuk menyatakan peluang suatu variabel (random) memiliki suatu nilai tertentu.

• Contoh:

– Variabel tinggi badan siswa  peluang terdapat siswa dengan tinggi badan 160 cm – 180 cm.

– Variabel jenis kelamin siswa  dari 5 siswa yang diambil secara acak di suatu SMU, peluang bahwa seluruhnya duduk di kelas X program MIPA.

(42)

Sebaran Binomial

• Sebaran Binomial digunakan untuk memodelkan peluang data hasil percobaan binomial, yakni:

– Hanya dapat menjalani tepat satu dari dua hasil yang mungkin.

– Peluang terjadinya hasil-hasil tersebut selalu tetap.

– Percobaan (upaya) dilakukan berulang sebanyak n kali.

• Contoh: Memodelkan banyaknya anak yang

terkena penyakit cacar air di suatu daerah: hasil yang mungkin adalah “anak terkena cacar air” dan “anak sehat”.

(43)

• Bila percobaan dalam peluang distribusi

binomial diulang n kali, peluang mendapatkan x hasil “sukses” dapat dihitung dengan:

Dalam model ini p menyatakan peluang

tercapainya “sukses” dalam setiap ulangan. • Sebaran binomial umumnya digunakan pada

inferensi tentang proporsi populasi

(banyaknya anggota populasi yang termasuk dalam suatu kategori / kelompok tertentu) dan uji independensi antarvariabel kategorik.

P(x) n x ! n x P (1- P) X n X ! ( )!   

(44)

• Selain menggunakan rumus, peluang suatu sebaran binomial juga dapat ditentukan

dengan bantuan tabel distribusi binomial atau dengan bantuan Microsoft Excel.

(45)

Sebaran Normal

• Sebaran normal lebih umum dijumpai

daripada sebaran

binomial, karena banyak sekali distribusi data

dalam kehidupan sehari-hari yang mengikuti pola distribusi normal.

• Ide dasar distribusi

normal adalah data yang sedikit memiliki ekstrem namun tinggi di bagian tengah.

(46)

• Bentuk kurva distribusi normal bergantung pada mean (μ) dan simpangan baku (σ) pada persamaan berikut: 2 2_/2σ μ) (x e 2π 1 f(x) _    • Secara khusus didefinisikan distribusi normal standar yakni distribusi normal dengan nilai μ = 0 dan σ = 1.

(47)

• Peluang pada sebaran normal ekuivalen dengan luas daerah yang berada di bawah kurva normal, sehingga dapat dihitung dengan kalkulus integral.

(48)

• Perhitungan nilai probabilitas dengan pengintegralan fungsi distribusi normal di atas sangat merepotkan, sehingga digunakan transformasi berikut

untuk “membawa” distribusi normal N (μ,σ2_{) ke}

distribusi normal standard N(0,1).

• Peluang distribusi normal standard dapat ditentukan menggunakan tabel distribusi peluang normal

standard atau sering disebut tabel Z.

σ

μ

X

(49)

Sebaran Student-t

• Dibandingkan sebaran normal, distribusi student-t memiliki ujung (ekor) yang lebih tinggi. Bentuk kurva

student-t ditentukan oleh derajat bebas (degree of freedom) sebesar k, dengan persamaan:

• Perhitungan peluang dengan mengintegralkan fungsi di atas sangat sulit, sehingga digunakan tabel.

2 1 2 1 1 2 2 1 k) f(x;                          k k x k k k 

(50)

• Perbandingan bentuk kurva distribusi student-t dengan berbagai nilai derajat bebas.

• Catatan: nama “student-t” merupakan samaran dari William Searly Gosset, penemu distribusi ini.

(51)

RUJUKAN

• Dajan, Anto. 1991. Pengantar Metode

Statistika II. Jakarta: LP3ES.

• Gunardi. 1999. Diktat Kuliah Metode

Statistika. Yogyakarta: Fakultas Matematika

dan Ilmu Pengetahuan Alam Universitas Gadjah Mada.

• Subanar. 2013. Statistika Matematika. Yogyakarta: Graha Iklmu

• Sudjana. 1989. Metode Statistika. Bandung: Tarsito