PROBABILITAS &
STATISTIKA
D R . A U D I T Y A
Measuring
Uncertainty
Quantifying
Uncertainty
Making
CONTOH
• Lama waktu dan kapasitas disk saat meng-install software • Memory yang digunakan saat suatu program komputer
dijalankan
• Saat-saat virus menyerang suatu sistem dan banyaknya kerusakan file akibat serangan tersebut
• Peluncuran satelit tertunda akibat cuaca buruk (yang awalnya diprediksi baik)
PROBABILITAS & STATISTIK
–
CONTOH
MASALAH
Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut,
kemungkinan tiap file terserang virus sebesar 0,2. Hitunglah probabilitas lebih dari 15 file
terserang virus tersebut.
Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut, setiap file akan
terkontaminasi virus tersebut dengan probabilitas sebesar p. Sebelumnya telah diamati bahwa 15 files telah terkontaminasi, estimasikanlah besarnya nilai p. Apakah ada indikasi kuat p lebih besar dari 0,2 jika lebih dari
DEFINISI
Statistik diartikan
Numerical description
= deskripsi numerik
Diasosiasikan sebagai kumpulan data
Ciri dari sebagian objek yang diamati
DEFINISI STATISTIK
Menurut Schaum’s ; Murray R Spiegel Ilmu
pengetahuan yang berhubungan dengan metode – metode ilmiah untuk pengumpulan,
pengorganisasian, perangkuman dan penganalisisan data di samping terkait pula dengan metode –
metode untuk penarikan kesimpulan yang valid serta pengambilan keputusan yang berdasarkan alasan-alasan yang ilmiah dan kuat yang memperoleh dari hasil analisis tadi
KEGUNAAN
Analisis data
Peramalan/prediksi
Uji hipotesa
• Seorang programmer ingin mengetahui apakah anti virus buatannya baru efektif menghadang serangan virus?
• Seberapa efisien konsumsi BBM pada jenis mobil tertentu?
• Bagaimana menerjemahkan hasil polling? Berapa banyak sampel diperlukan agar hasilnya akurat? Apa artinya margin of error?
MENGAPA PERLU BELAJAR STATISTIK?
Menjelaskan hubungan antar variabel Membuat keputusan lebih baik
Mengatasi perubahan-perubahan
Membuat rencana dan ramalan
• “It’s remarkable that a science which began with the consideration of games of chance should become the most important object of human knowledge …. The most important questions of life are, for the most part, really only problems of probability “ Pierre Simon, Marquis de Laplace
KITA DIBOMBARDIR DENGAN
STATISTIK
http://www.bps.go.id/brs_file/sbh_02jan14.pdf
http://www.gatra.com/hukum-1/44540-pada-2013,-23-385-tewas-kecelakaan-lalu-lintas.html
Iklan menyatakan:
“8 dari 10 wanita memilih shampoo Pantene”
Apa yang salah dari pernyataan ini?
STATISTIK DALAM KEHIDUPAN
SEHARI-HARI
Seiring meningkatnya data yang tersedia dan
perkembangan teknologi (komputer),
statistik akan digunakan lebih banyak dan
lebih sering lagi
Question:
Is it good that statistics
are used so much and what
PEMBAGIAN ILMU STATISTIK
•
Statistik deskriptif
statistik yang digunakan untukmenggambarkan berbagai karakteristik data atau menganalisis suatu statistik hasil penelitian, tetapi tidak digunakan untuk
Statistik inferensial suatu pernyataan mengenai suatu
1. Data dari 1-2 kasus
2. Data yang dikumpulkan tidak jelas apakah mewakili populasi sebenarnya
1. Saya kenal dua orang mahasiswa UWP yang lulus sarjana lebih dari 6 tahun, jadi kuliah di UWP lulusnya lebih lama dibanding PTS lain
Statistik
Deskriptif
Inferensial
Estimasi
Titik Interval
Uji
METODOLOGI STATISTIK
Mengidentifikasikan persoalan
Pengumpulan fakta-fakta yang ada
Mengumpulkan data asli yang baru
Klasifikasi data
Penyajian data
ELEMEN STATISTIK
A. Populasi
B. Sampel
C. Variabel
•
Contoh
•
Observasi vs
Eksperimen
A. POPULASI
Populasi adalah sebagai sekumpulan dari semua objek atau individu yang memiliki karakteristik tertentu, jelas dan lengkap yang akan diteliti
Contoh :
Semua produk yang dihasilkan pada suatu mesin
Semua mahasiswa teknik industri di Surabaya
Populasi lebih bergantung pada
B. SAMPEL
Sampel adalah sebagai sekumpulan data yang diambil atau diseleksi dari suatu populasi
Contoh :
Populasi = Seluruh mahasiswa teknik informatika di Surabaya
maka sampelnya mengambil beberapa mahasiswa teknik
informatika dari 1 PTN dan 5 PTS di Surabaya
Populasi =Semua produk yang dihasilkan suatu mesin, maka
LESSON LEARNED?
Sampel bersama dengan statistik inferensi memungkinkan kita mengambil kesimpulan tentang populasi
Elemen dalam probabilitas memungkinkan kita mengambil kesimpulan mengenai karakteristik dari dugaan/hipotesis
mengenai populasi berdasarkan sifat-sifat populasi yang telah diketahui sebelumnya
Hubungan Fundamental antara
Probabilitas dan Statistik Inferensi
• Aplikasi dari probabilitas adalah penting dalam menginterpretasikan statistik inferensi
Studi
Observasi
•Mengumpulkan data melalui pengamatan
•Hanya dapat
membantuk suatu hubungan antara variabel penjelas (explanatory) dan variabel respon
•Jika menggunakan data masa lampau disebut retrospective, jika dikumpulkan selama masa penelitian disebut prospective
Eksperime
n
• Secara acakmenempatkan subyek dalam berbagai
treatment
• Dapat membangun hubungan kausal
(sebab akibat) antara variabel explanatory dan variabel respon
MENGAPA SAMPLING? MENGAPA BUKAN
SENSUS
Beberapa individu sukar dijangkau atau diukur Populasi jarang statis
SUMBER DARI BIAS DALAM SAMPLING
Convenience sample. Individual yang mudah diakses dan cenderung mau dilibatkan dalam sampel
Non-response: jika hanya suatu fraction (yang tidak random) dari orang-orang yang disampling
secara acak bersedia terlibat dalam suatu survei sehingga sampel akhir tidak representasi dari
suatu populasi lagi
METODE SAMPLING
Simple Random Sampling: Memilih kasus (cases) dari
Stratified Sampling. Membagi populasi ke dalam
Cluster Sampling. Membagi populasi ke dalam
cluster-cluster lalu memilih beberapa cluster secara random. Selanjutnya mengambil secara acak
PRINSIP-PRINSIP DALAM RANCANGAN
EKSPERIMEN
1. Control. Membandingkan suatu perlakuan
(treatment) dengan kelompok kontrol
2. Randomize. Menempatkan subyek secara acak ke kelompok perlakuan.
3. Replicate. Mereplikasi suatu studi dalam sampel cukup besar atau mereplikasi keseluruhan studi (kasus the hidden messages in water
http://is-masaru-emoto-for-real.com/
4. Block. Jika dicurigai ada variabel-variabel yang dapat mempengaruhi variabel respon, maka
kelompokkan terlebih dahulu subyek ke dalam blok2 berdasarkan variabel-variabel ini lalu
CONTOH BLOCKING
Kita ingin merancang eksperimen apakah pemberian suplemen tertentu membuat orang berlari lebih
cepat
Kelompok perlakuan (treatment) : suplemen
Kelompok kontrol : tanpa suplement
Jika dicurigai suplemen tersebut mempengaruhi kelompok atlet profesional dan amatir secara berbeda, maka kita perlu mem-blok status
pro/amatir tersebut
Membagi sampel menjadi kelompok pro dan amatir
Secara acak membagi atlet yang pro dan amatir ke
dalam kelompok perlakuan dan control
Atlet pro dan amati secara berimbang terwakili dalam
BLOCKING VS VARIABEL
EXPLANATORY
Explanatory variables (atau terkadang disebut faktor) adalah kondisi yang kita tentukan pada unit
eksperimen
Blocking variables adalah karakteristik unit eksperimen yang ingin kita kontrol
BEBERAPA TERMINOLOGI LAIN
DALAM RANCANGAN
EKSPERIMEN
Placebo: perlakuan “palsu” sering digunakan sebagai
kelompok kontrol dalam studi kesehatan
Placebo Effect: unit eksperimen menunjukkan peruabhan
karena percaya mereka telah mendapatkan suatu perlakuan
Blinding: unit eksperiment tidak mengetahui apakah
mereka sesungguhnya berada dalam kelompok kontrol atau perlakuan
Double-Blind: baik unit eksperimen maupun peneliti tidak
RANDOM SAMPLING VS
C
.
VARIABEL
Dalam melakukan inferensi terhadap populasi, tidak semua ciri populasi harus diketahui, hanya satu atau beberapa
karakteristik populasi yang perlu diketahui, yang disebut sebagai VARIABEL
Variabel adalah suatu sifat atau karakteristik dari beberapa obyek, kejadian, atau orang yang nilainya dapat bervariasi dan dapat dihitung atau diukur
Contoh:
Jenis kelamin
Usia
Suku bangsa
Tinggi badan
Tingkat pendidikan
Kecacatan produk (ya/tidak dalam contoh 1)
TIPE VARIABEL
Variabel
Numerik / Kuantitatif
Kontinu Diskrit
Kategori / Kualitatif
NUMERIK VS KATEGORI
• Menggambarkan kuantitas yang dapat diukur
• Dapat dilakukan operasi aritmetik seperti
penjumlahan, pengurangan, diambil rata-ratanya, dll
Numerik
• Nilai dari suatu nama atau label
• Kategori dapat
diidentifikasikan dengan angka tetapi tidak bisa
dilakukan operasi aritmetik
Kategori
Tinggi badan, temperatur,
banyaknya
mahasiswa, jumlah kk
Jenis kelamin, tingkat pendidikan, bentuk
• Variabel numerik yang dihitung dan hanya dapat bernilai utuh
• Contoh: banyaknya file yang terkontaminasi
virus, banyaknya
kemunculan angka 2 dalam pelemparan dadu, jumlah anak dalam satu keluarga
• Variabel numerik yang dapat diukur dan dapat bernilai sembarang
• Contoh: kekuatan tarik suatu jenis material,
lama proses loading
sistem, panjang antrian
Numerik
CONTOH VARIABEL KONTINU
•
Tinggi seseorang yang dapat bernilai 62
cm, 67,5 cm atau 68,45678 cm, bergantung
pada tingkat akurasi pengukurannya
•
Jumlah anak dalam sebuah keluarga,
yang bernilai bsa salah satu dari 0, 1, 2, 3,
…
tetapi tidak mungkin 2,5 atau, 3,4567
• Variabel kategori yang tidak berurut disebut variabel kategori saja
• Contoh: jenis kelamin, merek televisi yang dimiliki
• Variabel kategori
yang memiliki urutan
• Contoh: tingkat
kepuasan pelanggan, ranking merek mobil favorit