PROBABILISTIC & STATISTICS
TIM DOSEN UMN
Last updated 26 August 2014
COURSE MATERIALS
Week#1: Introduction to Statistics Week#2: Descriptive Statistics Week#3: Probabilistic 1 Week#4: Probabilistic 2 Week#5: Data Distribution 1 Week#6: Data Distribution 2
Week#7: Guess Lecturer/Quiz/Review
---UTS--- Week#8: Estimation for single populations
COURSE MARKING
– Class Participation: 5%
3
GROUP ASSIGNMENT IMPORTANT DATES
Week#1: Make a group of max 10 students * Week#2: Submit a topic *
Week#3: Start Making Questionnaire Draft Week#4: Consult your questionnaire draft* Week#5: Test your questionnaire
Week#6: Final Questionnaire * Week#7: Start Data Collection UTS: -
Week#8: Continue Data Collection* Week#9: -
Week#10: Data Analysis 1* Week#11: -
Week#12: Data Analysis 2* Week#13: -
UAS
• Make a group of max 10 students
• Perform a descriptive research about customer behavior
• Making a questionnaire.
• Collecting Data
• Data Analysis using SAS or other tools
• Making a report
• Making a poster # latest week
• Making a presentation of your poster #latest week
• Submitting report #UAS (take home)
5
OTHERS
• UTS: Theory from week #1 to week #6
• Homework: Given by the Lecturer at some weeks
• SAS Lab Test: At latest week about 2x50”
• Class Participation: Get points by Answering review
STATISTIKA
• STATISTIK (statistic) dalam pengertian bersifat umum berarti informasi yang bersifat numerik. Contoh: gaji rata-rata seorang lulusan perguruan tinggi. Rata-rata mobil di Amerika menempuh jarak 11.099 mil per tahun.
• Dalam arti yang lebuh luas, STATISTIKA(Statistics)
adalah ilmu yang mempelajari tentang (1)
pengumpulan, (2) pengaturan, (3) analisis, dan (4) penafsiran data untuk membantu proses
pengambilan keputusan secara lebih efisien.
7
JENIS-JENIS STATISTIKA
• STATISTIKA DESKRIPTIF adalah jenis statistika yang mempelajari tentang metode-metode untuk (1) mengatur, (2) merangkum, dan (3) mempresentasikan data dengan cara yang informatif.
– Contoh: Sekurang-kurangnya 15 % dari kebakaran yang terjadi di kota Palembang, yang dilaporkan tahun lalu diakibatkan oleh tindakan-tindakan sengaja yang tidak bertanggung jawab.
• STATISTIKA INFERENSIAL adalah jenis statistika yang mempelajari tentang metode-metode untuk mengestimasi sifat populasi berdasarkan sampel.
JENIS-JENIS STATISTIKA
• STATISTIKA PARAMETRIK
– digunakan bila karakter populasi memenuhi seluruh asumsi statistika:
• Berdistribusi normal
• Homogeny
• Sampel harus random
• Tingkat pengukuran data = rasio
• STATISTIKA NON PARAMETRIK
– Digunakan bila ada salah satu asumsi statistika yang bukan merupakan karakter populasi
9
POPULASI
• Populasi atau universe adalah jumlah keseluruhan
SAMPEL
• Sampel adalah sebagian dari populasi yang
karakteristiknya hendak diteliti. Sampel yang baik, yang kesimpulannya dapat dikenakan pada populasi, adalah sampel yang bersifat representatif atau yang dapat menggambarkan karakteristik populasi.
–Contoh: Mahasiswa ICT terdiri dari 300 wanita dan
350 pria. Sampel yang diambil adalah 30 wanita dan 35 pria.
11
FAKTOR-FAKTOR
PENENTU SAMPEL REPRESENTATIF
Tingkat representatif sampel secara umum dapat ditentukan oleh beberapa hal sebagai berikut: 1) Homogenitas populasi.
2) Jumlah (besar) sampel yang dipilih.
ALASAN PENGAMBILAN SAMPEL
• Mempelajari seluruh anggota populasi akan memakan waktu.
• Biaya yang diperlukan untuk meneliti seluruh anggota populasi sangat besar.
• Mempelajari seluruh anggota populasi tidak mungkin dilakukan. Contoh menghitung jumlah anggota populasi ikan di seluruh Indonesia.
• Mengurangi kerugian karena bersifat destruktif. Misalkan pengujian kekuatan tabrakan mobil.
• Hasil-hasil yang diperoleh dari mempelajari sampel sudah memadai.
13
METODE PENGAMBILAN SAMPEL
• SAMPEL ACAK (RANDOM SAMPLING)
–Anggota sampel dipilih tidak berdasarkan
subjetifitas Peneliti.
• SAMPEL TIDAK ACAK (NON RANDOM SAMPLING).
–Anggota sampel dipilih atas keinginan Peneliti
SAMPEL ACAK
• SAMPEL ACAK SEDERHANA/ SIMPEL RANDOM
SAMPLING
• Sampel acak sistematis/ SYSTEMATIC RANDOM
SAMPLING
• STRATIFIED RANDOM SAMPLING
–PROPORTIONAL
–DISPROPORTIONAL
• CLUSTER RANDOM SAMPLING
15
SAMPEL ACAK SEDERHANA
• Kondisi: Jumlah populasi kecil
• Metode: Setiap anggota populasi diberikan nomor, kemudian dipilih secara acak sebanyak yang
diinginkan.
• Keuntungan: Setiap anggota sampel dipilih dengan peluang yang sama.
SAMPEL ACAK SISTEMATIS
• Metode: k=N/n menggunakan pembulatan ke bilangan bulat terdekat. Salah satu anggota dipilih sebagai titik awal, kemudian dipilih setiap anggota ke
k dari populasi.
• Keuntungan: Tidah karus melakukan penomoran. • Kelemahan: Harus dilakukan pemeriksaan urutan
anggota dan tidak benar-benar acak
17
STRATIFIED RANDOM SAMPLING
• Kondisi: Jumlah populasi besar
• Metode: Populasi yang heterogen dibagi-bagi menjadi beberapa sub kelompok (strata) yang lebih homogen. Kemudian dipilih wakil-wakil dari masing-masing strata secara acak.
PROPORTIONAL
STRATIFIED RANDOM SAMPLING
• Misalnya, populasi adalah karyawan PT. XYZ berjumlah 125. Populasi sendiri terbagi ke dalam tiga bagian :
Marketing : 15 Produksi : 75 Penjualan : 35
• Sampel yang diinginkan adalah 95. Maka jumlah sample yang diambil berdasarkan masing-masinng bagian tersebut ditentukan kembali dengan rumus n = (populasi kelas / jml populasi
keseluruhan) x jumlah sampel yang ditentukan. •
STRATIFIED RANDOM SAMPLING
• Misalnya, populasi karyawan PT. XYZ berjumlah 1000 orang yang berstrata berdasarkan tingkat pendidikan SMP, SMA, DIII, S1 dan S2.
Namun jumlahnya sangat tidak seimbang yaitu : SMP : 100 orang
SMA : 700 orang DIII : 180 orang S1 : 10 orang S2 : 10 orang
• Jumlah karyawan yang berpendidikan S1 dan S2 ini sangat tidak seimbang (terlalu kecil dibandingkan dengan strata yang lain) sehingga dua kelompok ini seluruhnya ditetapkan
KASUS
• Andi ingin melakukan penelitian untuk mencari jawaban berapa gaji lulusan UMN pada bulan pertama mereka bekerja.
• Setiap tahun, UMN menghasilkan 2000 sarjana dan Andi merasa jumlah ini terlalu besar sehingga ia ingin meneliti menggunakan sampel sebanyak 200 orang.
• Dari 200 orang yang didapatkan, terdapat 115 dari DKV, 50 Ilkom, 25 Ekonomi, dan 10 ICT.
• Kemudian ia mendapatkan informasi dari panitia kelulusan bahwa demografi lulusan umn wisuda terakhir kurang lebih DKV 40%, Ilkom 30%, Ekonomi 20%, dan ICT 10%.
• Apa yang harus dilakukan oleh Andi?
21
CLUSTER RANDOM SAMPLING
• Metode: Populasi dibagi-bagi menjadi beberapa kelompok (cluster) biasanya berdasarkan letak geografis. Kemudian beberapa cluster dipilih secara acak. Dari setiap cluster yang terpilih, dipilih wakil-wakilnya secara acak.
CONTOH DALAM GAMBAR
Populasi N= 324 rumah tangga akan diambil 27 rumah tangga
Gambar 1 SRS Gambar 2 Cluster
KEUNTUNGAN CLUSTER SAMPLING
• Ekonomis
• Sampling frame sudah tersedia
• Dengan biaya sama, bisa mendapatkan jumlah
sampel yang lebih besar
KEKURANGAN CLUSTER SAMPLING
• Keragaman Populasi mungkin tidak terwakilkan
• Elemen pada cluster yang sama memiliki sifat yang
sama
• Informasi lebih sedikit karena banyak terjadi
pengulangan informasi
• Dengan ukuran sampel yang sama, standard error
tinggi bisa saja terjadi dibandingkan teknik sampling lain.
25
SAMPEL TIDAK ACAK/
NON RANDOM SAMPLING
1. Convenience sampling: subjektif Peneliti
2. Judgment sampling: Kemampuan anggota sampel 3. Quota sampling: Terbatas sebesar kuota
CONVENIENCE SAMPLING
• Kondisi: untuk studi awal
• Anggota Sampel dipilih oleh sesuka Peneliti karena
MAU berpartisipasi, dekat rumah, teman, saudara
dll.
JUDGMENT SAMPLING
• Anggota sampel dipilih oleh Peneliti berdasarkan
pertimbangan bahwa anggota sampel MAMPU
berkontribusi
• Keuntungan: save money and time.
• Kekurangan:
–Kesalahan keputusan berakibat bias.
–Kualitas keputusan bisa berbeda-beda.
KUOTA SAMPLING
• Kuota sampling mirip dengan stratified random
sample bedanya:
–Kuota sampling tidak random
–Setiap strata mendapatakan jatah tertentu.
SNOWBALL SAMPLING
• Penarikan sample pola ini dilakukan dengan
menentukan sample pertama. Sampel berikutnya ditentukan berdasarkan informasi dari sample pertama, sample ketiga ditentukan berdasarkan informasi dari sample kedua, dan seterusnya
SYARAT SAMPEL YANG BAIK
• Memiliki akurasi yang baik yaitu jumlah error yang
kecil.
• Sampel harus memiliki selengkap mungkin karakter
populasi
• Memiliki simpang baku (S) yang kecil
31
PEDOMAN PENGAMBILAN SAMPEL
• Derajat keseragaman (homogenitas) dari populasi. Makin homogen populasinya, makin sedikit sampel yang perlu diambil.
• Presisi yang dikehendaki peneliti. Makin tinggi tingkat ketelitian yang diinginkan, makin besar sampel yang harus diambil. • Rencana analisis. Dari sisi presisi, jumlah sampel yang diambil
mungkin sudah cukup tapi jika dikaitkan dengan kebutuhan analisis, jumlah tersebut mungkin belum cukup.
• Tenaga, biaya, dan waktu. • Kemampuan peneliti
• Keadaan (intelektul) responden • Lokasi penelitian
UKURAN MINIMAL SAMPEL
• GAY DAN DIEHL (1992):
– Untuk penelitian deskriptif dibutuhkan 10% dari anggota populasi
– Untuk penelitian korelasional paling sedikit 30 elemen.
– Untuk penelitian perbadingan kausal dibutuhkan minimal 30 elemen dari tiap kelompok.
– Untuk penelitian eksperimen dibutuhkan minimal 15 elemen.
• UMA SEKARAN (1992):
– 30 sampai dengan 500 elemen.
– Bila dipecah menjadi beberapa sub kelompok, masing-masing sub kelompok minimal 30 elemen
– Untuk penelitian multivariate ukuran sampel 10 kali lebih besar dari jumlah VARIABEL yang akan dianalisis.
– Untuk penelitian sampel dengan pengendalian yang ketat dibutuhkan 10 sampai dengan 20 elemen.
33
REVIEW
• Ms. Washington is investigating teachers' attitudes toward year-round schooling. She is particularly interested in describing the attitudes of teachers from small, medium, and large schools. Which sampling procedure should be used by Ms. Washington to ensure her sample is representative of these types of schools?
• When a principal selects a sample of 30 subjects from each of the grades in her school, she is likely using which type of sampling technique?
HOMEWORK
35
• TEMUKAN BERBAGAI METODE MENGHITUNG
UKURAN SAMPEL!
DATA
• Data merupakan kumpulan fakta atau angka atau
segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai dasar menarik suatu kesimpulan.
–Contoh: dari surat kabar yang terbit setiap hari,
JENIS-JENIS DATA
• Data Primer:
–Data yang diperoleh oleh Peneliti untuk
keperluan/penanganan masalah yang dihadapi peneliti
• Data Sekunder:
–Data yang diperoleh bukan dari Peneliti untuk
keperluan/penanganan masalah tertentu.
–Bisa dipakai oleh Peneliti bila dapat digunakan
dalam penelitian.
37
KEUNTUNGAN DATA SEKUNDER
• Mendapatkan dengan biaya yang lebih murah
dengan waktu lebih cepat.
• Mengidentifikasi problem
• Mendefinisikan problem
• Menemukan pendekatan pada problem
• Memformulasikan design penelitian
KELEMAHAN DATA SEKUNDER
• Data sekunder belum tentu sesuai dengan problem yang ditangani oleh Peneliti. Kalaupun bisa, terbatas hanya pada keperluan yang tertentu.
• Metode yang digunakan untuk mendapatkan data sekunder bisa saja tidak sesuai dengan yang diinginkan Peneliti.
• Data sekunder dengan akurasi yang rendah.
• Data sekunder sudah kadaluarsa
• Data sekunder tidak bisa langsung dipergunakan, karena bergantung kepada beberapa kondisi tertentu.
39
VARIABEL
• Variabel adalah karakteristik yang dapat diamati dari
sesuatu (objek) dan mampu memberikan bermacam-macam nilai atau beberapa kategori.
–Contoh: Berat adalah variabel, sebab semua objek
beratnya tidak sama dan suatu objek dapat saja berubah-ubah dari waktu ke waktu.
–Contoh lain : Umur, nilai, kemajuan belajar, jenis
JENIS-JENIS VARIABEL
• VARIABEL KUANTITATIF VS KUALITATIF
• VARIABEL DISKRIT VS VARIABEL KONTINUE
• VARIABEL DEPENDEN VS VARIABEL BEBAS
• VARIABEL AKTIF VS VARIABEL ATRIBUT
41
TINGKATAN PENGUKURAN
(LEVEL OF MEASUREMENT)
• TINGKAT NOMINAL
• Data-data pada tingkat pengukuran ini bersifat (1) klasifikasi, (2) tidak berurutan (3) bukan numerik (4) Perbedaan antara nila tidak tetap.
– Contoh: Warna mobile phone: perak, kuning, merah,
• TINGKAT ORDINAL
• Data-data pada tingkat pengukuran ini bersifat (1) memiliki urutan, (2) bukan numerik (3) Perbedaan antara nila tidak tetap Contoh: Kualitas mobile phone: 1=buruk, 2=sedang, 3=baik.
• TINGKAT INTERVAL
SKALA DATA
• Skala comparatif:
– SKALA PAIRED COMPARISON
– SKALA RANK ORDER
– CONSTANT SUM
– Q-SORT
• Skala non-comparatif
– CONTINUOUS RATING SCALES
– ITEMIZED RATING SCALES
• skala Likert
• Semantic DifferEntial
• Stapel.
43
HOMEWORK
• CARI DEFINISI, DAN BERIKAN CONTOH