Pendahuluan
Apa data ?
•
Data merupakan hasil pengukuran terhadap suatu
objek/individu yang menjadi pusat perhatian.
–
Pengukuran dapat dilakukan secara kualitatif maupun
kuantitatif
–
Secara umum, skala pengukuran dibedakan menjadi
nominal, ordinal, interval dan rasio
•
Apa beda data dengan informasi ?
–
Informasi merupakan hasil yang diperoleh dari analisis
data
–
Misal, data tentang pendapatan kota Bogor tahun 2007
maka rata-rata pendapatan per kapita kota Bogor tahun
2007 merupakan informasi.
Ada berapa jenis data yang Anda
kenal?
•
Menurut sumbernya data dapat dibedakan
menjadi data PRIMER dan SEKUNDER
•
Menurut periode pengumpulannya data
dibedakan menjadi data TIME SERIES dan data
CROSS SECTION
•
Menurut skala pengukurannya data dibedakan
menjadi data KUALITATIF dan data KUANTITATIF
•
Menurut cakupan objeknya data dibedakan
menjadi data POPULASI dan data SAMPEL
Bagaimana Teknik Pengumpulan Data
?
observasi
percobaan
Survei didefinisikan sebagai sebuah metode untuk mengumpulkan data
primer yang mendasarkan pada komunikasi dengan perwakilan sampel secara individu
o Instrumen: kuesioner
o Ada aktivitas bertanya melalui wawancara
o Ada yang menjawab pertanyaan (individu / klp. individu) responden
Keuntungan survei: proses cepat, tidak mahal, efisien, dan merupakan
sarana yang akurat untuk mengakses informasi yang menyangkut
populasi (dengan catatan: survei dilaksanakan dengan tepat dan akurat)
Etika dalam survei: hak pribadi responden, pencegahan penipuan,
penjelasan tujuan survei kepada responden, kerahasiaan, kejujuran dalam pengumpulan data, dan objektivitas dalam melaporkan data
Observasi
Observasi ilmiah merupakan suatu proses pencatatan yang sistematis
terhadap pola perilaku orang, objek, dan kejadian-kejadian tanpa bertanya atau berkomunikasi dengan orang, objek atau kejadian tersebut
Wawancara Personal pewawancara bertanya jawab langsung
dengan responden
Keuntungan: responden dapat umpan balik, konfirmasi jawaban, waktu dapat lebih longgar, potensi pengisian kuesioner secara lengkap lebih tinggi, dapat menggunakan alat bantu visual, partisipasi lebih tinggi Kerugian: biaya lebih mahal, waktu lebih lama, efek anonimitas responden
Wawancara
Wawancara Telepon pewawancara bertanya jawab dengan
responden melalui telepon
Keuntungan: cepat, biaya relatif tidak mahal, mengurangi hal-hal yang bersifat pribadi, ada yang lebih suka diwawancarai via telpon.
Kerugian: keterwakilan populasi dapat menjadi masalah karena
mungkin tidak semua responden sasaran memiliki telpon, tidak dapat menggunakan media visual, durasi terbatas
Wawancara dapat dilakukan dari rumah kerumah atau di
tempat-tempat dimana responden dapat mudah dijumpai misalnya mal, kantor pelayanan pengaduan, dll.
Survei melalui surat/pos
Non Wawancara
Kuesioner tertulis menggunakan jalur distribusi lain
Melalui kartu garansi
Melalui majalah dengan pemberian (iming-iming) hadiah tertentu
Survei dengan media internet, dll.
Keuntungan: fleksibilitas geografi, biaya relatif lebih murah, responden lebih nyaman tidak diburu waktu, lebih pas untuk hal yang bersifat
pribadi
Kerugian: non respon tinggi, pertanyaan harus standar & terstruktur, sebelum menjawab seringkali responden membaca dulu seluruh
pertanyaan kuesioner sehingga dapat menimbulkan bias
Kuesioner Format baku, panjang halaman max 6, bahasa sederhana &
ilustrasi
Sebelum kita bicarakan cara pengambilan contohnya, perhatikan ilustrasi berikut (semuanya dikutip dari kuliah STK 211, kelas Prof AHN):
Seorang ibu rumah tangga melewati Jalan Pajajaran di Kota Bogor, dan dilihatnya banyak penjual duku Palembang di sepanjang jalan tersebut. Pada saat ingin membeli, penjual menawarkan untuk mencicipi terlebih dahulu. Puas dengan rasanya, ibu tersebut membeli dua kilogram. Sesampai di rumah, ternyata rasa duku yang dia beli tidak manis seperti yang dia rasakan di tempat penjualan tadi.
BPS mengadakan survei ekonomi dan menyebar beberapa petugas survei ke berbagai perumahan di Bogor. Hasil yang diperoleh cukup mengagetkan karena tingkat pendapatan masyarakat di Bogor Baru (salah satu perumahan A di Bogor) memiliki rata-rata yang tidak setinggi perkiraan. Setelah diselidiki ternyata, petugas di perumahan tersebut adalah petugas yang phobia terhadap anjing. Sehingga rumah yang dia datangi adalah rumah-rumah yang tidak memelihara anjing, dan rumah yang dilengkapi anjing umumnya lebih kaya daripada yang tidak.
Dua ilustrasi di atas adalah ilustrasi teknik
pengambilan contoh yang salah, hasilnya akan
berbias. Inilah resiko pengambilan kesimpulan
dari data contoh.
Jika cara pengambilannya
tidak tepat, maka hanya satu kelompok saja yang
didapatkan dan kesimpulan yang diambil tidak
bisa berlaku umum.
Manajemen Survei: Fieldwork
Seleksi enumerator sehat, memiliki ‘raport’ yg baik, komunikatif, menarik, terdidik, berpengalaman
Pelatihan sangat menentukan kualitas data yang dikumpulkan membekali enumerator tentang: memilih responden, kontak awal, teknik bertanya, probing, menulis jawaban, dan mengakhiri interview
Supervisi meyakinkan bahwa enumerator mengikui prosedur & teknik sesuai dengan yang diterima pada saat pelatihan (termasuk: quality control, editing, sampling control, control of cheating, progress)
Validasi memverifikasi apakah interview benar-benar dilakukan (ambil 10-25% durasi & kualitas interview, tanggapan thd enumerator, data demografi pokok, dan variabel-variabel kunci)
Evaluasi evaluasi terhadap biaya, waktu, response rates, kualitas interview, & kualitas data
Populasi vs Contoh
himpunan semua objek
yang menjadi minat
pengambilan kesimpulan
himpunan bagian dari
populasi
melakukan pengamatan terhadap seluruh
populasi seringkali tidak mungkin dilakukan
ketika akan membuat kesimpulan, mengapa?
Mengapa harus dengan contoh?
sumber daya
terbatas waktu yang
tersedia terbatas
pengamatan kadang bersifat merusah
mustahil mengamati seluruh anggota populasi
1
2
3
4
bagaimana caranya dengan menggunakan data contoh kita dapat mengambil kesimpulan terhadap populasi?
Ilustrasi
Andaikan kita memiliki sepiring sambel buatan ibu
kita. Berapa banyak yang kita ambil untuk mencicipi rasa
sambel
tersebut
?
Sebagian
besar
orang
akan
berpendapat bahwa seujung jari sudah cukup untuk
mengetahui rasa sepiring sambel tersebut. Tidak akan
ada seorang pun yang menjawab bahwa kita harus
merasakan setengah piring untuk menyatakan rasa
sambel buatan ibu.
Pengambilan contoh dari sebuah populasi bisa
dianalogkan dengan mencicipi masakan seperti di
atas. Jika data masing-masing objek bermacam-macam,
dengan kata lain karakteristik objeknya berbeda-beda,
maka perlu diambil contoh yang banyak untuk mewakili
setiap kelompok karakteristik. Namun jika karakteristik
objek pada populasi itu seragam, hampir sama, maka
contoh yang sedikit sudah cukup.
Statistika
Populasi
Contoh
Sampling
Pendugaan
Tingkat Keyakinan
Ilmu Peluang
Statistika Deskriptif
vs
Statistika Inferensia
Deskriptif
Parameter vs Statistik
data populasi olah/analisis parameter
data contoh olah/analisis statistik
Parameter tidak pernah diketahui, yang kita
ketahui adalah statistik. Statistik merupakan
Statistika
Populasi :
Keseluruhan pengamatan yang menjadi pusat
perhatian kita
Contoh :
Himpunan bagian dari populasi (mewakili)
Parameter :
Karakteristik numerik dari populasi
Statistik :
Karakteristik numerik dari contoh
Peubah / Variabel :
Ciri dari objek yang diamati
Skala pengukuran :
Nominal, Ordinal, Interval, Rasio
Peubah:
Kualitatif vs Kuantitatif, Diskret vs Kontinu
Pengumpulan Data:
Harus dibangkitkan dulu
Percobaan
Analisis Eksplorasi Data
Eksplorasi
Upaya untuk melihat ke dalam data guna mengungkap informasi yang terkandung dalam data tersebut manipulasi, penyarian/perangkuman, peragaan
Peragaan :
tabel & grafik (histogram, diagram batang, diagram lingkaran/pie chart, plot, dll.)
Penyarian:
ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil)0 10 20 30 40 50 60 70 80 90 Tw-1 Tw-2 Tw-3 Tw-4 Jabar Jatim Lampung 79% 21% Laki-Laki Perempuan 400 500 600 700 800 900 1000 20 40 60 80 100 120 Jarak (1000 Km) E m is i H c ( p p m )
Teknik Meringkas Data
ukuran pemusatan
Ukuran Pemusatan
nilai tempat mengumpulnya sebagian besar data
•
Median
, membagi data menjadi dua bagian yang
sama banyak
Me = data ke-(n+1)/2
•
Modus
, nilai data yang paling sering muncul
•
Rataan/Rata-rata
1 N Xi i 1 Nx
1 n Xi i 1 n
mean
average
Tentang Rataan
•
Rataan bersifat tidak kekar (
robust
)
terhadap adanya data-data bernilai ekstrim.
misal data yang dimiliki:
5, 7, 8, 13, 14, 14, 16, 17, 18, 21
rataan 13.3, median 14
5, 7, 8, 13, 14, 14, 16, 17, 18, 70
rataan 18.2, median 14
•
dikenal adanya Truncated Mean (rataan
terpangkas)
membuang data ekstrim
Ukuran Penyebaran
semakin besar nilainya berarti data semakin bervariasi/beragam
•
Wilayah (
Range
),
selisih antara nilai data
terbesar dengan data terkecil
•
Jangkauan antar kuartil (
Inter Quartile
Range
),
selisih antara kuartil 1 dengan
kuartil 3
kisaran tempat mengumpulnya
50% data bernilai ‘sedang’
•
Ragam (
variance
),
rata-rata kuadrat
penyimpangan data terhadap rata-ratanya
•
Simpangan Baku (
standard deviation
),
akar
dari ragam
2
2
1 N Xi i 1 N ( )s
2
x
2
1
n - 1
X
i i 1 n(
)
Penyajian dengan:
- Diagram Dahan Daun (Stem-and-Leaf Display)- Diagram Kotak Garis (Box-Plot)
Analisis Eksplorasi Data
Contoh data:
25 65 9 26 3 8 65 93 16 29 11 15 82 66 38 23 27 12 37 50 15 17 14 7 54 43 24 10 9 9 41 69 12 17 4 10 48 73 20 53 10 14 76 81 9 13 16 5 54 35 31 8 7 15 39 55 28 12 18 13 24 21 17 12 19 16 11Analisis Eksplorasi Data
Stem-and-leaf of Contoh3 N = 23 Leaf Unit = 1.0 1 0 3 3 0 45 5 0 77 8 0 899 (4) 1 0011 11 1 223 8 1 4455 4 1 67 2 1 8 1 2 1 2 1 2 1 2 7Stem-and-Leaf Display
Stem-and-leaf of Contoh1 N = 20 Leaf Unit = 1.0 1 2 5 4 3 579 7 4 138 (4) 5 0445 9 6 5569 5 7 36 3 8 12 1 9 3 Stem-and-leaf of Contoh2 N = 24 Leaf Unit = 1.0 3 0 899 7 1 0223 (6) 1 566779 11 2 01344 6 2 689 3 3 1 2 3 8 1 4 1 4 1 5 3Analisis Eksplorasi Data
30 20 10 0 C o n t o h 3 50 40 30 20 10 C o n t o h 2 95 85 75 65 55 45 35 25 C o n t o h 1Boxplot
Langkah Pembuatan Boxp-Plot:
1. Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3 2. Lakukan identifikasi pencilan:
dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d 3. Gambar !
Sebaran Penarikan Contoh
populasi ambil contoh berukuran n ambil contoh berukuran n ambil contoh berukuran n ambil contoh berukuran n 1x
x
2x
3x
kRata-rata contoh adalah peubah acak yang juga memiliki sebaran tertentu. Contoh yang berbeda dari populasi yang sama, hampir dapat
Sebaran Penarikan Contoh
x1, x2, …, xn dari populasi yang menyebar N(, 2)x
s
x
menyebar N(, 2/n) menyebar t-studentdb=n-1Sifat-sifat Penduga
ˆPenduga bagi suatu parameter , dilambangkan
Sifat yang diinginkan dari suatu penduga parameter adalah: 1. Tak Bias (unbiased)
2. Ragam penduga, , kecil
ˆ
E
ˆSifat-sifat Penduga
Tak bias,
ragam kecil
Bias, ragam besar
Tak bias, ragam
besar
Selang Kepercayaan
Menduga nilai parameter menggunakan kisaran nilai antara batas bawah (LCL=lower confidence limit) dan batas atas (UCL=upper confidence limit) x1, x2, …, xn dari populasi yang menyebar N(, 2) Selang kepercayaan (1-)x100% bagi adalah
n
s
t
x
2
Peluang
•
Bagaimana membuktikan bahwa sebuah dadu setimbang?
•
Empiris
Peluang = frekuensi relatif
•
Contoh:
• Satu mata uang setimbang dilempar sekali
RC = {M, B}
P({M})=1/2 dan P({B})=1/2
• Satu mata uang setimbang dilempar 3 kali
RC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM} P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8
Peluang
P(X=0) = P({BBB}) = 1/8
P(X=1) = P({BBM,BMB,MBB}) = 3/8 P(X=2) = P({BMM,MBM,MMB}) = 3/8 P(X=3) = P({MMM}) = 1/8
Sebaran Binom(n,p)
sebaran Binom dengan parameter n dan p(sebaran peluang diskret)
n
0,1,2,...,
;
)
1
(
)
(
x
p
p
x
n
x
X
P
x n xPeubah Acak fungsi yang memetakan anggota gugus RC ke gugus bilangan nyata
Nilai Harapan & Ragam Peubah Acak X
Nilai Harapan & Ragam : Sebaran Binom(n,p)
,...,n
i
x
P
x
X
E
i n i i x(
)
;
0
)
(
0
2 2 2)
(
)
(
X
E
X
E
x
,...,n
i
x
P
x
X
E
i n i i(
)
;
0
)
(
0 2 2
X 0 1 2 3 P(X) 0.125 0.375 0.375 0.125 E(X) = 1.5 2 = 0.75Khusus pada sebaran Binom(n,p) :
E(X) =
= np dan
2= np(1-p)
Peluang Kontinu
4
0
;
4
1
)
(
x
x
f
Sebaran Seragam
kontinu
P(X=3) = 0
pada sebaran kontinu, peluang pada satu titik =0
4
3
4
0
4
3
|
4
4
1
)
(
)
3
(
3 0 3 0 3
x
dx
dx
x
f
X
P
4
1
4
2
4
3
|
4
4
1
)
(
)
3
2
(
3 2 3 2 3 2
X
f
x
dx
dx
x
P
dx
x
xf
X
E
x
(
)
)
(
Nilai harapan
Peluang Normal
;
2
1
)
,
;
(
2 2 1 2
x
e
x
f
x
Sebaran Normal
(fungsi peluang kontinu)
)
,
N(
~
X
2Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan
400g dan standard deviasi 100g. Jika diambil satu ikan secara acak, berapa peluang mendapatkan ikan yang beratnya lebih dari 500g?
)
1
,
0
N(
~
Z
-X
Z
Tabel-Z 1587 . 0 ) 1 ( 100 400 500 ) 500 ( P Z P Z X PPeluang Normal, Z, t,
2, F
Jika X~N(
,
2)
~N(
,
2/n)
Bagaimana jika sebaran pop tdk normal
Dalil Limit Pusat
Apapun sebaran populasinya, ~N(, 2/n) dengan n
Jika
2tidak diketahui, maka sebaran Normal (Z)
sebaran t
Peubah acak Z
2
sebaran
2(Khi-kuadrat)
Rasio dari p.a. sebaran
2
sebaran F
Penggunaan:
Sebaran Z menguji jika 2 diketahui
Sebaran t menguji jika 2 tidak diketahui
Sebaran 2 menguji ragam (2)
Sebaran F Rasio dua ragam
x
Pendugaan Parameter
Dugaan Titik
untuk menduga
s
2untuk menduga
2x
Dugaan Selang
Selang kepercayaan (1-
)100% bagi
Jika
2diketahui:
Jika
2 tdk diketahui:
n
z
x
n
z
x
2 2
n
s
t
x
n
s
t
x
(n 1) (n 1) 2 2
Dugaan Selang
Selang kepercayaan (1-
)100% bagi
1-
2Jika
1dan
2tdk diketahui dan diasumsikan sama:
Pendugaan Parameter
2 2 2 1 2 1 2 1 2 1 2 2 2 1 2 1 2 1)
2(
)
2(
n
n
z
x
x
n
n
z
x
x
2 1 2 ) ( 2 1 2 1 2 1 2 ) ( 2 11
1
)
(
1
1
)
(
2 2n
n
s
t
x
x
n
n
s
t
x
x
v gab
v gab 2 dan 2 ) 1 ( ) 1 ( 2 1 2 1 2 2 2 2 1 1 2 v n n n n s n s n sgabHipotesis Statistik:
Pernyataan/dugaan mengenai parameter
populasi yang ingin dibuktikan kebenarannya
H
0
hipotesis nol
H
1atau H
a
hipotesis satu atau hipotesis alternatif
Misalnya:
H
0:
=60 vs H
1:
≠60
uji dwi arahH
0:
=160 vs H
1:
>160
uji eka arahH
0:
=500 vs H
1:
<500
uji eka arahPengujian Hipotesis
Pengujian Hipotesis
H0 terima
H1 terima
Hasil Pengujian
H0 benar
Benar
Salah Jenis 1
(
Salah Jenis 2
(
b
H1 benarKeadaan
Sebenarnya
Benar
= Peluang menolak H0 padahal H0 benar
Pengujian Hipotesis
Kaidah Keputusan:
Jika p-value <
H1 benar
Jika p-value ≥
H0 dianggap benar
taraf nyata pengujian
(kesalahan maksimum yang diperbolehkan jika memutuskan H1 benar)P-value
peluang salah jenis 1 berdasarkan data
Teladan 1:Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan
diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan =5%. (Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan 2=81 cm2).
Pengujian Hipotesis
Diketahui: n=25, =164 cm ;
2=81 cm
2;
=5%=0.05.
H
0:
=161 cm vs H
1:
>161cm
Z
tabel= Z
0.05= 1.65
P-value = P(x>x
0/
=161) = P(Z>1.67) = 0.0475
P-value <
Tolah H
0(Memang benar sekarang ada kenaikan rata-rata tinggi orang Indonesia dibandingkan dengan tahun 70-an)
x
67
.
1
25
/
81
161
-164
/
-x
n
Z
Z > Ztab Tolak H0Pengujian Hipotesis
Secara Umum:
Satu Nilai Tengah Populasi:
H0: = 0 vs H1: 0H0: 0 vs H1: > 0
H0: 0 vs H1: < 0
Dua Nilai Tengah Populasi:
Saling Bebas
Berpasangan
H0: 1= 2 vs H1: 1 2 H0: D = 0 vs H1: D 0 H0: 1 2 vs H1: 1> 2 H0: D 0 vs H1: D > 0 H0: 1 2 vs H1: 1< 2 H0: D 0 vs H1: D < 0
Pengujian Hipotesis
Teladan-2:
Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini, ujilah apakah dugaan tersebut di atas benar? (Gunakan =5% dan asumsikan ragam produksi kedua populasi sama).
11.7 9.6 12.2 8.6 9.3 10.1 8.9 9.5 10.4 8.3 9.4 Produksi dari 11 Petambak yang Berlatar Belakang Petambak
7.4 8.5 9.2 8.7 7.8 6.9 10.2 9.4 8.1 8.3 9.0
Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak
Bentuk Hipotesis ? Statistik Uji ?
2 1 2 2 1 2 1 1 1 ) ( ) ( 2 1 n n s x x s x x t gab x x hit H0: 1 2 vs H1: 1> 2