Bab I
Pendahuluan &
Statistika Deskriptif
•Pengertian Statistika •Distribusi Frekuensi •Central Tendency •Measure of DispersionPengertian Statistika
• Statistik (statistic) vs statistika
(statistics)
• Statistik: angka-angka
• Statistika: penggunaan data numerik
untuk membantu membuat
Deskriptif vs Inferensial
• Statistika deskriptif: perhitungan rangkuman dan tampilan grafis • Statistika inferensial: pembuatan
kesimpulan umum mengenai keseluruhan (populasi) dengan melakukan pangamatan atas suatu bagian (sampel)
• Tidak ada sampel yang dijamin sangat sesuai menggambarkan populasi sasaran, tapi galat pengambilan sampel (sampling error) harus dijaga agar dalam batas wajar.
Deduktif vs Induktif
• Statistika deduktif: sifat-sifat dari kasus-kasus khusus dapat diduga dari keadaan umum. Mis: kita dapat menetapkan 0,04 sebagai probabilitas bahwa seorang mahasiswa Teknik Sipil terpilih secara acak jika kita tahu bahwa 4% mahasiswa di kampus mengambil jurusan tersebut • Statistika induktif = statistika inferensial
Populasi vs Sampel
• Populasi statistika adalah kumpulan
seluruh pengamatan yang mungkin dari karakteristik tertentu yang diteliti
• Sampel adalah suatu kumpulan
pengamatan yang berasal dari suatu bagian dari populasi tertentu
• Galat (error) antara lain dipengaruhi
oleh jumlah sampel
Unsur dasar (elementary unit)
Suatu pengelompokan tunggal dari unsur-unsur dasar dapat menimbulkan beberapa buah populasi. Mis: para mahasiswa yang terdaftar pada sebuah universitas dapat menjadi unsur-unsur dasar populasi indeks prestasi, populasi penghasilan, populasi jenis kelamin, populasi jurusan, populasi tinggi badan, populasi usia dll. Bedakan dengan pengertian populasi yang berarti kelompok demografis sejumlah makhluk hidup.
Jenis Populasi
• Populasi kuantitatif: numerik
• Populasi kualitatif: atribut (mis: jenis
kelamin, pekerjaan dll)
• Populasi: telah ada, masa
mendatang, imajiner
• Sampel diambil karena keterbatasan biaya, waktu dan tenaga
• Data mentah: titik-titik data yang belum disusun dalam bentuk yang bermakna jelas
• Statistik deskriptif menyusun dan memanipulasi data mentah agar dapat dengan mudah diterjemahkan maknanya, misalnya dalam bentuk tabel dan grafik distribusi frekuensi, kecenderungan pemusatan dan variabilitas
Distribusi Frekuensi
Merupakan cara penyajian data ke dalam kelas-kelas. Banyaknya data di dalam tiap kelas dihitung sehingga diperoleh frekuensi kelas
Contoh
• Tabel di sebelah kiri adalah distribusi frekuensi berat 50 kopor yang ditimbang secara acak di bandara
• Pencatatan dibulatkan ke kg terdekat sehingga misalnya kelas 19-21 meliputi semua kopor dengan berat >18,5 kg (batas bawah kelas) tapi <21,5 kg (batas atas kelas)
• Batas kelas dibuat 1 desimal lebih banyak dari data asli
• Lebar kelas=batas atas kelas-batas bawah kelas
• Titik tengah kelas 19-21 misalnya adalah 20 Berat (kg) Frekuensi 7-9 2 10-12 8 13-15 14 16-18 19 19-21 7 ada 5 kelas
tepi atas kelas tepi bawah kelas
Panduan Membuat
Tabel Distribusi Frekuensi
• Hitung range, r=nilai maks.-nilai min. • Perkiraan banyak kelas (Sturgess),
k=1+3,3log(n) bila n adalah banyaknya data
• Lebar kelas, c=r/k, umumnya dibuat
seragam dan mudah diinterpertasikan
• Tentukan tepi bawah kelas pertama,
a1=nilai min-(kc-r)/2. Lalu a2=a1+c
• Batas atas kelas pertama:
b1=a2-(satu unit pengukuran terkecil/2)
Contoh:
Data tinggi 100 mahasiswa (cm)
156 170 165 170 158 164 160 162 167 171 168 161 169 153 165 169 164 158 164 157 161 166 173 163 173 162 166 161 163 169 157 152 159 168 156 163 155 164 156 165 164 163 164 162 164 157 161 167 164 167 166 160 169 172 167 167 164 163 168 156 162 167 163 161 163 162 167 156 174 170 160 162 156 164 154 158 162 162 163 164 165 171 162 158 162 165 174 164 169 153 167 157 168 161 169 163 159 168 159 168
Jawab:
• r=174-152=22 • k=1+3,3log100=7,6 • c=r/k=22/7,6=2,89≈ 3 • Bila k=7, a1=152-(7x3-22)/2=152,5>152 • Bila k=8, a1=152-(8x3-22)/2=151• Tepi bawah kelas berikutnya: 154, 157, 160, 163, 166, 169, 172
• Selanjutnya dapat ditentukan batas-batas bawah & atas kelas dan tepi atas kelas dengan memperhatikan c=3
Tabel Distribusi Frekuensi
Tepi Kelas Batas Kelas TitikTengah (X) Frekuensi (f) Frekuensi Relatif 151-153 150,5-153,5 152 3 0,03 154-156 153,5-156,5 155 7 0,07 157-159 156,5-159,5 158 12 0,12 160-162 159,5-161,5 161 18 0,18 163-165 162,5-164,5 164 27 0,27 166-168 165,5-168,5 167 17 0,17 169-171 168,5-171,5 170 11 0,11 172-174 171,5-174,5 173 5 0,05 Total 100 1,00(100%)
Tabel
Distribusi Frekuensi Kumulatif
Tepi Kelas Batas Kelas FrekuensiKumulatif < Batas Atas Kelas Frekuensi Kumulatif > Batas Bawah Kelas 151-153 150,5-153,5 3 100 154-156 153,5-156,5 10 97 157-159 156,5-159,5 22 90 160-162 159,5-161,5 40 78 163-165 162,5-164,5 67 60 166-168 165,5-168,5 84 33 169-171 168,5-171,5 95 16 172-174 171,5-174,5 100 5
Histogram & Poligon Frekuensi
Tinggi Badan Mahasiswa (cm)
171,5 - 174,5 165,5 - 168,5 159,5 - 162,5 153,5 - 156,5 147,5 - 150,5 30 20 10 0
Poligon Frekuensi Kumulatif
0 10 20 30 40 50 60 70 80 90 1 00 150 ,5 15 3,5 15 6,5 1 59,5 162,5 16 5,5 16 8,5 1 71,5 174,5Tinggi Badan Mahasis w a (cm )
F r e k u e n s i K u m u la ti f Frekuensi Kumulatif Kurang Dari Frekuensi Kumulatif
Dampak dari Pilihan k dan c
Tinggi Badan Mahasiswa (cm)
17 4,5 - 1 76,0 17 1,5 - 1 73,0 16 8,5 - 1 70,0 16 5,5 - 1 67,0 16 2,5 - 1 64,0 15 9,5 - 1 61,0 15 6,5 - 1 58,0 15 3,5 - 1 55,0 15 0,5 - 1 52 ,0 14 7,5 - 149 ,0 20 10 0
Tinggi Badan Mahasiswa (cm)
171,5 - 177,5 159,5 - 165,5 147,5 - 153,5 50 40 30 20 10 0
Tinggi Badan Mahasiswa (cm)
171,5 - 174,5 165,5 - 168,5 159,5 - 162,5 153,5 - 156,5 147,5 - 150,5 30 20 10 0
Central Tendency
• Untuk mendapatkan gambaran
mengenai karakteristik data, selain dengan analisis distribusi frekuensi, perlu pula analisis central tendency.
• Central tendency meliputi rataan
hitung/ukur/harmonis (arithmetic/
geometric/harmonic mean), median
dan modus (mode)
Rataan Hitung (Arithmetic Mean)
• Untuk sampel: • Untuk populasi:
• Untuk data dikelompokkan bila k
adalah banyaknya kelas:
n i i n X X 1
N i i N X 1
k i i i n X f X 1Contoh:
• Gunakan data 100 tinggi badan mhsw • Bila belum dikelompokkan maka mean
adalah 163,40
• Bila telah dikelompokkan (misalnya
dalam pembagian kelas yang telah dilakukan pada contoh sebelumnya) maka mean adalah 163,37
• Nilai mean yang hampir sama
menunjukkan pengelompokan yang baik.
Mean Untuk Data Berkelompok
Tepi Kelas Batas Kelas TitikTengah (Xi) Frekuensi (fi) Xifi 151-153 150,5-153,5 152 3 456 154-156 153,5-156,5 155 7 1085 157-159 156,5-159,5 158 12 1896 160-162 159,5-161,5 161 18 1288 163-165 162,5-164,5 164 27 4428 166-168 165,5-168,5 167 17 2839 169-171 168,5-171,5 170 11 1870 172-174 171,5-174,5 173 5 865 Total 100 16337
Metode Transformasi
Tepi Kelas TitikTengah (Xi) Frekuensi (fi) Ui Uifi 151-153 152 3 -4 -12 154-156 155 7 -3 -21 157-159 158 12 -2 -24 160-162 161 18 -1 -18 163-165 164 27 0 0 166-168 167 17 1 17 169-171 170 11 2 22 172-174 173 5 3 15 Total 100 -21
Metode Transformasi
37 , 163 100 21 3 164 1
n U f c X X k i i i sementaraMedian
• Merupakan nilai tengah dari data
yang telah diurutkan dari kecil ke besar atau sebaliknya.
• Untuk data ganjil median adalah nilai
tengah.
• Untuk data genap median adalah
rataan dua nilai tengah.
Contoh:
• Median dari 3,4,4,5,6,8,8,9,10 adalah
data ke 5 dari 9 data yaitu 6.
• Median dari data 3,4,4,5,6,8,8,8,9,10
adalah rataan dari data ke 5 dan ke 6 yaitu (6+8)/2=7
Median untuk Data Berkelompok
Bila Lo batas bawah kelas median, c lebar kelas, (∑fi)0 frekuensi
kelas-kelas di bawah kelas-kelas median, fm
frekuensi kelas median, n banyaknya data maka median adalah:
Sehingga median untuk contoh sebelumnya adalah: m i f f n c L Med
0 0 ) ( 2 61 , 163 27 40 2 100 3 5 , 162 MedModus
• Merupakan data yang paling banyak
muncul atau data yang frekuensinya terbesar.
• Data dapat memiliki 1 modus, lebih dari 1
modus atau tanpa modus.
• Modus dari 3,4,4,5,6,8,8,8,9,10 adalah 8 • Modus dari 3,4,4,5,6,8,8,9,10 adalah 4 & 8 • Modus dari 3,4,5,6,7,8, 9,10 tidak ada • Modus dari 8,8,8,8,8,8 tidak ada
Modus untuk Data Berkelompok
Bila:
Lo batas bawah kelas modus c lebar kelas
fmod frekuensi kelas medus
fi-1 fmod-frekuensi kelas sebelum fmod fi+1 fmod-frekuensi kelas sesudah fmod maka median adalah:
Sehingga median untuk contoh sebelumnya adalah: 1 1 1 0 f f f c L Mod 04 , 164 10 9 9 3 5 , 162 Mod
Skewness vs Posisi Nilai Sentral
Simetris: Mean=Median=Modus
Mean vs Median vs Modus
• Mean baik dipakai untuk data yang
tidak terlalu bervariasi.
• Median baik dipakai untuk data yang
sangat bervariasi atau ada nilai ekstrim.
• Modus baik untuk data yang
terkonsentrasi
• Tingkat variasi ini dapat ditunjukkan
oleh nilai simpangan baku
Hubungan Simetris
Mean, Modus dan Median
• Bila kurva distribusi frekuensi tidak
terlalu menceng maka berlaku hubungan Modus=3Median-2Mean
• Pada contoh tinggi badan mahasiswa
Modus=(3)(163,61)-(2)(163,37)=164,09 tidak jauh berbeda dengan hasil
perhitungan sebelumnya (164,04). Hal ini menunjukkan kurva relatif simetris.
Measure of Dispersion
• Dispersi adalah tingkat penyebaran suatu
data, yaitu perbedaan antar nilai, dan antara nilai dengan nilai sentralnya.
• Jenis dispersi meliputi range (jangkauan),
mean deviation, variance (variansi), standard deviation (simpangan baku), coefficient of variation (koefisien variasi).
• 4 jenis pertama merupakan ukuran
dispersi mutlak, sedang jenis terakhir merupakan ukuran dispersi relatif.
Range
• Merupakan selisih nilai terbesar dan
terkecil dari data.
• Pada contoh tinggi badan mahasiswa
nilai range r=174-152=22
• R terlalu kasar dan sangat
dipengaruhi nilai ekstrim sehingga jarang dipakai untuk ukuran dispersi.
Mean Deviation
• Merupakan jumlah mutlak dari selisih
setiap nilai dengan mean.
• Untuk data tidak berkelompok: • Untuk data berkelompok:
• Mean dapat diganti dengan median atau
modus. n X X MD n i i 1 n X X f MD n i i i 1
Variance (Variansi) Sampel
• Untuk data tidak berkelompok:
• Untuk data berkelompok:
) 1 ( 1 1 2 1 2 1 2 2
n n X X n n X X s n i n i i i n i i
) 1 ( 1 1 2 1 2 1 2 2
n n X f X f n n X X f s n i n i i i i i n i i iStandard Deviation
(Simpangan Baku)
• Walaupun variansi adalah ukuran
dispersi yang baik karena
mencerminkan selisih nilai dengan mean, namun bentuknya kuadrat padahal dispersi lebih mudah diinterpertasikan secara linier.
• Oleh sebab itu akar dari variansi
yaitu simpangan baku juga digunakan.
Koefisien Variasi
• Simpangan baku dan variansi adalah
ukuran variasi dari suatu set data atau biasa disebut variabi absolut
• Untuk membandingkan variasi atau
dispersi dari beberapa set data dipakai dispersi atau variasi relatif yaitu koefisien variasi (KV)