Bab I Pendahuluan & Statistika Deskriptif

(1)

Bab I

Pendahuluan &

Statistika Deskriptif

•Pengertian Statistika •Distribusi Frekuensi •Central Tendency •Measure of Dispersion

Pengertian Statistika

• Statistik (statistic) vs statistika

(statistics)

• Statistik: angka-angka

• Statistika: penggunaan data numerik

untuk membantu membuat

(2)

Deskriptif vs Inferensial

• Statistika deskriptif: perhitungan rangkuman dan tampilan grafis • Statistika inferensial: pembuatan

kesimpulan umum mengenai keseluruhan (populasi) dengan melakukan pangamatan atas suatu bagian (sampel)

• Tidak ada sampel yang dijamin sangat sesuai menggambarkan populasi sasaran, tapi galat pengambilan sampel (sampling error) harus dijaga agar dalam batas wajar.

Deduktif vs Induktif

• Statistika deduktif: sifat-sifat dari kasus-kasus khusus dapat diduga dari keadaan umum. Mis: kita dapat menetapkan 0,04 sebagai probabilitas bahwa seorang mahasiswa Teknik Sipil terpilih secara acak jika kita tahu bahwa 4% mahasiswa di kampus mengambil jurusan tersebut • Statistika induktif = statistika inferensial

(3)

Populasi vs Sampel

• Populasi statistika adalah kumpulan

seluruh pengamatan yang mungkin dari karakteristik tertentu yang diteliti

• Sampel adalah suatu kumpulan

pengamatan yang berasal dari suatu bagian dari populasi tertentu

• Galat (error) antara lain dipengaruhi

oleh jumlah sampel

Unsur dasar (elementary unit)

Suatu pengelompokan tunggal dari unsur-unsur dasar dapat menimbulkan beberapa buah populasi. Mis: para mahasiswa yang terdaftar pada sebuah universitas dapat menjadi unsur-unsur dasar populasi indeks prestasi, populasi penghasilan, populasi jenis kelamin, populasi jurusan, populasi tinggi badan, populasi usia dll. Bedakan dengan pengertian populasi yang berarti kelompok demografis sejumlah makhluk hidup.

(4)

Jenis Populasi

• Populasi kuantitatif: numerik

• Populasi kualitatif: atribut (mis: jenis

kelamin, pekerjaan dll)

• Populasi: telah ada, masa

mendatang, imajiner

• Sampel diambil karena keterbatasan biaya, waktu dan tenaga

• Data mentah: titik-titik data yang belum disusun dalam bentuk yang bermakna jelas

• Statistik deskriptif menyusun dan memanipulasi data mentah agar dapat dengan mudah diterjemahkan maknanya, misalnya dalam bentuk tabel dan grafik distribusi frekuensi, kecenderungan pemusatan dan variabilitas

(5)

Distribusi Frekuensi

Merupakan cara penyajian data ke dalam kelas-kelas. Banyaknya data di dalam tiap kelas dihitung sehingga diperoleh frekuensi kelas

Contoh

• Tabel di sebelah kiri adalah distribusi frekuensi berat 50 kopor yang ditimbang secara acak di bandara

• Pencatatan dibulatkan ke kg terdekat sehingga misalnya kelas 19-21 meliputi semua kopor dengan berat >18,5 kg (batas bawah kelas) tapi <21,5 kg (batas atas kelas)

• Batas kelas dibuat 1 desimal lebih banyak dari data asli

• Lebar kelas=batas atas kelas-batas bawah kelas

• Titik tengah kelas 19-21 misalnya adalah 20 Berat (kg) Frekuensi 7-9 2 10-12 8 13-15 14 16-18 19 19-21 7 ada 5 kelas

tepi atas kelas tepi bawah kelas

(6)

Panduan Membuat

Tabel Distribusi Frekuensi

• Hitung range, r=nilai maks.-nilai min. • Perkiraan banyak kelas (Sturgess),

k=1+3,3log(n) bila n adalah banyaknya data

• Lebar kelas, c=r/k, umumnya dibuat

seragam dan mudah diinterpertasikan

• Tentukan tepi bawah kelas pertama,

a₁=nilai min-(kc-r)/2. Lalu a₂=a₁+c

• Batas atas kelas pertama:

b₁=a₂-(satu unit pengukuran terkecil/2)

Contoh:

Data tinggi 100 mahasiswa (cm)

156 170 165 170 158 164 160 162 167 171 168 161 169 153 165 169 164 158 164 157 161 166 173 163 173 162 166 161 163 169 157 152 159 168 156 163 155 164 156 165 164 163 164 162 164 157 161 167 164 167 166 160 169 172 167 167 164 163 168 156 162 167 163 161 163 162 167 156 174 170 160 162 156 164 154 158 162 162 163 164 165 171 162 158 162 165 174 164 169 153 167 157 168 161 169 163 159 168 159 168

(7)

Jawab:

• r=174-152=22 • k=1+3,3log100=7,6 • c=r/k=22/7,6=2,89≈ 3 • Bila k=7, a₁=152-(7x3-22)/2=152,5>152 • Bila k=8, a₁=152-(8x3-22)/2=151

• Tepi bawah kelas berikutnya: 154, 157, 160, 163, 166, 169, 172

• Selanjutnya dapat ditentukan batas-batas bawah & atas kelas dan tepi atas kelas dengan memperhatikan c=3

Tabel Distribusi Frekuensi

Tepi Kelas Batas Kelas Titik

Tengah (X) Frekuensi (f) Frekuensi Relatif 151-153 150,5-153,5 152 3 0,03 154-156 153,5-156,5 155 7 0,07 157-159 156,5-159,5 158 12 0,12 160-162 159,5-161,5 161 18 0,18 163-165 162,5-164,5 164 27 0,27 166-168 165,5-168,5 167 17 0,17 169-171 168,5-171,5 170 11 0,11 172-174 171,5-174,5 173 5 0,05 Total 100 1,00(100%)

(8)

Tabel

Distribusi Frekuensi Kumulatif

Tepi Kelas Batas Kelas Frekuensi

Kumulatif < Batas Atas Kelas Frekuensi Kumulatif > Batas Bawah Kelas 151-153 150,5-153,5 3 100 154-156 153,5-156,5 10 97 157-159 156,5-159,5 22 90 160-162 159,5-161,5 40 78 163-165 162,5-164,5 67 60 166-168 165,5-168,5 84 33 169-171 168,5-171,5 95 16 172-174 171,5-174,5 100 5

Histogram & Poligon Frekuensi

Tinggi Badan Mahasiswa (cm)

171,5 - 174,5 165,5 - 168,5 159,5 - 162,5 153,5 - 156,5 147,5 - 150,5 30 20 10 0

(9)

Poligon Frekuensi Kumulatif

0 10 20 30 40 50 60 70 80 90 1 00 150 ,5 15 3,5 15 6,5 1 59,5 162,5 16 5,5 16 8,5 1 71,5 174,5

Tinggi Badan Mahasis w a (cm )

F r e k u e n s i K u m u la ti f Frekuensi Kumulatif Kurang Dari Frekuensi Kumulatif

Dampak dari Pilihan k dan c

17 4,5_{- 1} 76_,0 17 1,5_{- 1} 73_,0 16 8,5_{- 1} 70_,0 16 5,5_{- 1} 67_,0 16 2,5_{- 1} 64_,0 15 9,5_{- 1} 61_,0 15 6,5_{- 1} 58_,0 15 3,5_{- 1} 55_,0 15 0,5_{- 1} 52 ,0 14 7,5 - 1₄₉ ,0 20 10 0

171,5 - 177,5 159,5 - 165,5 147,5 - 153,5 50 40 30 20 10 0

171,5 - 174,5 165,5 - 168,5 159,5 - 162,5 153,5 - 156,5 147,5 - 150,5 30 20 10 0

(10)

Central Tendency

• Untuk mendapatkan gambaran

mengenai karakteristik data, selain dengan analisis distribusi frekuensi, perlu pula analisis central tendency.

• Central tendency meliputi rataan

hitung/ukur/harmonis (arithmetic/

geometric/harmonic mean), median

dan modus (mode)

Rataan Hitung (Arithmetic Mean)

• Untuk sampel: • Untuk populasi:

• Untuk data dikelompokkan bila k

adalah banyaknya kelas:



  n i i n X X 1



  N i i N X 1 



  k i i i n X f X 1

(11)

Contoh:

• Gunakan data 100 tinggi badan mhsw • Bila belum dikelompokkan maka mean

adalah 163,40

• Bila telah dikelompokkan (misalnya

dalam pembagian kelas yang telah dilakukan pada contoh sebelumnya) maka mean adalah 163,37

• Nilai mean yang hampir sama

menunjukkan pengelompokan yang baik.

Mean Untuk Data Berkelompok

Tepi Kelas Batas Kelas Titik

Tengah (Xi) Frekuensi (fi) Xifi 151-153 150,5-153,5 152 3 456 154-156 153,5-156,5 155 7 1085 157-159 156,5-159,5 158 12 1896 160-162 159,5-161,5 161 18 1288 163-165 162,5-164,5 164 27 4428 166-168 165,5-168,5 167 17 2839 169-171 168,5-171,5 170 11 1870 172-174 171,5-174,5 173 5 865 Total 100 16337

(12)

Metode Transformasi

Tepi Kelas Titik

Tengah (Xi) Frekuensi (fi) Ui Uifi 151-153 152 3 -4 -12 154-156 155 7 -3 -21 157-159 158 12 -2 -24 160-162 161 18 -1 -18 163-165 164 27 0 0 166-168 167 17 1 17 169-171 170 11 2 22 172-174 173 5 3 15 Total 100 -21

Metode Transformasi

37 , 163 100 21 3 164 1 _ _  _  



 n U f c X X k i i i sementara

(13)

Median

• Merupakan nilai tengah dari data

yang telah diurutkan dari kecil ke besar atau sebaliknya.

• Untuk data ganjil median adalah nilai

tengah.

• Untuk data genap median adalah

rataan dua nilai tengah.

Contoh:

• Median dari 3,4,4,5,6,8,8,9,10 adalah

data ke 5 dari 9 data yaitu 6.

• Median dari data 3,4,4,5,6,8,8,8,9,10

adalah rataan dari data ke 5 dan ke 6 yaitu (6+8)/2=7

(14)

Median untuk Data Berkelompok

Bila L_o batas bawah kelas median, c lebar kelas, (∑f_i)0 _frekuensi

kelas-kelas di bawah kelas-kelas median, f_m

frekuensi kelas median, n banyaknya data maka median adalah:

Sehingga median untuk contoh sebelumnya adalah: m i f f n c L Med



   0 0 ) ( 2 61 , 163 27 40 2 100 3 5 , 162     Med

Modus

• Merupakan data yang paling banyak

muncul atau data yang frekuensinya terbesar.

• Data dapat memiliki 1 modus, lebih dari 1

modus atau tanpa modus.

• Modus dari 3,4,4,5,6,8,8,8,9,10 adalah 8 • Modus dari 3,4,4,5,6,8,8,9,10 adalah 4 & 8 • Modus dari 3,4,5,6,7,8, 9,10 tidak ada • Modus dari 8,8,8,8,8,8 tidak ada

(15)

Modus untuk Data Berkelompok

Bila:

L_o batas bawah kelas modus c lebar kelas

f_mod frekuensi kelas medus

f_i-1f_mod-frekuensi kelas sebelum f_mod f_i+1f_mod-frekuensi kelas sesudah f_mod maka median adalah:

Sehingga median untuk contoh sebelumnya adalah: 1 1 1 0       f f f c L Mod 04 , 164 10 9 9 3 5 , 162     Mod

Skewness vs Posisi Nilai Sentral

Simetris: Mean=Median=Modus

(16)

Mean vs Median vs Modus

• Mean baik dipakai untuk data yang

tidak terlalu bervariasi.

• Median baik dipakai untuk data yang

sangat bervariasi atau ada nilai ekstrim.

• Modus baik untuk data yang

terkonsentrasi

• Tingkat variasi ini dapat ditunjukkan

oleh nilai simpangan baku

Hubungan Simetris

Mean, Modus dan Median

• Bila kurva distribusi frekuensi tidak

terlalu menceng maka berlaku hubungan Modus=3Median-2Mean

• Pada contoh tinggi badan mahasiswa

Modus=(3)(163,61)-(2)(163,37)=164,09 tidak jauh berbeda dengan hasil

perhitungan sebelumnya (164,04). Hal ini menunjukkan kurva relatif simetris.

(17)

Measure of Dispersion

• Dispersi adalah tingkat penyebaran suatu

data, yaitu perbedaan antar nilai, dan antara nilai dengan nilai sentralnya.

• Jenis dispersi meliputi range (jangkauan),

mean deviation, variance (variansi), standard deviation (simpangan baku), coefficient of variation (koefisien variasi).

• 4 jenis pertama merupakan ukuran

dispersi mutlak, sedang jenis terakhir merupakan ukuran dispersi relatif.

Range

• Merupakan selisih nilai terbesar dan

terkecil dari data.

• Pada contoh tinggi badan mahasiswa

nilai range r=174-152=22

• R terlalu kasar dan sangat

dipengaruhi nilai ekstrim sehingga jarang dipakai untuk ukuran dispersi.

(18)

Mean Deviation

• Merupakan jumlah mutlak dari selisih

setiap nilai dengan mean.

• Untuk data tidak berkelompok: • Untuk data berkelompok:

• Mean dapat diganti dengan median atau

modus. n X X MD n i i     1 n X X f MD n i i i     1

Variance (Variansi) Sampel

• Untuk data tidak berkelompok:

• Untuk data berkelompok:





) 1 ( 1 1 2 1 2 1 2 2            



   n n X X n n X X s n i n i i i n i i





) 1 ( 1 1 2 1 2 1 2 2            



   n n X f X f n n X X f s n i n i i i i i n i i i

(19)

Standard Deviation

(Simpangan Baku)

• Walaupun variansi adalah ukuran

dispersi yang baik karena

mencerminkan selisih nilai dengan mean, namun bentuknya kuadrat padahal dispersi lebih mudah diinterpertasikan secara linier.

• Oleh sebab itu akar dari variansi

yaitu simpangan baku juga digunakan.

Koefisien Variasi

• Simpangan baku dan variansi adalah

ukuran variasi dari suatu set data atau biasa disebut variabi absolut

• Untuk membandingkan variasi atau

dispersi dari beberapa set data dipakai dispersi atau variasi relatif yaitu koefisien variasi (KV)

(20)

Skewnes dan Kurtosis

S Mod X    S Med X ) ( 3   





3 1 3 3 nS X X n i i



   





4 1 4 4 nS X X n i i



   