STATISTIKA DASAR
Oleh
• cara penyajian data
-
tabel
-
grafik
• menghitung harga-harga penting :
-
ukuran lokasi
-
ukuran sebaran/penyimpangan
•
apabila data mempunyai observasinya cukup banyak perlu
disusun secara sistematik
Susunan data secara sistematik disebut distribusi atau
deretan (runtun)
data disusun menurut :
hasilnya disebut :
a. besarnya
(kuantitasnya)
b. kategorinya
(kualitasnya)
c. waktu
(terjadinya)
d. letak geografisnya
a. distribusi
frek. kuanti.
b. distribusi
frek. kualit.
c. runtun waktu
(time series)
d. distribusi
spasial
Penyusunan
distribusi frekuensi kuantitatif
- data dibagi menjadi
kelompok
yang biasa disebut
kelas interval
- banyaknya kelompok dipilih
antara 5 dan 15
- syarat :
antara satu kelompok dengan kelompok yang lain
tidak saling
overlap
artinya :
HARGA-HARGA TENGAH
Suatu harga yang dapat menggambarkan distribusi
khusunya ukuran letak (lokasi)
a) rata-rata (= mean)
b) median
c) modus
d) geometrik mean
e) Harmonic mean
UKURAN LETAK
a) Median
b) Kuartil
c) Desil
d) Persentil
e) Kuantil
87 66 28 67 51 34 47 61 108 49 20 37 56 75 52 73 59 37 55 58 54 63 47 54 57 59 72 57 34 66 64 54 25 82 27 47 71 42 85 77 56 55 33 69 72 52 69 21 73 49 62 51 44 42 26 66 41 44 48 72 61 37 47 61 56 52 51 22 48 35 44 67
Distribusi Frekuensi Penghasilan 84 keluarga di ABC
Penghasilan (dalam ribuan rupiah)
Banyak keluarga 20,0 – 29,9 7 30,0 – 39,9 40,0 – 49,9 50,0 – 59,9 60,0 – 69,9 70,0 – 79,9 80,0 – 89,9 90,0 – 99,9 100,0 – 109,9 9 16 21 14 9 4 3 1 84
Distribusi Frekuensi Penghasilan 84 keluarga di ABC
Penghasilan (dalam ribuan rupiah)
Banyak keluarga 19,5 – 29,5 7 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5 99,5 – 109,5 9 16 21 14 9 4 3 1
5
3
6
.
.
.
6
5
6
6
7
5
.
.
.
4
5
9
7
8
6
.
.
.
7
8
5
6
5
3
.
.
.
3
5
8
4
6
5
.
.
.
4
8
3
10
2
9
7
8
9
7
18
6
16
5
11
4
6
3
1
2
Banyaknya
Mahasiswa
Nilai
Ujian Statistik
S
K
G
K
G
Ks
D
B
B
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
171531
S
B
.
.
.
D
Ks
Ks
D
D
D
.
.
.
S
G
K
K
Distribusi Frekuensi Kualitatif
171531
354
Keseran
4057
Dwico
3456
Becak
161206
Sepeda
873
Gerobag
1585
Kereta
Banyak
Terjual
Jenis Plombir
Kendaraan
a) Mean :
Jumlah data dibagi banyak data
n 2 1
,
X
,...,
X
X
angka,
n
n
X
...
X
X
X
=
1+
2+
+
n∑
==
n 1 i iX
n
1
notasi untuk mean sampel
x
μ
atau
μ
Contoh :
Ada 5 macam beras harganya per kilogram
Rp. 340, Rp. 525, Rp. 450, Rp. 210, Rp. 275
=> Mean harga beras per kilogram
5
275
210
450
525
340
X
=
+
+
+
+
360
=
Suatu sifat mean yang baik :
Dapat digunakan untuk menghitung mean kelompok
gabungan, jika mean masing-masing kelompok
1 1
,
X
f
6 6,
X
f
5 5,
X
f
4 4,
X
f
3 3,
X
f
2 2,
X
f
n
6 2 1 6 6 2 2 1 1...f
f
f
X
f
...
X
f
X
f
X
+
+
+
+
+
=
n X f f X f 6 1 i i i 6 1 i i 6 1 i i i∑
∑
∑
= = = = = => nSeharusnya mudah dimengerti, sebab
1
kelompok
dalam
data
jumlah
X
,
f
1 1=
2
kelompok
dalam
data
jumlah
X
,
f
2 2=
. . .dst
6 6 2 2 1 1,
X
f
,
X
...
f
,
X
f
+
+
+
⇒
4638,0
84
JUMLAH
104,5
104,5
1
99,5 – 109,5
283,5
94,5
3
89,5 – 99,5
338,0
84,5
4
79,5 – 89,5
670,5
74,5
9
69,5 – 79,5
903,5
64,5
14
59,5 – 69,5
1144,5
54,5
21
49,5 – 59,5
712,5
44,5
16
39,5 – 49,5
310,5
34,5
9
29,5 – 39,5
171,5
24,5
7
19,5 – 29,5
f
ix
i2f
ix
ix
if
iPenghasilan
f
i= frekuensi interval ke-i
x
i= titik tengah interval ke-i
84
0
,
4638
f
x
f
X
9 1 i i 9 1 i i i=
=
∑
∑
= =21
,
55
=
kalau dihitung dari data asli (= raw data = data kasar)
ribu rupiah
84
51
42
...
72
52
67
X
=
+
+
+
+
+
21
,
55
=
ribu rupiah
b) Median :
angka yang letaknya ditengah setelah data diurutkan
contoh :
- banyaknya data ganjil :
270, 210, 450, 340, 525
210, 270, 340, 450, 525 urutkan
median
- banyaknya data genap :
210, 275, 340, 450, 485, 525 median 395 2 450 340 = + =
Median untuk distribusi frekuensi dapat dicari dengan 2 cara
-
menggunakan gambar (histogram)-
cara interpolasia = jarak antara 49,5 ke median 76 , 4 21 100 median int. frekuensi diarsir daerah luas = = = => median = 49,5 + 4,76 = 54,26
-
menggunakan cara interpolasi :rumus
:
.c f F 2 n L Median md md − + =-
Lmd = batas bawah interval median-
n = banyaknya data- F = nomor urut data tertinggi sebelum interval median
(= jumlah frekuensi interval – interval sebelum interval median
- fmd = frekuensi interval median - c = lebar interval median
interval median adalah interval yang memuat median
untuk contoh 1, hal 8, modul 2 interval median adalah
49,5 – 59,5 => Lmd = 49,5 => n = 84 => F = 7+9+16 = 32 => fmd = 21 => c = 10 .10 21 2 3 2 84 5 , 9 4 Median = + − =>
c) Modus :
anggota data yang paling sering muncul (mempunyai
frekuensi tertinggi
- data boleh kualitatif
contoh
* 4, 8, 5, 6, 8, 7, 6, 7, 9, 7, 6, 7,5
=> modus = 7
* 63, 65, 65, 65, 70, 72, 74, 79, 79, 79, 82, 82, 85
Untuk distribusi frekuensi
.c b L Modus mo + + = a a-
Lmo = batas bawah interval modus-
a = beda antara interval modus dengan interval sebelumnya-
b = beda antara interval modus dengan interval sesudahnya-
c = lebar interval modulinterval modus adalah 49,5 – 59,5 => Lmo = 49,5 a = 21 – 16 = 5 b = 21 – 14 = 7 c = 10 .10 7 5 2 3 5 5 , 9 4 Modus + − + = => 67 , 52 12 50 5 , 9 4 + = = Catatan :
UKURAN LOKASI
Setelah data diurutkan
a) Median :
membagi data menjadi dua bagian yang sama
b) Kuartil :
membagi data menjadi empat bagian yang sama
c) Desil :
membagi data menjadi sepuluh bagian yang sama
d) Persentil :
=> Suatu data akan mempunyai
•
1 Median
•
3 Kuartil
•
9 Desil
•
99 Persentil
•
(n-1) Kuantil/N-til
Menghitung Kuartil, Desil, Persentil atau Kuantil suatu distribusi
frekuensi sesuai dengan cara menghitung median
.c f F N i.n L Kuantil ki ki
i
ke-− + =rumus :
- i = 1, 2, …, (N-1) - N = banyaknya kelompokjika akan dihitung kuartil
(Q
1, Q
2, Q
3)
dicari dulu interval yang memuat masing-masing Kuartil
untuk
Q
1 adalah interval yang memuat observasi bernomor 214 84 4 1.n = =
untuk
Q
3 adalah interval yang memuat observasi bernomor 634 84 . 3 4 3.n = =
=> Interval yang memuat
Q
1 adalah : 39,5 – 49,5 sehingga10
.
16
16
21
5
,
39
Q
1=
+
−
HARGA-HARGA DEVIASI
Adalah ukuran yang menunjukkan sebaran/penyimpangan tiap observasi data terhadap suatu harga tengah
a) Rentang/Range b) Deviasi rata-rata
c) Variansi dan Deviasi Standar d) Deviasi kuartil
a) Rentang/Range
beda antara maksimum data dengan minimum data
R = max. – min.
Contoh : * 60, 60, 61, 63, 65, 65, 66, 67, 68, 90 => R = 90 – 60 = 30 * 60, 65, 70, 72, 75, 78, 80, 85, 88, 90 => R = 90 – 60 = 30b) Deviasi rata-rata :
adalah harga rata-rata sebaran tiap observasi data terhadap meannya
n 2 1
,
x
,...,
x
x
;
data
n
∑
==
n 1 i iX
n
1
X
:
mean
∑
=−
=
n 1 i iX
X
n
1
d.r.
Contoh 340, 525, 450, 210, 275 1510
0
165
165
525
90
90
450
20
-20
340
85
-85
275
150
-150
210
iX
(X
i−
X
)
X
i−
X
102
5
510
d.r
=
=
=>
1175,62 84 JUMLAh 49,29 49,29 104,5 1 99,5 – 109,5 117,87 39,29 94,5 3 89,5 – 99,5 117,16 29,29 84,5 4 79,5 – 89,5 173,61 19,29 74,5 9 69,5 – 79,5 130,06 9,29 64,5 14 59,5 – 69,5 14,91 0,71 54,5 21 49,5 – 59,5 171,36 10,71 44,5 16 39,5 – 49,5 186,39 20,71 34,5 9 29,5 – 39,5 214,97 30,71 24,5 7 19,5 – 29,5 fi |Xi –X| |Xi –X| Xi fi Penghasilan
fi = frekuensi interval ke-i Xi = titik tengah interval ke-i
X f
9
∑
c) Variansi dan standar Deviasi
n angka, X1, X2, … , Xn(
) (
)
(
)
1 n X X ... X X X X S 2 n 2 2 2 1 2 − − + + − + − =notasi untuk variansi sampel
(
)
1
n
X
X
n 1 i 2 i−
−
=
∑
=(
)
N
μ
X
σ
atau
σ
n 1 i 2 x i 2 x 2∑
=−
=
Standar deviasi = akar positif variansi
Notasi :
s
dan
σ
untuk sampel
untuk populasi
Contoh :
210, 340, 525, 450, 275 ) 275 210 450 525 340 ( 1 X = + + + +65450
0
37225
165
525
8100
90
450
400
-20
340
7225
-85
275
22500
-150
210
iX
(X
i−
X
)
(X
i−
X
)
25
,
16362
4
65450
s
:
Variansi
2=
=
=>
916
,
127
5
,
16362
s
:
standar
deviasi
=
=
untuk distribusi frekuensi