IV.
UKURAN PEMUSATAN DATA
4.1 Pendahuluan
· Untuk mendapatkan gambaran yang lebih jelas tentang sekumpulan data mengenai sesuatu hal, baik itu dari sampel ataupun populasi, selain data disajikan dalam bentuk tabel atau diagram, diperlukan ukuran-ukuran yang merupakan wakil dari kumpulan data tersebut.
· Ukuran statistik yang penting diantaranya adalah ukuran pemusatan, ukuran penyebaran,
ukuran tinggi rendah kurva (kurtosis) dan ukuran kemiringan (skewness).
· Ukuran pemusatan data dibedakan menjadi 2, yakni :
a. Ukuran gejala pusat adalah ukuran statistik yang menggambarkan gejala pusat
pengelompokan data, artinya ukuran statistik ini dapat mengisyaratkan pada bilangan apa data yang ada cenderung untuk berkelompok. Yang termasuk kedalam ukuran gejala pusat adalah rata-rata hitung, rata-rata ukur, rata-rata harmonik dan modus.
b. Ukuran letak adalah ukuran statistik yang menggambarkan letak data. Yang termasuk
ukuran letak adalah median, kuartil, desil dan persentil.
4.2 Ukuran Gejala Pusat Untuk Data Tunggal 4.2.1 Rata-Rata Hitung atau Rata-Rata (Mean)
· Definisi : Apabila dari sebuah populasi yang berukuran N, diukur variabel X yang memberikan hasil pengukuran x1,x2,...,xN dengan tingkat pengukuran interval/rasio,
maka rata-rata untuk variabel X dalam populasi didefinisikan sebagai hasil bagi jumlah nilai data dengan banyak data.
N x N
i i
å
== 1
m i = 1,2,...,N (parameter) (4.1)
n x x
N
i i
å
== 1
i = 1,2,...,n (statistik) (4.2)
dengan :
m
dan x = rata-rata hitung N dan n = banyak dataå
=N ii x 1
= jumlah seluruh nilai data
· Contoh 4.1
Berapa rata-rata hitung dari data berikut : 2, 5, 6, 8, 9 ?
Jawab : =
å
= =N x N
i i 1
m
☺ Rata-rata hitung dari data tersebut adalah
· Sifat-sifat rata-rata hitung :
1. Rata-rata hitung hanya boleh dihitung untuk data dengan tingkat pengukuran interval/rasio (data kuantitatif).
Artinya apabila dari sekumpulan data ada sebuah data yang hilang, maka rata-rata hitung tidak dapat dihitung.
4. Rata-rata hitung sangat dipengaruhi oleh nilai-nilai ekstrim.
4.2.2 Rata-rata Ukur (Geometric Mean)
· Untuk data bernilai x1, x2, ..., xN, maka rata-rata ukur didefinisikan sebagai :
· Untuk bilangan-bilangan yang bernilai besar, lebih baik digunakan logaritmanya, sehingga persamaan (4.3) menjadi persamaan (4.4)
N
Dan untuk memperoleh nilai G, gunakan anti log-nya.
· Contoh 4.2
☺ Rata-rata ukur untuk data tersebut adalah
4.2.3 Rata-rata Harmonik (Harmonic Mean)
· Untuk data x1, x2, ..., xN , maka rata-rata harmonik didefinisikan sebagai :
Berapa rata-rata harmonik dari data berikut : 2, 5, 6, 8, 9 ?
Jawab : =
Catatan :
- Perhatikan kembali hasil perhitungan pada contoh 4.1, 4.2, 4.3
- Untuk soal yang sama ternyata menghasilkan rata-rata hitung m = 6 , rata-rata ukur G = 5,33 dan rata-rata harmonik H =4,53
- Ternyata antara ketiga rata-rata dalam ukuran nilai pusat, yaitu rata-rata hitung (m), rata-rata ukur (G), dan rata-rata harmonik (H), terdapat hubungan : H £G £m
4.2.4 Modus
· Modus merupakan ukuran yang digunakan untuk menyatakan fenomena yang paling
banyak terjadi atau paling sering muncul.
· Untuk data kualitatif (data dengan tingkat pengukuran sekurang-kurangnya nominal) modus sering dipakai sebagai pengganti rata-rata. Sedangkan untuk data kuantitatif, modus diperoleh dengan jalan menentukan frekuensi terbesar di antara serangkaian data. · Serangkaian data mungkin memiliki satu modus (unimodal), dua modus (bimodal) atau
lebih dari dua (multimodal). · Contoh 4.4
Berapa modus dari data berikut : 2,3,5,3,6,9,3,9,5,6,5,1,5 ?
Jawab :
modus =
☺ Modus dari data tersebut adalah 5
4.3 Ukuran Gejala Pusat Untuk Data Berkelompok 4.3.1 Rata-rata Hitung (Mean)
a. Metode Biasa
Ringkasan data dalam suatu daftar distribusi frekuensi dinamakan data yang dikelompokkan. Jika data sudah dikelompokkan, rata-ratanya dapat didekati dengan menganggap bahwa nilai observasi di dalam suatu kelas mempunyai sebuah nilai yang sama dengan titik tengah kelas.
Perhitungan rata-rata hitung untuk data yang dikelompokkan dengan metoda biasa adalah :
(
)
(
)
N m f
f m f
k
i
i i
k
i i k
i
i
i
å
å
å
== =
´
=
´
= 1
1 1
m i = 1,2,...,k (4.7)
dengan : fi = frekuensi kelas interval ke-i N = jumlah frekuensi
mi = titik tengah kelas interval ke-i k = banyak kelas interval
· Contoh 4.5
Hitunglah rata-rata hitung untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga dalam daftar distribusi frekuensi di bawah ini?
Tabel 4.1 Perkiraan rata-rata hitung menggunakan metoda biasa Pengeluaran Frekuensi (fi) Titik Tengah Kelas (mi) fi x mi
50 – 55 1 (50+55)/2 = 52,5 (1 x 52,5) = 52,5
56 – 61 5 58,5 292,5
62 – 67 6 64,5 387,0
68 – 73 10 70,5 705,0
74 – 79 5 76,5 382,5
80 – 85 3 82,5 247,5
Jawab :
☺ Rata-rata hitung pengeluaran per hari untuk 30 keluarga tersebut adalah Rp
b. Metoda Short Cut (cara singkat/cara sandi)
Rumus mencari rata-rata hitung dengan menggunakan metode short cut adalah :
(
)
interval, namun diusahakan di kelas dengan frekuensi terbesar.
· Contoh 4.6 (Berdasarkan Contoh 4.5)
Hitung rata-rata hitung untuk data pada tabel di bawah ini dengan menggunakan metode short cut
Tabel 4.2 Perkiraan rata-rata hitung menggunakan metoda shortcut
Pengeluaran fi mi di fi x di
m
= 70,5 (nilai titik tengah dengan frekuensi kelas terbesar) Dengan menggunakan persamaan (4.8) diperoleh rata-rata hitung :(
)
4.3.2 Rata-rata Ukur
(
)
N m f
G k
i
i i
å
= ´= 1
log
log (4.9)
dengan : log G = logaritma rata-rata ukur
Dan untuk memperoleh nilai G, gunakan anti log-nya.
· Contoh 4.7 (Berdasarkan Contoh 4.5)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah nilai rata-rata ukurnya !
Tabel 4.3 Perhitungan Rata-rata Ukur
Pengeluaran fi mi log mi fi x log mi
50 – 55 1 52,5 Log (52,5)= 1,72 1 x 1,72 = 1,72
56 – 61 5 58,5 1,77 8,85
62 – 67 6 64,5 1,81 10,86
68 – 73 10 70,5 1,85 18,5
74 – 79 5 76,5 1,88 9,4
80 – 85 3 82,5 1,92 5,76
Jumlah 30 - 55,09
Jawab :
(
)
=
´
=
å
=N m f
G k
i
i i
1
log
log 55,09 / 30 = 1,83633
G = antilog ( 1,83633 ) = 68,6
☺ Pengeluaran per hari untuk 30 keluarga tersebut mempunyai rata-rata ukur sebesar Rp
4.3.3 Rata-rata Harmonik
å
= ÷øöçè æ
= k
i i
i m f N H
1
(4.10)
· Contoh 4.8 (Berdasarkan Contoh 4.5)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitung nilai rata-rata harmoniknya !
Tabel 4.4 Perhitungan Rata-rata Harmonik
Pengeluaran fi mi fi /mi
50 – 55 1 52,5 (1/52,5) = 0,02
56 – 61 5 58,5 0,09
62 – 67 6 64,5 0,09
68 – 73 10 70,5 0,14
74 – 79 5 76,5 0,07
80 – 85 3 82,5 0,04
Jawab : sebesar Rp
Catatan :
- Perhatikan kembali Contoh 4.5, 4.7, 4.8
- Untuk soal yang sama ternyata menghasilkan rata-rata hitung m = 68,9 , rata-rata ukur G =68,6 dan rata-rata harmonik H =66,67
- Ternyata antara ketiga rata-rata dalam ukuran nilai pusat, yaitu rata-rata hitung (m), rata-rata ukur (G), dan rata-rata harmonis (H), terdapat hubungan : H £G £m
4.3.4 Modus
LMo = batas bawah kelas modus, yakni kelas interval dengan frekuensi terbesar.
p = panjang kelas modus
d1 = frekuensi kelas modus dikurangi frekuensi kelas interval sebelumnya.
d2 = frekuensi kelas modus dikurangi frekuensi kelas interval sesudahnya.
· Contoh 4.9 (Berdasarkan Contoh 4.5)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah modusnya !
Tabel 4.5 Perhitungan Modus
Kelas ke- Pengeluaran fi Batas bawah Kelas
1 50 – 55 1 49,5
Dari tabel di atas diperoleh : Kelas modus = kelas ke - 4
4.4 Ukuran Letak Untuk Data Tunggal 4.4.1 Median
· Pada saat menghitung rata-rata hitung atau rata-rata ukur, maka persyaratan data harus berskala ukur interval/rasio. Apabila tingkat pengukurannya nominal/ordinal maka
m
atau pun G tidak berlaku.· Median merupakan ukuran letak untuk variabel dengan skala ukur minimal ordinal.
· Median dapat berlaku sebagai rata-rata untuk variabel dengan skala ukur ordinal.
· Median menentukan posisi tengah data setelah data diurutkan menurut besarnya. Jika
nilai median sama dengan Me, maka 50% dari data nilainya paling tinggi sama dengan Me dan 50% lagi nilainya paling rendah sama dengan Me.
· Median Untuk data tunggal ditentukan sebagai berikut :
a. jika banyak data ganjil, setelah data disusun menurut nilainya dari kecil ke besar, maka median merupakan data yang paling tengah.
b. jika banyak data genap, setelah data disusun menurut nilainya dari kecil ke besar, maka median merupakan rata-rata hitung dua data tengah.
c. Letak median (indeks median) untuk data tunggal ditentukan oleh rumus :
2 1 Me
I = N + (4.12)
dengan : N = banyak data
I Me = Indeks median, yang menyatakan pada data ke berapa letak median berada
· Contoh 4.10
Tentukan median dari data berikut 2, 6, 8, 5, 4, 9, dan 12.
Jawab :
N = 7, data diurutkan menjadi : Maka Me =
Atau dengan menggunakan indeks median : =
Me
I → median terletak di
Jadi Me = ,
☺ Artinya ada 50% dari data yang bernilai paling tinggi dan 50% lagi bernilai paling rendah
· Contoh 4.11
Diberikan data 12, 7, 8, 14, 9, 14, 19, 16. Berapa mediannya?
Jawab :
N = 8 , data diurutkan menjadi : Maka Me =
Atau dengan menggunakan indeks median : =
Me
I → median terletak di
Jadi Me =
4.4.2 Kuartil
· Kuartil adalah bilangan-bilangan yang membagi deretan bilangan yang telah diurutkan
dari kecil ke besar menjadi 4 bagian yang sama.
· Karena data dibagi menjadi 4 bagian yang sama, maka akan ada 3 buah kuartil (Q1, Q2
dan Q3).
· Letak kuartil ke-i (indeks kuartil) untuk data tunggal ditentukan oleh rumus:
(
)
4 1 Q
I i
+
=i N i=1,2,3 (4.13)
dengan : N = banyak data
IQi = Indeks kuartil, menyatakan pada data ke berapa letak kuartil ke-i berada
· Contoh 4.12
Tentukan kuartil dari data berikut 2, 6, 8, 5, 4, 9, dan 12.
Jawab :
N = 7, data diurutkan menjadi :
« =
(
+)
=4 1 1 Q
I 1 N → Q1 terletak di → Q1 =
☺ Artinya ada 25% dari data yang bernilai paling tinggi dan 75% lagi bernilai paling rendah
« =
(
+)
=4 1 2 Q
I 2 N → Q2 terletak di → Q2 =
☺ Artinya ada 50% dari data yang bernilai paling tinggi dan 50% lagi bernilai paling rendah
« =
(
+)
=4 1 3 Q
I 3 N → Q3 terletak di → Q3 =
☺ Artinya ada 75% dari data yang bernilai paling tinggi dan 25% lagi bernilai paling rendah
4.4.3 Desil
· Desil adalah bilangan-bilangan yang membagi deretan bilangan yang telah diurutkan
dari kecil ke besar menjadi 10 bagian yang sama.
· Karena data dibagi menjadi 10 bagian yang sama, maka akan ada 9 buah desil (D1,
D2,..,D9).
· Letak desil ke-i (indeks desil) untuk data tunggal ditentukan oleh rumus:
(
)
10 1 D
I i=i N + i=1,2,..9 (4.14)
dengan : N = banyak data
IDi = Indeks desil, menyatakan pada data ke berapa letak desil ke-i berada
· Contoh 4.13
Tentukan desil ke-3, ke-7 dan ke-9 dari data berikut 2, 6, 8, 5, 4, 9,12, 13, 13, 14, dan 15.
Jawab :
« =
(
+)
=10 1 3 D
I 3 N → D3 terletak di
Nilai D3 =
☺ Artinya ada 30% dari data yang bernilai paling tinggi dan 70% lagi bernilai paling rendah
«D7, D9...(coba sendiri)
4.4.4 Persentil
· Persentil adalah bilangan-bilangan yang membagi deretan bilangan yang telah
diurutkan dari kecil ke besar menjadi 100 bagian yang sama.
· Karena data dibagi menjadi 100 bagian yang sama, maka akan ada 99 buah persentil (P1,
P2,...,P99).
· Letak persentil ke-i (indeks persentil) ditentukan oleh rumus:
(
)
100 1 P
I i
+
=i N i=1,2,...,99 (4.15)
dengan : N = banyak data
I Pi = Indeks Persentil, menyatakan pada data ke berapa letak persentil ke-i berada.
· Contoh 4.14
Tentukan persentil ke-10, ke-25 dan ke-50 dari data berikut 2, 6, 8, 5, 4, 9,12, 13, 13, 14, dan 15.
Jawab :
N = 11, Data diurutkan terlebih dahulu menjadi :
« =
(
+)
=100 1 10 P I 10
N
→ P10 terletak di
Nilai P10 =
☺ Artinya ada 10% dari data yang bernilai paling tinggi dan 90% lagi bernilai paling rendah
«P25 dan P50 ...(coba sendiri)
4.5 Ukuran Letak Untuk Data Berkelompok 4.5.1 Median
÷÷ ÷ ÷
ø ö
çç ç ç
è
æ
-+ =
Me Me
f F N p
L 2
1
Me (4.16)
dengan : Me = median data kelompok
LMe = batas bawah kelas median, yakni kelas dimana median akan
terletak, yaitu pada jumlah frekuensi N 2 1 .
F = jumlah frekuensi sebelum kelas median. fMe = frekuensi kelas median
· Contoh 4.15 (Berdasarkan Contoh 4.5)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah mediannya. Tabel 4.6 Perhitungan Median
Kelas ke- Pengeluaran fi Batas Bawah Kelas Frek. Kum (F)
1 50 – 55 1 49,5
2 56 – 61 5 55,5
3 62 – 67 6 61,5
4 68 – 73 10 67,5
5 74 – 79 5 73,5
6 80 – 85 3 79,5
Jumlah 30 - -
Jawab :
Pada tabel di atas, jumlah frekuensi N = , sehingga N 2 1 =
Kelas median = kelas ke -
LMe = p = fm = F = (jumlah frekuensi sebelum kelas median)
= ÷÷ ÷ ÷
ø ö
çç ç ç
è
æ
-+ =
Me Me
f F N p
L 2
1
Me
☺ Artinya ada 50% keluarga dengan pengeluaran per hari paling tinggi
Rp dan 50% lagi dengan pengeluaran paling rendah Rp
· Hubungan rata-rata hitung, median dan modus
ü Dalam distribusi frekuensi yang sempurna (data menghasilkan kurva frekuensi
simetris), rata-rata hitung, median, dan modus mempunyai nilai yang sama.
ü Tetapi jika datanya mempunyai distribusi frekuensi yang condong (kurva frekuensi miring positif atau negatif), maka tiga ukuran pemusatan akan berbeda nilainya. ü Dalam distribusi miring positif, modus akan tetap berada di bawah puncak kurva
dan akan mempunyai nilai terkecil, rata-rata hitung akan dipengaruhi oleh nilai-nilai ekstrem dan akan ditarik menjauhi titik di bawah puncak distribusi ke arah nilai-nilai ekstrem, sehingga rata-rata hitung akan mempunyai nilai terbesar dan nilai median akan terletak diantara nilai modus dan nilai rata-rata hitung.
ü Dalam distribusi miring negatif, modus memiliki nilai terbesar, rata-rata hitung akan memiliki nilai terkecil dan median terletak diantara modus dan rata-rata.Dalam grafik, kedudukan ketiga nilai tersebut digambarkan seperti berikut :
a. Simetris b. Miring Positif c. Miring Negatif Gambar 4.1 Hubungan Rata-rata Hitung, Median, dan Modus
m = Me = Mo Mo < Me < m
4.5.2 Kuartil
Li = batas bawah kelas kuartil ke-i, yakni kelas dimana kuartil akan terletak
fi = frekuensi kelas kuartil
N = jumlah frekuensi p = panjang kelas kuartil
F = jumlah frekuensi sebelum kelas kuartil
· Contoh 4.16 (Berdasarkan Contoh 4.15)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah Q1 , Q2 , Q3 !
Tabel 4.7 Perhitungan Kuartil
Kelas ke- Pengeluaran fi Batas Bawah Kelas Frek. Kum (F)
1 50 – 55 1 49,5 1 lagi dengan pengeluaran paling rendah Rp
«Q2 dan Q3...(coba sendiri)
pada jumlah frekuensi i N 10
.
p = panjang kelas Di.
· Contoh 4.17 (berdasarkan contoh 4.15)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah D1 , D4 , D9 !
Tabel 4.8 Perhitungan Desil
Kelas ke- Pengeluaran fi Batas Bawah Kelas Frek. Kum (F)
1 50 – 55 1 49,5 1
2 56 – 61 5 55,5 6
3 62 – 67 6 61,5 12
4 68 – 73 10 67,5 22
5 74 – 79 5 73,5 27
6 80 – 85 3 79,5 30
Jumlah 30 - -
Jawab :
«Desil ke-1 (D1)
Pada tabel di atas, jumlah frekuensi N = , sehingga N =
10 1
Kelas D1 = kelas ke -
LD1 = p = fD1 =
F = (jumlah frekuensi sebelum kelas D1)
=
÷÷ø
ö
ççè
æ
-+
=
1 10
1 1 1
D
D D
f
F
N
p
L
☺ Artinya ada 10% keluarga dengan pengeluaran paling tinggi Rp dan 90% lagi dengan pengeluaran paling rendah Rp
«D4 dan D9...(coba sendiri)
4.5.4 Persentil
÷÷ø ö ççè
æ
-+ =
Pi i
Pi
f F N p
L 100
i
P i=1,2,...,99 (4.19)
dengan : Pi = persentil ke-i
p = panjang kelas Pi
N = jumlah frekuensi
F = jumlah frekuensi sebelum kelas Pi
fpi = frekuensi kelas Pi
LPi = batas bawah kelas Pi, yakni kelas dimana Pi akan terletak, yaitu pada
jumlah frekuensi i N
100
· Contoh 4.18 (berdasarkan contoh 4,15)
Untuk data pengeluaran per hari (ribu rupiah) untuk 30 keluarga, hitunglah P20 , P50 , P75
Tabel 4.9 Perhitungan Persentil
Kelas ke- Pengeluaran fi Batas Bawah Kelas Frek. Kum (F)
1 50 – 55 1 49,5 1
2 56 – 61 5 55,5 6
3 62 – 67 6 61,5 12
4 68 – 73 10 67,5 22
5 74 – 79 5 73,5 27
6 80 – 85 3 79,5 30
Jumlah 30 - -
Jawab :
« Persentil ke-20 (P20)
Pada tabel di atas, jumlah frekuensi N = , sehingga N =
100 20
Kelas P20 = kelas ke-
LP20 = p = fP20 = F = (jumlah frekuensi sebelum kelas P20)
=
÷÷ø ö ççè
æ
-+ =
20 100
20 20 20
P
P P
f F N p L
☺ Artinya ada 20% keluarga dengan pengeluaran paling tinggi Rp dan 80% lagi dengan pengeluaran paling rendah Rp
«P50 dan P75...(coba sendiri)
Catatan :
Dari ukuran-ukuran letak di atas diperoleh hubungan bahwa : § Me = Q2 = D5 = P50
§ Q1 = P25 dan Q3 = P75