PENDAHULUAN
1
1.1. Pengertian statistik dan statistika
Statistik adalah kumpulan data, bilangan maupun non bilangan yang disusun
dalam table dan atau diagram yang melukiskan suatu persoalan
Tabel nilai statistika
Nilai Jumlah Mahasiswa A B C D E 5 9 25 3 1
Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data,
pengolahan atau penganalisaannya dan penarikan kesimpulan berdasarkan kumpulan data dan penganalisaan yang dilakukan.
Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan statistika inferensia. Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Sedangkan pengertian statistika inferensia adalah metode yang berhubungan
dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan tentang seluruh gugus data induknya.
1.2. Data Statistik
Data statistik adalah keterangan atau ilustrasi mengenai sesuatu hal yang bisa berbentuk kategori (misalnya rusak, baik, cerah, berhasil) atau bilangan. Selanjutnya data yang berupa kategori disebut sebagai data kualitatif dan data bilangan disebut data
kuantitatif. Berdasarkan cara perolehannya data kuantitatif dibedakan menjadi data
diskrit dan data kontinu. Data-data yang diperoleh dari hasil menghitung atau membilang termasuk dalam data diskrit, sedangkan data-data yang diperoleh dari hasil mengukur termasuk dalam data kontinu.
Menurut sumbernya kita mengenal data intern dan data ekstern. Data intern adalah data yang diperoleh dari perusahaan atau instansi yang bersangkutan. Sedangkan data ekstern diperoleh dari luar instansi atau perusahaan tersebut.
Data ekstern dibedakan menjadi data primer dan data sekunder. Data primer adalah data yang dikeluarkan oleh badan sejenis. Sedangkan data lainnya termasuk data
sekunder. Semua data-data yang beru dikumpulkan dan belum pernah diolah disebut
sebagai data mentah.
1.3. Populasi dan sampel
Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita baik yang
berhingga maupun tak berhingga jumlahnya. Seringkali tidak praktis mengambil data dari keseluruhan populasi untuk menarik suatu kesimpulan. Untuk itu dilakukan pengambilan
sampel yaitu sebagian atau himpinan bagian dari populasi. Sampel yang diambil haris
dapat merepresentasikan populasi yang ada. Prosedur pengambialan sampel yang menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai suatu ciri populasi dikatakan berbias. Untuk menghindari kemungkinan bias ini perlu dilakukan pengambian contoh acak atau contoh acak sederhana. Contoh acak sederhana didefinisikan sebagai contoh yang dipilih sedemikian rupa sehingga setiap himpunan bagian yang berukuran n dari populasi mempunyai peluang terpilih yang sama.
1.4. Pembulatan angka
Dalam perhitungan dan analisis data statistik seringkali diperlukan pembulatan angka-angka. Berikut ini adalah beberapa aturan tentang pembulatan angka-angka.
1. Jika angka yang harus dihilangkan adalah 4 atau kurang, maka angka terkanan yang mendahuluinya tetap.
Contoh: Rp. 59.376,- dibulatkan menjadi Rp. 59 ribu.
2. Jika angka yang haarus dihilangkan adalah lebih dari 5 atau angka 5 diikuti angka bukan nol maka angka yang mendahuluinya ditambah dengan 1.
Contoh: 176,51 kg dibulatkan menjadi 177 kg.
3. Jika angka yang harus dihilangkan hanya angka 5 atau angka 5 diikuti nol, maka angka yang mendahuluinya tetap jika genap dan ditambah 1 jika ganjil.
Contoh: 8,500 dibulatkan menjadi 8
19,5 dibulatkan menjadi 20
1.5. Penyajian Data
Secara garis besar ada dua macam cara penyajian data dalam statistika yaitu: 1. Tabel atau daftar yang dapat berbentuk:
a. Daftar baris kolom b. Daftar kontingensi c. Daftar distribusi frekuensi
2. Grafik atau diagram yang terbagi menjadi: a. Diagram batang atau balok
b. Diagram garis atau grafik c. Diagram lingkaran d. Diagram lambing e. Diagram peta f. Diagram pencar
1.6. Daftar distribusi frekuensi dan grafiknya
Dalam distribusi frekuensi data dikelompokkan dalam beberapa kelas interval misalnya a–b, c-d dan seterusnya. Ada beberapa istilah yang digunakan dalam distribusi frekuensi yaitu:
1. Limit kelas atau ujung kelas yaitu nilai-nilai terkecil dan terbesar dalam setiap kelas interval. Nilai terbesar disebut sebagai limit atas kelas dan nilai terkecil disebut sebagai limit bawah kelas.
2. Batas kelas yaitu limit kelas ± setengah nilai skala terkecil. Nilai yang besar disebut batas atas kelas dan nilai yang kecil disebut sebagai batas bawah kelas. 3. Titik tengah kelas atau tanda kelas yaitu nilai yang terletak pada engah setiap kelas
interval. Aturan umum yang digunakan untuk menentukan titik tengah kelas atau tanda kelas adalah:
Tanda kelas = ± ½ (limit bawah + limit atas)
Macam-macam distribusi frekuensi 1. Distribusi frekuensi
2. Distribusi frekuensi. Relative (%)
3. Distribusi frekuensi kumulatif kurang dari 4. Distribusi frekuensi kumulatif lebih dari
1.7. CARA MEMBUAT DIST. FREK.
1. Tentukan Rentang
R = Nilai terbesar – nilai terkecil. = 99 - 35 = 64
2. Tentukan banyaknya kelas interval. Acuan aturan Starges
Banyak kelas = 1 + (3,3) log n
= 1 + (3,3) log 80 = 7,28 ≈ 7 kelas
s Banyakkela g tan n Re P= = 7 64 = 9,14 = 10 4. Tentukan limit kelas
5. Daftar semua limit keats
6. Menentukan frekwensi → bantuan kolom tabulasi
Contoh:
Nilai Ujian Statistik 80 orang mahasiswa adalah sebagai berikut: 79 49 48 34 81 98 87 80 80 84 90 70 91 93 82 78 70 71 92 38 56 81 74 73 68 72 85 51 65 93 83 86 80 35 83 73 74 43 86 88 92 93 76 71 90 72 67 75 80 91 61 72 97 81 88 81 70 74 98 95 80 59 73 71 83 60 83 82 60 67 89 63 76 63 88 70 66 88 79 75
Dengan menggunakan aturan pembuatan distribusi frekuensi tersebut di atas dapat dibuat sebuah distribusi frekuensi dengan 7 kelas sebagai berikut:
Nilai Ujian Frekuensi (f) 31 – 40 41 – 50 51 – 60 61 – 70 71 – 80 81 – 90 91 - 100 2 3 5 14 24 20 12 1.8. Model Populasi
Adalah pendekatan bentuk polygon frekuensi dengan garis lengkung halus yang bentuknya secocok mungkin:
a. Model normal b. Model simetrik
c. Model miring (ke kanan/ke kiri).
Jika suatu frekwensi tidak simetrik maka nilai mean (rata-rata) dan median tidak sama. Koefisien ke menjuluran pearson (sk)
σ µ µ = 3 ( -sk µ = median µ = mean (rata-rata) σ = simpangan baku. TUGAS I :
Berikut ini adalah data daya tahan alat terhadap suatu insektisida dalam satuan menit. 2.4 0.7 3.9 2.8 1.3 1.6 2.9 2.6 3.7 2.1 3.2 3.5 1.8 3.1 0.3 4.6 0.9 3.4 2.3 2.5 0.4 2.1 2.5 1.5 4.3 1.8 2.4 1.3 2.6 1.8 2.7 0.4 2.8 3.5 1.4 1.7 3.9 1.1 5.9 2.0 5.3 6.3 0.2 2.0 1.9 1.2 2.5 1.2 1.2 1.7 Dengan menggunakan 8 kelas interval dan nilai terendah 0,1
a. Buat distribusi frekuensi, distribusi frekuensi relatif (%) dan distribusi frekuensi kumulatif
b. Dengan menggunakan Microsoft Exel buatlah
1. Diagram balok, histogram, polygon frekuensi, Ogif dan diagram lingkaran.
2. Tentukan rata-rata (mean), modus, median, kuartil dan desil.
1.9. UKURAN PEMUSATAN
Ukuran pemusatan dibagi dalam dua kelompok
1. Ukuran gejala pusat, meliputi • Rata-rata hitung (mean) • Rata-rata ukur
• Rata-rata gabungan • Modus
2. Ukuran letak, meliputi • Median
• Kuartil • Desil • Persentil
Ukuran-ukuran tersebut di atas dapat dihitung dari kumpulan data populasi atau sampel. Jika ukuran-ukuran yang diambil dihitung dari data populasi disebut parameter , sedangkan jika dihitung dari data sampel disebut statistic.
1.9.1. Rata-rata Hitung (Mean)
Diperoleh dengan membagi jumlah seluruh data dengan banyak data
n x x=
∑
iJika masing-masing mempunyai frekuensi maka rata-ratanya disebut sebagai rata-rata
terboboti.
∑
∑
= i i i f x f x contoh;Barang Disimpan (fi) % Rusak (xi) fi xi
A 100 96 96
B 200 46 92
C 160 50 80
D 80 75 60
Berapa persen rata-rata barang yang rusak % 07 , 60 % 100 x 540 328 f x f x i i i = = =
∑
∑
Bukan seperti ini
(
)
66,75% 4 % 75 % 50 % 46 % 96 x= + + + = 1.9.2. Rata-rata GabunganJika kita mempunyai data n1, n2, n3, … dengan nilai rata-rata masing-masing x1,x2,x3,... maka rata-rata gabungan data di atas dinyatakan dengan
∑
∑
= i i i gab n x n xUntuk data-data yangv tersusun dalam distribusi frekuensi rata-ratanya dihitung dengan
∑
∑
= k k k f x f xdengan xk : nilai tengah kelas
fk : frekuensi kelas
atau dengan cara singkat/sandi (khusus untuk lebar kelas yang sama) yakni sebagai berikut + =
∑
∑
i i i o f c f p x xdengan xo : tengah kelas acuan fi : frekuensi ke-i
p : lebar kelas ci : harga sandi
1.9.3 Rata-rata Ukur (geometrik)
Digunakan jika perbandingan dua data berturutan tetap atau hampir tetap.
n n 3 2 1.x .x ...x x U=
Untuk bilangan-bulangan yang besar digunakan
n x log U
log =
∑
iUntuk fenomena yang bersifat tumbuh seperti pertumbuhan penduduk, bakteri dan lain-lain digunakan
t o t 100 x 1 P P + =
Untuk data-data yang telah disusun dalam daftar distribusi frekuensi rata-rata ukurnya dinyatakan
(
)
∑
∑
= i i i f x log f U log 1.9.4. Rata-rata HarmonikRata-rata harmonik biasanya digunakan untuk merata-ratakan kecepatan beberapa jarak tempuh atau mencari harga rata-rata suatu komoditi tertentu.
∑
= i x 1 n HUntuk data-data yang disusun dalam distribusi frekuensi
∑
∑
= i i i x f f HSecara umum hubungan rata-rata hitung
( )
x , rata-rata ukur (U) dan rata-rata harmonic (H) dinyatakanx U H≤ ≤
1.9.5. MODUS
Modus adalah nilai atau fenomena yang paling sering muncul jika datanya telah disusun dalam distribusi frekuensi .
+ + = 2 1 1 o b b b p b M
dengan b : batas bawah kelas modal (kelas dengan frekuensi tertinggi) p : panjang/lebar kelas modal
b1: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya
1.9.6. KUARTIL
Jika sekumpulan data dibagi menjadi empat bagian yang sama setelah di urutkan maka nilai yang membaginya disebut kuartil.
(
)
4 1 n i ke data k Letak i= + ; i = 1, 2, 3 Untuk data yang disusun dalam distribusi frekuensi − + = f F 10 n i p b Ki ; i = 1, 2, 3
dengan b : batas bawah kelas Di
p : panjang kelas Di
F : jumlah seluruh frekuensi sebelum kelas Di
f : frekuensi kelas Di
1.9.7. PRESENTIL
Jika sekumpulan data dibagi 100 sama besar akan menghasilkan persentil ke 1,2,3,…,99.
(
)
100 1 n i ke data P Letak i= +Untuk data dalam distribusi frekuensi
f F 100 n i p b Pi − + =
dengan b : batas bawah kelas Pi
p : panjang kelas Pi
F : jumlah seluruh frekuensi sebelum kelas Pis
f : frekuensi kelas Pi
QUIZ I
1. Apa yang dimaksud data diskrit dan data kontinu. Berikan masing-masing dua contoh!
3. Bagaimana rumus aturan untuk menentukan banyak kelas interval. Beri keterangan symbol-simbolnya.
4. Berikut adalah data umur 100 karyawan pabrik
52 35 23 52 58 58 56 52 31 40 40 51 36 52 41 53 29 31 44 28 62 58 24 37 46 43 58 32 31 63 59 51 29 43 64 65 44 35 52 37 67 34 33 47 68 35 61 40 38 34 57 55 41 59 52 31 61 40 41 49 44 41 44 56 43 64 48 28 33 31 25 45 27 59 42 30 40 42 37 41 26 26 40 45 53 47 39 36 33 35 34 47 52 50 67 53 45 40 51 44
a. Buat daftar distribusi frekuensi dengan 5 kelas. b. Gambarkan polygon frekuensinya.
c. Tentukan mean, modus, median
Kuartil 1 dan desil 7 berdasarkan distribusi fekuensi yang telah dibuat.
1.10. UKURAN SIMPANGAN
Ukuran simpangan digunakan sebagai gambaran bagaimana berpencarnya suatu data kuantitatif. Ukuran-ukuran tersebut yaitu:
a. Rentang = data terbesar – data terkecil b.Rentang Antar Kuartil (RAK)
RAK = K3 – K1 c. Simpangan Kuartil (SK) SK = 1/2 RAK = 1/2 (K3 – K1) d. Rata-rata Simpangan (RS) RS = n i
∑
χ −χ Selalu positif e. Simpangan baku/ deviasi standart• Simpangan baku untuk populasi disimbolkan σ Kuadrat simpangan baku disebut Varians
Varians sampel dihitung dengan : S2 =
(
)
1 n 2 i − χ − χ∑
atau S2 =(
)
(
n 1)
n n i2 i 2 − χ − χ∑
∑
Ini lebih dianjurkan karena kesalahannya -Lebih kecil
Jika datanya dalam distribusi frekuensi :
S2 =
(
)
1 n fi i 2 − χ − χ∑
Atau S2 =(
(
)
)
1 n n f f n 2 i i 2 i i − χ − χ∑
∑
Cara Sandi xi dapat diganti ci
Simpangn baku gabungan S2 =
(
)
∑
∑
− − K n S 1 n 2 i ini = jumlah data sampel ke i
Si = Simpangan baku sample ke i
K = jumlah / banyaknya sampel . Bilangan baku/ Nilai Z
Bilangan baku/nilai z didefinisikan sebagai :
Zi = s i
∑
χ − χ ; i = 1,2,3,…. N Atau lengkapnya Zi = χ −χ s s i o o +so = Simpangan baku
Ukuran-ukuran simpangan diatas merupakan ukuran absolut. Jika dari simpangan absolut diambil simpangan bakunya, maka kita dapat koefisien Variasi
KV = x100% rata -rata baku Simpangan
Selain ukuran simpangan/ disperse absolut, dikenal pula dispersi relatif yang dinyatakan : Dispersi relative = rata -rata baku Simpangan