1. Populasi dan Sampel  2. Statistik dan Statistika 3. Jenisâjenis ObservasiÂ
Statdas, Februari 2009
4. Statistika Deskriptif
âĒSari Numerik
âĒPenyajian Data
ÂĐ 2008 by USP & UM ; last edited Febâ09
Ilustrasi
Data nilai ujian Statistik Dasar dari 15 mahasiswa Data nilai ujian Statistik Dasar dari 15 mahasiswa Program Studi tertentu semester ganjil tahun 2008:
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
Berapa rataâ
rata nilai Seberapa
menyebarnya
Apakah rataârata nilai tahun ini
2
ujian? menyebarnya
kemampuan dari mahasiswa?
lebih baik daripada tahun lalu?
Adakah mahasiswa yangÂ
perlu perhatian
khusus? Inferensi
statistik Statistika
deskriptif
ÂĐ 2008 by UM
Statistik dan Statistika
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh : statistik liga sepak bola Indonesia
Statistika : ilmu yang berkaitan dengan cara
pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
ÂĐ 2008 by UM 3
Jenisâjenis Statistika
1.
Statistika deskriptif: metode yang berkaitan
1.Statistika deskriptif: metode yang berkaitan
dengan pengumpulan dan penyajian data.
2.
Statistika inferensi: metode yang berkaitan dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi.
(Pokok Bahasan/Bab 9-12)
ÂĐ 2008 by UM 4
Populasi dan Sampel
Populasi
Sampel
setiap obyek populasi memiliki kemungkinan/kesempatan yang
sama untuk terpilih
Sampel Acak
p
hasil pengukuran atau pengamatan
Data
ÂĐ 2008 by UM 5
Jenisâjenis Observasi
OBSERVASIÂ /Â DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
B h b d Didasarkan pada suatu
Tidak mengenal urutan dan operasi
aritmatika
Mengenal urutan dan operasi aritmatika
Berhubungan dengan
âproses menghitungâ, dan pengamatan atas himpunan terhitung.
Didasarkan pada suatu selang/interval sehingga meliputi semua
bilangan riil Warna batuan (abu-
abu, hitam, putih, coklat, dll), jenis
kelamin , dll
Ukuran baju (S, M, L, XL), ukuran kepuasan (tidak suka sama sekali,
tidak suka, biasa saja, suka, sangat suka)
Banyaknya pekerja yang dibutuhkan dalam suatu area pertambangan, jarak yang dilangkahi seseorang (bisa mundur, bisa maju) per 0,5 meter
Berat batuan, luas area pertambangan,
jarak tempuh truk pengangkut, suhu,
dll 6
ÂĐ 2008 by UM
Statistika Deskriptif
Metode yang berkaitan dengan pengolahan dan penyajian suatu gugus data sehingga memberikan penyajian suatu gugus data sehingga memberikan
informasi yang berguna.
bentuk distribusi data
ÂĐ 2008 by UM 7
Karakteristik Distribusi
1. PARAMETER DISTRIBUSI
Ukuran Pemusatan
Uk
mean, median, modus, kuartil atas, kuartil
bawah, dll Range, simpangan baku,Â
2. BENTUK DISTRIBUSI Simetris Ukuran Penyebaran Kemencengan
Kelancipan
Range, simpangan baku, variansi, jangkauan
antar kuartil, dll skewness
kurtosis
mean = median Menceng/skewÂ
Positif Menceng/skewÂ
Negatif Berpuncak
Tunggal Berpuncak
Jamak
mean > median
mean < median
# modus > 1 # modus = 1
ÂĐ 2008 by UM 8
CONTOHÂ KASUS
Berikut adalah data nilai ujian Statistik Dasar dari 15 mahasiswa Program Studi tertentu. (n = 15) g ( )
87 37 59 49 69 95 83 87 39 95 83 76 83 26 46
x
1x
2x
9x
12x
15Data yang diurutkan:
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x
(1)x
(2)x
(9)x
(12)x
(15)Adakah perbedaan dari penyajian kedua data di atas?
minimum maksimum
ÂĐ 2008 by UM 9
Ukuran Pemusatan DataÂ
1.
Mean (rata-rata)
n
x n x
ii n
=
â
=1
1
1 2
...
15x x x
x = + + +
Contoh :
15 87 37 ... 46
67, 60 15
+ + +
= =
ÂĐ 2008 by UM 10
50% data ( 50% data (akhir akhir)) 50 % data (
50 % data (awal awal))
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 x
(8) 3 x 2 x 2 x2. Median
Nilai tengah yang membagi dua kelompok data sama banyak.
med = x
(8)= 76 3. Modus
Nilai yang paling sering muncul.
mod = 83
ÂĐ 2008 by UM 11
25Â %
25Â % 25Â % 25Â % 25Â % 25Â % 25Â % 25Â % 4. Kuartil
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
 Kuartil bawah (q
1) :
q
1q
2= med q
31 15 1 (4)
4
46 q x
â + âx
â â
â â
= = =
2 2(n 1) n 1
q x
â + âx
â + ââ â â â
= =
1 1
4
q x
ân+ ââ â
â â
=
 Kuartil tengah (q
2) :
3 3(15 1) (12)
4
87 q x
â + âx
â â
â â
= = =
2 15 1 (8)
2
76 q x
â + âx
â â
â â
= = =
( )
4 2
n n
â â â â
â â â â
â â â â
3 3( 1)
4
q x
â n+ ââ â
â â
= g (q
2)
 Kuartil atas (q
3) :
ÂĐ 2008 by UM 12
5. Persentil
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 p
25p
50= med p
75p
25p
50med p
75âĒ Persentil ke-i :
âĒ Persentil ke-50 :
50( 1) 1100 2
n n
x
â + âx
â + ââ â â â
â â â â
= =
( 1) 100
x
âi n+ ââ â
â â
=
median
kuartil atas kuartil bawah
âĒ Persentil ke-25 dan Persentil ke-75?
ÂĐ 2008 by UM 13
Ukuran Penyebaran Data
1. Jangkauan data (Range)
R = data
maxâ data
minR = 95 â 26 = 69
2
2 2 2 1
1 1
1 1
( )
1 1
n
n n i
i
i i
i i
x
s x x x
n n n
=
= =
â â
â â â â
â â â â
= â â = â âââ â âââ
â â â s
2= 529, 2571
2. Variansi
JK
529, 2571 23, 01
s = =
3. Simpangan Baku (standard deviation) s = âs
24. Jangkauan antar kuartil dq = q
3â q
1JKXX
dq = q
3â q
1= 87 â 46 = 41
14ÂĐ 2008 by UM
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok data yang lain.
Pilih nilai k = 3/2 (tidak mutlak) y g
Bagaimana mendeteksi data pencilan ??
1. Hitung dq
2. Hitung BBP = q
1â k.dq dq = 41
BBP = 46 â (1,5)(41) = -15,5
3. Hitung BAP = q
3+ k.dq 4. Pencilan bawah < BBP 5. Pencilan atas > BAP
BAP = 87 + (1,5)(41) = 148,5 tidak ada pencilan bawah tidak ada pencilan atas
ÂĐ 2008 by UM 15
SARI NUMERIK Count (banyak data, n) 15
Sum (jumlah data) 1014
Average (rata-rata) 67.6
Median (kuartil tengah) 76 mean < median
Mode (modus) 83
Minimum 26
Maximum 95
Range 69
Standard Deviation 23.01
Variance 529.2571
Skewness -0.50*
Menceng kiri
Kurtosis -1.23*
25th Percentile (persentil-25) 46 50th Percentile (persentil-50) 76 75th Percentile (persentil-75) 87 Interquartile Range (dk) 41
* Perhitungan dengan Mic. Excel
ÂĐ 2008 by UM 16
Penyajian Data
1 Pie Chart 1. Pie Chart 2. Dot Plot 3. Histogram
4. Diagram Batang â Daun (stem â leaf) 5. Diagram Kotak â Titik (box plot)
6. dllâĶ
Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.
ÂĐ 2008 by UM 17
Pie Chart
9%
23% 58%
10%
9
Pi h t k fik b b t k li k
18
y Pie chart merupakan grafik yang berbentuk lingkaran yang mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%).
y Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kelompok data.
ÂĐ 2008 by UM
Dot Plot
3.5
0 0.5 1 1.5 2 2.5 3 3.5
0 20 40 60 80 100
frekuensi
nilai
y
Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yangÂ
bersangkutan
y
Titik ditumpuk diatas nilai data yang digambarkan.
ÂĐ 2008 by UM 19
Histogram
y Histogram adalah gambar berdasarkan distribusi frekuensi
y Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle).
y Daerah setiap rectangle sebanding dengan frekuensinya.
ÂĐ 2008 by UM 20
Diagram Batang-Daun (Stem-Leaf)
y Stem atau batang, mirip dengan grup data pada histogram, g g g g sedangkan leaf atau daun, mirip dengan frekuensi.
y Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di belakangnya akan merupakan leaf atau daun.
y Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
ÂĐ 2008 by UM 21
Diagram KotakâTitik (BoxâPlot)
85 95
90
100 max
q3
B Pl t di k t k lidiki di t ib i t
26
47.5 85 76
0 10 20 30 40 50 60 70 80
min
q1 q2
q3 mean
y Box Plot digunakan untuk menyelidiki distribusi tanpa menggunakan grup data seperti pada histogram dan diagram batang daun.
y Box Plot terdiri dari: datamin , q1, q2(median), q3, dan datamax yang disusun secara terurut dengan membentuk
kotak. 22
ÂĐ 2008 by UM
Pencilan pada Box Plot
* pencilan atas
max kedua
q1 q2
q3 mean
* pencilan atas
min ketiga
** pencilan bawah
ÂĐ 2008 by UM 23
Kelemahan dan Keunggulan
KELEMAHAN KEUNGGULAN
DOT PLOT Tidak efektif untuk ukuran data yang besar
CepatÂ
Nil i d  li d  di ki k data yang besar Nilai data asli dapat diperkirakan
HISTOGRAM Lama
Banyak perhitungan Nilai data tidak nampak
Histogram peluang dapat memberi gambaran tentang distribusi populasi Tidak menuntut ketelitian dalam mencatat setiap nilai data
BATANGâDAUN Menuntut ketelitian mencatat daun
Cepat
Tidak memerlukan perhitungan Nilai data asli dapat dilihat
daun p
Memudahkan perhitungan berbagai parameter
BOXÂ PLOT
Membutuhkan perhitungan yang panjang
Terdiri dari parameterâ
parameter dari data yang sudah diurutkan
Box plot dapat memberi gambaran tentang bentuk distribusi populasi Efektif untuk membandingkan bentuk distribusi beberapa kelompok data sekaligus
ÂĐ 2008 by UM 24
Bentuk Distribusi Ideal Normal
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
ÂSkewness = 0
ÂKurtosis = 3, (dalam software tertentu kurtosis normal = 0
ÂĐ 2008 by UM 25
Transformasi Data
y
Transformasi dilakukan untuk mendapatkan bentuk Transformasi dilakukan untuk mendapatkan bentuk distribusi yang lebih simetris.
y
Transformasi Tangga Tukey
-1/x2 -1/x âx log (x) x x2 x3 10x
data awal untuk bentuk distribusi :Â untuk bentuk distribusi :Â data awal
skewness negatif skewness positif
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x.
ÂĐ 2008 by UM 26
Transformasi Data Contoh Kasus
87
x
7569
y = x2
Lebih mendekati simetris (skew = 0) dibanding sebelum transformasi 37
59 49 69 95 83 87 39
9 1369 3481 2401 4761 9025 6889 7569 1521
skew = -0,18
dibanding sebelum transformasi (skew = -0,5)
39 95 83 76 83 26 46
1521 9025 6889 5776 6889 676 transformasi 2116
** Ketika data ditransformasi, maka satuan dari data juga akan berubah
ÂĐ 2008 by UM 27
Referensi
y Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.j y Devore, J.L. and Peck, R., Statistics â The Exploration and
Analysis of Data, USA: Duxbury Press, 1997.
y Walpole, Ronald E. dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung:
Penerbit ITB, 1995.
y Walpole, Ronald E. et.al, Probability and Statistics for Engineers and Scientist, 8th Ed., New Jersey: Pearson-Prentice Hall 2007.
y Wild, C.J. and Seber, G.A.F., Chance Encounters â A first Course in Data Analysis and Inference, USA: John Wiley&Sons,Inc., 2000.
y Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika.
ÂĐ 2008 by UM 28