Materi 2
Outline
Penyajian Data
Numerical Techniques
Graphical Techniques
• Teknik Grafik (Graphical Techniques)
Secara visual, grafis merupakan gambar-gambar yang
menunjukkan data berupa angka yang biasanya dibuat
berdasarkan tabel yang telah ada sebelumnya
Pie Chart
digambarkan dengan suatu lingkaran yang
sektor-sektornya menggambarkan proporsi variabel yang berbeda
Pie Chart Suara Partai
A, 38.90, 39% C, 8.07, 8% B, 53.03, 53%
Data Hasil Pemilihan Umum
Partai Jumlah Suara % jumlah suara
A 501 38.90
B 683 53.03
C 104 8.07
Bar Chart (Grafik Batang)
digambarkan menggunakan sumbu x dan y dimana sumbu x menunjukkan variabel yang digunakan sedangkan sumbu y menunjukkan jumlah kejadian
Bar Chart Pe ne rim aan Mahas is w a Baru
160 120 60 80 100 120 140 160 180
Jumlah Penerimaan Mahasiswa Baru
Jurusan Jumlah
Arsitektur 160
Sipil 120
Histogram dan Poligon Frekuensi
grafik yang mencerminkan distribusi frekuensi. Diperlukan sumbu x untuk menyatakan interval kelas dan sumbu y untuk menyatakan frekuensi kelas
Histogram 9,5 - 14, 5 14, 5 - 19, 5 19, 5 - 24, 5 24, 5 - 29, 5 39, 5 - 44,5 29, 5 - 34, 5 34, 5 - 39, 5 0 2 4 6 8 10 12
Kelas Interval Frekuensi Frekuensi Relatif
9,5 - 14,5 3 0,1 14,5 - 19,5 10 0,33 19,5 - 24,5 7 0,23 24,5 - 29,5 5 0,17 29,5 - 34,5 2 0,07 34,5 - 39,5 2 0,07 39,5 - 44,5 1 0,03
Ogive (Poligon Frekuensi Kumulatif)
merupakan grafik dari distribusi frekuensi kumulatif lebih dari atau kurang dari.
Ogive Kurang Dari
0 20 40 60 80 100 120 140 160 180 200 22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5 62.5 67.5 72.5
Ogive Lebih Dari
0 20 40 60 80 100 120 140 160 180 200 22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5 62.5 67.5 72.5
Steam and Leaf Plot
Metode ini diperkenalkan pada tahun 1977 oleh John Tuckey data dirangkum dalam bentuk batang dan daun (steam and leaf) Jika datanya banyak, steam dapat dibuat menjadi 2 baris Contoh : 18 17 30 15 22 26 17 31 20 14 29 21 20 26 17 20 37 10 14 25 17 18 20 17 19 27 22 36 14 42
Dibuat dalam bentuk :
1 8 7 5 7 4 7 0 4 7 8 7 9 4 2 2 6 0 9 1 0 6 0 5 0 7 2
3 0 1 7 6
Box Plot
digunakan untuk melihat apakah pada data tersebut terdapat outlier (data yang mempunyai nilai ekstrim) atau tidak
Untuk membuat Box Plot, ada beberapa data yang harus diketahui yaitu :
• Nilai data minimum • Nilai data maksimum • Median (Q2= kuartil ke 2) • Lower Quartile (Q1= kuartil ke 1) • Upper Quartile (Q3= kuartil ke 3)
• IQR (Inter Quartile Range) = selisih Q3 - Q1
• LIF (Lower Inner Fence) = Q1– 1,5 IQR
• UIF (Upper Inner Fence) = Q3+ 1,5 IQR • LOF (Lower Outer Fence) = Q1– 3 IQR
Contoh :
Data sebagai berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8 6,2 4,0 7,1 3,7 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1
n = 22 ; nilai minimum = 2,6 ; nilai maksimum = 15,8
Data diurut : 2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0 4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8 Lokasi Median = Md = Mean = 5,36 ≈ 5,4 Lokasi Q1= (data ke
6 dari data minimum) Q1= 3,4
Lokasi Q3= (data ke
6 dari data maksimum) Q3= 6,2 5 , 11 2 23 2 1 = = + n 0 , 4 2 0 , 4 0 , 4 = + 6 2 1 11 2 1 kebawah dibulatkan median lokasi = + = + 6 2 1 11 2 1 kebawah dibulatkan median lokasi = + = +
IQR (Inter Quartile Range) IQR = Q3– Q1= 6,2 – 3,4 = 2,8 LIF = Q1– 1,5 IQR = 3,4 – 1,5.(2,8) = - 0,8 UIF = Q3+ 1,5 IQR = 6,2 + 1,5.(2,8) = 10,4 LOF = Q1– 3 IQR = 3,4 – 3.(2,8) = - 5 UOF = Q3+ 3 IQR = 6,2 + 3.(2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan outlier. Data yang terletak diluar LIF dan UIF adalah outlier yang dibedakan menjadi 2 yaitu mild outlier dan extreem outlier
Apa Artinya ??
• Bila semua data terletak antara LIF dan UIF maka data tidak memiliki outlier
• Data terletak antara IF dan OF disebut mild outlier • Data yang terletak diluar OF disebut extreme outlier
Extreme outlier Extreme outlier
Mild outlier Mild outlier
bukan outlier
Outline
Penyajian Data
Numerical Techniques
Graphical Techniques
Distribusi Frekuensi
Jika n banyak Data dikelompokkan ke dlm kelas2 Frekuensi data tiap kelas DISTRIBUSI FREKUENSIIstilah dalam Distribusi Frekuensi
Distribusi Frekuensi Batas Nyata Kelas
(Class Boundary) Batas Kelas (Class Limit) Interval Kelas (Class Interval)
Lebar Interval Kelas (Width of Interval Class)
Nilai Tengah Kelas (Class Midpoint)
Penyusunan Distribusi Frekuensi :
1. Interval kelas harus dipilih dgn ketentuan - seluruh data harus disertakan
- data harus dimasukan sekali, hanya di satu kelas
1.
2. Umumnya jumlah interval kelas antara 5 sampai 20
3. Lebar interval kelas dianjurkan sama (biasanya kelipatan angka 5) Sebagai perkiraan awal lebar interval kelas gunakan rumus :
k
R
c
=
Dimana :
c = lebar interval kelas
R = kisaran data (range)
n
k
=
1
+
3
,
3
.
log
Dimana :k = jumlah interval kelas
n = jumlah data
terkecil
data
terbesar
data
R
=
4. Dihindari interval kelas terbuka karena untuk keperluan analisis statistik tidak bisa digunakan
5. Jika mungkin, interval kelas dipilih sedemikian rupa sehingga nilai tengah kelasnya bersesuaian dengan nilai dimana data aktual terkonsentrasi
Interval kelas dapat dihitung dengan rumus Sturge
Contoh Distribusi Frekuensi
• Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut: 79 79 48 74 81 98 87 80 80 84 90 70 91 93 82 78 70 71 92 38 56 81 74 73 68 72 85 51 65 93 83 86 90 35 83 73 74 43 86 88 92 93 76 71 90 72 67 75 80 91 61 72 97 91 88 81 70 74 99 95 80 59 71 77 63 60 83 82 60 67 89 63
•
Data terbesar = 99 ; Data terkecil = 35
Rentang = 99 – 35 = 64
•
Banyak kelas = 1 + (3,3) log n
= 1 + (3,3) log 80
= 1 + (3,3) (1,9031)
= 7,2802 (7 atau 8)
•
P = rentang / banyak kelas = 64 /7 = 9,14
(gunakan 9 atau 10)
•
Pilih batas bawah kelas interval pertama. Bisa
diambil sama dengan data terkecil atau nilai data
yang lebih kecil dari data terkecil tetapi selisihnya
harus kurang dari panjang/lebar kelas yang telah
ditentukan.
•
Dengan p=9, dan mulai dengan data yang lebih
kecil dari data terkecil, dipilih 31, maka kelas
interval pertama 31-40, 41-50, dst.
•
Buatlah tabel untuk memasukkan kelas-kelas
interval yang sudah dibentuk.
• Dari hasil di atas, sdh dapat dibuat :
– Histogram Frekuensi– Poligon Frekuensi
– Distribusi Frekuensi Kumulatif :
• Kurang dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih kecil daripada batas atas nyata interval kelas
• Lebih Dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih besar daripada atau sama dengan batas bawah nyata interval kelas
Ukuran Pemusatan
(Tendency Central)
Tendency Central Median Rata-Rata Modus KuantilRata-Rata (Average)
adalah nilai khas yang mewakili sifat tengah atau posisi pusat dari suatu kumpulan nilai data
Beberapa ukuran yang termasuk rata-rata :
• Mean Aritmatik
Data Tidak Berkelompok untuk suatu sampel
untuk suatu populasi
n x x i1 i
∑
= = n N x N i i∑
= = 1 x µData Berkelompok untuk sampel untuk populasi n x f f x f k i i m i k i i k i i m i
∑
∑
∑
= = = = = 1 , 1 1 , x N x f f x f K i i m i K i i K i i m i∑
∑
∑
= = = = = 1 , 1 1 , x . . µ Keterangan :xi : nilai dari data
k : jumlah interval kelas dlm suatu sampel K : Jumlah interval kelas dlm suatu populasi n : banyaknya data x dari suatu sampel N : banyaknya data x dari suatu populasi
fi : frekuensi atau jumlah pengamatan dlm sati interval kelas xm,i : nilai tengah dari interval kelas
• Mean Aritmatik Terbobot
merupakan mean aritmetik yang diperoleh dari nilai yang diberi pembobotan dimana : wi : faktor pembobotan
∑
∑
= = = n i i n i i i w w x w x 1 1 .• Mean Geometrik
• Mean Harmonik
(
)
n n n n i ix
x
x
x
x
G
1,
2,
3,...,
1 1=
=
∏
=∑
∑
= = = = n i i n i i x n x n H 1 1 1 1 1 1Median/Nilai Tengah
menyatakan posisi tengah dari nilai data terjajar
(data array)
dimana :
Li : batas bawah nyata kelas dari kelas median
n : banyaknya data
(∑fi)l : jmlh frekuensi seluruh kelas yang lebih rendah dari kelas median
fmed : frekuensi kelas median c : lebar interval kelas median
(
)
c f f n L Median median l i 2 . − + =∑
Modus
nilai yang paling sering muncul atau yang
frekuensinya terbesar
dimana :
Li : batas bawah nyata kelas dari kelas modus ∆1 : selisih frekuensi kelas modus dengan kelas
sebelumnya
∆2 : selisih frekuensi kelas modus dengan kelas sesudahnya
c
L
Modus
i.
2 1 1
∆
+
∆
∆
+
=
Kuantil : Kuartil, Desil, Persentil
nilai-nilai yang membagi suatu jajaran data (data array)
menjadi bagian-bagian yang sama.
dimana :
Ll,j : batas bawah nyata kelas dari kelas kuantil ke-i n : banyak data (semua frekuensi)
r : konstanta
untuk kuartil = 4, desil = 10, persentil = 100 (∑f)l,i : jmlh frekuensi seluruh kelas yang lebih rendah
daripada kelas kuantil ke-i f kuantil,i : frekuensi kelas kuantil ke-i
c : lebar interval kelas kuantil
( ) c f f n r i L K i kuantil i l i l i . . , , , − + = ∑
Ukuran Penyebaran
Tendency Central Jangkauan/Range Koefisien Variasi Simpangan Kuartil Simpangan Mutlak Rata-Rata Varians Deviasi StandartDeviasi Standart/Simpangan Baku
Data Tidak Berkelompok
sampel
populasi
(
)
(
1)
. . 1 2 1 1 2 1 2 − − = − − =∑
∑
∑
= = = n n x x n n x x s n i i n i i n i i x(
)
2 1 2 1 2 . x N i i N i i i x N x N x x f µ σ − = − =∑
∑
= =Data Berkelompok
sampel
populasi
(
)
(
1)
. . . . 1 . 2 1 , 1 2 , 1 2 , − − = − − =∑
∑
∑
= = = n n x f x f n n x x f s k i i m i k i i m i k i i m i x(
)
2 1 2 , 1 2 , . . x K i i m i K i x i m i x N x f N x f µ µ σ − = − =∑
∑
= =Varians
merupakan kuadrat dari standart deviasi/simpangan baku sehingga dinyatakan sebagai sx2dan σ