1
MENDESKRIPSIKAN DATA
Secara Grafik
2Tipe Data
Data Categorical Numerical Discrete Continuous Contoh: Status pernikahan Agama Warna Mata Contoh: Jumlah anak Kerusakan perjam (item terhitung) Contoh: Berat Voltage (ukuran karakteristik)Level Pengukuran
Interval Data Ordinal Data Nominal Data Quantitative Data Qualitative Data Kategori (tidak adaurutan atau arah) Kategori Berurut (ranking, urutan atau skala)
Beda antar pengukuran sama tapi tidak terdapat nilai nol yang sebenarnya
Ratio Data
Beda antar pengukuran sama, terdapat nilai nol yang sebenarnya
4
Presentasi Data secara
Grafik
Data dalam bentuk mentah biasanya
tidak mudah dipakai dalam pengambilan keputusan
Tipe-tipe organisasi data dibutuhkan
dalam bentuk Tabel Grafik
Tipe grafik yang dipakai tergantung
5
Presentasi Data secara
Grafik
Teknik presentasi data: Categorical Variables Numerical Variables • Frequency distribution • Bar chart • Pie chart • Pareto diagram • Line chart • Frequency distribution • Histogram and ogive •Scatter plot
6
Tabel dan Grafik untuk
Peubah Kategori
Categorical Data Graphing Data Pie Chart Pareto Diagram Bar Chart Frequency Distribution Table Tabulating Data 7Tabel Distribusi Frekuensi
Contoh: Pasien rumah sakit berdasarkan unit
Hospital Unit Number of Patients
Cardiac Care 1,052 Emergency 2,245 Intensive Care 340 Maternity 552 Surgery 4,630 (Peubah Kategori)
Ringkasan Data berdasarkan kategori
8
Diagram Batang
dan Lingkaran
Diagram Batang danDiagram
Lingkaran biasanya digunakan
untuk data kualitatif (kategori)
Tinggi batang atau ukuran potongan
lingkaran menunjukkan frekuensi atau persentase dari tiap kategori
9
Contoh Diagram Batang
Hospital Number Unit of Patients Cardiac Care 1,052 Emergency 2,245 Intensive Care 340 Maternity 552 Surgery 4,630
Hospital Patients by Unit
0 1000 2000 3000 4000 5000 C a rd ia c C a re E m e rg e n c y In te n s iv e C a re M a te rn it y S u rg e ry N u m b e r o f p a ti e n ts p e r y e a r 10 Cardiac Care 12% Emergency 25% Intensive Care 4% Maternity 6% Surgery 53%
Contoh Diagram Lingkaran
(Persentase dibulatkan ke bil bulat terdekat)
Hospital Number % of Unit of Patients Total
Cardiac Care 1,052 11.93 Emergency 2,245 25.46 Intensive Care 340 3.86 Maternity 552 6.26 Surgery 4,630 52.50 11
Diagram Pareto
Digunakan untuk menggambarkan data
kategori
Diagram Batang dimana kategori
ditunjukkan dalam urutan menurun berdasarkan frekuensi
A cumulative polygon is often shown in
the same graph
Digunakan untuk memisahkan “yang
12
Contoh: 400 item rusak diteliti penyebab kerusakannya
Source of
Manufacturing Error Number of defects
Bad Weld 34 Poor Alignment 223 Missing Part 25 Paint Flaw 78 Electrical Short 19 Cracked case 21 Total 400
13
Step 1:Urutkan penyebab kerusakan dalam
urutan menurun
Step 2:Dapatkan % dalam tiap kategori
Source of
Manufacturing Error Number of defects % of Total Defects
Poor Alignment 223 55.75 Paint Flaw 78 19.50 Bad Weld 34 8.50 Missing Part 25 6.25 Cracked case 21 5.25 Electrical Short 19 4.75 Total 400 100%
Contoh Diagram Pareto
14
Contoh Diagram Pareto
c u m u la tiv e % ( lin e g ra p h ) % o f d e fe c ts in e a c h c a te g o ry (b a r g ra p h ) Manufacturing Defect 0% 10% 20% 30% 40% 50% 60% Electrical Short Poor Alignment Paint Flaw 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Step 3:Show results graphically
(continued)
15
Grafik untuk Data Time-Series
Diagram Garis (time-series plot)
digunakan untuk menunjukkan nilai dari peubah menurut waktu
Waktu diukur pada sumbu horisontal Peubah yang diselidiki diukur pada
sumbu vertikal
16
Contoh Diagram Garis
Magazine Subscriptions by Year
0 50 100 150 200 250 300 350 1 9 9 0 1 9 9 2 1 9 9 4 1 9 9 6 1 9 9 8 2 0 0 0 2 0 0 2 2 0 0 4 2 0 0 6 T h o u s a n d s o f s u b s c ri b e rs
17
Data Numerik
Histogram Ogive
Distribusi Frekuensi dan Distribusi Kumulatif
Grafik untuk Mendeskripsikan
Peubah Numerik
18
Apakah Distribusi Frekuensi?
Dist. Frekuensi adl sebuah daftar atau
sebuah tabel yang...
Mengandung pengrup-an kelas (kategori
atau range dimana data berada) ...
Dan frekuensi yg berhubungan dengan
dimana data berada dalam kelas atau kategori tersebut
Distribusi Frekuensi
19
Kenapa Menggunakan
Distribusi Frekuensi?
Dist. Frek adl sbh cara untuk
merangkum data
Dist merangkum data mentah
kebentuk yang lebih berguna (berarti)
Dan menjadikan pengamatan sekilas
menjadi lebih berarti
20
Interval dan Batas Kelas
Setiap grup kelas harus memp. lebar yang sama
Cara mendapatkan lebar kelas
Gunakan paling sedikit 5 interval tapi tidak lebih dari 15-20 interval
Interval tidak pernah overlap
Bulatkan lebar interval ke batas akhir interval yang diinginkan
w= lebar interval= nilai terbesar−nilai terkecil
21
Contoh Distribusi Frekuensi
Contoh:Sebuah perusahaan jaket memilih
secara acak 20 hari dalam musim dingin dan mencatata suhu tertinggi perharinya
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
22
Urutkan data mentah dengan urutan naik:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Dapatkan range: 58 - 12 = 46
Pilih banyak kelas: 5 (biasanya antara 5 dan 15) Hitung lebar interval: 10 (46/5 dibulatkan)
Dapatkan batas interval: 10 tapi kurang dari 20, 20 tapi kurang dari 30, . . . , 60 tapi kurang dari 70
Hitung amatan dan masukkan dalamn kelas
masing yg bersesuaian
Contoh Distribusi Frekuensi
23
Contoh Distribusi Frekuensi
Interval Frekuensi 10 tp kurang dr 20 3 .15 15 20 tp kurang dr 30 6 .30 30 30 tp kurang dr 40 5 .25 25 40 tp kurang dr 50 4 .20 20 50 tp kurang dr 60 2 .10 10 Total 20 1.00 100 Frekuensi Relatif Persentase Data yg terururt: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 24
Histogram
Grafik data dalam distribusi frekuensi
disebut histogram
Batas interval ditunjukkan pada sumbu
mendatar
Sumbu vertikal menunjukan frekensi,
frekuensi relatif, atau persentase
Batang adl tingi yg representatif dari
25 Temperature in Degrees
Contoh Histogram
(Tdk ada gap antar batang) Interval10 but less than 20 3
20 but less than 30 6
30 but less than 40 5
40 but less than 50 4
50 but less than 60 2
Frequency Histogram: Daily High Temperature 0 3 6 5 4 2 0 0 2 4 6 8 0 10 20 30 40 50 60 F re q u e n c y 26
Berapa Interval Kelas?
Many (interval kelas yg pendek) Bisa mendapatkan banyak kelas tanpa observasi Memberikan indikasi buruk beda antar kelas Few (interval kelas yg lebar) Terlalu padat Menyembunyikan pola yg penting 0 0.5 1 1.5 2 2.5 3 3.5 4 12 20 28 36 44 52 60 Temperature F re q u e n c y (X axis labels are upper class endpoints) 0 2 4 6 8 10 12 0 30 60 More Temperature F re q u e n c y 27Distribusi Frekuensi Kumulatif
Kelas 10 tp kurang dr 20 3 15 3 15 20 tp kurang dr 30 6 30 9 45 30 tp kurang dr 40 5 25 14 70 40 tp kurang dr 50 4 20 18 90 50 tp kurang dr 60 2 10 20 100 Total 20 100Persentase Persentase Kumulatif Data terurut: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Frekensi Frekuensi Kumulatif 28
Ogive
Graphing Cumulative Frequencies
Interval endpoints Interval Less than 10 10 010 but less than 20 20 15
20 but less than 30 30 45
30 but less than 40 40 70
40 but less than 50 50 90
50 but less than 60 60 100
Cumulative Percentage Upper interval
endpoint Ogive: Daily High Temperature
0 20 40 60 80 100 10 20 30 40 50 60 C u m u la ti v e P e rc e n ta g e
29
Bentuk Distribusi
Bentuk dari sebuah distribusi dikatakan
simetri jika observasi berimbang terhadap pusat (bell shape)
Symmetric Distribution 0 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 F re q u e n c y 30
Bentuk Distribusi
Bentuk distribusi dikatakan miring
(skewed) jika observasi tidak
berimbang terhadap pusat
Positively Skewed Distribution
0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 F re q u en cy
Negatively Skewed Distribution
0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 F re q u en cy
Miring kekanan(positively skewed)
Miring kekiri (negatively skewed)
31
Hubungan antar Peubah
Grafik yg dijelaskan diatas hanya untuk
satu peubah
Jika dua peubah dipakai, maka teknik yg
digunakan adl: Categorical (Qualitative) Variables Numerical (Quantitative) Variables
Cross tables Scatter
diagrams/plots
32
Scatter Diagramsdigunakan untuk
observasi dari dua peubah numerik
Scatter Diagram:
−Satu peubah diukur pada sumbu vertikal dan satunya pada sumbu horisontal
33
Contoh Scatter Diagram
Volume per day Cost per day 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200Cost per Day vs. Production Volume
0 50 100 150 200 250 0 10 20 30 40 50 60 70 Volume per Day C o s t p e r 34
Cross Tables
Cross Tables (atau contingency tables)
menampilkan banykanya observasi untuk tiap kombinasi dua peubah kategori atau ordinal
Jika terdapat r kategori untuk peubah
pertama (biasanya dalam baris) dan c kategori untuk peubah kedua (biasanya dalam kolom), tabel disebut r x c cross table
35
Contoh Cross Table
4 x 3 Cross Tableuntuk investasi pilihan para investor
(nilai dlm $1000’s)
Investment Investor A Investor B Investor C Total Category Stocks 46.5 55 27.5 129 Bonds 32.0 44 19.0 95 CD 15.5 20 13.5 49 Savings 16.0 28 7.0 51 Total 110.0 147 67.0 324 36
Grafik Data Kategori
Multivariate
Grafik Batang bersisian
Comparing Investors
0 10 20 30 40 50 60
Stocks Bonds CD Savings
37
Contoh :Grafik Bersisian
Penjualan pertigabulanan perdaerah
0 10 20 30 40 50 60 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr East West North 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr Ea st 20.4 27.4 59 20.4 W est 30.6 38.6 34.6 31.6 North 45.9 46.9 45 43.9
Plot Stem-and-leaf plot
(John Tukey, 1977) Contoh: Nilai Ujian (n = 40 students) Stem Leaf 3 6 4 5 37 6 235899 7 011346778999 8 00111233568889 9 02238