Pertemuan 02
Koding dan tabulasi data
Statistika Sosial
Tujuan Pertemuan 02
Setelah mempelajari bagian ini, peserta mata kuliah mampu :
•Menjelaskan Perbedaan Data Kategorik dan Numerical
•Menjelaskan cara melakukan pengkodean data
•Melakukan Tabulasi data
•Membuat Grafik Data
Tipe-tipe Data
Data
Categorical Numerical
Discrete Continuous
Contoh:
Status perkawinan (SK, BK)
Jenis Kelamin (LK, PR)
Tingkat Pendidikan (SD, SMP,SMA, DIV, S1, S2 & S3)
Status Merokok (M, TM) Contoh:
Banyaknya anak (1, 2, 3 dst)
Banyaknya rusak per jam (1, 2, 3 dst)
Contoh:
Berat Badan (45,50 Kg, 67 Kg, 89 Kg)
Hasil panen (1 Ton, 29 KG)
Konsumsi BBM perliter (10 lt, 20 lt)
Tingkat Pengukuran
Interval Data Ordinal Data
Nominal Data
Quantitative Data
Qualitative Data Kategorik (Tidak ada
urutan )
Kategorik terurut (ranking, urutan, or skaling)
Berbeda antar setiap pengukuran, tidak memiliki nilai nol mutlak
Ratio Data
Berbeda antar setiap pengukuran, memiliki nilai nol mutlak
Skala nominal
• Adalah skala yang semata-mata hanya untuk memberikan indeks, atau nama saja dan tidak mempunyai makna yang lain
• Misal anda memberi angka untuk Jenis Pekerjaan
1 = Petani
2 = Pedagang 3 = PNS
Tidak berarti bahwa Petani lebih rendah dari Pedagang dan PNS, begitu juga sebaliknya. Anda dapat mengganti angka ketiganya sesuka hati anda tanpa mempengaruhi arti statistikanya.
Skala ordinal
• Adalah skala ranking, di mana kode yang diberikan memberikan urutan tertentu pada data, tetapi tidak menunjukkan selisih yang sama dan tidak ada nol mutlak
• Misal tingkat kecantikan ranking 1,2,3,4.
• Jelas bahwa ranking 1 lebih cantik dari ranking 2,3, dan 4. Akan tetapi, tidak berarti bahwa ranking 1 mempunyai kecantikan 4 kali dibanding ranking 4, dst…
Skala interval
•Skala pengukuran yang mempunyai selisih sama antara satu pengukuran dengan
pengukuran yang lain, tetapi tidak memiliki nilai nol mutlak
•Nilai A setara dengan 4, B dengan 3, C dengan 2 dan D dengan 1. Selisih A dan B sama
dengan selisih B dan C dan juga sama persis dengan selisih nilai C dan D. Akan tetapi, tidak boleh dikatakan bahwa A empat kali lebih
pintar dibandingkan D, atau A dua kali lebih pintas dari pada B. Meskipun selisihnya sama, tetapi tidak mempunyai nilai nol mutlak.
• Sebagai contoh, suhu, dalam derajat Fahrenheit atau Celcius, merupakan skala interval. Kita
dapat mengatakan bahwa suhu 50 > 40 derajat, demikian juga suhu 30 > 20 derajat. Perbedaan selisih suhu antara 40 dan 50 derajat =
perbedaan suhu antara 20 dan 30 derajat, yaitu 10 derajat. Perbedaan antara kedua nilai pada skala interval sudah punya makna yang berarti, berbeda dengan perbedaan pada skala ordinal yang maknanya tidak berarti. Misalnya,
perbedaan antara suhu 40 dan 50 derajat dua kali lebih besar dibandingkan dengan
perbedaan antara suhu 30 dan 35.
Skala rasio
•Adalah skala pengukuran yang paling tinggi di mana selisih tiap
pengukuran adalah sama dan mempunyai nilai nol mutlak
•BB 100 benar-benar 2x BB 50. BB Ayah anda 60 kg, berat badan anda 40 kg. Berarti BB ayah anda adalah 1,5 x BB anda.
Skala rasio
• Memang agak sedikit susah membedakan skala interval dengan rasio. Kuncinya adalah di angka 0, apakah nilai nol tersebut mutlak atau tidak?
• Suhu bisa berupa skala interval tapi bisa juga skala rasio, tergantung pada skala pengukuran yang digunakan. Apabila kita menggunakan skala Celcius atau Fahrenheit, termasuk skala interval,
• Apabila Kelvin yang digunakan, suhu termasuk skala rasio. Mengapa? Karena suhu 0 derajat Kelvin adalah mutlak! Kita tidak saja dapat
mengatakan bahwa suhu 200 derajat lebih tinggi daripada suhu 100 derajat, tetapi benar dua kali lebih tinggi.
Grafik Berdasarkan Variabel Data
• Grafik data berdasarkan variabel Data
Variabel
Kategorik Variabel
Numerik
• Distribusi Frequensi
• Bar chart
• Pie chart
• Diagram Pareto
• Line chart
• Histogram
• Diagram Batang dan Daun
• Scatter plot
Tabel Distribusi Frekuensi
Contoh: Banyaknya Pasien Per Unit
Unit RS # Pasien
Cardiac Care 1,052
Emergency 2,245
Intensive Care 340
Maternity 552
Surgery 4,630
(Variabel : Kategorik)
Ringkasan data per kategori
Contoh Bar Chart
Pie Chart Example
(Percentase dibulaskan ke angka terdekat
Hospital Number % of Unit of Patients Total Cardiac Care 1,052 11.93 Emergency 2,245 25.46 Intensive Care 340 3.86 Maternity 552 6.26 Surgery 4,630 52.50
Diagram Pareto
Contoh: 400 barang cacat berdasar faktornya:
Source of
Manufacturing Error Number of defects
Bad Weld 34
Poor Alignment 223
Missing Part 25
Paint Flaw 78
Electrical Short 19
Cracked case 21
Total 400
Diagram Pareto
Step 1: Urutkan berdasar sebab kerusakan Step 2: Hitunglan prosentasenya
Source of
Manufacturing Error Number of defects % of Total Defects
Poor Alignment 223 55.75
Paint Flaw 78 19.50
Bad Weld 34 8.50
Missing Part 25 6.25
Cracked case 21 5.25
Electrical Short 19 4.75
Total 400 100%
Diagram Pareto
cumulative % (line graph)
% of defects in each category (bar graph)
Step 3: Presentasi grafik
Grafik data Time-Series
•Plot data time series dibuat dalam grafik garis digunakan untuk menyajikan nilai- nilai dari suatu variabel sepanjang waktu tertentu
•Waktu diukur pada sumbu mendatar
•Variabel data diukur pada sumbu vertikal
Contoh Plot Data TS
Distribusi Frequensi
Apa Distribusi Frequensi itu ?
•Distribusi frequensi adalah sebuah daftar atau table …
•Berisi kelas-kelas atau kategori-kategori
…
•Dan frekuensi data yang bersesuaian…
Interval Kelas dan Batasnya
•Masing-masing kelas mempunyai lebar yang sama dengan formula
Gunakan mininal 5 kelas, tapi tidak lebih 15-20 interval
Interval kelas tidak overlap
Bulatkan ke atas lebar interval
intervals desired
of number
number smallest
number largest
width interval
w
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Contoh Distribusi Frequensi
Suatu perusahaan insulasi secara random
memilih 20 hari di musim winter dan Mengukur temperaturnya
Urutkan datanya :
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Frequency Distribution Example
•Hitung range: 58 - 12 = 46
•Pilih banyaknya kelas: 5
•Hitung lebar interval : 10 (46/5 dibulat ke atas )
•Tentukan batas interval: 10 but less than 20, 20 but less than 30, . . . , 60 but less than 70
•Hitung observasi dan masukkan ke kelas yang sesuai
Distribusi Frequensi
Interval Frequency
10 but less than 20 3 .15 15 20 but less than 30 6 .30 30
30 but less than 40 5 .25 25
40 but less than 50 4 .20 20
50 but less than 60 2 .10 10
Total 20 1.00 100
Relative
Frequency Percentage
Histogram
• Grafik dari data dalam suatu distribusi frequensi disebut dengan histogram
• Nilai-nilai Interval ditunjukkan pada sumbu horisontal
• Sumbu vertikal berisi frequensi, atau frequensi relatif, atau persentase
• Batang tegak menunjukkan banyaknya observasi atau frekuensi masing-masing kelas
Temperature in Degrees
Contoh Histogram
Bentuk Distribusi
•Bentuk distribusi dikatakan simetrik jika observasi seimbang, atau
terdistribusi di tengah.
Symmetric Distribution
0 1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9
Frequency
Bentuk Distribusi
•Bentuk distribusi dikatakan skewed (menceng) jika observasi tidak
symmetric.
Positively Skewed Distribution
0 2 4 6 8 10 12
1 2 3 4 5 6 7 8 9
Frequency
Negatively Skewed Distribution
0 2 4 6 8 10 12
1 2 3 4 5 6 7 8 9
Frequency
Suatu distribusi dikatakan menceng ke kanan jika
ekornya melebar ke kanan.
Suatu distribusi dikatakan menceng ke kiri jika ekornya melebar ke kiri
Diagram Batang dan Daun
• Cara yang mudah untuk melihat distribusi data set
METHOD: Pisahkan data terurut ke
angka utama (batang) dan angka tambahan (daun)
Contoh
• Di sini, gunakan puluhan sebagai batangnya:
Data terurut :
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
21 ditunjukkan
38 ditunjukkan
Batang Daun
23 1
8
Contoh
• Diagram batang dan daun lengkap :
Stem Leaves
2 1 4 4 6 7 7 3 0 2 8
4 1
Data terurut:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Contoh lain
• Gunakan ratusan sebagai batang :
▫ Diagram batang dan daun lengkap :
batang daun 6 1 3 6 7 2 2 5 8 8 3 4 6 6 9 9 9 1 3 3 6 8 10 3 5 6
11 4 7 12 2
Data:
613, 632, 658, 717, 722, 750, 776, 827, 841, 859, 863, 891, 894, 906, 928, 933, 955, 982, 1034, 1047,1056, 1140, 1169, 1224
• Diagram Scatter Plot digunakan untuk observasi berpasangan
dari dua variabel numerik
•Diagram Scatter :
▫Satu variabel diukur untuk sumbu vertikal dan lainnya digunakan
untuk sumbu horisontal
Diagram Scatter Plot
Contoh Diagram Scatter
Umur B.
Pressure
23 125
26 140
29 146
33 160
38 167
42 170
50 188
55 195
60 200
Tabulasi Silang
•Tabulasi Silang digunakan untuk
menampilkan data observasi dua atau lebih variabel kategorik.
•Kombinasi kategori dari Var I dan II, dinamakan dengan sel.
•Jika ada r kategiri untuk variabel I
(baris), dan c kategori untuk variabel II (kolom), tabelnya disebut dengan tabel silang r x c. Ada r x c sel data.
Contoh Tabel Silang
•Tabulasi silang 4 x 3 untuk Biaya RS untuk 4 kategori dari 3 RS berbeda (Dalam 100 ribuan )
Kategori Hospital A Hospital B Hospital C
A 46.5 55 57.5 B 32.0 34 39.0
C 15.5 20 13.5
D 16.0 15 7.0