• Tidak ada hasil yang ditemukan

Visualisasi Data (tool: MS Excel) Tim Penyusun Materi Pengenalan Teknologi Informasi Institut Teknologi Bandung 2018

N/A
N/A
Protected

Academic year: 2022

Membagikan "Visualisasi Data (tool: MS Excel) Tim Penyusun Materi Pengenalan Teknologi Informasi Institut Teknologi Bandung 2018"

Copied!
55
0
0

Teks penuh

(1)

Visualisasi Data (tool: MS Excel)

Tim Penyusun Materi Pengenalan Teknologi Informasi Institut Teknologi Bandung © 2018

(2)

Objektif

• Mahasiswa memahami latar belakang dan pentingnya visualisasi data

• Mahasiswa memahami prinsip-prinsip dasar visualisasi data, dan mampu mengembangkan visualisasi data yang tepat

• Mahasiswa dapat menggunakan grafik yang disediakan MS Excel untuk keperluan visualisasi data

(3)

Pengenalan Teknologi Informasi

15/11/2021 3

(4)

Pentingya Insight

Richard Hamming (1962):

“The purpose of computing is

insight not numbers”

Insight: wawanan/pengertian/pengetahuan yang mendalam

Chris North:

Data-transfer via Vision vs Ears = 100MB/s : (<100b/s)

(5)

Statistik tidak cukup?

Ref: [6]

Pengenalan Teknologi Informasi

15/11/2021 5

(6)

Statistik tidak cukup?

Visualisasi perlu?

Summary statistics mungkin

kehilangan trend penting

• Visualisasi data memudahkan data anlaysis

• Visualisasi data dapat menampilkan kerumitan data menjadi sederhana dan menampilkan berbagai sudut

pandang dari data

http://en.wikipedia.org/wiki/Anscombe%27s_quartet

Anscombe’s Quartet

(7)

Kelebihan Visualisasi Data

• Memberikan pengertian komprehensif atas data yang banyak

• Memungkinkan persepsi secara cepat terhadap property atau karakteristik penting dari data.

• Dapat memperlihatkan secara cepat persoalan yang aa pada data, misalnya ada nilai data yang tidak masuk akal, outlier, dll

Memfasilitasi pemahaman terhadap fitur data, baik secara large- scale maupun small-scale

Pengenalan Teknologi Informasi

15/11/2021 7

(8)

Beberapa Definisi

• Visualisasi Data :

an umbrella term, mengkonversi sumber data ke dalam sebuah representasi visual

• Visualisasi Saintifik:

Visualisasi data saintifik yang berhubungan erat dengan objek dunia-nyata yang memiliki property spasial

Contoh: visualisasi data gempa, visualisasi arah angin

• Visualisasi Information

Visualisasi dalam bentuk bagan (chart), grafik, metafora spasial/visual yang digunakan untuk merepresentasikan dataset yang tidak memiliki komponen spasial.

Contoh: visualisasi harga saham, visualisasi perbandingan jumlah mahasiswa ITB

(9)

Contoh

Visualisasi Saintifik

Pengenalan Teknologi Informasi

15/11/2021 9

(10)

Contoh Visualisasi Informasi

(11)

Data Visualization

11/15/2021 SA/IF5170/Pengantar Visualisasi Data

11 (c) Andy Kirk, 2012

Data Visualization:

the representaton and presentation of data that exploits our visual perception abilities in order to amplify cognition

Pengenalan Teknologi Informasi

15/11/2021 11

(12)

Tujuan Visualisasi:

• Visualisasi untuk

analisis

(a.k.a. “visual analytics”)

Eksploitasi kekuatan persepsi visual untuk mengekplor atau menganalisis hubugan antar data

Biasanya ditampilkan dalam berbagai bentuk atau sudut pandang visualisasi untuk menemukan hubungan yang diinginkan

• Visualisasi untuk

komunikasi

Memilih view tertentu dari data untuk di-share

Biasanya dilakukan dengan konstruksi visualisasi dengan tujuan menjelaskan kepada audiens

(13)

Visualisasi untuk

Tujuan Analisis

(Exploratory)

Pengenalan Teknologi Informasi

15/11/2021 13

(14)

Visualisasi untuk

Tujuan

Komunikasi

(Explanatory)

(15)

Tahapan Visualisasi Data

1. Acquire: Obtain the data...

2. Parse: Provide some structure for the data’s meaning, and order it into categories.

3. Filter: Remove all but the data of interest.

4. Mine: Applymethods from statistics or data mining as a way to discern patterns or place the data in mathematical context.

5. Represent: Choose a basic visual model, such as a bar graph, list, or tree.

6. Refine: Improve the basic representation to make it clearer and more visually engaging.

7. Interact: Add methods for manipulating the data or controlling what features are visible.

Note: stages are often iterative and may have a flexible order or even be omitted in some projects.

Fry, B. (2008). Visualizing data. Sebastopol, CA: O’Reilly Media, Inc.

(c) Angela Zoss (angela.zoss@duke.edu)

11/15/2021 Pengenalan Teknologi Informasi 15

15/11/2021 15

(16)

Tipe Data

Categorical-Nominal

Nama negara, warna kulit, nama program studi, dll

Categorical-Ordinal

Likert scale (“sangat setuju” s.d. “sangat tidak setuju”)

Indeks nilai A, B, C, D, E

Categorical-Binary

Jenis kelamin, status mahasiswa (aktif, tidak aktif), dll

Quantitative-Discrete

Banyaknya anak, banyaknya mahasiswa, banyaknya sks lulus

Quantitative-Continues

Usia, berat badan, tinggi, suhu

(17)

Klasifikasi Visualisasi Data

Perbandingan Kategori (Comparing Categories)

Penampilan Perubahan Terhadap Waktu (Showing over Times)

Penampilan Hirarki dan Hubungan Keseluruhan-Bagian (Whole- part relationship)

Plotting relationships

• Pemetaan Data Geospatial (tidak dibahas di kuliah ini)

Pengenalan Teknologi Informasi

15/11/2021 17

(18)
(19)

Comparing Categories

• Membandingkan nilai-nilai dari suatu variabel bersifat kategorikal

Contoh: membandingkan jumlah mahasiswa untuk beberapa prodi, pendapatan per kapita negara-negara di dunia,

• Grafik yang dapat digunakan:

[Vertical/Horizontal] bar chart/column chart

Histogram

Radial chart

Dot plot

Dll.

Pengenalan Teknologi Informasi

15/11/2021 19

(20)

Comparing categories: Bar chart

Bar chart/grafik garis: Menggunakan batang vertikal atau

horizontal untuk menunjukkan perbandingan nilai-nilai numerik pada kategori-kategori tertentu

(21)

Comparing categories: Histogram chart

Histogram: Memvisualisasikan distribusi data untuk interval- interval nilai atau periode waktu. Setiap batang pada histogram merepresentasikan frekuensi data untuk tiap interval.

Pengenalan Teknologi Informasi

15/11/2021 21

(22)

Comparing categories: Dot plot

Dot chart/dot plot : adalah chart di mana titik-titik data di-plot- kan ke atas skala sederhana,

• Dot plot merupakan alternative dari bar chart untuk

merepresentasikan nilai-nilai kuantitatif berasosiasi dengan variable kategorikal

(23)

Comparing categories: Radial [bar] chart

• Radial [bar] chart: bar chart yang diplot di atas sistem koordinat polar

Problem: panjang batang dapat salah diinterpretasi

Pengenalan Teknologi Informasi

15/11/2021 23

(24)

Penampilan Perubahan Terhadap Waktu (Showing over Times)

• Visualisasi menampilkan data dalam suatu periode waktu untuk menemukan trend atau perubahan terkait waktu

• Grafik/chart yang dapat digunakan:

Line chart

Area chart + stacked area chart

Histogram

Dll.

(25)

Showing over times: Line chart

Line chart: menggunakan garis yang menghubungkan titik-titik data untuk menunjukkan perubahan terkait waktu atau interval nilai tertentu

Pengenalan Teknologi Informasi

15/11/2021 25

(26)

Showing over times:

Area Chart + Stacked Area Chart

Area chart menggunakan

wilayah di bawah garis (seperti pada line chart) untuk

menyatakan data kuantitatif terkait waktu

Stacked Area Chart terdiri atas beberapa area chart yang

bertumpuk satu di atas yang lain yang menandakan kategori yang berbeda

(27)

Penampilan Hierarki dan Hubungan Keseluruhan- Bagian (Whole-part relationship)

Hierarki: Menampilkan bagaimana ranking atau urutan data atau objek dirangking

Whole-part relationship: menunjukkan proporsi bagian-bagian pada suatu variabel dari keseluruhannya

• Grafik yang dapat digunakan:

Pie chart

Stacked bar chart

Treemap

Dll.

Pengenalan Teknologi Informasi

15/11/2021 27

(28)

Hierarchy + Whole Part Relationship:

Pie Chart

Pie chart: menunjukkan proporsi/persentase dari kategori- kategori dalam suatu variable

(29)

Hierarchy + Whole Part Relationship:

Stacked Bar Chart

Stacked bar chart: menampilkan bagian-bagian dari total nilai untuk suatu kategori dalam satu bar/batang

Pengenalan Teknologi Informasi

15/11/2021 29

(30)

Hierarchy + Whole Part Relationship:

TreeMap

Treemap: menunjukkan struktur hierarki dari nilai kuantitatif melalui ukuran area

(31)

Plotting relationships

• Menunjukkan hubungan-hubungan antar data atau korelasi antara 2 variable atau lebih

• Grafik yang dapat digunakan:

Scatter plot

Bubble plot

Heatmap

Dll.

Pengenalan Teknologi Informasi

15/11/2021 31

(32)

Plotting Relationship: Scatter Plot

Scatter plot terdiri atas titik-titik nilai yang dipetakan di atas koordinat x dan y yang merepresentasikan nilai dari 2 variable

• Dapat digunakan untuk menunjukkan korelasi antara kedua variabel

(33)

Plotting Relationship: Bubble plot

Bubble plot adalah grafik multi-variable yang memplot nilai-nilai kuantitatif dalam bentuk lingkaran yang berbeda luasnya.

Pengenalan Teknologi Informasi

15/11/2021 33

(34)

Plotting Relationship: Heatmap

Heatmap digunakan untuk memvisualisasikan data melalui berbagai variasi warna. Dalam bentuk tabular, heatmap dapat digunakan untuk memetakan data dari 2 variable atau lebih.

(35)

Chart in MS Excel

MS Excel menyediakan berbagai jenis chart yang dapat digunakan untuk

mengkomunikasikan data secara grafis

• Chart dalam Excel tersedia secara secara default sebagai bagian dari menu Insert

Pengenalan Teknologi Informasi

15/11/2021 35

(36)

Contoh data-1

Buka file data.csv dalam MS Excel

Save sebagai file data.xlsx

Create table bernama MyData

(37)

Bar chart (1)

• Buat vertical bar chart untuk menampilkan umur dari setiap orang

• Langkah:

Select seluruh data pada kolom name dan kolom age

Klik icon bar chart pada menu Insert

Charts

Pilih style bar chart yang diinginkan

Klik caption tabel untuk

menggantinya menjadi “Age of Person”

Pengenalan Teknologi Informasi

15/11/2021 37

(38)

Bar Chart (2)

• Tampilkan banyaknya anak

(num_children) dan banyaknya piaraan (num_pets) dalam 1 grafik vertical bar chart

• Langkah:

Select kolom name, num_children, num_pets

Klik icon bar chart pada menu Insert  Charts

Pilih style bar chart yang diinginkan

(39)

Horizontal Bar Chart

• Langkah:

Select kolom name,

num_children, num_pets

Klik icon bar chart pada menu Insert  Charts

Pilih horizontal bar chart dengan style yang diinginkan

Pengenalan Teknologi Informasi

15/11/2021 39

(40)

Histogram (1)

• Tampilkan distribusi orang berdasarkan kelompok umur: 0-20;

21-40; 41-60; 61-80; 81-100

• Menggunakan add-ins Analysis Toolpak (lihat materi kuliah sebelumnya untuk aktivasinya)

• Langkah:

1. Buat daftar nilai atas dalam histogram: 20, 40, 60, 80, 100, misalnya pada lokasi: I2:I5

2. Buka menu Data  Data Analysis 3. Pilih analysis tool: Histogram

4. …

(41)

Histogram (2)

Langkah:

4. Untuk Input Range, select lokasi seluruh data yang akan dibuat histogramnya, dalam hal ini sel: B2:B8

5. Untuk Bin Range, select lokasi data bin yang dibuat pada langkah 1, dalam hal ini misalnya: I1:I5

6. Untuk Output Range, klik posisi di mana perhitungan frekuensi untuk keperluan histogram dituliskan, misalnya pada kolom K3.

7. Check Chart Output.

8. Klik OK

Pengenalan Teknologi Informasi

15/11/2021 41

(42)

Pie Chart

• Tampilkan komposisi banyaknya orang berdasarkan negara

• Langkah:

Hitung distribusi frekuensi (lihat bahan kuliah sebelumnya)

Select daftar distribusi frekuensi

Klik icon bar chart pada menu Insert  Charts

Pilih pie chart dengan style yang diinginkan

(43)

Stacked Bar Chart (1)

Tampilkan data banyaknya data per jenis kelamin (gender) per negara bagian (state)

Langkah:

1. Membuat tabel pivot:

Langkah:

a. Pilih menu Insert  Pivot Table

b. Pada bagian Select a table or range, masukkan nama table atau range, misalnya dalam hal ini: MyData atau select A1:F8

c. Pada bagian Choose where you want the PivotTable report to be placed, letakkan sel pertama di mana tabel pivot akan diletakkan. Misalnya pilih Existing

Worksheet dengan Location pada H2

c. Pada box PivotTable Fields check kolom gender pada kotak Rows, drag kolom state pada kotak Columns, dan drag kolom name pada kolom Values

15/11/2021 Pengenalan Teknologi Informasi 43

(44)

Stacked Bar Chart (2)

• Langkah:

2. Select tabel pivot yang dihasilkan dari langkah sebelumnya

3. Pilih menu Insert  Chart dan klik bar chart. Pilih stacked

column dengan style yang diinginkan.

(45)

Stacked Bar Chart (3)

• Tampilkan banyaknya anak

(num_children) dan banyaknya piaraan (num_pets) dalam 1 grafik stacked bar chart

• Langkah:

Select column name, num_children, dan num_pets

Pilih menu Insert  Chart dan klik bar chart. Pilih stacked column dengan style yang diinginkan.

15/11/2021 Pengenalan Teknologi Informasi 45

(46)

Contoh Data-2: Time-series

Buka file animal.csv dalam MS Excel

Save sebagai file animal.xlsx

Create table bernama AnimalData

(47)

Line Chart (1)

Tampilkan pertumbuhan populasi beruang (Bears) dari tahun ke tahun dalam line chart

Langkah:

1. Klik icon line chart pada menu Insert  Charts.

Pilih style line chart 2D yang diinginkan.

2. Pada menu Design, pilih Select Data

3. Pada box Select Data Source yang muncul, untuk Chart data range, select kolom Bears pada tabel AnimalData. Pada bagian Legend entries (Series) akan muncul kolom Bears sebagai data yang ditampilkan di line chart 4. Untuk bagian Horizontal (Category) Axis

Labels, pilihlah seluruh nilai pada kolom Year (tanpa header)

5. Klik OK

Pengenalan Teknologi Informasi

15/11/2021 47

(48)

Line Chart (2)

Tampilkan pertumbuhan populasi beruang (Bears), lumba-lumba

(Dolphins), dan ikan paus (Whales) dari tahun ke tahun dalam 1 line chart

Langkah yang dilakukan sama spt.

pada slide sebelumnya, hanya pada langkah 3, pilih semua kolom Bears, Dolphins, dan Whales

Setelah selesai membentuk chart, klik properties chart (icon +) dan klik

Legend untuk memunculkan data kategori yang dimunculkan

(49)

Area Chart

• Tampilkan pertumbuhan

populasi beruang (Bears) dari tahun ke tahun dalam area

chart

• Langkah:

1. Select kolom Year dan Bears 2. Klik Insert  Chart

3. Pilih Area Chart

Pengenalan Teknologi Informasi

15/11/2021 49

(50)

Stacked Area Chart

• Tampilkan pertumbuhan populasi beruang (Bears),

lumba-lumba (Dolphins), dan ikan paus (Whales) dari tahun ke tahun dalam stacked area chart

• Seperti pada slide sebelumnya, hanya saja yang dipilih adalah seluruh tabel

(51)

Contoh Data-3: medali Asian Games

• Kembali ke contoh pada materi kuliah sebelumnya: file medali.csv atau

medali.xlsx

Buka file medali.xlsx (atau dari medali.csv)

Buat table MedalTable

15/11/2021 Pengenalan Teknologi Informasi 51

(52)

Scatter Plot

Tampilkan relationship antara variable gold dan total dalam grafik scatter plot dan tunjukkan adanya korelasi positif

Langkah:

1. Select kolom gold dan total 2. Pilih Insert  Chart

3. Pilih All Charts  Scatter, klik OK 4. Langkah tambahan: Klik

properties (icon +) untuk

menampilkan axis, lalu ubah title dan nama-nama sumbu

(53)

Bubble Plot (1)

Tampilkan banyaknya total

medali (kolom total) dikaitkan dengan perolehan nilai medali

emas (kolom gold) pada sumbu x dan perolehan medali perak

(kolom silver) pada sumbu y dalam grafik bubble plot untuk 10 negara dengan rangking

tertinggi

Bubble plot pada dasarnya menggunakan Scatter Plot

Langkah:

1. Buat tabel terpisah untuk data 10 negara dengan rangking tertinggi dan perolehan total medali,

simpan misalnya di Sheet2

Urutan kolom dari kiri ke kanan:

gold, silver, total

Gold akan menjadi sumbu x, silver akan menjadi sumbu y, dan total akan menjadi ukuran bubble

2. Select seluruh data pada table 3. Pilih Insert  Chart, pilih All

Chart  Scatter  Bubble 4. Klik OK

15/11/2021 Pengenalan Teknologi Informasi 53

(54)

Bubble Plot (2)

• Langkah tambahan:

Select properties dari Chart untuk mengganti title,

menampilkan dan mengganti nama axis (sumbu)

Change color dengan orange

(55)

Treemap

Tampilkan perbandingan

perolehan total medali untuk 10 negara dengan rangking tertinggi

Langkah:

Buat tabel terpisah untuk data 10

negara dengan rangking tertinggi dan perolehan total medali

Select tabel tersebut

Pilih Insert  Chart. Pilih TreeMap.

Rename chart title dengan Top 10 2018 Asian Games

15/11/2021 Pengenalan Teknologi Informasi 55

Referensi

Dokumen terkait

Hasil analisis uji statistik dapat disimpulkan bahwa terdapat hubungan yang signifikan antara kejadian anemia dengan derajat penyakit ginjal kronik pada pasien

Berdasarkan literatur diproleh beberapa komplikasi yang berhubungan terhadap nilai saturasi oksigen yaitu; hipotensi, kram otot, pusing, demam, nyeri dada dan

• Tiap sub bagian dapat didefinisikan sebagai fungsi yang tinggal dipanggil sebagai 1 baris atau ekspresi dalam program utama. • Code reuse instead of

&gt;= Jika nilai operan kiri lebih besar dari atau sama dengan operan kanan, maka menghasilkan

Array bernama TabInt dengan setiap elemen bertype integer dan dengan nilai default elemen 0, dengan ukuran 10 elemen dan.. setiap elemen array diakses dengan menggunakan indeks ke-0

Setiap Orang dengan sengaja dan tanpa hak atau melawan hukum melakukan perbuatan sebagaimana dimaksud dalam Pasal 27 sampai dengan Pasal 34 yang mengakibatkan kerugian bagi Orang

Selanjutnya dilakukan pemeriksaan untuk ukuran kinerja pada setiap jenis kinerja. Untuk ukuran kinerja yang sama, nilainya akan diperbandingkan antar pabrik gula dalam

Secara historis antara lain, adanya SKB tiga Menteri tahun 1975 yang menyamakan status ijazah dan lulusan madrasah dengan ijazah dan lulusan sekelas umum yang setingkat,