Visualisasi Data (tool: MS Excel)
Tim Penyusun Materi Pengenalan Teknologi Informasi Institut Teknologi Bandung © 2018
Objektif
• Mahasiswa memahami latar belakang dan pentingnya visualisasi data
• Mahasiswa memahami prinsip-prinsip dasar visualisasi data, dan mampu mengembangkan visualisasi data yang tepat
• Mahasiswa dapat menggunakan grafik yang disediakan MS Excel untuk keperluan visualisasi data
Pengenalan Teknologi Informasi
15/11/2021 3
Pentingya Insight
Richard Hamming (1962):
“The purpose of computing is
insight not numbers”
Insight: wawanan/pengertian/pengetahuan yang mendalam
Chris North:
Data-transfer via Vision vs Ears = 100MB/s : (<100b/s)
Statistik tidak cukup?
Ref: [6]
Pengenalan Teknologi Informasi
15/11/2021 5
Statistik tidak cukup?
Visualisasi perlu?
•
Summary statistics mungkinkehilangan trend penting
• Visualisasi data memudahkan data anlaysis
• Visualisasi data dapat menampilkan kerumitan data menjadi sederhana dan menampilkan berbagai sudut
pandang dari data
http://en.wikipedia.org/wiki/Anscombe%27s_quartetAnscombe’s Quartet
Kelebihan Visualisasi Data
• Memberikan pengertian komprehensif atas data yang banyak
• Memungkinkan persepsi secara cepat terhadap property atau karakteristik penting dari data.
• Dapat memperlihatkan secara cepat persoalan yang aa pada data, misalnya ada nilai data yang tidak masuk akal, outlier, dll
• Memfasilitasi pemahaman terhadap fitur data, baik secara large- scale maupun small-scale
Pengenalan Teknologi Informasi
15/11/2021 7
Beberapa Definisi
• Visualisasi Data :
• an umbrella term, mengkonversi sumber data ke dalam sebuah representasi visual
• Visualisasi Saintifik:
• Visualisasi data saintifik yang berhubungan erat dengan objek dunia-nyata yang memiliki property spasial
• Contoh: visualisasi data gempa, visualisasi arah angin
• Visualisasi Information
• Visualisasi dalam bentuk bagan (chart), grafik, metafora spasial/visual yang digunakan untuk merepresentasikan dataset yang tidak memiliki komponen spasial.
• Contoh: visualisasi harga saham, visualisasi perbandingan jumlah mahasiswa ITB
Contoh
Visualisasi Saintifik
Pengenalan Teknologi Informasi
15/11/2021 9
Contoh Visualisasi Informasi
Data Visualization
11/15/2021 SA/IF5170/Pengantar Visualisasi Data
11 (c) Andy Kirk, 2012
Data Visualization:
the representaton and presentation of data that exploits our visual perception abilities in order to amplify cognition
Pengenalan Teknologi Informasi
15/11/2021 11
Tujuan Visualisasi:
• Visualisasi untuk
analisis(a.k.a. “visual analytics”)
• Eksploitasi kekuatan persepsi visual untuk mengekplor atau menganalisis hubugan antar data
• Biasanya ditampilkan dalam berbagai bentuk atau sudut pandang visualisasi untuk menemukan hubungan yang diinginkan
• Visualisasi untuk
komunikasi• Memilih view tertentu dari data untuk di-share
• Biasanya dilakukan dengan konstruksi visualisasi dengan tujuan menjelaskan kepada audiens
Visualisasi untuk
Tujuan Analisis
(Exploratory)
Pengenalan Teknologi Informasi
15/11/2021 13
Visualisasi untuk
Tujuan
Komunikasi
(Explanatory)
Tahapan Visualisasi Data
1. Acquire: Obtain the data...
2. Parse: Provide some structure for the data’s meaning, and order it into categories.
3. Filter: Remove all but the data of interest.
4. Mine: Applymethods from statistics or data mining as a way to discern patterns or place the data in mathematical context.
5. Represent: Choose a basic visual model, such as a bar graph, list, or tree.
6. Refine: Improve the basic representation to make it clearer and more visually engaging.
7. Interact: Add methods for manipulating the data or controlling what features are visible.
Note: stages are often iterative and may have a flexible order or even be omitted in some projects.
Fry, B. (2008). Visualizing data. Sebastopol, CA: O’Reilly Media, Inc.
(c) Angela Zoss (angela.zoss@duke.edu)
11/15/2021 Pengenalan Teknologi Informasi 15
15/11/2021 15
Tipe Data
• Categorical-Nominal
• Nama negara, warna kulit, nama program studi, dll
• Categorical-Ordinal
• Likert scale (“sangat setuju” s.d. “sangat tidak setuju”)
• Indeks nilai A, B, C, D, E
• Categorical-Binary
• Jenis kelamin, status mahasiswa (aktif, tidak aktif), dll
• Quantitative-Discrete
• Banyaknya anak, banyaknya mahasiswa, banyaknya sks lulus
• Quantitative-Continues
• Usia, berat badan, tinggi, suhu
Klasifikasi Visualisasi Data
• Perbandingan Kategori (Comparing Categories)
• Penampilan Perubahan Terhadap Waktu (Showing over Times)
• Penampilan Hirarki dan Hubungan Keseluruhan-Bagian (Whole- part relationship)
• Plotting relationships
• Pemetaan Data Geospatial (tidak dibahas di kuliah ini)
Pengenalan Teknologi Informasi
15/11/2021 17
Comparing Categories
• Membandingkan nilai-nilai dari suatu variabel bersifat kategorikal
• Contoh: membandingkan jumlah mahasiswa untuk beberapa prodi, pendapatan per kapita negara-negara di dunia,
• Grafik yang dapat digunakan:
• [Vertical/Horizontal] bar chart/column chart
• Histogram
• Radial chart
• Dot plot
• Dll.
Pengenalan Teknologi Informasi
15/11/2021 19
Comparing categories: Bar chart
• Bar chart/grafik garis: Menggunakan batang vertikal atau
horizontal untuk menunjukkan perbandingan nilai-nilai numerik pada kategori-kategori tertentu
Comparing categories: Histogram chart
• Histogram: Memvisualisasikan distribusi data untuk interval- interval nilai atau periode waktu. Setiap batang pada histogram merepresentasikan frekuensi data untuk tiap interval.
Pengenalan Teknologi Informasi
15/11/2021 21
Comparing categories: Dot plot
• Dot chart/dot plot : adalah chart di mana titik-titik data di-plot- kan ke atas skala sederhana,
• Dot plot merupakan alternative dari bar chart untuk
merepresentasikan nilai-nilai kuantitatif berasosiasi dengan variable kategorikal
Comparing categories: Radial [bar] chart
• Radial [bar] chart: bar chart yang diplot di atas sistem koordinat polar
• Problem: panjang batang dapat salah diinterpretasi
Pengenalan Teknologi Informasi
15/11/2021 23
Penampilan Perubahan Terhadap Waktu (Showing over Times)
• Visualisasi menampilkan data dalam suatu periode waktu untuk menemukan trend atau perubahan terkait waktu
• Grafik/chart yang dapat digunakan:
• Line chart
• Area chart + stacked area chart
• Histogram
• Dll.
Showing over times: Line chart
• Line chart: menggunakan garis yang menghubungkan titik-titik data untuk menunjukkan perubahan terkait waktu atau interval nilai tertentu
Pengenalan Teknologi Informasi
15/11/2021 25
Showing over times:
Area Chart + Stacked Area Chart
• Area chart menggunakan
wilayah di bawah garis (seperti pada line chart) untuk
menyatakan data kuantitatif terkait waktu
• Stacked Area Chart terdiri atas beberapa area chart yang
bertumpuk satu di atas yang lain yang menandakan kategori yang berbeda
Penampilan Hierarki dan Hubungan Keseluruhan- Bagian (Whole-part relationship)
• Hierarki: Menampilkan bagaimana ranking atau urutan data atau objek dirangking
• Whole-part relationship: menunjukkan proporsi bagian-bagian pada suatu variabel dari keseluruhannya
• Grafik yang dapat digunakan:
• Pie chart
• Stacked bar chart
• Treemap
• Dll.
Pengenalan Teknologi Informasi
15/11/2021 27
Hierarchy + Whole Part Relationship:
Pie Chart
• Pie chart: menunjukkan proporsi/persentase dari kategori- kategori dalam suatu variable
Hierarchy + Whole Part Relationship:
Stacked Bar Chart
• Stacked bar chart: menampilkan bagian-bagian dari total nilai untuk suatu kategori dalam satu bar/batang
Pengenalan Teknologi Informasi
15/11/2021 29
Hierarchy + Whole Part Relationship:
TreeMap
• Treemap: menunjukkan struktur hierarki dari nilai kuantitatif melalui ukuran area
Plotting relationships
• Menunjukkan hubungan-hubungan antar data atau korelasi antara 2 variable atau lebih
• Grafik yang dapat digunakan:
• Scatter plot
• Bubble plot
• Heatmap
• Dll.
Pengenalan Teknologi Informasi
15/11/2021 31
Plotting Relationship: Scatter Plot
• Scatter plot terdiri atas titik-titik nilai yang dipetakan di atas koordinat x dan y yang merepresentasikan nilai dari 2 variable
• Dapat digunakan untuk menunjukkan korelasi antara kedua variabel
Plotting Relationship: Bubble plot
• Bubble plot adalah grafik multi-variable yang memplot nilai-nilai kuantitatif dalam bentuk lingkaran yang berbeda luasnya.
Pengenalan Teknologi Informasi
15/11/2021 33
Plotting Relationship: Heatmap
• Heatmap digunakan untuk memvisualisasikan data melalui berbagai variasi warna. Dalam bentuk tabular, heatmap dapat digunakan untuk memetakan data dari 2 variable atau lebih.
Chart in MS Excel
• MS Excel menyediakan berbagai jenis chart yang dapat digunakan untuk
mengkomunikasikan data secara grafis
• Chart dalam Excel tersedia secara secara default sebagai bagian dari menu Insert
Pengenalan Teknologi Informasi
15/11/2021 35
Contoh data-1
• Buka file data.csv dalam MS Excel
• Save sebagai file data.xlsx
• Create table bernama MyData
Bar chart (1)
• Buat vertical bar chart untuk menampilkan umur dari setiap orang
• Langkah:
• Select seluruh data pada kolom name dan kolom age
• Klik icon bar chart pada menu Insert
Charts
• Pilih style bar chart yang diinginkan
• Klik caption tabel untuk
menggantinya menjadi “Age of Person”
Pengenalan Teknologi Informasi
15/11/2021 37
Bar Chart (2)
• Tampilkan banyaknya anak
(num_children) dan banyaknya piaraan (num_pets) dalam 1 grafik vertical bar chart
• Langkah:
• Select kolom name, num_children, num_pets
• Klik icon bar chart pada menu Insert Charts
• Pilih style bar chart yang diinginkan
Horizontal Bar Chart
• Langkah:
• Select kolom name,
num_children, num_pets
• Klik icon bar chart pada menu Insert Charts
• Pilih horizontal bar chart dengan style yang diinginkan
Pengenalan Teknologi Informasi
15/11/2021 39
Histogram (1)
• Tampilkan distribusi orang berdasarkan kelompok umur: 0-20;
21-40; 41-60; 61-80; 81-100
• Menggunakan add-ins Analysis Toolpak (lihat materi kuliah sebelumnya untuk aktivasinya)
• Langkah:
1. Buat daftar nilai atas dalam histogram: 20, 40, 60, 80, 100, misalnya pada lokasi: I2:I5
2. Buka menu Data Data Analysis 3. Pilih analysis tool: Histogram
4. …
Histogram (2)
• Langkah:
4. Untuk Input Range, select lokasi seluruh data yang akan dibuat histogramnya, dalam hal ini sel: B2:B8
5. Untuk Bin Range, select lokasi data bin yang dibuat pada langkah 1, dalam hal ini misalnya: I1:I5
6. Untuk Output Range, klik posisi di mana perhitungan frekuensi untuk keperluan histogram dituliskan, misalnya pada kolom K3.
7. Check Chart Output.
8. Klik OK
Pengenalan Teknologi Informasi
15/11/2021 41
Pie Chart
• Tampilkan komposisi banyaknya orang berdasarkan negara
• Langkah:
• Hitung distribusi frekuensi (lihat bahan kuliah sebelumnya)
• Select daftar distribusi frekuensi
• Klik icon bar chart pada menu Insert Charts
• Pilih pie chart dengan style yang diinginkan
Stacked Bar Chart (1)
• Tampilkan data banyaknya data per jenis kelamin (gender) per negara bagian (state)
• Langkah:
1. Membuat tabel pivot:
Langkah:
a. Pilih menu Insert Pivot Table
b. Pada bagian Select a table or range, masukkan nama table atau range, misalnya dalam hal ini: MyData atau select A1:F8
c. Pada bagian Choose where you want the PivotTable report to be placed, letakkan sel pertama di mana tabel pivot akan diletakkan. Misalnya pilih Existing
Worksheet dengan Location pada H2
c. Pada box PivotTable Fields check kolom gender pada kotak Rows, drag kolom state pada kotak Columns, dan drag kolom name pada kolom Values
15/11/2021 Pengenalan Teknologi Informasi 43
Stacked Bar Chart (2)
• Langkah:
2. Select tabel pivot yang dihasilkan dari langkah sebelumnya
3. Pilih menu Insert Chart dan klik bar chart. Pilih stacked
column dengan style yang diinginkan.
Stacked Bar Chart (3)
• Tampilkan banyaknya anak
(num_children) dan banyaknya piaraan (num_pets) dalam 1 grafik stacked bar chart
• Langkah:
• Select column name, num_children, dan num_pets
• Pilih menu Insert Chart dan klik bar chart. Pilih stacked column dengan style yang diinginkan.
15/11/2021 Pengenalan Teknologi Informasi 45
Contoh Data-2: Time-series
• Buka file animal.csv dalam MS Excel
• Save sebagai file animal.xlsx
• Create table bernama AnimalData
Line Chart (1)
• Tampilkan pertumbuhan populasi beruang (Bears) dari tahun ke tahun dalam line chart
• Langkah:
1. Klik icon line chart pada menu Insert Charts.
Pilih style line chart 2D yang diinginkan.
2. Pada menu Design, pilih Select Data
3. Pada box Select Data Source yang muncul, untuk Chart data range, select kolom Bears pada tabel AnimalData. Pada bagian Legend entries (Series) akan muncul kolom Bears sebagai data yang ditampilkan di line chart 4. Untuk bagian Horizontal (Category) Axis
Labels, pilihlah seluruh nilai pada kolom Year (tanpa header)
5. Klik OK
Pengenalan Teknologi Informasi
15/11/2021 47
Line Chart (2)
• Tampilkan pertumbuhan populasi beruang (Bears), lumba-lumba
(Dolphins), dan ikan paus (Whales) dari tahun ke tahun dalam 1 line chart
• Langkah yang dilakukan sama spt.
pada slide sebelumnya, hanya pada langkah 3, pilih semua kolom Bears, Dolphins, dan Whales
• Setelah selesai membentuk chart, klik properties chart (icon +) dan klik
Legend untuk memunculkan data kategori yang dimunculkan
Area Chart
• Tampilkan pertumbuhan
populasi beruang (Bears) dari tahun ke tahun dalam area
chart
• Langkah:
1. Select kolom Year dan Bears 2. Klik Insert Chart
3. Pilih Area Chart
Pengenalan Teknologi Informasi
15/11/2021 49
Stacked Area Chart
• Tampilkan pertumbuhan populasi beruang (Bears),
lumba-lumba (Dolphins), dan ikan paus (Whales) dari tahun ke tahun dalam stacked area chart
• Seperti pada slide sebelumnya, hanya saja yang dipilih adalah seluruh tabel
Contoh Data-3: medali Asian Games
• Kembali ke contoh pada materi kuliah sebelumnya: file medali.csv atau
medali.xlsx
• Buka file medali.xlsx (atau dari medali.csv)
• Buat table MedalTable
15/11/2021 Pengenalan Teknologi Informasi 51
Scatter Plot
• Tampilkan relationship antara variable gold dan total dalam grafik scatter plot dan tunjukkan adanya korelasi positif
• Langkah:
1. Select kolom gold dan total 2. Pilih Insert Chart
3. Pilih All Charts Scatter, klik OK 4. Langkah tambahan: Klik
properties (icon +) untuk
menampilkan axis, lalu ubah title dan nama-nama sumbu
Bubble Plot (1)
• Tampilkan banyaknya total
medali (kolom total) dikaitkan dengan perolehan nilai medali
emas (kolom gold) pada sumbu x dan perolehan medali perak
(kolom silver) pada sumbu y dalam grafik bubble plot untuk 10 negara dengan rangking
tertinggi
• Bubble plot pada dasarnya menggunakan Scatter Plot
• Langkah:
1. Buat tabel terpisah untuk data 10 negara dengan rangking tertinggi dan perolehan total medali,
simpan misalnya di Sheet2
• Urutan kolom dari kiri ke kanan:
gold, silver, total
• Gold akan menjadi sumbu x, silver akan menjadi sumbu y, dan total akan menjadi ukuran bubble
2. Select seluruh data pada table 3. Pilih Insert Chart, pilih All
Chart Scatter Bubble 4. Klik OK
15/11/2021 Pengenalan Teknologi Informasi 53
Bubble Plot (2)
• Langkah tambahan:
• Select properties dari Chart untuk mengganti title,
menampilkan dan mengganti nama axis (sumbu)
• Change color dengan orange
Treemap
• Tampilkan perbandingan
perolehan total medali untuk 10 negara dengan rangking tertinggi
• Langkah:
• Buat tabel terpisah untuk data 10
negara dengan rangking tertinggi dan perolehan total medali
• Select tabel tersebut
• Pilih Insert Chart. Pilih TreeMap.
• Rename chart title dengan Top 10 2018 Asian Games
15/11/2021 Pengenalan Teknologi Informasi 55