Data, Database, Big Data
Apa itu Database ?
Database adalah kumpulan data yang disimpan dengan sistem
tertentu, dan saling berhubungan, sehingga dapat dikelola dengan mudah.
Database penting untuk mengatur data yang jumlahnya banyak, dan selalu bertambah. Sebagai contoh, program website, aplikasi, dan lainnya.
Terdapat 5 Komponen database:
1. Data file-file yang berisi informasi, baik teks, log, gambar, dan lainnya.
2. Hardwareperangkat keras yang digunakan untuk menyimpan dan mengelola data.
3. Sistem Operasibertanggung jawab atas semua sistem yang ada di komputer atau server.
4. Database Management System (DBMS)aplikasi pengelolaan database. Dengan DBMS, Anda bisa lebih mudah ketika menginput dan mengupdate data. (MySQL)
5. Database Access Languageahasa yang digunakan untuk menulis perintah, seperti mengakses, menambah, memperbarui, dan menghapus data di dalam database.
Alfian Dharma Kusuma, Intern Junior Content Writer di Dicoding Naning Nur Wijayanti .
Strutur dari data
Fungsi Database
1. Mempercepat dan Mempermudah Identifikasi Data 2. Mengontrol Data Secara Terpusat
3. Menghindari Duplikasi Data
4. Menyimpan Data dengan Lebih Aman 5. Menghemat Biaya
6. Dapat Diakses Multi-User
Tipe atau jenis Database
1. Operational Database database OLTP (On Line Transaction
Processing) adalah jenis database yang dapat mengelola data dinamis secara real-time. Contoh Operational Database: Microsoft SQL Server, AWS Dynamo, Apache Cassandra, dan MongoDB.
2. Relational Database
Relational Database data disimpan dalam beberapa tabel yang saling terkait atau berhubungan (membentuk relasi).
Relational database juga memiliki empat sifat yang dikenal sebagai ACID, yaitu:
Atomicity – Memastikan data sukses
dioperasikan atau tidak sama sekali. Jadi, jika satu data gagal dioperasikan, maka semua data juga akan gagal.
Consistency – Data dapat dikembalikan
dalam keadaan sebelumnya, jika proses data gagal.
Isolation – Data yang sedang diproses akan terisolasi dari proses-proses lainnya.
Durability – Memastikan data tersimpan di dalam sistem dan tetap aman, bahkan dalam keadaan restart system
Memerlukan RDBMS atau Relational Database Management System
Contoh Relational Database:
MySQL, PostgreSQL, MongoDB,
MariaDB, Oracle Database, IBM DB2, SAP HANA, MemSQL, Interbase, dan Firebird.
3. Distributed Database
Merupakan sistem penyimpanan yang terdistribusi yang terdiri dari dua berkas atau lebih serta terletak di situs yang berbeda, baik di jaringan yang sama maupun di jaringan yang berbeda sama sekali
Artinya, data disimpan dalam beberapa komputer di tempat yang sama dan dihubungkan melalui jaringan.
4. Analytical Database
Analytical database merupakan d atabase yang dapat menyimpan dan mengelola big data, termasuk bisnis, pasar, dan data pelanggan untuk analisis business
intelligence (BI).
Terdiri dari data dan informasi
yang diringkas agar mudah untuk dibaca.
Selain itu dioptimalkan secara khusus untuk
skalabilitas dan query yang lebih cepat.
Database tipe ini sangat
dibutuhkan oleh organisasi
manajemen dan pengguna-
pengguna lainnya.
5. Database Warehouse
Database warehouse adalah sistem
database yang sering kali digunakan untuk pelaporan dan analisis data.
Database warehouse dapat menyimpan data dari sumber yang berbeda-beda dan dapat diupload dari sistem operasi. Itu mengapa dinamakan warehouse atau
“gudang”.
Bidang business intelligence menggunakan database ini sebagai pusat data sebelum diolah.
Contoh Database Warehouse: Microsoft Access (Office), Oracle.
Data Warehouse
Data warehouse (DW) memiliki tujuan untuk menyimpan data dari waktu ke waktu. Data yang tersimpan merupakan database operasional.
Basis data pada warehouse bisa
menjadi sumber utama dalam mencari informasi yang telah diperiksa, diubah, dan terintegrasi.
Basis data ini biasanya digunakan oleh para manajer dan end-user lainnya yang memiliki izin untuk mengaksesnya.
6. End-User Database
End-User Database artinya semua data dapat diakses, dikelola, dan dikembangkan oleh pengguna.
Pengguna akhir yang berhubungan langsung dengan database inilah yang disebut end-user database.
Data yang sudah berinteraksi
dengan end-user biasanya data siap pakai. Artinya, data bisa dibaca oleh manusia, sudah bukan berupa data pemrograman lagi. Misalnya,
spreadsheet, dokumen, dan lainnya.
Contoh End-User Database: SQLite
7. Cloud Database
Cloud database merupakan sistem yang menyimpan data secara virtual, bukan disimpan dalam server fisik.
pemeliharaannya pun tidak serumit server fisik, karena database dapat dijalankan melalui cloud computing platform.
Contoh Cloud Database: Amazon Web Service (AWS), Oracle Database, Microsoft Azure, Google Cloud Platform, IBM DB2, MongoDB Atlas, OpenStack.
8. Real-Time Database
Real-time database adalah model data yang sistem pengolahannya dibuat guna menangani beban kerja suatu lembaga besar seperti negara.
Real-time database biasa digunakan oleh lembaga akuntansi, hukum, perbankan, multimedia, analisis data ilmiah, serta catatan medis.
Pengolahan data tersebut bisa berubah-ubah sesuai dengan permintaan dan bersifat terus- menerus. Seperti berubahnya harga mata uang dollar yang berubah setiap menit. Di balik itu
semua, terdapat basis data real-time yang bekerja dengan cepat.
Pengantar Big Data
Big Data “meledak” di awal dekade abad 21
Perusahaan online dan startup, misalnya Google, Amazon, eBay, LinkedIn, Facebook, dibangun dari data yang besar
Data yang sangat besar dapat memengaruhi banyak hal, di berbagai bidang: medis,
industri, ekonomi dan perbankan, dll
Perkembangan Data
Apa itu Big Data?
Big Data mirip dengan ‘small data’, namun jauh lebih besar ukurannya
banyak perdebatan tentang apa itu Big Data
Dengan data sangat besar perlu pendekatan berbeda Teknik, alat bantu, arsitektur
Tujuan: menyelesaikan masalah baru atau masalah lama dengan cara lebih baik
Big Data memberikan nilai dari penyimpanan dan pemrosesan dari kuantitas sangat besar yang tidak bisa dianalisis dengan teknik komputasi tradisional
• Walmart menangani > 1 juta transaksi dari customer tiap jam
• Facebook menangani 40 miliar foto dari user base
• Decoding genome , awalnya memerlukan pemrosesan selama 10 tahun sekarang 1 minggu
•
Gambaran Umum Big Data
• McKinsey Global (2011)
Big Data dapat didefinisikan dengan data yang memiliki skala (volume), distribusi (velocity), keragaman (variety) yang sangat besar, dan atau abadi, sehingga membutuhkan penggunaan arsitektur teknikal dan
metode analitis yang inovatif untuk mendapatkan wawasan yang dapat memberikan nilai bisnis baru (informasi yang bermakna).
• Hurwitz, et al. (2013)
Big data merupakan istilah untuk sekumpulan data yang begitu besar atau kompleks dimana tidak bisa ditangani lagi dengan sistem teknologi komputer konvensional
• Kapan suatu data dapat dikatakan sebagai “Big Data”?
5 V Pad a
BigDat a
3V (Awal)
5 V (Sekarang)
• Veracity
• Value
• Volume
• Velocity
• Variety
5 V Pada Big Data: Volume (1)
•• Facebook menghasilkan 10TB data baru setiap hari, Twitter 7TB
Sebuah Boeing 737 menghasilkan 240 terabyte data penerbangan selama penerbangan dari satu wilayah bagian AS ke wilayah yang lain
Microsof kini memiliki satu juta server, kurang dari Google, tetapi lebih dari Amazon, kata Ballmer (2013).
•
• Catatan: Kita dapat menggunakan semua data ini untuk memberitahu
kita sesuatu, jika kita mengetahui pertanyaan yang tepat untuk bertanya.
Bentuk infrastruktur data center Google Cloud Platform
5 V Pada Big Data:
Volume (2)
Traditional Approach Big Data Approach
Analyzed information
All available information analyzed
All available information
Analyze all data Analyze small
subsets of data
5 V Pada Big Data:
Velocity
• Kecepatan data yang masuk (per jam, per detik, etc). Clickstreams (web
log) dan transfer data asynchronous yang dapat menangkap apa saja
yang dilakukan oleh jutaan atau lebih pengguna yang lakukan saat ini.
Traditional Approach Big Data Approach
Data
Hypothesis Question Exploration
Data
Answer Insight Correlation
Explore all data and Start with hypothesis and test
against selected data identify correlations