PENDAHULUAN
Internet, adalah sebuah revolusi terhadap dunia komputer dan komunikasi yang tidak pernah terjadi sebelumnya. Penemuan telegram, telepon, komputer membuka jalan integrasi kemampuan yang luar biasa. Internet mampu menyiarkan sesuatu ke seluruh dunia, menyebarluaskan informasi, media untuk kolaborasi dan interaksi antara individu melalui komputer masing-masing tanpa dibatasi lokasi geografis. (Internet Society, 1997) Di Indonesia, merujuk data Badan Pusat Statistik dalam Statistik Telekomunikasi Indonesia 2017, pengguna internet menunjukkan grafik meningkat dari tahun ke tahun. Di tahun 2013 hanya terdapat 14,9% pengguna internet di Indonesia. Namun, di tahun 2017, terjadi peningkatan drastis, mencapai 32,34% pengguna internet. Lebih detail dapat dilihat pada Grafik 1.
Ini menjadikan sekarang begitu banyak data yang tersebar dari internet. Terlebih saat ini dalam Revolusi Industri 4.0 dimana komunikasi, sosial media dan beragam sensor mengaburkan batasan antara orang, internet dan dunia fisik nyata. Beragam tipe, kuantitas dan nilai data bisa dikumpulkan secara cepat: dari profil individu melalui laman Facebook atau Instagram menjadi data demografis, dari akun bank sampai catatan kesehatan menjadi profil pekerja, dan sebagainya.
Apa itu data? Apakah data merupakan suatu informasi? Bisakah data menjadi suatu pengetahuan? Dan masih banyak lagi pertanyaan dasar akan akan coba dibahas melalui materi pembelajaran kali ini. Pemahaman tentang data merupakan landasan penting untuk memahami sistem informasi manajemen.
Gambar 1
Grafik Pengguna Internet di Indonesia
Sumber: Badan Pusat Statistik, Statistik Telekomunikasi Indonesia 2017
DATA, INFORMASI DAN PENGETAHUAN
Kata “data” merupakan bentuk jamak darikata “datum” dalam bahasa Latin yang berarti
“(hal) yang diberikan”.
Kamus Besar Bahasa Indonesia
mendefinisikan data sebagai: (1) keterangan yang benar dan nyata; (2) keterangan atau bahan nyata yang dapat dijadikan dasar kajian (analisis atau kesimpulan); dan (3) informasi dalam bentuk yang dapat diproses oleh komputer, seperti representasi digital dari teks, angka, gambar, grafis atau suara. Kamus Cambridge, mendefinisikan data sebagai information, especially facts or numbers, collected to be examined and considered and used to help decision-making, or information in an electronic form that can be stored and used by a computer. [informasi, khususnya fakta atau angka, dikumpulkan untuk diperiksa dan
dipertimbangkan serta digunakan untuk membantu proses pengambilan keputusan, atau informasi dalam bentuk elektronik yang dapat disimpan dan digunakan oleh komputer].
Terkadang, pengertian data dan informasi menjadi tidak jelas. Akan tetapi secara umum data menjadi suatu informasi ketika ditinjau dalam suatu konteks atau setelah dianalisis. Dengan kata lain, data merupakan suatu konsep umum yang menunjukkan suatu fakta mengandung suatu informasi yang ditunjukkan atau dikodekan dalam suatu bentuk tertentu untuk mudah digunakan atau diproses lebih lanjut. Hasil proses dari data menjadi informasi ini kemudian menjadi suatu pengetahuan, yang diperoleh dari pengalaman langsung berdasarkan informasi tentang sesuatu.
Ini sejalan dengan pengertian yang disampaikan oleh Dr. Quentin L. Burrel dari Isle of Man International Businesss School, dikutip dari Zins (2007) yang menyatakan: Data are the basic individual items of numeric or other information, garnered through observation; but in themselves, without context, they are devoid of information. Information is that which is conveyed, and possibly amenable to analysis and interpretation, through data and the context in which the data are assembled. Knowledge is the general understanding and awareness garnered from accumulated information, tempered by experience, enabling new contexts to be envisaged.
[Data adalah suatu individual dasar numerik atau informasi lain, dikumpulkan melalui observasi tetapi berdiri sendiri tanpa konteks, sehingga
bukan menjadi suatu informasi. Informasi adalah apa yang disampaikan dan sangat mungkin untuk dianalisis dan ditafsirkan, melalui data dan konteks dimana data itu dirangkai. Pengetahuan
adalah pemahaman dan kesadaran umum yang diperoleh dari akumulasi informasi, tempaan pengalaman, dan memungkinkan untuk mempertimbangkan suatu konteks baru.]
Untuk lebih mempermudah pemahaman, Gambar 2 menunjukkan Model Data, Informasi dan Pengetahuan (Mutongi, D.C., 2016).
Gambar 2
Model Data, Informasi dan Pengetahuan
KUALITAS DATA
Mengingat data merupakan landasan awalyang akan membentuk informasi yang menjadi suatu pengetahuan, adalah sangat penting untuk diukur dan diperiksa agar data
yang diolah benar-benar berkualitas. Ada enam dimensi untuk mengukur dan memeriksa suatu kualitas data (DAMA UK Working Group, 2013), yaitu:
1. Kelengkapan (Completeness)
Data yang disimpan untuk diolah sudah lengkap 100%.
2. Keunikan (Uniqueness)
Data tidak akan direkam lebih dari satu kali berdasarkan pada hal tersebut telah ditetapkan.
3. Ketepatan Waktu (Timeliness)
Ukuran dimana data menggambarkan suatu kenyataan dari satu titik waktu yang diperlukan.
4. Keabsahan (Validity)
Data disebut sah jika sesuai dengan sintaks (format, tipe, rentang) yang telah didefinisikan sebelumnya.
5. Ketepatan (Accuracy)
Sejauh mana data itu benar-benar menggambarkan “dunia nyata” dari suatu obyek atau peristiwa yang dijelaskan. 6. Kekonsistensian (Consistency)
Tidak terdapat perbedaan ketika diperbandingkan dengan dua atau lebih pemahaman terhadap sesuatu definisi. Untuk lebih meyakinkan agar data yang diperoleh benar-benar berkualitas, beberapa pertanyaan dapat diujikan:
1. Kegunaan data - Apakah data dapat dimengerti, mudah, relevan, dapat diakses, dipelihara dan presisi sesuai ukurannya?
2. Masalah waktu - Apakah data bersifat stabil namun responsif jika terjadi perubahan yang sah?
3. Fleksibilitas data - Apakah data bisa diperbandingkan dan dicocokkan dengan data lain? Apakah data ada pengelompokkan atau klasifikasinya? Dapatkan data dipergunakan kembali dan mudah untuk diolah?
4. Keyakinan dalam data - Apakah tata kelola data, perlindungan data dan
keamanan data berlaku? Bagaimana dengan reputasi data, apakah terverifikasi atau dapat diverifikasi? 5. Nilai data - Apakah ada manfaat baik dari
data? Apakah bisa dioptimalkan
penggunaannya? Apakah bisa
membahayakan keamanan atau privasi orang atau tanggung jawab hukum perusahaan? Apakah data ini mendukung atau bertentangan terhadap citra atau kesan perusahaan?
Selain itu, kualitas data dapat ditentukan dengan mengacu pada kategori dan dimensi berikut ini (Rusdiana, H.A. dan Irfan, Moch., 2018): 1. Kategori I - Instrinsic a. Accuracy (Akurasi) b. Objectivity (Obyektivitas) c. Believability (Keterpercayaan) d. Reputation (Reputasi) 2. Kategori II - Accessibility
a. Accessibility (Mudah Diakses) b. Security (Aman)
3. Kategori III - Contextual a. Relevancy (Kesesuaian) b. Value-added (Nilai tambah) c. Timeliness (Ketepatan waktu) d. Completeness (Kelengkapan)
e. Amount of info (Jumlah informasi yang diperoleh)
4. Kategori IV - Representational
a. Interpretability (Dapat dimengerti) b. Ease of understanding (Mudah
dimengerti)
c. Concise representation (Gambaran yang padat)
d. Consistent representation (Gambaran yang konsisten)
KLASIFIKASI DATA
Data dapat diklasifikasikan menjadi beberapakelompok, yaitu: 1. Menurut Jenis Data
a. Data hitung (enumeration/counting data) adalah hasil perhitungan atau jumlah tertentu.
b. Data ukur (measeurement data) adalah data yang menunjukkan ukuran mengenai nilai sesuatu. 2. Menurut Sifat Data
a. Data Kuantitatif (quantitative data) adalah data dalam bentuk angka. b. Data Kualitatif (qualitative data)
adalah data bukan dalam bentuk penjumlahan atau angka
3. Menurut Sumber Data
a. Data Internal (internal data) adalah data yang berasal dari dalam organisasi atau data asli, hasil observasi yang dilakukan sendiri, bukan dari hasil observasi orang lain. b. Data Eksternal (eksternal data)
adalah data yang berasal dari luar organisasi atau data hasil observasi orang lain.
• Data Eksternal Primer (primary external data) merupakan data dalam bentuk lisan atau tulisan dari pemilik data sendiri atau orang yang melakukan observasi atau pengumpul data tersebut, biasa juga disebut dirctly external data.
• Data Eksternal Sekunder (secondary external data) merupakan data yang diperoleh dari orang yang tidak melakukan observasi langsung, biasa juga disebut indirectly external data. 4. Menurut Cara Memperolehnya
a. Data Primer adalah data yang dikumpulkan langsung oleh peneliti
atau diperoleh dari sumber pertama dan datanya belum diolah.
b. Data Sekunder adalah data yang diperoleh dari pihak kedua yang mengumpulkan data tersebut. Biasanya data telah diolah dan diatur
sedemikian rupa oleh
pengumpulnya.
5. Menurut Cakupan Pengumpulannya a. Data sensus yaitu data yang
diperoleh dari populasi.
b. Data sampel yaitu data yang diperoleh dari sampel.
6. Menurut Waktu Pengumpulannya
a. Data Cross Section (Insidentil), yaitu data yang dikumpulkan hanya pada waktu-waktu tertentu saja untuk mengetahui keadaan pada waktu tersebut. Misalnya; data penelitian dengan kuesioner.
b. Data Time series (Berkala), yaitu data yang dikumpulkan secara berkala dari waktu ke waktu untuk mengetahui perkembangan suatu kejadian pada periode tertentu. Misalnya; data harga sembako. 7. Menurut Dinamika Data
a. Data Statis yaitu data yang dalam jangka waktu lama tidak akan mengalami perubahan.
b. Data Semi Dinamis yaitu data yang
dalam waktu kemungkinan
mengalami perubahan.
c. Data Dinamis yaitu data yang menurut waktu akan mengalami perubahan.
8. Menurut Skala Pengukurannya
a. Data nominal yaitu data yang diberikan pada obyek atau kategori
yang tidak menggambarkan
kedudukan obyek atau kategori tersebut terhadap obyek atau kategori lainnya. Biasanya digunakan
sebagai kode. Hanya
mengelompokkan kategori
berdasarkan kelompok tertentu. Ciri data ini yaitu (a) kategori data bersifat lepas (satu obyek hanya masuk pada satu kelompok saja); (b) kategori data tidak disusun secara logis. Misalnya, jenis kelamin: 1 untuk pria dan 0 untuk wanita.
b. Data ordinal merupakan data yang penomoran objek atau kategorinya disusun menurut besarnya, dari tingkat terendah ke tingkat tertinggi atau sebaliknya, jarak/rentang data tidak harus sama. Ciri dari jenis data ini adalah kategori data dapat disusun berdasarkan urutan logis dan sesuai dengan besarnya karakteristik yang dimiliki. Selebihnya memiliki ciri yang sama dengan data nominal. Misalnya, pengelompokkan nilai angka menjadi nilai huruf.
c. Data interval merupakan data dimana obyek/ ategori dapat diurutkan berdasarkan suatu atribut yang memberikan informasi tentang interval antara tiap obyek/kategori sama. Besar interval dapat di tambah atau dikurangi. Ciri dari jenis data ini sama dengan data ordinal, tetapi urutan kategori data mempunyai jarak yang sama. Misalnya, ABCDE=12345
d. Data rasio memiliki sifat-sifat data nominal, data ordinal dan data interval, dilengkapi dengan titik nol absolut. Karena terdapat angka nol maka pada data ini dapat dibuat perkalian atau pembagian. Angka pada data menunjukkan nilai yang sebenarnya dari objek/kategori yang diukur. Misalnya, si A=50 dan si B=100 maka rasio si B adalah 2 kali si A.
MAHADATA (
BIG DATA
)
Pada awalnya, kata “big data” pertama kali muncul dalam laporan peneliti NASA di tahun 1997 yang menggambarkan tentang masalah visualisasi komputer grafis dimana diungkapkan:
“provides an interesting challenge for computer
systems: data sets are generally quite large, taxing the capacities of main memory, local disk, and even remote disk. We call this the problem of big data. When data sets do not fit in main memory (in core), or when they do not fit even on local disk, the most common solution is to acquire
more resources.”
[“memberikan tantangan yang menarik untuk
sistem komputer: kumpulan data umumnya cukup besar, membebani kapasitas memori utama, penyimpanan lokal, dan bahkan penyimpanan jarak jauh. Kami menyebut ini sebaga masalah mahadata. Dimana sekumpulan data tidak muat
dalam memori utama di inti komputer atau bahkan data tersebut tidak muat di diska lokal, sehingga solusi umum adalah menambah
kapasitas sumber daya”] (Press, 2014)
McKinsey Global Institute Report 2011, mendefinisikan mahadata sebagai kumpulan data yang ukurannya di luar kemampuan perangkat lunak basis data untuk menangkap, menyimpan, mengelola dan menganalisis. Ini menjadi kunci utama dalam kompetisi yang menopang gelombang baru pertumbuhan produktivitas, inovasi dan kelebihan konsumen.
Meskipun hingga hari ini para ahli masih mendefinisikan pengertian mahadata, tetapi satu hal yang pasti bahwa setiap hari ada jutaan transaksi, surat elektronik, foto, berkas, video, posting dan permintaan pencarian
diketikan yang berarti ada zettabytes data. Dengan demikian, mahadata secara umum memiliki 4 karakteristik, yaitu:
1. Volume (Volume)
Jumlah data yang dihasilkan dan disimpan. Ukuran data menentukan nilai dan potensi pengetahuan, dan ini dapat dipertimbangkan apakan sebagai mahadata atau tidak.
2. Variety (Variasi)
Terkait dengan jenis dan sifat data. Ini membantu dalam menganalisis secara efektif menggunakan data yang ada. Penggabungan data melalui teks, gambar, audio, atau video dapat melengkapi data yang hilang.
3. Velocity (Kecepatan)
Dalam konteks ini, kecepatan dimana data tersebut dihasilkan dan diproses akan memenuhi tuntutan dan tantangan yang ada dalam kaitannya dengan pertumbuhan dan pembangunan.
4. Veracity (Kebenaran)
Ini merupakan perluasan definisi dalam mahadata yang mengacu pada nilai dan kualitas data. Ketika kualitas data yang diperoleh semakin besar dan bervariasi akan berdampak pada ketepatan analisis. Akan tetapi, mengekstraksi pengetahuan yang penting dan berharga dari banyaknya data lebih sulit daripada mengatakannya. Ada begitu banyak data yang dihasilkan setiap hari, memperbesar basis data secara besar-besaran sehingga menjadi sulit untuk mengambil, membentuk, menyimpan, mengelola, membagi, menganalisis dan memvisualisasikan pengetahuan yang penting dan berarti dari data. Inilah mengapa pengetahuan tentang cara menyimpulkan informasi berharga dari kumpulan mahadata menjadi bidang pengetahuan yang menarik.
MENGENAL UKURAN BYTE
Istilah byte diciptakan oleh Warner Buchholz pada bulan Juni 1956 ketika awal mendesain komputer IBM Stretch. Asal kata byte merujuk pada grup bit terkecil, biasanya 4 bit. Komputer awal biasa menggunakan ukuran 4 bit Binary-Coded Decimal (BCD) untuk tampilan dan 6 bit untuk pencetakan grafis. Ini kemudian berkembang menjadi 7 bit di tahun 1963 yang biasa dikenal dengan American Standard Code for Information Interchange (ASCII). Dalam perkembangan mikroprosesor di tahun 1970, Intel mempopulerkan 8 bit untuk mikroprosesor komputer personal. Simbol yang digunakan menurut IEC 80000-13, IEEE 1541 dan Metric Interchange Format adalah
“B”. Akan tetapi International System of Quantities (ISQ) menggunakan simbol “B” sebagai simbol
bel, menggambarkan unit algoritma rasio daya yang dikembangkan oleh Alexander Graham Bell. Ambigu juga terjadi dalam penggunaan singkatan kilo (k atau K), mega (M) dan giga (G). Di beberapa bidang industri perangkat lunak dan keras komputer, awalan biner digunakan untuk byte dan bit yang secara arsitektur diukur dalam kelipatan 2, sementara produsen perangkat penyimpanan mempraktikkan kepatuhan terhadap kelipatan SI desimal. Misalnya kapasitas disk drive sebesar 100 gigabyte ditentukan ketika disk berisi 100 miliar byte (93 gigabit) ruang penyimpanan.
Awalan Kelipatan untuk bit atau byte (B) Desimal Value SI 1000 103 k kilo 10002 106 M mega 10003 109 G giga 10004 1012 T tera 10005 1015 P peta 10006 1018 E exa 10007 1021 Z zetta 100008 1024 Y yotta Binary
Value IEC JEDEC
1024 210 Ki kibi K kilo 10242 220 Mi mebi M mega 10243 230 Gi gibi G giga 10244 240 Ti tebi - - 10245 250 Pi pebi - - 10246 260 Ei exbi - - 10247 270 Zi zebi - - 10248 280 Yi yobi - -
Sumber bacaan: https://en.wikipedia.org/wiki/Byte
DAFTAR BACAAN
Badan Pusat Statistik. Statistik Telekomunikasi Indonesia 2017. Badan Pusat Statistik. ISSN: 2476-9134
DAMA UK Working Group. The Six Primary Dimensions for Data Quality Assessment. Whitepaper by the DAMA UK Working Group on Data Quality Dimensions. Oktober 2013.
https://dictionary.cambridge.org/dictionary/english/data diakses 15 September 2019, 23:28 WITA https://kbbi.kemdikbud.go.id/entri/data diakses 15 September 2019, 23:14 WITA
https://www.maxmanroe.com/vid/teknologi/pengertian-data.html
Internet Society (1997). Brief History of the Internet. htps://www.internetsociety.org/internet/ history-internet/brief-history-internet diakses 15 September 2019, 19:33 WITA
McKinsey Global Institute. Big data: The next frontier for innovation, competition, and productivity. Mei 2011. McKinsey & Company
Mutongi, D.C. (2016). Revisiting Data , Information , Knowledge and Wisdom ( DIKW ) Model and Introducing the Green Leaf Model. https://pdfs.semanticscholar.org/14b9/04f0e28b26eaa214 fe086f0df90ce502ae53.pdf?_ga=2.251080518.1522744971.1568564136-1854573633.1568564 136 diakses 16 September 2019, 01:46 WITA
Press, Gil. 12 Big Data Definitions: What’s Yours?. 3 September 2014, 08:01. https://www.forbes. com/sites/gilpress/2014/09/03/12-big-data-definitions-whats-yours/#23f46cf913ae diakses 16 September 2019, 03:26 WITA
Rusdiana, H.A. dan Irfan, Moch. (2018) Sistem Informasi Manajemen. Bandung: Pustaka Setia. ISBN 978-979-076-421-7
Zins, Chaim (2007). What is the meaning of "data", "information", and "knowledge"?.
https://pdfs.semanticscholar.org/d04c/f02cf43bfb27245e2ec8b3c0b0fcf48837da.pdf diakses 16 September 2019, 00:21 WITA