• menjelaskan perbedaan antara data, informasi, dan pengetahuan;
• mendefinisikan data mining dan menjelaskan perannya dalam sebuah organisasi.
Tanpa data, perangkat keras dan perangkat lunak tidak akan berguna! Data merupakan komponen ketiga dari suatu sistem informasi.
Setelah berhasil menyelesaikan bab ini, Anda akan dapat:
menjelaskan karakteristik gudang data; Dan
Namun, kedua komponen tersebut tidak membuat komputer berguna. Bayangkan jika Anda menyalakan komputer, memulai pengolah kata, namun tidak dapat menyimpan dokumen. Bayangkan jika Anda membuka pemutar musik tetapi tidak ada musik yang diputar. Bayangkan membuka browser web tetapi tidak ada halaman web.
• menjelaskan peran sistem manajemen basis data; •
Data bisa bersifat kuantitatif atau kualitatif. Data kuantitatif bersifat numerik, hasil suatu pengukuran, hitungan, atau perhitungan matematis lainnya. Data kualitatif bersifat deskriptif. “Ruby Red”, warna Ford Focus 2013, adalah contoh data kualitatif. Suatu angka juga bisa bersifat kualitatif: kalau saya bilang angka favorit saya adalah 5, itu adalah data kualitatif karena bersifat deskriptif, bukan hasil pengukuran atau perhitungan matematis.
Anda telah diperkenalkan dengan dua komponen pertama sistem informasi: perangkat keras dan perangkat lunak.
Data adalah potongan-potongan informasi mentah tanpa konteks. Jika saya memberi tahu Anda, “15, 23, 14, 85,” Anda tidak akan belajar apa pun. Tapi saya akan memberi Anda data.
• mendefinisikan istilah database dan mengidentifikasi langkah-langkah untuk membuatnya;
Data saja tidak begitu berguna. Agar bermanfaat, perlu diberikan konteks.
Kembali ke contoh di atas, jika saya memberi tahu Anda bahwa “15, 23, 14, dan 85ÿ adalah jumlah siswa yang mendaftar untuk kelas yang akan datang, itu bisa menjadi informasi. Dengan menambahkan konteks – bahwa angka-angka tersebut mewakili
jumlah siswa yang mendaftar untuk kelas tertentu – saya telah mengubah data menjadi informasi.
Langkah terakhir menaiki tangga informasi adalah langkah dari pengetahuan (mengetahui banyak tentang suatu topik) menuju kebijaksanaan. Seseorang dapat dikatakan memiliki
kebijaksanaan ketika ia dapat menggabungkan pengetahuan dan pengalamannya untuk menghasilkan pemahaman yang lebih mendalam terhadap suatu topik. Seringkali dibutuhkan waktu bertahun-tahun untuk mengembangkan kebijaksanaan mengenai topik tertentu, dan membutuhkan kesabaran.
Tujuan dari banyak sistem informasi adalah mengubah data menjadi informasi untuk menghasilkan pengetahuan yang dapat digunakan untuk pengambilan keputusan. Untuk melakukan hal ini, sistem harus mampu mengambil data, memasukkan data ke dalam konteks, dan menyediakan alat untuk agregasi dan analisis. Basis data dirancang hanya untuk tujuan seperti itu.
Basis data dapat diatur dalam berbagai cara, dan dengan demikian mempunyai banyak bentuk. Bentuk database yang paling populer saat ini adalah database relasional. Contoh populer dari database relasional adalah Microsoft Access, MySQL, dan Oracle. Database relasional adalah database yang datanya disusun menjadi satu atau lebih tabel. Setiap tabel memiliki sekumpulan bidang, yang menentukan sifat data yang disimpan dalam tabel.
Catatan adalah salah satu contoh dari sekumpulan bidang dalam tabel. Untuk memvisualisasikannya, anggaplah catatan sebagai baris tabel dan bidang sebagai kolom tabel. Pada contoh di bawah, kita memiliki tabel informasi siswa, dengan setiap baris mewakili siswa dan setiap kolom mewakili satu informasi tentang siswa.
Setelah kami memasukkan data ke dalam konteks, mengumpulkan dan menganalisisnya, kami dapat menggunakannya untuk mengambil keputusan bagi organisasi kami. Kita dapat mengatakan bahwa konsumsi informasi menghasilkan pengetahuan. Pengetahuan ini dapat digunakan untuk mengambil keputusan, menetapkan kebijakan, dan bahkan memicu inovasi.
Basis Data Relasional
Hampir semua program perangkat lunak memerlukan data untuk melakukan sesuatu yang berguna. Misalnya saja Anda sedang mengedit suatu dokumen di pengolah kata seperti Microsoft Word, maka dokumen yang sedang Anda kerjakan adalah datanya. Perangkat lunak pengolah kata dapat
memanipulasi data: membuat dokumen baru, menggandakan dokumen, atau memodifikasi dokumen. Beberapa contoh data lainnya adalah: file musik MP3, file video, spreadsheet, halaman web, dan e-book. Dalam beberapa kasus, misalnya dengan e-book, Anda mungkin hanya memiliki kemampuan untuk membaca datanya.
database, semua data dijelaskan dan dikaitkan dengan data lain. Semua informasi dalam database juga harus terkait; database terpisah harus dibuat untuk mengelola informasi yang tidak terkait. Misalnya, database yang berisi informasi tentang pelajar tidak boleh juga menyimpan informasi tentang harga saham perusahaan. Basis data tidak selalu berbentuk digital – lemari arsip, misalnya, mungkin dianggap sebagai bentuk basis data.
Untuk keperluan teks ini, kami hanya akan mempertimbangkan database digital.
Basis data adalah kumpulan informasi terkait yang terorganisir. Ini adalah koleksi yang terorganisir, karena dalam a
URL Saylor: http://www.saylor.org/courses/bus206 Dikaitkan kepada: David T. Bourgeois, Ph.D.
saylor.org
40 Sistem Informasi untuk Bisnis dan Selebihnya
Contoh Data
Basis Data
Baris dan kolom dalam sebuah tabel
Misalkan sebuah universitas ingin membuat sistem informasi untuk melacak partisipasi dalam klub mahasiswa. Setelah mewawancarai beberapa orang, tim desain mengetahui bahwa tujuan penerapan sistem ini adalah untuk memberikan wawasan yang lebih baik tentang cara universitas mendanai klub. Hal ini dapat dicapai dengan melacak berapa banyak anggota yang dimiliki setiap klub dan seberapa aktif klub tersebut. Dari sini, tim memutuskan bahwa sistem harus melacak klub, anggotanya, dan acara mereka. Dengan menggunakan informasi ini, tim desain menentukan bahwa tabel berikut perlu dibuat:
pengidentifikasi unik untuk setiap catatan dalam tabel. Misalnya, dalam tabel Siswa, nama belakang siswa dapat digunakan sebagai cara untuk mengidentifikasi mereka secara unik. Namun, kemungkinan besar beberapa siswa akan memiliki nama belakang yang sama (seperti Rodriguez, Smith, atau Lee), sehingga bidang yang berbeda harus dipilih. Alamat email siswa mungkin merupakan pilihan yang baik untuk kunci utama, karena alamat email bersifat unik.
bergabung dengan banyak klub.
Untuk membuat hubungan ini dengan benar, kunci utama harus dipilih untuk setiap tabel. Kunci ini adalah
• Keanggotaan: tabel ini akan menghubungkan siswa dengan klub, sehingga memungkinkan kita untuk memiliki siswa tertentu
meja siswa. Yang terakhir, karena ini adalah database relasional, setiap tabel harus memiliki field yang sama dengan setidaknya satu tabel lainnya (dengan kata lain: tabel tersebut harus memiliki hubungan satu sama lain).
Dalam database relasional, semua tabel dihubungkan oleh satu atau lebih field, sehingga memungkinkan untuk menghubungkan semua tabel dalam database melalui field yang sama yang mereka miliki. Untuk setiap tabel, salah satu bidang diidentifikasi sebagai kunci utama. Kunci ini adalah pengidentifikasi unik untuk setiap record dalam tabel. Untuk membantu Anda memahami istilah-istilah ini lebih jauh, mari kita telusuri proses perancangan database.
• Siswa: nama siswa, email, dan tahun lahir.
Solusi kami adalah menciptakan nilai untuk setiap siswa — ID pengguna — yang akan bertindak sebagai kunci utama. Kami juga akan melakukan ini untuk masing-masing klub mahasiswa. Solusi ini cukup umum dan menjadi alasan Anda memiliki begitu banyak ID pengguna!
Sekarang tim desain telah menentukan tabel mana yang akan dibuat, mereka perlu menentukan informasi spesifik yang akan disimpan oleh setiap tabel. Ini memerlukan identifikasi bidang yang akan ada di setiap tabel. Misalnya, Nama Klub akan menjadi salah satu bidang di tabel Klub. Nama Depan dan Nama Belakang akan menjadi kolom di
Namun, kunci utama tidak dapat diubah, jadi ini berarti bahwa jika siswa mengubah alamat email mereka, kami harus menghapusnya dari database dan memasukkannya kembali – bukan sebuah proposisi yang menarik.
• Klub: ini akan melacak nama klub, presiden klub, dan deskripsi singkat tentang klub.
• Acara: tabel ini akan melacak kapan klub bertemu dan berapa banyak siswa yang hadir.
saylor.org URL Saylor: http://www.saylor.org/courses/bus206
Dikaitkan kepada: David T. Bourgeois, Ph.D.
Bab.4: Data 41
Merancang Basis Data
Anda dapat melihat desain akhir database pada gambar di bawah ini:
Dengan desain ini, kami tidak hanya memiliki cara untuk mengatur semua informasi yang kami perlukan untuk
memenuhi persyaratan, namun kami juga berhasil menghubungkan semua tabel bersama-sama. Berikut tampilan tabel database dengan beberapa contoh data. Perhatikan bahwa tabel Keanggotaan mempunyai tujuan tunggal untuk memungkinkan kami menghubungkan beberapa siswa ke beberapa klub.
Diagram database Klub Mahasiswa
42 Sistem Informasi untuk Bisnis dan Lainnya
URL Saylor: http://www.saylor.org/courses/bus206 Dikaitkan kepada: David T. Bourgeois, Ph.D.
saylor.org
Tipe Data Normalisasi
Dalam desain ini, ketika seorang siswa bergabung dengan klub pertamanya, pertama-tama kita harus menambahkan siswa tersebut ke tabel Siswa, di mana nama depan, nama belakang, alamat email, dan tahun lahirnya dimasukkan. Penambahan tabel Siswa ini akan menghasilkan ID siswa. Sekarang kami akan menambahkan entri baru untuk menunjukkan bahwa siswa tersebut adalah anggota klub tertentu. Hal ini dicapai dengan menambahkan catatan dengan ID pelajar dan ID klub di tabel Keanggotaan. Jika siswa ini bergabung dengan klub kedua, kami tidak perlu menduplikasi entri nama, email, dan tahun lahir siswa tersebut; sebagai gantinya, kita hanya perlu membuat entri lain di tabel Keanggotaan dari ID klub kedua dan ID pelajar.
atau “Salah” dan angka 1 untuk “Ya” atau “Benar”.
• Teks: untuk menyimpan data non-numerik yang singkat, umumnya kurang dari 256 karakter. Data
• Ya/Tidak: bentuk khusus dari tipe data angka yang (biasanya) panjangnya satu byte, dengan angka 0 untuk “Tidak”
Dalam desain database Klub Mahasiswa, tim desain bekerja untuk mencapai tujuan ini. Misalnya, untuk melacak keanggotaan, solusi sederhana mungkin adalah dengan membuat kolom Anggota di tabel Klub dan kemudian mencantumkan nama semua anggota di sana. Namun, desain ini berarti bahwa jika seorang siswa bergabung dengan dua klub, maka informasinya harus dimasukkan
untuk kedua kalinya. Sebaliknya, para desainer memecahkan masalah ini dengan menggunakan dua tabel: Siswa dan Keanggotaan.
dan dua tempat desimal.
Saat mendefinisikan field dalam tabel database, kita harus memberikan tipe data pada setiap field. Misal field Birth Year adalah tahun, maka berupa angka, sedangkan First Name berupa teks. Kebanyakan database modern memungkinkan penyimpanan beberapa tipe data berbeda. Beberapa tipe data yang lebih umum tercantum di sini:
tergantung pada seberapa besar angka terbesarnya.
Saat mendesain database, salah satu konsep penting yang harus dipahami adalah normalisasi. Secara sederhana, menormalkan database berarti mendesainnya sedemikian rupa sehingga: 1) mengurangi duplikasi data antar tabel dan 2) memberikan fleksibilitas sebanyak mungkin pada tabel.
Mata Uang: bentuk khusus dari tipe data angka yang memformat semua nilai dengan indikator mata uang
• Nomor: untuk menyimpan nomor. Biasanya ada beberapa jenis angka berbeda yang dapat dipilih,
• Tanggal/Waktu : bentuk khusus dari tipe data angka yang dapat diartikan sebagai angka atau waktu. •
Perancangan database Klub Mahasiswa juga memudahkan perubahan desain tanpa modifikasi besar pada struktur yang ada. Misalnya, jika tim desain diminta menambahkan fungsionalitas ke sistem untuk melacak penasihat fakultas di klub, kita dapat dengan mudah melakukannya dengan menambahkan tabel Penasihat Fakultas (mirip dengan tabel Siswa) dan kemudian menambahkan bidang baru ke Klub meja untuk menyimpan ID Penasihat Fakultas.
desainer dapat mengidentifikasi panjang maksimum teks.
Bab.4: Data 43
URL Saylor: http://www.saylor.org/courses/bus206 Dikaitkan kepada: David T. Bourgeois, Ph.D.
saylor.org
Ada dua alasan penting mengapa kita harus mendefinisikan tipe data suatu bidang dengan benar. Pertama, tipe data memberi tahu database fungsi apa yang dapat dilakukan dengan data tersebut. Misalnya, jika kita ingin melakukan fungsi matematika dengan salah satu field, kita harus memastikan untuk memberitahu database bahwa field tersebut adalah tipe data angka. Jadi jika kita mempunyai, katakanlah, suatu field yang menyimpan tahun lahir, kita dapat mengurangkan angka yang disimpan dalam field tersebut dari tahun sekarang untuk mendapatkan usia.
Setelah Anda merancang database dan memuat data, bagaimana Anda akan melakukan sesuatu yang berguna dengannya? Cara utama untuk bekerja dengan database relasional adalah dengan menggunakan Structured Query Language, SQL (diucapkan
“sekuel”, atau sekadar dinyatakan sebagai SQL). Hampir semua aplikasi yang bekerja dengan database (seperti sistem manajemen database, dibahas di bawah) menggunakan SQL sebagai cara untuk menganalisis dan memanipulasi data relasional. Sesuai dengan namanya, SQL adalah bahasa yang dapat digunakan untuk bekerja dengan database relasional. Dari
Meskipun tidak bagus untuk menggantikan database, spreadsheet dapat menjadi alat yang ideal untuk menganalisis data yang disimpan dalam database. Paket spreadsheet dapat dihubungkan ke tabel atau kueri tertentu dalam database dan digunakan untuk membuat bagan atau melakukan analisis pada data tersebut.
gambar atau file musik.
*
Ketika beberapa tipe data harus digabungkan, atau ketika hubungan antara tipe data ini rumit, maka spreadsheet bukanlah solusi terbaik. Basis data memungkinkan data dari beberapa entitas (seperti siswa, klub, keanggotaan, dan acara) untuk dihubungkan bersama menjadi satu kesatuan. Meskipun spreadsheet memungkinkan Anda menentukan jenis nilai apa yang dapat dimasukkan ke
dalam selnya, database menyediakan cara yang lebih intuitif dan canggih untuk menentukan jenis data yang masuk ke setiap bidang, mengurangi kemungkinan kesalahan, dan memungkinkan analisis lebih mudah.
• Objek: tipe data ini memungkinkan penyimpanan data yang tidak dapat dimasukkan melalui keyboard, seperti
Mungkin akan lebih bijaksana jika kita mengurangi ukuran lahan agar kita tidak menyia-nyiakan ruang penyimpanan.
• Teks Paragraf: tipe data ini memungkinkan teks lebih panjang dari 256 karakter.
Agar adil, untuk penggunaan sederhana, spreadsheet dapat menggantikan database dengan cukup baik. Jika hanya diperlukan daftar baris dan kolom sederhana (satu tabel), maka membuat database mungkin berlebihan. Dalam contoh Klub Mahasiswa, jika kita hanya perlu melacak daftar klub, jumlah anggota, dan informasi kontak presiden, kita dapat menggunakan satu spreadsheet. Namun, kebutuhan untuk mencantumkan daftar acara dan nama anggota akan menjadi masalah jika dilacak dengan spreadsheet.
Alasan penting kedua untuk menentukan tipe data adalah agar jumlah ruang penyimpanan yang tepat dialokasikan untuk data kita. Misalnya, jika bidang Nama Depan didefinisikan sebagai tipe data teks(50), ini berarti lima puluh karakter dialokasikan untuk setiap nama depan yang ingin kita simpan. Namun, meskipun nama depan hanya terdiri dari lima karakter, lima puluh karakter (byte) akan dialokasikan. Meskipun ini mungkin bukan masalah besar, jika tabel kita berisi 50.000 nama, kita mengalokasikan 50 50.000 = 2.500.000 byte untuk penyimpanan nilai-nilai ini.
Seringkali, ketika memperkenalkan konsep database kepada siswa, mereka dengan cepat memutuskan bahwa database hampir sama dengan spreadsheet. Lagi pula, spreadsheet menyimpan data secara terorganisir, menggunakan baris dan kolom, dan terlihat sangat mirip dengan tabel database. Kesalahpahaman ini meluas melampaui ruang kelas: spreadsheet digunakan sebagai pengganti database dalam segala jenis situasi setiap hari, di seluruh dunia.
Sidebar: Perbedaan antara Database dan Spreadsheet
Bahasa Kueri Terstruktur
44 Sistem Informasi untuk Bisnis dan Lainnya
saylor.org URL Saylor: http://www.saylor.org/courses/bus206
Dikaitkan kepada: David T. Bourgeois, Ph.D.
• Kueri berikut akan membuat daftar jumlah siswa di setiap klub, mencantumkan nama klub
NoSQL muncul dari kebutuhan untuk memecahkan masalah database berskala besar yang tersebar di beberapa server atau bahkan di seluruh dunia. Agar database relasional dapat berfungsi dengan baik, penting bahwa hanya satu orang yang dapat memanipulasi
sebagian data pada satu waktu, sebuah konsep yang dikenal sebagai penguncian catatan. Namun dengan database berskala besar saat ini (seperti Google dan Amazon), hal ini tidak mungkin dilakukan. Basis data NoSQL dapat bekerja dengan data dengan cara yang lebih longgar, memungkinkan lingkungan yang lebih tidak terstruktur, mengkomunikasikan perubahan pada data dari waktu ke waktu ke semua server yang merupakan bagian dari basis data.
PILIH "Nama Depan", "Nama Belakang" DARI "Siswa" DI MANA "Students.ID" =
Penjelasan mendalam tentang cara kerja SQL berada di luar cakupan teks pengantar ini, namun contoh berikut akan memberi Anda gambaran tentang kekuatan penggunaan SQL untuk memanipulasi data relasional. Banyak paket database, seperti Microsoft Access, memungkinkan Anda membuat kueri yang ingin Anda buat secara visual, lalu membuat kueri SQL untuk Anda.
Mungkin perkembangan baru yang paling menarik adalah konsep NoSQL (dari frasa “tidak hanya SQL”).
• Kueri berikut akan mengambil daftar nama depan dan belakang presiden klub:
PILIH "Klub.Nama Klub", COUNT("Keanggotaan.ID Pelajar") DARI "Klub"
permintaan data yang sederhana hingga operasi pembaruan yang kompleks, SQL adalah andalan pemrogram dan administrator basis data. Untuk memberi Anda gambaran seperti apa tampilan SQL, berikut adalah beberapa contoh penggunaan database Klub Siswa kami.
Model yang berpusat pada dokumen memungkinkan penyimpanan data yang lebih tidak terstruktur dengan menempatkan data ke dalam
“dokumen” yang kemudian dapat dimanipulasi.
lalu jumlah anggotanya:
Model database relasional adalah model database yang paling banyak digunakan saat ini. Namun, ada banyak model database lain yang memberikan kekuatan berbeda dari model relasional. Model basis data hierarki, yang populer pada tahun 1960an dan 1970an,
menghubungkan data bersama-sama dalam suatu hierarki, memungkinkan adanya hubungan induk/anak antar data.
Jenis Basis Data Lainnya
Bab.4: Data 45
saylor.org URL Saylor: http://www.saylor.org/courses/bus206
Dikaitkan kepada: David T. Bourgeois, Ph.D.
Sistem Manajemen Basis Data
Paket DBMS umumnya menyediakan antarmuka
MySQL sumber terbuka juga merupakan database perusahaan.
database dalam format database terbuka (ODB). DBMS Access Microsoft digunakan untuk bekerja dengan database dalam format Microsoft Access Database-nya sendiri. Access dan Base juga memiliki kemampuan untuk membaca dan menulis ke format database lain.
Basis data yang hanya dapat digunakan oleh satu pengguna pada satu waktu tidak akan memenuhi kebutuhan sebagian
besar organisasi. Ketika komputer-komputer telah menjadi jaringan dan kini bergabung di seluruh dunia melalui Internet, sebuah kelas database telah muncul yang dapat diakses oleh dua, sepuluh, atau bahkan satu juta orang. Basis data ini terkadang diinstal pada satu komputer untuk diakses oleh sekelompok orang di satu lokasi. Di lain waktu, mereka diinstal pada beberapa server di seluruh dunia, dimaksudkan untuk diakses oleh jutaan orang. Paket database perusahaan relasional ini dibuat dan didukung oleh perusahaan seperti Oracle, Microsoft, dan IBM.
diubah, ditambah, atau dihapus, program perangkat lunak harus mengaksesnya. Banyak aplikasi perangkat lunak yang memiliki kemampuan ini: iTunes dapat membaca database- nya untuk memberi Anda daftar lagu-lagunya (dan
memutar lagu-lagunya); perangkat lunak ponsel Anda dapat berinteraksi dengan daftar kontak Anda. Namun bagaimana dengan aplikasi untuk membuat atau mengelola database?
Perangkat lunak apa yang dapat Anda gunakan untuk membuat database, mengubah struktur database, atau sekadar
melakukan analisis? Itulah tujuan dari kategori aplikasi
perangkat lunak yang disebut sistem manajemen basis data (DBMS).
Beberapa perusahaan berupaya menyediakan solusi database berskala besar dengan beralih dari model relasional ke model lain yang lebih fleksibel. Misalnya, Google kini menawarkan App Engine Datastore, yang berbasis NoSQL. Pengembang dapat menggunakan App Engine Datastore untuk mengembangkan aplikasi yang mengakses data dari mana saja di dunia. Amazon.com menawarkan beberapa layanan basis data untuk penggunaan perusahaan, termasuk Amazon RDS, yang merupakan layanan basis data relasional, dan Amazon DynamoDB, solusi perusahaan NoSQL.
Misalnya, Apache OpenOffice.org Base (lihat cuplikan layar) dapat digunakan untuk membuat, memodifikasi, dan menganalisis
Basis Data Perusahaan
Bagi komputer, database terlihat seperti satu atau lebih file. Agar data dalam database dapat dibaca,
database menjadi lebih besar dan lebih besar, didistribusikan pada sejumlah besar komputer yang terhubung melalui jaringan.
Sistem ini terutama digunakan untuk mengembangkan dan menganalisis database pengguna tunggal. Basis data ini tidak dimaksudkan untuk dibagikan melalui jaringan atau Internet, melainkan diinstal pada perangkat tertentu dan bekerja dengan satu pengguna pada satu waktu.
Seperti yang dinyatakan sebelumnya, model database relasional tidak dapat diskalakan dengan baik. Yang dimaksud dengan skala di sini adalah a untuk melihat dan mengubah desain database, membuat kueri, dan mengembangkan laporan. Sebagian besar paket ini dirancang untuk bekerja dengan tipe database
tertentu, namun umumnya kompatibel dengan berbagai database.
Microsoft Access dan Open Office Base adalah contoh sistem manajemen basis data pribadi.
URL Saylor: http://www.saylor.org/courses/bus206 Dikaitkan kepada: David T. Bourgeois, Ph.D.
saylor.org
46 Sistem Informasi untuk Bisnis dan Lainnya
Cuplikan layar sistem manajemen basis data Open Office