ORGANISASI DATA
Data bisnis terdiri data field, record dan file.
• Data field adalah unit data yang terkecil
• Record (catatan) adalah kumpulan data field yang saling terhubung
• File adalah kumpulan record yang berhubungan. Bisa berupa spreadsheet, dokumen, set data atau kumpulan fakta.
Contoh : file pegawai.
Folder adalah kumpulan file – file yang berkaitan dalam satu group.
FOLDER
- Perpindahan file antar folder adalah hal yang mudah. Hanya dengan menyorot file yang akan dipindah kemudian klik
kanan pilih copy. Pilih folder tempat tujuan salinan dengan meng klik tombol mouse dan pilih paste.
- Yang harus diperhatikan bagi seorang manajer adalah bagaimana pemahaman secara konseptual dalam
MENGORGANISASIKAN DATA
File Data biasanya di organisasikan menurut : 1. Fungsi
2. Frekuensi Penggunaan 3. Pemakai
4. Proyek
Di organisasi banyak manajer menyimpan data sebagai file-file yang digunakan untuk aplikasi.
Keterangan :
Gambar diatas memperlihatkan isi file data spreadsheet “Nama Barang”.
Data diorganisasikan dengan menempatkannya dalama spreadsheet.
Pertama file diberi nama yang mengungkapkan isi file Kedua, data diorganisasikan menjadi baris dan kolom.
Spreadsheet “Nama Barang” memiliki lima field : Kode, Nama Barang, Merk, Harga dan Jumlah yang ada.
Ditiap baris, pemakai akan menemukan kode barang yang diikuti dengan spesifikasinya
Spreadsheet sbg Database Sederhana
I. Flat Files
Adalah tabel yang tidak memiliki field yang berulang. Istilah
dalam spreadsheet diganti dengan istilah struktur data. Seperti tabel spreadsheet menjadi file, kolom menjadi field dan baris menjadi record (catatan).
Dengan struktur flat file, pengorganisasian data tidak memungkinkan field yang berulang.
II. Key Fields
Berisi suatu nilai yang secara unik mengidentifikasi setiap
STRUKTUR DATABASE
Database mengacu pada semua data yang disimpan pada sumber daya berbasis komputer.
Sistem Manajemen Database (database management system –
DBMS) adalah sebuah aplikasi perangkat lunak yang menyimpan struktur database, data itu sendiri, hubungan antar data di
dalam database, maupun formulir dan laporan yang berhubungan dengan database.
• Struktur Database Hierarkis (hierarchical database structure), yaitu struktur kelompok data, subkelompok data dan
subkelompok yang lebih kecil lagi yang menyerupai cabang – cabang pohon.
• Memanfaatkan sumber daya komputer secara efisien saat
sebagian besar catatan dalam database akan digunakan dalam aplikasi. Misalnya operasi akuntansi.
• Akan tetapi saat manajer menginginkan sedikit catatan tertentu dari sejumlah besar data yang ada dalam database, struktur
database hierarkis kurang efisien.
• Struktur Database Jaringan (network database structure)
memungkinkan satu catatan tertentu menunjuk pada catatatn yang lain dalam database.
• Tiap catatan dalam database dapat memiliki petunjuk ke tiap catatan lain dalam database. Namun ini menjadi sumber
kelemahan dan kekacauan pada saat struktur jaringan ingin diterapkan untuk masalah praktis.
• Struktur database Relasional merupakan sekumpulan tabel yang saling berhubungan secara implisit.
• Bila terdapat satu kolom bersama antara dua tabel, baris-baris dari dua tabel itu dapat digabungkan bila nilai-nilai data pada kolom bersama itu sama. Kolom-kolom bersama antara berbagai tabel adalah mekanisme yang membentuk hubungan implisit.
• Contoh Database Relational :
Sebuah toko elektronik mempunyai database yang berisi NamaProduk, Merk Produk dan Data order. Database ini disimpan dengan nama tabel Barang.
Mereka juga mempunyai tabel Pemasok yang berisi ID, Nama Pemasok, Alamat dan NamaProduk.
Tabel Barang secara implisit berhubungan dengan tabel Pemasok melalui kolom “NamaProduk”.
Melaui field “NamaProduk” bisa diketahui nama Pemasoknya. Perangkat lunak yang sering digunakan untuk sistem
manajemen database adalah Microsoft Acces, Oracle dan MySQL.
KONSEP DATABASE
Database adalah kumpulan seluruh sumberdaya berbasis komputer milik organisasi.
Sistem Manajemen Database adalah perangkat lunak yang menyimpan struktur database, hubungan antar-data dalam database, serta berbagai formulir dan laporan yang berkaitan dengan database tersebut.
Database yang dikendalikan oleh sistem manajemen database adalah satu set catatan data yang berhubungan dan saling
menjelaskan.
Tujuan utama dari Konsep Database adalah meminimalkan pengulangan data dan mencapai independensi data.
Pengulangan Data (Data Redundancy) adalah duplikasi data, dengan kata lain berarti data yang sama disimpan dalam
beberapa file.
Hal ini akan menyebabkan Inkonsistensi Data, sebuah kondisi dimana data yang ada menjadi tidak sama dan tidak diketahui nilai mana yang benar atau salah.
Independensi Data adalah kemampuan untuk membuat
perubahan dalam struktur data tanpa membuat perubahan pada program yang memproses data tersebut.
Kamus Data (data dictionary) adalah istilah database yang
mengacu pada definisi data yang disimpan dalam database itu sendiri yang dikendalikan oleh sistem manajemen database.
lanjutan ...
File Tenaga Penjual
File Penjual File Hutang File Piutang File Pelanggan
File Penjualan
File Pembeli File
PERKEMBANGAN PERANGKAT LUNAK
DATABASE
Perangkat lunak database dimulai dengan IDS (Integrated
Data Store) yang dikembangkan oleg GE tahun 1964.
Dilanjutkan IBM yang mengembangkan IMS (Information
Management System).
Apollo melengkapinya dengan perangkat lunak sistem
manajemen database.
Sistem Manajemen Database menyediakan interface bahasa pemrograman dan query language interface. Query ini
memungkinkan akses sendirian (stand-alone) ke catatan database tanpa kode ditempeli dengan bahasa
IBM mengeluarkan SEQUEL sebagai pengembangan query
language pada tahun 1970. Ini menggunakan konsep structured query language (SQL), yaitu suatu set perintah yang menjelaskan bagaimana caranya memproses struktur database relasional.
Kerjasama IBM dengan ANSI memunculkan produk database SQL yang mempunyai interface standar dan memungkinkan organisasi dapat berbagi struktur data yang sama tanpa
membutuhkan perangkat keras komputer yang sama atau perangkat lunak yang sama.
MENCIPTAKAN DATABASE
Proses menciptakan database mencakup 3 langkah : 1. Menentukan data yang dibutuhkan
2. Menjelaskan data tersebut
3. Memasukkan data kedalam database.
Kebutuhan data dicapai melalui 2 pendekatan dasar, yaitu berorientasi proses dan model perusahaan
a. Pendekatan berorientasi proses disebut juga Pendekatan Berorientasi Masalah dan Model Proses (process modelling). b. Pendekatan Model Perusahaan (enterprise modeling
1.
Perencanaan strategis untuk sumber daya informasi
Buat model data enterprise
Model data enterprise
Kembangkan database
PENGELOLA DATABASE
• Adalah spesialis informasi yang bertanggung jawab atas database.
• Tugas Pengelola Database (database administration / DBA) :
1. Perencanaan database, meliputi kerjasama dengan para manajer untuk mendefinisikan skema perusahaan dan dengan para pemakai untuk mendefinisikan sub skema mereka. Juga memilih perangkat keras dan lunak sistem manajemen database.
2. Penerapan database, mencakup penciptaan database yang sesuai dengan DBMS dan menetapkan prosedur dan kebijakan penggunaan database
3. Operasi database, mencakup menawarkan program pendidikan bagi pemakai database.
PENGETAHUAN DALAM DATABASE
• Pengetahuan dalam database (knowledge discovery in databases
/ KDD) adalah semua kegiatan yang memberikan arti pada data yang tersimpan dalam database yang besar.
• Data Warehousing, database yang menyediakan sumber daya
data yang memungkinkan pemakai untuk memanipulasi dan menggunakan data secara intuitif. Penyimpanan data
memerlukan tempat yang besar dikarenakan jumlah data yang tersimpan sangat besar.
• Data Mart, merupakan sebuah database yang berisi data yang
hanya menjelaskan satu segmen dari operasi perusahaan.
• Data Mining, adalah proses menemukan hubungan dalam data
Contoh kasus Data Mining
• Kasus : Bank ABC telah memutuskan untuk menawarkan reksa dana kepada para pelanggannya. Manajemen bank ingin
mengarahkan materi promosi pada segmen pelanggan yang memberikan potensi bisnis terbesar.
• Ada tiga pendekatan dalam Data Mining yang bisa dipilih dan dilakukan Manajemen Bank ABC, yaitu :
a. Data Mining berdasarkan Verifikasi.
b. Data Mining berdasarkan Penemuan
a. Data Mining berdasarkan Verifikasi
• Satu pendekatan adalah para manajer mengidentifikasi
karakteristik yang mereka yakini dimiliki oleh pasar sasaran. Misalkan pasar yang dipilih adalah pasangan muda,
berpenghasilan ganda dan kaya.
• Query dapat dimasukkan kedalam DBMS dan catatan yang tepat dapat dipanggil.
• Pendekatan dimulai dengan hipotesis pemakai tentang bagaimana data tersebut terstruktur, disebut data mining berdasarkan verifikasi (verification-driven data mining).
b. Data Mining berdasarkan Penemuan
• Pendekatan ini memungkinakan suatu sistem data miningmengidentifikasi pelanggan terbaik untuk promosi tersebut.
• Sistem ini menganalisa database, mencari kelompok-kelompok dengan karakteristik umum. Sehingga dinamakan data mining berdasarkan penemuan (discovery-driven data mining).
• Disini manajemen selain menganalisa pasangan muda, juga menganalisa pasangan yang sudah pensiun yang tergantung pada jaminan sosial dan pensiun.
• Dengan data mining ini dapat didapatkan analisa lebih jauh,
c. Kombinasi Data Mining Verifikasi & Penemuan
• Perkembangan data mining dimasa depan akan
mengkombinasikan pendekatan hipotesis dan penemuan.
• Pengembangan ini menggunakan penalaran yang mendasari
Konsep Sistem Pendukung Keputusan (Decision Support System)
• Konsep ini memungkinkan pemakai dan komputer bekerja sama memecahkan suatu masalah.
PROSES KDD
PROSES KDD
• Langkah-langkah KDD adalah (Peter Cabena):
1. Penentuan Sasaran Bisnis (Business Objective Determination)
2. Persiapan Data (Data Preparation) – Data Selection
– Data Preprocessing – Data Transformation 3. Data Mining
4. Analysis of Results