• Tidak ada hasil yang ditemukan

BAB II DASAR TEORI. Tabel 2.1: Perbedaan dengan Penelitian Sebelumnya

N/A
N/A
Protected

Academic year: 2022

Membagikan "BAB II DASAR TEORI. Tabel 2.1: Perbedaan dengan Penelitian Sebelumnya"

Copied!
18
0
0

Teks penuh

(1)

BAB II DASAR TEORI 2.1 Penelitian Sebelumnya

Pada bab ini berisi landasan teori sebagai parameter rujukan untuk dilaksanakannya penelitian ini. Terdapat 2 penelitian sebagai rujukan yang melandasi penelitian ini, dianatarannya penelitian dari Xie Wu & Huimin Zhang yang berjudul “Design and Implementation of Data Warehouse of Minor Chain Supermarkets” [5] dan penelitian dari Yebai Li, Xiumei Yu, dan Cui Li yang berjudul “The Applied Research on the Statistic Data Warehouse Based on the Snowflake Model” [7]. Berikut adalah perbedaan-perbedaan yang dijabarkan dalam tabel.

Tabel 2.1: Perbedaan dengan Penelitian Sebelumnya The Applied Research on the Statistic

Data Warehouse Based on the Snowflake Mode

Design and Implementation of Data Warehouse of Minor Chain

Supermarkets a. Menggunakan Snowflakes

Schema

b. Studi Kasus pada data Statistika c. Menggunakan Front end Report

service modules Microsoft SQL Server 2005

a. Menggunakan Star Schema b. Studi Kasus Pada Minor Chain c. Front End menggunakan

Microsoft Excel Pivot Table

Pada penelitian Xie Wu, studi kasus yang di angkat berkaitan dengan Minor

(2)

Snowflakes Schema. Endpoint pada penelitian tersebut menampilkan Cube OLAP menggunakan Report Service Microsoft SQL Server 2005 [7].

Pengkajian pada penelitian diatas adalah sebagai landasan pembangunan sistem Data Warehouse yang berkaitan dengan tema pertokoan, tidak menutup kemungkinan dilakukan pengkajian dengan penelitian lain yang berkaitan dengan penelitian ini.

2.2 Data dan Informasi 2.2.1 Data

Data merupakan sebuah fakta tunggal yang dapat berupa angka, gambar, atau suara. Menurut Patricia Wallace, Data merupakan dasar dari sebuah sistem informasi dan juga merupakan fakta mentah yang terwujud kedalam berbagai macam variasi bentuk, Misalnya sebuah acara peluncuran mobil menghasilkan data yang banyak yang menjelaskan tentang acara tersebut [9]. Pada pendapat lain, Data merupakan sebuah fakta mentah, sebuah observasi mengenai fenomena fisik yang terjadi ataupun transaksi yang ada pada sebuah bisnis. Berdasarkan pendapat tersebut, bisa disimpulkan bahwa Data merupakan representasi sebuah fakta tunggal yang terwujud kedalam berbagai macam variasi baik dalam bentuk dokumen, suara, gambar ataupun media yang lain.

2.2.2 Informasi

Informasi merupakan representasi sebuah data yang telah dilakukan pengolahan lebih lanjut agar dapat digunakan untuk keperluan tertentu. Menurut Patricia Wallace, Informasi adalah sebuah data yang telah dilakukan penyusunan dan dianalisa agar memiliki makna dan kegunaan. Sebagai contoh data temperatur suhu seorang pasien jika dilakukan penggabungan dengan data-data yang lain seperti tekanan darah dapat menjadi sebuah informasi rekam medis dari pasien tersebut [9].

(3)

Gambar 2.1 4 Komponen umum Sistem Informasi

Berdasarkan gambar 2.1, Patricia Wallace memaparkan bahwa ada 4 komponen umum dari sistem informasi sebagaimana dijelaskan sebagai berikut [9]:

a. Orang, Pengembangan, perawatan, design dari berbagai macam sistem informasi pasti melibatkan beberapa orang didalam tim. Dalam sistem informasi, semua orang berkolaborasi dan bekerja sama. Ada yang sebagai developer, manajer, pembuat konsep, bahkan kontributor dari sistem informasi tersebut.Contohnya, Sistem informasi User-generated content (UGC) merupakan bentuk besar dari sistem informasi seperti facebook, youtube, dan wikipedia tidak akan berarti jika tidak melibatkan komunitas didalam itu untuk berkontribusi [9].

b. Teknologi, Teknologi informasi merupakan komponen penting didalam sebuah sistem informasi dikarenakan semua kegiatan yang terlibat menggunakan perangkat atau hardware IT seperti laptop, smartphone, kamera digital maupun komponen IT yang lain. Hal itu semua untuk melakukan

(4)

c. Proses, Proses juga salah satu komponen penting didalam sebuah Sistem Informasi dikarenakan hal ini menjelaskan bagaimana Sebuah Sistem Informasi dalam menyelesaikan tugasnya didalam sebuah perusahaan [9].

d. Data, Data merupakan komponen paling kompleks dalam sebuah sistem informasi. Data dapat direpresentasikan kedalam berbagai macam bentuk, misalnya suara, gambar, gelombang, dan tulisan [9].

2.3 Database

Database merupakan tempat untuk menampung data yang saling berelasi yang diperlukan oleh sebuah perusahaan [3]. Pendapat lain mengatakan bahwa database merupakan tempat penampungan data yang didesign untuk mendukung efisiensi penyimpanan data serta pemeliharaan data [10]. Sehingga dari dua pendapat berikut bisa disimpulkan bahwa database adalah tempat untuk menampung data sebuah organisasi atau perusahaan yang saling berelasi sehingga memudahkan dalam pemeliharaan data dan manajerial penyimpanan data.

2.3.1 Entitas

Entitas adalah representasi yang berdiri sendiri dari bentuk fisik yang ada pada dunia nyata [3]. Pendapat lain mengatakan, Entitas merupakan komponen yang ada pada perusahaan dimana harus dilakukan penyimpanan [11]. Entitas merupakan sebuah catatan yang menyimpan data detail dari sesuatu yang memiliki primary key sebagai pembedannya (Andri Wahju) [12]. Dapat disimpulkan bahwa entitas adalah sebuah cara untuk merepresentasikan sesuatu yang ada pada dunia nyata dimana harus dilakukan penyimpanan berdasarkan primary key yang ada.

2.4 Data Warehouse

2.4.1 Definisi Data Warehouse

Data Warehouse adalah sebuah tempat untuk menampung data yang saling terintegrasi, terekam secara historikal dan konsisten [6]). Pada pendapat lain, Data Warehouse merupakan basis data yang berorientasi subject (Subject Oriented), berorientasi waktu (Time Variant), dan Konsisten (Non-Volatile) [13].

(5)

Berdasarkan pendapat yang telah dipaparkan bisa disimpulkan bahwa Data Warehouse merupakan sebuah tempat untuk menampung data yang saling terintegrasi dan historikal yang memiliki sifat berorientasi subject, berorientasi waktu, dan konsisten untuk membantu manajerial dalam melakukan analisis data.

Data warehouse membantu memisahkan sektor antara sektor transaksi dan sektor analis sehingga perusahaan dapat melakukan penggabungan beberapa sumber data yang digunakan untuk melakukan analisa terhadap transaksi yang terjadi.

2.4.2 Karakteristik Data Warehouse

Inmon memaparkan karakteristik Data Warehouse menjadi 4 bagian yaitu Subject-Oriented, Integrated, Nonvolatile, and Time-Variant [14].

2.4.2.1 Subject Oriented

Data Warehouse memiliki karakteristik subject oriented yang berarti data warehouse fokus pada penanganan data pada sebuah perusahaan atau organisasi yang bersifat subjektif [14]. Semisal dalam hal pertokoan, data warehouse fokus pada data yang berkaitan dengan SKU, Pelanggan, Transaksi Pembelian, dan Produk. Pada contoh yang lain dalam dunia kesehatan, data warehouse fokus pada data yang berkaitan dengan Pasien, Obat, dan Transaksi.

(6)

Gambar 2.2 Subject Oriented pada Data Warehouse

Berdasarkan pemaparan diatas, dapat kita simpulkan bahwa setiap organisasi ataupun perusahaan dalam operasional yang berlaku selalu ada sisi subjek yang terkait. Subjek yang terkait dalam penelitian ini adalah Produk, Diskon Produk, Metode Pembayaran, Kustomer, Dan Transaksi Pembelian.

2.4.2.2 Time-Variant

Time-Variant merupakan salah satu karakteristik Data Warehouse. Hal ini menandakan bahwa setiap data yang ada pada sistem Data Warehouse memiliki rentan waktu yang panjang dan akurat berdasarkan waktu yang berjalan sejak sistem data warehouse di bangun. Berbeda dengan database operasional yang mayoritas datanya bersifat realtime dan validitas datanya hanya berlaku pada saat di akses saja. Validitas data yang dimiliki Data Warehouse di tentukan oleh waktu yang terkait dengan data tersebut, sehinnga komponen waktunya harus jelas agar dapat digunakan sebagai bahan analisis yang valid. Database operasional memiliki rentang waktu antara 60 – 90 hari, sedangkan pada Data Warehouse memiliki rentang waktu 5 – 10 tahun. Hal ini membuktikan bahwa Data Warehouse memiliki banyak data historikal daripada sistem database yang lain (inmon).

Gambar 2.3 Time – Variant pada Data Warehouse 2.4.2.3 Integration

Data Warehouse memiliki karakteristik lainnya yang disebut Integration.

Pada Database Operasional, Sumber data yang digunakan hanya menggunakan

(7)

satu sumber saja. Sedangkan pada Data Warehouse dapat menggunakan sumber data yang bervariasi. Dengan banyaknya sumber data yang dapat di tangani, Hal ini memungkinkan terjadinnya perbedaan satuan database operasional dengan database operasional yang lainnya. Misalnya, pada database operasional memiliki memiliki primary key dengan tipe data char, sedangkan pada external source memiliki tipe integer. Untuk menyiasati hal tersebut, data warehouse perlu melakukan penyamaan atau pengkondisian tipe data agar sama dan terintegrasi.

Gambar 2.4 Integration pada Data Warehouse 2.4.2.4 Non-Volatile

Karakteristik data warehouse selanjutnya adalah Non-Volatile. Pada database operasional, data mengalami 3 mekanisme yaitu create, update, delete. Sedangkan data pada database data warehouse hanya mengalami satu mekanisme saja yaitu update sehingga data historis terjaga dengan baik.

(8)

Gambar 2.5 Non-Volatile pada Data Warehouse 2.4.3 Struktur Data Warehouse

Struktur data warehouse terdiri dari Older Level Of Detail, Current Level of Detail, Level of lightly Summarized Data (Data Mart Level), dan Level of Highly Summarized Data [14]. Pada tahap Current Level Of Detail, data dari database operasional dilakukan load kedalam database Data Warehouse pada saat itu juga. Jika dilakukan load lagi, maka data yang telah dilakukan load tadi masuk ke tahap ke Older Level Of Detail. Pada tahap Level of lightly Summarized Data, data-data yang dihasilkan merupakan hasil rangkuman pada waktu saat itu juga.

Jika sudah melampaui waktu tertentu, maka data akan menjadi data historikal dan masuk ke tahap Level of Highly Summarized Data.

2.5 Perbedaan OLAP dan OLTP

OLTP atau kepanjangan dari On-line Transaction Processing adalah sebuah cara untuk melakukan akses data pada database sistem komputer yang terhubung di jaringan yang dilakukan secara realtime dengan melakukan 3 aksi utama yaitu Create, Update, Delete, dan Read (Joarder Kamal). Kegiatan OLTP biasannya terjadi pada semua transaksi yang berkaitan dengan sistem basis data komputer, misalnya melakukan update data pembelian pada sistem kasir, mencatat mutasi lokasi barang pada sistem pergudangan.

OLAP atau kepanjangan dari On-Line Analytical Processing merupakan sebuah paradigma atau cara untuk melakukan akses pada multidimensional data didalam sebuah data warehouse. OLAP memungkinkan untuk melakukan

(9)

beberapa operasional untuk melakukan analisa pada cube yaitu Drill-down dan Slice and Dice (Julien aligon). Kegiatan OLAP dilakukan berdasarkan waktu tertentu terhadap OLTP yang terkait. OLAP terbentuk guna membantu menyediakan informasi untuk kegiatan analisis berdasarkan waktu yang diinginkan.

2.6 Model Dimensional

Model Dimensional merupakan sebuah konsep logikal sistem yang memberikan kemudahan dalam mengakses data secara lengkap dan terstandarisasi. Model dimensional terbentuk berdasarkan beberapa Entity Relationship dimana setiap ER terdapat primary key dan foreign key yang saling terintegrasi. Hal ini memungkinkan setiap entitas dapat mengakses data pada entitas yang lain yang saling terhubung sehingga data yang didapatkan akan lebih lengkap dan luas. Terdapat dua jenis model dimensional yang sering di terapkan dalam beberapa sistem data warehouse yaitu Star Schema & Snowflakes Schema.

2.6.1 Star Schema

Star Schema merupakan rancangan data multidimensional yang terbentuk menyerupai bintang. Star Schema terdiri dari tabel fakta dan tabel dimensi yang dimana tabel fakta di kelilingi masing-masing tabel dimensi. Tabel dimensi pada Star Schema merupakan hasil dari teknik collapse dari beberapa tabel yang terkait pada OLTP tanpa dilakukan normalisasi sehingga pada star schema terdapat banyak kondisi tabel yang redundan. Tabel fakta pada Star Schema terhubung langsung dengan Tabel Dimensi.

(10)

Gambar 2.6 Star Schema 2.6.2 Snowflakes Schema

Snowflakes Schema merupakan rancangan data multidimensional yang terbentuk menyerupai Star Schema akan tetapi pada setiap tabel dimensi dilakukan pemecahan secara hierarki [8]. Hal itu bertujuan agar tidak terjadi denormalisasi pada tabel dimensi dikarenakan redundansi yang terjadi pada tabel dimensi yang ada di Star Schema. Konsep pembentukan tabel fakta dan tabel dimensi hampir menyerupai Star Schema.

(11)

Gambar 2.7 Snowflake Schema 2.7 ETL

ETL kepanjangan dari Extraction-Transform-Load merupakan sebuah cara untuk melakukan transformasi dari OLTP kedalam OLAP yang dilakukan dengan beberapa tahapan. ETL merupakan cara untuk melakukan ekstraksi dari beberapa sumber data dan dilakukan integrasi kedalam Data Warehouse secara periodik [15]. Kegiatan ETL dilakukan dengan perangkat lunak seperti Talend Open Studio For Data Integration, Pentaho Kettle. Pada penelitian ini, penulis menggunakan Talend Open Studio For Data Integration untuk melakukan kegiatan ETL.

2.7.1 Metadata

Metadata adalah seluruh informasi yang berkaitan dengan data yang

(12)

2.8 From ER Models to Dimensional Models Methodologies

Metode ER Models to Dimensional Models adalah sebuah metode perancangan data warehouse yang disusun oleh Daniel L. Moody dan Mark A.R.

Kortink. Metode ini melakukan perancangan data warehouse berlandaskan pada ER Diagram yang telah ada. Terdapat empat tahap umum yang ada pada metode ini yaitu Classify Entities, Identify Hierarchies, Produce Dimensionals Models, dan Evaluation and Refinement [8].

2.8.1 Classify Entities

Pada tahap ini dilakukan pengklasifikasian entitas pada ER diagram yang ada.

Terdapat tiga jenis entitas yang ada yaitu Entitas Transaksi, Entitas Komponen, dan Entitas Klasifikasi.

2.8.1.1 Entitas Transaksi

Entitas Transaksi adalah sebuah entitas yang merekam data detail yang ada pada sebuah proses bisnis. Misal Order kamar hotel, Pembelian barang, Peminjaman buku perpustakaa, keluar-masuk barang pada pergudangan. Hasil pengklasifikasian dari entitas ini akan membantu dalam membentuk calon tabel fakta.

2.8.1.2 Entitas Komponen

Entitas Komponen adalah sebuah entitas yang terhubung langsung dengan entitas Transaksi melalui relasi one-to-many. Entitas ini memuat data detail atau komponen dari setiap transaksi dalam proses bisnis. Entitas Komponen dapat menjawab dari pola 5W+1H yaitu who, where, what, why, when and How dari setiap transaksi yang terjadi.

2.8.1.3 Entitas Klasifikasi

Entitas Klasifikasi merupakan sebuah entitas yang memiliki hubungan langsung dengan entitas komponen dengan relasi one-to-many. Entitas ini memuat data detail dari entitas komponen yang perlu dilakukan pemecahan secara hierarki.

(13)

Gambar 2.8 dapat dilihat gambaran secara umum pembagian entitas menurut Moody

Gambar 2.8 Pengklasifikasian Entitas pada ER Diagram 2.8.2 Identify Hierarchies

Hierarki dalam dimensional model merupakan bagian inti dari melakukan permodelan dan juga merupakan landasan untuk menentukan tabel dimensi dari ER Diagram [8].Sehingga hal ini perlu dilakukan identifikasi yang tepat agar konsep yang di bangun menjadi lebih struktural. Pada tahap ini terdiri dari dua jenis hierarki yaitu Hierarki Minimal dan Hierarki Maksimal.

2.8.2.1 Hierarki Minimal

Hierarki Minimal merupakan sebuah hierarki yang menempati posisi paling bawah dari hierarki Maksimal. Entitas pada Hierarki Minimal hanya memiliki relasi one-to-many saja.

(14)

Gambar 2.9 dapat dilihat bahwa tabel State merupakan Hierarki Minimal pada entitas tersebut.

2.8.2.2 Hierarki Maksimal

Hierarki Maksimal merupakan sebuah hierarki yang menempati posisi paling atas.

Entitas pada hierarki ini hanya memiliki relasi Many-to-one.

Gambar 2.10 Entitas yang berada pada Hierarki Maksimal

Gambar 2.8 menjelaskan bahwa tabel Sale Item merupakan hierarki Maksimal pada entitas tersebut.

2.8.3 Produce Dimensionals Models

Produce Dimensionals Models merupakan sebuah tahap untuk menghasilkan model dimensional berdasarkan dari tahap-tahap sebelumnya. Pada tahap ini terdapat dua operator umum yaitu operator Collapse Hierarchies dan Aggregation.

2.8.3.1 Collapse Hierarchy

Collapse Hierarchy merupakan sebuah operator untuk melakukan peleburan hierarki menjadi satu bagian. Peleburan dilakukan pada entitas Klasifikasi kedalam Entitas Komponen. Hal tersebut harus dilakukan jika perancangan menggunakan skema bintang / Star Schema. Peleburan tersebut dapat menyebabkan tabel menjadi bentuk denormalisasi.

(15)

Gambar 2.11 Collapse hierarchy pada tabel state menuju ke tabel Region Pada penelitian ini tidak diperlukan operator ini dikarenakan skema yang digunakan adalah Snowflake Schema.

2.8.3.2 Aggregation

Aggregation merupakan operator untuk melakukan pembentukan entitas baru dengan melakukan operasi perhitungan. Operator ini hanya dapat dilakukan pada Entitas Transaksi yang memuat data angka perhitungan.

Gambar 2.12 Operator Aggregation

2.8.4 Evaluasi dan pembenahan (Evaluation and Refinement) Tahap Evaluasi dan Pembenahan merupakan tahapan yang dilakukan setelah model dimensional terbentuk. Pada tahap ini dilakukan evaluasi terhadap model yang sudah di rancang, apakah sudah sesuai atau tidak. Jika tidak sesuai,

(16)

Gambar 2.13 Tahapan From ER Models to Dimensional Models (Moody, et all)

(17)

2.9 Tools Pembuatan Data Warehouse

Untuk implementasi data warehouse di butuhkan beberapa perangkat lunak dalam membangunnya. Pada penelitian ini, penulis menggunakan database mysql sebagai dbms utamannya. Untuk kegiatan ETL, penulis menggunakan Talend Open Studio For Data Integration dikarenakan bersifat open source.

Untuk kegiatan pembentukan Cube dari OLAP yang dibentuk, penulis menggunakan perangkat lunak Pentaho Schema Workbench. Untuk sektor reporting Cube berbasis web, penulis menggunakan Pentaho Business Intelligence Server.

(18)

Referensi

Dokumen terkait

Urutan pengerjaan pembuatan huruf/angka pada bidang plesteran terdiri dari: melukis huruf/angka pada permukaan, menyiapkan permukaan, melekatkan adukan pada permukaan,

Previous studies on compensation system hilight that implementation of pay system may affect employee's feeling of justice (St-Onge.. These finding is consistent

diibaratkan seperti teknologi penginderaan jarak jauh menggunakan citra satelit yang digunakan untuk mendeteksi potensi sumber daya alam di suatu titik lokasi,

Oleh karena itu, definisi hukum Islam yang mendekati kesempurnaan adalah dengan menggantungkan definisi Syaltut dengan Amir Syarifuddin, yaitu

terlampir dalam dokumen tersebut, surat pernyataan kesediaan untuk melakukan pengelolaan dan pemantauan lingkungan hidup yang ditandatangani oleh Ketua Koperasi

di penuhi oleh seorang perawat di level atau jenjangnya. 3) Ada daftar kewenangan klinis yang telah disusun oleh panitia adhoc dan.. disahkan oleh direktur

Berdasarkan hal tersebut di atas, dan mengacu pada kesepakatan antara DPRK dan Pemerintah Kota Sabang tentang Kebijakan Umum APBK Tahun 2011, para pihak sepakat terhadap

Dengan menerapkan metode pembelajaran yang terintegrasi dengan teknologi komputer (seperti SPC) akan memberikan suatu model yang berbasis unjuk kerja, hal ini