Penerapan Data Mining Dalam Penentuan Pola Pembelian Customer Di CV. Sultan Jaya Mandiri Menggunakan Association Minign Rules

(1)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

FEBI NURAFIAH

10111619

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

(2)

iii

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT berkat Rahmat dan Karunia-Nya penulis dapat menyelesaikan penyusunan skripsi ini. Shalawat beserta salam semoga senantiasa terlimpah curahkan kepada Nabi Muhammad SAW, kepada keluarganya, para sahabatnya, kepada umatnya hingga akhir zaman, amin.

Penulisan skripsi ini diajukan untuk memenuhi salah satu syarat memeperoleh gelar sarjana pada Program Studi Teknik Informatika Fakultas Teknik dan Ilmu Komputer. Adapun judul skripsi yang penulis ajukan adalah

“PENERAPAN DATA MINING DALAM PENENTUAN POLA PEMBELIAN

CUSTOMER DI CV.SULTAN JAYA MANDIRI MENGGUNAKAN

ASSOCIATION MINING RULES“

Dalam penulisan skripsi ini tentunya tidak lepas dari kekurangan, baik aspek kualitas maupun aspek kuantitas dari materi penelitian yang disajikan.

Semua ini didasarkan dari keterbatasan yang dimiliki penulis.

Penulis menyadari bahwa skripsi ini jauh dari sempurna sehingga penulis

membutuhkan kritik dan saran yang bersifat membangun untuk kemajuan pendidikan di masa yang akan datang.

Dalam penulisan skripsi ini tidak lepas dari hambatan dan kesulitan, namum berkat bimbingan, bantuan, nasihat dan saran serta kerjasama dari berbagai pihak, khususnya pembimbing, segala hambatan tersebut akhirnya dapat diatasi dengan baik. Untuk itu penulis menyampaikan rasa hormat dan terima kasih sebesar-besarnya kepada:

1. Allah SWT yang telah mencurhakan rahmat dan hidayah-Nya hingga detik

ini.

2. Ibu Dian Dharmayanti, S.T., M.Kom. selaku dosen pembimbing yang

(3)

iv

memberikan saran serta kritikan-Nya dalam penyusunan skripsi ini.

5. Bapak H.Emuh Ahmad yang telah menerima penulis untuk melakukan

penelitian di CV.Sultan Jaya Mandiri.

Selain itu tidak lupa penulis ucapkan terima kasih yang sebesar-besarnya

dan penghargaan yang setinggi-tingginya kepada:

1. Ibunda Hj.Mimin Siti Aminah dan Kaka-kaka tercinta Wahyu Husnul

Mujib, Wahyu Samsul Ma’rif, Siti Nuraenah, Siti Solihah, Wahyu

Miftahul Anwar yang telah tulus selalu mendoakan, memberikan dorongan moril dan materil, masukan , perhatian, dukungan sepenuhnya dan kasih sayang yang tidak ternilai dan tanpa batas yang telah kalian berikan yang terbaik untuk penulis.

2. Kepada teman terdekat yang selalu memberikan dukungan, serta masukan

untuk menyelsaikan skripsi ini.

3. Kepada sahabat-sahabat yang selalu mendoakan dan menghibur penulis

disaat semangat mulai memudar dalam menyelsaikan skripsi ini.

4. Kepada teman-teman kelas IF14 angkatan 2011 atas dukungan dan

kebersamaannya, terutama untuk Nur Azizah yang telah bersedia meluangkan waktunya untuk berbagi pendapat dengan penulis dalam menyelesaikan skripsi ini.

5. Kepada teman-teman satu bimbingan Ibu Dian Dharmayanti, S.T.,

M.Kom. atas dukungan dan kebersamaannya untuk penulis dalam menyelesaikan skripsi ini.

6. Semua pihak yang tidak dapat penulis sebut satu persatu yang telah

membantu dalam menyelesaikan skripsi ini.

(4)

v

Keterbatasan kemampuan, pengetahuan dan pengalaman penulis dalam pembuatan skripsi ini masih jauh dari kesempurnaan. Untuk itu penulis akan selalu menerima segala masukan yang ditujukan untuk menyempurnakan skripsi ini. Akhir kata penulis mengharapkan semoga skripsi ini dapat bermanfaat serta manambah wawasan pengetahuan baik bagi penulis sendiri maupun bagi pembaca pada umunya.

Bandung, 27 Februari 2016

(5)

vi

DAFTAR ISI

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR GAMBAR ... viii

DAFTAR TABEL ... xi

DAFTAR SIMBOL ... xiii

DAFTAR LAMPIRAN ... xv

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Perumusan Masalah... 2

1.3 Maksud dan Tujuan ... 2

1.3.1 Maksud ... 2

1.3.2 Tujuan ... 2

1.4 Batasan Masalah ... 3

1.5 Metodologi Penelitian ... 3

1.5.1 Metode Pengumpulan Data ... 3

1.5.2 Metode Pembangunan Data Mining ... 4

1.5.3 Metode Pembangunan Perangkat Lunak ... 5

1.6 Sistematika Penulisan ... 7

BAB 2 TINJAUAN PUSTAKA ... 9

2.1 Profil Instansi ... 9

2.1.1 Sejarah Instansi ... 9

2.1.2 Logo ... 9

2.1.3 Struktur Organisasi ... 10

2.1.4 Visi dan Misi Instansi ... 11

2.2 Landasan Teori ... 12

2.2.1 Data... 12

(6)

vii

2.2.3 Database Management System ... 13

2.2.4 Data Mining ... 14

2.2.5 Association Rule ... 19

2.2.6 Algoritma FP- Growth ... 23

2.2.7 Inified Modelling Language (UML) ... 26

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 29

3.1 Analisis Sistem ... 29

3.1.1 Analisis Masalah ... 29

3.1.2 Analisis Penerapan Metode CRISP-DM ... 32

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 68

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 103

4.1 Implementasi Sistem ... 103

4.1.1 Perangkat Keras yang Digunakan ... 103

4.1.2 Perangkat Lunak yang Digunakan... 103

4.1.3 Implementasi Basis Data ... 104

4.1.4 Impementasi Antarmuka ... 106

4.2 Pengujian Sistem ... 106

4.2.1 Pengujian Alpha ... 107

BAB V KESIMPULAN DAN SARAN ... 119

(7)

121

DAFTAR PSUTAKA

[1] B. Santoso, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis,

Yogyakarta: Graha Ilmu, 2007. [2] A.Doedit, Penelitian Deskriptif, 2009.

[3] R. W. Pate Chapman, 2000. [Online]. Available: http://the- modeling-agency.com/crisp-dm.pdf. [Diakses 25 November 2016].

[4] R. S. Pressman, Software Engineering: A Practitioner's Approach, 6th ed., New York: Mc Graw-Hill Companies, 2005.

[5] F. Buku Teks Komputer: Basis Data, 5th ed., Bandung: Informatika, 2004 [6] W. Sistem Basis Data: Analisis dan Pemodelan Data, 1st ed., Yogyakarta:

Graha Ilmu, 2003

[7] J. Simarmata and I. Prayuda, Basis Data, Yogyakarta: Andi Offset, 2006. [8] Ramon A. Mata Toledeo, Pailine K. Cushman, Dasar-dasar Database

Relasional. Jakarta.

[9] J. Han and M. Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006.

[10] D. T. Larose, DATA MINING METHODS AND MODELS, New Jersey: John Wiley & Sons, Inc, 2006.

[11] D. Ulmer, "Mining an Online Auctions Data Warehouse," The Mid-Atlantic Student Workshop on Programming Languages and Systems, vol. 19, 2002. [12] K. and E. T. Luthfi, Algoritma Data Mining, Andi, 2009.

[13] D. T. Larose, Discovering Knowledge In Data: An Introduction To Data Mining, New Jersey: Wiley Interscience, 2005.

[14] Witten, I, H. 2011. Data Mining : practical machine learning tools and techniques.

(8)

1

BAB 1

PENDAHULUAN

1.1 Latar Belakang Masalah

CV.Sultan Jaya mandiri yang berlokasi di Jl.Raya nanggeleng No.53 Darangdan-Purwakarta adalah sebuah perusahaan kecil yang bergerak dibidang penjualan barang. Barang-barang yang dijual terdiri dari beberapa kategori diantaranya sembako, food, dan non food. Pengelompokan ini dilakukan untuk memudahkan dalam mengelola produk dan juga untuk memudahkan pelanggan untuk memesan produk yang akan dibeli. Produk yang termasuk kedalam sembako adalah produk-produk yang termasuk ke dalam Sembilan bahan pokok seperti halnya beras, terigu dan gula. Produk yang termasuk kedalam kategori

food merupakan produk-produk kebutuhan sehari-hari yang dapat dimakan layaknya makanan dan minuman ringan, sedangkan untuk non-food merupakan produk-produk kebutuhan sehar-hari yang tidak dapat dimakan seperti halnya sabun, deterjen, kosmetik dll. Untuk kategori food, dalam seharinya perusahaan dapat melakukan sekitar 20 transaksi penjualan yang totalnya melibatkan kurang lebih 100 item barang.

Pada event tertentu, CV. Sultan Jaya Mandiri akan membuatkan paket

barang sebagai strategi pemasaran. Maksud dari pembuatan paket tersebut adalah barang-barang yang dijual secara bersamaan yang dibentuk menjadi sebuah paket

(9)

sebagai dasar pengambilan keputusan untuk membuat sebuah paket penjualan barang. Sebagai contoh, dari data tersebut didapat bahwa minyak goreng dan minuman kemasan adalah barang yang banyak terjual. Akan tetapi, apakah kedua barang tersebut efektif bila dijual secara bersamaan sebagai paket, karena pelanggan belum tentu ingin membeli minyak goreng bersamaan dengan minuman kemasan.

Dalam bidang keilmuan data mining, terdapat suatu metode yang dinamakan association rule. Metode ini sering juga dinamakan dengan market basket analysis karena awal mulanya yang berasal dari studi tentang database

transaksi penjualan [1]. Association rule bertujuan untuk menunjukan nilai asosiatif antara jenis-jenis barang yang dibeli oleh pelanggan sehingga terlihatlah sebuah pola berupa barang-barang apa saja yang sering dibeli secara bersamaan dalam sebuah transaksi penjualan. Dengan mengetahui barang apa saja yang sering dibeli secara bersamaan, dapat dibuat sebuah dasar keputusan untuk menentukan barang-barang apa saja yang efektif bila dibuat sebagai paket barang. Berdasarkan uraian tersebut, maka diperlukan perangkat lunak yang mengimplementasikan metode association rule sebagai alat bantu untuk menentukan nilai asosiatif antara jenis-jenis barang.

1.2 Perumusan Masalah

Dari latar belakang diatas dapat disimpulkan perumusan masalah yaitu bagaimana cara menerapkan data mining dengan metode association rule

menggunakan algoritma fp-growth untuk menentukan produk apa saja yang dapat dapat dijual dalam satu paket untuk ditawarkan kepada konsumen.

1.3 Maksud dan Tujuan 1.3.1 Maksud

Maksud dari penelitian ini adalah menerapkan metode association rule

terhadap pembentukan paket penjualan barang di CV.Sultan Jaya Mandiri. 1.3.2 Tujuan

(10)

3

1.4 Batasan Masalah

Berdasarkan perumusan masalah di atas maka batasan masalah dapat disimpulkan sebagai berikut:

1. Algoritma yang digunakan adalah algoritma Fp-Growth untuk pemaketan produk di CV. Sultan Jaya Mandiri.

2. Data yang digunakan dalam penelitian ini adalah data transaksi penjualan di CV.Sultan Jaya Mandiri selama 3 bulan terakhir sebelum

event-event tertentu seperti hari raya idul fitri, contoh data training yang dipilih yaitu pada bulan April-Juni 2015.

3. Format data yang akan dimining yaitu format data excel.xlsx.

4. Informasi yang dihasilkan berupa pola penentuan paket penjualan barang.

5. Pendekatan analisis pembangunan perangkat lunak ini menggunakan pendekatan analisis OOP.

6. Aplikasi yang dibangun berbasis dekstop.

7. Menggunakan tool pemrograman C# dan database server MySql. 1.5 Metodologi Penelitian

Metodologi penelitian yang digunakan adalah metode penelitian deskriptif, yaitu metode penelitian yang bertujuan untuk memberikan gambaran atau deskripsi tentang suatu keadaan secara objektif [2]. Metode penelitian ini memiliki dua metode yaitu metode pengumpulan data dan metode pembangunan

data mining.

1.5.1 Metode Pengumpulan Data

Metode pengumpulan data yang akan digunakan dalam penelitian ini terdiri dari :

1. Studi literatur

Studi literatur adalah metode pengumpulan data yang dilakukan dengan cara mengumpulkan literatur, jurnal, paper, bacaan-bacaan dan

(11)

2. Wawancara

Wawancara yang dilakukan langsung kepada pihak perusahaan untuk mendapatkan informasi tentang data transaksi penjualan dan meminta data transaksi tersebut.

1.5.2 Metode Pembangunan Data Mining

Dalam penelitian ini mengikuti standar dari Cross-Industry Standard for Data Mining (CRISP-DM) merupakan suatu standar yang telah dikembangkan pada tahun 1996 yang ditunjukkan untuk melakukan proses analisis dari suatu

industri sebagai strategi pemecahan masalah dari bisnis satu unit penelitian [3]. Untuk data yang dapat di proses dengan CRSP-DM ini, tidak ada ketentuan atau karakteristik tertentu, karena data tersebut akan diproses kembali pada fase-fase di dalamnya.

Gambar 1. 1 Cross-Industry Standard for Data Mining (CRISP-DM)

Berikut ini adalah tahapan-tahapan yang akan dilakukan dalam penelitian ini sesuai dengan CRISP-DM :

a. Business understanding

(12)

5

b. Data understanding

Pada tahap pemahaman data ini terlebih dahulu akan mengumpulkan semua data yang diperlukan dari hasil data-data transaksi pejualan di CV. Sultan Jaya Mandiri periode April - Juni 2015.

c. Data preparation

Pada tahapan ini akan dilakukan proses pemilihan dan pengolahan data yang nantinya akan diperlukan dalam tahap pemodelan sehingga pemodelan yang dilakukan dapat memberikan hasil yang maksimal sesuai

dengan target yang diinginkan, data yang akan dipilih adalah data transaksi penjualan di CV. Sultan Jaya Mandiri periode Mei – Agustus 2015.

d. Modeling

Dalam tahapan pemodelan ini akan menggunakan teknik metode data mining dengan metode association rule dengan cara menemukan aturan asosiatif atau pola kombinasi barang berdasarkan hasil data transaksi, sehingga dapat diketahui barang apa saja yang sering dibeli secara bersamaan oleh konsumen.

e. Evaluation

Pada tahap evaluasi ini akan dibandingkan hasil fp-growth dilakukan oleh sistem dengan perhitungan manual, dengan mengambil beberapa sampel acak. Evaluasi ini ditujukan untuk mengukur apakah pemodelan yang dilakukan sesuai dengan tujuan pengimplementasian data mining pada sistem ini.

f. Deployment

Setiap tahap evaluasi dimana menilai secara detail hasil dari pemodelan, maka akan dilakukan pengimplementasian dari keseluruhan model yang telah dirancang. Selain itu juga dilakukan penyesuaian dari model

dengan sistem yang akan dibangun sehingga dapat menghasilkan suatu hasil yang sesuai dengan target pemahaman bisnis.

1.5.3 Metode Pembangunan Perangkat Lunak

(13)

dalam membangun software [4]. Metode waterfall melakukan pendekatan secara sistematis dan terurut, di mana tahap demi tahap yang akan dilalui harus menunggu selesainya tahap sebelumnya dan berjalan berurutan.

Gambar 1. 2 Model Waterfall

Tahap dari model waterfall adalah sebagai berikut: 1. Communication

Communcation adalah tahap awal dalam pembuatan perangkat lunak yang meliputi project initiation dan requirements gathering. Pada tahap ini seluruh kebutuhan yang diperlukan oleh sistem dan akan diaplikasikan dalam bentuk perangkat lunak dikumpulkan. Hal ini sangat penting, mengingat perangkat lunak harus dapat berinteraksi dengan elemen-elemen seperti hardware, dan lain-lain.

2. Planning

Planning adalah tahap perencanaan pembangunan perangkat lunak yang meliputi estimating, scheduling dan tracking. Pada tahap ini akan ditentukan bagaimana sebuah perangkat lunak akan dibuat berdasarkan kebutuhan yang telah dikumpulkan pada tahap sebelumnya.

3. Modelling

Modelling adalah tahap menganalisis dan memodelkan sebuah perangkat lunak kedalam sebuah model berupa blueprint. Sebuah model perangkat lunak harus dapat mengimplementasikan kebutuhan yang telah disebutkan

(14)

7

4. Construction

Construction adalah tahap implementasi sebuah model perangkat lunak kedalam bahasa komputer melalui proses coding kemudian dilakukan pengujian. Proses implementasi harus berdasarkan model yang telah dirancang sebelumnya dan harus diuji untuk menghindari terjadinya kesalahan (error).

5. Deployment

Deployment adalah tahap penyebaran perangkat lunak kepada pengguna. Pada tahap ini, perangkat lunak yang telah dibuat terus dikembangkan dan diperbaiki dengan adanya support kepada pengguna yang mengalami masalah dan feedback dari pengguna untuk pengembangan selanjutnya. 1.6 Sistematika Penulisan

Sistematika penulisan dalam penelitian ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan ini adalah sebagai berikut:

BAB 1 PENDAHULUAN

Bab ini membahas mengenai latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian, dan sistematika penulisan yang digunakan.

BAB 2 TINJAUAN PUSTAKA

Bab ini membahas tentang sejarah, logo, visi, misi, struktur organisasi dari CV. Sultan Jaya Mandiri dan berbagai konsep dasar dan teori-teori yang berhubungan dengan judul penelitian, seperti pengertian data, data mining, associaiton rule algoritma fp-growth, DFD, kamus data dan spesifikasi proses.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi tentang analisis dan perancangan sistem yang akan dibangun

(15)

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini menjelaskan tentang implementasi dan pengujian terhadap tingkat kekuatan dan keakuratan aturan-aturan asosiasi yang telah didapatkan berdasarkan pola penentuan paket penjualan barang yang telah diterapkan sesuai dengan algoritma fp-growth yang dihasilkan dari setiap jenis barang yang dikombinasikan serta hasil dari algoritma fp growth untuk penentuan paket penjualan barang. BAB 5 KESIMPULAN DAN SARAN

Bab ini berisi tentang kesimpulan dari hasil penelitian yang telah dilakukan dan

(16)

9

BAB 2

TINJAUAN PUSTAKA

2.1 Profil Instansi 2.1.1 Sejarah Instansi

CV.Sultan Jaya Mandiri yang berlokasi di Jalan Raya Nanggeleng No.53 Darangdan-Purwakarta, bergerak dalam bidang penjualan barang. Barang-barang yang dijual terdiri dari barang-barang kebutuhan sehari-hari seperti sembako, food, dan non-food.

Toko Sultan pertama kali berdiri pada tanggal 18 Agustus 2005, toko sultan menerapkan konsep swalayan dalam proses penjualannya, sehingga memudahkan konsumen untuk melihat dan memilih langsung produk yang akan dibeli. Toko sultan pada awalnya hanya menjual produk-produk secara retail, namun seiring meningkatnya omset penjualan maka toko sultan menjual produk dalam jumlah yang banyak atau grosir. Selain menjual produk dalam bentuk satuan, toko sultan pun menjual produk dalam bentuk paket dengan harga jual

lebih murah dibandingkan dengan membeli produk secara terpisah atau satuan. Pada tanggal 22 September 2014 Toko Sultan resmi menjadi badan usaha yang terdaftar dengan nama CV.Sultan Jaya Mandiri. Dan dari situlah Toko sultan mulai berkembang dan menjadi perusahaan distributor barang seperti saat ini. 2.1.2 Logo

Berikut adalah logo dari CV.Sultan Jaya Mandiri yang dapat dilihat pada Gambar 2.1:

(17)

1.1.3 Struktur Organisasi

Struktur organisasi instansi adalah gambar yang menerangkan posisi dan hierarki kerja di dalam suatu perusahaan. Struktur organisasi CV.Sultan Jaya Mandiri dapat dilihat pada Gambar 2.2:

Direktur

Manager

Operasional Keuangan

Gudang House Keeping Pelayan

Gambar 2. 2 Struktur Organisasi CV.Sultan Jaya Mandiri

Job Description

1. Direktur bertanggung jawab penuh terhadap perusahaan, tugas dan tanggung

jawabnya sebagai berikut :

a. Membuat perencanaan, strategi dan kebijakan yang menyangkut operasi

Perusahaan.

b. Menyusun anggaran kebutuhan persediaan produk.

c. Melakukan kontrol secara keseluruhan atau operasi Perusahaan.

d. Memegang kendali atas keputusan penting yang bersifat umum berkaitan

dengan keuangan.

2. Manager Operasional berfungsi untuk membantu Direktur, tugas dan tanggung

jawabnya adalah sebagai berikut :

a. Membantu Direktur dalam mengawasi Perusahaan.

b. Mengatur setiap bagian yang ada di Perusahaan agar menjalankan

(18)

11

3. Bagian Keuangan bertugas terhadap transaksi pelanggan, tugas dan tanggung

jawab sebagai berikut :

a. Bertanggung jawab terhadap hal-hal yang menyangkut keuangan. b. Menghitung pemasukan dan pengeluaran setiap bulannya.

c. Melayani pelanggan dalam pembayaran transaksi.

4. Bagian Gudang bertugas terhadap persediaan barang digudang, tugas dan

tanggung jawabnya sebagai berikut:

a. Bertanggung jawab terhadap hal-hal yang menyangkut persediaan barang.

b. Mengecek barang yang kosong. c. Mengecek barang kadaluarsa.

5. Bagian Pelayan berfungsi untuk melayani setiap pelanggan, tugas dan

tanggung jawab sebagai berikut :

a. Membantu dalam melayani pesanan-pesanan pelanggan. b. Melayani semua pesanan pelanggan.

6. Bagian House Keeping bertugas terhadap kebersihan dan kenyamanan pelanggan, tugas dan tanggung jawab sebagai berikut :

a. Bertanggung jawab terhadap kebersihan, baik di luar ataupun di dalam

lingkungan Perusahaan/Toko.

b. Membereskan dan membersihkan peralatan yang telah digunakan.

2.1.3 Visi dan Misi Instansi

Visi yang dijalankan perusahaan adalah menjadi perusahaan distributor lokal yang berkepanjangan. Misi perusahaan ada 2 jenis yaitu:

1. Produktif

Meningkatkan produktifitas perusahaan dan sumber daya manusianya agar perusahaan dapat terus berkembang kearah yang lebih baik.

2. Efisiensi

(19)

2.2 Landasan Teori

Landasan teori membahas mengenai materi atau teori apa saja yang digunakan sebagai acuan dalam membuat tugas akhir ini. Landasan teori yang di uraikan merupakan hasil studi literature, baik dari buku, maupun situs internet.

2.2.1 Data

Data adalah representasi fakta dunia nyata yang mewakili suatu objek seperti manusia (pegawai, siswa, pembeli, pelanggan), barang, hewan, peristiwa, konsep, keadaan, dan sebagainya, yang direkam dalam bentuk angka, huruf,

symbol teks, gambar, bunyi, atau kombinasinya [5]. Dalam pendekatan basis data tidak hanya berisi basis data itu sendiri tetapi juga termasuk definisi atau deskripsi dari data yang disimpan. Definisi data disimpan dalam sistem katalog, yang berisi informasi tentang struktur tiap berkas, tipe dan format penyimpanan tiap item data, dan berbagai konstrin dari data. Semua informasi yang disimpan dalam katalog ini biasa disebut meta-data [6].

2.2.2 Basis Data

Basis data adalah mekanisme yang digunakan untuk menyimpan informasi atau data. Informasi adalah sesuatu yang kita gunakan sehari-hari untuk berbagai alasan. Dengan basis data, pengguna dapat menyimpan data secara terorganisasi. Setelah data disimpan, informasi harus mudah diambil. Kriteria dapat digunakan untuk mengambil informasi. Cara data disimpan dalam basis data menentukan seberapa mudah mencari informasi berdasarkan banyak kriteria. Data pun harus mudah ditambahkan ke dalam basis data, dimodifikasi, dan dihapus [7].

Menurut Fathansyah [5], basis data sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti :

1. Himpunan kelompok data (arsip) yang saling berhubungan yang

diorganisasi sedemikian rupa agar kelak dapat dimanfaatkan kembali

dengan cepat dan mudah.

2. Kumpulan data yang saling berhubungan yang disimpan secara bersama

(20)

13

3. Kumpulan file/ tabel/ arsip yang saling berhubungan yang disimpan dalam

media penyimpanan elektronis.

2.2.2.1Data pada Basis Data dan Hubungannya Ada 3 jenis data pada sistem database, yaitu [8] :

1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data.

2. Data masukan (input data), data dari luar sistem yang dimasukan melalui peralatan input (keyboard), yang dapat merubah data operasional.

3. Data kelauran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional. 2.2.2.2 Keuntungan dan Kerugian Pemakain Sistem Database

Keuntungan [8] :

1. Terpeliharanya keselarasan data

2. Data dapat dipakai secara bersama-sama.

3. Memudahkan penerapan standarisaasi dan batas-batas pengamanan. 4. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari

setiap aplikasi.

5. Program /data independent. Kerugian [8]:

1. Mahal dalam implementasinya. 2. Rumit

3. Penanganan proses recoverybackup sulit.

4. Kerusakan pada sistem basis data dapat mempengaruhi.

2.2.3 Database Management System

(21)

serta mengolah data menjadi informasi yang dibutuhkan (DBMS = Database + Program Utilitas) [5].

2.2.4 Data Mining

Data mining, sering juga disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang digunakan karena ia termasuk bagian dari data mining [1].

Secara umum, definisi data mining dapat diartikan sebagai berikut [9]:

1. Proses penemuan pola yang menarik dari data yang tersimpan dalam

jumlah besar.

2. Ekstrasi dari suatu informasi yang berguna atau menarik (non-trivial,

implisit, sebelumnya belum diketahui potensi kegunaannya) pola atau pengetahuan dari data yang di simpan dalam jumlah besar.

3. Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap

data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti. 2.2.4.1Tahapan-tahapan Data Mining

Data mining sangat diperlukan terutama dalam mengelola data yang sangat besar untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi pengguna data mining. Alasan utama data mining sangat dibutuhkan dalam industri informasi karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran

atau berjumlah besar. Informasi iniliah yang nantinya sangat berguna untuk pengembangan. Berikut adalah langkah-langkah dalam data mining [1].

(22)

15

Gambar 2. 3 Tahapan Proses Data Mining Tahapan-tahapan data mining :

1. Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilangkan noise dan data yang

tidak konsisten. Pembersihan data ini juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya.

2. Integrasi data (data integration)

Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. Tidak jarang data yang diperlukan untuk data mining tidak hanya berasal dari satu database saja, tetapi bisa juga berasal dari beberapa database atau file teks. Integrasi data perlu dilakukan secara teliti dan cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan dapat menyesatkan proses pengambilan aksi nantinya.

3. Seleski data (data selection)

(23)

Sebagai contoh, dalam mencari nilai asosiasi suatu barang, data nama pelanggan dalam data transaksi tidak diperlukan, karena data nama pelanggan tersebut tidak diperlukan, data tersebut dapat dihilangkan. 4. Transformasi data (data transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan suatu format data khusus sebelum bisa diaplikasikan.

5. Proses mining

Proses utama dalam tahapan data mining, disaat inilah metode-metode yang digunakan diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

6. Evaluasi pola (pattern evaluation)

Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang didapat tidak sesuai, maka ada beberapa alternative yang dapat diambil, seperti menjadikannya umpan balik untuk memperbaiki proses data mining atau mencoba metode data mining lainnya yang lebih sesuai.

7. Presentasi pengetahuan (knowledge presentation)

Tahap terakhir dari proses data mining ini adalah bagaimana memformulasikan keputusan atau aksi dari hasil data mining yang didapat sehingga dapat dipahami oleh semua pihak.

2.2.4.2Metode - Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu [10] :

1. Deskripsi

(24)

17

profesional akan sedikit didukung dalam pemilihan presiden. deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik

pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah :

1. _{Prediksi harga beras dalam tiga bulan yang akan datang.}

2. _{Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan} jika batas bawah dinaikan.

4. Klasifikasi

Dalam klasifikasi, terdapat terget variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

1. _{Menentukan apakah suatu transaksi kartu kredit merupakan} transaksi yang curang atau bukan.

(25)

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma

pengklusteran mencoba untuk melakukan pembagian terhadap keselurahan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah :

1. Mendapatkan kelompok-kelompok konsumen untuk target

pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemesaran yang besar.

2. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap

perilaku finansial dalam baik maupun mencurigakan. 6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah :

1. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler

yang diharapkan untuk memberika respon positif terhadap penawaran upgrade layanan yang diberikan.

2. Menemukan barang dalam supermarket yang dibeli secara

(26)

19

2.2.5 Association Rule

Aturan asosiasi (Association rule) adalah salah satu teknik tentang ‘apa

bersama apa’. Ini bisa berupa transaksi di supermarket, misalnya seseorang yang membeli susu bayi juga membeli sabun mandi. Di sini berarti susu bayi bersama sabun mandi. Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan Market Basket [5].

Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola frequent itemset ditemukan, barulah mencari aturan asosiatif atau aturan keterkaitan yang memenuhui syarat yang telah ditentukan.

Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki Boolean variable yang akan menunjukan keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola Boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule.

Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditujukan sebagai berikut :

Kopi → susu [support = 2%, confidence = 60%]

Nilai support 2% menunjukan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60% yaitu menunjukan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.

Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Support (nilai penunjang) adalah presentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam aturan asosiasi.

(27)

a. Support : suatu ukuran yang menunjukan seberapa besar tingkat dominasi suatu

itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu

itemset layak untuk dicari confidence-nya ( misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukan bahwa

item A dan item B dibeli bersamaan).

b. Confidence : suatu ukuran yang menunjukan hubungan antara 2 item secara

conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh pelanggan jika pelanggan tersebut membeli sebuah item A).

Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk

confidence (minimum confidence).

Nilai support sebuah item diperoleh dengan rumus sebagai berikut[1] : x100%….. Persamaan (2.1)

Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut:

x100%..Persamaan (2.2)

Sedangkan nilai confidence dapat dicari setelah pola frekuensi munculnya sebuah

item ditemukan. Rumus untuk menghitung confidence adalah sebagai berikut: x100%…..Persamaan(2.3)

Berikut adalah contoh penerapan metode association rule :

Misalkan diberikan tabel data transaksi sebagai berikut dengan minimum support count = 2.

Tabel 2. 1 Data Transaksi

TID Items

1 B

2 B, D

(28)

21

TID Items

4 A, D, E 5 B, C

6 A, C

7 A

Yang mana nilai support count didapat dari :

x 100% = 2.14 ≈ 2 Frekuensi kemunculan tiap item dapat dilihat pada tabel berikut:

Tabel 2. 2 Frekuensi Kemunculan Tiap Karakter

Item Frekuensi

A 4

B 3

C 3

D 3

E 2

Karena contoh kasus dalam kemunculan item sudah frequent dalam setiap transaksi, sudah diurut berdasarkan frekuensi yang paling tinggi. Selanjutnya pada gambar di bawah ini memberikan ilustrasi mengenai pembentukan FP-Tree setelah pembacaan TID 2

Gambar 2. 4 Hasil Pembentukan FP-Tree setelah pembacaan TID 2

(29)

Gambar 2. 6 Hasil pembentukan FP-Tree setelah pembacaan TID 7

Diberikan 7 data transaksi dengan 5 jenis item seperti pada tabel di atas. Gambar 5-7 menunjukan proses terbentuknya FP-Tree setiap TID dibaca. Setiap simpul pada FP-Tree mengandung nama sebuah item dan counter support yang berfungsi untuk menghitung frekuensi kemunculan item tersebut dalam tiap lintasan transaksi.

Setelah FP-Tree terbentuk dari sekumpulan data transaksi maka, proses pencarian frequent itemset dengan menggunakan algoritma FP-Growth akan dilakukan yang dibagi menjadi tiga tahapan utama, yaitu:

a. Tahap pembangkitan conditional pattern base

Merupakan subdata yang berisi prefix path (lintasan awal) dan suffix pattern

(pola akhiran). Pembangkitan conditional pattren base didapatkan melalui FP-Tree yang telah dibangun sebelumnya.

b. Tahap pembangkitan conditional FP-Tree

Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar atau sama dengan minimum support count akan dibangkitkan dengan

conditional FP-Tree seperti pada tabel 2.3 dibawah ini.

Tabel 2. 3 Hasil Perhitungan Conditional Pattern Base dan Conditional FP-Tree

Item Conditional Pattern Base Conditional FP Tree E {{A,C,D:1}, {A,D:1}} {<A:2,D:2>}

D {{B:1}, {A,C:1}, {A:1}} {A:2}

(30)

23

c. Tahap pencarian frequent itemset.

Apabila conditional FP-Tree merupakan lintasan tunggal(single-path), maka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap

conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-Growth secara rekursif (proses memanggil dirinya sendiri) seperti contoh pada tabel 2.4 dibawah ini.

Tabel 2. 4 Hasil Frequent Itemset

Suffix Frequent Itemset

E E, A-E, D-E, A-D-E

D D, A-D

C C, A-C

Tabel 2. 5 Hasil Generate Rule

Rule Support Confidence (%)

A → E 2 (2/4)*100 = 50

E → A 2 (2/2)*100 = 100

A → D 2 (2/4)*100 = 50

D → A 2 (2/3)*100 = 66.67

A → C 2 (2/4)*100 = 50

C → A 2 (2/3)*100 = 66.67

D → E 2 (2/3)*100 = 66.67

E → D 2 (2/2)*100 = 100

A- D →E 2 (2/2)*100 = 100

D- E →A 2 (2/2)*100 = 100

2.2.6 Algoritma FP- Growth

(31)

diisi dengan hasil dari dataset yang telah didapat sebelumnya. Kunci untuk mendapatkan struktur pohon yang bisa didapatkan dengan proses lebih cepat untuk mencari item set yang besar menjadi sedikit dengan di urutkan secara

descending dari frekuensi yang ada dataset tersebut. Masing-masing item yang tidak mencapai kebutuhan minimum dari threshold tidak dimasukkan kedalam pohon, tapi dikeluarkan secara efektif dari dataset [14].

FP-Tree merupakan struktur penyimpanan data yang dimampatkan. FP-Tree dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-Tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-Tree semakin efektif. Kelebihan dari FP-Tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien.

Adapun FP-Tree adalah sebuah pohon dengan definisi sebagai berikut:

a. FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan berupa pohon yang beranggotakan item-item tertentu, dan sebuah tabel

frequentheader.

b. Setiap simpul dalam FP- Tree mengandung tiga informasi penting, yaitu label item, menginformasikan jenis item yang direpresentasikan simpul tersebut, support count, merepresentasikan jumlah lintasan transaksi yang melalui simpul tesebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar-lintasan, ditandai dengan garis panah putus-putus.

2.2.4.1Langkah-Langkah Proses Perhitungan Association Rule Dengan

Algoritma FP-Growth

Proses perhitungan association rule terdiri dari beberapa tahap adalah sebagai berikut [15] :

1. Membuat Header Item

(32)

25

mendapatkan item dan nilai support-nya, maka item yang tidak frequent

dibuang dan item diurutkan berdasarkan nilai support-nya. Header untuk item, disiapkan pada suatu array tertentu dan ditambahkan ketika membuat FP-Tree.

2. Membuat FP-Tree

FP-Tree dibangun dengan mencari item sesuai urutan pada item yang

frequent. Data transaksi tidak perlu diurutkan, dan untuk tiap item yang ditemukan bisa langsung dimasukkan ke dalam FP-Tree. Sesudah membuat root, tiap item yang ditemukan dimasukkan berdasarkan path

pada FP-Tree. Jika item yang ditemukan sudah ada, maka nilai support item tersebut yang ditambahkan. Namun jika path belum ada, maka dibuat node baru untuk melengkapi path baru pada FP-Tree tersebut. Hal ini dilakukan selama item pada transaksi masih ada yang

qualified, artinya memenuhi nilai minimum support. Jadi, item-item

yang ditemukan dalam transaksi akan berurutan memanjang ke bawah. Dalam struktur FP-Tree, diterapkan alur path dari child hingga ke root. Jadi, suatu path utuh dalam FP-Tree adalah dari child terbawah hingga ke root. Tiap node pada FP-Tree memiliki pointer ke parent, sehingga pencarian harus dimulai dari bawah.

3. Pattern Extraction

Pattern extraction dilakukan berdasarkan keterlibatan item pada suatu path. Di setiap path, diperiksa semua kombinasi yang mungkin dimana item tersebut terlibat. Di iterasi berikutnya dilakukan dengan melibatkan item berikutnya, tanpa melibatkan item sebelumnya, sehingga pattern yang sama tidak akan ditemukan dua kali pada path

yang sama. Bila item pertama suatu hasil kombinasi bukan item terakhir (sebelum root), maka kombinasi itemset tersebut masih bisa dikembangkan lagi.

4. Memasukkan setiap pattern yang ditemukan ke dalam PatternTree

(33)

sama dapat ditemukan pada path yang berbeda. Untuk itu digunakan struktur data Pattern Tree (lihat Gambar 2.5). Setiap node di Pattern Tree merepresentasikan dan menyimpan frekuensi suatu

pattern. Pattern Tree terdiri atas Pattern TreeNode yang menyimpan nilai item, nilai support dan dilengkapi dengan dua pointer yaitu untuk horisontal dan vertikal.

Misalnya pada node d:1 di atas, berarti terdapat pattern a-c-d bernilai

support 1. Kemudian bila ada pattern a-c-d lagi bernilai support n yang ditemukan dari FP-Tree maka nilai support 1 tersebut menjadi n+1. Contoh hasil lengkap dari PatternTree tersebut:

1. a:5 menggambarkan bahwa ada pattern a sebanyak 5 2. b:4 menggambarkan bahwa ada pattern a-b sebanyak 4 3. c:4 menggambarkan bahwa ada pattern a-b-c sebanyak 4 4. d:3 menggambarkan bahwa ada pattern a-b-c-d sebanyak 3 5. c:2 menggambarkan bahwa ada pattern a-c sebanyak 2 6. d:1 menggambarkan bahwa ada pattern a-c-d sebanyak 1 7. d:3 menggambarkan bahwa ada pattern a-d sebanyak 3 5. Mengurutkan dan Menyeleksi Pattern

Pattern yang tidak memenuhi minimum support, dihapus dari daftar

pattern. Pattern-pattern yang tersisa kemudian diurutkan untuk memudahkan pembuatan rules.

2.2.7 Inified Modelling Language (UML)

Unified Modeling Language (UML) adalah himpunan struktur dan teknik untuk pemodelan desain program berorientasi objek serta aplikasinya. Berikut adalah beberapa model yang digunakan dalam perancangan Data Mining

(34)

27

Pemaketan Produk di CV.Sultan Jaya Mandiri untuk menggambarkan sistem dalam UML:

1. Diagram Use Case

2. Diagram Kelas 3. Diagram Aktivitas 4. Diagram Objek

2.2.7.1 Diagram Use Case

Diagram use case adalah model fungsional sebuah sistem yang

menggunakan aktor dan use case. Use case adalah layanan (services) atau fungsi– fungsi yang disediakan oleh sistem untuk penggunanya.

Deskripsi Diagram Use Case:

1. Sebuah use case adalah dimana sistem digunakan untuk memenuhi satu atau lebih kebutuhan pemakai.

2. Use case merupakan awal yang sangat baik untuk setiap fase pengembangan berbasis objek, design testing, dan dokumentasi. 3. Use case menggambarkan kebutuhan sistem dari sudut pandang di

luar sistem.

4. Use case menentukan nilai yang diberikan sistem kepada

pemakainya.

5. Use case hanya menetapkan apa yang seharusnya dikerjakan oleh sistem, yaitu kebutuhan fungsional sistem.

6. Use case tidak untuk menentukan kebutuhan nonfungsional, misal: sasaran kerja, bahasa pemrograman.

2.2.7.2 Diagram Kelas

Diagram kelas adalah diagram UML yang menggambarkan kelas-kelas dalam sebuah sistem dan hubungannya antara satu dengan yang lain, serta

dimasukkan pula atribut dan operasi. Tahapan dari diagram kelas adalah sebagai berikut:

1. Mengidentifikasi objek dan mendapatkan kelas-kelasnya. 2. Mengidentifikasi atribut kelas-kelas.

(35)

4. Mengidentifikasi operasi pada kelas-kelas.

5. Mengidentifikasikan hubungan antar kelas dengan menggunakan

asosiasi, agregasi, dan inheritance (pewarisan). 2.2.7.3 Diagram Aktifitas

Diagram aktivitas adalah representasi grafis dari seluruh tahapan alur kerja. Diagram ini mengandung aktivitas, pilihan tindakan, perulangan dan hasil dari aktivitas tersebut[14]. Diagram ini dapat digunakan untuk menjelaskan proses bisnis dan alur kerja operasional secara langkah demi langkah dari komponen

suatu sistem.

2.2.7.4 Diagram Objek

(36)

29

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

3.1 Analisis Sistem

Analisis sistem adalah penguraian dari suatu informasi yang utuh kedalam bagian-bagian komponennya dengan maksud untuk mengidentifikasi dan mengevaluasi permasalahan, kesempatan, hambatan yang terjadi dan kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan. Analisis Sistem ini bertujuan untuk menjelaskan permasalahan yang muncul pada saat pembangunan sistem, hal ini bertujuan untuk membantu ketika proses perancangan sistem berlangsung. Tugas utama analisis sistem dalam tahap ini adalah menemukan kelemahan-kelemahan dari sistem yang berjalan sehingga dapat diusulkan perbaikannya. Dalam analisis sistem ini meliputi beberapa bagian, yaitu :

1. Analisis Masalah

2. Analisis Penerepan Metode CRISP-DM

3. Analisis Spesifikasi Kebutuhan Perangkat Lunak 4. Analisis Penerapan Kebutuhan Fungsional

5. Analisis Penerapan Kebutuhan Non Fungsional

3.1.1 Analisis Masalah

Analisis masalah yang dilakukan adalah melihat dan mengidentifikasi permasalahan atau kendala di dalam penelitian yang dilakukan. Masalah dapat

diartikan sebagai suatu pernyataan yang menyatakan tentang situasi yang memerlukan pemecahan. Perlu ada analisis masalah melalui rumusan masalah yang sudah ditentukan sebelumnya. Berdasarkan hasil pengamatan, diketahui bahwa analisis masalahnya adalah sebagai berikut :

1. Dalam menentukan barang-barang apa saja yang akan dijual secara paket,

(37)

2. Pemaketan produk dilakukan pada hari besar tertentu seperti idul fitri,

natal dan hari-hari besar lainnya.

3.1.2 Analisis Penerapan Metode CRISP-DM

Metode pembangunan perangkat data mining yang digunakan dalam penelitian ini adalah Cross-Industry Standard Process for Data Mining (CRISP-DM).

3.1.2.1 Pemahaman Bisnis

Tahapan pemahaman bisnis merupakan tahapan pertama dilakukan dalam

kerangka kerja CRISP-DM. Dalam tahapan bisnis ini terdapat beberapa tahapan lainnya, yaitu :

1. Tujuan Bisnis

Dalam proses bisnisnya CV. Sultan Jaya Mandiri mempunyai tujuan bisnis yaitu untuk memenuhi permintaan customer untuk meningkatkan penjualan.

2. Penentuan Sasaran Data Mining

Tujuan dari penerapan data mining pada pola pembelian customer

ini adalah untuk mengetahui bagaimana pola penentuan paket berdasarkan dari data yang sudah ada untuk meningkatkan penjualan.

3.1.2.2 Pemahaman Data

Dalam penelitian ini adalah data transaksi yang terjadi di CV. Sultan Jaya Mandiri yang berasal dari file microsoft excel (.xlsx). Namum pada tahap ini, data yang digunakan hanyalah data transaksi penjualan pada tanggal 01/04/2015. Berikut merupakan penjelasan dari masing-masing atribut yang terdapat pada tabel data transaksi yang dapat dilihat pada tabel 3.1 dibawah ini :

Tabel 3. 1 Struktur Data Transaksi

Keterangan

Fungsi Untuk mengetahui jenis produk –produk yang paling sering terjual oleh customer

Format Microsoft Excel (.xlsx)

(38)

31

Keterangan

Atribut Tanggal Transaksi Tanggal proses pembelian No Transaksi Nomor pembelian

Kode Barang Kode dari setiap barang

Nama Barang Nama barang yang dibeli

Kategori Kategori dari setiap nama barang

Jumlah Jumlah barang yang dibeli

Harga Harga brang yang dibeli Total Total harga yang dibeli

3.1.2.3Persiapan Data

Persiapan data adalah hal yang harus dilakukan dalam proses data mining,

karena tidak semua data atau atribut dalam data digunakan pada data mining. Proses ini dilakukan agar data yang akan digunakan sesuai dengan kebutuhan. Adapun tahapan-tahapan preprocessing data dalam penelitian ini adalah sebagai berikut :

1. Ekstraksi Data

Ekstraksi data dapat diartikan sebagai proses pengambilan data dari sumber data dalam rangka untuk melanjutkan proses pengolahan data

ketingkat selanjutnya ataupun untuk menyimpan data hasil ekstrak tersebut. Dalam penelitian ini, data yang berasal dari flat file berformat microsoft excel

di-ekstrak, kemudian disimpan kedalam sebuah database agar memudahkan dalam proses pengolahan data. Data yang digunakan sebanyak 171 record

dari 37 transaksi. Data transaksi penjualan terdapat dalam table D-1 dalam lampiran D.

2. Pembersihan Data

(39)

cleaning jumlah data menjadi 163 record dari 38 transaksi. Data yang telah dibersihkan dari hasil ekstraksi data terdapat dalam table D-2 dalam lampiran. 3. Pemilihan Atribut

Pemilihan atribut adalah proses pemilihan atribut data yang akan digunakan, sehingga data tersebut dapat diproses sesuai dengan kebutuhan

data mining. Dalam penelitian ini, atribut yang akan digunakan yakni no transaksi dan kode barang yang memiliki tujuan masing-masing, seperti pada no transaksi berguna untuk membedakan pembelian dari yang lain, kode

barang berguna untuk mengetahui barang apa saja yang dibeli dalam satu transaksi. Jumlah data setelah proses pemilihan atribut sebanyak 163 dari 37 transaksi. Hasil pemilihan atribut dapat dilihat pada table D-3 dalam lampiran D.

4. Setelah semua proses telah berhasil dilalui dan data transaksi telah sesuai

dengan kebutuhan yang diperlukan dalam proses data mining, maka data transaksi penjualan tersebut sudah dapat digunakan untuk diproses dalam sistem datamining dengan 163 record data dari 37 transaksi.

3.1.2.4Pemodelan

Pemodelan merupakan tahap untuk membuat model atau desain sistem yang akan dibangun. Didalam tahap ini akan dipilih metode yang cocok untuk menyelesaikan masalah di CV. Sultan Jaya Mandiri dalam pembuatan paket barang. Metode yang akan digunakan adalah metode associaiton rule dengan algoritma fp-growth.

Metode dasar association rule dibagi menjadi dua tahap yaitu tahap pencarian pola frekuensi tinggi dan pembentukan atau perhitungan asosiasi dari frekuensi yang sudah didapatkan.

1. Pencarian pola frekuensi tinggi

Tahap ini mencari pola item yang memenuhi syarat minimum dari nilai

(40)

33

dan memberikan nilai frequent, dimana nilai frequent tersebut didapat dengan cara menghitung kemunculan setiap barang pada data transaksi penjualan. Dari hasil perhitungan frequent dapat diketahui jumlah item

yang terdapat pada data transaksi sebanyak 65 item.

Adapun hasil pengolahan dapat dilihat pada table 3.2 dibawah ini.

(41)

Kode

kurang dari nilai minimum support yang telah ditentukan sebelumnya, dalam kasus ini nilai minimum support yang telah ditentukan adalah sebesar 3. Dimana item yang kurang dari 3 akan dihilangkan dan item yang memiliki frequent lebih atau sama dengan 3 akan akan digunakan untuk ke proses berikutnya. Setelah dilakukan proses eliminasi terhadap data yang tidak memenuhi minimum support, maka jumlah item yang memenuhi

(42)

35

Tabel 3. 3 Item Yang Memenuhi Minimum Support

Kode Kode mendapatkan data yang memenuhi nilai minimum support seperti pada tabel 3.3 diatas, selanjutnya melakukan proses pengurutan secara

descending dari kemunculan setiap frekuensi (frequent) yang muncul dan memberikan priority sebagai tanda dari setiap item yang memiliki

(43)

Berikut ini adalah hasil pengurutan frequent item berdasarkan proritas terdapat pada tabel 3.4.

Tabel 3. 4 Pemberian nilai Priority

Kode Barang Support Count Priority

ASK1 7 1

KKA1 7 2

TA1 6 3

GP1 5 4

MS2 5 5

BPK1 4 6

EJ1 4 7

FF1 4 8

GDC3 4 9

KBA1 4 10

MS1 4 11

SIAB1 4 12

SPAB1 4 13

AA1 3 14

BB1 3 15

BR1 3 16

ET1 3 17

FYK1 3 18

GM1 3 19

IRAB1 3 20

KAFM31 3 21

KB1 3 22

KLWC1 3 23

NB2 3 24

(44)

37

Kode Barang Support Count Priority

PK1 3 26

tertinggi atau nilai priority tertinggi akan didahulukan penulisannya. Pada tahap ini, jumlah transaksi yang didaptkan yaitu sebesar 37 transaksi. Hasil dari pengurutan data berdasarkan priority terdapat pada tabel 3.5.

Tabel 3. 5 Hasil Pengurutan data Berdasarkan Priority

No Transaksi Kode Barang

(45)

No Transaksi Kode

(46)

39

No Transaksi Kode Barang

5. Langkah selanjutnya membuat fp- tree. Berikut adalah tahap-tahap dalam pembuatan fp-tree yaitu :

1. Transaksi 137505 :BPK1, EJI1, KBA1, PO1

a. Lakukan pembacaan pada data transaksi pertama yang akan diproses. b. Lakukan pengecekan pada root yang diinisialisasikan dengan Null,

(47)

Null

BPK1:1

EJ1:1

KBA1:1

PO1:1

Gambar 3. 1 Hasil pembentukan FP-Tree Setelah Transaksi 137505

2. Transaksi 137506 :FF1, SPAB1, IRAB1

a. _{Lakukan pembacaan pada data transaksi kedua yang akan diproses.}

b. _{Lakukan pengencekan pada}_root_{, karena}_root_{sudah mempunyai} anak dan data yang dibaca berbeda dengan data yang dibaca

sebelumnya maka itu menjadi anak terakhir dari root dan menjadi

sibling dari node data pertama. Dan support count dari node tersebut bertambah 1.

FF1:1

SPAB 1:1

IRAB 1:1 Null

BPK1: 1

EJ1:1

KBA1

:1

PO1:1

Gambar 3. 2 Hasil pembentukan FP-Tree setelah Transaksi 137506

3. Transaksi 137507 :BPK1, SPAB1, BB1, IRAB1, PK1, PO1, RT1 a. Lakukan pembacaan pada data transaksi ketiga yang akan diproses. b. Lakukan pengencekan pada root, karena root sudah mempunyai

(48)

41

Gambar 3. 3 Hasil pembentukan FP-Tree setelah Transaksi 137507

4. Transaksi 137508 : NB2, SIAB1, BB1, KB1

a. Lakukan pembacaan pada data transaksi keempat yang akan

diproses.

b. Lakukan pengencekan pada root, karena root sudah mempunyai anak dan data yang dibaca berbeda dengan data yang dibaca sebelumnya maka itu menjadi anak terakhir dari root. Dan support count dari node tersebut bertambah 1.

Null

(49)

5. Transaksi 137542 :TA1, MS2, MS1

Setelah proses pembentukan tree trakhir maka terbentuklah tree dari semua transaksi yang akan digunakan seperti yang terdapat pada gambar 3.5 berikut ini.

Null

(50)

43

Pembentukan lengkap fp-tree dapat dilihat pada table D-4 dalam lampiran D. Setelah tahap pembangunan fp-tree dari sekumpulan data transaksi dilakukan, maka akan dilakukan pembangkitan conditional pattern base, conditional fp-tree, frequent pattern.

1. Tahapan Pembangkitan Conditional Pattern Base

Dalam tahap ini mencari support count terkecil dari setiap item sampai dengan terbesar berdasarkan hasil priority sebelumnya. Selanjutnya adalah mencari lintasan awal dan pola akhir untuk setiap item. Pembangkitan

conditional pattern base didapatkan melalui FP-Tree yang telah dibangun sebelumnya. Jumlah item yang didapatkan conditional pattern base-Nya adalah sebanyak 27 item. Berikut ini adalah hasil perhitungan conditional pattern base dapat dilihat pada table 3.6.

Tabel 3. 6 Hasil perhitungan Condiitonal Pattern Base

Items Conditional Pattren Base

TULM1  BPK1, NB2:1  TA1, GP1, GM1:1

TE1  GP1, MS2, AA1, PF1:1  RT1:1

 ET1:1

SOY1  FF1:1

 GDC3, AA1, KLWC1:1  BB1:1

RT1  BPK1, SPAB1, BB1, IRAB1,

PK1, PO1:1  MS2, MS1:1

PO1  BPK1, EJ1, KBA1:1

 BPK1, SPAB1, BB1, IRAB1,

PK1:1

(51)

PK1  BPK1, SPAB1, BB1, IRAB1:1  BPK1, FYK1:1

 ASK1:1

PF1  ASK1, KKA1, ET1  GP1, MS2, AA1:1  KKA1, FYK1:1

NB2  BPK1:1

 SIAB1, BB1, KB1:1

 ASK1, SIAB1, SPAB1, KB1:1

KLWC1  ASK1, KKA1:1  KKA1:1

 GDC3, AA1:1

KB1  SIAB1, BB1:1

 TA1, EJ1, KBA1, BR1:1  ASK1, SIAB1, SPAB1:1

KAFM31  TA1, GP1, BR1:1  TA1, BR1:1

 ASK1, KKA1, SPAB1:1

IRAB1  BPK1, SPAB1, BB1:1  , SPAB1:1

 FF1, SIAB1, AA1:1

GM1  TA1, GP1:1

 GP1, KBA1, MS2, EJ1:1  MS1:1

ET1  ASK1, KKA1:1

(52)

45

BB1  BPK1, SPAB1:1  SIAB1:1

AA1  FF1, SIAB1:1  GP1, MS2:1  GDC3:1

SPAB1  BPK1:1  FF1:1

 ASK1, SIAB1:1  ASK1, KKA1:1

SIAB1  FF1:1  TA1:1  ASK1:1

MS1  KBA1, MS2:1

 ASK1, MS2:1  MS2:1

KBA1  BPK1, EJ1:1  TA1, EJ1:1

 ASK1, KKA1, EJ1, GDC3:1  GP1:1

GDC3  ASK1, KKA1, EJ1:1

FF1  KKA1:1

EJ1  BPK1:1

 TA1:1

 ASK1, KKA1:1  GP1, KBA1, MS2:1

MS2  TA1:1

(53)

2. Tahap Pembangkitan Conditional FP-Tree

Pada tahap ini setiap item yang ada pada table 3.6 diatas akan dibuat

conditional fp-tree, dan apabila ada item yang support count-nya memenuhi minimum support maka akan dibangkitkan dengan conditional FP-Tree.

1. Tahap pembentukan conditional fp-tree untuk item TULM1 dengan

conditional pattern base { BPK1, NB2:1 }, { TA1, GP1, GM1:1} yaitu

null karena tidak memenuhi minimum support count ≥ 3 dan tidak

termasuk kedalam item yang frequent.

Null

BPK1:4

NB2:1

GM1:1 TA1:6

GP1:2

TULM 1:1

Gambar 3. 6 Lintasan Mengandung Simpul TULM1

2. Conditional Fp-tree untuk item TE1 dengan conditional pattern base { GP1, MS2, AA1, PF1:1} { RT1:1} {ET1:1} yaitu null karena walaupun support count-nya memenuhi nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

 GP1:1

GP1  TA1:2

(54)

47

Gambar 3. 7 Lintasan Mengandung SImpul TE1

3. Conditional Fp-tree untuk item SOY1 dengan Conditional Pattern Base { FF1:1} {GDC3, AA1, KLWC1:1} {BB1:1} yaitu null karena walaupun support count-nya memenuhi nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Null

Gambar 3. 8 Lintasan Mengandung Simpul SOY1

4. Conditional Fp-tree untuk item RT1 dengan Conditional Pattern Base

{BPK1, SPAB1, BB1, IRAB1, PKI1, PO1:1} {MS2, MS1:1} yaitu

null karena tidak memenuhi support count ≥ 3 dan tidak termasuk

(55)

Null

Gambar 3. 9 Lintasan Mengandung Simpul RT1

5. Conditional Fp-tree untuk item PO1 dengan Conditional Pattern Base

{BPK1, EJ1, KBA1:1} {BPK1, SPAB1, BB1, IRAB1, PK1:1} {GDC3, FYK1:1} yaitu null karena walaupun support count-nya memenuhi nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Gambar 3. 10 Lintasan Mengandung SImpul PO1

6. Conditional Fp-tree untuk item PK1 dengan Conditional Pattern Base

{BPK1, SPAB1, BB1, IRAB1:1} {BPK1, FYK1:1} {ASK1:1} yaitu

(56)

49

support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Null

Gambar 3. 11 Lintasan Mengandung Simpul PK1

7. Conditional Fp-tree untuk item PF1 demngan Conditional Pattern Base { ASK1, KKA1, ET1:1} {GP1, MS2, AA1:1} {KKA1, FYK1:1} yaitu null karena walaupun support count-nya memenuhi nilai

minimum support, tetapi pada proses pembangkitan tidak didapatkan

support count yang memenuhi nilai minimum support.

Null

Gambar 3. 12 Lintasan Mengandung Simpul PF1

8. Conditional Fp-tree untuk item NB2 dengan Conditional Pattern Base

(57)

minimum support, tetapi pada proses pembangkitan tidak didapatkan

Null

Gambar 3. 13 Lintasan Mengandung Simpul NB2

9. Conditional Fp-tree untuk item KLWC1 dengan Conditional Pattern Base {ask1, kka1:1} {KKA1:1} {GDC3, AA1:1} yaitu null karena walaupun support count-nya memenuhi nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Null

Gambar 3. 14 Lintasan Mengandung Simpul KLWC1

10. Conditional Fp-tree untuk item KB1 dengan Conditional Pattern Base

(58)

51

nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Null

Gambar 3. 15 Lintasan Mengandung Simpul KB1

11. Conditional Fp-tree untuk item KAFM31 dengan Conditional Pattern Base {TA1, GP1, BR1:1} {TA1, BR1:1} {ASK1, KKA1, SPAB1:1} yaitu null karena walaupun support count-nya memenuhi nilai

support count yang memenuhi nilai minimum support.

Null

Gambar 3. 16 Lintasan Mengandung Simpul KAFM31

(59)

Null

Gambar 3. 17 Lintasan Mengandung Simpul IRAB1

13. Conditional Fp-tree untuk item GM1 dengan Conditional Pattern Base

{TA1, GP1:1} {GP1, KBA1, MS2, EJ1:1} {MS1:1} yaitu null karena walaupun support count-nya memenuhi nilai minimum support, tetapi pada proses pembangkitan tidak didapatkan support count yang memenuhi nilai minimum support.

Null

Gambar 3. 18 Lintasan Mengandung Simpul GM1

14. Conditional Fp-tree untuk item ET1 dengan Conditional Pattern Base