• Tidak ada hasil yang ditemukan

Penerapan Data Mining Menggunakan Metode Association Rule pada Data Tansaksi Makmur Jaya Kosmetik

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan Data Mining Menggunakan Metode Association Rule pada Data Tansaksi Makmur Jaya Kosmetik"

Copied!
152
0
0

Teks penuh

(1)
(2)
(3)
(4)

RIWAYAT HIDUP PENULIS

DATA PRIBADI

Nama : Juwita Permata Sari

NIM : 10111651

Tempat, Tgl Lahir : Garut, 21 Januari 1994 Jenis Kelamin : Perempuan

Agama : Islam

Alamat : Kp. Cikantong RT 01 RW 04 Desa Sukmukti Kec Sukawening Kab.Garut 44184

No. Telp : 085793158271

E-Mail : juwitapermatasari21@gmail.com

PENDIDIKAN

Tahun 2011-2016 : Universitas Komputer Indonesia, Fakultas Teknik dan Ilmu Komputer, Jurusan Teknik Informatika, Jenjang Strata1.

Tahun 2008– 2011 : SMK YPPT GARUT Tahun 2005– 2008 : SMP Negeri 1 Sukawening Tahun 1999– 2005 : SD Negeri Sukamukti IV

(5)

PENERAPAN DATA MINING MENGGUNAKAN METODE

ASSOCIATION RULES PADA DATA TRANSAKSI MAKMUR JAYA

KOSMETIK

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

JUWITA PERMATA SARI

10111651

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

(6)

iii

penyusunan skripsi yang berjudul “PENERAPAN DATA MINING MENGGUNAKAN METODE ASSOCIATION RULES PADA DATA TRANSAKSI MAKMUR JAYA KOSMETIK” ini dengan baik.

Adapun tujuan dari penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika Universitas Komputer Indonesia.

Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai pihak dan berkah dari Allah SWT sehingga kendala-kendala yang dihadapi dapat diatasi. Untuk itu penulis menyampaikan rasa hormat dan terima kasih sebesar-besarnya kepada :

1. Allah Subhannahu wa Ta’ala yang telah mencurahkan rahmat dan karunia-Nya hingga saat ini.

2. Bapak Alif Finandhita, S.Kom., M.T. selaku dosen pembimbing yang telah meluangkan waktu, pikiran, memberikan motivasi, arahan, dan saran serta ilmu pengetahuannya kepada penulis dalam penyusunan skripsi ini.

3. Bapak Adam Mukharil Bachtiar, S.Kom., M.T. selaku dosen reviewer yang telah memberikan saran serta kritiknya dalam penyusunan skripsi ini.

4. Ibu Gentisya Tri Mardiani, S.Kom., M.Kom. selaku dosen wali yang telah memberikan banyak masukan dan kritikannya terhadap penyusunan tugas akhir ini.

(7)

iv

6. Ibu Ai Sumiarsih selaku manager di Makmur Jaya Kosmetik yang telah bersedia memberikan kesempatan kepada penulis untuk melakukan penelitian tugas akhir ini.

7. Ibunda Iis Liswati, Ayahanda Asep Saepudin, Mamah Hj Hasanah, Abah H.Memed (Alm), Apa Iya Juhriya(Alm) tercinta yang selalu memberi

dukungan, do’a dan semangat tanpa hentinya, terimakasih atas kasih sayang

yang tiada ada duanya.

8. Adik tersayang Sansan dan Wildan yang selalu memberi motivasi serta dukungan kepada penulis agar cepat menyelesaikan kuliah.

9. Teman - teman IF-14 angkatan 2011.

10. Teman – teman satu bimbingan Pak Alif Finandhita, S.Kom., M.T dan teman

– teman satu angkatan TA .

11. Sahabat yang tak terlupakan Idam, Tono, Rizal atas dukungan dan kebersamaanya selama ini, penulis tidak akan pernah melupakan masa-masa indah bersama kalian.

12. Teman – teman seperjuangan Keling, Lukman, Eza, Egi, Sisil yang rela bertukar pendapat dan berjuang bersama hingga akhir dalam mentuntaskan tugas akhir ini.

13. Sahabat tercinta Anti, Anna, Rifni, Farida, Gilang, Hesti, Iis, barudak Re’damz,

barudak A’TKJ 11, semua sahabat yang tidak bisa disebutkan satu persatu atas

dukungan, semangat dan motivasi serta selalu mendengarkan curhatan dikala galau melanda

14. Semua pihak yang tidak dapat penulis sebut satu persatu yang telah membantu dalam penyelesaian penulisan skripsi ini.

(8)

v

Bandung, 30 Juli 2016

(9)

vi

Contents

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... iv

DAFTAR GAMBAR ... vii

DAFTAR TABEL ... xii

DAFTAR SIMBOL ... xv

DAFTAR LAMPIRAN ... xx

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Perumusan Masalah ... 2

1.3 Maksud dan Tujuan ... 2

1.4 Batasan Masalah... 2

1.5 Metodologi Penelitian ... 3

1.5.1 Metode Pengumpulan Data ... 3

1.5.2 Metode Pembangunan Data mining ... 3

1.6 Sistematika Penulisan ... 5

BAB 2 TINJAUAN PUSTAKA ... 7

2.1 Profil Institusi ... 7

2.1.1 Sejarah Toko ... 7

(10)

vii

2.2.1 Data ... 9

2.2.2 Basis Data ... 10

2.2.3 Database Mangement System ... 11

2.2.4 Data Mining ... 11

2.2.5 Cross-Industry Standard Process for Data Mining (CRISP-DM) ... 14

2.2.6 Association Rule ... 17

2.2.7 Algoritma FP-Growth ... 19

2.2.8 FP – Tree ... 23

2.2.9 Unified Modeling Language (UML) ... 24

2.2.10 MySQL ... 26

BAB 3 ANALISIS DAN PERANCANGAN ... 27

3.1 Analisis Sistem ... 27

3.1.1 Analisis Masalah ... 27

3.1.2 Analisis Penerapan Metode Crisp-DM ... 27

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 93

3.1.3.1 Analisis Pengguna ... 93

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 93

3.2 Perancangan Sistem ... 112

3.2.1 Perancangan Class ... 112

3.2.2 Perancangan Basis data ... 116

3.2.6 Perancangan Struktur Menu ... 118

3.2.7 Perancangan Antar Muka ... 119

3.2.5 Perancangan Pesan ... 122

(11)

viii

4.1 Implementasi Sistem ... 124

4.1.1 Perangkat Keras yang Digunakan ... 124

4.1.2 Perangkat lunak yang digunakan ... 124

4.1.3 Implementasi Basis Data ... 125

4.1.4 Implementasi Antarmuka ... 126

4.2 Pengujian Sistem ... 127

4.2.1 Rencana Pengujian ... 127

4.2.2 Pengujian Fungsional ... 127

4.2.2 Kesimpulan Pengujian Fungsional ... 130

4.2.3 Pengujian Wawancara ... 130

4.2.4 Kesimpulan Pengujian Wawancara ... 131

4.2.5 Pengujian Hasil ... 131

4.2.7 Kesimpulan Pengujian Hasil ... 135

BAB 5 KESIMPULAN DAN SARAN ... 136

5.1 Kesimpulan ... 136

5.2 Saran ... 136

(12)

140

[2] P. Chapman, J. Clinton, R. Keber, T. Khabaza, T. Reinartz, C. Shearer and R. Wirth, CRISP-DM 1.0, Step-by-step data mining guide, 2000

[3] H.A.Fajar, Data Mining. Andi, 2013.

[4] Kusrini, Strategi Perancangan dan Pengolahan Basis Data, Andi, 2007. [5] B. Santoso, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan

Bisnis, Yogyakarta: Graha Ilmu, 2007.

[6] Yuhefizard, Database Management Menggunakan Microsoft Access 2003, Jakarta : PT. Elex Media Komputindo, 2008.

[7] Prasetyo Eko, Data Mining, Andi, 2012.

[8] J. Han and M. Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006.

[9] Kusrini and E. T. Lutfi, Algoritma Data Mining, Andi, 2009.

[10] J. Santoni, “Implementasi Data Mining Dengan Metode Market Basket

Analysis,” Teknologi Informasi dan Pendidikan, vol. 5, p.2, Sep.2012 [11] D.T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to

DATA MINING, Hoboken, New Jersey: John Wiley & Sons, Inc., 2005.

(13)

1

PENDAHULUAN

1.1 Latar Belakang Masalah

Makmur Jaya Kosmetik merupakan toko produk kosmetik yang paling besar di daerah Garut, berdiri sejak tahun 1996. Produk utama yang dijual di adalah produk-produk kebutuhan penunjang kecantikan, berbagai merk produk-produk bisa ditemukan di toko ini. Untuk mendapatkan produk yang diinginkan, konsumen akan berkontak langsung dengan pelayan toko dan melakukan transaksi pembelian. juga menawarkan paket produk kosmetik.

Dari hasil pengamatan, toko Makmur Jaya Kosmetik mengalami permasalah dalam pembentukan paket. Dari sekian banyak produk paket yang ditawarkan hanya sedikit paket yang dibeli oleh pelanggan, karena pasangan produk yang dijual dalam satu paket merupakan produk yang kurang dibutuhkan oleh pelanggan. Hal ini terjadi karena kurangnya pertimbangan dari pemilik toko terhadap pola pembelian konsumen dalam pembentukan paket, sehingga mengakibatkan melesetnya informasi dalam pembentukan paket penjualan produk kosmetik dan mengakibatkan terjadinya penumpukan barang di gudang sehingga barang tersebut menjadi kadaluarsa dan tidak bisa dijual lagi.

Data Mining memiliki banyak metode salah satunya adalah Association Rules.

Menurut "Data Preparationfor Data Mining" dalam Applied Artificial Intelligence (Zhang,Zhang, & Yang, 2003) Association Rule merupakan salah satu metode yang bertujuan untuk mencari pola yang sering muncul pada banyak transaksi, dimana setiap transaksi terdiri dari beberapa item. Untuk permasalahan pada toko dapat diatasi dengan metode Association Rule. Salah satu pengaplikasian dari Association Rule

(14)

himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data yang besar Pola pembelian yang didapat merupakan pola pembelian konsumen yang sering terjadi pada pembelian.

Berdasarkan masalah yang dihadapi di , maka perlu dilakukan suatu “

PENERAPAN DATA MINING MENGGUNAKAN METODE ASSOCIATION RULES PADA DATA TRANSAKSI MAKMUR JAYA KOSMETIK” Agar dapat mengetahui pola pembelian dari pelanggan dan memberikan informasi yang berguna kepada pihak untuk mengambil keputusan dalam membentuk paket penjualan produk kosmetiknya.

1.2 Perumusan Masalah

Berdasarkan uraian latar belakang masalah di atas maka rumusan masalahdalam penelitian ini adalah bagaimana menerapkan Data Mining

menggunakan metode Association Rules dengan algoritma FP-Growthuntuk rekomendasi pembentukan paket penjualan produk di toko .

1.3 Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membuat aplikasi Data Mining menggunakan metode

Association Rules dengan algoritma FP-Growth pada data transaksi penjualan untuk

rekomendasi pembentukan paket penjualan produk di toko .

Sedangkan tujuan yang ingin dicapai dalam pembangunan aplikasi ini adalah untuk menghasilkan informasi berupa rekomendasi paket penjualan produk kosmetik pada pihak .

1.4 Batasan Masalah

1. Data yang dianalisa merupakan data transaksi penjualan di periode Januari 2016.

2. Jenis item yang dicakup merupakan produk yang dijual, yaitu berupa jenis kosmetik berbagai merk.

(15)

4. Informasi yang dihasilkan berupa pola pembelian konsumen yang akan menjadi dasar sebagai pembentukan paket yang akan ditawarkan kepada konsumen.

1.5 Metodologi Penelitian

Metodologi penelitian merupakan suatu proses yang digunakan untuk memecahkan suatu masalah yang logis, dimana memerlukan data untuk mendukung terlaksananya suatu penelitian. Metodologi penelitian yang digunakan adalah metode deskriptif, yaitu metode yang menggambarkan fakta-fakta dan informasi dalam situasi atau kejadian dimasa sekarang secara sistematis, faktual dan akurat. Metodologi penelitian ini memiliki dua metode, yaitu metode pengumpulan data dan metode pembangunan perangkat lunak.

1.5.1 Metode Pengumpulan Data

Metode Metod epengumpulan data dapat diperoleh secara langsung dari objek penelitian dan referensi-referensi yang telah diperoleh. Cara-cara yang digunakan untuk mendapatkan data adalah sebagai berikut:

1. StudiLapangan

Studi lapangan adalah metode pengumpulan data yang dilakukan dengan mengadakan penelitian ke Toko . Studi lapangan ini dilakuka dengan dua cara, yaitu: a. Observasi

Observasi merupakan metode pengumpulan data dengan mengadakan penelitian dan peninjauan langsung ke Toko .

b. Wawancara

Wawancara merupakan metode pengumpulan data yang dilakukan dengan mengadakan tanya jawab secara langsung kepada area manager di Toko .

2. StudiLiteratur

(16)

1.5.2 Metode Pembangunan Data mining

Dalam penelitian ini mengikuti standar dari Cross-Industry Standard for Data

mining (CRISP-DM) merupakan suatu standar yang telah dikembangkan pada tahun

1996 yang ditunjukkan untuk melakukan proses analisis dari suatu industri sebagai strategi pemecahan masalah dari bisnis satu unit penelitian [3]. Untuk data yang dapat di proses dengan CRSP-DM ini, tidak ada ketentuan atau karakteristik tertentu, karena data tersebut akan diproses kembali pada fase-fase di dalamnya.

Gambar 1. 1 Cross Industri Standard for Data Mining(CRISP-DM)[4]

Berikut ini adalah tahapan-tahapan yang akan dilakukan dalam penelitian ini sesuai dengan CRISP-DM :

1. Business understanding

(17)

2. Data understanding

Pada tahap pemahaman data ini terlebih dahulu akan mengumpulkan semua data yang diperlukan dari hasil data-data transaksi penjualan di Makmur Jaya Kosmetik dari bulan Januari 2016. Dilanjutkan dengan proses pemahaman tentang data yang akan digunakan sebagai hipotesa untuk menemukan informasi yang tersembunyi.

3. Data preparation

Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data yang akan diproses pada tahap pemodelan/modeling) mengacu dari data transaksi penjualan Makmur Jaya Kosmetik dengan periode januari 2016. Pada tahap ini juga mencakup pemilihan tabel, record, dan atribut-atribut data, termasuk proses pembersihan untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling).

4. Modeling

Dalam tahapan pemodelan ini akan menggunakan teknik metode data mining

dengan metode association rule dengan cara menemukan aturan asosiatif atau pola kombinasi produk berdasarkan hasil data transaksi, sehingga dapat diketahui item produk mana saja yang sering dibeli oleh konsumen secara bersamaan.

5. Evaluation

Pada tahap evaluasi ini akan dibandingkan hasil Fp-growth dilakukan oleh sistem dengan perhitungan manual, dengan mengambil beberapa sampel acak. Evaluasi ini ditujukan untuk mengukur apakah pemodelan yang dilakukan sesuai dengan tujuan pengimplementasian data mining pada sistem ini.

6. Deployment

(18)

1.6 Sistematika Penulisan

Sistematika penulisan yang digunakan dalam penyusunan laporan tugas akhir ini adalah sebagai berikut :

BAB 1. PENDAHULUAN

Bab ini membahas mengenai Latar Belakang Masalah, Rumusan Masalah, Maksud dan Tujuan, Batasan Masalah, Metodologi Penelitian, dan Sistematika Penulisan yang digunakan.

BAB 2. TINJAUAN PUSTAKA

Bab ini membahas tentang sejarah, logo, visi, misi, struktur organisasi dari Makmur Jaya Kosmetik dan berbagai konsep dasar dan teori-teori yang berhubungan dengan judul penelitian, seperti pengertian data, data mining, associaiton rule algoritma Fp-growth , UML, kamus data dan spesifikasi proses.

BAB 3. ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi tentang analisis dan perancangan sistem yang akan dibangun berdasarkan data penjualan yang diperoleh dari Makmur Jaya Kosmetik dengan menggunakan data mining dengan metode associaiton rule menggunakan algoritma

Fp-growth

BAB 4. IMPLEMENTASI DAN PENGUJIAN

Bab ini menjelaskan tentang implementasi dan pengujian terhadap tingkat kekuatan dan keakuratan aturan-aturan asosiasi yang telah didapatkan berdasarkan pola pembelian yang telah diterapkan sesuai dengan algoritma Fp-growth .

BAB 5. KESIMPULAN DAN SARAN

(19)

7

TINJAUAN PUSTAKA

2.1 Profil Institusi

Makmur Jaya Kosmetik merupakan salah satu bidang usaha penjualan produk-produk kebutuhan kecantikan dan kebutuhan salon dari berbagai merk dalam negeri maupun merk dari luar negeri. Makmur Jaya Kosmetik berlokasi di Jln. Jend. A. Yani No.62 Garut

2.1.1 Sejarah Toko

Toko Makmur Jaya Kosmetik didirikan oleh ibu Hj. Ratna Rosita pada tahun 1986. Nama Makmur Jaya diambil dari nama anak beliau yang bernama Reka Makmur Jaya. Ide untuk mendirikan toko Makmur Jaya Kosmetik ini berawal dari banyaknya konsumen wanita yang sudah membutuhkan kosmetik dan pada saat itu toko kosmetik masih dibilang jarang. Toko Makmur Jaya Kosmetik awalnya adalah sebuah kios kecil biasa yang menjual merk dagang dalam negri. Seiring berkembangnya waktu, kebutuhan akan penunjang kecantikan khususnya bagi kaum wanita semakin bertambah. Pada saat ini Makmur Jaya Kosmetik sudah banyak menjual produk dalam dan luar negri seperti : Rista, Wardah, Ponds, LaTulipe, Tloac Paris, Tull Jye, Tje Fuk, jade, Bless dan lain-lain. Hingga akhirnya sampai sekarang Toko Makmur Jaya Kosmetik merupakan toko kosmetik terbesar dan terkemuka diwilayahnya.

2.1.2 Logo

(20)

Gambar 2. 1 Logo Toko

2.1.3 Visi dan Misi

Berikut adalah visi dan misi dari toko :

2.1.3.1 Visi

Visi dari toko adalah sebagai berikut:

1. Menjadi penyedia kosmetik yang aman, lengkap dan terpercaya, serta dapat memberikan pelayanan yang berkualitas

2.1.3.2 Misi

Misi dari toko adalah sebagai berikut:

1. Menyediakan produk kosmetik dari berbagai merk yang dibutuhkan oleh pelanggan

2. Menyediakan kosmetik yang aman yang memiliki label halal serta tercatat di Badan Pom

3. Memberikan pelayanan yang baik pada seluruh pelanggan

2.1.4 Struktur Organisasi

Struktur organisasi dari toko dapat dilihat dari gambar 2.2.

Pemimpin

Manager

Bag. Gudang Bag.

Keuangan

Karyawan Karyawan Karyawan

(21)

Deskripsi Jabatan :

1. Pemimpin

Pemimpin merupakan pemilik dari toko yang bertanggung jawab penuh terhadap segala sesuatu yang terjadi di toko .

2. Manager

Manager merupakan seseorang yang membantu pemimpin dalam mengontrol atau mengawasi segala kegiatan di toko .

3. Bag. Gudang

Bagian Gudang merupakan seseorang yang bertugas membantu pemilik dalam mengatur, mengelola, dan mencatat produk-produk yang ada digudang serta produk-produk yang akan dipesan untuk stok barang.

4. Bag. Keuangan

Bagian Keuangan merupakan seseorang yang bertugas untuk membantu pemilik dalam mencatat produk yang terjual dan transaksi yang telah terjadi.

5. Karyawan

Karyawan merupakan seseorang yang bertugas untuk melayani konsumen dalam melakukan pembelian dan transaksi pembayaran.

2.2 Landasan teori

Landasan teori yang berkaitan dengan materi atau teori yang digunakan sebagai acuan melakukan penenlitian. Landasan teori yang diuraikan merupakan hasil studi literatur, buku-buku, maupun situs internet.

2.2.1 Data

Data adalah segala fakta, angka atau teks yang dapat diproses oleh komputer. Data

dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data adalah sesuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data terdapat

himpunan data yang merupakan kumpulan dari objek dan atributnya. Atribut merupakan

(22)

dari sekumpulan record, yang masing-masing terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe data record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari record data, dimana tiap record (transaksi) meliputi satu set item

[3].

2.2.2 Basis Data

Basis data adalah kumpulan data yang saling berelasi. Data sendiri merupakan fakta mengenai obyek, orang, dan lain – lain. Data dinyatakan dengan nilai (angka, deretan karakter, atau symbol) [4].

Basis Data sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti[4] : 1. Himpunan kelompok data (arsip) yang saling berhubungan yang diorganisasi

sedemikian rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.

2. Kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.

3. Kumpulan file/ tabel/ arsip yang saling berhubungan yang disimpan dalam media penyimpanan elektronis.

2.2.2.1 Data pada Basis Data dan Hubungannya

Ada 3 jenis data pada sistem database, yaitu [5] :

1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data

2. Data masukan (input data), data dari luar sistem yang dimasukan melalui peralatan input (keyboard), yang dapat merubah data operasional.

3. Data kelauran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional.

2.2.2.2 Keuntungan dan Kerugian Pemakaian Sistem Database

Keuntungan [5] :

(23)

2. Data dapat dipakai secara bersama-sama.

3. Memudahkan penerapan standarisaasi dan batas-batas pengamanan. 4. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari setiap aplikasi.

5. Program /data independent. Kerugian :

1. Mahal dalam implementasinya. 2. Rumit

3. Penanganan proses recoverybackup sulit.

4. Kerusakan pada sistem basis data dapat mempengaruhi.

2.2.3 Database Mangement System

Database Management System atau disingkat DBMS adalah perangkat lunak

(software) yang berfungsi untuk mengelola database. Mulai dari membuat database itu sendiri, sampai dengan prosesyang berlaku dalam database tersebut, baik berupa entry, edit, hapus, query terhadap data, membuat laporan dan lain sebagainya secara efektif dan efesien. Salah satu jenis DBMS yang sangat terkenal saat ini adalah Relational DBMS (RDBMS), RDBMS mempresentasikan data dalam bentuk tabel – tabel yang saling berhubugan. Sebuah tabel disususn dalam bentuk baris (record) dan kolom (field) [6].

2.2.4 Data Mining

Data mining adalah proses untuk mendapatkan informasi yang berguna dari gedung basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Istilah

data mining kadang disebut juga knowledge discovery. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model, kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam

basis data yang tersimpan. Dalam data mining, pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat megetahui pola universal data-data yang ada [7].

(24)

1. Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar.

2. Ekstrasi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui potensi kegunaannya) pola atau pengetahuan dari data yang di simpan dalam jumlah besar.

3. Eksplorasi dari analisa secara otomatis atau semiotomatis terhadap data data dalam jumlah besar untuk mencari pola dan aturan yang berarti.

2.2.4.1 Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang

dapat dilakukan, yaitu [9] : 1. Deskripsi

Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat mengumpulkan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

(25)

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah :

1. Prediksi harga beras dalam tiga bulan yang akan datang.

2. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan.

4. Klasifikasi

Dalam klasifikasi, terdapat terget variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.

2. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk class objek-objek yang memiliki kemiripan.

Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi,

algoritma pengklusteran mencoba untuk melakukan pembagian terhadap

(26)

1. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar.

2. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.

3. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah : 1. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler

yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.

2. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

2.2.5 Cross-Industry Standard Process for Data Mining (CRISP-DM)

Cross-Indutry Standard Prosess for Data Mining (CRISP-DM) yang

(27)

Fase-fase dari CRISP-DM [11] : 1. Business understanding

a. Penentuan tujuan objek dan kebutuhan secara detail dalam lingkup bisnis atau unit penelitian secara keseluruhan.

b. Menilai situasi objek untuk mengetahui sumber daya yang tersedia.

c. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.

2. Data understanding

a. Mengumpulkan data.

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal.

c. Mengevaluasi kualitas data.

d. Jika diinginkan, pilih sebagian kecil grup data yang mungkin mengandung pola dari permasalahan.

(28)

3. Data preparation

a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk

keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif.

b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.

c. Lakukan perubahan pada beberapa variabel jika dibutuhkan.

d. Sipakan data awal sehingga siap untuk perangkat pemodelan.

4. Modelling

a. Pilihan dan aplikasikan teknik pemodelan yang sesuai.

b. Membangun model yang digunakan.

c. Menilai model yang digunakan.

d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk

menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.

e. Aturan bisnis pembentukan paket

5. Evaluation

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk

digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.

(29)

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6. Deployment

a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.

b. Contoh sederhana penyebaran : pembuataan laporan.

c. Contoh kompleks penyebaran : penerapan proses data mining secara paralel pada departemen lain.

2.2.6 Association Rule

Aturan asosiasi (Association rule) adalah salah satu teknik tentang ‘apa

bersama apa’. Ini bisa berupa transaksi di supermarket, misalnya seseorang yang

membeli susu bayi juga membeli sabun mandi. Di sini berarti susu bayi bersama sabun mandi. Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga sering dinamakan Market Basket [10].

Untuk mencari association ruledari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset

adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola

frequent itemset ditemukan, barulah mencari aturan asosiatif atau aturan keterkaitan yang memenuhui syarat yang telah ditentukan.

Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki Booleanvariable yang akan menunjukan keberadaannya atau tidak barang tersebut dalam satu transaksi atau satu keranjang belanja. Pola

Boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara

bersamaan. Pola tersebut dirumuskan dalam sebuah association rule. Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditujukan sebagai berikut :

(30)

Nilai support 2% menunjukan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence

60% yaitu menunjukan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.

Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Support (nilai penunjang) adalah presentase kombinasi

item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar-item dalam aturan asosiasi.

Dalam menentukan suatu association rule, terdapat suatu ukuran kepercayaan yang didapat dari hasil pengelolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran, yaitu:

1) Support : suatu ukuran yang menunjukan seberapa besar tingkat dominasi suatu

itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu itemset

layak untuk dicari confidence-nya ( misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukan bahwa item A dan

item B dibeli bersamaan).

2) Confidence : suatu ukuran yang menunjukan hubungan antara 2 item secara

conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh

pelanggan jika pelanggan tersebut membeli sebuah item A).

Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support

(minimum support) dan syarat minimum untuk confidence (minimum confidence).

Nilai support sebuah item diperoleh dengan rumus sebagai berikut[11] :

� � A =� �ℎ � � � � � � � � ��� � �x100%….. Persamaan (2.1)

Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut:

(31)

Sedangkan nilai confidence dapat dicari setelah pola frekuensi munculnya sebuah item

ditemukan. Rumus untuk menghitung confidence adalah sebagai berikut:

� � =J Ja a aa a a ya ya a a a x100%…..Persamaan(2.3)

2.2.7 Algoritma FP-Growth

Algoritma fp-growth merupakan salah satu alternatif algoritma yang cukup efektif untuk mencari himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data yang besar. Algoritma fp-growth merupakan algoritma

association rules yang cukup sering dipakai. Algoritma fp-growth ini dikembangkan

dari algoritma apriori. Algoritma apriori menghasilkan kombinasi yang sangat banyak sehingga sangat tidak efisien.

Algoritma fp-growth ini merupakan salah satu solusi dari algoritma apriori yang memakan waktu yang sangat lama karena harus melakukan pattern matching yang secara berulang-ulang. Sedangkan dalam proses algoritma fp-growth terdapat banyak kelebihan yang terbukti sangat efisien karena hanya dilakukan pemetaan data atau scan

database sebanyak 2 kali untuk membangun struktur ”tree”. Maka dari itu, algoritma

fp-growth dikenal juga dengan sebutan algoritma FP-Tree . Dengan menggunakan

struktur FP-Tree , algoritma fp-growth dapat langsung mengekstrak frequent itemset

dari susunan FP-Tree yang telah terbentuk. Metode fp-grwth dapat dibagi menjadi 3 tahapan utama yaitu sebagai :

1) Tahap Pembangkitan conditional pattern base.

Conditional Pattern Base merupakan sub database yang berisi prefix path dan

suffix pattern. Pembangkitan conditinal pattern base didapatkan melalui

FP-Tree yang telah dibangun sebelumnya.

2) Tahap Pembangkitan Conditional FP-Tree

Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count

(32)

3) Tahap Pencarian frequent itemset

Apabila conditional FP-Tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dnegan melakukan kombinasi item untuk setiap

conditional FP-Tree . Jika bukan lintasan tunggal, maka dilakukan

pembangkitan FP-Growth secara rekursif.

Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk mendapat

frequent itemset,yang dapat dilihat pada algoritma berikut :

Contoh kasus penerapan Algoritma FP-Growth

Input : FP-Tree Tree

Output : Rt Sekumpulan lengkap pola frequent Method : FP-Ggrowth ( Tree, null )

Procedure : FP-Growth ( Tree, _ ) {

01 : if Tree mengandung single path P;

02 : then untuk tiap kombinasi ( dinotasikan _ ) dari node node dalam path do 03 : bangkitkan pola _ _ dengan support daro node-node dalam _;

04 : else untuk tiap a1 dalam header dari Tree do

{

05 : bangkitkan pola

06 : bangun _ = a1 _ dengan support = a1. Support

07 : if Tree _ = _

(33)

-Misalkan didapat hasil dari tabel pembangkitan conditional pattern base

sebagai berikut, diketahui sebelumnya nilai minimum support 5%.

a. Tahap Pembangkitan Conditional Pattern Base

Tabel 2. 1 Conditional Pattern Base

Item Conditional Pattern Base

1 2,3, 1:6

b. Tahap Pembangkitan Conditional FP-Tree

Pada tahap ini, support count dari setiap item dijumlahkan, lalu setiapdan dibandingkan dengan conditional fp - tree

- Conditional fp – tree 1: { 2,4,3 }

Karena support count 1 adalah 6, maka memenuhi minimum support yaitu 4. Berikut adalah tahap-tahap pembangkitan conditional FP-Tree 1.

- Pada lintasan yang berakhiran {1} dengan support count 1 atau lebih yang dimilikinya akan dihilangkan dan support count yang melewati

lintasan pertama atau lintasan lainnya yang berakhiran {1}, akn disamain sesuai dengan support count yang dimilikinya.

(34)

- Proses selanjutnya adalah apabila dalam suatu lintasan, melintasi dua atau lebih, maka support count akan selalu bertambah 1

Setelah proses pembangkitan, proses terakhir adalah mencari frequent itemset yang keluar. 2:6 dan 3:6 adalah item yang keluar

Gambar 2. 6 Conditional FP-Tree 1,2:6 Hasil Frequent Itemset

Gambar 2. 7 Conditional FP-Tree 1,3:6 Hasil Frequent Itemset

c. Tahap Pencarian frequent itemset

- Akumulasiakn count setiap item

- Buat conditional FP-Tree

(35)

Gambar 2. 8 Conditional FP-Tree Untuk Item Frequenset 1, 2:6

2.2.8 FP Tree

FP-Tree merupakan struktur penyimpanan data yang dimampatkan. FP-Tree

dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-Tree . Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-Tree semakin efektif. Kelebihan dari FP-Tree

adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien. Adapun FP-Tree adalah sebuah pohon dengan definisi sebagai berikut :

1. FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan pohon yang beranggotakan item-item tertentu, dan sebuah tabel frequent header.

2. Setiap simpul dalam FP-Tree mengandung tiga informasi penting, yaitu

label item, menginformasikan jenis item yang dipresentasikan simpul

(36)

tersebut, support count merepresentasikan jumlah lintasan transaksi yang melalui simpul tersebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar lintasan, ditandai dengan garis putus-putus.

2.2.9 Unified Modeling Language (UML)

Unified Modeling Language (UML) adalah himpunan struktur dan teknik untuk

pemodelan desain program berorientasi objek serta aplikasinya. Berikut adalah beberapa model yang digunakan dalam perancangan Data Mining Pemaketan Produk untuk menggambarkan sistem dalam UML:

1. Diagram Use Case

2. Diagram Class 3. Diagram Aktivitas 4. Diagram Objek

2.2.9.1. Diagram Use Case

Diagram use case adalah model fungsional sebuah sistem yang menggunakan aktor dan use case. Use case adalah layanan (services) atau fungsi–fungsi yang disediakan oleh sistem untuk penggunanya.

Deskripsi Diagram Use Case:

1. Sebuah use case adalah dimana sistem digunakan untuk memenuhi satu atau lebih kebutuhan pemakai.

2. Use case merupakan awal yang sangat baik untuk setiap fase

pengembangan berbasis objek, design testing, dan dokumentasi.

3. Use case menggambarkan kebutuhan sistem dari sudut pandang di luar

sistem.

4. Use case menentukan nilai yang diberikan sistem kepada pemakainya.

5. Use case hanya menetapkan apa yang seharusnya dikerjakan oleh

(37)

6. Use case tidak untuk menentukan kebutuhan nonfungsional, misal: sasaran kerja, bahasa pemrograman.

2.2.9.2 Diagram Class

Diagram class adalah Diagram UML yang menggambarkan class

-class dalam sebuah sistem dan hubungannya antara satu dengan yang lain, serta dimasukkan pula atribut dan operasi. Tahapan dari Diagram class adalah sebagai berikut:

1. Mengidentifikasi objek dan mendapatkan class-classnya. 2. Mengidentifikasi atribut class-class.

3. Mulai mengkonstruksikan kamus data. 4. Mengidentifikasi operasi pada class-class.

5. Mengidentifikasikan hubungan antar class dengan menggunakan

asosiasi, agregasi, dan inheritance (pewarisan).

2.2.9.3 Diagram Aktifitas

Diagram aktivitas adalah representasi grafis dari seluruh tahapan alur kerja. Diagram ini mengandung aktivitas, pilihan tindakan, perulangan dan hasil dari aktivitas tersebut. Diagram ini dapat digunakan untuk menjelaskan proses bisnis dan alur kerja operasional secara langkah demi langkah dari komponen suatu sistem.

2.2.9.4 Diagram Objek

Diagram objek adalah suatu Diagram yang berfungsi untuk mengatur

(38)

Diagram objek, dapat berguna. Sebuah Diagram objek dasarnya instansiasi semua atau bagian dari Diagram class

2.2.10 MySQL

MySQL adalah multiuser database yang menggunakan bahasa structured

Query Language (SQL). MySQL dalam operasi client server melibatkan server

daemon MySQL di sisi server dan berbagai macam program serta library yang berjalan di sisi client. MySQL mampu menangani data yang cukup besar. Perusahaan yang mengembangkan MySQL yaitu TcX, mengaku bahwa MySQL yang mampu menyimpan data lebih dari 40 database, 10.000 tabel dan sekitar 7 juta baris, totalnya kurang lebih 100 Gigabyte data [12].

(39)

27

ANALISIS DAN PERANCANGAN

3.1 Analisis Sistem

Analisis sistem (System Analysis) dapat didefinisikan sebagai penguraian dari suatu sistem informasi yang utuh ke dalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan mengevaluasi permasalahan-permasalahan, kesempatan-kesempatan, hambatan-hambatan yang terjadi dan kebutuhan-kebutuhan yang diharapkan sehingga dapat diusulkan perbaikan-perbaikannya. Dalam analisa sistem ini meluputi beberapa bagian, yaitu :

1. Analisis Masalah

2. Analisis Penerapan Metode Crisp-DM

3. Analisis Prosedur Penentuan Paket Produk Kosmetik 4. Analisis Spesifikasi Kebutuhan Perangkat Lunak

3.1.1 Analisis Masalah

Berdasarkan hasil pengamatan, dapat disimpulkan bahwa permasalahan yang ada di toko yaitu belum adanya informasi penentuan paket produk kosmetik yang sesuai dengan minat konsumen yang akan ditawarkan.

3.1.2 Analisis Penerapan Metode Crisp-DM 3.1.2.1Pemahaman Bisnis

Pemahaman Bisnis atau disebut dengan Business Understanding merupakan tahapan pertama yang dilakukan dalam kerangka kerja CRISP-DM. Dalam tahapan bisnis ini terbagi menjadi dua bagian, yaitu:

1. Penentuan Tujuan Bisnis

Menjual produk dalam bentuk paket untuk memenuhi permintaan konsumen dan menghasilkan keuntungan untuk perusahaan.

(40)

Menilai situasi merupakan tahapan untuk menjelaskan sumber daya yang tersedia di Makmur Jaya Kosmetik. Berikut Merupakan sumber daya yang ada pada Makmur Jaya Kosmetik

1. Sumber Daya Perangkat Keras

1.1Terdapat Alat penunjang transaksi yaitu, printer thermal dan cashdrawer (laci Kasir)

1.2Komputer 2. Sumber daya data

2.1Sumber daya data yang di Makmur Jaya Kosmetik yaitu data transaksi penjualan.

2.2Sumber daya data ini bersifat internal yaitu tersimpan di database Makmur Jaya Kosmetik

3. Sumber data personil

3.1Pegawai kasir yang bertugas melakukan transaksi pembeli , mencetak nota dan membuat laporan penjualan yang akan di serahkan ke manager.

4. Kebutuhan

4.1Data yang digunakan dalam penelitian ini adalah data transaksi penjualan.

5. Asumsi

5.1Data transaksi yang digunakan merupakan hasil import dari aplikasi kasir di Makmur Jaya Kosmetik dengan format database (.sql) 5.2Data transaksi yang digunakan periode bulan Januari 2016 6. Batasan

(41)

3. Penentuan Sasaran Data Mining

Mengetahui keterkaitan produk yang sering dibeli oleh kosumen sehingga bisa dijadikan acuan dalam penentuan paket produk.

3.1.2.2Pemahaman Data

Tahapan pemahaman data dimulai dengan pengumpulan data awal dan hasil kegiatan untuk mengidentifikasi masalah data, untuk mendetekdi subset menarik untuk membetuk hipotesis untuk informasi yang tersembunyi.

1. Mengumpulkan Data Awal

Sumber yang didapat adalah data transaksi di Makmur Jaya Kosmetik. Yang dapat dilihat di Gambar 3.1.

(42)

Data yang ada saat ini merupakan bentuk tidak normal, untuk memudahkan proses analisis dalam data miningmaka dilakukan proses normalisasi. Berikut adalah tahapan proses normalisasi:

a. Tahap 1: Bentuk unnormalize

Tabel 3. 1 Bentuk Unnormalize Data Transaksi

b. Tahap 2: Bentuk Normal Ke-1

Tabel 3. 2 Bentuk Norma ke-1

Nama toko Alamat

toko

Tlp toko

No Faktur Tang

gal

Kode Nama Produk Qty Harga Jumla

h

Total Harga

Makmur

16010001 01/01

/2016

01/01/2016 WFS60 Wardah Facial Scrub 60 ml

1 3900 0

39000 5541500

1601000

22500 5541500

1601000 1

01/01/2016 CHPWGU V40

CITRA HAZ

SPOTLES WHITE GLOW UV 40 G

1 1050 0

10500 5541500

1601000

(43)

2. Mendeskripsikan Data

Tahap kedua dalam pemahaman data adalah mendeskripsikan data dengan tujuan untuk memahami data yang didapat dari hasil pengumpulan data awal. Berikut merupakan penjelasan dari masing-masing atribut yang terdapat pada tabel transaksi yang dapat dilihat pada tabel 3.1 dibawah ini :

Tabel 3. 3Struktur Data Transaksi Penjualan

Dokumen Keterangan

Detail Data

Transaksi

Deskripsi Data ini berisi mengenai data transaksi yang ada di toko

Format Microsoft Excel (.xlsx)

Atribut No Faktur Nomor struk

Tanggal Tanggal pencetakan struk

Kode Kode barang yang dibeli

Nama Produk Nama barang yang dibeli

Qty Jumlah barang yang dibeli

Harga Harga barang yang dibeli

Jumlah Harga Barang dikalikan dengan Qty

Total Harga Total harga dari barang yang dibeli

3.1.2.2.3 Verify Data Quality (Verifikasi Kualitas Data)

Dari data transaksi yang didapat terdapat noise, noise yaitu data transaksi yang hanya memiliki 1 barang dalam sekali transaksi sehingga data tersebut perlu dihilangkan dikarenakan data tersebut akan mempengaruhi proses mining kedepanya. Maka dari itu data – data yang memiliki noise akan dilakukan pembersihan data pada tahap berikutnya.

1601000 1

01/01/2016 KS35 KAPAS SARIAYU 35

01/01/2016 PSHPAD17 0

22000 5541500

1601000 1

01/01/2016 WLDCS30 S1

Wardah Lig Day Cream Step 1 30 gr

1 2400 0

(44)

3.1.2.3Data Preparation

Persiapan Data merupakan tahap dimana akan dilakukan pemilihan tabel dan

field yang akan digunakan dalam proses mining. Persiapan data dilakukan dengan sebutan Preprocessing Data. Preprocessing merupakan hal yang harus dilakukan dalam proses data mining, karena tidak semua data atau atribut data dalam data digunakan dalam proses data mining. Proses ini dilakukan agar data yang digunakan sesuai dengan kebutuhan. Adapun tahapan-tahapan preprocessing data dalam penelitian ini adalah sebagai berikut:

1. Ekstrasi Data

Ekstraksi data dapat diartikan sebagai proses pengambilan data dari sumber data dalam rangka untuk melanjutkan proses pengolahan data ke tingkat selanjutnya ataupun untuk menyimpan data hasil ekstrak tersebut. Dalam penelitian ini, data yang berasal dari flat file berformat microsoft excel (.xlsx) di ekstrak kedalam format sql, kemudian disimpan kedalam sebuah database agar memudahkan dalam proses pengolahan data. Berikut merupakan contoh sampel data transaksi 1 bulan periode bulan Januari sebanyak 30 transaksi yang terdapat di toko , dimana atribut-atribut yang terdapat dalam data tersebut antara lain No, No Faktur, Tanggal, Kode Barang, Nama Barang, Varian, Harga Barang, Qty, Jumlah, dan Total Harga.

2. Pemilihan Atribut ( Select Data)

Proses pemilihan atribut atau selection data adalah proses dimana atribut data akan dipilih dan diproses sesuai dengan kebutuhan data mining. Sebelum melakukan proses cleaning atau pembersihan data akan lebih efisien jika melakukan proses

selection atau pemilihan atribut ini terlebih dahulu. Karena dari data transaksi yang sebanyak ribuan record ini memiliki 10 atribut sedangkan yang dibutuhkan untuk data

mining hanya 2 atribut. Dengan menyeleksi atribut yang tidak dibutuhkan akan

(45)

tidak perlu. Dalam penelitian ini, 2 atribut yang akan digunakan adalah atribut No Faktur dan Kode. K edua atribut ini digunakan untuk memenuhi tujuan awal dimana akan dicari pola pembelian konsumen berdasarkan produk yang dibeli. Seperti atribut No Faktur digunakan untuk membedakan satu transaksi dengan transaksi lainnya, dan atribut Kode digunakan untuk mengetahui produk apa saja yang dibeli dalam satu transaksi.

Tabel 3. 4 Pemilihan Atriburt

NoFaktur Kode NoFaktur Kode

16010001 WFS60 16010014 PELB

16010001 PCSAC40 16010014 WFSNDS

16010001 CHPWGUV40 16010015 WLCF60

16010001 LTMC120 16010015 PCSAC40

16010001 KS35 16010015 MSDHM500

16010001 PAR 16010015 PFLC25

16010001 PSHPAD170 16010015 PCSACWFF50

16010001 WLDCS30S1 16010016 CHPWGUV40

16010002 WFS60 16010016 LTMC120

16010002 PCSAC40 16010016 WLNC20S2

16010002 CHPWGUV40 16010016 RAWL10

16010002 MSDHM500 16010016 ELDW

16010002 PFLC25 16010016 JMS

16010002 KS35 16010016 PLDS35

16010002 PELB 16010017 WFS60

16010002 PSHPAD170 16010017 PCSAC40

(46)

16010003 WLCF60 16010017 PCSACWFF50

16010003 CHPWGUV40 16010017 PAR

16010003 MSDHM500 16010017 WLBBCL15

16010003 KS35 16010017 SSHP170

16010003 PELB 16010018 WFS60

16010003 WLDCS30S1 16010018 MSDHM500

16010003 WLNC20S2 16010018 LTMC120

16010003 WFSNDS 16010018 PFLC25

16010003 WELFSP20 16010018 MKP120

16010004 WLCF60 16010018 ELDW

16010004 PCSAC40 16010019 WLCF60

16010004 CHPWGUV40 16010019 PCSACWFF50

16010004 PELB 16010019 RAWL10

16010004 PSHPAD170 16010019 HICAT60

16010005 WFS60 16010020 WFS60

16010005 PCSAC40 16010020 WLCF60

16010005 MSDHM500 16010020 PFLC25

16010005 LTMC120 16010020 PAR

16010005 PAR 16010020 EHVITR

16010005 PELB 16010021 WLCF60

16010005 WLDCS30S1 16010021 SSHP170

16010006 WLCF60 16010022 HICAT60

16010007 PCSAC40 16010023 WFS60

16010008 WFS60 16010023 PCSAC40

16010008 CHPWGUV40 16010023 MSDHM500

16010008 MSDHM500 16010023 LTMC120

16010008 KS35 16010023 PFLC25

16010008 PELB 16010024 WFS60

16010008 PSHPAD170 16010024 PCSACWFF50

16010009 WLCF60 16010024 PAR

16010009 CHPWGUV40 16010024 WLBBCL15

16010009 KS35 16010024 EHVITR

16010009 PAR 16010025 WLCF60

16010009 PELB 16010025 CHPWGUV40

16010009 WLDCS30S1 16010025 PFLC25

16010009 WFSNDS 16010025 RAWL10

16010009 SSHP170 16010025 HICAT60

(47)

16010010 WFS60 16010026 WFS60

16010010 PCSAC40 16010026 PCSAC40

16010010 CHPWGUV40 16010026 MSDHM500

16010010 MSDHM500 16010026 PCSACWFF50

16010010 LTMC120 16010026 WLNC20S2

16010010 KS35 16010026 WLBBCL15

16010010 PELB 16010026 SSHP170

16010010 PSHPAD170 16010026 EHVITR

16010011 WLCF60 16010027 WFS60

16010011 LTMC120 16010027 PCSAC40

16010011 KS35 16010027 LTMC120

16010011 PSHPAD170 16010027 PFLC25

16010011 WLDCS30S1 16010027 PCSACWFF50

16010011 WLNC20S2 16010027 WLBBCL15

16010011 WFSNDS 16010027 WELFSP20

16010011 SSHP170 16010028 WFS60

16010012 WFS60 16010028 WLCF60

16010012 WLCF60 16010028 PFLC25

16010012 CHPWGUV40 16010028 PCSACWFF50

16010012 LTMC120 16010028 RAWL10

16010012 PAR 16010028 WELFSP20

16010012 WLDCS30S1 16010029 WLCF60

16010013 WLCF60 16010029 PCSAC40

16010013 MSDHM500 16010029 MSDHM500

16010013 KS35 16010029 PFLC25

16010013 PSHPAD170 16010029 PCSACWFF50

16010013 WLNC20S2 16010029 EHVITR

16010013 WFSNDS 16010030 WLCF60

16010013 HICAT60 16010030 PCSAC40

16010014 WFS60 16010030 CHPWGUV40

16010014 PCSAC40 16010030 MSDHM500

16010014 CHPWGUV40 16010030 PFLC25

16010014 LTMC120 16010030 PCSACWFF50

16010014 KS35 16010030 WLNC20S2

(48)

3. Pembersihan Data

Proses pembersihan data atau cleaning data adalah proses menghilangkan data tidak relevan atau inkosisten dan proses menghilangkan noise. Noise disini yaitu data transaksi yang hanya memiliki 1 produk dalam sekali pembelian. Dalam data transaksi ini akan dilakukan pengeleminasian terhadap transaksi yang memiliki jumlah produk kurang dari 2 produk dalam satu kali transaksinya, karena syarat ini diperlukan dalam

Association Rules untuk melihat keterhubungan antar 2 produk atau lebih. Setelah melakukan proses pembersihan data, dari data transaksi yang awalnya sebanyak 33 transaksi di cleaning menjadi 27 transaksi.

Sebelum Pembersihan Data Setelah Pembersihan Dara

NoFaktur Kode NoFaktur Kode

16010005 WFS60 16010005 WFS60

16010005 PCSAC40 16010005 PCSAC40

16010005 MSDHM500 16010005 MSDHM500

16010005 LTMC120 16010005 LTMC120

16010005 PAR 16010005 PAR

16010005 PELB 16010005 PELB

16010005 WLDCS30S1 16010005 WLDCS30S1

16010006 WLCF60 16010008 WFS60

16010007 PCSAC40 16010008 CHPWGUV40

16010008 WFS60 16010008 MSDHM500

16010008 CHPWGUV40 16010008 KS35

16010008 MSDHM500 16010008 PELB

16010008 KS35 16010008 PSHPAD170

16010008 PELB 16010008 PSHPAD170

Tabel 3. 5 Hasil Pembersihan Data

NoFaktur Kode NoFaktur Kode

16010001 WFS60 16010014 WFSNDS

16010001 PCSAC40 16010015 WLCF60

16010001 CHPWGUV40 16010015 PCSAC40

16010001 LTMC120 16010015 MSDHM500

(49)

16010001 PAR 16010015 PCSACWFF50

16010001 PSHPAD170 16010016 CHPWGUV40

16010001 WLDCS30S1 16010016 LTMC120

16010002 WFS60 16010016 WLNC20S2

16010002 PCSAC40 16010016 RAWL10

16010002 CHPWGUV40 16010016 ELDW

16010002 MSDHM500 16010016 JMS

16010002 PFLC25 16010016 PLDS35

16010002 KS35 16010017 WFS60

16010002 PELB 16010017 PCSAC40

16010002 PSHPAD170 16010017 CHPWGUV40

16010003 WFS60 16010017 PCSACWFF50

16010003 WLCF60 16010017 PAR

16010003 CHPWGUV40 16010017 WLBBCL15

16010003 MSDHM500 16010017 SSHP170

16010003 KS35 16010018 WFS60

16010003 PELB 16010018 MSDHM500

16010003 WLDCS30S1 16010018 LTMC120

16010003 WLNC20S2 16010018 PFLC25

16010003 WFSNDS 16010018 MKP120

16010003 WELFSP20 16010018 ELDW

16010004 WLCF60 16010019 WLCF60

16010004 PCSAC40 16010019 PCSACWFF50

16010004 CHPWGUV40 16010019 RAWL10

16010004 PELB 16010019 HICAT60

16010004 PSHPAD170 16010020 WFS60

16010005 WFS60 16010020 WLCF60

16010005 PCSAC40 16010020 PFLC25

16010005 MSDHM500 16010020 PAR

16010005 LTMC120 16010020 EHVITR

16010005 PAR 16010021 WLCF60

16010005 PELB 16010021 SSHP170

16010005 WLDCS30S1 16010023 WFS60

16010008 WFS60 16010023 PCSAC40

16010008 CHPWGUV40 16010023 MSDHM500

16010008 MSDHM500 16010023 LTMC120

16010008 KS35 16010023 PFLC25

(50)

16010008 PSHPAD170 16010024 PCSACWFF50

16010009 WLCF60 16010024 PAR

16010009 CHPWGUV40 16010024 WLBBCL15

16010009 KS35 16010024 EHVITR

16010009 PAR 16010025 WLCF60

16010009 PELB 16010025 CHPWGUV40

16010009 WLDCS30S1 16010025 PFLC25

16010009 WFSNDS 16010025 RAWL10

16010009 SSHP170 16010025 HICAT60

16010009 MKP120 16010025 MKP120

16010010 WFS60 16010026 WFS60

16010010 PCSAC40 16010026 PCSAC40

16010010 CHPWGUV40 16010026 MSDHM500

16010010 MSDHM500 16010026 PCSACWFF50

16010010 LTMC120 16010026 WLNC20S2

16010010 KS35 16010026 WLBBCL15

16010010 PELB 16010026 SSHP170

16010010 PSHPAD170 16010026 EHVITR

16010011 WLCF60 16010027 WFS60

16010011 LTMC120 16010027 PCSAC40

16010011 KS35 16010027 LTMC120

16010011 PSHPAD170 16010027 PFLC25

16010011 WLDCS30S1 16010027 PCSACWFF50

16010011 WLNC20S2 16010027 WLBBCL15

16010011 WFSNDS 16010027 WELFSP20

16010011 SSHP170 16010028 WFS60

16010012 WFS60 16010028 WLCF60

16010012 WLCF60 16010028 PFLC25

16010012 CHPWGUV40 16010028 PCSACWFF50

16010012 LTMC120 16010028 RAWL10

16010012 PAR 16010028 WELFSP20

16010012 WLDCS30S1 16010029 WLCF60

16010013 WLCF60 16010029 PCSAC40

16010013 MSDHM500 16010029 MSDHM500

16010013 KS35 16010029 PFLC25

16010013 PSHPAD170 16010029 PCSACWFF50

16010013 WLNC20S2 16010029 EHVITR

(51)

16010013 HICAT60 16010030 PCSAC40

16010014 WFS60 16010030 CHPWGUV40

16010014 PCSAC40 16010030 MSDHM500

16010014 CHPWGUV40 16010030 PFLC25

16010014 LTMC120 16010030 PCSACWFF50

16010014 KS35 16010030 WLNC20S2

16010014 PAR 16010030 WLBBCL15

16010014 PELB

3.1.2.4Modeling

Pemodelan merupakan tahap untuk mebuat model atau desain sistem yang akan dibangun. Data yang digunakan untuk pengolahan data adalah data yang tertera pada tabel 3.3

1. Select Modeling Technique ( Memilih Teknik Pemodelan)

Dengan menggunakan metode Data Mining, data transaksi akan diolah dengan aturan asosiasi untuk menemukan pola-pola pembelian barang yang sering dibeli oleh konsumen. Didalam tahap ini metode yang digunakan adalah Assosiacion Rule.

Penelitian ini bertujuan menemukan pola assosiasi pembelian konsumen. Teknik pemodelan yang digunakan dalam penelitian ini adalah metode Association

Rules sedangkan algoritma yang digunakan dalam penelitian ini adalah algoritma

FP-Growth Dengan menerapkan Data Mining, data transaksi akan diolah dengan aturan

asosiasi atau metode Association Rules untuk menemukan pola-pola pembelian produk yang sering dibeli oleh konsumen.

2. Build Model ( Membangun Model)

Algoritma yang digunakan dalam penelitian ini adalah algoritma

FP-Growth. Algoritma ini akan mencari himpunan menu yang sering dibeli dengan melihat

FP-Tree yang sudah dibuat terlebih dahulu sehingga proses pencarian himpunan produk dapat lebih cepat dilakukan daripada algoritma apriori. Berikut ini adalah langkah-langkah proses pengerjaan algoritma FP-Growth :

(52)

Dengan menggunakan tabel 3.3, masing-masing item dihitung frekuensi kemunculan berdasarkan itemnya. Hasil dari penghitungan kemunculan item dapat dilihat pada tabel 3.4 dibawah ini.

Tabel 3. 6 Hasi Perhitungan Kemunculan Produk

Nama Produk Support

Count

Wardah Facial Scrub 60 ml 16

PONDS CS ACNE C 40 13

PONDS CS ACNE C 40 13

CITRA HAZ SPOTLES WHITE GLOW UV 40 G 13 MAKARIZO SALON DAILY HAIR MASK 500gr NEW 12

La Tulip Milk Cleanser 120 ml New 10

PONDS FAIR LOVELY CREAM 25 G 10

KAPAS SARIAYU 35 9

PONDS CS ACNE CLEAR WHITE FF50 G 9

Pensil Alis Revlon 8

Pixy Eye Liner Black 8

PANTENE SHP ANTI DANRUFF 170 ML ATLAS 7

Wardah Lig Day Cream Step 1 30 gr 6

Wardah LIG NIGHT CREAM 20 step 2 6

WARDAH FACIAL SERUM NORMAL DRY SKIN 5

SUNSILK SHP SOFT 170 ML 5

WARDAH LIGHT BB CREAM LIGHT 15ML 5

REXONA ADVANCED WHITENING LOT 10G 4

ELIPS Hair Vit Repair 4

Wardah Excl. Liq Found. 02 Sheer Pink 20 ml 3

MINYAK KAYU PUTIH 120 3

HOT IN CREAM A.THERAPY 60 G 3

Eye LINER DAVIS WARNA 2

Just Miss Serut 1

Purbasari lips Daily Series 35 1

Awal mula ditentukan minimum support dan juga confidence dari keinginan pengguna untuk melihat batasan terendah munculnya menu. Penentuan minimum

(53)

support terlalu besar maka hasil yang didapatkan terlalu sedikit bahkan tidak ada, sedangkan apabila nilai minimum support nya terlalu kecil, hasil yang didapatkan terlalu banyak. Untuk kasus ini dimisalkan ditentukan minimum support : 4 dan

confidence : 60%.. Hal ini dilakukan dengan memproses data yang ada pada tabel 3.6

yang dapat dilihat pada tabel 3.7.

Tabel 3. 7 Hasil Perhitungan Support Item

Kode

SUPPORT

COUNT Nilai Support

WFS60 16 59.25925926

WLCF60 14 51.85185185

PCSAC40 13 48.14814815

CHPWGUV40 13 48.14814815

MSDHM500 12 44.44444444

LTMC120 10 37.03703704

PFLC25 10 37.03703704

KS35 9 33.33333333

PCSACWFF50 9 33.33333333

PAR 8 29.62962963

PELB 8 29.62962963

PSHPAD170 7 25.92592593

WLDCS30S1 6 22.22222222

WLNC20S2 6 22.22222222

WFSNDS 5 18.51851852

SSHP170 5 18.51851852

WLBBCL15 5 18.51851852

RAWL10 4 14.81481481

EHVITR 4 14.81481481

WELFSP20 3 11.11111111

MKP120 3 11.11111111

HICAT60 3 11.11111111

ELDW 2 7.407407407

JMS 1 3.703703704

(54)

Langkah ke dua yaitu mengeleminasi menu yang tidak memenuhi minimum support 15%. Hasil Pengeleminasian menu dapat dilihat pada tabel 3.8.

Tabel 3. 8 Hasil Eleminasi Minimum Support

Kode SUPPORT COUNT

WFS60 16

WLCF60 14

PCSAC40 13

CHPWGUV40 13

MSDHM500 12

LTMC120 10

PFLC25 10

KS35 9

PCSACWFF50 9

PAR 8

PELB 8

PSHPAD170 7

WLDCS30S1 6

WLNC20S2 6

WFSNDS 5

SSHP170 5

WLBBCL15 5

RAWL10 4

EHVITR 4

Langkah ketiga yaitu mengurutkan kembali frequent berdasarkan banyaknya kemunculan menu yang disebut dengan Frequency of occurrence yang dapat dilihat pada tabel 3.9.

Tabel 3. 9 Priority

Kode

SUPPORT

COUNT Priority

WFS60 16 1

WLCF60 14 2

PCSAC40 13 3

CHPWGUV40 13 4

MSDHM500 12 5

(55)

PFLC25 10 7

KS35 9 8

PCSACWFF50 9 9

PAR 8 10

PELB 8 11

PSHPAD170 7 12

WLDCS30S1 6 13

WLNC20S2 6 14

WFSNDS 5 15

SSHP170 5 16

WLBBCL15 5 17

RAWL10 4 18

EHVITR 4 19

Langkah keempat adalah membuat fp-tree. Berikut proses pembentukan FP-Tree

dibawah ini :

1) Transaksi 16010001 : WFS60, PCSAC40, CHPWGUV40, LTMC120, KS35, PAR, PSHPAD170, WLDCS30S1

2) Lakukan pembacaan pada data transaksi pertama yang akan diproses.

3) Lakukan pengecekan pada rootyang diinisialisasikan dengan Null, jika root belum mempunyai anak (child), maka data yang dibaca tadi menjadi anak pertama dari root. Dan support count

(56)

WFS60 :1

NULL

PCSA C40:1

CHPW GUV4 0:1

LTMC 120:1

KS35:1

PAR :1

PSHPA D170 : 1

WLDC S30S1 : 1

Gambar 3. 2 Tree Transaksi 16010001

1) Transaksi 16010002 : WFS60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25, KS35, PELB, PSHPAD170

1) Lakukan pembacaan pada data transaksi kedua yang akan diproses.

2) Jika data yang keluar berikutnya sama dengan data yang pertama, maka itu bukan anak kedua dari root, tetapi tetap anak dari root yang sebelumnya keluar, yang berubah adalah

(57)

WFS60 :2 NULL

PCSA C40:2

CHPW GUV4 0:2

LTMC 120:1

KS35:1

PAR :1

PSHPA D170 : 1

WLDC S30S1 :

1

MSDH M500 : 1

PFLC2 5 : 1

KS35:1

PELB : 1

PSHPA D170 : 1

Gambar 3. 3 Tree Transaksi 16010002

2) Transaksi 16010003 : WFS60, WLCF60, CHPWGUV40, MSDHM500, KS35, PELB, WLDCS30S1, WLNC20S2, WFSNDS, WELFSP20

1) Lakukan pembacaan pada data transaksi ketiga yang akan diproses.

2) Jika data yang keluar sama setelah pembacaan, namun berbeda

lintasanmaka node pada laintasan yang lain tidak bertambah

support count-nya, hanya data yang dibaca sama saja yang

(58)

WFS60

(59)

3) Setelah pembacaan sampai ke transaksi 16010030 : WLCF60, PCSAC40, CHPWGUV40, MSDHM500, PFLC25, PCSACWFF50, WLNC20S2, WLBBCL15 akan membentuk FP-tree di Gambar 3.5

WFS60

Gambar

Gambar 2. 8 Conditional FP-Tree  Untuk Item Frequenset 1, 2:6
Gambar 3. 1 Data Transaksi Makmur Jaya Kosmetik
Tabel 3. 3Struktur Data Transaksi Penjualan
Tabel 3. 4 Pemilihan Atriburt
+7

Referensi

Dokumen terkait

(If Dalam  kondisi  normal,  baku  mutu  air  limbah  sebagaimana  climaksud  dalam  Pasal  4  setiap  saat  tidak  boleh  dilampaui  oleh  perianggung  jawab 

Risiko hukum adalah risiko yang timbul akibat tuntutan hukum dan atau kelemahan aspek yuridis. Risiko ini juga dapat timbul antara lain karena peraturan perundang-undangan

2000, Pajak Daerah adalah iuran wajib yang dilakukan oleh Orang Pribadi atau Badan.. kepada Daerah tanpa imbalan langsung yang seimbang dan

Hasil penelitian dari kemampuan bahasa melalui metode story reading sebelum dilakukan tindakan pencapaian prosentase sebesar 37,2%, pada Siklus I prosentasenya mencapai

Senin Selasa Rabu Kamis Jum’at Sabtu Juli Agustus Septemb er Oktober Novemb er Desembe r Jumlah Mata Pelajaran Hari Jumlah Senin Selasa Rabu Kamis Jum’at Sabtu.. PKn

Tujuan penelitian ini adalah untuk mengidentifikasi dan menganalisis penerapan terapi perilaku: token ekonomi pada klien dengan gangguan sensori persepsi:

Hal ini mungkin disebabkan karena madrasah yang muncul sebelum berdirinya madrasah Nizamiyah, bersifat eksklusif karena untuk kalangan para bangsawan (patrician),

Penulisan pelaporan merupakan tahap akhir dari rangkaian proses penelitian. Peneliti dalam menulis laporan penelitian haruslah sesuai dengan sistematika penulisan yang sudah di