Penerapan Data Mining Untuk Penyusunan Layout Produk di Summit The Boutique Outlet Menggunakan Metode Association Rule

(1)

(2)

(3)

(4)

DAFTAR RIWAYAT HIDUP

Data Pribadi

Nama : Silvia Manela

Tempat/TanggalLahir : Bandung, 29 Maret 1993

Umur : 23 Tahun

JenisKelamin : Perempuan

Alamat : Jl. Abdul Halim No.89 RT.01 RW.07 Kel.Cigugur

Tengah Kec.Cimahi Tengah Kota Cimahi

No. Telepon : 085659003676

Riwayat Pendidikan

1999 - 2005 Lulus SD Negeri Pasir Kaliki 9 Kota Bandung

2005 - 2008 Lulus SMP Negeri 47 Kota Bandung

2008 - 2011 Lulus SMK Pasundan 2 Kota Bandung

2011 – 2016 Universitas Komputer Indonesia

(5)

PENERAPAN

DATA MINING

UNTUK PENYUSUNAN

LAYOUT

PRODUK DI SUMMIT THE BOUTIQUE OUTLET

MENGGUNAKAN METODE

ASSOCIATION

RULE

SKRIPSI

Diajukan untuk Menempuh Tugas Akhir Sarjana

SILVIA MANELA 10111595

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

(6)

KATA PENGANTAR

Alhamdulillahi Rabbil ‘Alamiin, Puji syukur Alhamdulillah penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat, hidayah dan

karunia-Nya, sehingga penulis dapat menyelesaikan skripsi yang berjudul

“PENERAPAN DATA MINING UNTUK PENYUSUNAN LAYOUT PRODUK

DI SUMMIT THE BOUTIQUE OUTLET MENGGUNAKAN METODE

ASSOCIATION RULE.” untuk memenuhi salah satu syarat dalam menyelesaikan

studi jenjang starata satu (S1) di Program Studi Teknik Informatika, Fakultas

Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.

Dengan keterbatasan ilmu dan pengetahuan yang dimiliki oleh penulis,

penyusunan skripsi ini tidak akan terwujud tanpa mendapat dukungan, bantuan

dan masukan dari berbagai pihak. Oleh karena itu melalui kata pengantar ini,

penulis ingin menyampaikan terima kasih yang sebesar-besarnya kepada:

1. Allah SWT atas segala nikmat yang telah diberikan sehingga penulis

dapat menyelesaikan skripsi ini.

2. Junjungan besar, Nabi Muhammad SAW yang telah menujukkan

kepada kita jalan yang lurus berupa ajaram agama islam yang

sempurna dan menjadi anugerah serta rahmat bagi seluruh alam

semesta.

3. Kedua orang tua yang sangat penulis sayangi, Bapak Sudirman dan

Ibu Elita yang selama ini telah memberikan dukungan baik secara

moril maupun materil serta kasih sayang dan juga pengorbanan kepada

penulis yang tidak terbalaskan.

4. Ibu Dian Dharmayanti, S.T., M.Kom selaku Sekertaris Program Studi

(7)

iv

6. Ibu Ednawati Rainarli, M.SI. selaku Dosen Wali IF-13/2011.

7. Kepada Ibu Paula selaku store manager dan juga Bapak Ilham selaku

Supervisor di Summit Boutique Outlet yang telah memberikan ijin

kepada penulis untuk melakukan penelitian di Summit The Boutique

Outlet.

8. Adik-adik penulis, Ritno Andrian dan Putri Amelia yang telah

memberikan semangat serta dukungan kepada penulis dalam

menyelesaikan tugas akhir ini.

9. Nirwan Saeful Ahmad yang selalu setia menemani dan bersedia

meluangkan waktunya untuk membantu segala keperluan selama

menyelesaikan tugas akhir ini.

10.Lizuardi Danar, Dienurra, dan Deden yang selalu menyempatkan

waktunya untuk membantu, memotivasi, dan bertukar pikiran dalam

penyelesaian skripsi ini.

11.Teman – teman sehidup seskripsi, Martono, Wita, Rizal, Lukman, Eza,

kak Mukti, dan Kiki yang sering menjadi teman begadang dalam

mengerjakan revisi skripsi juga saling menyemangati disaat merasa

lelah karena revision yang rasanya gak beres – beres.

12.Teman-Teman “Minion” Fitri, Adisty, Yayah, dan Evi yang selalu

memberikan dukungan, motivasi, dan juga semangat kepada penulis.

13.Sahabatku tersayang Selvi Ramanda, Friska Suprianti, dan Winda

Puspita, maaf sering nolak diajak main dan piknik tapi tetap tak

hentinya memberikan semangat dan doa agar skripsi ini cepat selesai.

14.Kepada teman-teman satu bimbingan Ibu Dian Dharmayanti, S.T.,

M.Kom yang selalu datang paling awal dan pulang paling akhir

diantara mahasiswa skripsi lain dan bersama – sama menjadi “kuncen”

terakhir di lorong sekjur IF.

15.Bapak dan Ibu dosen serta seluruh staf pegawai Program Studi Teknik

Informatika Universitas Komputer Indonesia yang telah membantu

(8)

16.

Serta seluruh pihak yang tidak dapat penulis sebutkan satu persatu,

terima kasih atas segala bentuk dukungan untuk menyelesaikan skripsi

ini.

Di dalam pembuatan skripsi ini, penulis telah berusaha semaksimal

mungkin walaupun demikian penulis menyadari bahwa skripsi ini jauh dari

sempurna. Untuk itu penulis akan selalu menerima segala masukan yang ditujukan

untuk menyempurnakan skripsi ini. Akhir kata, penulis berharap semoga skripsi

ini dapat bermanfaat bagi penulis pada khususnya dan pembaca pada umumnya.

Wassalamu’alaikum Wr. Wb.

Bandung, Agustus 2016

(9)

vi

1.5 Metodologi Penelitian ... 3

1.5.1 Metode Pengumpulan Data ... 4

1.5.2 Metode Pembangunan Data Mining ... 4

1.5.3 Metode Pembangunan Perangkat Lunak ... 6

1.6 Sistematika Penulisan ... 8

BAB 2 TINJAUAN PUSTAKA ... 9

2.1 Tentang Perusahaan ... 9

2.1.1 Struktur Organisasi Perusahaan ... 9

2.1.2 Deskripsi Kerja ... 10

2.2 Landasan Teori ... 10

2.2.1 Data ... 10

2.2.2 Basis Data ... 11

2.2.3 Database Management System ... 16

2.2.4 Data Mining ... 16

2.2.5 Association Rule ... 19

2.2.6 Algoritma CT-Pro ... 21

2.2.7 Unifief Modelling Language (UML) ... 29

(10)

3.1 Analisis Sistem ... 33

3.1.1 Analisis Masalah ... 33

3.1.2 Analisis Non Fungsional dan Kebutuhan Non Fungsional ... 75

3.1.3 Analisis Kebutuhan Fungsional ... 76

3.2 Perancangan Sistem ... 103

3.2.1 Perancangan Kelas ... 103

3.2.2 Peracangan Data ... 106

3.2.3 Perancangan Struktur Menu ... 108

3.2.4 Perancangan Antar Muka ... 109

3.2.5 Perancangan Pesan ... 112

3.2.6 Jaringan Sematik ... 112

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 113

4.1 Implementasi Sistem ... 113

4.1.1 Perangkat keras yang digunakan ... 113

4.1.2 Perangkat Lunak yang Digunanakan ... 114

4.1.3 Implementasi Basis Data ... 114

4.1.4 Implemetasi antar muka ... 115

4.2 Pengujian Sistem ... 116

4.2.1 Skenario Pengujian ... 117

4.2.2 Pengujian Fungsional ... 117

4.2.3 Kesimpulan Pengujian Fungsional ... 119

4.2.4 Hasil Wawancara ... 119

4.2.5 Kesimpulan Pengujian Betha ... 120

4.2.6 Pengujian Hasil ... 120

4.2.7 Kesimpulan Pengujian Hasil ... 124

BAB 5 KESIMPULAN DAN SARAN ... 125

5.1 Kesimpulan ... 125

(11)

127

DAFTAR PUSTAKA

[1] Sugiyono, “Metode Penelitian Kuantitatif dan R&D”, Bandung: Alfabeta,

2010.

[2] Brigida Arie, "Data Mining dalam Kerangka Kerja CRM", 2012. [Online].

Available: http://Data MiningData Mining_Informatika.html. [Diakses 4

Oktober 2015].

[3] I. Sommerville, “Software Engineering”, Edisi 6, Jakarta: Erlangga, 2003.

[4] F. Buku Teks Komputer: “Basis Data”, 5th ed., Bandung: Informatika,

2004.

[5] W. Sistem Basis Data, “Analisis dan Pemodelan Data”, 1st ed., Yogyakarta:

Graha Ilmu, 2003.

[6] Fathansyah, “Basis Data”, Bandung: Informatika 2012.

[7] B. Santoso, Data Mining: “Teknik Pemanfaatan Data Untuk Keperluan

Bisnis”, Yogyakarta: Graha Ilmu, 2007.

[8] Kusrini, Taufiq Luthfi Emha, “Algoritma Data Mining”, Yogyakarta, Andi,

2009.

[9] J. Han and M. Kamber, Data Mining: Concepts and Techniques, 2nd ed.,

San Francisco: Morgan Kaufmann Publishers, 2006.

[10] K. and E. T. Luthfi, Algoritma Data Mining, Andi, 2009

[11] D. T. Larose, Discovering Knowledge In Data: “An Introduction To Data

Mining”, New Jersey: Wiley Interscience, 2005.

[12] Rohmania Putri Nurlaili, Sari Widya Sihwi dan Meiyanto Eko Sulistyo,

“Implementasi Algoritma CT-Pro untuk menemukan pola pada data siswa

SMA”, Sesindo, 2014.

[13] Y.G Sucahyo and R. P. Gopalan, “ CT-PRO: A Bpttom Up Non Recursive

(12)

Sructure”. In proc Paper presented at the IEEE ICDM Workshop on

Frequent Itemset Mning Implementation (FIMI), Brighton UK, 2004.

[14] Prabowo P. Widodo dan Herlawati. “Menggunakan UML”. Informatika

(13)

1

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Summit Boutique Outlet adalah sebuah tempat perbelanjaan yang

menyediakan banyak jenis barang antara lain pakaian, aksesoris, juga oleh – oleh.

Dari barang - barang yang tersedia, barang tersebut dibedakan menjadi beberapa

jenis art. Setiap beberapa bulan sekali Summit memperbarui tata letak barangnya,

ini dikarenakan beberapa jenis art yang jarang dibeli oleh konsumen sehingga

butuh penempatan yang baru, diharapkan layout baru ini dapat membuat jenis art

lebih mudah diperhatikan oleh pelanggan dan layout baru juga dimaksudkan agar

toko terlihat rapi dan juga suasana baru untuk toko.

Format tampilan letak jenis art di Summit ini masih berdasarkan

pandangan dari Supervisor dan tidak ada aturan khusus dari atasan toko dalam

penyusunannya, yang pasti Supervisor ditugaskan untuk menentukan letak jenis

art agar barang terlihat rapi dan menarik yang nantinya Supervisor akan

memerintahkan Pramuniaga untuk menyusun jenis art tersebut berdasarkan letak

terbaik menurutnya. Jenis art di Summit yang banyak dan barang baru dengan

berbagai jenis art yang datang sering kali membuat bingung Supervisor untuk

memutuskan tempat mana yang paling baik untuk meletakkan jenis art tersebut

sehingga kerap kali Supervisor meletakkan barang tersebut di tempat yang kurang

bagus sehingga malah membuat jenis art tersebut tidak diperhatikan oleh

pelanggan, belum lagi kadang terdapat jenis art yang jarang dibeli oleh pelanggan

dan butuh layout baru.

Konsumen yang datang ke Summit kebanyakan merupakan rombongan

yang sering kali membeli beberapa barang secara bersama sehingga sering kali

ditemukan satu transaksi penjualan dengan lebih dari satu jenis art. Banyaknya

data penjualan yang ada di Summit hanya disimpan sebagai arsip semata dan tidak

dimanfaatkan guna kepentingan Summit itu sendiri. Pemanfaatan data penjualan

(14)

2

akan menghasilkan pola pembelian rata – rata konsumen yang terjadi setiap hari.

Pola pembelian konsumen setiap hari dapat digunakan untuk mengatasi salah satu

masalah yang terjadi di Summit yaitu dalam penempatan layout barang. Oleh

karena itu penulis ingin mencoba mengatasi masalah tersebut dengan mencoba

memberikan rekomendasi terhadap penempatan tata letak jenis art kepada

karyawan toko dengan merapkan data mining pada data penjualan di Summit The

Boutique Outlet menggunakan metode Association Rule untuk melihat hubungan

asosiasi antara sejumlah atribut penjualan guna mendapatkan pola pembelian dari

konsumen tentang jenis art apa saja yang konsisten dibeli secara bersamaan

sehingga nantinya dapat menjawab permasalah penyusunan tata letak jenis art

yang baik guna memudahkan karyawan toko untuk menyusun barang juga

memudahkan calon konsumen dalam memilih barang yang diinginkan.

Data mining adalah serangkaian proses untuk menggali nilai tambah dari

suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara

manual (Pramudiono, 2007). Dalam bidang keilmuan data mining, terdapat suatu

metode yang dinamakan Association Rule. Metode ini sering disebut dengan

market basket analysis karena awal mulanya yang berasal dari studi tentang

database transaksi penjualan (Santoso, 2007). Association Rule bertujuan untuk

menunjukan nilai asosiatif antara kategori produk yang sering dibeli bersamaan

dalam satu transaksi penjualan. Dengan mengetahui kategori apa saja yang sering

dibeli bersamaan maka dapat menghasilkan sebuah rekomendasi penempatan

layout barang yang lebih baik dalam mengambil keputusan dalam penempatan

barang.

1.2 Rumusan Masalah

Dari latar belakang yang telah dipaparkan di atas, maka dapat disimpulkan

bagaimana cara menerapkan data mining pada data penjualan yang ada pada

Summit The Boutique Outlet dengan menggunakan metode Association rule

(15)

3

1.3 Maksud dan Tujuan

Maksud dari skripsi ini adalah untuk menerapkan data mining pada data

penjualan dengan menggunakan metode association rule untuk penyusunan layout

produk di Summit The Boutique Outlet menggunakan algoritma CT- PRO.

Adapun tujuan yang ingin dicapai pada penelitian ini adalah :

1. Membantu Summit the Boutique Outlet mengetahui informasi tentang

pola pembelian konsumen.

2. Memberikan rekomendasi kepada Supervisor tentang penempatan

setiap jenis art di Summit the Boutique Outlet

1.4 Batasan Masalah

Agar penelitian terfokus pada tujuan yang ingin dicapai maka dibuatlah

suatu batasan masalah mengenasi penilitian ini. Di bawah ini merupakan batasan

masalah, yaitu:

1. Data yang akan dianalisis adalah data transaksi penjualan yang ada

pada Summit the Boutique Outlet pada bulan januari 2014 dengan

banyak data penjualan yang digunakan sebanya 353 record.

2. Metode yang digunakan adalah metode association rule dengan

menggunakan algoritma CT-PRO.

3. Hasil analisis adalah pengetahuan mengenai pola pembelian

konsumen terhadap produk yang tersedia di Summit the Boutique

Outlet.

4. Metode analisis yang digunakanan dalam pembangunan perangkat

lunak ini menggunakan pendekatan analisis Pemrograman

Berorientasi Objek.

5. Aplikasi yang dibangun berbasis desktop dengan bahasa pemrograman

C# dan menggunakan databaseMYSQL.

1.5 Metodologi Penelitian

Metodologi penelitian yang digunakan adalah metode penelitian deskriptif,

yaitu metode penelitian yang bertujuan untuk memberikan gambaran atau

(16)

4

dibagi menjadi 2 tahap, yaitu metode pengumpulan data dan metode

pembangunan perangkat lunak. Adapun metode pengumpulan data, penelitian

data mining dan pembangunan perangkat lunak sebagai berikut :

1.5.1 Metode Pengumpulan Data

Metode pengumpulan data yang digunakan pada penelitian ini adalah

sebagai berikut:

1. Studi Literatur

Teknik pengumpulan data dengan cara mengumpulkan literatur,

jurnal, paper, dan buku yang berkaitan dengan penelitian yang

dilakukan.

2. Wawancara

Teknik pengumpulan data dengan cara berinteraksi atau

berkomunikasi secara langsung kepada responden dengan mengajukan

pertanyaan yang sesuai dengan topik yang diambil.

1.5.2 Metode Pembangunan Data Mining

Dalam penelitian ini mengikuti standar dari Cross-Industry Standard for

Data Mining (CRISP-DM) merupakan suatu standar yang telah dikembangkan

pada tahun 1996 yang ditunjukkan untuk melakukan proses analisis dari suatu

industri sebagai strategi pemecahan masalah dari bisnis satu unit penelitian [2].

Untuk data yang dapat diproses dengan CRISP-DM ini, tidak ada ketentuan atau

karakteristik tertentu, karena data tersebut akan diproses kembali pada fase-fase

(17)

5

Gambar 1. 1 Cross-Industry Standard for Data Mining (CRISP-DM) [2]

Berikut ini adalah tahapan-tahapan yang akan dilakukan dalam penelitian

ini sesuai dengan CRISP-DM:

a. Business Understanding

Penerapan data mining pada penelitian ini adalah untuk memberikan

informasi tentang rekomendasi penyusunan layout jenis art di Summit

the Boutique Outlet.

b. Data Understanding

Pada tahap pemahaman data ini terlebih dahulu akan mengumpulkan

semua data yang diperlukan dari hasil data-data transaksi di Summit

the Boutique Outlet.

c. Data Preparation

Pada tahapan ini akan dilakukan proses pemilihan dan pengolahan

data yang nantinya akan diperlukan dalam tahap pemodelan sehingga

pemodelan yang dilakukan dapat memberikan hasil yang maksimal

sesuai dengan target yang diinginkan, data yang akan dipilih adalah

data transaksi di Summit the Boutique Outlet adalah data penjualan

pada bulan Januari 2014 sebanyak 353 record.

d. Modeling

Dalam tahapan pemodelan ini akan menggunakan teknik metode data

(18)

6

aturan asosiatif atau pola kombinasi barang berdasarkan hasil data

transaksi, sehingga dapat diketahui barang apa saja yang sering dibeli

secara bersamaan oleh konsumen.

e. Evaluation

Pada tahap evaluasi ini akan dibandingkan hasil CT-Pro dilakukan

oleh sistem dengan perhitungan manual, dengan mengambil beberapa

sampel acak. Evaluasi ini ditujukan untuk mengukur apakah

pemodelan yang dilakukan sesuai dengan tujuan pengimplementasian

data mining pada sistem ini.

f. Deployment

Setiap tahap evaluasi dimana menilai secara detail hasil dari

pemodelan, maka akan dilakukan pengimplementasian dari

keseluruhan model yang telah dirancang. Selain itu juga dilakukan

penyesuaian dari model dengan sistem yang akan dibangun sehingga

dapat menghasilkan suatu hasil yang sesuai dengan target pemahaman

bisnis

1.5.3 Metode Pembangunan Perangkat Lunak

Dalam pembangunan aplikasi ini menggunakan model waterfall sebagai

tahapan pengembangan perangkat lunak ini. Waterfall adalah model klasik yang

bersifat sistematis, berurutan dalam membangun software [3]. Adapun tahapan

(19)

7

1. Requirements analysis and definition

Tahap requirements analysis and definition adalah tahap

pengumpulan data terhadap kebutuhan sistem, batasan dan tujuan

dibuatnya perangkat lunak. Tahap pengumpulan data haruslah sedetail

mungkin, karena nantinya akan digunakan sebagai spesifikasi sistem

yang akan dibangun.

2. System and software design

Tahap system and software design adalah tahap mendesain perangkat

lunak yang dikerjakan setelah kebutuhan selesai dikumpulkan secara

lengkap.

3. Implementation and unit testing

Tahap implementation and unit testing merupakan hasil dari tahap

desain yang dibentuk kedalam baris kode-kode program berdasarkan

bahawa pemrograman yang telah di tentukan sebelumnya. Program

yang telah di buat kemudian diuji bersarkan unitnya.

4. Integration and system testing

Tahap integration and system testing adalah tahap penyatuan unit-unit

program menjadi sebuah kesatuan sistem yang kemudian diuji secara

keseluruhan.

5. Operation and maintenance

Tahap operation and maintenance adalah tahap pengoprasian program

di lingkungannya dan melakukan pemeliharaan, seperti koreksi error

yang sebelumnya tidak diketahui pada tahapan sistem testing, selain

daripada itu tahapan ini juga digunakan untuk mengadaptasi terhadap

(20)

8

1.6 Sistematika Penulisan

Sistematika penulisan laporan akhir penelitian ini disusun untuk

mendeskripsikan secara umum tentang penelitian yang dilakukan. Sistematika

penulisan tugas akhir ini adalah sebagai berikut :

BAB 1 PENDAHULUAN

Menjelaskan tentang latar belakang permasalahan, merumuskan

inti permasalahan, menentukan maksud dan tujuan penelitian,

batasan masalah, yang kemudian diikuti dengan metodologi

penelitian, serta sistematika penulisan.

BAB 2 LANDASAN TEORI

Membahas berbagai konsep dasar dan teori-teori yang berkaitan

dengan topik penelitian yang dilakukan dan hal-hal yang berguna

dalam proses analisis permasalahan serta tinjauan terhadap

penelitian.

BAB 3 ANALISIS DAN PERANCANGAN

Menganalisis masalah dari data hasil penelitian, kemudian

dilakukan pula proses perancangan sistem yang akan dibangun

sesuai dengan analisa yang telah dilakukan.

BAB 4 IMPLEMENTASI DAN PENGUJIAN

Membahas tentang mplementasi dari tahapan-tahapan penting yang

telah dilakukan sebelumnya kemudian dilakukan pengujian

terhadap sistem sesuai dengan tahapan yang telah dijalani untuk

memperlihatkan sejauh mana sistem yang dibangun layak

digunakan.

BAB 5 KESIMPULAN DAN SARAN

Berisi kesimpulan dan saran yang diharapkan dapat menjadi

(21)

(22)

BAB 2

TINJAUAN PUSTAKA

2.1 Tentang Perusahaan

Summit The Boutique Outlet adalah sebuah tempat perbelanjaan yang

berada di Jl. R.E. Marthadinata Bandung yang berdiri sejak tahun 2001 dan salah

satu bidang usaha yang dikelola oleh PT. The Big Price Cut Group yang berada di

Jl. Cipaganti Kota Bandung. Ada banyak jenis barang yang dijual di Summit

antara lain fashion, aksesoris, juga oleh – oleh khas Bandung. Dari barang yang

tersedia, jenis barang tersebut dibedakan menjadi beberapa kategori barang untuk

membedakan jenis barang tersebut.

2.1.1 Struktur Organisasi Perusahaan

Struktur organisasi perusahaan adalah gambar suatu bagan yang

menerangkan posisi atau jabatan dan struktur kerja pegawai dalam suatu

perusahaan. Berikut ini adalah struktur organisasi di Summit The Boutique Outlet:

Store Manager

Supervisor

(23)

10

2.1.2 Deskripsi Kerja

Setiap perusahaan tentu memiliki karyawan – karyawan yang

diperkerjakan untuk membuat perusahaan maju dan keryawan – karywan

memiliki tugasnya masing – masing. Berikut deskripsi kerja dari masing – masing

karyawan yang bekerja di Summit the boutique outlet :

1. Store Manager

Store Maneger bertugas untuk mengawasi kerja para karyawan,

pengambil keputusan dan penanggung jawab semua aktifitas yang

berada di Summit.

2. Supervisor

Supervisor bertugas untuk Mengawasi semua aktifitas dan membatu

aktifitas di Summit.

3. Admin

Admin bertugas untuk mengelola semua data yang ada di Summit

seperti data penjualan, data gudang, data barang dan lain – lain.

4. Kordinator Lapangan

Mengevaluasi absensi karyawan kepada Store manager.

5. Pramuniaga

Bertugas untuk melayani customer yang akan membeli barang di

Summit, merapihkan barang, juga menyimpan letak barang untuk

dipajang.

2.2 Landasan Teori

Landasan teori adalah membahas tentang materi atau teori apa saja yang

digunakan sebagai bahan acuan dalam membuat tugas akhir ini. Landasan teori

yang digunakan merupakan hasil studi literature baik dari buku atau situs internet.

2.2.1 Data

Data adalah sesuatu yang belum mempunyai arti bagi penerimanya dan

masih memerlukan adanya suatu pengolahan. Data bisa berujut suatu keadaan,

(24)

yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, obyek, kejadian

ataupun suatu konsep [4]. Dalam pendekatan basis data tidak hanya berisi basis

data itu sendiri tetapi juga termasuk definisi atau deskripsi dari data yang

disimpan. Definisi data disimpan dalam sistem katalog, yang berisi informasi

tentang struktur tiap berkas, tipe dan format penyimpanan tiap item data, dan

berbagai konstrin dari data. Semua informasi yang disimpan dalam katalog ini

biasa disebut meta-data [5].

2.2.2 Basis Data

Basis data adalah mekanisme yang digunakan untuk menyimpan informasi

atau data. Informasi adalah sesuatu yang kita gunakan sehari-hari untuk berbagai

alasan. Dengan basis data, pengguna dapat menyimpan data secara terorganisasi.

Setelah data disimpan, informasi harus mudah diambil. Kriteria dapat digunakan

untuk mengambil informasi. Cara data disimpan dalam basis data menentukan

seberapa mudah mencari informasi berdasarkan banyak kriteria. Data pun harus

mudah ditambahkan ke dalam basis data, dimodifikasi, dan dihapus [6].

basis data sendiri dapat didefinisikan dalam sejumlah sudut pandang

seperti:

1. Himpunan kelompok data (arsip) yang saling berhubungan yang

diorganisasi sedemikian rupa agar kelak dapat dimanfaatkan kembali

dengan cepat dan mudah.

2. Kumpulan data yang saling berhubungan yang disimpan secara

bersama sedemikian rupa dan tanpa pengulangan (redudansi) yang

tidak perlu, untuk memenuhi berbagai kebutuhan.

3. Kumpulan file/ tabel/ arsip yang saling berhubungan yang disimpan

(25)

12

2.2.2.1Operasi Dasar Basis Data

Didalam sebuah disk, basis data dapat diciptakan dan dapat pula

ditiadakan. Didalam sebuah disk, kita dapat pula menempatkan beberapa (lebih

dari satu) basisdata. Sementara dalam sebuah basis data, kita dapat menempatkan

satu atau lebih file/tabel. Pada file/tabel inilah sesungguhnya data

disimpan/ditempatkan. Setiap basis data umumnya dibuat untuk mewakili sebuah

semesta data yang spesifik. Misalnya, ada basis data kepegawaian, basis data

akademik, basis data inventori (pergudangan), dan sebagainya. Sementara dalam

basis data akademik, misalnya, kita dapat menempatkan file mahasiswa, file

mata_kuliah, file dosen, file jadwal, file kehadiran, file nilai, dan seterusnya.

Karena itu, operasi-operasi dasar yang dapat kita lakukan berkenaan dengan basis

data dapat meliputi [6]:

1. Pembuatan basis data baru (create database), yang identik dengan

pembuatan lemari arsip yang baru.

2. Penghapusan basis data (drop database), yang identik dengan

perusakan lemari arsip (sekaligus beserta isinya, jika ada).

3. Pembuatan file/tabel dari suatu basis data (create table), yang identik

dengan penambahan map arsip baru ke sebuah lemari sarsip yang

telah ada.

4. Penghapusan file/tabel dari suatu basis data (drop table), yang identik

dengan perusakan map arsip lama yang ada disebuah lemari arsip.

5. Penambahan/pengisian data baru ke sebuah file/tabel disebuah basis

data (insert), yang identik dengan penambahan ke lemari arsip ke

sebuah map arsip.

6. Pengambilan data dari sebuah file/tabel (retrieve/search) yang identik

dengan pencarian lembaran arsip dari sebuah map arsip.

7. Pengubahan data dari sebuah file/tabel (update), yang identik dengan

perbaikanisi lembaran arsip yang ada di sebuah map arsip.

8. Penghapusan data dari sebuah file/tabel (delete), yang identik dengan

(26)

Operasi yang berkenaan dengan pembuatan objek (basis data dan tabel)

merupakan operasi awal yang hanya dilakukan sekali dan berlaku seterusnya.

Sedang operasi-operasi yang berkaitan dengan isi tabel (data) merupakan operasi

rutin yang akan berlangsung berulang-ulang dan karena itu operasi-operasi inilah

yang lebih tepat mewakili aktivitas pengelolaan (management) dan pengolahan

(processing) data dalam basis data [6].

2.2.2.2Objektif Basis Data

Telah disebutkan diawal bahwa tujuan awal dan utama dalam pengelolaan

data dalam sebuah basis data adalah agar kita dapat memperoleh/menemukan

kembali data (yang kita cari) dengan mudah dan cepat. Di samping itu,

pemanfaatan basis data untuk pengelolaan data, juga memiliki tujuan-tujuan lain

[6]. Secara lebih lengkap, pemanfaatan basis data dilakukan untuk memenuhi

sejumlah tujuan (objektif) seperti buku ini [6]:

1. Kecepatan dan Kemudahan (Speed)

Pemanfaatan basis data memungkinkan kita untuk dapat menyimpan

data atau melakukan perubahan/manipulasi terhadap data atau

menampilkan kembali data tersebut dengan lebih cepat dan mudah,

daripada jika kita menyimpan data secara manual (non elektronis) atau

secara elektronis (tetapi tidak dalam bentuk penerapan basis data,

misalnya dalam bentuk spread sheet atau dokumen teks biasa).

2. Efisiensi Ruang Penyimpanan (Space)

Karena keterkaitan yang erat antar kelompok data dalam sebuah basis

data, maka redundansi (pengulangan) data pasti akan selalu ada.

Banyaknya redundansi ini tentu akan memperbesar ruang

penyimpanan (baik di memori utama maupun memori sekunder) yang

(27)

14

3. Keakuratan (Accuracy)

Pemanfaatan pengkodean atau pembentukan relasi antar data bersama

dengan penerapan aturan/batasan (constraint) tipe data, domain data,

keunikan data, dan sebagainya, yang seara ketat dapat diterapkan

dalam sebuah basis data, sangat berguna untuk menekan

ketidakakuratan pemasukan/penyimpanan data.

4. Ketersediaan (Availability)

Pertumbuhan data (baik dari sisi jumlah maupun jenisnya) sejalan

dengan waktu akan semakin membutuhkan ruang penyimpanan yang

besar. Padahal tidak semua data itu selalu kita gunakan/butuhkan.

Karena itu kita dapat memilah adanya data utama/master/referensi,

data transaksi, data histori hingga data kadaluarsa. Data yang sudah

jarang atau bahkan tidak pernah lagi kita gunakan, dapat kita atur

untuk dilepaskan dari sistem basis data yang sedang aktif (menjadi

off-line) baik dengan cara penghapusan atau dengan memindahkannya ke

media penyimpanan off-line (seperti removable disk atau tape). Di sisi

lain, karena kepentingan pemakaian data, sebuah basis data dapat

memiliki data yang disebar di banyak lokasi geografis. Data nasabah

sebuah bank, misalnya, dipisah-pisah dan disimpan dilokasi yang

sesuai dengan keberadaan nasabah. Dengan pemanfaatan teknologi

jaringan komputer, data yang berada di suatu lokasi/cabang, dapat

juga diakses (menjadi tersedia/available) bagi lokasi/cabang lain.

5. Kelengkapan (Completenes)

Lengkap/tidaknya data yang kita kelola dalam sebuah basis data

bersifat relatif (baik terhadap kebutuhan pemakai maupun terhadap

waktu). Bila seorang pemakai sudah menganggap bahwa data yang

dipelihara sudah lengkap, maka pemakai yang lain belum tentu

berpendapat sama. Atau, yang sekarang dianggap sudah lengkap,

belum tentu di masa yang akan datang juga demikian. Dalam sebuah

basis data, di samping data kita juga harus menyimpan struktur (baik

(28)

dari tiap objek, seperti struktur file/tabel atau indeks). Untuk

mengakomodasi kebutuhan kelengkapan data yang semakin

berkembang, maka kita tidak hanya dapat menambah record-record

data, tetapi juga dapat melakukan perubahan struktur dalam basis data,

baik dalam bentuk penambahan objek baru (tabel) atau dengan

penambahan field-field baru pada suatu tabel.

6. Keamanan (Security)

Memang ada sejumlah (aplikasi) pengelola basis data yang tidak

menerapkan aspek keamanan dalam penggunaan basis data. Tetapi

untuk sistem yang besar dan serius, aspek keamanan juga dapat

diterapkan dengan ketat. Dengan begitu kita dapat menentukan

siapa-siapa (pemakai) yang boleh menggunakan basis data beserta

objek-objek di dalamnya dan menentukan jenis-jenis operasi apa saja yang

boleh dilakukannya.

7. Kebersamaan Pemakaian (Sharability)

Pemakai basis data seringkali tidak terbatas pada satu pemakai saja,

atau di satu lokasi saja atau oleh satu sistem/aplikasi saja. Data

pegawai dalam basis data kepegawaian, misalnya, dapat digunakan

oleh banyak pemakai, dari sejumlah departemen dalam perusahaan

atau oleh banyak sistem (sistem penggajian, sistem akuntansi, sistem

inventori, dan sebagainya). Basis data yang dikelola oleh sistem

(aplikasi) yang mendukung lingkungan multiuser, akan dapat

memenuhi kebutuhan ini, tetapi tetap dengan menjaga/menghindari

(karena data yang sama diubah oleh banyak pemakai pada saat yang

bersamaan) atau kondisi deadlock (karena ada banyak pemakai yang

(29)

16

2.2.3 Database Management System

Kumpulan atau gabungan database dengan perangkat lunak aplikasi yang

berbasis database tersebut dinamakan Database Management System (DBMS).

DBMS merupakan koleksi terpadu dari database dan program–program komputer

(utilitas) yang digunakan untuk mengakses dan memelihara database.

Program-program tersebut menyediakan berbagai fasilitas operasi untuk memasukan,

melacak, dan memodifikasi data kedalam database, mendefinisikan data baru,

serta mengolah data menjadi informasi yang dibutuhkan (DBMS = Database +

Program Utilitas) [4]. Perangkat lunak yang termasuk DBMS seperti dBase,

FoxBase, Rbase, Microsoft-Access (sering juga disingkat Ms-Access) dan Borland

Pradox (untuk DBMS yang sederhana) atau Borland-Interbase, MS-Sql, Sever,

Oracle Database, IBM, DB2, Informix, Sybase, MySql, PostgreSQL (untuk

DBMS yang lebih kompleks dan lengkap) [6].

2.2.4 Data Mining

Data mining, sering juga disebut knowledge discovery in database (KDD),

adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk

menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.

Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan

keputusan di masa depan. Sehingga istilah pattern recognition sekarang jarang

digunakan karena ia termasuk bagian dari data mining [7]. Data Mining adalah

suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam

database. Data Mining adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, dan machine learning untuk mengektrasi dan

mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari

berbagai database besar (Turban, dkk. 2005) [8].

2.2.4.1Tahapan Data Mining

Berikut adalah tahapan dalam data mining :

(30)

Seleksi data dari sekumpulan data operasional perlu dilakukan

sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil

seleksi yang akan digunakan untuk proses data mining, disimpan

dalam suatu berkas, terpisah dari baris data operasional.

2. Pre-Processing/cleaning

Sebelum proses data mining dapat dilakukan, perlu dilakukan dahulu

proses cleaning pada data yang menjadi fokus KDD, Knowledge

Discovery Databases. Proses cleaning mencakup antara lain

membuang duplikasi data, memeriksa data yang inkonsisten, dan

memeperbaiki kesalahan pada data. Juga dilakukan proses enrichment,

yaitu proses “meperkaya” data yang sudah ada dengan data atau

informasi lain yang relevan dan diperlukan untuk KDD.

Pre-processing data adalah hal yang harus dilakukan dalam proses data

mining karena tidak semua data atau atribut data dalam data

digunakan dalam proses data mining. Proses ini dilakukan agar data

yang akan digunakan sesuai dengan kebutuhan. Adapun

langkah-langkah pre-processing adalah sebagai berikut :

a. Pemilihan atribut (atribut selection)

Pemilihan atribut adalah proses pemilihan atribut data yang akan

digunakan sehingga dapat kita olah untuk proses mining.

b. Pembersihan data (data cleaning)

Proses menghilangkan noise dan menghilangkan data yang tidak

relevan.

3. Transformation

Coding adalah proses transformasi pada ata yang telah dipilih,

sehingga data tersebut sesuai untuk proses data mining. Proses coding

(31)

18

Teknik, metode, atau algortima yang tepat sangat bergantung pada

tujuan dan proses KDD secara keseluruhan.

5. Interpretation/evaluate on

Pola informasi yang dihasilkan dari proses data mining perlu

ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang

berkepentingan. Tahap ini merupakan bagian dari proses KDD yang

disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola

atau informasi yang disebut bertentangan dengan fakta atau hipotesis

yang ada sebelumnya.

2.2.4.2Metode Data Mining

Secara garis besar, Han dalam bukunya menjelaskan bahwa metode data

mining dapat dilihat dari dua sudut pandang pendekatan yang berbeda, yaitu

pendekatan deskriptif dan pendekatan prediktif [9].

Pendekatan deskriptif adalah pendekatan dengan cara mendeskripsikan

data inputan. Metode yang termasuk kedalam pendekatan ini adalah :

1. Metode deskripsi konsep/kelas, yaitu data dapat diasosiasikan dengan

kelas atau konsep. Ada tiga macam pendeskripsian yaitu (1)

karakteristik data, dengan membuat summary karakter umum atau

fitur data suatu kelas target, (2) diskriminasi data, dengan

membandingkan class target dengan satu atau sekelompok kelas

pembanding, (3) gabungkan antara karakterisasi dan diskriminasi.

2. Metode association rule, yaitu menemukan aturan asosiatif atau pola

kombinasi dari suatu item yang sering terjadi dalam sebuah data.

Pendekatan kedua adalah pendekatan prediktif, yaitu pendekatan yang

dapat digunakan untuk memprediksi, dengan hasil berupa kelas atau cluster.

Metode yang termasuk dalam pendekatan ini adalah :

1. Metode klasifikasi dan prediksi, yaitu metode analisis data yang

digunakan untuk membentuk model yang mendeskripsikan kelas data

yang penting, atau model yang memprediksikan trend data. Klasifikasi

(32)

sedangkan prediksi untuk memodelkan fungsi yang mempunyai nilai

kontinu.

2. Metode clustering, mengelompokan data untuk membentuk

kelas-kelas baru atau sering disebut cluster. Metode clustering bertujuan

untuk memaksimalkan persamaan dalam satu cluster dan

meminimalkan perbedaan antar cluster.

2.2.5 Association Rule

Association Rule atau Aturan Asosiasi adalah teknik Data Mining untuk

menemukan aturan asosiatif atau pola kombinasi dari suatu item. Bila kita

mengambil contoh aturan asosiatif dalam suatu transaksi pembelian barang di

suatu minimarket adalah kita dapat mengetahui berapa besar kemungkinan

seorang konsumen membeli suatu item bersamaan dengan item lainnya (membeli

roti bersama dengan selai). Karena awalnya berasal dari studi tentang database

transaksi pelanggan untuk menentukan kebiasaan suatu produk dibeli bersama

apa, maka association rule sering juga dinamakan market basket analysis [7].

Association Rule adalah bentuk jika “kejadian sebelumnya” kemudian “konsekuensinya” (If antecedent, then consequent), yang diikuti dengan perhitungan aturan support dan confidence. Bentuk umum dari association rule

adalah Antecedent -> Consequent. Bila kita ambil contoh dalam sebuah transaksi

pembelian barang di sebuah minimarket didapat bentuk association rule roti ->

selai, artinya bahwa pelanggan yang membeli roti ada kemungkinan pelanggan

tersebut juga akan membeli selai, dimana tidak ada batasan dalam jumlah

item-item pada bagian antecedent ataupun consequent dalam sebuah rule.

Association rule memiliki dua tahap pengerjaan, yaitu [10]:

1. Mencari kombinasi yang paling sering terjadi dari suatu itemset.

(33)

20

1. Support : suatu ukuran yang menunjukkan seberapa besar tingkat dominasi

suatu item/itemset dari keseluruhan transaksi. Ukuran ini menentukan

apakah suatu item/itemset layak untuk dicari confidence-nya (misal, dari

keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item

yang menunjukkan bahwa item A dan item B dibeli bersamaan).

2. Confidence : suatu ukuran yang menunjukkan hubungan antara 2 item

secara conditional (misal, menghitung kemungkinan seberapa sering item B

dibeli oleh pelanggan jika pelanggan tersebut membeli sebuah item A).

Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola

dengan membandingkan pola tersebut dengan nilai minimum kedua parameter

tersebut yang ditentukan oleh pengguna. Bila suatu pola memenuhi kedua nilai

minimum parameter yang sudah ditentukan sebelumnya, maka pola tersebut dapat

disebut sebagai interesting rule atau strong rule.

2.2.5.1Metodologi Dasar Analisis Asosiasi

Metodologi dasar Association Rule terbagi menjadi dua tahap, yaitu [10]:

a. Analisa pola frekuensi tinggi

Tahap ini mencari pola item yang memenuhi syarat minimum dari nilai

support dalam database. Menurut Larose, kita bebas menentukan nilai

minimum support (minsup) dan minimum confidence (mincof) sesuai

kebutuhan [11]. Sebagai contoh, bila ingin menemukan data-data yang

memiliki hubungan asosiasi yang kuat, minsup dan mincof-nya bisa diberi

nilai yang tinggi. Sebaliknya, bila ingin melihat banyaknya variasi data

tanpa terlalu mempedulikan kuat atau tidaknya hubungan asosiasi antara

item-nya, nilai minsup dan mincofnya dapat diisi rendah. Untuk

rekomendasi dalam menentukan minimum support dapat diambil dari

perhitungan rata-rata 1 jenis produk pada data yang digunakan, seperti

rumus berikut :

(34)

Persamaan 1 menjelaskan bahwa nilai support didapat dengan cara

membagi jumlah transaksi yang mengandung item A (satu item) dengan

jumlah total seluruh transaksi. Sedangkan untuk mencari nilai support dari

2 item menggunakan rumus berikut :

Support(A,B) = P(A ∩ B) = (Persamaan 2-2)

Persamaan 2 menjelaskan bahwa nilai support 2-itemsets didapat

dengan cara membagi jumlah transaksi yang mengandung item A dan item

B (item pertama bersamaan dengan item yang lain) dengan jumlah total

seluruh transaksi.

1. Pembentukan Aturan Assosiatif

Setelah semua pola frekuensi tinggi ditemukan, kemudian mencari

aturan asosiatif yang memenuhi syarat minimum untuk confidence dengan

menghitung confidence aturan assosiatif A -> B dari support pola

frekuensi tinggi A dan B, menggunakan rumus :

Confidence = (A -> B) = (Persamaan 2-3)

Persamaan 3 menjelaskan bahwa nilai confidence diperoleh dengan

cara membagi jumlah transaksi yang mengandung item A dan item B (item

pertama bersamaan dengan item yang lain) dengan jumlah transaksi yang

mengandung item A (item Pertama atau item yang ada disebelah kiri).

2.2.6 Algoritma CT-Pro

(35)

22

baik pembentukan tree maupun frequent itemset mining yang dilakukan menjadi

lebih cepat[12].

Langkah-langkah algoritma CT-PRO adalah sebagai berikut [13]:

1. Mencari Frequent Item, pada tahap ini terjadi proses-proses sebagai

berikut:

Data-data yang telah dikumpulkan, diseleksi dan pilih data yang

relevan (data yang lengkap).Data-data yang ada, kemudian dilakukan

transformasi data. Kemudian masing masing data diseleksi berdasarkan

minimum support yang telah ditentukan, kemudian didapat item yang

frekuen .Masing-masing item dihitung frekuensi kemunculannya sehingga

dihasilkan GlobalitemTable.

2. Membangun CFP-Tree , pada tahap ini terjadi proses-proses sebagai

berikut:

1. Frequent item yang telah didapatkan, diurutkan berdasarkan

Global Item tabel yang ada secara menurun (diurutkan mulai dari

item berfrekuensi terbesar hingga terkecil).

2. Dengan frequentitem yang telah terurut ini dibentuk Global

CFP-Tree , aturan pembentukan Global CFP-Tree sebagai berikut:

a. CFP-Tree terdiri dari tree yang memiliki root yang mewakili

indeks dari item dengan tingkat kemunculan tertinggi dan

kumpulan subtree sebagai anak dari root.

b. Jika I = {i1,i2, …, ik} adalah kumpulan dari frequent item

pada node tersebut, dan level yang menunjukkan struktur data

tree pada node tersebut dimulai dari item yang terdapat pada

(36)

(37)

24

Dalam pencarian itemfrequent dan membangun CFP tree digunakan Algoritma

sebagai berikut :

input Database D, Support Threshold σ output CFP-Tree 1 begin

12 Sort GlobalItemTable in frequency descending order

13 Assign an index for each frequent item in the GlobalItemTable 14 // Step 2: Construct CFP-Tree

15 Construct the left most branch of the tree 16 for each transaction t ∈ D

17 Initialize mappedTrans 18 for each frequent item i ∈ t

19 mappedTrans = mappedTrans ∪ GetIndex(i) 20 end for

21 Sort mappedTrans in ascending order of item ids 22 InsertToCFPTree(mappedTrans)

23 end for 24 end

25 Procedure InsertToCFPTree(mappedTrans) 26 firstItem := mappedTrans[1]

27 currNode := root of subtree pointed by ItemTable[firstItem] 28 for each subsequent item i ∈ mappedTrans

29 if currNode has child represent i

(38)

Gambar 2. 3 Algorithm 1 CT-PRO Algorithm: Step 1 and Step 2[13]

3. Melakukan penggalian frequent patterns, pada tahap ini terjadi

proses-proses sebagai berikut :

a. Pada tahap mining ini, algoritma CT-Pro bekerja dengan

melakukan bottom-up mining sehingga Global Item tabel

diurutkan mulai dari item berfrekuensi terkecil hingga

terbesar.

b. Untuk setiap item yang terdaftar pada Global Item tabel yang

telah diurutkan, dilakukan pencarian node yang berkaitan

dengan item tersebut pada Global CFP-Tree . Dari semua

node yang ditemukan untuk setiap item inilah yang disebut

dengan Local Frequent item dan digunakan untuk membuat

Local Item Tabel.

c. Pada pembuatan Local item tabel ini juga dilakukan

berdasarkan jumlah minimum support yang telah ditentukan.

d. Setelah itu, dibuat Local CFP-Tree berdasarkan Local Item

Tabel yang terbentuk. Aturan pembentukan Local CFP-Tree

sama dengan pembentukan Global CFP-Tree , yang

membedakan adalah pada Global CFP-Tree yang digunakan

dalam pembentukan tree-nya adalah Global Item tabel yang

terbentuk dari Global Item tabel data sedangkan pada Local

CFP-Tree yang digunakan dalam pembentukan tree-nya

adalah Local Item tabel yang terbentuk dari Local Frequent

item.

e. Dari Local CFP-Tree dibentuk frequent pattern sesuai

dengan item yang di-mining.

(39)

26

Berikut merupakan algoritma dalam penggalian frequent Patterns:

Gambar 2. 4 Algoritma 1 CT-PRO Penggalian Frequent Patterns[13]

Berikut ini merupakan contoh kasus penerapan metode association rule

menggunakan CFP-Tree:

Misalkan terdapat itemset seperti gambar di bawah dan ingin kita dapatkan

frequentPattern-nya. Min_support untuk itemset di bawah ini adalah 2 (20%). input CFP-Tree output Frequent Itemsets FP

1 Procedure Mining

2 for each frequent item i ∈ GlobalItemTable from the least to the most frequent 3 Initialize LocalFrequentPatternTree with i as the root

10 Traverse the LocalFrequentPatternTree to print the frequent itemsets

25 for each occurrence of node i in the CFP-Tree 26 Initialize mappedTrans

27 for each frequent item j ∈ LocalItemTable in the path to the root

28 mappedTrans = mappedTrans ∪ GetIndex(j) 29 end for

30 Sort mappedTrans in ascending order of item ids

(40)

Tabel 2. 1 Sampel Transaksi

tid item

1 C D E F G H

2 A C D E M

3 A B D E G K

4 A C D H

5 A C D J

Dari itemset di atas kita hitung jumlah kemunculan masing-masing item dan

buang yang tidak memenuhi min support dan buat tabel baru dengan nama header

Table secara menurun sehingga didapatkan Frequent item.berikut Hasil pencarian

item frequent item.

Tabel 2. 2 Item yang Frequent

tid item

1 C D E F G H

2 A C D E

3 A B D E G

4 A C D H

5 A C D

Didapat dari transaksi di atas item A(4),C(4),D(5),E(3),G(2) Setelah kita dapatkan

item dengan jumlah count setiap item lakukan mapping pada transaksi dengan

Index pertama yang memiliki count terbesar.Berikut merupakan Hasil Mapping

Node data :

Tabel 2. 3 Mapping Transaksi

tid item

(41)

28

Setelah dilakukan mapping data selanjutnya adalah membangun Global CFP-Tree

dengan menggunakan data transaksi pada Table 2.1 berikut hasil dari

Gambar 2. 5 Hasil Global CFP-Tree

Setelah membuat Global CFP-Tree selanjutnya adalah membuat mencari

frequent Pattern dari Global- CFP - tree dengan memilih item dengan support

count terkecil atau memilih node terkahir sebagai contoh pada Global CFP –Tree

pada gambar 2.3 Index node 5 merupakan node terakhir kemudian lakukan

penulusuran pada node tersebut dengan menghitung setiap count dari item.Dari

hasil di atas item yang memenuhi minimum support count adalah item D(2) dan

E(2) selanjutnya berikan Index ide baru pada local item Table, lalu lakukan

pembangunan Local CFP-Tree sebagai berikut :

Index Item Count

(42)

count yang telah di tentukan berati item tersebut memnuhi frequent berikut hasil

projek id 5:

1 D

5

2 E

4

5 G

4

1 D

5

Gambar 2. 7 Local CFP-Tree projection 5

Dari Local CFP-Tree projection maka didapatkan itemfrequent untuk Index 5

dengan item G adalah sebagai berikut: (5,2,1:6)

2.2.7 Unifief Modelling Language (UML)

UML singkatan dari Unified Modeling Languages yang berarti bahasa

pemodelan standar. Ketika kita membuat model menggunakan konsep UML ada

aturan-aturan yang harus diikuti. Bagaimana elemen pada model-model yang kita

buat berhubungan satu dengan yang lainnya harus mengikuti standar yang ada.

UML bukan hanya sekedar diagram tetapi juga menceritakan konteksnya[14].

Berikut adalah beberapa model yang digunakan dalam perancangan aplikasi Data

Mining untuk menentuan rekomendasi layout barang di Summit the Boutique

Outlet untuk menggambarkan sistem dalam UML:

1. Diagram Use Case

2. Diagram Activity

3. Diagram Sequence

(43)

30

komponen, kejadian atau kelas[14]. Komponen pembentuk Use Case Diagram

adalah sebagai berikut :

1. Actor

Pada dasarnya actor bukanlah bagian dari use case diagram, namun

untuk dapat terciptanya suatu use case diagram diperlukan beberapa actor.

Actor tersebut mempresentasikan seseorang atau sesuatu (seperti

perangkat, sistem lain) yang berinteraksi dengan sistem. Sebuah actor

mungkin hanya memberikan informasi inputan pada sistem, hanya

menerima informasi dari sistem atau keduanya menerima, dan memberi

informasi pada sistem. Actor hanya berinteraksi dengan use case, tetapi

tidak memiliki kontrol atas use case. Actor digambarkan dengan stick man.

Actor dapat digambarkan secara secara umum atau spesifik, dimana untuk

membedakannya kita dapat menggunakan relationship.

2. Use Case

Use case adalah gambaran fungsionalitas dari suatu sistem, sehingga

customer atau pengguna sistem paham dan mengerti mengenai kegunaan

sistem yang akan dibangun.

Catatan : Use case diagram adalah penggambaran sistem dari sudut

pandang pengguna sistem tersebut (user), sehingga pembuatan use case

lebih dititikberatkan pada fungsionalitas yang ada pada sistem, bukan

berdasarkan alur atau urutan kejadian.

Cara menentukan Use Case dalam suatu sistem:

1. Pola perilaku perangkat lunak aplikasi.

2. Gambaran tugas dari sebuah actor.

3. Sistem atau “benda” yang memberikan sesuatu yang bernilai

kepada actor.

4. Apa yang dikerjakan oleh suatu perangkat lunak (*bukan

bagaimana cara mengerjakannya).

Ada beberapa relasi yang terdapat pada use case diagram:

(44)

2. Generalization, disebut juga inheritance (pewarisan), sebuah

elemen dapat merupakan spesialisasi dari elemen lainnya.

3. Dependency, sebuah elemen bergantung dalam beberapa cara ke

elemen lainnya.

4. Aggregation, bentuk association dimana sebuah elemen berisi

elemen lainnya.

Tipe relasi/ stereotype yang mungkin terjadi pada use case diagram:

1. <<include>> , yaitu kelakuan yang harus terpenuhi agar sebuah

event dapat terjadi, dimana pada kondisi ini sebuah use case

adalah bagian dari use case lainnya.

2. <<extends>>, kelakuan yang hanya berjalan di bawah kondisi

tertentu seperti menggerakkan alarm.

3. <<communicates>>, mungkin ditambahkan untuk asosiasi yang

menunjukkan asosiasinya adalah communicates association. Ini

merupakan pilihan selama asosiasi hanya tipe relationship yang

dibolehkan antara actor dan use case.

2.2.7.2Activity Diagram

Activity diagram memiliki pengertian yaitu lebih fokus kepada

menggambarkan proses bisnis dan urutan aktivitas dalam sebuah proses. Dipakai

pada business modeling untuk memperlihatkan urutan aktifitas proses bisnis.

Memiliki struktur diagram yang mirip flowchart atau data flow diagram pada

perancangan terstruktur. Memiliki pula manfaat yaitu apabila kita membuat

diagram ini terlebih dahulu dalam memodelkan sebuah proses untuk membantu

memahami proses secara keseluruhan dan activity dibuat berdasarkan sebuah atau

(45)

32

diketahui objek-objek yang terlibat dalam sebuah use case beserta metode-metode

sekuen juga di butuhkan untuk melihat skenario yang ada pada use case[14].

Sequence diagram biasa digunakan untuk menggambarkan skenario atau

rangkaian langkah-langkah yang dilakukan sebagai respons dari sebuah event

untuk menghasilkan output tertentu. Diawali dari apa yang men-trigger aktivitas

tersebut, proses dan perubahan apa saja yang terjadi secara internal dan output apa

yang dihasilkan. Masing-masing objek, termasuk aktor, memiliki lifeline vertikal.

Message digambarkan sebagai garis berpanah dari satu objek ke objek lainnya.

2.2.7.4Class Diagram

Diagram kelas atau class diagram menggambarkan struktur sistem dari

segi pendefinisian kelas-kelas yang akan di buat untuk membangun sistem. Kelas

memiliki apa yang disebut atribut dan metode atau operasi.

1. Atribut merupakan variabel-variabel yang di miliki oleh suatu kelas

2. Operasi atau metode adalah fungsi-fungsi yang dimiliki oleh suatu

kelas

Diagram kelas dibuat agar pembuat program atau programmer membuat

kelas-kelas sesuai rancangan di dalam diagram kelas agar antara dokumentasi

perancangan dan perangkat lunak sinkron. banyak berbagai kasus, perancangan

kelas yang dibuat tidak sesuai dengan kelas-kelas yang dibuat pada perangkat

lunak, sehingga tidaklah ada gunanya lagi sebuah perancangan karena apa yang

(46)

BAB 5

KESIMPULAN DAN SARAN

Pada bab ini akan disimulkan hasil penelitian yang telah dilakukan serta

saran untuk pengembangan penelitian lebih lanjut.

5.1 Kesimpulan

Berdasarkan hasil Implementasi dan Pengujian yang telah dilakukan pada

sistem Data Mining yang telah dibagun dengan menggunakan Metode Association

Rule dan Algoritma CT-Pro, maka dapat diambil kesimpulan sebagai berikut :

1. Aplikasi yang dibangun dapat menghasilkan informasi berupa jenis art apa

saja yang saling berkaitan dan sering dibeli secara bersama sebagai dasar

keputusan dalam menentukan rekomendasi layout.

2. Aplikasi yang dibangun dapat membantu Supervisor memberikan informasi

rekomendasi layout produk kepada pramuniaga pada saat penempatan produk

dilakukan.

5.2Saran

Saran untuk pengembangan lebih lanjut, yaitu sebagai berikut :

1. Pengembangan dalam memberikan rekomendasi layout produk dengan

output yang lebih dinamis lagi sehingga memudahkan dan menyenangkan

Supervisor dalam menggunakan aplikasi.

2. Pengembangan dengan Menggunakan database yang tersedia di Summit

Boutique Outlet sebagai pengganti import data yang pada penelitian ini

menggunakan format .xlxs dalam mengeksekusi data penjualannya

sehinggal aplikasi dapat digunakan dengan memilih berdasarkan data

(47)