• Tidak ada hasil yang ditemukan

Penerapan Data Mining Dalam Penentuan Pola Pembelian Customer di PT Coppal Utama Indomelt Menggunakan Algoritma FP-Growth

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan Data Mining Dalam Penentuan Pola Pembelian Customer di PT Coppal Utama Indomelt Menggunakan Algoritma FP-Growth"

Copied!
38
0
0

Teks penuh

(1)
(2)
(3)
(4)

RIWAYAT HIDUP PENULIS

Nama : Hans Bryan Setra

NIM : 10110022

Tempat/Tanggal Lahir : Bandung, 4 Desember 1992 Jenis Kelamin : Laki-laki

Agama : Kristen Protestan

Alamat : Ds.Cukanggenteng RT 01 RW 02 No 19 Kec. Pasirjambu Kab. Bandung

Kota : Bandung

Telepon : 085659972762

Email : [email protected]

PENDIDIKAN

1. 1998 – 2004 : SDN Cukanggenteng 1 2. 2004 – 2007 : SMPN 1 Ciwidey

3. 2007 – 2010 : SMA Angkasa Lanud Sulaeman

4. 2010 – 2016 : Program Studi S1 Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer

Universitas Komputer Indonesia, Bandung

Dengan ini Penulis menyatakan bahwa semua informasi yang diberikan dalam dokumen ini adalah benar

Bandung, 2016 Penulis

(5)

PENERAPAN DATA MINING DALAM PENENTUAN POLA

PEMBELIAN CUSTOMER

DI PT.COPPAL UTAMA INDOMELT MENGGUNAKAN

ALGORITMA FP-GROWTH

Skripsi

Diajukan untuk Menempuh Ujian Akhir Sarjana

Hans Bryan Setra

10110022

Program Studi Teknik Informatika

Fakultas Teknik Dan Ilmu Komputer

Universitas Komputer Indonesia

(6)
(7)

Kata Pengantar

Puji dan Syukur penulis panjatkan kepada Tuhan Yesus Kristus, yang telah memberikan rahmat, akal budi dan berkat-Nya yang melimpah, sehingga penulis dapat menyelesaikan penyusunan laporan Tugas Akhir yang berjudul “Penerapan Data Mining Dalam Penentuan Pola Pembelian Customer Di PT,Coppal Utama Indomelt Menggunakan Algoritma Fp-Growth”. Dalam hal ini penulis menyadari

bahwa laporan tugas akhir ini masih jauh dari sempurna dan masih banyak kekurangan mengingat terbatasnya kemampuan serta ilmu yang dimiliki oleh penulis.

Pada kesempatan kali ini, sengan rendah hati penulis ingin menyampaikan penghargaan dan rada terimakasih yang sebesar-besarnya kepada:

1. Kedua orang tua yang telah memberikan segalanya kepada penulis sehingga penulis dapat ada dan menjadi apa yang ada seperti sampai saat ini.

2. Adik tersayang Claudi Arga Immanuel Setra, terimakasih banyak atas dukungan dan doanya

3. Ibu Dian Dharmayanti S.T.,M.Kom selaku dosen pembiming sekaligus dosen wali penulis yang telah banyak membantu penulis dalam menyelesaikan pembuatan laporan Tugas Akhir ini, dan juga telah banyak memberikan memotivasi kepada penulis.

4. Bapak Adam Mukharil Bachtiar, S.Kom.,M.T. sekalu Penguji 1 yang telah banyak memberikan masukan kepada penulis.

5. Seluruh jajaran dosen dan staff Program Studi Teknik Informatika yang telah memberikan banyak masukan kepada penulis.

6. Orang special, Julia Sri Tanjung S.Si yang telah meberikan semangat dan motivasi

7. Keluarga 6C++ Bang MJ, K gege, K Veve, Irfan, Mayer, Anggi, Icha, Bang Andrew yang selalu mendukung dan memberi semangat kepada saya. 8. Sahabat sahabatku, Ardy, Titus,Ino, Edward, Yolanda, Yopie, Sheini yang

terus mendukung dalam doa dan memberikan semangat.

9. Rekan – rekan IF1 2010 yang bersama sama berjuang dalam perkuliahan. 10.Kukuh, Putra, Teguh yang telah membantu saya dalam menyelesaikan

(8)

Semoga Laporan Tugas Akhir bermanfaat bagi penulis khususnya dan bagi para pembaca pada umumnya saya mengharapkan kritik dan saran dari para pembaca dalam pengembangan laporan ini.

Bandung, July 2016

(9)

DAFTAR ISI

ABSTRAK ... i

ABSTRACT………..i

KATA PENGANTAR………..i

DAFTAR ISI ... i

DAFTAR GAMBAR ………...i

DAFTAR TABEL……….…i

DAFTAR SIMBOL………...i

BAB 1 ... 1

PENDAHULUAN ... 1

1.1. Latar Belakang Masalah ... 1

1.2. Perumusan Masalah ... 2

1.3. Maksud dan Tujuan ... 2

1.4. Batasan Masalah... 2

1.5. Metodologi Penelitian ... 3

1.5.1 Metode Pengumpulan Data ... 3

1.5.2 Metode Penelitian Data Mining ... 3

1.6 Metode Pembangunan Perangkat Lunak ... 4

1.7 Sistematika Penulisan ... 5

BAB 1 PENDAHULUAN ... 5

BAB 2 TINJAUAN PUSTAKA ... 5

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 5

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 6

BAB 5 KESIMPULAN DAN SARAN ... 6

BAB 2 ... 7

(10)

2.1 Profil Perusahaan ... 7

2.1.1 Logo ... 7

2.1.2 Visi dan Misi ... 7

2.1.2.1 Visi ... 7

2.1.2.2 Misi ... 8

2.2 Landasan Teori ... 8

2.2.1 Data ... 8

2.2.2 Database ... 8

2.2.2.1 Data pada Database dan Hubungannya ... 8

2.2.2.2 keuntungan dan Kerugian Pemakaian Sistem Database ... 9

2.2.3 Data Mining ... 9

2.2.3.1 Konsep Data Mining ... 10

2.2.3.2 Tahapan Data Mining ... 11

2.2.3.3 Metode –Metode Data Mining ... 12

2.2.2.4 Cross-Industry Standard Process for Data Mining (CRISP-DM) ... 14

2.2.5 Association Rule ... 17

2.2.6 Algoritma FP-Growth ... 19

2.2.7 Unified Modelling Language (UML) ... 22

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 25

3.1 Analisis Sistem ... 25

3.1.1 Analisis Masalah ... 25

3.1.2 Analisis Penerapan Metode CRISP-DM ... 26

3.1.2.1 Pemahaman Bisnis ... 26

3.1.2.2 Pemahaman Data ... 26

(11)

3.1.2.4 Pemodelan ... 28

3.1.3.1 Analisis Kebutuhan Non-Fungsional ... 40

3.1.3.2 Analisis Kebutuhan Perangkat Keras ... 40

3.1.3.3 Evaluasi kebutuhan perangkat keras ... 41

3.1.3.4 Analisis Kebutuhan Perangkat Lunak ... 41

3.1.3.5 Evaluasi kebutuhan perangkat lunak ... 42

3.1.3.7 Analisis Kebutuhan Fungsional ... 43

3.2.1.1 Skenario Use Case... 45

3.2 Perancangan Sistem ... 70

3.2.1 Perancangan Class ... 71

3.2.2 Perancangan Basis Data ... 74

3.2.3 Skema Relasi ... 75

3.2.4 Struktur Tabel... 75

3.2.5 Perancangan Struktur Menu ... 76

3.2.6 Perancangan Antar Muka ... 77

3.2.7 Perancangan Pesan ... 80

3.2.8 Jariangan Semantik ... 81

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 82

4.1 Implementasi Sistem ... 82

4.1.1 Perangkat Keras yang Digunakan ... 82

4.1.2 Perangkat Lunak yang Digunakan ... 83

4.1.3 Implementasi Basis Data ... 83

4.1.4 Implementasi Antarmuka ... 84

4.2 Pengujian Sistem ... 85

(12)

4.2.1.2 Kesimpulan Pengujian Alpha ... 87

4.2.2 Pengujian Beta ... 88

4.2.3 Pengujian Hasil ... 88

4.2.3.1 Kesimpulan Pengujian Hasil ... 90

BAB 5 KESIMPULAN DAN SARAN ... 91

5.1 Kesimpulan ... 91

5.2 Saran ... 91

(13)

DAFTAR PUSTAKA

[1].H.AFAJAR, Data Mining, Andi 2013.

[2].J.Han and M.Kamber, Data Mining : Concept and Techniques, 2nd ed. San Fransisco: Morgan Kauffman, 2006

[3].Sujatha Dandu, B.L.Deekshatulu & Priti Chandra (2013). Algorithm for Frequent Item sets Mining Based on Apriori and FP-Tree. Aurora’s Technological and Research Institute, Hyderabad, India, 13 (2),1-5.

[4].Dawen Xia,Yanhui Zhou, Zhuobo Rong, and Zili Zhang (2012). IPFP: An

Improved Parallel FP-Growth Algorithm for Frequent Itemsets Mining. School of Computer and Information Science, Southwest University, Chongqing, China Institute of Statistics, Southwest University, Chongqing, China School of

Information Technology, Deakin University, Victoria, Australia, Guizhou Minzu University, Guiyang, China,1-6.

[5].Jian Pei 2013, Data Mining & Improved on FP-Growth,

(14)

1

BAB 1

PENDAHULUAN

1.1. Latar Belakang Masalah

PT.COPPAL UTAMA INDOMELT adalah Perusahaan yang bergerak dibidang pengecoran logam, tembaga, baja untuk membuat bagian atau rangka awal suatu produk yang dibutuhkan oleh perusahaan yang bergerak di pembuatan mobil, alat industri dan lainnya.

Dalam proses pemesanan barang, pihak perusahaan kerap kali permasalahan. Masalah yang sering dihadapi adalah kehabisan stok barang mentah untuk pembuatan pesanan barang yang memiliki tingkat keinginan yang sangat tinggi. Masalah ini sangat mempengaruhi hal penyediaan stok barang dan alokasi dana penyediaan barang tersebut. Tentunya perusahaan menginginkan laba yang signifikan dengan memiliki selisih pemasukan yang lebih besar dari pada pengeluaran. Untuk itulah dibutuhkan upaya untuk mengolah pola peyediaan barang sedemikian rupa berdasarkan prediksi dari tingkat keinginan konsumen sehingga ketika diadakan penyediaan stok barang mentah, barang yang disediakan lebih banyak adalah barang yang memiliki tingkat keinginan yang lebih tinggi dikalangan konsumen, sedangkan barang yang lainnya disediakan lebih sedikit.

Untuk memungkinkan hal yang telah disebutkan sebelumnya dibutuhkan sebuah sistem yang dapat membantu pengolahan data pengadaan stock barang berdasarkan tingkat keinginan konsumen yang dapat menjadi acuan bagi perusahaan untuk mengadakan penyediaan barang dan sistem ini akan menggunakan salah satu algoritma Association Analysis yaitu Frequent Pattern Growth (FP-Growth), Algoritma FP-Growth ini adalah algoritma yang memungkinkan pencarian data yang sering digunakan.

(15)

FP-2

GROWTH” dalam bentuk tugas akhir sebagai upaya pemberian solusi agar dapat

memudahkan pihak perusahaan dalam mengatur stok barang yang di butuhkan.

1.2. Perumusan Masalah

Dari latar belakang di atas dapat disimpulkan perumusan masalah yaitu bagaimana cara menerapkan data mining dengan metode association rules untuk merekomendasikan barang casting yang harus diproduksi oleh PT. Coppal Utama Indomelt.

1.3. Maksud dan Tujuan

Maksud dari penelitian ini adalah untuk menerapkan data mining dalam perekomedasian barang dengan metode association mining rules PT Coppal Utama Indomelt.

1. Membantu pihak perusahaan dalam memanfaatkan data penjualan untuk mendapatkan informasi di dalam data penjualan tersebut.

2. Membantu pihak perusahaan untuk mendapatkan informasi mengenai barang apa saja yang harus diproduksi.

.

1.4.Batasan Masalah

Berdasarkan latar belakang masalah yang sudah dijelaskan di atas, maka rumusan masalah yang dapat penulis rumuskan adalah :

1. Algoritma yang digunakan dalam penelitian ini adalah algoritma fp-growth.

2. Data yang digunakan adalah data penjualan barang yang ada di perusahaan pada periode bulan juni - agustus 2015.

3. Aplikasi ini dibangun berbasis desktop.

4. Analisis dan perancangan yang digunakan adalah metode Object Orientied OO.

(16)

3

1.5. Metodologi Penelitian

Metodologi penelitian merupakan suatu proses yang digunakan untuk memecahkan suatu masalah yang logis, dimana memerlukan data untuk mendukung terlaksananya suatu penelitian. Metodologi penelitian yang digunakan adalah metode deskriptif, yaitu metode yang menggambarkan fakta-fakta dan informasi dalam situasi atau kejadian dimasa sekarang secara sistematis, faktual dan akurat. Metodologi penelitian ini memiliki dua metode, yaitu metode pengumpulan data dan metode pembangunan perangkat lunak.

1.5.1 Metode Pengumpulan Data

Metode penelitian yang digunakan dalam pembangunan sistem untuk tugas akhir ini adalah sebagai berikut :

a. Studi Literatur

Pengumpulan data dengan cara mengumpulkan literatur, jurnal, paper dan bacaan-bacaan yang ada kaitannya dengan judul penelitian.

b. Observasi

Teknik pengumpulan data dengan mengadakan penelitian dan peninjauan langsung terhadap permasalahan yang diambil.

c. Interview

Teknik pengumpulan data dengan mengadakan tanya jawab secara langsung yang ada kaitannya dengan topik yang diambil.

1.5.2 Metode Penelitian Data Mining

(17)

4

1.6 Metode Pembangunan Perangkat Lunak

Metode yang digunakan dalam pembuatan perangkat lunak ini menggunakan model waterfall seperti pada Gambar 1.1. Model ini adalah model klasik yang melakukan pendekatan secara sistematis, berurutan dalam membangun software berkat penurunan dari satu fase ke fase lainnya. Tahap dari model ini adalah sebagai berikut:

1. Communication

Tahap communication dilakukan analisis terhadap kebutuhan pembangunan aplikasi dengan melakukan pengumpulan data dan mengadakan pertemuan dengan pihak perusahaan maupun mengumpulkan data tambahan baik yang ada di jurnal, artikel, maupun internet.

2. Planning

Pada tahap planning akan direncanakan kebutuhan atau informasi apa yang akan ditampilkan, tools dan data yang digunakan, agar sistem informasi yang ditampilkan sesuai dengan permintaan dan keinginan pihak perusahaan .

3. Modeling

Tahap modeling akan dilakukan perancangan terhadap sistem aplikasi data mining, proses ini berfokus pada rancangan struktur data berupa Use Case Diagram, kebutuhan fungsional dan non fungsional, perancangan antarmuka dan struktur menu yang akan digunakan pada sistem informasi yang dibangun sebelum dilakukan proses coding.

4. Construction

Tahap construction akan dibangun sistem sesuai dengan permintaan dari pihak perusahaan . Pada tahap ini perencanaan dan perancangan sistem informasi ini akan diimplementasikan kedalam bahasa pemrograman C# dan MySQL sebagai database server yang menerima dan mengirimkan datanya. Setelah selesai maka akan dilakukan testing berupa pengujian terhadap sistem yang telah dibuat. Tujuan testing adalah menemukan kesalahan-kesalahan terhadap sistem tersebut untuk kemudian bisa diperbaiki.

(18)

5

Tahap deployment bisa dikatakan final dari pembuatan aplikasi data mining . Setelah melakukan analisis, desain dan pengkodean, maka sistem yang sudah jadi akan digunakan oleh pihak perusahaan dan pengguna Kemudian sistem yang telah dibuat harus dilakukan pemeliharaan secara berkala.

Gambar 1.1 Model Waterfall

1.7 Sistematika Penulisan

BAB 1 PENDAHULUAN

Bab ini akan membahas mengenai latar belakang masalah, perumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian yang digunakan, serta sistematika penulisan.

BAB 2 TINJAUAN PUSTAKA

Membahas berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan hal-hal yang berguna dalam proses analisis permasalahan. Membahas tentang konsep dasar serta teori-teori yang berkaitan dengan topic penelitian dan yang melandasi penerapan data mining untuk menentukan strategi pasar.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

(19)

6

menjadi lebih baik. Menjelaskan tentang perencanaan sistem secara keseluruhan berdasarkan hasil dari analisis perancangan sistem ini mencakup perancangan basis data, perancangan menu, dan perancangan interface atau antarmuka sistem yang akan di bangun.

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini berisi tentang implementasi dan pengujian sistem yang telah dikerjakan, yang terdiri dari menerapkan rencana implementasi, melakukan kegiatan implementasi, dan tindak lanjut implementasi. Selain itu juga berisi pengujian aplikasi yang dikerjakan.

BAB 5 KESIMPULAN DAN SARAN

(20)

7

BAB 2

TINJAUAN PUSTAKA

2.1 Profil Perusahaan

PT.COPPAL UTAMA INDOMELT adalah Perusahaan yang bergerak dibidang pengecoran logam, tembaga, baja untuk membuat bagian atau rangka awal suatu produk yang dibutuhkan oleh perusahaan yang bergerak di pembuatan mobil, alat industri dan lainnya.

PT.Coppal Utama Indomelt didirikan tahun 1998 dan dibangun dari buah keterbatasan yang membuat semangat juang tumbuh semakin kuat, kami selalu berusaha menjaga kepuasan konsumen dengan terus mengembangkan penelitian dan teknologi di bidang pengecoran logam. Tujuan yang terus perusahaan ini kembangkan dari waktu ke waktu adalah membuat casting yang mempunyai kualitas baik dan harga yang bersaing. Perusahaan ini juga ingin menjadi sebuah perusahaan pengecoran logam yang disegani dan mempunyai pasar yang luas di Indonesia.

Perusahaan ini juga selalu memotivasi seluruh aspek yang ada di perusahaan agar mengutamakan kepuasan pelanggan. Komplain atau kritik dari pelanggan adalah salah satu prioritas perusahaan ini untuk terus mengadakan improvisasi kualitas pruduk dan manajemen.

2.1.1 Logo

Gambar 2 1 Logo Perusahaan

2.1.2 Visi dan Misi

2.1.2.1 Visi

(21)

8

2.1.2.2 Misi

National solution for local component supply with competitive quality,

cost and delivery in advance technology” 2.2 Landasan Teori

Landasan teori yang berkaitan dengan materi atau teori yang digunakan sebagai acuan melakukan penelitian. Landasan teori yang diuraikan merupakan hasil studi literatur, buku-buku, maupun situs internet.

2.2.1 Data

Data Adalah segala fakta, angka atau teks yang dapat diproses oleh computer. Data dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data adalah seusuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data terdapat himpunan data yang merupakan kumpulan dari objek dan atributnya. Atributnya merupakan sifat atau karakteristik atau fitur. Salah satu himpunan data adalah record data, yaitu data yang terdiri dari sekumpulan record, yang masing-masing terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe fata record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari record data, dimana tiap record (transaksi) meliputi satu set item.

2.2.2 Database

Database adalah susunan record data operasional lengkap dari suatu organisasi atau perusahaan yang diorganisir dan disimpan secara terintegrasi dengan menggunakan metode tertentu dalam komputer sehingga mampu memenuhi informasi yang optimal yang dibutuhkan oleh para pengguna.

2.2.2.1 Data pada Database dan Hubungannya

Ada 3 jenis data pada sistem database, yaitu:

1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data

(22)

9

3. Data keluaran (output data), berupa laporan melalui peralatan output

sebagai hasil dari dalam sistem yang mengakses data operasional. 2.2.2.2 keuntungan dan Kerugian Pemakaian Sistem Database

Keuntungan :

1. Terpeliharanya keselarasan data

2. Data dapat dipakai secara bersama-sama.

3. Memudahkan penerapan standarisasi dan batas-batas pengamanan.

4. Terpeliharanya keseimbangan atau perbedaan kebutuhan data dari setiap aplikasi.

5. Program/data independent.

Kerugian:

1. Mahal dalam implementasinya 2. Rumit/kompleks.

3. Penanganan proses recovery backup sulit.

4. Kerusakan pada sistem basis data mempengaruhi. 2.2.3 Data Mining

Data Mining adalah proses untuk mendapatan informasi yang berguna dari gedung basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Istilah data mining kadang disebut juga

knowledge discovery. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model. Kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam basis data yang tersimpan. Dalam data mining, pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat mengetahui pola universal

data-data yang ada.

Istilah data mining sering disebut dengan nama knowledge discovery atau

(23)

10

1. Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar

2. Ekstrasi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui potensi kegunaannya) pola atau pengetahuan dari data yang di simpan dalam jumlah besar

3. Eksplorasi dari analisa secara otmatis atau semiotomatis terhadap data data dalam jumlah besar untuk mencari pola dan aturan yang berarti.

2.2.3.1 Konsep Data Mining

Data mining sangat diperlukan terutama dalam mengelola data yang sangat besar untuk meudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi pengguna data mining. Alasan utama data mining sangat dibutuhkan dalam industri informasi karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran atau berjumlah besar. Informasi iniliah yang nantinya sangat berguna untuk pengembangan. Berikut adalah langkah-langkah dalam data mining :

(24)

11

1. Data cleaning yaitu untuk menghilangkan noise data yang tidak konsisten. 2. Data integration yaitu menggabungkan beberapa file atau database.

3. Data selection yaitu data yang relevan dengan tugas analisis dikembalikan ke dalam database untuk proses data mining.

4. Data transformation yaitu data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi. 5. Data mining yaitu proses esensial dimana metode yang intelejen

digunakan untuk mengekstrak pola data.

1. Knowledge disccovery yaitu proses esential dimana metode yang intelejen digunakan untuk mengekstrak pola data.

2. Pattern evolution yaitu untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik.

3. Knowledge presentation yaitu gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambah kepada user.

2.2.3.2 Tahapan Data Mining

Tahapan dalam melakukan data mining salah satunya adalah

preprocessing data. Tahapan ini biasanya diperlukan karena data yang akan digunakan belum baik, yang disebabkan oleh beberapa faktor berikut ini :

1.Incomplete : tidak lengkapnya nilai suatu atribut, tidak lengkapnya atribut-atribut yang penting, atau hanya mempunyai data yang merupakan rekapitulasi 2.Noisy : mengandung eror atau merupakan value yang tidak wajar.

3.Inconsisten : mengandung nilai yang saling bertentangan.

Padahal data yang bisa diterima untuk bisa diproses menjadi informasi atau knowledge adalah data yang mempunyai kualitas diantaranya :

(25)

12

e. Bisa dipercaya

f. Mempunyai nilai tambah g. Kemudahan untuk dimengerti

Jika data tidak dalam kualitas seperti yang telah diuraikan diatas,maka kualitas analisis data menajdi kurang sehingga hasilnya pun kurang bermakna. Hal tersebut harus dihindarkan karena hasil analisa yang salah dapat berujung pada solusi yang salah. Untuk itu, perlu dilakukan preprocessing data yang bertujuan agar membuat data menjadi lebih berkualitas. Adapun tahapan-tahapannya adalah sebagai berikut :

1. Data cleaning : mengisi/mengganti nilai-nilai yang hilang. Menghaluskan daya yang noisy, mengidentifikasi dan menghilangkan data yang tidak wajar, dan menyelesaikan masalah inconsistensi data.

2. Data integration : menggabungkan beberapa database, dan file menjadi satu sehingga didapatkan sumber data yang besar.

3. Data transformation : normalisasi dan agresi data.

4. Data reduction : mengurangi volume data namun tetap mempertahankan arti dalam hal hasil analisis data.

5. Data discretization : merupakan bagian dari data reduction dengan memperhitungkan data yang signifikan, khususnya pada data numerik.

2.2.3.3 Metode –Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu :

1.Deskripsi

(26)

13

2.Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

3.Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.Contoh prediksi dalam bisnis dan penelitian adalah :

1.Prediksi harga beras dalam tiga bulan yang akan datang.

2.Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan.

4.Klasifikasi

Dalam klasifikasi, terdapat terget variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.

2. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.

3.

5.Pengklusteran

(27)

14

lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keselurahan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah :

1. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar. 2. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.

6.Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah :

1.Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.

2.Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

2.2.2.4 Cross-Industry Standard Process for Data Mining (CRISP-DM)

Cross-Indutry Standard Prosess for Data Mining (CRISP-DM) yang dikembangkan tahun 1996 oleh analis dari beberapa industri seperti Daimler Chrysler, SPSS dan NCR. CRISP-DM menyediakan standar proses data mining

(28)

15

adaptif. Fase berikutnya dalam urutan bergantung kepada keluaran dari fase sebelumnya. Hubungan antarfase digambarkan dengan panah. Sebagai contoh, jika proses berada pada fase modelling. Berdasar pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation untuk perbaikan lebih lanjut terhadap data atau berpindah maju kepada fase evaluation. Enam fase yang ada dalam metode CRISP-DM tersebut dapat dilihat pada Gambar 2.3 :

Gambar 2. 3 CRISP-DM

Fase-fase dari CRISP-DM [8] : 1. Business understanding

a. Penentuan tujuan objek dan kebutuhan secara detail dalam lingkup bisnis atau unit penelitian secara keseluruhan.

b. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.

2. Data understanding

a. Mengumpulkan data.

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal.

c. Mengevaluasi kualitas data.

(29)

16

3. Data preparation

a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif.

b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.

c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Sipakan data awal sehingga siap untuk perangkat pemodelan. 4. Modelling

a. Pilihan dan aplikasikan teknik pemodelan yang sesuai. b. Kalibrasi aturan model untuk mengoptimalkan hasil.

c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan datamining yang sama.

d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik datamining tertentu.

5. Evaluation

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.

c. Menentukan apakah terdapat permasalahan penting dari bisnis atau penelitian yang tidak tertangani dengan baik.

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6. Deployment

a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.

(30)

17

Contoh kompleks penyebaran : penerapan proses datamining secara paralel pada departemen lain.

2.2.5 Association Rule

Association rule adalah salah satu teknik utama atau prosedur dalam

market basket analysis untuk mencari hugungan antar-item dalam suatu dataset

dan menampilkan bentuk associaiton rule [10]. Association rule (aturan asosiasi) akan menemukan pola tertentu untuk mengasosiasikan data yang satu dengan data yang lain.

Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang ahrus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah semua pola frequent item ditemukan, barulah mencari aturan assosiatif atau aturan keterkaitan yang memenuhi syarat yang telah ditentukan.

Jika diasumsikan bahwa barang yang dijual di swalayan adalah semesta, maka setiap barang akan memiliki boolean variabel yang akan menunjukkan keberadaannya atau tidak barang tersebut dalam suatu transaksi atau satu kerangajng belanja. Pola boolean yang didapat digunakan untuk menganalisa barang yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah

association rule. Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditunjukkan sebagai berikut :

Kopi  susu [support = 2%, confidence = 60%]

Association rule dperlukan suatu variabel ukuran yang ditentukan sendiri oleh user untuk menentukan batasan sejauh mana atau sebanyak apa output yang diinginkan user. Support dan confidence adalah sebuah ukuran kepercayaan dan kegunaan suatu pola yang telah ditemukan, Nilai support 2% menunjukkan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60%, yaitu menunjukkan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.

(31)

18

persentase kombinasi item tersebut dalam database, sedangkan confidencei (nilai kepastian adalah kuatnya hubungan antar –item dalam aturan asosiasi.

Dalam menentukan suatu associaiton rule, terdapat suatu interestingness measure (ukuran kepercayaan) yang didaapt dari hasil pengolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran, yaitu :

1. Support : suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu item/itemset layak untuk dicari confidence-nya (misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukkan bahwa item A dan item B dibeli bersamaan).

2. Confidence : suatu ukuran yang menunjukkan hubungan antara 2 item

secara conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh pelanggan jika pelanggan tersebut membeli sebuah item A).

Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Bila suatu pola memenuhi kedua nilai minimum parameter yang sudah ditentukan sebelumnya, maka pola tersebut dapat disebut sebagai interesting rule atau strong rule. Metodologi dasar analisis asosiasi terbagi menjadi dua tahap [12] :

1. Analisis pola frekuensi tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai

support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut.

� � = � �ℎ � � � yang �ℎ � � � ��� � X 100 % ... Persamaan (2-1) Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut

� � , = � ∩ )…Persamaan (2-2) � � , =

� �ℎ � � � yang �� � �

� �ℎ � � � � x100%.Persamaan(2-2)

(32)

19

Setelah semua pola frekuensi tinggi ditemukan, kemudian mencari aturan asosiasi yang cukup kuat ketergantungan antar item .

Dalam antecedent (pendahulu) dan consequent (pengikut) serta memenuhi syarat

minimum untuk confidence aturan asosiatif AB.

Misalkan D adalah himpunan transaksi, dimana setiap transaksi T dalam D merepresentasikan himpunan item yang berada dalam I. I adalah himpunan item

yang dijual. Misalkan kita memilih himpunan item A dan himpunan item lain B, kemudian aturan asosiasi akan berbentuk :

Jika A, maka B (AB)

Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B dimana aturan :

Jika A, maka B Tidak berarti

Jika B, maka A

Sebuah itemset adalah himpunan item-item yang ada dalam I, dan i itemset. Frekuensi itemset merupakan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan.

Nilai confidence dari aturan A B diperoleh dari rumus berikut.

� = � | =� �ℎ � � � yang �ℎ � � � �� � ���� � � Persamaan (2-3)

2.2.6 Algoritma FP-Growth

(33)

20

descending dari frekuensi yang ada dataset tersebut. Masing-masing item yang tidak mencapai kebutuhan minimum dari threshold tidak dimasukkan kedalam pohon, tapi dikeluarkan secara efektif dari dataset [8].

Tree merupakan struktur penyimpanan data yang dimampatkan. FP-Tree dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-Tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-Tree semakin efektif. Kelebihan dari FP-Tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien.

Adapun FP-Tree adalah sebuah pohon dengan definisi sebagai berikut:

a. FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan berupa pohon yang beranggotakan item-item tertentu, dan sebuah tabel

frequentheader.

b. Setiap simpul dalam FP- Tree mengandung tiga informasi penting, yaitu label item, menginformasikan jenis item yang direpresentasikan simpul tersebut, support count, merepresentasikan jumlah lintasan transaksi yang melalui simpul tesebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antar-lintasan, ditandai dengan garis panah putus-putus.

2.2.4.1Langkah-Langkah Proses Perhitungan Association Rule Dengan

Algoritma FP-Growth

Proses perhitungan association rule terdiri dari beberapa tahap adalah sebagai berikut [9] :

1. Membuat Header Item

Header dalam hal ini selain sebagai header suatu item ke FP-Tree juga sebagai jenis item dasar yang memenuhi minimum support. Setelah mendapatkan item dan nilai support-nya, maka item yang tidak frequent

(34)

21

untuk item, disiapkan pada suatu array tertentu dan ditambahkan ketika membuat FP-Tree.

2. Membuat FP-Tree

FP-Tree dibangun dengan mencari item sesuai urutan pada item yang

frequent. Data transaksi tidak perlu diurutkan, dan untuk tiap item yang ditemukan bisa langsung dimasukkan ke dalam FP-Tree. Sesudah membuat root, tiap item yang ditemukan dimasukkan berdasarkan path

pada FP-Tree. Jika item yang ditemukan sudah ada, maka nilai

supportitem tersebut yang ditambahkan. Namun jika path belum ada, maka dibuat node baru untuk melengkapi path baru pada FP-Tree tersebut. Hal ini dilakukan selama item pada transaksi masih ada yang

qualified, artinya memenuhi nilai minimum support. Jadi, item-item

yang ditemukan dalam transaksi akan berurutan memanjang ke bawah. Dalam struktur FP-Tree, diterapkan alur path dari child hingga ke root. Jadi, suatu path utuh dalam FP-Tree adalah dari child terbawah hingga ke root. Tiap node pada FP-Tree memiliki pointer ke parent, sehingga pencarian harus dimulai dari bawah.

3. Pattern Extraction

Pattern extraction dilakukan berdasarkan keterlibatan item pada suatu path. Di setiap path, diperiksa semua kombinasi yang mungkin dimana item tersebut terlibat. Di iterasi berikutnya dilakukan dengan melibatkan item berikutnya, tanpa melibatkan item sebelumnya, sehingga pattern yang sama tidak akan ditemukan dua kali pada path

yang sama. Bila item pertama suatu hasil kombinasi bukan item terakhir (sebelum root), maka kombinasi itemset tersebut masih bisa dikembangkan lagi.

4. Memasukkan setiap pattern yang ditemukan ke dalam PatternTree

(35)

22

di Pattern Tree merepresentasikan dan menyimpan frekuensi suatu

pattern. Pattern Tree terdiri atas Pattern TreeNode yang menyimpan nilai item, nilai support dan dilengkapi dengan dua pointer yaitu untuk horisontal dan vertikal.

Misalnya pada node d:1 di atas, berarti terdapat pattern a-c-d bernilai

support 1. Kemudian bila ada pattern a-c-d lagi bernilai support n yang ditemukan dari FP-Tree maka nilai support 1 tersebut menjadi n+1. Contoh hasil lengkap dari PatternTree tersebut:

1. a:5 menggambarkan bahwa ada pattern a sebanyak 5 2. b:4 menggambarkan bahwa ada pattern a-b sebanyak 4 3. c:4 menggambarkan bahwa ada pattern a-b-c sebanyak 4 4. d:3 menggambarkan bahwa ada pattern a-b-c-d sebanyak 3 5. c:2 menggambarkan bahwa ada pattern a-c sebanyak 2 6. d:1 menggambarkan bahwa ada pattern a-c-d sebanyak 1 7. d:3 menggambarkan bahwa ada pattern a-d sebanyak 3 5. Mengurutkan dan Menyeleksi Pattern

Pattern yang tidak memenuhi minimum support, dihapus dari daftar

pattern. Pattern-pattern yang tersisa kemudian diurutkan untuk memudahkan pembuatan rules.

2.2.7 Unified Modelling Language (UML)

Unified Modeling Language (UML) adalah himpunan struktur dan teknik untuk pemodelan desain program berorientasi objek serta aplikasinya. Berikut adalah beberapa model yang digunakan dalam

(36)

23

perancangan Data Mining Pemaketan Produk di Minimarket Warga Tunggal untuk menggambarkan sistem dalam UML:

1. Diagram Use Case fungsi–fungsi yang disediakan oleh sistem untuk penggunanya.

Deskripsi Diagram Use Case:

1. Sebuah use case adalah dimana sistem digunakan untuk memenuhi satu atau lebih kebutuhan pemakai.

2. Use case merupakan awal yang sangat baik untuk setiap fase pengembangan berbasis objek, design testing, dan dokumentasi. 3. Use case menggambarkan kebutuhan sistem dari sudut pandang di

luar sistem.

4. Use case menentukan nilai yang diberikan sistem kepada pemakainya.

5. Use case hanya menetapkan apa yang seharusnya dikerjakan oleh sistem, yaitu kebutuhan fungsional sistem.

6. Use case tidak untuk menentukan kebutuhan nonfungsional, misal: sasaran kerja, bahasa pemrograman.

2.2.7.2 Diagram Kelas

Diagram kelas adalah diagram UML yang menggambarkan kelas-kelas dalam sebuah sistem dan hubungannya antara satu dengan yang lain, serta dimasukkan pula atribut dan operasi.Tahapan dari diagram kelas adalah sebagai berikut:

(37)

24

3. Mulai mengkonstruksikan kamus data. 4. Mengidentifikasi operasi pada kelas-kelas.

5. Mengidentifikasikan hubungan antar kelas dengan menggunakan asosiasi,

agregasi, dan inheritance (pewarisan). 2.2.7.3 Diagram Aktifitas

Diagram aktivitas adalah representasi grafis dari seluruh tahapan alur kerja. Diagram ini mengandung aktivitas, pilihan tindakan, perulangan dan hasil dari aktivitas tersebut. Diagram ini dapat digunakan untuk menjelaskan proses bisnis dan alur kerja operasional secara langkah demi langkah dari komponen suatu sistem.

2.2.7.4 Diagram Sequence

Sequence diagram menggambarkan kelakuan objek pada use case

dengan mendeskripsikan waktu hidup objek dan message yang dikirimkan dan diterima antar objek. Oleh karena itu untuk menggambarkan sequence diagram

maka harus diketahui objek-objek yang terlibat dalam sebuah use case beserta metode-metode yang dimiliki kelas yang diinstansiasi menjadi objek itu.

Banyaknya sequence diagram yang harus digambar adalah sebanyak pendefinisian use case yang memiliki proses sendiri atau yang penting semua use case yang telah didefinisikan interaksi jalannya pesan sudah dicakup pada

sequence diagram sehingga semakin banyak use case yang didefinisikan maka

(38)

92

BAB 5

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil implementasi dan pengujian yang telah dilakukan pada sistem penerapan data mining dengan menggunakan metode association rule dan

algoritma FP-Growth maka dapat diambil kesimpulan sebagai berikut :

1. Aplikasi yang dibangun dapat membantu pihak perusahaan untuk memanfaatkan atau mengelola data penjualan yang ada menjadi sebuah informasi.

2. Aplikasi yang dibangun dapat membantu pihak perusahaan mengetahui kombinasi barang apa saja yang bisa dijadikan opsional dalam memproduksi produk Casting dibulan berikutnya .

5.2 Saran

Saran untuk pengembangan lebih lanjut, yaitu sebagai berikut :

1. Penambahan fitur untuk penyaringan data transaksi penjualan yang akan dianalisis berdasarkan warna serta ukuran yang dibeli.

Gambar

Gambar 1.1 Model Waterfall
Gambar 2 1 Logo Perusahaan
Gambar 2. 2 Konsep Data Mining

Referensi

Dokumen terkait

Dengan potensi-potensi sektor pariwisata Kabupaten Bandung Barat tentu saja dapat menjadi peluang sebagaimana penggunaan smartphone diharapkan dapat menjadi salah satu media

Outputnya sendiri akan digunakan dalam tahapan evaluasi risiko, output yang akan diperoleh pada tahapan analisis risiko sendiri berisikan kemungkinan dari risk

Berdasarkan hasil penelitian diperoleh simpulan bahwa model pembelajaran Numbered Heads Together (NHT) lebih efektif untuk meningkatkan kemampuan pemahaman

Intervensi yang dilakukan penulis pada An.Z yaitu: 1) Observasi keadaan umum dan vital sign pasien bertujuan untuk mengetahui keadaan umum pasien, tanda-tanda vital

Tujuan penelitian ini adalah untuk: 1 Menghasilkan produk berupa media pembelajaran IPS berbasi multimedia interaktif pada materi kedudukan dan peran keluarga pada siswa kelas

Dengan menggunakan data time series periode 2000-2014 dan metode Ordinary Least Square untuk mengestimasi fungsi permintaan maka diperoleh hasil analisis yang

Atas dasar diatas, dalam hal ini, sebagai salah satu upaya yang dilakukan oleh Pemerintah Pusat ialah dengan adanya bentuk pelayanan sosial bagi para generasi

beberapa manfaat dari tujuan pembelajaran mata pelajaran yaitu: a) Menentukan tujuan proses belajar mengajar. b) Menentukan persyaratan awal pembelajaran. e) Menyusun