Pembangunan Aplikasi Data Mining Untuk Menentukan Penempatan Produk Menggunakan Metode Association Rule di Iteung Pusat Oleh Oleh Bandung

(1)

(2)

(3)

(4)

BIODATA

Data Pribadi

Nama : Mukti Alamsyah

Tempat/Tanggal Lahir : Bandung, 20 Maret 1992 Jenis Kelamin : Laki-laki

Alamat : Jl. Tangkuban Parahu 51 RT 04 RW 19 Jayagiri Lembang

No. Telp : 085794891892

Email : [email protected]

Riwayat Pendidikan

1998 – 2004 Lulus SDN 1 Lembang 2004 – 2007 Lulus SMPN 1 Lembang 2007 – 2010 Lulus SMAN 1 Lembang

2010 – 2016 Universitas Komputer Indonesia

(5)

PEMBANGUNAN APLIKASI

DATA MINING

UNTUK MENENTUKAN PENEMPATAN PRODUK

MENGGUNAKAN METODE

ASSOCIATION RULE

DI ITEUNG PUSAT OLEH-OLEH BANDUNG

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

MUKTI ALAMSYAH

10110405

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

(6)

iii

KATA PENGANTAR

Puji dan syukur ke hadirat Allah SWT, atas berkat rahmat dan hidayah-Nya sehingga penulis dapat menuangkan ide dan gagasan dalam karya ilmiah Tugas Akhir ini. Penulis mengangkat judul: “PEMBANGUNAN APLIKASI DATA MINING UNTUK MENENTUKAN PENEMPATAN PRODUK MENGGUNAKAN METODE ASSOCIATION RULE DI ITEUNG PUSAT OLEH-OLEH BANDUNG”.

Tugas Akhir ini diajukan untuk memenuhi syarat mata kuliah Tugas Akhir program STRATA 1 Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia (UNIKOM), Bandung. Dengan selesainya Tugas Akhir ini, Penulis ungkapkan rasa syukur yang tiada terhingga kepada Allah SWT. Dan Penulis mengucapkan terima kasih kepada :

1. Kedua Orang Tua yang saya hormati dan saya cintai yang telah memberikan doa, dukungan dan motivasi bagi Penulis untuk menyelesaikan laporan Tugas Akhir ini.

2. Bapak Alif Finandhita, S.Kom., M.T. selaku dosen pembimbing yang telah menyediakan waktunya dan memberikan banyak masukan kepada Penulis. 3. Ibu Dian Dharmayanti, S.T., M.Kom. selaku reviewer dan penguji 1 yang

telah memberikan masukan kepada penulis.

4. Ibu Nelly Indriani, S.Si., M.T. selaku penguji 3 yang telah memberikan masukan kepada penulis.

5. Saudara dan keluarga yang telah memberikan motivasi untuk menyelesaikan tugas akhir ini.

6. Rekan-rekan seperjuangan IF-9 angkatan 2010 yang selalu memberikan semangat dan motivasi kepada penulis.

7. Rekan-rekan satu bimbingan Bapak Alif; Lizuardi, Kiki, Maulana, yang telah memberikan masukan dan saran dalam penulisan laporan ini.

8. Rekan-rekan reviewer Ibu Dian.

(7)

iv

10.Sahabatku Dwikeu Novi Asrika yang telah memberikan bantuan dalam penulisan laporan dan semangat saat Penulis membutuh motivasi.

11.Saudara Chandra Setiawan selaku pengelola Iteung Pusat Oleh-oleh Bandung yang telah memberikan kesempatan untuk melakukan penelitian dalam tugas akhir ini.

12.Pihak – pihak yang telah membantu yang tidak dapat disebutkan satu persatu. Akhir kata, Penulis berharap semoga laporan ini dapat bermanfaat bagi para pembaca.

Bandung, 1 Agustus 2016

(8)

v

1.3 Maksud dan Tujuan ... 3

1.4 Batasan Masalah... 3

1.5 Metodologi Penelitian ... 3

1.5.1 Metode Penelitian Data Mining ... 3

1.5.2 Metode Pengumpulan Data ... 5

1.5.3 Metode Pembangunan Perangkat Lunak ... 6

1.6 Sistematika Penulisan ... 7

BAB 2 TINJAUAN PUSTAKA ... 9

2.1 Profil Institusi ... 9

2.2.2.1 Data Pada Database dan Hubungannya... 11

2.2.2.2 Keuntungan dan kerugian Pemakai Sistem Database ... 12

(9)

vi

2.2.3.1 Konsep Data Mining ... 13

2.2.3.2 Metode Data Mining ... 13

2.2.3.3 Association Rule ... 18

2.2.3.3.1 Metodologi Dasar Analisis Asosiasi ... 19

2.2.3.3.2 Algoritma CT-PRO ... 21

2.2.4 Alat-Alat Pemodelan Sistem ... 23

2.2.4.1 Entity Relationship Diagram (ERD)... 23

2.2.4.2 Diagram Konteks ... 23

2.2.4.3 Data Flow Diagram (DFD) ... 23

2.2.4.4 Kamus Data... 25

2.2.4.5 Spesifikasi Proses (Process Specification) ... 25

2.2.5 MySQL ... 26

2.2.6 PHP ... 26

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 29

3.1 Analisis Sistem ... 29

3.1.1 Analisis Masalah ... 29

3.1.2 Analisis Penerapan Metode CRISP-DM ... 30

3.1.2.1 Pemahaman Bisnis ... 30

3.1.2.2 Pemahaman Data (Data Understanding) ... 32

3.1.2.3 Persiapan Data ... 33

3.1.2.4 Pemodelan (Modelling)... 41

3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 98

3.1.3.1 Analisis Kebutuhan Non-Fungsional ... 98

3.1.3.2 Analisis Kebutuhan Fungsional ... 100

3.1.3.2.1 Entity Relationship Diagram (ERD) ... 100

3.1.3.2.2 Skema Relasi ... 101

3.1.3.2.3 Diagram Konteks ... 101

3.1.3.2.4 Data Flow Diagram ... 102

3.1.3.2.5 Spesifikasi Proses ... 105

3.1.3.2.6 Kamus Data ... 109

(10)

vii

3.1.4.1 Perancangan Data ... 112

3.1.4.1.1 Perancangan Basis Data ... 112

3.1.4.1.2 Struktur Tabel ... 112

3.1.4.2 Perancangan Struktur Menu... 115

3.1.4.3 Perancangan Antar Muka... 115

3.1.4.4 Perancangan Antar Muka... 119

3.1.4.5 Perancangan Antar Semantik ... 120

BAB 4 IMPLEMENTASI DAN PENGUJIAN ... 121

4.1 Implementasi Sistem ... 121

4.1.1 Implementasi Perangkat Keras ... 121

4.1.2 Implementasi Perangkat Lunak ... 121

4.1.3 Implementasi Basis Data ... 121

4.1.4 Implementasi Antarmuka ... 123

4.2 Pengujian Perangkat Lunak... 124

4.2.1 Rencana Pengujian ... 124

4.2.1.1 Pengujian Black Box ... 125

4.2.1.2 Pengujian Beta (Hasil Wawancara Pengguna) ... 127

4.2.1.3 Pengujian Hasil ... 128

BAB 5 KESIMPULAN DAN SARAN ... 135

5.1 Kesimpulan ... 135

5.2 Saran ... 135

(11)

136

DAFTAR PUSTAKA

[1] P. Duncan dan Hollander, Manajemen Toko Eceran, Jakarta: Balai Aksara, 1981.

[2] I. Pramudiono, Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data, 2007.

[3] S. B, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Yogyakarta: Graha Ilmu, 2007.

[4] Y. Sucahyo dan R. Gopalan, “CT-PRO: A Bottom-Up Non Recursive Frequent Itemset Mining Algorithm Using Compressed FP-Tree Data Structure,” 2004.

[5] D. Aditya, Penelitian Deskriptif, 2009. [6] P. Chapman, Crisp-DM 1.0, 2000.

[7] I. Sommerville, Software Engineering, 2007. [8] F. H.A., Data Mining, Andi, 2013.

[9] Ramon A. Mata Toledeo, Pailine K. Cushman, Dasar-dasar Database Relasional, Jakarta: Airlangga, 2007.

[10] D. T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to DATA MINING, Hoboken, New Jersey: Wiley Interscience, 2005. [11] S. J., Implementasi Data Mining Dengan Metode Market Basket Analysis,

Teknologi Informasi dan Pendidikan,, 2012.

[12] Kusrini dan E. T. Luthfi, dalam Algoritma Data Mining, Yogyakarta, Andi, 2009.

[13] P. Adhitya, “Penerapan Metode Association Rule untuk Pembentukan Paket Penjualan Barang di PT. Celebes,” 2013.

(12)

137

[15] E. N. R. Hendra Kurniawan, Aplikasi Inventory Menggunakan Java NetBeans, Xampp,dan iReport, Elex MediaKomputindo, 2009-2013.

[16] D. T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to DATA MINING, Hoboken, New Jersey: Wiley Interscience, 2005. [17] C. Berrard, “Issues in the Testing of Object-Oriented Software,” 1994. [18] C. Fournier, “Essential Software Testing A Use-case Approach,” 2009. [19] G. J. Myers, The Art of Software Testing, New York, 1979.

[20] R. M, “Management of Integrated Training Systems,” Proceedings of IEEE 1990 National, vol. 2, pp. 924-928, 1990.

(13)

1 BAB 1

PENDAHULUAN

1.1 Latar Belakang

Iteung Pusat Oleh-oleh Bandung, merupakan tempat penjualan cinderamata dan oleh-oleh khas Bandung yang telah ada sejak tahun 2013. Toko ini berada di Jalan Anggrek No. 55 Bandung dan telah memiliki beberapa cabang di antaranya di Carrefour-Transmart, Yogya Kepatihan, Cihampelas Batara Hotel, dan Natural Lembang. Iteung Pusat Oleh-oleh Bandung merupakan toko oleh-oleh dengan format swalayan sehingga konsumen dapat memilih dan mengambil sendiri produk yang diinginkan. Produk yang ditawarkan oleh toko Iteung yaitu berupa makanan atau camilan khas Bandung, pakaian, tas, hiasan atau pajangan, dan beragam kerajinan tangan yang hampir semuanya berasal dari daerah Bandung.

Dalam menjalankan bisnisnya, toko Iteung selalu berusaha untuk memberikan kepuasan dan kenyamanan bagi konsumen dengan menawarkan produk-produk yang berkualitas serta membuat suasana belanja yang menyenangkan dengan menyajikan tema yang unik di setiap cabangnya. Namun terdapat beberapa kendala yang dimiliki oleh toko tersebut, di antaranya dalam menentukan penempatan produk untuk setiap cabangnya. Berdasarkan wawancara yang telah dilakukan dengan pihak manajemen toko Iteung, banyaknya jenis produk yang disediakan di toko tersebut membuatnya merasa kesulitan dalam mengatur tata letak produk yang sesuai dengan persepsi konsumen.

(14)

2

keinginan konsumen pun dapat menjadi nilai tambah bagi perusahaan untuk menarik minat belanja konsumen [1].

Seiring berjalannya waktu, aktivitas penjualan serta transaksi yang terjadi menghasilkan data yang banyak dan akan terus bertambah. Akan tetapi data tersebut tidak dimanfaatkan oleh pihak toko secara maksimal, hanya sebatas laporan dan kemudian disimpan sebagai arsip. Dengan menggunakan data mining, data tersebut dapat digali hingga didapatkan nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual [2].

Dalam bidang keilmuan data mining, terdapat suatu metode yang dinamakan association rule. Metode ini sering juga dinamakan dengan market basket analysis

karena awal mulanya yang berasal dari studi tentang database transaksi penjualan [3]. Association rule bertujuan untuk menunjukkan nilai asosiatif antara jenis-jenis produk yang dibeli oleh konsumen sehingga dapat di lihat sebuah pola berupa produk-produk apa saja yang sering dibeli secara bersamaan dalam sebuah transaksi penjualan, sehingga dapat dijadikan acuan untuk pengambilan keputusan dalam penempatan produk.

Sebagai solusi untuk pemecahan masalah di Iteung Pusat Oleh-oleh Bandung, maka diperlukan “Pembangunan Aplikasi Data Mining Untuk Menentukan Penempatan Produk Menggunakan Metode Association Rule“ untuk mengatasi permasalahan yang dihadapi oleh Iteung Pusat Oleh-oleh Bandung. Diharapkan dengan adanya perangkat lunak ini dapat membantu pihak perusahaan untuk dimanfaatkan oleh pihak perusahaan sebagai dasar pertimbangan dalam penempatan produk.

1.2 Rumusan Masalah

(15)

3

1.3 Maksud dan Tujuan

Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membangun Aplikasi Data Mining Menggunakan Metode Association Rule Untuk Penempatan Produk di Iteung Pusat Oleh-oleh Bandung.

Sedangkan tujuan yang ingin dicapai dalam penelitian ini antara lain:

1. Membantu pihak manajemen Toko Oleh-oleh Iteung dalam mengetahui jenis produk apa saja yang dapat ditempatkan secara berdekatan demi kenyamanan konsumen dalam mencari atau memilih produk yang diinginkan.

2. Membantu pihak manajemen Toko Oleh-oleh Iteung untuk mendapatkan gambaran penempatan produk yang akan diterapkan di setiap cabangnya.

1.4 Batasan Masalah

Batasan yang diterapkan dalam penelitian ini adalah sebagai berikut:

1. Data yang akan di analisa adalah data penjualan produk Iteung Pusat Oleh-oleh Bandung dari tanggal 1 sampai 5 Januari 2016.

2. Algoritma yang akan digunakan adalah algoritma CT-PRO [4]. 3. Aplikasi yang dibangun berbasis web.

4. Informasi yang dihasilkan berupa rekomendasi jenis produk apa saja yang dapat ditempatkan secara berdekatan.

5. Metode analisis dan perancangan yang digunakan adalah dengan menggunakan pendekatan analisis terstruktur.

1.5 Metodologi Penelitian

Adapun metode penelitian data mining, pengumpulan data, dan pembangunan perangkat lunak yang digunakan adalah sebagai berikut:

1.5.1 Metode Penelitian Data Mining

(16)

4

diaplikasikan di berbagai sektor industri. Gambar berikut menjelaskan tentang siklus hidup pengembangan data mining yang telah ditetapkan dalam CRISP-DM [5].

Gambar 1.1 Metode CRIPS-DM

Berikut ini adalah penjelasan mengenai enam tahap siklus hidup pengembangan data mining berdasarkan gambar di atas:

1. Business Understanding

Tujuan bisnis Iteung Pusat Oleh-oleh Bandung memasarkan produk secara langsung untuk memenuhi permintaan konsumen. Sedangkan tujuan dari proses mining-nya adalah mengetahui pola penjualan produk yang sering terjual bersama untuk dijadikan dasar dalam penentuan penempatan produk.

2. Data Understanding

Tahap ini dimulai dengan pengumpulan data, sumber data yang didapat dalam penelitian ini merupakan data transaksi penjualan yang terjadi di Iteung Pusat Oleh-oleh Bandung pada bulan Januari tahun 2016. Data yang digunakan dalam proses analisa berupa file excel dengan format .xlsx.

3. Data Preparation

(17)

5

4. Modeling

Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan nilai yang optimal. Pemodelan dilakukan menggunakan metode Association Rule dengan menggunakan algoritma CT-PRO.

5. Evaluation

Pada tahap ini, dilakukan evaluasi terhadap model yang digunakan, apakah dengan Association Rule dengan algoritma CT-PRO cukup efektif dalam mencapai tujuan yang ditetapkan pada tahap business understanding.

6. Deployment

Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk tabel yang menunjukkan hasil analisa pada data transaksi penjualan.

1.5.2 Metode Pengumpulan Data

Pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Studi Literatur

Tahap ini adalah melakukan studi pustaka dengan buku, paper, jurnal dan website sebagai media referensi penyusunan, penulisan dan penelitian.

2. Observasi

Tahap pengumpulan informasi dengan cara melakukan observasi di Toko Oleh-oleh Iteung.

3. Interview

(18)

6

1.5.3 Metode Pembangunan Perangkat Lunak

Teknik dalam pembuatan perangkat lunak menggunakan paradigma perangkat lunak secara Waterfall. Metode Waterfall menurut Ian Sommerville [6] meliputi beberapa proses diantaranya:

1. Analysist

Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan proyek pembuatan perangkat lunak.

2. Design

Tahap penerjemahan dari data yang dianalisis ke dalam bentuk yang mudah dimengerti oleh user.

3. Coding

Tahap penerjemahan data atau pemecahan masalah yang telah dirancang ke dalam bahasa pemrograman tertentu.

4. Testing

Merupakan tahap pengujian terhadap perangkat lunak yang dibangun.

5. Maintenance

Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat mengalami perubahan atau penambahan sesuai dengan permintaan user.

(19)

7

1.6 Sistematika Penulisan BAB 1 PENDAHULUAN

Bab ini membahas mengenai latar belakang permasalahan, mengidentifikasi masalah yang dihadapi, menentukan maksud dan tujuan penelitian, dengan diikuti batasan masalah agar penelitian lebih terfokus, menentukan metodologi penelitian yang digunakan, serta sistematika penulisan.

BAB 2 LANDASAN TEORI

Bab ini membahas mengenai konsep dasar serta teori-teori yang berkaitan dengan topik penelitian dan hal-hal yang berguna dalam proses analisis permasalahan.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Bab ini menganalisis masalah dari data penjualan hasil penelitian di Iteung Pusat Oleh-oleh Bandung untuk kemudian dilakukan proses perancangan sistem yang akan dibangun sesuai dengan analisa yang telah dilakukan.

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini membahas tentang implementasi dari tahapan-tahapan penting yang telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap kesesuaian sistem dengan tahapan yang telah ditentukan untuk memperlihatkan sejauh mana sistem layak digunakan.

BAB 5 KESIMPULAN DAN SARAN

(20)

(21)

9 BAB 2

TINJAUAN PUSTAKA

2.1 Profil Institusi

Iteung Pusat Oleh-oleh Bandung, merupakan tempat penjualan cinderamata dan oleh-oleh khas Bandung yang telah ada sejak tahun 2013. Toko ini berada di Jalan Anggrek No. 55 Bandung dan telah memiliki beberapa cabang di antaranya di Carrefour-Transmart, Yogya Kepatihan, Cihampelas Batara Hotel, dan Natural Lembang. Iteung Pusat Oleh-oleh Bandung merupakan toko oleh-oleh dengan format swalayan sehingga konsumen dapat memilih dan mengambil sendiri produk yang diinginkan. Produk yang ditawarkan oleh toko Iteung yaitu berupa makanan atau camilan khas Bandung, pakaian, tas, hiasan atau pajangan, dan beragam kerajinan tangan yang hampir semuanya berasal dari daerah Bandung.

2.1.1 Logo

Berikut ini adalah logo Iteung Pusat Oleh-oleh Bandung

Gambar 2.1 Logo Iteung Pusat Oleh-oleh Bandung

2.1.2 Struktur Organisasi

(22)

10

Owner

Keuangan

Admin IT Supervisor

Pramuniaga Kasir

Gambar 2.2 Struktur Organisasi di Iteung Pusat Oleh-oleh Bandung

2.1.3 Deskripsi Kerja

1. Owner

Selain menjadi pemilik perusahaan, owner bertugas untuk mengawasi kerja para karyawan, pengambil keputusan dan penanggung jawab semua aktivitas yang berada di Iteung Pusat Oleh-oleh Bandung.

2. Keuangan

Bagian keuangan bertugas merencanakan, menganggarkan, memeriksa, mengelola, dan menyimpan dana yang dimiliki oleh perusahaan.

3. Admin IT

Admin IT bertugas mengelola semua data yang ada di Iteung Pusat Oleh-oleh Bandung seperti data penjualan, data gudang, data produk dan lain – lain. 4. Supervisor

Supervisor bertugas untuk Mengawasi semua aktivitas karyawan dan

membatu aktivitas di Iteung Pusat Oleh-oleh Bandung. 5. Pramuniaga

Bertugas untuk melayani customer yang akan membeli produk di Toko, merapikan produk, juga menyimpan letak produk untuk dipajang.

6. Kasir

(23)

11

2.2 Landasan Teori

Landasan teori membahas tentang materi atau teori apa saja yang digunakan sebagai bahan acuan dalam pembuatan tugas akhir ini. Landasan teori yang diuraikan merupakan hasil studi literatur baik dari buku atau situs internet.

2.2.1 Data

Data adalah segala fakta, angka atau teks yang dapat diproses oleh komputer. Data dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data adalah sesuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data terdapat himpunan data (data-set) yang merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek yang biasanya dikenal sebagai variabel, field, karakteristik atau fitur.

Salah satu himpunan data (data-set) adalah record data, yaitu data yang terdiri dari sekumpulan record, yang masing-masing terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe data record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari record data, di mana tiap record (transaksi) meliputi satu set item [7].

2.2.2 Database

Database adalah susunan record data operasional lengkap dari suatu

organisasi atau perusahaan yang diorganisir dan disimpan secara terintegrasi dengan menggunakan metode tertentu dalam komputer sehingga mampu memenuhi informasi yang optimal yang dibutuhkan oleh para pengguna [8].

2.2.2.1 Data Pada Database dan Hubungannya Ada 3 jenis data pada sistem database, yaitu [8]:

1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data.

(24)

12

3. Data keluaran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional.

2.2.2.2 Keuntungan dan kerugian Pemakai Sistem Database Berikut adalah keuntungan pemakai sistem database [8]: 1. Terkontrolnya kerangkapan data dan inkonsistensi. 2. Terpeliharanya keselarasan data.

3. Data dapat dipakai secara bersama-sama.

4. Memudahkan penerapan standarisasi dan batas-batas pengamanan. 5. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari setiap

aplikasi.

6. Program/data independent.

Di samping keuntungan, terdapat kerugian pemakai sistem database, yaitu:

1. Mahal dalam implementasinya. 2. Rumit/kompleks.

3. Penanganan proses recovery backup sulit.

4. Kerusakan pada sistem basis data dapat mempengaruhi.

2.2.3 Pengertian Data Mining

Data mining adalah suatu istilah yang digunakan untuk menguraikan

penemuan pengetahuan dalam database. Data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan

pengetahuan yang terkait dari berbagai database besar [9].

Menurut Pramudiono [2], “Data mining adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.”

(25)

13

1. Pertumbuhan yang cepat dalam kumpulan data.

2. Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan memiliki akses ke dalam database yang handal.

3. Adanya peningkatan akses data melalui navigasi web dan intranet.

4. Tekanan kompetensi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi.

5. Perkembangan teknologi perangkat lunak untuk data mining (ketersediaan teknologi).

6. Perkembangan yang hebat dalam kemampuan komputasi dan pengembangan kapasitas media penyimpanan.

2.2.3.1 Konsep Data Mining

Data mining sangat diperlukan terutama dalam mengelola data yang sangat

besar untuk memudahkan aktivitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi pengguna data

mining. Alasan utama data mining sangat dibutuhkan dalam industri informasi

karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran atau berjumlah besar. Informasi inilah yang nantinya sangat berguna untuk pengembangan.

2.2.3.2 Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang

dapat dilakukan, yaitu [9]: 1. Deskripsi

(26)

14

pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai

prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah:

a. Prediksi harga beras dalam tiga bulan yang akan datang.

b. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikkan.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah:

a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.

b. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.

5. Pengklusteran

(27)

15

Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah:

a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar.

b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah:

a. Meneliti jumlah konsumen dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.

b. Menemukan produk dalam supermarket yang dibeli secara bersamaan dan produk yang tidak pernah dibeli secara bersamaan.

2.2.3.2.1 Cross-Industry Standard Process for Data Mining (CRISP-DM) Cross-Indutry Standard Prosess for Data Mining (CRISP-DM) yang

(28)

16

Dalam CRISP-DM, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase. Keseluruhan fase berurutan yang ada tersebut bersifat adaptif. Fase berikutnya dalam urutan bergantung kepada keluaran dari fase sebelumnya. Hubungan antar fase digambarkan dengan panah. Sebagai contoh, jika proses berada pada fase modelling. Berdasar pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation untuk perbaikan lebih lanjut terhadap data atau berpindah maju kepada fase evaluation.

Enam fase yang ada dalam metode CRISP-DM tersebut dapat dilihat pada Gambar berikut ini:

Gambar 2.3 Fase metode CRISP-DM

Fase-fase dari CRISP-DM [9]:

1. Business Understanding

a. Penentuan tujuan bisnis yang dilakukan oleh perusahaan dan kriteria sukses bisnis yang menjadi acuan berhasilnya perusahaan dalam menjalankan bisnis.

b. Menjelaskan tujuan digunakannya metode data mining dalam bsnis yang dijalankan dan kriteria suksesnya metode data mining.

(29)

17

2. Data Understanding

a. Mengumpulkan data.

b. Mendeskripsikan data yang telah diperoleh. c. Mengevaluasi kualitas data.

d. Jika diinginkan, pilih sebagian kecil grup data yang mungkin mengandung pola dari permasalahan.

3. Data Preparation

a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif.

b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.

c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Siapkan data awal sehingga siap untuk perangkat pemodelan.

4. Modeling

a. Pilihan dan aplikasikan teknik pemodelan yang sesuai. b. Kalibrasi aturan model untuk mengoptimalkan hasil.

c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama.

d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.

5. Evaluation

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.

(30)

18

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6. Deployment

a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.

b. Contoh sederhana penyebaran: pembuatan laporan.

c. Contoh kompleks penyebaran: penerapan proses data mining secara paralel pada departemen lain.

2.2.3.3 Association Rule

Association rule adalah salah satu teknik utama atau prosedur dalam

market basket analysis untuk mencari hubungan antar-item dalam suatu data set

dan menampilkan bentuk associaiton rule [10]. Association rule (aturan asosiasi) akan menemukan pola tertentu untuk mengasosiasikan data yang satu dengan data yang lain.

Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah

semua pola frequent item ditemukan, barulah mencari aturan assosiatif atau aturan keterkaitan yang memenuhi syarat yang telah ditentukan.

Jika diasumsikan bahwa produk yang dijual di swalayan adalah semesta, maka setiap produk akan memiliki boolean variabel yang akan menunjukkan keberadaannya atau tidak produk tersebut dalam suatu transaksi atau satu keranjang belanja. Pola boolean yang didapat digunakan untuk menganalisa produk yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule. Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditunjukkan sebagai berikut:

Kopi → susu [support = 2%, confidence = 60%]

Association rule diperlukan suatu variabel ukuran yang ditentukan sendiri

(31)

19

kegunaan suatu pola yang telah ditemukan, Nilai support 2% menunjukkan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60%, yaitu menunjukkan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.

Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter yaitu support dan confidence. Support (nilai penunjang) adalah persentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian adalah kuatnya hubungan antar–item dalam aturan asosiasi.

Dalam menentukan suatu association rule, terdapat suatu interestingness measure (ukuran kepercayaan) yang didapat dari hasil pengolahan data dengan

perhitungan tertentu. Umumnya ada dua ukuran, yaitu:

1. Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu item/itemset layak untuk dicari confidence-nya (misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukkan bahwa item A dan item B dibeli bersamaan). 2. Confidence, suatu ukuran yang menunjukkan hubungan antara 2 item

secara conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh konsumen jika konsumen tersebut membeli sebuah item A). Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Bila suatu pola memenuhi kedua nilai minimum parameter yang sudah ditentukan sebelumnya, maka pola tersebut dapat

disebut sebagai interesting rule atau strong rule.

2.2.3.3.1 Metodologi Dasar Analisis Asosiasi

Metodologi dasar Association Rule terbagi menjadi dua tahap, yaitu [11]: 1. Analisis pola frekuensi tinggi

Tahap Tahap ini mencari pola item yang memenuhi syarat minimum dari nilai support dalam database. Menurut Larose, kita bebas menentukan nilai

(32)

20

kebutuhan [9]. Sebagai contoh, bila ingin menemukan data-data yang memiliki hubungan asosiasi yang kuat, minsup dan mincof-nya bisa diberi nilai yang tinggi. Sebaliknya, bila ingin melihat banyaknya variasi data tanpa terlalu mempedulikan kuat atau tidaknya hubungan asosiasi antara item-nya, nilai minsup dan mincofnya dapat diisi rendah [12]. Nilai support sebuah item diperoleh dengan rumus berikut.

� =� � � �_� _� �� _{� � �} � × % ... Persamaan 2.1

Persamaan 2-1 menjelaskan bahwa nilai support didapat dengan cara membagi jumlah transaksi yang mengandung item A (satu item) dengan jumlah total seluruh transaksi.

Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut � � , = � ⋂

� , =� � � �_� _� �� _{� � �}� � × % ... Persamaan 2.2

Persamaan 2-2 menjelaskan bahwa nilai support item set didapat dengan cara membagi jumlah transaksi yang mengandung item A dan item B (item pertama bersamaan dengan item yang lain) dengan jumlah total seluruh transaksi.

2. Pembentukan aturan asosiasi

Setelah semua pola frekuensi tinggi ditemukan, kemudian mencari aturan asosiasi yang cukup kuat ketergantungan antar item.

Dalam antecedent (pendahulu) dan consequent (pengikut) serta memenuhi syarat minimum untuk confidence aturan asosiatif A→B.

Misalkan D adalah himpunan transaksi, di mana setiap transaksi T dalam D merepresentasikan himpunan item yang berada dalam I. I adalah himpunan item yang dijual. Misalkan kita memilih himpunan item A dan himpunan item lain B, kemudian aturan asosiasi akan berbentuk:

Jika A, maka B (A→B)

Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B di mana aturan:

(33)

21

Jika B, maka A

Sebuah item set adalah himpunan item-item yang ada dalam I, dan i item set. Frekuensi item set merupakan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan.

Nilai confidence dari aturan A→B diperoleh dari rumus berikut.

=� _�� _{� � �} �� _�� _� � ... Persamaan 2.3

2.2.3.3.2 Algoritma CT-PRO

Algoritma ini merupakan salah satu algoritma pengembangan dari FP-Growth. Perbedaannya adalah di mana FP-Growth membuat FP-Tree sedangkan

CT-PRO membuat Compressed FP-Tree (CFP-Tree ) [13]. Pada tahap mining algoritma CT-PRO juga menggunakan pendekatan bottom-up dimana item pada item tabel dan CFP-Tree dilakukan scan dari jumlah terkecil hingga terbesar.

Algoritma CT-PRO memiliki tiga tahap yaitu: 1. Menemukan item-item yang frequent.

2. Membuat struktur data CFP-Tree. 3. Melakukan mining frequent patterns.

Langkah-langkah kerja algoritma CT-PRO [13] [14]:

1. Mencari Frequent Item, pada tahap ini terjadi proses-proses sebagai berikut: a. Dari dataset yang ada, dilakukan seleksi berdasarkan minimum support

yang ditentukan sehingga menghasilkan frequent item.

b. Dari frequent item yang telah terbentuk, dihitung frekuensi kemunculan setiap item sehingga menghasilkan Global Item tabel.

2. Membangun CFP-Tree, pada tahap ini terjadi proses-proses sebagai berikut: a. Frequent item yang telah didapatkan, diurutkan berdasarkan Global item table yang ada secara menurun (diurutkan mulai dari item berfrekuensi

terbesar hingga terkecil).

(34)

22

1) CFP-Tree terdiri dari tree yang memiliki root yang mewakili indeks dari item dengan tingkat kemunculan tertinggi dan kumpulan subtree sebagai anak dari root.

2) Jika I = {i1,i2, …, ik} adalah kumpulan dari frequent item dalam transaksi, item dalam transaksi akan dimasukkan ke dalam CFP-Tree dimulai dari root subtree yang merupakan i1 dalam item tabel.

3) Root dari CFP-Tree merupakan level-0 dari tree.

4) Setiap node dalam CFP-Tree memiliki empat field utama yakni item-id, parent-id, Count yang merupakan jumlah item pada node

tersebut, dan level yang menunjukkan struktur data tree pada node tersebut dimulai dari item yang terdapat pada item tabel dengan level yang terdapat pada CFP-Tree.

3. Mining, pada tahap ini terjadi proses-proses sebagai berikut [13] [14]: a. Pada tahap mining ini, algoritma CT-PRO bekerja dengan melakukan

bottom-up mining sehingga Global item table diurutkan mulai dari item

berfrekuensi terkecil hingga terbesar.

b. Untuk setiap item yang terdaftar pada Global item table yang telah diurutkan, dilakukan pencarian node yang berkaitan dengan item tersebut pada Global CFP-Tree. Dari semua node yang ditemukan untuk setiap item inilah yang disebut dengan Local frequent item dan digunakan untuk

membuat Local item table.

c. Pada pembuatan Local item table ini juga dilakukan berdasarkan jumlah minimum support yang telah ditentukan.

d. Setelah itu, dibuat Local CFP-Tree berdasarkan Local item table yang terbentuk. Aturan pembentukan Local CFP-Tree sama dengan pembentukan Global CFP-Tree, yang membedakan adalah pada Global

CFP-Tree yang digunakan dalam pembentukan tree-nya adalah Global

(35)

23

e. Dari Local CFP-Tree dibentuk frequent pattern sesuai dengan item yang di-mining.

f. Dari frequent pattern dihitung masing-masing item yang memenuhi dihitung confidencenya. Apabila memenuhi minimum confidence maka masing-masing item yang bersangkutan dijadikan sebagai knowledge.

2.2.4 Alat-Alat Pemodelan Sistem

Alat-alat pemodelan sistem adalah alat dan metode yang akan digunakan untuk memodelkan perancangan perangkat lunak dalam skripsi ini.

2.2.4.1 Entity Relationship Diagram (ERD)

ERD Menurut Nugroho (2002) adalah diagram yang memperlihatkan entitas-entitas yang terlibat dalam suatu sistem serta hubungan-hubungan (relasi) antar entitas tersebut.

2.2.4.2 Diagram Konteks

Diagram konteks adalah diagram aliran data pada tingkat paling atas yang merupakan penggambaran yang berfungsi untuk memperlihatkan interaksi atas hubungan langsung antara sistem informasi dengan lingkungannya. Diagram konteks menggambarkan sebuah sistem berupa sebuah proses yang berhubungan dengan satu atau beberapa entitas.

2.2.4.3 Data Flow Diagram (DFD)

Data flow diagram (DFD) adalah suatu alat pemodelan yang digunakan untuk

memodelkan fungsi dari sistem, menggambarkan secara rinci mengenai sistem sebagai jaringan kerja antar fungsi yang berhubungan satu sama lain dengan menunjukkan dari dan kemana data mengalir serta menyimpannya. Pada umumnya DFD dimulai dari 0, 1, 2, dst. Level ke-0 disebut dengan diagram konteks yang menggambarkan sistem secara global.

(36)

24

a. Diagram Konteks, merupakan satu lingkaran besar yang dapat mewakili seluruh proses yang terdapat di dalam suatu sistem.

b. DFD Level 1 merupakan satu lingkaran besar yang mewakili lingkaran-lingkaran kecil yang ada di dalamnya, dan merupakan pemecahan dari diagram konteks.

c. Diagram Rinci, merupakan diagram yang menguraikan proses apa yang ada dalam diagram DFD Level 1.

Contoh kasus dari penerapan Diagram Konteks:

Gambar 2.4 Contoh Kasus Penerapan Diagram Konteks

Contoh DFD dari diagram konteks di atas:

(37)

25

2.2.4.4 Kamus Data

Kamus data adalah suatu penjelasan tertulis mengenai data yang berada dalam database. Kamus data ikut berperan untuk menjelaskan arti aliran data dan

menyimpan dalam menggambarkan data flow diagram, menjelaskan spesifikasi nilai dan satuan yang relevan terhadap data yang mengalir dalam sistem tersebut, mendeskripsikan komposisi paket data yang bergerak melalui aliran.

Fungsi kamus data [9]:

1. Menjelaskan arti aliran data dan penyimpanan data dalam DFD.

2. Mendeskripsikan komposisi paket data (elemen data) yang bergerak melalui aliran data.

3. Mendeskirpsikan komposisi penyimpanan data.

4. Mendeskripsikan nilai dan satuan (struktur data) yang relevan bagi penyimpanan dan aliran.

5. Mendeskripsikan hubungan detail antar penyimpanan. Tabel 2.1 Struktur Kamus Data

Nama Data Keterangan

Deskripsi Memilih file yang akan diproses Bentuk Data Format file

Struktur Data Atribut yang digunakan

2.2.4.5 Spesifikasi Proses (Process Specification)

Digunakan untuk mendeskripsikan proses yang terjadi pada level paling rendah dari DFD. Struktur spesifikasi proses dapat dilihat di tabel lampiran.

Hubungan dengan Prosess Specification [11]:

1. Semua proses dalam DFD yang tidak dapat dipecah lagi dan harus didefinisikan dalam process specification.

2. Aliran data masuk (input) dan keluar (output) dalam DFD dan hubungan ke data store harus sesuai dan relevan dalam process specification.

3. Setiap elemen data dalam process specification harus: a. Nama dari aliran data atau data store.

(38)

26

Tabel 2.2 Struktur Spesifikasi Proses

No. Urut Proses Keterangan No. Proses

SQL (Structured Query Language) adalah sebuah bahasa yang dipergunakan untuk mengakses data dalam basis data relasional. SQL juga dapat diartikan sebagai antar muka standar untuk sistem manajemen basis data relasional, termasuk sistem yang beroperasi pada komputer pribadi. SQL memungkinkan seorang pengguna untuk mengakses informasi tanpa mengetahui di mana lokasinya atau bagaimana informasi tersebut disusun [15].

MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL (bahasa Inggris: database management system) atau DBMS yang multi thread, dan multi-user. MySQL dimiliki dan di sponsori oleh sebuah perusahaan komersial Swedia

MySQL AB, di mana memegang hak cipta hampir atas semua kode sumbernya. Kedua orang Swedia dan satu orang Finlandia yang mendirikan MySQL AB adalah: David Axmark, Allan Larsson, dan Michael "Monty" Widenius.

2.2.6 PHP

PHP adalah bahasa pemrograman script server-side yang didesain untuk pengembangan web. Selain itu, PHP juga bisa digunakan sebagai bahasa pemrograman umum. PHP di kembangkan pada tahun 1995 oleh Rasmus Lerdorf, dan sekarang dikelola oleh The PHP Group.

PHP disebut bahasa pemrograman server side karena PHP diproses pada komputer server. Hal ini berbeda dibandingkan dengan bahasa pemrograman client-side seperti JavaScript yang diproses pada web browser (client).

(39)

27

(40)

(41)

135 BAB 5

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil implementasi dan pengujian yang telah dilakukan pada aplikasi data mining untuk rekomendasi penempatan produk menggunakan metode association rule dan algoritma CT-Pro, maka dapat diambil kesimpulan sebagai

berikut:

1. Aplikasi yang dibangun dapat membantu pihak manajemen Toko Oleh-oleh Iteung dalam mengetahui jenis produk apa saja yang dapat ditempatkan secara berdekatan dalam penempatan produk.

2. Aplikasi yang dibangun dapat membantu pihak manajemen Toko Oleh-oleh Iteung untuk mendapatkan gambaran penempatan produk yang akan diterapkan di setiap cabangnya.

5.2 Saran

Adapun saran untuk pengembangan aplikasi penempatan produk lebih lanjut yaitu:

1. Pembangunan aplikasi data mining dikembangkan dengan menggunakan pemrograman berorientasi objek (Object Oriented Programming) sehingga aplikasi dapat berjalan secara dinamis.

2. Pembangunan aplikasi dikembangkan dengan mengimplementasikan algoritma lain agar dapat melihat perbandingan performansi dari algoritma CT-Pro.