BIODATA
Data Pribadi
Nama : Mukti Alamsyah
Tempat/Tanggal Lahir : Bandung, 20 Maret 1992 Jenis Kelamin : Laki-laki
Alamat : Jl. Tangkuban Parahu 51 RT 04 RW 19 Jayagiri Lembang
No. Telp : 085794891892
Email : m.alamsyah8@gmail.com
Riwayat Pendidikan
1998 – 2004 Lulus SDN 1 Lembang 2004 – 2007 Lulus SMPN 1 Lembang 2007 – 2010 Lulus SMAN 1 Lembang
2010 – 2016 Universitas Komputer Indonesia
PEMBANGUNAN APLIKASI
DATA MINING
UNTUK MENENTUKAN PENEMPATAN PRODUK
MENGGUNAKAN METODE
ASSOCIATION RULE
DI ITEUNG PUSAT OLEH-OLEH BANDUNG
SKRIPSI
Diajukan untuk Menempuh Ujian Akhir Sarjana
MUKTI ALAMSYAH
10110405
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
iii
KATA PENGANTAR
Puji dan syukur ke hadirat Allah SWT, atas berkat rahmat dan hidayah-Nya sehingga penulis dapat menuangkan ide dan gagasan dalam karya ilmiah Tugas Akhir ini. Penulis mengangkat judul: “PEMBANGUNAN APLIKASI DATA MINING UNTUK MENENTUKAN PENEMPATAN PRODUK MENGGUNAKAN METODE ASSOCIATION RULE DI ITEUNG PUSAT OLEH-OLEH BANDUNG”.
Tugas Akhir ini diajukan untuk memenuhi syarat mata kuliah Tugas Akhir program STRATA 1 Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia (UNIKOM), Bandung. Dengan selesainya Tugas Akhir ini, Penulis ungkapkan rasa syukur yang tiada terhingga kepada Allah SWT. Dan Penulis mengucapkan terima kasih kepada :
1. Kedua Orang Tua yang saya hormati dan saya cintai yang telah memberikan doa, dukungan dan motivasi bagi Penulis untuk menyelesaikan laporan Tugas Akhir ini.
2. Bapak Alif Finandhita, S.Kom., M.T. selaku dosen pembimbing yang telah menyediakan waktunya dan memberikan banyak masukan kepada Penulis. 3. Ibu Dian Dharmayanti, S.T., M.Kom. selaku reviewer dan penguji 1 yang
telah memberikan masukan kepada penulis.
4. Ibu Nelly Indriani, S.Si., M.T. selaku penguji 3 yang telah memberikan masukan kepada penulis.
5. Saudara dan keluarga yang telah memberikan motivasi untuk menyelesaikan tugas akhir ini.
6. Rekan-rekan seperjuangan IF-9 angkatan 2010 yang selalu memberikan semangat dan motivasi kepada penulis.
7. Rekan-rekan satu bimbingan Bapak Alif; Lizuardi, Kiki, Maulana, yang telah memberikan masukan dan saran dalam penulisan laporan ini.
8. Rekan-rekan reviewer Ibu Dian.
iv
10.Sahabatku Dwikeu Novi Asrika yang telah memberikan bantuan dalam penulisan laporan dan semangat saat Penulis membutuh motivasi.
11.Saudara Chandra Setiawan selaku pengelola Iteung Pusat Oleh-oleh Bandung yang telah memberikan kesempatan untuk melakukan penelitian dalam tugas akhir ini.
12.Pihak – pihak yang telah membantu yang tidak dapat disebutkan satu persatu. Akhir kata, Penulis berharap semoga laporan ini dapat bermanfaat bagi para pembaca.
Bandung, 1 Agustus 2016
v
1.3 Maksud dan Tujuan ... 3
1.4 Batasan Masalah... 3
1.5 Metodologi Penelitian ... 3
1.5.1 Metode Penelitian Data Mining ... 3
1.5.2 Metode Pengumpulan Data ... 5
1.5.3 Metode Pembangunan Perangkat Lunak ... 6
1.6 Sistematika Penulisan ... 7
BAB 2 TINJAUAN PUSTAKA ... 9
2.1 Profil Institusi ... 9
2.2.2.1 Data Pada Database dan Hubungannya... 11
2.2.2.2 Keuntungan dan kerugian Pemakai Sistem Database ... 12
vi
2.2.3.1 Konsep Data Mining ... 13
2.2.3.2 Metode Data Mining ... 13
2.2.3.3 Association Rule ... 18
2.2.3.3.1 Metodologi Dasar Analisis Asosiasi ... 19
2.2.3.3.2 Algoritma CT-PRO ... 21
2.2.4 Alat-Alat Pemodelan Sistem ... 23
2.2.4.1 Entity Relationship Diagram (ERD)... 23
2.2.4.2 Diagram Konteks ... 23
2.2.4.3 Data Flow Diagram (DFD) ... 23
2.2.4.4 Kamus Data... 25
2.2.4.5 Spesifikasi Proses (Process Specification) ... 25
2.2.5 MySQL ... 26
2.2.6 PHP ... 26
BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 29
3.1 Analisis Sistem ... 29
3.1.1 Analisis Masalah ... 29
3.1.2 Analisis Penerapan Metode CRISP-DM ... 30
3.1.2.1 Pemahaman Bisnis ... 30
3.1.2.2 Pemahaman Data (Data Understanding) ... 32
3.1.2.3 Persiapan Data ... 33
3.1.2.4 Pemodelan (Modelling)... 41
3.1.3 Analisis Spesifikasi Kebutuhan Perangkat Lunak ... 98
3.1.3.1 Analisis Kebutuhan Non-Fungsional ... 98
3.1.3.2 Analisis Kebutuhan Fungsional ... 100
3.1.3.2.1 Entity Relationship Diagram (ERD) ... 100
3.1.3.2.2 Skema Relasi ... 101
3.1.3.2.3 Diagram Konteks ... 101
3.1.3.2.4 Data Flow Diagram ... 102
3.1.3.2.5 Spesifikasi Proses ... 105
3.1.3.2.6 Kamus Data ... 109
vii
3.1.4.1 Perancangan Data ... 112
3.1.4.1.1 Perancangan Basis Data ... 112
3.1.4.1.2 Struktur Tabel ... 112
3.1.4.2 Perancangan Struktur Menu... 115
3.1.4.3 Perancangan Antar Muka... 115
3.1.4.4 Perancangan Antar Muka... 119
3.1.4.5 Perancangan Antar Semantik ... 120
BAB 4 IMPLEMENTASI DAN PENGUJIAN ... 121
4.1 Implementasi Sistem ... 121
4.1.1 Implementasi Perangkat Keras ... 121
4.1.2 Implementasi Perangkat Lunak ... 121
4.1.3 Implementasi Basis Data ... 121
4.1.4 Implementasi Antarmuka ... 123
4.2 Pengujian Perangkat Lunak... 124
4.2.1 Rencana Pengujian ... 124
4.2.1.1 Pengujian Black Box ... 125
4.2.1.2 Pengujian Beta (Hasil Wawancara Pengguna) ... 127
4.2.1.3 Pengujian Hasil ... 128
BAB 5 KESIMPULAN DAN SARAN ... 135
5.1 Kesimpulan ... 135
5.2 Saran ... 135
136
DAFTAR PUSTAKA
[1] P. Duncan dan Hollander, Manajemen Toko Eceran, Jakarta: Balai Aksara, 1981.
[2] I. Pramudiono, Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data, 2007.
[3] S. B, Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Yogyakarta: Graha Ilmu, 2007.
[4] Y. Sucahyo dan R. Gopalan, “CT-PRO: A Bottom-Up Non Recursive Frequent Itemset Mining Algorithm Using Compressed FP-Tree Data Structure,” 2004.
[5] D. Aditya, Penelitian Deskriptif, 2009. [6] P. Chapman, Crisp-DM 1.0, 2000.
[7] I. Sommerville, Software Engineering, 2007. [8] F. H.A., Data Mining, Andi, 2013.
[9] Ramon A. Mata Toledeo, Pailine K. Cushman, Dasar-dasar Database Relasional, Jakarta: Airlangga, 2007.
[10] D. T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to DATA MINING, Hoboken, New Jersey: Wiley Interscience, 2005. [11] S. J., Implementasi Data Mining Dengan Metode Market Basket Analysis,
Teknologi Informasi dan Pendidikan,, 2012.
[12] Kusrini dan E. T. Luthfi, dalam Algoritma Data Mining, Yogyakarta, Andi, 2009.
[13] P. Adhitya, “Penerapan Metode Association Rule untuk Pembentukan Paket Penjualan Barang di PT. Celebes,” 2013.
137
[15] E. N. R. Hendra Kurniawan, Aplikasi Inventory Menggunakan Java NetBeans, Xampp,dan iReport, Elex MediaKomputindo, 2009-2013.
[16] D. T. Larose, DISCOVERING KNOWLEDGE IN DATA : An Introduction to DATA MINING, Hoboken, New Jersey: Wiley Interscience, 2005. [17] C. Berrard, “Issues in the Testing of Object-Oriented Software,” 1994. [18] C. Fournier, “Essential Software Testing A Use-case Approach,” 2009. [19] G. J. Myers, The Art of Software Testing, New York, 1979.
[20] R. M, “Management of Integrated Training Systems,” Proceedings of IEEE 1990 National, vol. 2, pp. 924-928, 1990.
1 BAB 1
PENDAHULUAN
1.1 Latar Belakang
Iteung Pusat Oleh-oleh Bandung, merupakan tempat penjualan cinderamata dan oleh-oleh khas Bandung yang telah ada sejak tahun 2013. Toko ini berada di Jalan Anggrek No. 55 Bandung dan telah memiliki beberapa cabang di antaranya di Carrefour-Transmart, Yogya Kepatihan, Cihampelas Batara Hotel, dan Natural Lembang. Iteung Pusat Oleh-oleh Bandung merupakan toko oleh-oleh dengan format swalayan sehingga konsumen dapat memilih dan mengambil sendiri produk yang diinginkan. Produk yang ditawarkan oleh toko Iteung yaitu berupa makanan atau camilan khas Bandung, pakaian, tas, hiasan atau pajangan, dan beragam kerajinan tangan yang hampir semuanya berasal dari daerah Bandung.
Dalam menjalankan bisnisnya, toko Iteung selalu berusaha untuk memberikan kepuasan dan kenyamanan bagi konsumen dengan menawarkan produk-produk yang berkualitas serta membuat suasana belanja yang menyenangkan dengan menyajikan tema yang unik di setiap cabangnya. Namun terdapat beberapa kendala yang dimiliki oleh toko tersebut, di antaranya dalam menentukan penempatan produk untuk setiap cabangnya. Berdasarkan wawancara yang telah dilakukan dengan pihak manajemen toko Iteung, banyaknya jenis produk yang disediakan di toko tersebut membuatnya merasa kesulitan dalam mengatur tata letak produk yang sesuai dengan persepsi konsumen.
2
keinginan konsumen pun dapat menjadi nilai tambah bagi perusahaan untuk menarik minat belanja konsumen [1].
Seiring berjalannya waktu, aktivitas penjualan serta transaksi yang terjadi menghasilkan data yang banyak dan akan terus bertambah. Akan tetapi data tersebut tidak dimanfaatkan oleh pihak toko secara maksimal, hanya sebatas laporan dan kemudian disimpan sebagai arsip. Dengan menggunakan data mining, data tersebut dapat digali hingga didapatkan nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual [2].
Dalam bidang keilmuan data mining, terdapat suatu metode yang dinamakan association rule. Metode ini sering juga dinamakan dengan market basket analysis
karena awal mulanya yang berasal dari studi tentang database transaksi penjualan [3]. Association rule bertujuan untuk menunjukkan nilai asosiatif antara jenis-jenis produk yang dibeli oleh konsumen sehingga dapat di lihat sebuah pola berupa produk-produk apa saja yang sering dibeli secara bersamaan dalam sebuah transaksi penjualan, sehingga dapat dijadikan acuan untuk pengambilan keputusan dalam penempatan produk.
Sebagai solusi untuk pemecahan masalah di Iteung Pusat Oleh-oleh Bandung, maka diperlukan “Pembangunan Aplikasi Data Mining Untuk Menentukan Penempatan Produk Menggunakan Metode Association Rule“ untuk mengatasi permasalahan yang dihadapi oleh Iteung Pusat Oleh-oleh Bandung. Diharapkan dengan adanya perangkat lunak ini dapat membantu pihak perusahaan untuk dimanfaatkan oleh pihak perusahaan sebagai dasar pertimbangan dalam penempatan produk.
1.2 Rumusan Masalah
3
1.3 Maksud dan Tujuan
Berdasarkan permasalahan yang diteliti, maka maksud dari penulisan tugas akhir ini adalah untuk membangun Aplikasi Data Mining Menggunakan Metode Association Rule Untuk Penempatan Produk di Iteung Pusat Oleh-oleh Bandung.
Sedangkan tujuan yang ingin dicapai dalam penelitian ini antara lain:
1. Membantu pihak manajemen Toko Oleh-oleh Iteung dalam mengetahui jenis produk apa saja yang dapat ditempatkan secara berdekatan demi kenyamanan konsumen dalam mencari atau memilih produk yang diinginkan.
2. Membantu pihak manajemen Toko Oleh-oleh Iteung untuk mendapatkan gambaran penempatan produk yang akan diterapkan di setiap cabangnya.
1.4 Batasan Masalah
Batasan yang diterapkan dalam penelitian ini adalah sebagai berikut:
1. Data yang akan di analisa adalah data penjualan produk Iteung Pusat Oleh-oleh Bandung dari tanggal 1 sampai 5 Januari 2016.
2. Algoritma yang akan digunakan adalah algoritma CT-PRO [4]. 3. Aplikasi yang dibangun berbasis web.
4. Informasi yang dihasilkan berupa rekomendasi jenis produk apa saja yang dapat ditempatkan secara berdekatan.
5. Metode analisis dan perancangan yang digunakan adalah dengan menggunakan pendekatan analisis terstruktur.
1.5 Metodologi Penelitian
Adapun metode penelitian data mining, pengumpulan data, dan pembangunan perangkat lunak yang digunakan adalah sebagai berikut:
1.5.1 Metode Penelitian Data Mining
4
diaplikasikan di berbagai sektor industri. Gambar berikut menjelaskan tentang siklus hidup pengembangan data mining yang telah ditetapkan dalam CRISP-DM [5].
Gambar 1.1 Metode CRIPS-DM
Berikut ini adalah penjelasan mengenai enam tahap siklus hidup pengembangan data mining berdasarkan gambar di atas:
1. Business Understanding
Tujuan bisnis Iteung Pusat Oleh-oleh Bandung memasarkan produk secara langsung untuk memenuhi permintaan konsumen. Sedangkan tujuan dari proses mining-nya adalah mengetahui pola penjualan produk yang sering terjual bersama untuk dijadikan dasar dalam penentuan penempatan produk.
2. Data Understanding
Tahap ini dimulai dengan pengumpulan data, sumber data yang didapat dalam penelitian ini merupakan data transaksi penjualan yang terjadi di Iteung Pusat Oleh-oleh Bandung pada bulan Januari tahun 2016. Data yang digunakan dalam proses analisa berupa file excel dengan format .xlsx.
3. Data Preparation
5
4. Modeling
Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan nilai yang optimal. Pemodelan dilakukan menggunakan metode Association Rule dengan menggunakan algoritma CT-PRO.
5. Evaluation
Pada tahap ini, dilakukan evaluasi terhadap model yang digunakan, apakah dengan Association Rule dengan algoritma CT-PRO cukup efektif dalam mencapai tujuan yang ditetapkan pada tahap business understanding.
6. Deployment
Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk tabel yang menunjukkan hasil analisa pada data transaksi penjualan.
1.5.2 Metode Pengumpulan Data
Pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Studi Literatur
Tahap ini adalah melakukan studi pustaka dengan buku, paper, jurnal dan website sebagai media referensi penyusunan, penulisan dan penelitian.
2. Observasi
Tahap pengumpulan informasi dengan cara melakukan observasi di Toko Oleh-oleh Iteung.
3. Interview
6
1.5.3 Metode Pembangunan Perangkat Lunak
Teknik dalam pembuatan perangkat lunak menggunakan paradigma perangkat lunak secara Waterfall. Metode Waterfall menurut Ian Sommerville [6] meliputi beberapa proses diantaranya:
1. Analysist
Merupakan tahap menganalisis hal-hal yang diperlukan dalam pelaksanaan proyek pembuatan perangkat lunak.
2. Design
Tahap penerjemahan dari data yang dianalisis ke dalam bentuk yang mudah dimengerti oleh user.
3. Coding
Tahap penerjemahan data atau pemecahan masalah yang telah dirancang ke dalam bahasa pemrograman tertentu.
4. Testing
Merupakan tahap pengujian terhadap perangkat lunak yang dibangun.
5. Maintenance
Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat mengalami perubahan atau penambahan sesuai dengan permintaan user.
7
1.6 Sistematika Penulisan BAB 1 PENDAHULUAN
Bab ini membahas mengenai latar belakang permasalahan, mengidentifikasi masalah yang dihadapi, menentukan maksud dan tujuan penelitian, dengan diikuti batasan masalah agar penelitian lebih terfokus, menentukan metodologi penelitian yang digunakan, serta sistematika penulisan.
BAB 2 LANDASAN TEORI
Bab ini membahas mengenai konsep dasar serta teori-teori yang berkaitan dengan topik penelitian dan hal-hal yang berguna dalam proses analisis permasalahan.
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
Bab ini menganalisis masalah dari data penjualan hasil penelitian di Iteung Pusat Oleh-oleh Bandung untuk kemudian dilakukan proses perancangan sistem yang akan dibangun sesuai dengan analisa yang telah dilakukan.
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab ini membahas tentang implementasi dari tahapan-tahapan penting yang telah dilakukan sebelumnya kemudian dilakukan pengujian terhadap kesesuaian sistem dengan tahapan yang telah ditentukan untuk memperlihatkan sejauh mana sistem layak digunakan.
BAB 5 KESIMPULAN DAN SARAN
9 BAB 2
TINJAUAN PUSTAKA
2.1 Profil Institusi
Iteung Pusat Oleh-oleh Bandung, merupakan tempat penjualan cinderamata dan oleh-oleh khas Bandung yang telah ada sejak tahun 2013. Toko ini berada di Jalan Anggrek No. 55 Bandung dan telah memiliki beberapa cabang di antaranya di Carrefour-Transmart, Yogya Kepatihan, Cihampelas Batara Hotel, dan Natural Lembang. Iteung Pusat Oleh-oleh Bandung merupakan toko oleh-oleh dengan format swalayan sehingga konsumen dapat memilih dan mengambil sendiri produk yang diinginkan. Produk yang ditawarkan oleh toko Iteung yaitu berupa makanan atau camilan khas Bandung, pakaian, tas, hiasan atau pajangan, dan beragam kerajinan tangan yang hampir semuanya berasal dari daerah Bandung.
2.1.1 Logo
Berikut ini adalah logo Iteung Pusat Oleh-oleh Bandung
Gambar 2.1 Logo Iteung Pusat Oleh-oleh Bandung
2.1.2 Struktur Organisasi
10
Owner
Keuangan
Admin IT Supervisor
Pramuniaga Kasir
Gambar 2.2 Struktur Organisasi di Iteung Pusat Oleh-oleh Bandung
2.1.3 Deskripsi Kerja
1. Owner
Selain menjadi pemilik perusahaan, owner bertugas untuk mengawasi kerja para karyawan, pengambil keputusan dan penanggung jawab semua aktivitas yang berada di Iteung Pusat Oleh-oleh Bandung.
2. Keuangan
Bagian keuangan bertugas merencanakan, menganggarkan, memeriksa, mengelola, dan menyimpan dana yang dimiliki oleh perusahaan.
3. Admin IT
Admin IT bertugas mengelola semua data yang ada di Iteung Pusat Oleh-oleh Bandung seperti data penjualan, data gudang, data produk dan lain – lain. 4. Supervisor
Supervisor bertugas untuk Mengawasi semua aktivitas karyawan dan
membatu aktivitas di Iteung Pusat Oleh-oleh Bandung. 5. Pramuniaga
Bertugas untuk melayani customer yang akan membeli produk di Toko, merapikan produk, juga menyimpan letak produk untuk dipajang.
6. Kasir
11
2.2 Landasan Teori
Landasan teori membahas tentang materi atau teori apa saja yang digunakan sebagai bahan acuan dalam pembuatan tugas akhir ini. Landasan teori yang diuraikan merupakan hasil studi literatur baik dari buku atau situs internet.
2.2.1 Data
Data adalah segala fakta, angka atau teks yang dapat diproses oleh komputer. Data dapat digunakan sebagai input dan menghasilkan sebuah informasi. Data adalah sesuatu yang belum memiliki arti dan masih membutuhkan suatu pengolahan. Dalam data terdapat himpunan data (data-set) yang merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek yang biasanya dikenal sebagai variabel, field, karakteristik atau fitur.
Salah satu himpunan data (data-set) adalah record data, yaitu data yang terdiri dari sekumpulan record, yang masing-masing terdiri dari satu set atribut yang tetap. Salah satu yang termasuk dalam tipe data record yaitu data transaksi. Data transaksi merupakan sebuah tipe khusus dari record data, di mana tiap record (transaksi) meliputi satu set item [7].
2.2.2 Database
Database adalah susunan record data operasional lengkap dari suatu
organisasi atau perusahaan yang diorganisir dan disimpan secara terintegrasi dengan menggunakan metode tertentu dalam komputer sehingga mampu memenuhi informasi yang optimal yang dibutuhkan oleh para pengguna [8].
2.2.2.1 Data Pada Database dan Hubungannya Ada 3 jenis data pada sistem database, yaitu [8]:
1. Data operasional dari suatu organisasi, berupa data yang tersimpan dalam basis data.
12
3. Data keluaran (output data), berupa laporan melalui peralatan output sebagai hasil dari dalam sistem yang mengakses data operasional.
2.2.2.2 Keuntungan dan kerugian Pemakai Sistem Database Berikut adalah keuntungan pemakai sistem database [8]: 1. Terkontrolnya kerangkapan data dan inkonsistensi. 2. Terpeliharanya keselarasan data.
3. Data dapat dipakai secara bersama-sama.
4. Memudahkan penerapan standarisasi dan batas-batas pengamanan. 5. Terpeliharanya keseimbangan atas perbedaan kebutuhan data dari setiap
aplikasi.
6. Program/data independent.
Di samping keuntungan, terdapat kerugian pemakai sistem database, yaitu:
1. Mahal dalam implementasinya. 2. Rumit/kompleks.
3. Penanganan proses recovery backup sulit.
4. Kerusakan pada sistem basis data dapat mempengaruhi.
2.2.3 Pengertian Data Mining
Data mining adalah suatu istilah yang digunakan untuk menguraikan
penemuan pengetahuan dalam database. Data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar [9].
Menurut Pramudiono [2], “Data mining adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.”
13
1. Pertumbuhan yang cepat dalam kumpulan data.
2. Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan memiliki akses ke dalam database yang handal.
3. Adanya peningkatan akses data melalui navigasi web dan intranet.
4. Tekanan kompetensi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi.
5. Perkembangan teknologi perangkat lunak untuk data mining (ketersediaan teknologi).
6. Perkembangan yang hebat dalam kemampuan komputasi dan pengembangan kapasitas media penyimpanan.
2.2.3.1 Konsep Data Mining
Data mining sangat diperlukan terutama dalam mengelola data yang sangat
besar untuk memudahkan aktivitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi pengguna data
mining. Alasan utama data mining sangat dibutuhkan dalam industri informasi
karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran atau berjumlah besar. Informasi inilah yang nantinya sangat berguna untuk pengembangan.
2.2.3.2 Metode Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu [9]: 1. Deskripsi
14
pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai
prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikkan.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah:
a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.
b. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.
5. Pengklusteran
15
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam suatu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah:
a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang besar.
b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang pasar. Contoh asosiasi dalam bisnis dan penelitian adalah:
a. Meneliti jumlah konsumen dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.
b. Menemukan produk dalam supermarket yang dibeli secara bersamaan dan produk yang tidak pernah dibeli secara bersamaan.
2.2.3.2.1 Cross-Industry Standard Process for Data Mining (CRISP-DM) Cross-Indutry Standard Prosess for Data Mining (CRISP-DM) yang
16
Dalam CRISP-DM, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase. Keseluruhan fase berurutan yang ada tersebut bersifat adaptif. Fase berikutnya dalam urutan bergantung kepada keluaran dari fase sebelumnya. Hubungan antar fase digambarkan dengan panah. Sebagai contoh, jika proses berada pada fase modelling. Berdasar pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation untuk perbaikan lebih lanjut terhadap data atau berpindah maju kepada fase evaluation.
Enam fase yang ada dalam metode CRISP-DM tersebut dapat dilihat pada Gambar berikut ini:
Gambar 2.3 Fase metode CRISP-DM
Fase-fase dari CRISP-DM [9]:
1. Business Understanding
a. Penentuan tujuan bisnis yang dilakukan oleh perusahaan dan kriteria sukses bisnis yang menjadi acuan berhasilnya perusahaan dalam menjalankan bisnis.
b. Menjelaskan tujuan digunakannya metode data mining dalam bsnis yang dijalankan dan kriteria suksesnya metode data mining.
17
2. Data Understanding
a. Mengumpulkan data.
b. Mendeskripsikan data yang telah diperoleh. c. Mengevaluasi kualitas data.
d. Jika diinginkan, pilih sebagian kecil grup data yang mungkin mengandung pola dari permasalahan.
3. Data Preparation
a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif.
b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.
c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Siapkan data awal sehingga siap untuk perangkat pemodelan.
4. Modeling
a. Pilihan dan aplikasikan teknik pemodelan yang sesuai. b. Kalibrasi aturan model untuk mengoptimalkan hasil.
c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama.
d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.
5. Evaluation
a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.
b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.
18
d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.
6. Deployment
a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.
b. Contoh sederhana penyebaran: pembuatan laporan.
c. Contoh kompleks penyebaran: penerapan proses data mining secara paralel pada departemen lain.
2.2.3.3 Association Rule
Association rule adalah salah satu teknik utama atau prosedur dalam
market basket analysis untuk mencari hubungan antar-item dalam suatu data set
dan menampilkan bentuk associaiton rule [10]. Association rule (aturan asosiasi) akan menemukan pola tertentu untuk mengasosiasikan data yang satu dengan data yang lain.
Untuk mencari association rule dari suatu kumpulan data, tahap pertama yang harus dilakukan adalah mencari frequent itemset terlebih dahulu. Frequent itemset adalah sekumpulan item yang sering muncul secara bersamaan. Setelah
semua pola frequent item ditemukan, barulah mencari aturan assosiatif atau aturan keterkaitan yang memenuhi syarat yang telah ditentukan.
Jika diasumsikan bahwa produk yang dijual di swalayan adalah semesta, maka setiap produk akan memiliki boolean variabel yang akan menunjukkan keberadaannya atau tidak produk tersebut dalam suatu transaksi atau satu keranjang belanja. Pola boolean yang didapat digunakan untuk menganalisa produk yang dibeli secara bersamaan. Pola tersebut dirumuskan dalam sebuah association rule. Sebagai contoh konsumen biasanya akan membeli kopi dan susu yang ditunjukkan sebagai berikut:
Kopi → susu [support = 2%, confidence = 60%]
Association rule diperlukan suatu variabel ukuran yang ditentukan sendiri
19
kegunaan suatu pola yang telah ditemukan, Nilai support 2% menunjukkan bahwa keseluruhan dari total transaksi konsumen membeli kopi dan susu secara bersamaan yaitu sebanyak 2%. Sedangkan confidence 60%, yaitu menunjukkan bila konsumen membeli kopi dan pasti membeli susu sebesar 60%.
Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter yaitu support dan confidence. Support (nilai penunjang) adalah persentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian adalah kuatnya hubungan antar–item dalam aturan asosiasi.
Dalam menentukan suatu association rule, terdapat suatu interestingness measure (ukuran kepercayaan) yang didapat dari hasil pengolahan data dengan
perhitungan tertentu. Umumnya ada dua ukuran, yaitu:
1. Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item/itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu item/itemset layak untuk dicari confidence-nya (misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi suatu item yang menunjukkan bahwa item A dan item B dibeli bersamaan). 2. Confidence, suatu ukuran yang menunjukkan hubungan antara 2 item
secara conditional (misal, menghitung kemungkinan seberapa sering item B dibeli oleh konsumen jika konsumen tersebut membeli sebuah item A). Kedua ukuran ini nantinya berguna dalam menentukan kekuatan suatu pola dengan membandingkan pola tersebut dengan nilai minimum kedua parameter tersebut yang ditentukan oleh pengguna. Bila suatu pola memenuhi kedua nilai minimum parameter yang sudah ditentukan sebelumnya, maka pola tersebut dapat
disebut sebagai interesting rule atau strong rule.
2.2.3.3.1 Metodologi Dasar Analisis Asosiasi
Metodologi dasar Association Rule terbagi menjadi dua tahap, yaitu [11]: 1. Analisis pola frekuensi tinggi
Tahap Tahap ini mencari pola item yang memenuhi syarat minimum dari nilai support dalam database. Menurut Larose, kita bebas menentukan nilai
20
kebutuhan [9]. Sebagai contoh, bila ingin menemukan data-data yang memiliki hubungan asosiasi yang kuat, minsup dan mincof-nya bisa diberi nilai yang tinggi. Sebaliknya, bila ingin melihat banyaknya variasi data tanpa terlalu mempedulikan kuat atau tidaknya hubungan asosiasi antara item-nya, nilai minsup dan mincofnya dapat diisi rendah [12]. Nilai support sebuah item diperoleh dengan rumus berikut.
� =� � � �� � �� � � � � × % ... Persamaan 2.1
Persamaan 2-1 menjelaskan bahwa nilai support didapat dengan cara membagi jumlah transaksi yang mengandung item A (satu item) dengan jumlah total seluruh transaksi.
Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut � � , = � ⋂
� , =� � � �� � �� � � �� � × % ... Persamaan 2.2
Persamaan 2-2 menjelaskan bahwa nilai support item set didapat dengan cara membagi jumlah transaksi yang mengandung item A dan item B (item pertama bersamaan dengan item yang lain) dengan jumlah total seluruh transaksi.
2. Pembentukan aturan asosiasi
Setelah semua pola frekuensi tinggi ditemukan, kemudian mencari aturan asosiasi yang cukup kuat ketergantungan antar item.
Dalam antecedent (pendahulu) dan consequent (pengikut) serta memenuhi syarat minimum untuk confidence aturan asosiatif A→B.
Misalkan D adalah himpunan transaksi, di mana setiap transaksi T dalam D merepresentasikan himpunan item yang berada dalam I. I adalah himpunan item yang dijual. Misalkan kita memilih himpunan item A dan himpunan item lain B, kemudian aturan asosiasi akan berbentuk:
Jika A, maka B (A→B)
Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B di mana aturan:
21
Jika B, maka A
Sebuah item set adalah himpunan item-item yang ada dalam I, dan i item set. Frekuensi item set merupakan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan.
Nilai confidence dari aturan A→B diperoleh dari rumus berikut.
=� �� � �� � � �� �� � � � ... Persamaan 2.3
2.2.3.3.2 Algoritma CT-PRO
Algoritma ini merupakan salah satu algoritma pengembangan dari FP-Growth. Perbedaannya adalah di mana FP-Growth membuat FP-Tree sedangkan
CT-PRO membuat Compressed FP-Tree (CFP-Tree ) [13]. Pada tahap mining algoritma CT-PRO juga menggunakan pendekatan bottom-up dimana item pada item tabel dan CFP-Tree dilakukan scan dari jumlah terkecil hingga terbesar.
Algoritma CT-PRO memiliki tiga tahap yaitu: 1. Menemukan item-item yang frequent.
2. Membuat struktur data CFP-Tree. 3. Melakukan mining frequent patterns.
Langkah-langkah kerja algoritma CT-PRO [13] [14]:
1. Mencari Frequent Item, pada tahap ini terjadi proses-proses sebagai berikut: a. Dari dataset yang ada, dilakukan seleksi berdasarkan minimum support
yang ditentukan sehingga menghasilkan frequent item.
b. Dari frequent item yang telah terbentuk, dihitung frekuensi kemunculan setiap item sehingga menghasilkan Global Item tabel.
2. Membangun CFP-Tree, pada tahap ini terjadi proses-proses sebagai berikut: a. Frequent item yang telah didapatkan, diurutkan berdasarkan Global item table yang ada secara menurun (diurutkan mulai dari item berfrekuensi
terbesar hingga terkecil).
22
1) CFP-Tree terdiri dari tree yang memiliki root yang mewakili indeks dari item dengan tingkat kemunculan tertinggi dan kumpulan subtree sebagai anak dari root.
2) Jika I = {i1,i2, …, ik} adalah kumpulan dari frequent item dalam transaksi, item dalam transaksi akan dimasukkan ke dalam CFP-Tree dimulai dari root subtree yang merupakan i1 dalam item tabel.
3) Root dari CFP-Tree merupakan level-0 dari tree.
4) Setiap node dalam CFP-Tree memiliki empat field utama yakni item-id, parent-id, Count yang merupakan jumlah item pada node
tersebut, dan level yang menunjukkan struktur data tree pada node tersebut dimulai dari item yang terdapat pada item tabel dengan level yang terdapat pada CFP-Tree.
3. Mining, pada tahap ini terjadi proses-proses sebagai berikut [13] [14]: a. Pada tahap mining ini, algoritma CT-PRO bekerja dengan melakukan
bottom-up mining sehingga Global item table diurutkan mulai dari item
berfrekuensi terkecil hingga terbesar.
b. Untuk setiap item yang terdaftar pada Global item table yang telah diurutkan, dilakukan pencarian node yang berkaitan dengan item tersebut pada Global CFP-Tree. Dari semua node yang ditemukan untuk setiap item inilah yang disebut dengan Local frequent item dan digunakan untuk
membuat Local item table.
c. Pada pembuatan Local item table ini juga dilakukan berdasarkan jumlah minimum support yang telah ditentukan.
d. Setelah itu, dibuat Local CFP-Tree berdasarkan Local item table yang terbentuk. Aturan pembentukan Local CFP-Tree sama dengan pembentukan Global CFP-Tree, yang membedakan adalah pada Global
CFP-Tree yang digunakan dalam pembentukan tree-nya adalah Global
23
e. Dari Local CFP-Tree dibentuk frequent pattern sesuai dengan item yang di-mining.
f. Dari frequent pattern dihitung masing-masing item yang memenuhi dihitung confidencenya. Apabila memenuhi minimum confidence maka masing-masing item yang bersangkutan dijadikan sebagai knowledge.
2.2.4 Alat-Alat Pemodelan Sistem
Alat-alat pemodelan sistem adalah alat dan metode yang akan digunakan untuk memodelkan perancangan perangkat lunak dalam skripsi ini.
2.2.4.1 Entity Relationship Diagram (ERD)
ERD Menurut Nugroho (2002) adalah diagram yang memperlihatkan entitas-entitas yang terlibat dalam suatu sistem serta hubungan-hubungan (relasi) antar entitas tersebut.
2.2.4.2 Diagram Konteks
Diagram konteks adalah diagram aliran data pada tingkat paling atas yang merupakan penggambaran yang berfungsi untuk memperlihatkan interaksi atas hubungan langsung antara sistem informasi dengan lingkungannya. Diagram konteks menggambarkan sebuah sistem berupa sebuah proses yang berhubungan dengan satu atau beberapa entitas.
2.2.4.3 Data Flow Diagram (DFD)
Data flow diagram (DFD) adalah suatu alat pemodelan yang digunakan untuk
memodelkan fungsi dari sistem, menggambarkan secara rinci mengenai sistem sebagai jaringan kerja antar fungsi yang berhubungan satu sama lain dengan menunjukkan dari dan kemana data mengalir serta menyimpannya. Pada umumnya DFD dimulai dari 0, 1, 2, dst. Level ke-0 disebut dengan diagram konteks yang menggambarkan sistem secara global.
24
a. Diagram Konteks, merupakan satu lingkaran besar yang dapat mewakili seluruh proses yang terdapat di dalam suatu sistem.
b. DFD Level 1 merupakan satu lingkaran besar yang mewakili lingkaran-lingkaran kecil yang ada di dalamnya, dan merupakan pemecahan dari diagram konteks.
c. Diagram Rinci, merupakan diagram yang menguraikan proses apa yang ada dalam diagram DFD Level 1.
Contoh kasus dari penerapan Diagram Konteks:
Gambar 2.4 Contoh Kasus Penerapan Diagram Konteks
Contoh DFD dari diagram konteks di atas:
25
2.2.4.4 Kamus Data
Kamus data adalah suatu penjelasan tertulis mengenai data yang berada dalam database. Kamus data ikut berperan untuk menjelaskan arti aliran data dan
menyimpan dalam menggambarkan data flow diagram, menjelaskan spesifikasi nilai dan satuan yang relevan terhadap data yang mengalir dalam sistem tersebut, mendeskripsikan komposisi paket data yang bergerak melalui aliran.
Fungsi kamus data [9]:
1. Menjelaskan arti aliran data dan penyimpanan data dalam DFD.
2. Mendeskripsikan komposisi paket data (elemen data) yang bergerak melalui aliran data.
3. Mendeskirpsikan komposisi penyimpanan data.
4. Mendeskripsikan nilai dan satuan (struktur data) yang relevan bagi penyimpanan dan aliran.
5. Mendeskripsikan hubungan detail antar penyimpanan. Tabel 2.1 Struktur Kamus Data
Nama Data Keterangan
Deskripsi Memilih file yang akan diproses Bentuk Data Format file
Struktur Data Atribut yang digunakan
2.2.4.5 Spesifikasi Proses (Process Specification)
Digunakan untuk mendeskripsikan proses yang terjadi pada level paling rendah dari DFD. Struktur spesifikasi proses dapat dilihat di tabel lampiran.
Hubungan dengan Prosess Specification [11]:
1. Semua proses dalam DFD yang tidak dapat dipecah lagi dan harus didefinisikan dalam process specification.
2. Aliran data masuk (input) dan keluar (output) dalam DFD dan hubungan ke data store harus sesuai dan relevan dalam process specification.
3. Setiap elemen data dalam process specification harus: a. Nama dari aliran data atau data store.
26
Tabel 2.2 Struktur Spesifikasi Proses
No. Urut Proses Keterangan No. Proses
SQL (Structured Query Language) adalah sebuah bahasa yang dipergunakan untuk mengakses data dalam basis data relasional. SQL juga dapat diartikan sebagai antar muka standar untuk sistem manajemen basis data relasional, termasuk sistem yang beroperasi pada komputer pribadi. SQL memungkinkan seorang pengguna untuk mengakses informasi tanpa mengetahui di mana lokasinya atau bagaimana informasi tersebut disusun [15].
MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL (bahasa Inggris: database management system) atau DBMS yang multi thread, dan multi-user. MySQL dimiliki dan di sponsori oleh sebuah perusahaan komersial Swedia
MySQL AB, di mana memegang hak cipta hampir atas semua kode sumbernya. Kedua orang Swedia dan satu orang Finlandia yang mendirikan MySQL AB adalah: David Axmark, Allan Larsson, dan Michael "Monty" Widenius.
2.2.6 PHP
PHP adalah bahasa pemrograman script server-side yang didesain untuk pengembangan web. Selain itu, PHP juga bisa digunakan sebagai bahasa pemrograman umum. PHP di kembangkan pada tahun 1995 oleh Rasmus Lerdorf, dan sekarang dikelola oleh The PHP Group.
PHP disebut bahasa pemrograman server side karena PHP diproses pada komputer server. Hal ini berbeda dibandingkan dengan bahasa pemrograman client-side seperti JavaScript yang diproses pada web browser (client).
27
135 BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil implementasi dan pengujian yang telah dilakukan pada aplikasi data mining untuk rekomendasi penempatan produk menggunakan metode association rule dan algoritma CT-Pro, maka dapat diambil kesimpulan sebagai
berikut:
1. Aplikasi yang dibangun dapat membantu pihak manajemen Toko Oleh-oleh Iteung dalam mengetahui jenis produk apa saja yang dapat ditempatkan secara berdekatan dalam penempatan produk.
2. Aplikasi yang dibangun dapat membantu pihak manajemen Toko Oleh-oleh Iteung untuk mendapatkan gambaran penempatan produk yang akan diterapkan di setiap cabangnya.
5.2 Saran
Adapun saran untuk pengembangan aplikasi penempatan produk lebih lanjut yaitu:
1. Pembangunan aplikasi data mining dikembangkan dengan menggunakan pemrograman berorientasi objek (Object Oriented Programming) sehingga aplikasi dapat berjalan secara dinamis.
2. Pembangunan aplikasi dikembangkan dengan mengimplementasikan algoritma lain agar dapat melihat perbandingan performansi dari algoritma CT-Pro.