K-MEANS CLUSTERING
SKRIPSI
STEFFI ANDINA SEBAYANG
071402041
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN
2012
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Teknologi Informasi
STEFFI ANDINA SEBAYANG 071402041
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2012
PERSETUJUAN
Judul : SISTEM MARKET BASKET UNTUK
MENENTUKAN TATA LETAK PRODUK PADA
SUATU SWALAYAN MENGGUNAKAN
ALGORITMA K-MEANS CLUSTERING
Kategori : SKRIPSI
Nama : STEFFI ANDINA SEBAYANG
Nomor Induk Mahasiswa : 071402041
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI (Fasilkom-TI) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, Juni 2012
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dra. Elly Rosmaini, M.Si DR. Erna Budhiarti Nababan, M.IT
NIP. 19600520 198503 2002 NIP. -
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
Prof. Dr. Opim Salim Sitompul NIP. 19610817 198701 1001
PERNYATAAN
SISTEM MARKET BASKET UNTUK MENENTUKAN TATA LETAK PRODUK PADA SUATU SWALAYAN MENGGUNAKAN ALGORITMA
K-MEANS CLUSTERING
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, Juni 2012
Steffi Andina Sebayang 071402041
PENGHARGAAN
Alhamdulilah, puji dan syukur penulis panjatkan kehadirat Allah SWT, serta shalawat dan salam kepada junjungan kita nabi Muhammad SAW, karena atas berkah, rahmat dan hidayahnya penulis dapat menyelesaikan penyusunan skripsi ini. Ucapan terima kasih yang tidak terhingga kepada Allah SWT yang selalu membimbing dan mengajarkan saya akan pentingnya kesabaran dan tanggung jawab selama penyusunan skripsi ini.
Dalam penulisan skripsi ini penulis banyak mendapatkan bantuan serta dorongan dari pihak lain. Dalam kesempatan ini dengan segala kerendahan hati, penulis mengucapkan terima kasih kepada:
1. Kedua orang tua penulis, yaitu Ayahanda alm. Ir. Rasimin Sebayang yang saya yakin beliau bersama Allah selalu memberikan doa dan dukungannya dimanapun beliau berada serta Ibunda saya Hj. Isyah Sembiring yang terus menerus mengasihi, membimbing dan terus mendukung penulis di dalam doa beliau sehingga dapat menyelesaikan skripsi ini. Serta kepada semua abang-abang saya Titon Faisal Sebayang, SE, Topaz Halim Roy Candra Sebayang, ST, MT, Tri Endi Sebayang yang telah memberikan dukungan moril maupun materi kepada penulis selama ini, dan seluruh keluarga besar atas perhatiannya dan dukungannya kepada penulis.
2. Ketua program studi Teknologi Informasi, Bapak Prof. Opim Sitompul, M.Sc dan Sekteraris Program Studi Teknologi Informasi Bapak Drs.
Sawaluddin, M.IT, Dekan dan Pembantu Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara, semua dosen pada Program Studi Teknologi Informasi dan pegawai Teknologi Informasi Ibu Delima Harahap, Ibu Bamelia, Kak Maya Sofia, S.Kom, Kak Naumi Syah, Amd, Kak Wardah Chairani, SE dan Bang Faisal.
3. Ibu Dr. Erna Budhiarti Nababan, M.IT dan Ibu Dra. Elly Rosmaini, M.Si selaku dosen pembimbing penulis yang telah meluangkan waktu, tenaga dan pikiran untuk menyelesaikan skripsi ini.
4. Ibu Dian Rachmawati, S.Si, M.Kom dan Bapak Deddy Arisandi, ST, M.Kom selaku dosen pembanding yang telah banyak mamberikan petunjuk, saran dan kritik dalam menyelesaikan skripsi ini.
5. Teman-teman mahasiswa Teknologi Informasi stambuk 2007 Boy Utomo Manalu, Anandia Zelvina, Nurul Dwi Rahma Putri, Khairunnisa, Agnes Margareta, Ita Deniska, Polin Pardede, Musyafa Hutagalung dan Bambang Kurniawan atas bantuan, masukan, motivasi, hiburan dan kerjasamanya.
Semangat teman-teman dan yakin kita bisa.
Dalam penyusunan skripsi ini penulis menyadari bahwa masih banyak kekurangan, untuk itu penulis mengharapkan saran dan kritik yang bersifat membangun dari semua pihak demi kesempurnaan skripsi ini.
Akhir kata penulis mengharapkan semoga skripsi ini dapat bermanfaat dan membantu semua pihak yang memerlukannya.
ABSTRAK
Penentuan tata letak produk pada swalayan merupakan hal penting yang harus diperhatikan oleh pihak manajemen swalayan. Market basket analysis adalah salah satu teknik data mining yang dapat menemukan pola yang berupa produk-produk yang sering dibeli bersamaan dalam sebuah transaksi. Pada skripsi ini akan dijelaskan bagaimana market basket analysis dengan menggunakan algoritma k-means clustering berdasarkan kebiasaan konsumen berbelanja untuk menghasilkan suatu model tata letak produk. Penelitian ini menggunakan data yang diperoleh dari struk-struk belanja pada swalayan. Algoritma k-means clustering digunakan untuk mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok lain. Hasil dari penelitian ini menghasilkan sebuah model tata letak produk yang dapat digunakan oleh pihak manajemen swalayan.
Kata Kunci: tata letak produk; market basket analysis; algoritma k-means clustering.
SYSTEM MARKET BASKET TO DETERMINE THE LAYOUT OF THE PRODUCT IN A SUPERMARKET USING K-MEANS CLUSTERING
ALGORITHM
ABSTRACT
Determination of the products on supermarket layout is an important thing that must be considered by the management department. Market Basket Analysis is one technique on Data Mining that is used to discover patterns of the products often purchased together in a transaction. In this research we applied market basket analysis with k-means clustering algorithm based on consumer shopping habits to produce a model of the product layout. Data on the research were taken from structural groceries on supermarket receipts. K-means clustering algorithm is used to partition the data into clusters so that the data that has same characteristics are grouped into the same cluster and the data that has different characteristics are grouped into other groups.
Result of this research produce a model of a product layout that can be used by the management department.
Keywords: product layout; market basket analysis; k-means clustering algorithms.
DAFTAR ISI
Halaman
Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak vi
Abstract vii
Daftar Isi viii
Daftar Tabel x
Daftar Gambar xi
BAB 1 Pendahuluan
1.1 Latar Belakang 1
1.2 Rumusan Masalah 3
1.3 Batasan Masalah 3
1.4 Tujuan Penelitian 4
1.5 Manfaat Penelitian 4
1.6 Metode Penelitian 4
1.7 Sistematika Penulisan 5
BAB 2 Landasan Teori
2.1. Defenisi Swalayan 7
2.2. Data Mining : Knowledge Discovery Databases (KDD) 7
2.2.1 Tahapan Data Mining 9
2.2.2 Pengelompokan Data Mining 11
2.3. Clustering 14
2.4 Algoritma K-Means 19
2.5 Market Basket Analysis 21
BAB 3 Analisis Dan Perancangan Sistem
3.1. Data yang Digunakan 24
3.2. Praproses Data 24
3.2.1 Penentuan Kelompok Jenis Produk 24
3.2.2 Penentuan Record 27
3.2.3 Penentuan Kelompok Berdasarkan Record 27
3.3. Cleaning Data 29
3.4. Uji Coba Dengan Algoritma K-Means Clsutering 31
3.5. Perancangan Antarmuka Sistem 40
3.5.1 Perancangan Flowchart Sistem 40 3.5.2 Perancangan Tampilan Sistem 42 BAB 4 Implementasi Dan Pengujian Sistem
4.1. Implementasi Sistem 47
4.2. Pengujian Sistem 48
4.2.1 Upload Data Struk 48
4.2.2 Hasil Mean Clustering 51
4.3. Hasil Clustering 81
BAB 5 Kesimpulan Dan Saran
5.1. Kesimpulan 84
5.2. Saran 84
Daftar Pustaka 86
Lampiran A: Listing Program 88
DAFTAR TABEL
Halaman
Tabel 3.1 Dataset Penjualan Produk 27
Tabel 3.2 Dataset Penjualan Produk Dengan 7 Atribut 29
Tabel 3.3 Dataset yang Telah Dicleaning 31
Tabel 3.4 Pemberian Nama Cluster Pada Masing-Masing Data 32 Tabel 3.5 Hasil Centroid Awal Masing-Masing Cluster 34 Tabel 3.6 Hasil Penghitungan Jarak Setiap Data Masing-Masing Cluster 36 Tabel 3.7 Anggota Data Awal Masing-Masing Cluster 37
DAFTAR GAMBAR
Halaman
Gambar 2.1 Kajian Umum Data Mining 8
Gambar 2.2 Proses KDD 10
Gambar 3.1 Contoh Struk Belanjaan 25
Gambar 3.2 Flowchart Sistem 41
Gambar 3.3 Rancangan Tampilan Form Upload Data 42
Gambar 3.4 Rancangan Tampilan Cleaning Data dan Pemberian Nama Cluster 43
Gambar 3.5 Rancangan Tampilan Hasil Iterasi N 44
Gambar 3.6 Rancangan Tampilan Hasil Akhir 46
Gambar 4.1 Dataset Penjualan Produk 50
Gambar 4.2 Upload Data Struk 50
Gambar 4.3 Cleaning Data dan Pemberian Nama Cluster 53
Gambar 4.4 Iterasi 1 60
Gambar 4.5 Iterasi 2 66
Gambar 4.6 Iterasi 3 72
Gambar 4.7 Hasil Akhir 81