i
TUGAS AKHIR
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN JENIS PRODUK DI SWALAYAN LARISSO AMBULU-JEMBER
Di Susun Oleh : Indri Dwi Rukmana
1210652018
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JEMBER 2015
ii
TUGAS AKHIR
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN JENIS PRODUK DI SWALAYAN LARISSO AMBULU-JEMBER
Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1 Jurusan Teknik Informatika Fakultas Teknik
Universitas Muhammadiyah Jember
Disusun Oleh : Indri Dwi Rukmana
1210652018
Dosen Pembimbing : 1. Daryanto, S.Kom., M.Kom
2. Lutfi Ali Muharom, S.Si
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JEMBER 2015
iii
HALAMAN PENGESAHAN
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN JENIS PRODUK DI SWALAYAN LARISSO AMBULU-JEMBER
Oleh : Indri Dwi Rukmana
1210652018
Tugas Akhir Ini Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer (S.Kom)
di
Universitas muhammadiyah Jember
Telah diuji dan disahkan dihadapan tim penguji sidang tugas akhir, pada :
Hari : Jumat
Tanggal : 30 Januari 2015
Ruangan : Ruang Sidang Fakultas Teknik
Disetujui oleh :
Dosen Penguji I Dosen Pembimbing I
Yeni Dwi Rahayu, M.Kom Daryanto, S.Kom., M.Kom
NPK. 11 03 590 NPK. 11 03 589
Dosen Penguji II Dosen Pembimbing II
Yulio Rahmadi, S,Kom Lutfi Ali Muharom, S.Si
NPK. 10 03 545 NPK. 10 09 550
Jember, Mengesahkan, Dekan Fakultas Teknik
Ir. Rusgianto, MM NIP. 131 863 867
Ketua Jurusan Teknik Informatika
Agung Nilogiri S.T., M.Kom NIP. 19770330 200501 1002
iv
PERNYATAAN Yang bertanda tangan di bawah ini :
Nama : Indri Dwi Rukmana
Nim : 1210652018
Jurusan : Teknik Informatika
Tempat dan Tanggal Lahir : Jember, 27 Juni 1989
Agama : Islam
Alamat : Perumahan Bumi Ambulu Permai blok AA.4
Ambulu - Jember
Dengan ini menyatakan dengan sesungguhmya bahwa saya benar-benar membuat Tugas Akhir ini sebagai syarat kelulusan program Sarjana (S1) untuk memperoleh gelar
“S.Kom” Jurusan Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Jember dengan judul “Implementasi Algoritma K-Means Clustering Untuk Menentukan Tata Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu - Jember”.
Demikian pernyataan ini saya buat dengan sesungguhnya, apabila terungkap suatu jiplakan maka saya bersedia menerima akibat berupa sangsi akademis dan sangsi lain yang diberikan oleh yang berwenang.
Jember, 21 Januari 2015
Indri Dwi Rukmana 1210652018
v
PERSEMBAHAN
Alhamdulillahirabbil alamin, akhirnya aku sampai ke titik ini. Segala puji dan syukur kepada ALLAH SWT atas segala rakhmat dan hidayahnya yang telah memberikan kekuatan, kesehatan dan kesabaran untuk ku dalam mengerjakan skripsi ini. Terima kasih ku juga kepada :
1. Ayah dan Ibu tercinta yang selalu memberikanku motivasi, inspirasi, semangat dan kasih sayangnya yang tak terhingga dalam menjalani kehidupan ini.
2. Kakak dan adikku yang telah sama-sama kita berjuang atas kehidupan yang kita tempuh ini, teruslah berjuang untuk mencapai cita-cita kita.
3. My Dear yang selalu ada di sampingku, mendengarkan semua keluh kesahku, memberikan support, doa dan rasa cintanya yang tulus kepadaku.
4. Para dosen-dosen ku, terutama pembimbingku di Universitas Muhammadiyah Jember yang tak pernah lelah dan sabar memberikan bimbingan dan arahan kepada ku.
5. Teman – teman seperjuanganku yang selalu memberiku semangat.
6. Teman – teman kostan Greendland Cluster GO.20 yang super kocak dan konyol, terimakasih atas canda tawa kalian serta supportnya selama ini.
vi
MOTTO
“ Dia memberikan hikmah (ilmu yang berguna) kepada siapa yang dikehendaki-Nya.
Barang siapa yang mendapat hikmah itu, sesungguhnya ia telah mendapat kebajikan yang banyak. Dan tiadalah yang menerima peringatan melainkan orang- orang yang berakal ”.
(Q.S. Al-Baqarah: 269)
“ Sesungguhnya bersama kesukaran itu ada keringanan. Karena itu bila kau sudah selesai (mengerjakan yang lain). Dan berharaplah kepada Tuhanmu ”. (Q.S Al Insyirah : 6-8)
“ Bersabar, Berusaha, dan Bersyukur. Bersabar dalam berusaha, berusaha dengan pantang menyerah dan bersyukur atas apa yang telah diperoleh ”. (Indri)
“ Jadilah seperti karang di lautan yang selalu kuat meskipun terus dihantam ombak dan lakukanlah hal yang bermanfaat untuk diri sendiri dan juga untuk orang lain, karena hidup tidak abadi ”. (Indri)
“ Kaki yang akan berjalan lebih jauh, tangan yang akan berbuat lebih banyak, mata yang akan menatap lebih lama, leher yang akan lebih sering melihat ke atas, lapisan tekad yang seribu kali lebih keras dari baja, dan hati yang akan bekerja lebih keras, serta mulut yang akan selalu berdoa ”. -5cm
vii
KATA PENGANTAR
Alhamdulillahirabbil alamin, segala puji bagi Allah SWT Tuhan semesta alam atas segala berkat, rahmat, taufik, serta hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini dengan baik dan tepat waktu.
Tugas Akhir yang berjudul “ Implementasi Algoritma K-means Clustering Untuk Menetukan Tata Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu- Jember ” ini dilakukan untuk memenuhi salah satu persyaratan pendidikan di Universitas Muhammadiyah Jember Jurusan Teknik Informatika, Fakultas Teknik.
Dalam kesempatan ini, penulis menyampaikan rasa terima kasih kepada:
1. Bapak Daryanto S.Kom., M.Kom selaku dosen pembimbing 1.
2. Bapak Lutfi Ali Muharom, S.Si selaku dosen pembimbing 2.
3. Ibu Yeni Dwi Rahayu, M.Kom selaku dosen penguji 1.
4. Bapak Yulio Rahmadi, S.Kom selaku dosen penguji 2.
5. Para Dosen Fakultas Teknik Informatika, terima kasih atas semua ilmu yang telah diberikan.
6. Keluarga penulis yang telah memberikan do’a dan juga bantuan secara moril dan materil.
7. Teman-teman yang telah mendukung dan memberi semangat kepada penulis.
8. Serta pihak-pihak yang telah membantu dan tidak dapat penulis sebutkan satu persatu.
Penulis menyadari bahwa masih banyak kekurangan dan kelemahan dalam penyusunan skripsi ini. Oleh karena itu, kami mengharapkan kritik dan saran yang membangun dan menambah wawasan dan wacana ilmu kami.
Akhir kata penulis berharap kerangka acuan skripsi ini dapat memberikan wawasan dan pengetahuan kepada para pembaca pada umumnya dan pada penulis pada khususnya.
Jember, 21 Januari 2014
Penulis
viii
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN JENIS PRODUK DI SWALAYAN LARISSO DI AMBULU – JEMBER
1. Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRAK
Swalayan adalah salah satu tempat berbelanja yang dapat memberikan kenyamanan, kebersihan, kecepatan dan kerapian produk untuk konsumennya. Banyak konsumen yang lebih memilih berbelanja di swalayan daripada di pasar tradisional karena swalayan dapat memberikan kenyamanan dan kerapian produknya, akan tetapi tidak sedikit dari konsumen yang mengeluhkan masalah tata letak produk yang ada di swalayan.
Penentuan tata letak produk pada swalayan merupakan hal penting yang harus diperhatikan oleh pihak manajemen swalayan. Pada tugas akhir ini akan dijelaskan bagaimana implementasi algoritma k-means clustering berdasarkan kebiasaan konsumen berbelanja untuk menghasilkan suatu model tata letak merk produk berdasarkan jenis produknya.
Penelitian ini menggunakan data yang diperoleh dari struk-struk belanja pada swalayan larisso di Ambulu - Jember. Algoritma k-means clustering digunakan untuk mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok lain. Hasil dari penelitian ini menghasilkan sebuah model tata letak merk produk berdasarkan jenis produknya yang dapat memudahkan konsumen dalam mendapatkan barang yang dibutuhkan.
Kata Kunci: tata letak merk produk ; algoritma k-means clustering.
ix
IMPLEMENTATION OF K-MEANS CLUSTERING ALGORITHM TO DETERMINE THE LAYOUT OF THE BRANDS PRODUCT BY TYPES PRODUCT IN LARISSO SUPERMARKET AMBULU JEMBER
1. Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRACT
Supermarket is one place that can provide comfort, cleanliness, speed and neatness of products for consumers. Many consumers who prefer to shop in supermarkets than in traditional markets because supermarkets can provide comfort and neatness of its products, but not a bit of consumers who complained about the layout of the existing products in supermarkets.
Determining the layout of the product at the supermarket is an important thing that must be considered by the management of self-service. In this final project will be explained how the implementation of k-means clustering algorithm based on consumer shopping habits to generate a model layout of the brands products by type product.
This study uses data obtained from the receipt at the larisso supermarket in Ambulu - Jember. K-means clustering algorithm is used to partition the data into clusters so that the data which have similar characteristics are grouped into the same cluster and the data that have different characteristics are grouped into another group. The results of this study resulted in a model of the brands products layout based on the types of products that can enable customers to obtain needed goods.
Keywords: brands product layout; k-means clustering algorithm.
x
D
DAAFFTTAARR IISSII
Halaman
HALAMAN SAMPUL ... i
HALAMAN PENGESAHAN ... iii
PERNYATAAN ... iv
PERSEMBAHAN ... v
MOTTO ... vi
KATA PENGANTAR ... vii
ABSTRAK ... viii
ABSTRACT ... ix
DAFTAR ISI ... x
DAFTAR GAMBAR ... xii
DAFTAR TABEL... xiv
DAFTAR LAMPIRAN ... xvi
BAB 1. PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Perumusan Masalah ... 2
1.3 Batasan Masalah ... 2
1.4 Tujuan Penelitian ... 2
1.5 Manfaat Penelitian ... 2
BAB 2. TINJAUAN PUSTAKA ... 3
2.1 Definisi Swalayan ... 3
2.2 Profil Swalayan Larisso Ambulu ... 3
2.3 Tata Letak ... 5
2.4 Data Mining ... 6
2.4.1 Tahapan Data Mining ... 8
2.4.2 Pengelompokan Data Mining... 9
2.5 Clustering ... 12
2.5.1 Partitioning Clustering ... 14
2.6 Algoritma K-Means ... 15
2.7 Microsoft Visual Basic.Net ... 16
xi
BAB 3. METODOLOGI PENELITIAN ... 18
3.1 Data Yang Digunakan ... 18
3.2 Praproses Data ... 18
3.2.1 Penentuan Kelompok Jenis Produk... 18
3.2.2 Penentuan Kelompok Berdasarkan Record ... 20
3.3 Cleaning Data ... 24
3.4 Uji Coba Dengan Algoritma K-Means Clustering ... 26
3.4.1 Perhitungan Jarak Berdasarkan Parameter Produk ... 30
3.4.2 Pengelompokkan Jarak Terkecil atau Minimum ... 38
3.5 Perancangan Antar Muka Sistem ... 42
3.5.1 Perancangan Flowchart Sistem ... 42
3.5.2 Perancangan Tampilan Sistem... 44
BAB 4. HASIL DAN PEMBAHASAN ... 46
4.1 Spesifikasi Sistem ... 46
4.2 Implementasi Sistem ... 46
4.2.1 Pengujian Sistem... 47
4.2.2 Hasil Clustering ... 69
4.2.3 Denah Tata Letak Awal dan Setelah Clustering ... 71
BAB 5. KESIMPULAN DAN SARAN ... 74
5.1 Kesimpulan ... 74
5.2 Saran ... 74
DAFTAR PUSTAKA ... 75
xii
D
DAAFFTTAARR GGAAMMBBAARR
HHaallaammaann
2.1 Struktur Organisasi Swalayan Larisso Ambulu ... 4
2.2 Kajian Umum Data Mining ... 7
2.3 Tahapan Data Mning ... 8
3.1 Contoh Struk Belanja ... 19
3.2 Flowchart Sistem... 43
3.3 Tampilan Praposes Data ... 44
3.4 Tampilan Proses K-Means... 44
3.5 Tampilan Hasil ... 45
3.6 Tampilan Sorting Kelompok ... 45
4.1 Tampilan Proses K-Means Parameter Produk Makanan Ringan... 47
4.2 Tampilan Hasil Pengujian Parameter Produk Makanan Ringan ... 48
4.3 Tampilan Hasil Sorting Kelompok Parameter Produk Makanan Ringan... 49
4.4 Tampilan Proses K-Means Parameter Produk Minuman ... 50
4.5 Tampilan Hasil Pengujian Parameter Produk Minuman ... 51
4.6 Tampilan Hasil Sorting Kelompok Parameter Produk Minuman ... 51
4.7 Tampilan Proses K-Means Parameter Produk Buah-buahan ... 52
4.8 Tampilan Hasil Pengujian Parameter Produk Buah-buahan ... 53
4.9 Tampilan Hasil Sorting Kelompok Parameter Produk Buah-buahan ... 54
4.10 Tampilan Proses K-Means Parameter Produk Perawatan ... 55
4.11 Tampilan Hasil Pengujian Parameter Produk Perawatan ... 56
4.12 Tampilan Hasil Sorting Kelompok Parameter Produk Perawatan ... 56
4.13 Tampilan Proses K-Means Parameter Produk Bahan Dapur ... 57
4.14 Tampilan Hasil Pengujian Parameter Produk Bahan Dapur ... 58
4.15 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Dapur ... 59
4.16 Tampilan Proses K-Means Parameter Produk Bahan Makanan ... 60
4.17 Tampilan Hasil Pengujian Parameter Produk Bahan Makanan ... 61
4.18 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Makanan .. 61
4.19 Tampilan Hasil Proses K-Means Produk Perlengkapan ... 62
4.20 Tampilan Hasil Pengujian Parameter Produk Perlengkapan ... 63
xiii
4.21 Tampilan Hasil Sorting Kelompok Parameter Produk Perlengkapan ... 64
4.22 Tampilan Proses K-Means Parameter Produk Obat-obatan ... 65
4.23 Tampilan Hasil Pengujian Parameter Produk Obat-obatan ... 66
4.24 Tampilan Hasil Sorting Kelompok Parameter Produk Obat-obatan ... 66
4.25 Tampilan Proses K-Means Parameter Produk Rokok ... 67
4.26 Tampilan Hasil Pengujian Parameter Produk Rokok ... 68
4.27 Tampilan Hasil Sorting Kelompok Parameter Produk Rokok... 69
4.28 Denah Tata Letak Awal Produk ... 71
4.29 Denah Tata Letak Merk Produk Setelah Clustering ... 71
xiv
D
DAAFFTTAARR TTAABBEELL
HHaallaammaann
3.1 Dataset Merk Produk ... 21
3.2 Dataset Penentuan Jenis Produk ... 24
3.3 Dataset Yang Telah di Cleaning ... 26
3.4 Centroid Produk Makanan Ringan ... 27
3.5 Centroid Produk Minuman ... 27
3.6 Centroid Produk Buah-buahan ... 27
3.7 Centroid Produk Perawatan ... 28
3.8 Centroid Produk Bahan Dapur ... 28
3.9 Centroid Produk Bahan Makanan ... 28
3.10 Centroid Produk Perlengkapan ... 29
3.11 Centroid Produk Obat-obatan ... 29
3.12 Centroid Produk Rokok... 29
3.13 Hasil Penghitungan Jarak Dengan Paramater Produk Makanan Ringan Masing-Masing cluster... 30
3.14 Hasil Penghitungan Jarak Dengan Paramater Produk Minuman Masing-Masing cluster... 31
3.15 Hasil Penghitungan Jarak Dengan Paramater Produk Buah-buahan Masing-Masing cluster... 32
3.16 Hasil Penghitungan Jarak Dengan Paramater Produk Perawatan Masing-Masing cluster... 33
3.17 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Dapur Masing-Masing cluster... 34
3.18 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Makanan Masing-Masing cluster... 35
3.19 Hasil Penghitungan Jarak Dengan Paramater Produk Perlengkapan Masing-Masing cluster... 36
3.20 Hasil Penghitungan Jarak Dengan Paramater Produk Obat-obatan Masing-Masing cluster... 37 3.21 Hasil Penghitungan Jarak Dengan Paramater Produk Rokok
xv
Masing-Masing cluster... 38
3.22 Anggota Data Masing-Masing Cluster Produk Makanan Ringan ... 38
3.23 Anggota Data Masing-Masing Cluster Produk Minuman ... 39
3.24 Anggota Data Masing-Masing Cluster Produk Buah-buahan ... 39
3.25 Anggota Data Masing-Masing Cluster Produk Perawatan ... 40
3.26 Anggota Data Masing-Masing Cluster Produk Bahan Dapur ... 40
3.27 Anggota Data Masing-Masing Cluster Produk Bahan Makanan ... 41
3.28 Anggota Data Masing-Masing Cluster Produk Perlengkapan ... 41
3.29 Anggota Data Masing-Masing Cluster Produk Obat-obatan ... 42
3.30 Anggota Data Masing-Masing Cluster Produk Rokok ... 42
4.1 Hasil Clustering ... 70
xvi
D
DAAFFTTAARR LLAAMMPPIIRRAANN
HHaallaammaann Biodata Penulis ... 77
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Seiring dengan pertumbuhan ekonomi Indonesia yang maju dan berkembang pesat khususnya di kota besar maupun kota kecil, telah terjadi perubahan diberbagai sektor, termasuk dibidang industri dan produksi serta pada kegiatan eceran di Indonesia yang telah berkembang menjadi usaha yang berskala besar. Perkembangan bisnis eceran yang pesat ini tidak lepas dari faktor meningkatnya jumlah penduduk Indonesia dan juga meningkatkan jumlah pendapatan perkapita penduduk Indonesia yang menyebabkan taraf hidup masyarakat Indonesia semakin meningkat. Hal ini membawa dampak kepada pola perilaku belanja seseorang, dimana semakin meningkatnya taraf hidup seseorang maka tuntutan akan tempat berbelanja yang nyaman dan dapat menyediakan segala kebutuhan konsumen dalam satu lokasi semakin dibutuhkan. Swalayan adalah salah satu tempat berbelanja yang dapat memberikan kenyamanan, kebersihan, kecepatan dan kerapian produk untuk konsumennya.
Banyak konsumen yang lebih memilih berbelanja di swalayan daripada di pasar tradisional, alasannya swalayan dapat memberikan kenyamanan dan kerapian dalam berbelanja. Namun tidak sedikit dari para konsumen yang mengeluhkan tentang kerapian merk produk pada swalayan, dimana tata letak merk produknya tidak strategis dan tepat, sehingga membuat konsumen sulit untuk mendapatkan merk produk yang mereka butuhkan, juga akan menghabiskan waktu yang cukup lama hanya untuk menemukan merk produk tersebut. Tata letak merk produk yang strategis dan tepat dalam penataanya akan lebih mudah dijangkau oleh konsumen dan tidak akan menghabiskan waktu. Untuk itu perlu dibuat sebuah sistem yang dapat menentukan pola tata letak merk produk pada swalayan, yaitu dengan dibuatnya suatu teknik clustering.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah clustering K-Means (Santosa, 2007). K-Means merupakan salah satu metode data clustering non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007).
2
Berdasarkan uraian diatas, penulis berkeinginan untuk membuat suatu implementasi algoritma K-Means Clustering untuk menentukan tata letak merk produk berdasarkan jenis produk di swalayan Larisso Ambulu - Jember.
1.2 Perumusan Masalah
Berdasarkan uraian diatas, perumusan masalah dalam Tugas Akhir ini, yaitu bagaimana mengimplementasikan algoritma K-Means Clustering untuk menentukan tata letak merk produk berdasarkan jenis produk di swalayan Larisso Ambulu – Jember.
1.3 Batasan Masalah
Batasan masalah dari Tugas Akhir yang berjudul Implementasi algoritma K-Means Clustering untuk menetukan tata letak merk produk berdasarkan jenis produk di swalayan Larissso Ambulu - Jember , antara lain :
1. Data yang dianalisis adalah data struk, berisi merk produk yang diperoleh dari swalayan Larisso di Ambulu – Jember dari bulan Januari - September 2014.
2. Algoritma yang digunakan adalah algortima K-Means Clustering.
3. Perancangan program menggunakan bahasa pemrograman VB.NET.
1.4 Tujuan Penelitian
Tujuan dari Tugas Akhir ini adalah :
1. Membuat sebuah model untuk menentukan tata letak merk produk berdasarkan jenis produk pada swalayan.
2. Menerapkan K-Means Clustering dalam menentukan tata letak merk produk berdasarkan jenis produk pada swalayan.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah didapatkan sebuah model tata letak merk produk berdasarkan jenis produk di swalayan Larisso Ambulu – Jember yang dapat memudahkan
3
bagi konsumen dalam menemukan merk produk yang dibutuhkan sehingga tidak membutuhkan waktu lama untuk mencarinya
4
BAB II
TINJAUAN PUSTAKA
2.1 Defenisi Swalayan
Supermarket atau pasar swalayan menurut Marwan Asri (1991 : 289) adalah salah satu bentuk usaha eceran yang menyediakan beraneka macam kebutuhan konsumen. Satu Supermarket mungkin menjual pakaian wanita, pria, anak-anak, alat rumah tangga, alat olah raga, perhiasan serta alat rumah tangga lainnya dan alat tulis.
Swalayan adalah sebuah toko yang menjual segala kebutuhan sehari-hari. Barang- barang yang dijual di swalayan biasanya adalah barang-barang kebutuhan sehari-hari. Seperti bahan makanan, minuman dan barang kebutuhan seperti tissue dan sebagainya.
Biasanya setelah berbelanja di swalayan, konsumen akan menerima struk belanjaan dari pihak swalayan. Struk belanja digunakan oleh swalayan untuk diberikan kepada konsumen seberapa banyak produk yang dibeli serta jumlah harga produk per unitnya serta total dari keseluruhannya. Struk belanja ini juga merupakan bukti transaksi konsumen kepada swalayan terhadap produk-produk apa saja yang telah dibeli.
2.2 Profil Swalayan Larisso Ambulu
Ambulu adalah sebuah kecamatan di Kabupaten Jember, Provinsi Jawa Timur, Indonesia. Wilayah selatan kecamatan ini berbatasan dengan Samudra Hindia. Kecamatan Ambulu mempunyai luas wilayah 104,56 km2 dengan ketinggian rata-rata 18 m dari atas permukaan laut.
Di kecamatan Ambulu terdapat salah satu pusat perbelanjaan/swalayan yang menjadi tempat favorit masyarakat sekitar maupun masyarakat dari luar kecamatan untuk berbelanja, yaitu Swalayan Larisso yang berlokasi di Jl. Watu Ulo no.21 Ambulu, sekitar ± 30 km atau 30 menit dari pusat kota Jember. Swalayan ini didirikan pertengahan tahun 2010, dan sekarang ini telah berkembang pesat karena merupakan satu-satunya tempat perbelanjaan yang memiliki harga relatif murah dibanding dengan supermarket lainnya. Di Swalayan ini menyediakan berbagai macam kebutuhan konsumen mulai dari bahan makanan, minuman dan
5
bahan kebutuhan lainnya, dimana pembeli mengambil sendiri barang yang dibutuhkan dari rak-rak yang disediakan dan nantinya membayar dikasir dan akan mendapatkan struk belanja.
Di Swalayan Larisso Ambulu memiliki ± 70 Karyawan yang terdiri dari supervisor, bagian keuangan, personalia, dan bagian gudang. Untuk Jam kerja di Swalayan Larisso yaitu setiap hari senin – minggu mulai pukul 09.00 – 21.00.
Struktur organisasi di Swalayan Larisso Ambulu – Jember dapat digambarkan sebagai berikut:
Gambar 2.1 Struktur Organisasi Swalayan Larisso Ambulu Jobdesk masing – masing bagian yaitu :
1. Direktur : Bertugas memimpin dan menjalankan Swalayan, mengangkat dan memberhentikan karyawan, serta bertanggung jawab terhadap keuntungan dan kerugian perusahaan.
2. Supervisor Swalayan : Bertugas mengatur kerjanya para bawahannya, membuat job desk para bawahanya (staf), bertanggung jawab atas hasil kerja bawahanya (staf), memberi motivasi ke bawahanya (staf), memberikan breafing, serta membuat rencana pekerjaan untuk kedepannya yaitu rencana kerja harian,mingguan,bulanan,dan tahunan.
3. Junior Supervisor : Mengawasi, mengarahkan dan membimbing seluruh divisi / bagian yang menjadi tanggung jawabnya agar dapat melaksanakan tugas dengan baik.
6
4. Pramuniaga : Melakukan kelancaran operasional counter seperti display barang, mengisi barang yang telah kosong ataupun barang yang baru, dan menjaga kebersihan area kerja, kebersihan dan kerapian barang.
5. Manajer Keuangan : Bertugas mengelola keuangan swalayan (penerimaan dan pengeluaran keuangan) seperti penggajian karyawan.
6. Staf Administrasi : Melakukan kegiatan yang berhubungan dengan kegiatan administrasi.
7. Kepala Kasir : Memonitoring kegiatan kasir setiap harinya dan membuat laporan keuangan.
8. Kasir : Melayani pembayaran konsumen setiap hari dan bertanggung jawab terhadap uang setoran.
9. Personalia / umum : Melakukan kegiatan umum seperti mencatat kehadiran dan lembur kerja karyawan, menyediakan dan mengatur jumlah tenaga kerja yang dibutuhkan swalayan.
10. Divisi Teknik / Maintenence : Bertanggung jawab terhadap kelancaran operasional swalayan.
11. Satpam : Bertugas menjaga keamanan swalayan.
12. Cleaning Service : Bertugas membersihkan seluruh ruangan yang ada di swalayan.
13. Kepala Gudang : Menerima barang baik dari supplier, mengecek jumlah barang yang dikirim dan disesuaikan dengan dokumen, mengecek kebersihan dan keamanan barang yang ada, dan mengeluarkan barang yang dibutuhkan oleh swalayan.
14. Staf Bag.EDP : Bertugas mengawasi dan melakukan kegiatan Electronic Data Processing yaitu memasukkan atau menginput data barang-barang baru dan perubahan harga, memasukkan data jadwal promosi berkaitan dengan barang yang dijual, serta merapikan ulang data yang ada dikomputer.
2.3 Tata Letak
Tata letak adalah suatu rancangan fasilitas, menganalisis, membentuk konsep, dan mewujudkan sistem pembuatan barang atau jasa. Rancangan ini pada umumnya digambarkan sebagai rancangan lantai, yaitu satu susunan fasilitas fisik (perlengkapan, tanah, bangunan, dan sarana lain) untuk mengoptimalkan hubungan antara petugas pelaksana, aliran barang,
7
aliran informasi, dan tata cara yang diperlukan untuk mencapai tujuan usaha secara ekonomis dan aman.
Tata letak merupakan satu keputusan penting yang menentukan efisiensi sebuah operasi dalam jangka panjang. Tata letak memiliki banyak dampak strategis karena tata letak menentukan daya saing perusahaan dalam kapasitas, proses, fleksibilitas, dan biaya, serta kualitas lingkungan kerja, kontak pelangga, dan citra perusahaan. Tata letak yang efektif dapat membantu organisasi mencapai sebuah strategi yang menunjang diferensiasi, biaya rendah, atau respon cepat. Tujuan strategi tata letak adalah untuk membangun tata letak yang ekonomis yang memenuhi kebutuhan persaingan perusahaan.
2.4 Data Mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Dengan arti lain data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Data mining telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh- contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam
8
situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali, selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur data mining dalam penerapannya antara lain: clustering, classification, association rule mining, neural network, genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap data mining adalah
perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum populernya data mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual (Moertini, 2002). Secara umum data mining memiliki beberapa kajian. Seperti yang dapat dilihat pada Gambar 2.2, data mining merupakan pusat dari beberapa kajian. Diantaranya adalah estimasi, seleksi variabel, clustering, visualisasi, market basket analysis dan klasifikasi. Semua kajian tersebut termasuk ke dalam data mining.
Gambar 2.2 Kajian Umum Data Mining ( Sumber : Santosa 2007 )
Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar (Larose, 2005).
Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecendrungan yang penting yang biasanya tidak disadari keberadaannya (Moertini, 2002). Hal-hal penting yang terkait dengan data mining adalah (Luthfi & Kusrini, 2009):
9
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih objek dalam satu dimensi yang sama. Misalnya dalam dimensi produk dapat melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat dilihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001). Masalah- masalah yang sesuai untuk diselesaikan dengan teknik data mining dapat dicirikan dengan (Piatetsky & Shapiro, 2006):
1. Memerlukan keputusan yang bersifat knowledge-based.
2. Mempunyai lingkungan yang berubah.
3. Metode yang ada sekarang bersifat sub-optimal.
4. Tersedia data yang bisa diakses, cukup dan relevan.
5. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat.
Kata mining mempunyai arti yaitu usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelegent), machine learning, statistik dan database.
Beberapa metode yang sering disebut-sebut dalam literatur data mining antara lain clustering, classification, association rules mining, neural network, genetic algorithm dan lain-lain (Moertini, 2002).
2.4.1 Tahapan Data Mining
Di dalam tahapan data mining, data yang ada, tidak dapat langsung diolah dengan menggunakan sistem data mining. Data tersebut harus dipersiapkan terlebih dahulu agar hasil yang diperoleh dapat lebih maksimal, dan waktu komputasinya lebih minimal. Proses persiapan data ini sendiri dapat mencapai 60 % dari keseluruhan proses dalam data mining.
Proses data mining secara garis besar terdiri dari 5 tahapan yaitu data selection, pre- processing/cleaning, transformation, data mining dan interpretation/evaluation. Proses data mining digambarkan pada Gambar 2.3 berikut:
10
Gambar 2.3 Tahapan Data Mining (Sumber : Fayyad 1996)
Berikut ini merupakan tahapan dari proses data mining (Fayyad, 1996):
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk data mining, seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam data mining merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam
11
data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses data mining secara keseluruhan.
5. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses data mining yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
2.4.2 Pengelompokan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Larose, 2005):
1. Deskripsi
Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
12
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian adalah:
1. Prediksi harga beras dalam tiga bulan yang akan datang.
2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Cluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam cluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok- kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah:
13
1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.
3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik dan mencurigakan.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah :
1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons positif terhadap penawaran upgrade layanan yang diberikan.
2.5 Clustering
Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang lain.
Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering.
Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada.
Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan pendekatan automatic mapping (Self – Organising Map/SOM).
14
Clustering (pengelompokan data) mempertimbangkan sebuah pendekatan penting untuk mencari kesamaan dalam data dan menempatkan data yang sama ke dalam kelompok- kelompok. Clustering membagi kumpulan data ke dalam beberapa kelompok dimana kesamaan dalam sebuah kelompok adalah lebih besar daripada diantara kelompok-kelompok yang lain (Rui Xu & Donald 2009). Gagasan mengenai pengelompokan data, atau clustering, memiliki sifat yang sederhana dan dekat dengan cara berpikir manusia kapanpun kepada kita dipresentasikan jumlah data yang besar, kita biasanya cenderung merangkumkan jumlah data yang besar ini ke dalam sejumlah kecil kelompok-kelompok atau kategori-kategori untuk memfasilitasi analisanya lebih lanjut. Selain dari itu, sebagian besar data yang dikumpulkan dalam banyak masalah terlihat memiliki beberapa sifat yang melekat yang mengalami pengelompokan-pengelompokan natural (Hammouda & Karray, 2003).
Namun demikian, penemuan pengelompokan-pengelompokan ini atau upaya untuk mengkategorikan data adalah bukan sebuah tugas yang sederhana bagi manusia kecuali data memiliki dimensionalitas rendah (dua atau tiga dimensi paling banyak). Inilah sebabnya mengapa beberapa metode dalam soft computing telah dikemukakan untuk menyelesaikan jenis masalah ini. Metode ini disebut “Metode-Metode Pengelompokan Data” (Hammouda &
Karray, 2003).
Algoritma-algoritma clustering digunakan secara ekstensif tidak hanya untuk mengorganisasikan dan mengkategorikan data, akan tetapi juga sangat bermanfaat untuk kompresi data dan konstruksi model. Melalui pencarian kesamaan dalam data, seseorang dapat merepresentasikan data yang sama dengan lebih sedikit simbol. Dan juga, jika kita dapat menemukan kelompok-kelompok data, kita dapat membangun sebuah model masalah berdasarkan pengelompokan-pengelompokan ini (Dubes & Jain, 1988).
Clustering menunjuk pada pengelompokan record, observasi-observasi, atau kasus- kasus ke dalam kelas-kelas objek yang sama. Cluster adalah sekumpulan record yang sama dengan satu sama lain dan tidak sama dengan record dalam cluster lain. Clustering berbeda dari klasifikasi dimana tidak ada variabel target untuk clustering. Tugas clustering mencoba untuk tidak mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose, 2005). Bahkan, algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke dalam subkelompok-subkelompok atau cluster-cluster homogen secara relatif. Dimana kesamaan record dalam cluster dimaksimalkan dan kesamaan dengan record diluar cluster ini diminimalkan.
15
Clustering sering dilaksanakan sebagai langkah pendahuluan dalam proses pengumpulan data, dengan cluster-cluster yang dihasilkan digunakan sebagai input lebih lanjut ke dalam sebuah teknik yang berbeda, seperti neural network. Karena ukuran yang besar dari banyak database yang dipresentasikan saat ini, dapat membantu untuk menggunakan analisa clustering terlebih dahulu, untuk mengurangi ruang pencarian untuk algoritma-algoritma downstream. Aktivitas clustering pola khusus meliputi langkah-langkah berikut (Dubes & Jain, 1988) :
1. Representasi pola (secara opsional termasuk ekstraksi dan/atau seleksi sifat.
2. Defenisi ukuran kedekatan pola yang tepat untuk domain data.
3. Clustering pengelompokan.
4. Penarikan data (jika dibutuhkan).
5. Pengkajian output (jika dibutuhkan).
Representasi pola merujuk pada jumlah kelas, jumlah pola-pola yang ada, dan jumlah, tipe dan skala fitur yang tersedia untuk algoritma clustering. Beberapa informasi ini dapat tidak bisa dikontrol oleh praktisioner. Seleksi sifat (fitur) adalah proses pengidentifikasian subset fitur original yang paling efektif untuk digunakan dalam clustering. Ekstraksi fitur adalah penggunaan satu atau lebih transformasi dari sifat-sifat input untuk menghasilkan sifat- sifat baru yang lebih baik.
Secara garis besar, terdapat beberapa metode clustering data. Pemilihan metode clustering bergantung pada tipe data dan tujuan clustering itu sendiri. Metode-metode beserta algortima yang termasuk didalamnya adalah sebagai berikut:
1. Partitioning Methdos
Metode yang membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut dengan beberapa kriteria. Algoritma yang dipakai pada metode ini adalah K-Means, K- Medoid, PROCLUS, CLARA, CLARANS dan PAM.
2. Hierarchical Methods
Metode yang membuat suatu penguraian secara hierarchical dari himpunan data dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua jenis, yaitu Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE dan CHAMELEON.
16
3. Density-Based Methods
Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi algoritma DBSCAN, OPTICS dan DENCLU.
4. Grid-Based Methods
Metode ini berdasarkan suatu struktur granularitas multi-level. Metode clustering ini meliputi algoritma STING, WaveCluster dan CLIQUE.
5. Model-Based Methods
Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best fit dari model tersebut untuk masing-masing yang lain. Metode clustering ini meliputi pendekatan statistik, yaitu algoritma COBWEB dan jaringan syaraf tiruan SOM.
2.5.1 Partitioning Clustering
Partitioning Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Konsep dasar dari partitioning clustering adalah membagi n jumlah cluster ke dalam k cluster. Metode ini merupakan metode pengelompokan yang bertujuan mengelompokkan objek sehingga jarak antara setiap objek ke pusat kelompok di dalam satu kelompok adalah minimum.
Metode Pengelompokan :
Cluster adalah kumpulan data dimana jika objek data yang terletak didalam cluster harus memiliki kemiripan sedangkan yang tidak berada dalam suatu cluster tidak mempunyai kemiripan.
Jika ada n objek penelitian dengan p variabel maka sebelum dilakukan pengelompokan data atau objek terlebih dahulu menentukan ukuran kedekatan sifat antar data. Ukuran data yang bisa digunakan adalah jarak euclidius (euclidean distance), antara dua objek dari p dimensi pengamatan. Jika objek pertama yang diamati adalah 𝑥= 𝑥1 ,𝑥2,…,𝑥𝑝 dan 𝑦= 𝑦1 ,𝑦2,…,𝑦𝑝 maka rumus euclidean distance adalah sebagai berikut:
(2.1)
17
dimana:
d : distance
x : 𝑥1,𝑥2,𝑥3,…,𝑥𝑝 y : 𝑦1,𝑦2,𝑦3,…,𝑦𝑝
j : merepresentasikan nilai atribut p : dimensi data
2.6 Algoritma K-Means
K-Means (MacQueen, 1967) adalah salah satu dari algoritma unsupervised learning yang paling sederhana untuk menyelesaikan masalah clustering yang telah dikenal. Prosedur ini mengikuti cara sederhana dan mudah untuk mengklasifikasikan kumpulan data tertentu melalui jumlah cluster tertentu (menganggap k cluster) yang telah ditetapkan sebelumnya.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah clustering k-means (Santosa, 2007). K-Means merupakan salah satu metode data clustering non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007). Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalkan variasi antar cluster.
Pada dasarnya penggunaan algoritma dalam melakukan proses clustering tergantung dari data yang ada dan konklusi yang ingin dicapai. Untuk itu digunakan algoritma K-Means yang didalamnya memuat aturan sebagai berikut:
1. Jumlah cluster perlu diinputkan.
2. Hanya memiliki atribut bertipe numerik.
Untuk tahapannya, algoritma k-means memilih secara acak k buah data sebagai centroid. Kemudian, jarak antara data dan centroid dihitung dengan menggunakan Euclidean Distance. Data dikelompokkan dalam cluster yang terkecil / berdasarkan jarak minimum dihitung dari titik semua cluster.
18
Algoritma K-Means pada dasarnya melakukan dua proses, yaitu proses pendeteksian lokasi pusat tiap cluster dan proses pencarian anggota dari tiap-tiap cluster. Cara kerja algoritma K-Means:
1. Tentukan k sebagai jumlah cluster yang ingin dibentuk.
2. Bangkitkan k centroid (titik pusat cluster) secara random.
3. Hitung jarak setiap data ke masing-masing centroid.
4. Kelompokkan masing-masing objek ke dalam cluster berdasarkan jarak minimum.
2.7 Microsoft Visual Basic.NET
Microsoft Visual Basic. NET adalah sebuah alat untuk mengembangkan dan membangun aplikasi yang bergerak diatas sistem NET Framework, dengan menggunakan bahasa basic. Dengan menggunakan alat ini, para programmer dapat membangun aplikasi windows form, aplikasi web berbasis ASP.NET, dan juga aplikasi command-line.
Alat ini dapat diperoleh secara terpisah dari beberapa produk lainnya (seperti Microsoft Visual C++, Visual C#, atau Visual J#) atau juga dapat diperoleh secara terpadu dalam Microsoft Visual Studio.NET. Bahasa Visual Basic.NET sendiri menganut paradigma bahasa pemrograman berorientasi objek yang dapat dilihat sebagai evolusi dari Microsoft Visual Basic versi sebelumnya yang diimplementasikan diatas .NET Framework.
NET Framework adalah landasan kerja bagi aplikasi – aplikasi net yang dibuat dalam bahasa pemrograman berbasis net tanpa terpengaruh oleh bahasa pemrograman yang digunakan didalam NET Framework ini karena semua coding yang telah dikembangkan dalam programmer akan dieksekusi berdasarkan urutan-urutan proses bekerja yang saling melengkapi.
Komponen – komponen pada NET.Framework adalah : 1. Common Language Runtime
Merupakan jembatan antara aplikasi net dengan sistem operasi.
2. Microsoft Intermediate Language
Merupakan bahasa program yang tidak diterjemahkan langsung kedalam bahsa biner namun terlebih dahulu di terjemahkan kedalam bahasa Common Language Runtime
19
kemudian diterjemahkan kembali kedalam bahasa Microsoft Intermediate Language yang baru akhirnya menghasilkan bahasa biner yang siap dijalankan.
3. Just in Time Complier
Just in Time Complier hanya melakukan komplikasi kode yang hanya dibutuhkan saja sehingga lebih efisien.
4. Framework Class Library
Merupakan kumpulan class – class yang berjumlah ribuan didalam NET Framework.
Microsoft Visual Basic.NET terdiri dari 5 komponen utama yang tersusun dalam tiga lapisan (layer) yaitu :
1. Visual Studio.NET
Microsoft Visual Studio.NET merupakan kumpulan perkembangan tools untuk membangun aplikasi Web ASP, Xml Web Service, Aplikasi desktop dan Aplikasi Mobile.
Pada Aplikasi Visual Studio.NET ini bahasa-bahsa pemrograman yang digunakan seperti Visual Basic, Visual C ++, dan Visual C.
2. Visual Basic.NET (VB NET)
Merupakan salah satu bahasa pemrograman yang bisa digunakan untuk membangun aplikasi – apliaksi NET di Platform.
3. IDE Visual Basic
IDE (Integrated Development Environment) adalah perangkat lunak komputer yang berfungsi untuk membantu pemrograman dalam mengembangkan perangkat lunak (tools pendukung).
20
BAB III
METODOLOGI PENELITIAN
3.1 Data yang Digunakan
Pada penelitian ini data yang digunakan adalah dataset yang bertipe record, berupa data struk belanja yang berisi merk produk pada swalayan Larisso di Ambulu – Jember yang diperoleh mulai bulan Januari s/d September 2014. Data awal yang didapat yaitu berupa data mentah sebanyak 16 struk belanja (120 dataset). Pada Gambar 3.1 dapat dilihat salah satu contoh dari struk belanja. Data mentah tersebut akan diubah kedalam bentuk record yang akan menjadi dataset sebanyak 16 record. Dataset ini terdiri dari 7 atribut. Adapun atribut-atribut yang dimaksud yaitu kode produk, nama produk, jumlah produk, harga produk, total harga, tunai dan kembalian. Seluruh atribut pada dataset selanjutnya akan diseleksi pada tahapan praproses data.
3.2 Praproses Data
Tahap praproses data merupakan tahap seleksi data yang bertujuan untuk mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Tahapan yang dikerjakan adalah menentukan kelompok jenis produk dan menentukan kelompok berdasarkan record dengan tujuan untuk mempermudah pemahaman terhadap isi record. Dan juga melakukan seleksi dengan memperhatikan konsistensi data, missing value dan redundant data.
3.2.1 Penentuan Kelompok Jenis Produk
Seperti yang dapat dilihat pada Gambar 3.1, terdapat beberapa atribut yaitu kode produk, nama produk, jumlah produk, harga produk, total harga, tunai dan kembalian. Dari semua atribut tersebut hanya beberapa yang akan digunakan dan dianggap cukup memenuhi untuk dilakukannya penelitian. Adapun atribut tersebut yaitu nama produk dan jumlah produk.
21
Gambar 3.1 Contoh Struk Belanja
Pada swalayan banyak sekali terdapat nama-nama produk ataupun merk-merk produk yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan jenis- jenisnya. Adapun pengelompokkan jenis produk sebagai berikut:
1. Makanan Ringan
Disini semua jenis makanan ringan seperti Salt Chesee, Krupuk, Permen, Koko Krunch, Oreo dan lain-lain akan dikelompokkan ke dalam atribut makanan ringan.
2. Minuman
Semua jenis minuman mulai dari minuman botol, minuman kaleng, sirup dan juga termasuk semua jenis susu dikelompokkan ke dalam atribut minuman.
3. Buah-buahan
Atribut ini berisi semua jenis buah-buahan.
22
4. Perawatan
Yang termasuk pada atribut ini yaitu perawatan rambut seperti shampoo, conditioner, vitamin rambut dan lain-lain. Perawatan kulit seperti lotion, lulur, dan lain-lain.
Perawatan mandi atau peralatan mandi seperti sabun, sikat gigi, pasta gigi dan lain-lain.
5. Bahan Dapur
Bahan dapur seperti semua jenis indomie. Bumbu-bumbu dapur seperti kecap, saos/sambal, merica, sasa, sajiku nasigoreng, gula, garam dan lain-lain dikelompokkan ke dalam atribut bahan dapur.
6. Bahan Makanan
Semua jenis bahan makanan mulai dari sayur-sayuran, ayam, sarden, ikan, nugget dan juga sossis termasuk ke dalam atribut bahan makanan.
7. Perlengkapan
Jenis produk yang termasuk pada atribut ini seperti pewangi baju, pewangi lantai, sabun pencuci piring, pengharum ruangan, baygon dan lain-lain.
8. Obat-obatan
Segala jenis obat-obatan termasuk ke dalam atribut ini.
9. Rokok
Pada atribut ini berisi semua jenis rokok.
3.2.2 Penentuan Kelompok Berdasarkan Record
Tahap selanjutnya adalah mengubah data mentah (struk belanja) menjadi dataset yang berisikan semua merk produk barang yang dibeli dalam bentuk record. Semua data mentah merk produk barang sebanyak 16 struk belanja (120 dataset) dimasukkan dengan jumlahnya dan kemudian dikelompokkan berdasarkan jenis produknya sehingga hasilnya dapat dilihat pada Tabel 3.1 dan Tabel 3.2 berikut :
23
Tabel 3.1 Dataset Merk Produk
NO STRUK MERK PRODUK JUMLAH
1 Struk 1 Gula 6
2 Struk 1 Aqua Botol 1
3 Struk 1 Pocari Sweat 900 ML 1
4 Struk 1 Pocari Sweat 500 ML 1
5 Struk 1 Sprite 2
6 Struk 1 Frestea Botol 1
7 Struk 1 Salt Cheese 1
8 Struk 1 Kecap Bango 1
9 Struk 1 Hello Krupuk 1
10 Struk 1 Hello Stick Tahu 1
11 Struk 1 Butter Keju 1
12 Struk 1 Yupi Gummy 1
13 Struk 1 Sasa Tepung 1
14 Struk 1 Royco Bumbu Tempe 2
15 Struk 1 Laurier Maxi 1
16 Struk 1 Royco Bumbu Ayam 1
17 Struk 1 Antimo Cair 4
18 Struk 1 Tissue 1
19 Struk 1 Butter Coconut 1
20 Struk 1 Master Kids 1
21 Struk 1 Laurier Maxi 1
22 Struk 1 Hers Protex 1
23 Struk 2 Zee Susu Bag 1
24 Struk 2 Zee Susu Sachet 10
25 Struk 3 Hers Protex 1
26 Struk 3 Tepung Vergo 1
27 Struk 3 Laurier Maxi 1
28 Struk 3 Royco Bumbu Ayam 2
29 Struk 3 Sajiku Nasgor 2
30 Struk 3 Baby Shampoo 1
31 Struk 3 Clear Shampoo 1
32 Struk 4 Koko Krunch 1
33 Struk 4 Handbody Marina 1
34 Struk 5 Susu Milo 1
35 Struk 5 Softener 1
36 Struk 5 Zee Susu Bag 2
24
37 Struk 5 Oreo 1
38 Struk 5 Gery Saluut 1
39 Struk 5 Nissin Wafer 1
40 Struk 5 Beng-beng 1
41 Struk 5 Fenesia Wafer 1
42 Struk 5 Molto 2
43 Struk 5 Lifebuoy 1
44 Struk 5 Pepsodent 1
45 Struk 5 Lux 1
46 Struk 6 Kecap Bango 1
47 Struk 6 Zee Susu Bag 2
48 Struk 6 Zee Susu Bag 2
49 Struk 6 Royco Bumbu Ayam 2
50 Struk 6 Pucelle 1
51 Struk 6 Pepsodent 1
52 Struk 6 Pepsodent 1
53 Struk 7 Kayu Putih 2
54 Struk 7 Susu Milo 3
55 Struk 7 Wismilak 3
56 Struk 7 ABC Saos 2
57 Struk 7 ABC Sambal 1
58 Struk 7 Champ Seafood 1
59 Struk 8 Gula 2
60 Struk 8 Champ Sosis 1
61 Struk 8 Fenesia Wafer 1
62 Struk 8 Sarimie Goreng 5
63 Struk 8 Indomie Goreng 1
64 Struk 8 Sasa Tepung 1
65 Struk 8 Yupi Gummy 1
66 Struk 9 Laurier Maxi 1
67 Struk 9 Oreo 1
68 Struk 9 Nutrijel 1
69 Struk 9 Agarasa 2
70 Struk 10 Kayu Putih 2
71 Struk 10 Gula 2
72 Struk 10 Malkis Abon 1
73 Struk 10 Melon 1
74 Struk 10 ABC Sambal 1
25
75 Struk 10 Handbody Marina 2
76 Struk 11 Apel 10
77 Struk 11 Lifebuoy 3
78 Struk 11 G-Mild 1
79 Struk 11 Top Kopi 48
80 Struk 11 Mama Lemon 2
81 Struk 11 Jeruk 5
82 Struk 11 Dji Sam Soe 2
83 Struk 12 Strowbery 35
84 Struk 12 G-Mild 6
85 Struk 12 Nissin Wafer 10
86 Struk 12 Mizone 25
87 Struk 12 Apel 25
88 Struk 12 Anggur 35
89 Struk 12 Nivea 30
90 Struk 12 Indomie Goreng 43
91 Struk 12 Mama Lemon 19
92 Struk 13 Sunlight 10
93 Struk 13 So Nice 10
94 Struk 13 Baygon 10
95 Struk 13 Mixagrip 8
96 Struk 13 Casablanca Parfum 52
97 Struk 13 Beng-beng 97
98 Struk 13 Susu Milo 10
99 Struk 13 Jeruk 10
100 Struk 13 Nuvo 8
101 Struk 14 Apel 6
102 Struk 14 Kelengkeng 10
103 Struk 14 Indomie Goreng 20
104 Struk 14 Nugget 5
105 Struk 14 Panadol 23
106 Struk 14 Lux 12
107 Struk 14 Djarum 17
108 Struk 15 Koyo Cabe 5
109 Struk 15 Djarum 10
110 Struk 15 Konimex 13
111 Struk 15 Superpel 19
112 Struk 15 Stella 29
26
113 Struk 15 Melon 10
114 Struk 16 Energen 2
115 Struk 16 Promild 5
116 Struk 16 Sarden 8
117 Struk 16 Lifebuoy 7
118 Struk 16 Bodrex 16
119 Struk 16 Belimbing 29
120 Struk 16 Royco Bumbu Ayam 15
Tabel 3.2 Dataset Penentuan Jenis Produk
No
Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat- obatan
Rokok
1 Struk 1 6 8 0 1 11 0 4 4 0
2 Struk 2 0 11 0 0 0 0 0 0 0
3 Struk 3 0 0 0 2 5 0 2 0 0
4 Struk 4 1 0 0 1 0 0 0 0 0
5 Struk 5 5 3 0 3 0 0 3 0 0
6 Struk 6 0 4 0 3 3 0 0 0 0
7 Struk 7 0 3 0 0 3 1 2 0 3
8 Struk 8 2 0 0 0 9 1 0 0 0
9 Struk 9 1 0 0 0 3 0 1 0 0
10 Struk 10 1 0 1 2 3 0 2 0 0
11 Struk 11 0 48 15 3 0 0 2 0 4
12 Struk 12 10 25 95 30 43 0 19 0 12
13 Struk 13 97 10 10 60 0 10 20 8 0
14 Struk 14 0 0 16 12 20 5 0 23 17
15 Struk 15 0 0 10 0 0 0 48 18 10
16 Struk 16 0 2 29 7 15 8 0 16 5
Dari tabel diatas dapat dilihat dataset berjumlah 16 record struk belanja dengan 9 jenis produk. Dataset yang dimasukkan berupa merk produk apa saja yang dibeli dan berapa jumlah merk produk yang dibeli oleh konsumen didalam satu struk kemudian di kelompokkan berdasarkan jenis produknya.
27
3.3 Cleaning Data
Tahap selanjutnya adalah melakukan cleaning data terhadap data yang memiliki missing value dan redundant data. Dikatakan missing value jika atribut- atribut dalam dataset tidak berisi nilai atau kosong, sementara itu data dikatakan redundant jika dalam satu dataset yang sama terdapat lebih dari satu record yang berisi nilai yang sama.
Pada dataset penjualan produk ini tidak banyak terdapat data yang missing value dan redundant, jadi penulis melakukan pembersihan data seperti:
1. Dataset yang memiliki jumlah produk diatas 40 item.
Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat-
obatan Rokok
Struk 11 0 48 15 3 0 0 2 0 4
Struk 12 10 25 95 30 43 0 19 0 12
Struk 13 97 10 10 60 0 10 20 8 0
Struk 15 0 0 10 0 0 0 48 18 10
2. Pada dataset hanya terdapat satu produk saja yang dibeli.
Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat-
obatan Rokok
Struk 2 0 11 0 0 0 0 0 0 0
3. Pada dataset hanya terdapat dua produk saja yang dibeli
Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat-
obatan Rokok
Struk 4 1 0 0 1 0 0 0 0 0
4. Pada dataset hanya terdapat tiga produk saja yang dibeli Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat-
obatan Rokok
Struk 3 0 0 0 2 5 0 2 0 0
28
Struk 6 0 4 0 3 3 0 0 0 0
Struk 8 2 0 0 0 9 1 0 0 0
Struk 9 1 0 0 0 3 0 1 0 0
Setelah dilakukannya tahapan cleaning data terhadap dataset, maka didapat hasil akhir sebanyak 6 record dengan 9 jenis produk dan mempunyai isi data yang relevan yang dapat dilihat pada Tabel 3.3 berikut:
Tabel 3.3 Dataset yang telah di cleaning
3.4 Uji Coba dengan Algoritma K-Means Clustering
K-Means adalah salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam cluster yang lain.
Tahapan clustering dengan menggunakan K-Means dimulai dengan pembentukan cluster dimana penulis di sini membagi cluster maksimal sesuai dengan jumlah dataset, karena nantinya setiap cluster yang diinputkan dapat memilih data sheet untuk menentukan nilai centroid akan tetapi dengan syarat nilai centroid tidak dapat muncul dengan nilai yang sama. Kemudian dilakukan proses penghitungan jarak dari centroid dengan menggunakan Euclidean Distance, di mana centroid diperoleh dari objek dataset yang telah diinputkan.
No Struk Ke-
Makanan Ringan
Minu man
Buah- buahan
Pera watan
Bahan Dapur
Bahan Makanan
Perleng kapan
Obat-
obatan Rokok
1 Struk 1 6 8 0 1 11 0 4 4 0
2 Struk 5 5 3 0 3 0 0 3 0 0
3 Struk 7 0 3 0 0 3 1 2 0 3
4 Struk 10 1 0 1 2 3 0 2 0 0
5 Struk 14 0 0 16 12 20 5 0 23 17
6 Struk 16 0 2 29 27 15 8 0 16 5