Sistem Clustering Data Penjualan Menggunakan Algoritma Fuzzy C-Means

(1)

SISTEM CLUSTERING DATA PENJUALAN MENGGUNAKAN

ALGORITMA FUZZY C-MEANS

SKRIPSI

DIAN PUSPITASARI SEBAYANG

101402083

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

(2)

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

DIAN PUSPITASARI SEBAYANG 101402083

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(3)

2

PERSETUJUAN

Judul : SISTEM CLUSTERING DATA PENJUALAN

MENGGUNAKAN ALGORITMA FUZZY C-MEANS

Kategori : SKRIPSI

Nama : DIAN PUSPITASARI SEBAYANG

Nomor Induk Mahasiswa : 101402083

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dedy Arisandi, ST.,M.Kom Dr. Erna Budhiarti Nababan, M.IT NIP. 19790831200912 1 002 NIP. –

Diketahui/Disetujui oleh

Program Studi S1 Teknologi Informasi Ketua,

(4)

PERNYATAAN

SISTEM CLUSTERING DATA PENJUALAN MENGGUNAKAN ALGORITMA FUZZY C-MEANS

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 10 Februari 2015

(5)

4

UCAPAN TERIMA KASIH

Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat, karunia, taufik dan hidayah-Nya, serta segala sesuatu dalam hidup, sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi (S1)Teknologi Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi.

Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu penulis dalam menyelesaikan skripsi ini baik secara langsung maupun tidak langsung. Pada kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Keluarga penulis, Ayahanda tercinta Alm. Drs. Abdul Alik Sebayang, Ibunda tercinta Tri Murti Br. Sembiring, Abang penulis M.Safrizal Sebayang. S.Pd, dan adik penulis Debi Ardillah Sebayang beserta keluarga besar yang selalu memberikan dukungan, perhatian serta doa kepada penulis sehingga dapat menyelesaikan skripsi ini.

2. Ibu Dr. Erna Budhiarti Nababan, M.IT. selaku Dosen Pembimbing I dan Bapak Dedy Arisandi, ST., M.Kom, selaku Dosen Pembimbing II yang telah banyak meluangkan waktunya serta memberikan bimbingan dan dukungan kepada penulis dalam penyusunan dan penulisan skripsi ini.

3. Bapak Muhammad Anggia Muchtar, ST., MM.IT. selaku Dosen Penguji I dan Ibu

Sarah Purnamawati, ST.,M.Sc selaku Dosen Penguji II yang telah memberikan kritik dan saran yang membangun dalam penyempurnaan skripsi ini.

4. Bapak Muhammad Anggia Muchtar, ST., MM.IT. selaku Ketua Program Studi S1 Teknologi Informasi dan Bapak Mohammad Fadly Syahputra, B.Sc., M.Sc.IT. selaku Sekretaris Program Studi S1 Teknologi Informasi.

(6)

6. Sahabat-sahabat penulis, Cassia Divina, Rafika Diaz, Indriyana Octavia, Ade Nur Fatimah, Yola Adhysta dan Sofiah Novitasari yang telah memberikan semangat, dukungan dan perhatian yang tak terungkapkan.

7. Teman-teman penulis di FOYA: Ovy, Desi, Handra, Muslim, Rozy, Dian Pomta, Edgar, Galih, Ekatama, Baim, Fezan, Joko, Khairul dan Heri yang telah memberikan dukungannya, selalu setia membantu penulis selama perkuliahan dan tidak hanya menjadi teman tapi keluarga bagi hidup penulis.

8. Teman-teman penulis di Teknologi Informasi USU angkatan 2010, terutama Sharfina Faza, Nurul Putri Ibrahim, Rini Jannati, Tri Annisa, Maslimona Harimita, Amelia dan Novi yang telah memberikan semangat dan menjadi teman diskusi penulis dalam menyelesaikan skripsi ini.

9. Seluruh staf TU (Tata Usaha) serta pegawai di Program Studi S1 Teknologi Informasi

10. Semua pihak yang terlibat langsung ataupun tidak langsung yang tidak dapat penulis ucapkan satu per satu yang telah membantu penyelesaian skripsi ini.

(7)

6

ABSTRAK

Perusahaan ritel meyimpan jumlah data yang besar setiap harinya karena memiliki jumlah transaksi yang sangat banyak. Data tersebut dapat diolah sehingga memperoleh informasi yang bermanfaat untuk strategi pemasaran. Salah satu informasi yang dapat diperoleh dan bermanfaat untuk strategi pemasaran adalah mengetahui pada saat kapan suatu produk banyak terjual. Untuk mengolah data tersebut digunakan teknik data mining yaitu metode clustering yang merupakan proses membagi data dalam suatu himpunan kedalam beberapa kelompok. Algoritma Fuzzy C-Means(FCM) adalah salah satu metode clusteringyang merupakan algoritma data supersived yang setiap datanya menjadi anggota dari suatu kluster dengan derajat didefinisikan dengan level keanggotaan. Dengan menggunakan algoritma FCM, data penjualan berupa jumlah barang terjual, jumlah invoice, jenis produk dari tahun 2011 hingga tahun 2013 menghasilkan tingkat penjualan tinggi untuk seluruh produk pada bulan Juli, Agustus dan Desember.

(8)

CLUSTERING SYSTEM FOR SALES DATA USING

FUZZY C-MEANS ALGORITHM

ABSTRACT

Retail companies stored enormous data from every transaction each day. That data can be processed to get useful information marketing purposes. One of information that can be obtained and become useful for marketing strategy is know when one specific product generated more sales. To process the data, clustering method, one of data mining technique, is used to cluster the data into groups. Fuzzy C-Means algorithm is one of clustering method that supervised data into member of a cluster with the degree defined by member level. With FCM algorithm, sales data in the form of amount of item sold, invoice total, and types of product from 2011 to 2013 generate high sales level for all products in July, August and December.

(9)

8

1.1 Latar Belakang 1

1.2 Rumusan Masalah 2

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 3

1.5 Manfaat Penelitian 3

1.6 Metodologi Penelitian 3

1.7 Sistematika Penulisan 4

BAB 2 LANDASAN TEORI 6

2.1 Pola Perilaku Konsumen 6

2.2 Penambangan Data (Data Mining) 7

2.2.1 Tahapan Data Mining 8

2.2.2 Pengelompokan Data Mining 10

2.3 Clustering 12

2.4 Fuzzy C-Means 15

2.5 Penelitian Terdahulu 18

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 20

3.1 Data yang digunakan 21

(10)

3.2.1 Data Cleaning 23

3.2.2 Penentuan variabel 23

3.2.3 Pengelompokan kategori produk 23

3.3 Pemrosesan Data 25

3.3.1 Penentuan parameter FCM 25

3.3.2 Proses algoritma FCM 26

3.4. Analisis Komponen Sistem 37

3.4.1 Data Flow Diagram (DFD) 37

3.4.1.1 DFD level-0 37

3.4.1.2 DFD level-1 38

3.4.2 Flowchart 39

3.4.3 Sitemap aplikasi 41

3.5 Perancangan Sistem 41

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 47

4.1 Implementasi Sistem 47

4.2 Implementasi Perancangan Antarmuka 47

4.2.1 Halaman login 48

4.2.2 Halaman home 48

4.2.3 Halaman manage 49

4.2.4 Halaman input data 49

4.2.5 Halaman data 50

4.2.6 Halaman kategori 51

4.2.7 Halaman periode 51

4.2.8 Halaman admin 52

4.3 Pengujian Sistem 52

4.3.1 Rencana pengujian sistem 52

4.3.2 Kasus dan hasil pengujian sistem 53

4.3.3 Pengujian sistem 55

BAB 5 KESIMPULAN DAN SARAN 62

5.1 Kesimpulan 62

5.2 Saran 62

(11)

10

DAFTAR TABEL

Hal

Tabel 2.1 Penelitian terdahulu 20

Tabel 3.1 Data cleaning 23

Tabel 3.2 Jumlah penjualan perhari 24

Tabel 3.3 Jumlah penjualan perbulan 25

Tabel 3.4 Nilai parameter awal 25

Tabel 3.5 Data penjualan kategori produk 26

Tabel 3.6 Pusat klaster ke-1 iterasi pertama 29

Tabel 3.9 Fungsi objektif iterasi pertama 32

Tabel 3.10 Perubahan matriks 33

Tabel 3.11 Nilai fungsi objektif 35

Tabel 3.12 Nilai derajat keanggotaan pada iterasi terakhir 36

Tabel 4.1 Rencana pengujian sistem 53

Tabel 4.2 Hasil pengujian 53

(12)

DAFTAR GAMBAR

Hal

Gambar 2.1 Bidang ilmu data mining 8

Gambar 2.2 Tahapan data mining 10

Gambar 3.1 Sampel laporan frekuensi data penjualan 22

Gambar 3.2 DFD level 0 38

Gambar 3.3 DFD level 1 39

Gambar 3.4 Flowchart algoritma Fuzzy C-Means 40

Gambar 3.5 Sitemap aplikasi 41

Gambar 3.6 Rancangan tampilan login 42

Gambar 3.7 Rancangan tampilan halaman home 42

Gambar 3.8 Rancangan tampilan halaman cluster 43 Gambar 3.9 Rancangan tampilan halaman input data 43 Gambar 3.10 Rancangan tampilan halaman daftar kategori produk 44 Gambar 3.11 Rancangan tampilan halaman daftar produk 45 Gambar 3.12 Rancangan tampilan halaman daftar periode 45 Gambar 3.13 Rancangan tampilan halaman admin 46

Gambar 4.1 Halaman login 48

Gambar 4.2 Halaman home 49

Gambar 4.3 Halaman manage 49

Gambar 4.4 Halaman input data 50

Gambar 4.5 Halaman data 50

Gambar 4.6 Halaman kategori 51

(13)

12

Gambar 4.8 Halaman admin 52

Gambar 4.9 Halaman hasil input data 56

Gambar 4.10 Proses clustering 56

(14)

ABSTRAK

Perusahaan ritel meyimpan jumlah data yang besar setiap harinya karena memiliki jumlah transaksi yang sangat banyak. Data tersebut dapat diolah sehingga memperoleh informasi yang bermanfaat untuk strategi pemasaran. Salah satu informasi yang dapat diperoleh dan bermanfaat untuk strategi pemasaran adalah mengetahui pada saat kapan suatu produk banyak terjual. Untuk mengolah data tersebut digunakan teknik data mining yaitu metode clustering yang merupakan proses membagi data dalam suatu himpunan kedalam beberapa kelompok. Algoritma Fuzzy C-Means(FCM) adalah salah satu metode clusteringyang merupakan algoritma data supersived yang setiap datanya menjadi anggota dari suatu kluster dengan derajat didefinisikan dengan level keanggotaan. Dengan menggunakan algoritma FCM, data penjualan berupa jumlah barang terjual, jumlah invoice, jenis produk dari tahun 2011 hingga tahun 2013 menghasilkan tingkat penjualan tinggi untuk seluruh produk pada bulan Juli, Agustus dan Desember.

(15)

7

CLUSTERING SYSTEM FOR SALES DATA USING

FUZZY C-MEANS ALGORITHM

ABSTRACT

Retail companies stored enormous data from every transaction each day. That data can be processed to get useful information marketing purposes. One of information that can be obtained and become useful for marketing strategy is know when one specific product generated more sales. To process the data, clustering method, one of data mining technique, is used to cluster the data into groups. Fuzzy C-Means algorithm is one of clustering method that supervised data into member of a cluster with the degree defined by member level. With FCM algorithm, sales data in the form of amount of item sold, invoice total, and types of product from 2011 to 2013 generate high sales level for all products in July, August and December.

(16)

PENDAHULUAN

1.1 Latar belakang

Kehadiran teknologi informasi terutama basis data dalam perusahaan sudah menjadi kebutuhan pokok. Banyak perusahaan yang mengumpulkan data dengan ukuran yang besar sehingga pertumbuhan jumlah data yang begitu cepat hanya membuat data tidak dimanfaaatkan dengan baik. Salah satu perusahaan yang memiliki penyimpanan jumlah data yang besar adalah perusahaan ritel. Perusahaan ritel setiap harinya memiliki jumlah transaksi yang sangat banyak. Hal ini berdampak pada pertumbuhan jumlah data yang sangat pesat dan menimbulkan jumlah data yang berskala besar dalam basis data. Data tersebut dapat diolah sehingga memperoleh informasi yang bermanfaat untuk strategi pemasaran. Salah satu cara memperoleh strategi pemasaran adalah dengan memperhatikan kapan suatu produk banyak dibeli konsumen, sehingga manajemen perusahaan mengetahui produk apa saja yang harus ditingkatkan penjualanannya.

(17)

2

ini adalah proses clustering lebih lambat dibandingkan k-meansdan metode yang digunakan tidakmenentukan jumlah klaster dari awal. Penelitian lainnya adalah implementasi data mining untuk mengetahui pola transaksi pada data penjualan menggunakan metode Deskripsi (Anisah, 2013) yang menghasilkan pola transaksi penjualan per periode dan informasi tingkat penjualan kategori produk yang laku dan jarang laku, pada penelitiannya memiliki kekurangan dalam segi metode yang digunakan, metode yang digunakan adalah metode deskripsi yang menggunakan jumlah transaksi penjualan sebagai variabel untuk menghasilkan nilai rata-rata, median dan modus untuk setiap produk.

Clustering merupakan proses membagi data dalam suatu himpunan kedalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar dari pada kesamaan data tersebut dengan data dalam kelompok lain. Salah satu algoritma yang termasuk dalam metode kluster adalah Fuzzy C-Means (FCM) yang merupakan algoritma clustering data supersived yang setiap datanya menjadi anggota dari suatu kluster dengan derajat didefinisikan dengan level keanggotaan (Kusrini, 2009).

Penelitian yang telah dilakukan menggunakan Algoritma FCM adalah penerapan data mining Penerapan Fuzzy C-Means dalam Pemilihan Peminatan Tugas Akhir. Hasil dari penelitian ini bahwa FCM sesuai untuk aplikasi pemilihan peminatan tugas akhir karena memiliki akurasi yang tinggi (Sumanto, 2011)

Oleh karena itu, penulis akan mengambil judul Sistem Clustering Data Penjualan Menggunakan Algoritma Fuzzy C-Means.

1.2 Rumusan masalah

(18)

1.3Batasan masalah

Untuk mencegah meluasnya pembahasan dan agar lebih terarah maka dibuat batasan masalah, yang meliputi :

1. Hanya digunakan pada perusahaan ritel

2. Hanya meneliti 3 (tiga) kategori produk secara umum, tidak berdasarkaan merk produk, hanya berdasarkan jenis dari produk tersebut.

1.4 Tujuan

Adapun tujuan dari penelitian ini adalah menentukan tingkat penjualan menggunakan Algoritma Fuzzy C-Means.

1.5 Manfaat

Adapun manfaat dari penelitian ini adalah sebagai berikut : 1. Mengetahui implementasi Algoritma Fuzzy C-Means

2. Dengan mengetahui tingkat penjualan produk, manajemen dapat membuat keputusan mengenai strategi pemasaran seperti menentukan program untuk meningkatkan penjualan item barang dengan promo dan periode waktu tertentu, dan manajemen dapat mengatur persediaan barang pada periode waktu tertentu. 3. Penulis berharap penelitian ini dapat menjadi referensi untuk pembaca.

1.6 Metodologi Penelitian

Metodologi penelitian yang digunakan pada tugas akhir ini adalah: 1. Studi literatur

Pada tahap ini dilakukan dengan membaca dan mempelajri dalam buku-buku dan referensi, jurnal atau sumber-sumber penelitian yang berkaitan dengan Data mining dan Algoritma Fuzzy C-Means (FCM).

2. Analisis masalah

Pada tahap ini akan dilakukan analisa data menggunakan data mining pada data transaksi penjualan

3. Pengumpulan data

(19)

4

4. Pra pengolah data dan Outliers

Mempersiapkan data yang akan diolah dan menemukan outliers dari data yang diolah.

5. Perancangan sistem

Pada tahap ini dilakukan perancangan antarmuka. Proses perancangan dilakukan berdasarkan hasil analisis studi literatur yang telah didapatkan.

6. Implementasi sistem

Pada tahap ini dilakukan proses implementasi pengkodean program dalam aplikasi komputer menggunakan bahasa pemrograman PHP dan MySQL.

7. Pengujian

Pada tahap ini dilkaukan proses pengujian dan percobaan terhadap sistem sesuai dengan kebutuhan yang ditentukan sebelumnya serta memastikan progrm yang dibuat berjalan seperti yang diharapkan.

8. Dokumentasi dan penyusunan laporan

Pada tahap ini dilakukan pembuatan dokumentasi sistem, lengkap dengan analisis yang diperoleh dan dokumentasi hasil analisis dan implementasi algoritma Fuzzy C-Means(FCM).

1.7. Sistematika Penulisan

Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut:

BAB 1: PENDAHULUAN

Bab ini akan menjelaskan tentang latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, dan sistematika penulisan.

BAB 2: LANDASAN TEORI

(20)

BAB 3: ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi analisis terhadap fokus permasalahan penelitian dan perancangan sistem yang akan dibangun seperti menggambar flowchart atau diagram alur kerja system, analisis terhadap proses kerja algoritma Fuzzy C-Means pada pola transaksidan perancangan antarmuka atau interface.

BAB 4: IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini berisi pembahasan tentang implementasi algoritma yang disusun pada bab 3 dan pengujian terhadap sistem yang dibangun.

BAB 5: KESIMPULAN DAN SARAN

(21)

BAB 2

LANDASAN TEORI

Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui pola perilaku konsumen.

2.1. Pola Perilaku Konsumen

Perilaku konsumen adalah proses dan aktivitas ketika seseorang berhubungan dengan pencarian, pemilihan, pembelian, penggunaan, serta pengevaluasian produk dan jasa demi memenuhi kebutuhan dan keinginan (Duncan, 2005). Perilaku konsumen merupakan hal-hal yang mendasari konsumen untuk membuat keputusan pembelian. Untuk barang berharga jual rendah (low-involvement) proses pengambilan keputusan dilakukan dengan mudah, sedangkan untuk barang berharga jual tinggi (high-involvement) proses pengambilan keputusan dilakukan dengan pertimbangan yang matang (Kincaid, 2003).

(22)

memahami sikap konsumen dalam menghadapi sesuatu, seseorang dapat menyebarkan ide dengan lebih cepat dan efektif.

2.2. Penambangan Data (Data Mining)

Data mining merupakan pemilihan atau menggali pengetahuan dari jumlah data yang banyak (Han dan Kamber, 2001).Data mining disebut penemuan pengetahuan atau menemukan pola yang tersembunyi dalam data. Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaanya (Pramudiono, 2006).

Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya,yang dapat dipahami dan bermanfaat bagi pemilik data (Larose, 2006). Dengan kata lain, data mining adalah proses menganalisis data dalam jumlah besar dan membentuk suatu pola sehingga menjadi informasi yang berguna.

Berdasarkan definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah :

1.Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar.

3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.

(23)

8

Gambar 2.1. Bidang Ilmu Data Mining

2.2.1. Tahapan Data Mining

Istilah data mining dan Knowledge Discovery in Database (KDD) seringkali digunakan secara bergantian untuk menjelaskan proses penggalian informasi yang tersembunyi dalam suatu basis data yang besar. Dalam implementasinya, data mining merupakan bagian dari proses KDD. Sebagai komponen dalam KDD, data mining berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah dalam basis data. KDD mencakup keseluruhan proses pencarian pola/informasi dalam basis data yang dimulai dari pemilihan dan persiapan data sampai representasi pola yang ditentukan dalam bentuk yang mudah dimengerti oleh pihak berkepentingan. Proses KDD secara garis besar terdiri atas beberapa tahap (Fayyad, 1996).

1. Data Selection

(24)

2. Pre-processing/Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (typo), juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/Evalution

(25)

10

Gambar 2.2. Tahapan Data Mining

(Sumber : Fayyad, 1996)

2.2.2. Pengelompokan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapatdilakukan, yaitu (Larose, 2005):

1. Deskripsi

Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.

2. Estimasi

(26)

menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian adalah :

1. Prediksi harga beras dalam tiga bulan yang akan datang.

2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori.Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.Cluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam cluster lain.

(27)

12

Contoh pengklusteran dalam bisnis dan penelitian adalah:

1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar.

2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.

3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilakufinansial dalam baik dan mencurigakan.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu.Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah :

1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons positif terhadap penawaran upgrade layanan yang diberikan.

2.3. Clustering

(28)

terlihat memiliki beberapa sifat yang melekat yang mengalami pengelompokan-pengelompokan natural (Hammouda & Karray, 2003).

Namun demikian, penemuan pengelompokan-pengelompokan ini atau upaya untuk mengkategorikan data adalah bukan sebuah tugas yang sederhana bagi manusia kecuali data memiliki dimensionalitas rendah (dua atau tiga dimensi paling banyak).Inilah sebabnya mengapa beberapa metode dalam soft computing telah dikemukakan untuk menyelesaikan jenis masalah ini.Metode ini disebut “Metode-Metode Pengelompokan Data” (Hammouda & Karray, 2003).

Algoritma-algoritma clustering digunakan secara ekstensif tidak hanya untuk mengorganisasikan dan mengkategorikan data, akan tetapi juga sangat bermanfaat untuk kompresi data dan konstruksi model. Melalui pencarian kesamaan dalam data, seseorang dapat merepresentasikan data yang sama dengan lebih sedikit simbol. Dan juga, jika kita dapat menemukan kelompok-kelompok data, kita dapat membangun sebuah model masalah berdasarkan pengelompokan-pengelompokan ini (Dubes & Jain, 1988).

Clustering menunjuk pada pengelompokan record, observasi-observasi, atau kasus-kasus ke dalam kelas-kelas objek yang sama. Cluster adalah sekumpulan record yang sama dengan satu sama lain dan tidak sama dengan record dalam cluster lain. Clustering berbeda dari klasifikasi dimana tidak ada variabel target untuk clustering. Tugas clustering mencoba untuk tidak mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose, 2005). Bahkan, algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke dalam subkelompok-subkelompok atau cluster-cluster homogen secara relatif. Dimana kesamaan record dalam cluster dimaksimalkan dan kesamaan dengan record diluar cluster ini diminimalkan.

(29)

14

Aktivitas clustering pola khusus meliputi langkah-langkah berikut (Dubes & Jain, 1988) :

1. Representasi pola (secara opsional termasuk ekstraksi dan/atau seleksi sifat. 2. Defenisi ukuran kedekatan pola yang tepat untuk domain data.

3. Clustering pengelompokan. 4. Penarikan data (jika dibutuhkan). 5. Pengkajian output (jika dibutuhkan).

Representasi pola merujuk pada jumlah kelas, jumlah pola-pola yang ada, dan jumlah, tipe dan skala fitur yang tersedia untuk algoritma clustering. Beberapa informasi ini dapat tidak bisa dikontrol oleh praktisioner. Seleksi sifat (fitur) adalah proses pengidentifikasian subset fitur original yang paling efektif untuk digunakan dalam clustering. Ekstraksi fitur adalah penggunaan satu atau lebih transformasi dari sifat-sifat input untuk menghasilkan sifat-sifat-sifat-sifat baru yang lebih baik.

Pertimbangkan data himpunan X (dataset) yang terdiri dari point-point data (atau secara sinonim, objek-objek, hal-hal, kasus-kasus, pola, tuple, transaksi) xi = (xi1, …,xid) A dalam ruang atribut A, dimana i = 1, N, dan setiap komponen adalah sebuah atribut A kategori numerik atau nominal. Sasaran akhir dari clustering adalah untuk menentukan point-point pada sebuah sistem terbatas dari subset k, cluster. Biasanya subset tidak berpotongan (asumsi ini terkadang dilanggar), dan kesatuan mereka sama dengan dataset penuh dengan pengecualian yang memungkinkan outlier. Ci adalah sekelompok point data dalam dataset X, dimana X = Ci ..Ck .. Coutliers, Cj1 .. Cj2 =0.

(30)

1. Partitioning Methdos

Metode yang membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut dengan beberapa kriteria.Algoritma yang dipakai pada metode ini adalah Means, K-Medoid, PROCLUS, CLARA, CLARANS dan PAM.

2. Hierarchical Methods

Metode yang membuat suatu penguraian secara hierarchical dari himpunan data dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua jenis, yaitu Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE dan CHAMELEON.

3. Density-Based Methods

Metode ini berdasarkan konektivitas dan fungsi densitas.Metode ini meliputi algoritma DBSCAN, OPTICS dan DENCLU.

4. Grid-Based Methods

Metode ini berdasarkan suatu struktur granularitas multi-level.Metode clustering ini meliputi algoritma STING, WaveCluster dan CLIQUE.

5. Model-Based Methods

Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best fit dari model tersebut untuk masing-masing yang lain. Metode clustering ini meliputi pendekatan statistik, yaitu algoritma COBWEB dan jaringan syaraf tiruan SOM.

2.4. Fuzzy C-Means

(31)

16

Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means (FCM). Fuzzy C-Means (FCM) adalah suatu teknik pengclusteran data yang mana keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.

Konsep dari Fuzzy C-Means pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusatcluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan kepusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data. Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system.

Algoritma Fuzzy C-Means

Langkah-langkah yang dilakukan di Algoritma Fuzzy C-Means Clustering meliputi (Kusuma, 2004) :

1. Input data yang akan di cluster X, berupa matriks berukuran n x m (n = jumlah sampel data ; m = atribut setiap data)

Xij data sampel ke-i ( i = 1, 2, .... , n), atribut ke-j ( 1, 2,... , m)

2. Menentukan jumlah dari • Cluster (c)

• Pangkat (w) -> w > 1, nilai w yang paling optimal dan sering dipakai adalah w = 2. (Klawonn, 1997).

• Maksimum Iterasi (MaxIter) • Kriteria penghentian ( )

(32)

3. Membangkitkan bilangan Random iki= 1,2,…n., k=1,2,…c sebagai elemenmatriks partisi awal U. Menghitung jumlah setiap kolom ( atribut ) dengan j = 1, 2, .. n dengan persamaan :

Qi = (2.1)

µik =

4. Menghitung pusat cluster ke-k : Vkj ,dengan k = 1,2,...,c; danj =1,2,...,m. dengan persamaan :

(2.2)

dengan :

= pusat cluster ke-k untuk atribut ke-j

= derajat keanggotaan untuk data sampel ke-i pada cluster ke-k = data ke-i, atribut ke-j

5. Menghitung fungsi obyektif pada iterasi ke- t, dengan persamaan :

= _(2.3)

dengan:

(33)

18

= fungsi objektif pada iterasi ke-t

6. Menghitung perubahan matriks partisi dengan persamaan :

(2.4)

dengan: i = 1,2,...,n; dan k = 1,2,...,c. Dimana :

= derajat keanggotaan untuk data sampel ke-i pada cluster ke-k

= data ke-i, atribut ke-j

7. Memeriksa kondisi berhenti dengan aturan persamaan

8. Jika: ( |Pt – Pt-1| < ) atau (t >MaxIter) maka berhenti. Jika tidak maka t = t+1, Ulangi langkah ke-4.

2.5. Penelitian Terdahulu

Penelitian yang berhubungan dengan pengolahan data penjualan dan algoritma Fuzzy C-Means seperti pada tabel 2.1 adalah

1. Penerapan data mining pada penjualan menggunakan metode Agglomerative Hierarchical Clustering(Sutrisno, 2013) yang menghasilkan pola penjualan produk mana yang diminati oleh konsumen, kekurangan dalam penelitian ini adalah proses clustering lebih lambat dibandingkan k-means dan metode yang digunakan tidak menentukan jumlah klaster dari awal.

(34)

dalam segi metode yang digunakan, metode yang digunakan adalah metode deskripsi yang menggunakan jumlah transaksi penjualan sebagai variabel untuk menghasilkan nilai rata-rata, median dan modus untuk setiap produk.

3. Penerapan data mining pada penjualan produk minuman di PT. Pepsi Coca Cola Indobeverages menggunakan metode Clustering (Irdiansyah, 2013).Pada penelitian ini, metode yang digunakan adalah Agglomerative Hierarchical Clustering. Hasil dari penelitian adalah kelompok karakteristik umum dari grup-grup konsumen yang berbeda. Penelitian dilakukan dengan menggunakan parameter wilayah, jumlah penjualan dan rata-rata penjualan.

4. Penentuan jurusan sekolah menengah atas (Bahar, 2011). Pada penelitian ini algoritma FCM memiliki tingkat akurasi rata-rata 78.39%. Proses klastering dalam penelitian ini dilakukan dengan menentukan jumlahklaster yang terbentuk di awal proses sesuai dengan jumlah kelompok(Jurusan) yang diinginkan. sehingga, tidak dapat dipastikan berapasesungguhnya jumlah klaster ideal yang terbentuk dari data nilai siswa yangada, sehingga akurasi hasil pengelompokkan tidak dapat terukur.

5. Pemilihan peminatan tugas akhir mahasiswa (Sumanto, 2011).Kesimpulan dari penelitian iniadalah pemilihan peminatan tugas akhir mahasiswa sangat menentukan hasil tugas akhir mahasiswa. Tingkat akurasi penerapan FCM untuk pemilihan peminatan tugasakhir pada data yang digunakan pada eksperimen ini mencapai 80%.

Tabel 2.1 Penelitian Terdahulu

(35)

20

1 2013 Agglomerative Hierarchical Clustering

kekurangan dalam penelitian ini adalah proses clustering lebih lambat dibandingkan k-means dan metode yang digunakan tidak menentukan jumlah klaster dari awal.

2 2013 Metode Deskripsi Kekurangannya karena penelitian hanya menghasilkan nilai rata-rata, median dan modus untuk setiap produk.

3 2013 Agglomerative Hierarchical Clustering

(36)

Bab ini secara garis besar membahas tentang analisis datapenjualan menggunakan algoritma Fuzzy C-Means pada sistem dan tahap-tahap yang dilakukan dalam perancangan sistem yang akan dibangun.

3.1.Data yang digunakan

Data yang digunakan dalam penelitian ini adalah laporan frekuensi data penjualan produk yang bersumber dari salah satu swalayan di Kota Medan dari tahun 2011 hingga 2013 yang memberikan gambaran secara nyata bagaimana penjualanan suatu produk dari waktu ke waktu. Setelah data terkumpul dilakukan analisa data yang sesuai dengan kebutuhan sistem ini. Oleh karena itu, untuk menghasilkan kesimpulan pada analisis data, diperlukan data penjualan produk yang akan dianalisis berdasarkan metode clustering menggunakan algoritma Fuzzy C-Means.

(37)

22

Gambar 3.1 Sampel laporan frekuensi data penjualan

Sumber : Database Penjualan Swalayan Omi Ar Rasyid Medan

Pada swalayan terdapat banyak sekali nama-nama produk ataupun merk-merk produk yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan kategori produknya. Kategori produk yang dipilih adalah sebagai berikut:.

1. Susu 2. Beras

3. Minyak goreng

Pemilihan kategori tersebut berdasarkan data dari kategori produk produk yang selalu dibeli konsumen setiap bulannya.

3.2. Praproses Data

Dalam mengolah data mining terdapat beberapa tahapan yang harus dilakukan sehingga data dapat digunakan secara maksimal. Tahapan tersebut merupakan bagian dari Knowledge Discovery in Database (KDD), yaitu:

(38)

Pada tahap ini dilakukan pembersihan data, yaitu menghapus data missing values. Data missing values tersebut merupakan data yang diperlukan untuk proses ini. Pada penelitian ini pembersihan dilakukan terhadap record yang memiliki jumlah frekuensi/invoice lebih besar dibandingkan jumlah terjual. Sampel data cleaning seperti pada tabel 3.1 :

Tabel 3.1. Data Cleaning

No Nama Barang Jumlah Terjual Jumlah Invoice

1 Aqua 1.5 ltr 50 63

2 Bear Brand 30 44

Pada Tabel 3.1, Jumlah barang yang terjual lebih sedikit dibandingkan dengan jumlah invoice, sehingga data tersebut tidak dapat digunakan.

3.2.2. Penentuan Variabel

Pada tahap ini akan dilakukan penentuan variabel yang akan menghasilkan analisa untuk mengolah data. Adapun variabelnyasebagai berikut :

a. Jenis produk yaitu jenis produkyang terjual

b. Periode yaitu rentang waktu penjualan produk

c. Jumlah produk yang Terjual yaitu nilai dari jumlah barang yang terjual adalah komponen terpenting dalam mengolah data penjualan. Dari jumlah barang yang terjual akan diketahui tingkat penjualanan suatu produk. Penelitian ini menggunakan jumlah barang berdasarkan kategorinya.

d. Jumlah invoice yaitu jumlah nota atau faktur yang mencatat penjualan suatu produk

3.2.3. Pengelompokan kategori produk

Pengelompokan kategori produk adalah mengubah nama produk untuk mempermudah penelitian, yakni:

1. Kategori produk susu terbagi atas :

(39)

24

b. Balita berubah menjadi produk A2

c. Anak 7-12 tahun berubah menjadi produk A3 d. Manula berubah menjadi produk A4

e. Ibu Hamil berubah menjadi produk A5 2. Kategori produk beras terbagi atas :

a. Harga < Rp. 10.000 berubah menjadi produk A6 b. Harga > Rp. 10.000 berubah menjadi produk A7 3. Kategori produk minyak goreng terbagi atas :

a. Minyak kelapa/kelapa sawit berubah menjadi produk A8 b. Minyak jagung berubah menjadi produk A9

c. Minyak zaitun berubah menjadi produk A10

Data yang akan digunakan adalah data penjualan dari 8 (delapan) kategori produk yang dibeli konsumen selama 3 tahun. Data memiliki 1080 record data penjualan berdasarkan hari seperti tabel 3.2.

Tabel 3.2. Jumlah penjualan perhari

No Periode

(40)

Tabel 3.3. Jumlah penjualan perbulan

Periode Jumlah barang terjual

Bulan Tahun A1 A2 A3 A4 A5 A6 A7 A8 A9 A10

1 Jan 2011 45 51 32 24 40 10 11 30 10 1

2 Feb 2011 46 55 41 14 48 11 11 35 8 0

3 Mar 2011 32 48 35 20 47 10 10 38 6 2

4 Apr 2011 28 60 30 9 50 12 10 25 5 1

5 Mei 2011 43 65 32 15 55 8 13 29 6 0

6 Jun 2011 48 48 28 10 54 9 15 30 6 0

7 Jul 2011 42 60 30 20 42 11 19 35 7 2

8 Agt 2011 35 75 31 24 45 13 18 43 10 0

9 Sept 2011 49 48 39 12 48 10 18 45 10 2

10 Okt 2011 44 50 33 14 50 10 14 32 5 0

11 Nov 2011 37 43 39 19 51 12 14 35 4 0

12 Des 2011 50 74 42 23 58 13 16 45 8 2

3.3.Pemrosesan Data

Terdapat beberapa tahapan dalam pengolahan data yang harus dilalui agar menghasilkan data yang diinginkan.

3.3.1. Penentuan Paramater Fuzzy C-Means

Untuk melakukan perhitungan dengan metode fuzzy c-means pada penelitian ini ditetapkan nilai parameter awal pada Tabel 3.4 berikut:

Tabel 3.4. Nilai Parameter Awal

Parameter Nilai

Cluster (c) 3

(41)

26

Maksimum Iterasi (MaxIter) 100 Kriteria Penghentian ( ) 10-5 Fungsi Objektif Awal(P0) 0

Iterasi Awal (t) 1

3.3.2. Proses Fuzzy C-Means

Tabel 3.5 merupakan data penjualan produk A1 pada tahun 2011, 2012 dan 2013 yang mewakili keseluruhan produk untuk dilakukan proses clustering.

Tabel 3.5. Data Penjualan Kategori Produk A1

(42)

21 September 2012 50

22 Oktober 2012 55

23 November 2012 48

24 Desember 2012 52

Tabel 3.5. Data Penjualan Kategori Produk A1 (lanjutan)

No Periode Jumlah barang

Setelah menetapkan nilai parameter awal dan data siap untuk diklaster, akan dilakukan proses clustering pertahun menggunakan langkah langkah dari Algoritma Fuzzy C-Means (FCM).

Langkah 1. Membangkitkan Bilangan Random

Membangkitkan bilangan random ik, i=1,2,...,n ; k=1,2,...c; sebagai elemen elemen matriks partisi awal (U).

(43)

28

Langkah 2. Menentukan Pusat Klaster (v)

Pada iterasi pertama, untuk menentukan pusat klaster dengan menggunakan persamaan 2.2, sebagai contoh perhitungan sebagai berikut.

Tahap perhitungan untuk mencari nilai pusat klaster ke-1 adalah 1. Nilai derajat keanggotaan klaster ke-1 pada data pertama

- ( i1) = 0.21845002136495 - ( i1)2 _{= (} _{i1,1) x (} _i1,1)

= 0.96526143723138x 0.96526143723138 = 0.931729642206

(44)

- ( i1)2 _{x X1.1} _{= (} _i1)2 _{x Nilai Jumlah barang terjual pada data pertama} = 0.931729642206 x 45

= 41.92783389927

3. Kemudian, perkalian dari derajat keanggotaan yang telah dikuadratkan dengan masing masing nilai variabel dari data pertama hingga data terakhir dijumlahkan.

Hasil penjumlahan dari hasil perkalian tersebut pada variabel jumlah penjualan produk.

= ( i1)2_{x X1.1 + ... + (} _i1)2_{x X1.36}

= 41.92783389927 + ... + 49.21557855008 = 168.9835324312

4. Perhitungan hasil dari pusat klaster (Vkj) pada klaster ke-1

168.9835324312 3.913355933957

43.181232489917

Pusat Klaster ke-1 (Vkj) = 43.181232489917

Setelah diperoleh nilai pusat klaster ke-1(Vkj), tahap yang sama untuk menghitung nilai pusat klaster ke-2 dan pusat klaster ke-3.

Pusat Klaster ke-2 (Vkj) = 39.9037273399 Pusat Klaster ke-3 (Vkj) = 41.5870789438

Hasil perhitungan pusat klaster pada iterasi pertama klaster ke-1 pada tabel 3.6, klaster ke-2 pada tabel 3.7 dan klaster ke-3 pada tabel 3.8

Tabel 3.6 Pusat Klaster ke-1 pada Iterasi Pertama

=

= Vkj=

hasil perkalian jumlah barang terjual

Jumlah derajat keanggotaan yang telah dikuadratkan ( i1)2 hasil perkalian jumlah

(45)

30

No Derajat Keanggotaan

klaster ke-1( i1)

X1.1 ( i1)2 ( i1)2x X1.1

1 0.96526143723138 45 0.9317296422061 41.92783389927 2 0.23158842863306 46 0.053633200276728 2.4671272127295 3 0.36663449996156 32 0.13442085656207 4.3014674099861 4 0.63792040354536 28 0.40694244125947 11.394388355265

5 0.5425824414747 43 0.29439570579664 12.659015349256

Tabel 3.6 Pusat Klaster ke-1 pada Iterasi Pertama (lanjutan)

klaster ke-1( i1)

X1.1 ( i1)2 ( i1)2x X1.1

7 0.56055448102335 42 0.31422132619536 13.197295700205 8 0.073222192137453 35 0.0053614894214 0.18765212974949 9 0.34738428300868 49 0.1206758400814 5.9131161639913 10 0.30625440409682 44 0.093791760028698 4.1268374412627 11 0.59623081744602 37 0.35549118767235 13.153173943877 12 0.99212477592368 50 0.9843115710016 9.21557855008

3.913355933957 168.9835324312

Pusat klaster ke-1 (vkj1) 43.181232489917

klaster ke-2 ( i2)

X1.1 ( i2)2 ( i2)2x X1.1

(46)

6 0.56457336016279 48 0.31874307900551 15.299667792264 7 0.45954918903236 42 0.21118545714031 8.8697891998928 8 0.71840481555564 35 0.51610547901353 18.063691765474 9 0.074715500871326 49 0.00558240607045 0.2735378974522 10 0.36732353479622 44 0.13492657921519 5.9367694854684 11 0.39104127319935 37 0.15291327734537 5.6577912617787 12 0.51137230169587 50 0.26150163094174 13.075081547087

3.09323916706 123.43177232

klaster ke-3 ( i3)

X1.1 ( i3)2 ( i3)2x X1.1

1 0.22632857423631 45 0.05122462351584 2.3051080582128 2 0.38484755462323 46 0.14810764029948 6.8129514537761 3 0.41720469501807 32 0.17405975754512 5.5699122414438 4 0.81757056799467 28 0.66842163365113 18.715805742232 5 0.71628860380795 43 0.51306936394514 22.061982649641 6 0.63903445163948 48 0.40836503038217 19.601521458344 7 0.61817283983498 42 0.38213765990964 16.049781716205 8 0.29194892900463 35 0.08523417714695 2.9831962001434 9 0.868278451647 49 0.75390746959452 36.941466010131 10 0.28340595149832 44 0.08031893334466 3.5340330671654 11 0.52926415995661 37 0.28012055101457 10.364460387539 12 0.5434437006755 50 0.29533105580388 14.766552790194

1.17082783238752 48,6913094951

(47)

32

Langkah 3. Menghitung Fungsi Objektif (P)

Setelah terbentuk pusat klaster, selanjutnya menghitung fungsi objektif (P), Fungsi objektif digunakan sebagai syarat perulangan untuk mendapatkan pusat klaster yang tepat, sehingga diperoleh kecenderungan data untuk masuk ke klaster mana pada step akhir.

Perhitungan fungsi objektif Pt dimana nilai variabel Xij dikurang dengan pusat klaster Vkj kemudian hasil pengurangannya di kuadratkan lalu masing masing hasilkuadrat dijumlahkan untuk dikali dengan kuadrat dari derajat keanggotaan untuk tiap klaster, setelah itu jumlahkan semua nilai di semua klaster untuk mendapatkan fungsi objektif Pt. Fungsi objektif pada iterasi pertama (p1) dihitung dengan menggunakan persamaan (2.3).

=

= 610.752343807

Cara menghitungnya sebagai berikut : =

= (( X1j – V1j ) x (μi1)2_{+ ( X1j – V2j ) x (μi2)}2_{+ ( X1j – V3j ) x (μi3)}2_{) + ... +}

(( X12j – V1j ) x (μi1)2_{+ ( X12j – V2j ) x (μi2)}2_{+ ( X12j – V3j ) x (μi3)}2₎

= 29.441381108746 + .... + 93.324960765445 = 610.752343807

Misalkan ( X1j – V1j ) x ( i1)2_{adalah a, ( X1j – V2j ) x (} _i2)2_{adalah b dan ( X1j – V3j ) x} ( i3)2_{adalaj c. Untuk lebih rincinya dapat dilihat pada tabel 3.9.}

(48)

No a b c a+b+c

1 3.0820826976 25.762632452663 0.5966659584103 29.44138110874 2 0.4261399259 3.3030490952883 2.8842292661826 6.613418287407 3 16.805290109 30.56373004827 15.998194825816 63.36721498377 4 93.787951151 67.729136240698 123.39645834854 284.9135457412

12 45.766147588 26.656095954744 20.902717222183 93.32496076544 Fungsi Objektif iterasi pertama (P1) 610.752343807

Langkah 4. Menghitung Perubahan Matriks Partisi (U)

Perhitungan perubahan matriks partisi (U) menggunakan persamaan 2.4. untuk menghasilkan derajat kenggotaan yang baru yang memiliki rentang antara 0 dan tidak lebih dari 1. Contoh menghitung perubahan matriks seperti tabel 3.10.

Tabel 3.10. Perubahan matriks

X1 Vkj (X1 – Vkj)2

45 43.181232489917 3.3079152557338 0.30230520514896 45 39.903727339962 25.971995025446 0.038503010608937 45 41.587078943843 11.648030135855 0.08585142623574

Untuk perhitungan perubahan matriks lebih rinci adalah sebagai berikut:

(X1 – Vkj)2 =

(49)

34

Setelah menghitung seluruh nilai perubahan matrik maka diperoleh Matriks partisi baru (U) untuk iterasi pertama

Langkah 5. Mengecek Kondisi Berhenti

Karena | P1– P0| = | 610.752343807– 0| = 610.752343807> (10-5_{), dan iterasi =}

1 < MaxIter (=100), maka proses dilanjutkan ke iterasi kedua (t=2), iterasi berhenti jika nilai Pt lebih kecil dari nilai , iterasi berhenti di MaxIter yang telah ditentukan atau nilai Pt yang sebelumnya dan yang baru adalah sama.

(50)

41.33468753492 3

Fungsi objektif pada iterasi kedua (P2) juga dihitung seperti cara perhitungan fungsi objektif pada iterasi pertama. Hasilnya adalah:

=

= 137.99935387841

Hasil perbaikan matriks partisi untuk iterasi kedua (U2) :

Karena | P1– P0| = | 137.99935387841– 0| = 137.99935387841>> (10-5_{), dan iterasi =} 1 < MaxIter (=100), maka proses dilanjutkan ke iterasi kedua (t=3).

Demikian seterusnya, hingga | | Pt– P0| < , atau t > MaxIter. Dalam penelitian ini, proses berhenti untuk kategori produk A1 pada tahun 2011 setelah iterasi ke-17. Urutan proses berhentinya iterasi dapat dilihat di tabel 3.11.

Tabel 3.11. Nilai fungsi objektif pada tiap iterasi

0.97953206926447 0.00278128016080 0.017686650574729 0.89001237349373 0.018896664766731 0.091090961739537 0.072055879808764 0.7985813098421 0.12936281034914

0.96149873423631 0.0036443344099176 0.034856931353771 0.024703053986294 0.9011960699356 0.024703053986294 0.644962223993 0.095912829858583 0.25912494614842

(51)

36

Pada iterasi terakhir, diperoleh pusat klaster:

V17 =

(52)

Dari hasil perbaikan matriks partisi baru pada iterasi terakhir inilah yang akan menentukan produk tersebut di setiap bulannya termasuk penjualan yang tinggi, sedang atau rendah, rincinya dapat dilihat pada tabel 3.12.

Tabel 3.12 Nilai derajat keanggotaan baru pada iterasi terakhir

i

1 45 0.16222 0.01356 0.82423 *

2 46 0.48240 0.01837 0.49923 *

3 32 0.00029 0.99910 0.00062 *

4 28 0.03828 0.89244 0.06928 *

5 43 0.00420 0.00118 0.99462 *

6 48 0.97733 0.00181 0.02086 *

7 42 0.03959 0.01869 0.94172 *

8 35 0.03449 0.87340 0.09211 *

9 49 0.99634 0.00037 0.00329 *

10 44 0.01783 0.00284 0.97933 *

11 37 0.09536 0.58413 0.32051 *

12 50 0.95656 0.00534 0.03810 *

Berdasarkan matriks iterasi terakhir, kelompok/klasterberdasarkan pusatklaster(centroid) terbentuk sebanyak 3 klaster yaitu:

- Pusat klaster pada klaster 0 adalah 48.6770 - Pusat klaster pada klaster 1 adalah 32.2828

- Pusat klaster pada klaster 2 adalah 43.3696

Dari ketiga pusat klaster tersebut dapat diperoleh informasi bahwa:

1. Kelompok pertama yang memiliki rata-rata jumlah penjualan sekitar 48.6770 cenderung masuk sebagai kelompok penjualan tinggi.

2. Kelompok kedua yang memiliki rata-rata jumlah penjualan sekitar 32.2828 cenderung masuk sebagai kelompok penjualan rendah.

(53)

38

3.4 . Analisis Komponen Sistem

3.4.1 Data flow diagram (DFD)

Diagram Alir Data (DAD) atau Data Flow Diagram adalah representasi grafik yangmenggambarkan informasi dan transformasi informasi yang diaplikasikan sebagai data yang mengalir dari masukan (input) dan keluaran (output).

DFD dapat digunakan untuk merepresenasikan sebuah sistem atau perangkatlunak pada beberapa level abstraksi. DFD dibagi menjadi beberapa level yang lebih detail untuk mrepresentasikan aliran informasi atau fungsi yang lebih detail. DFD menyediakan mekanisme untuk pemodelan fungsional ataupun pemodelan aliran informasi. Oleh karena itu, DFD lebih sesuai digunakan untuk memodelkan fungsiperangkat lunak yang akan diimplementasikan menggunakan pemrograman terstruktur karena pemrograman terstruktur membagi-bagi bagiannya dengan fungsi fungsi dan prosedur-prosedur (Shalahuddin, 2011).

3.4.1.1. DFD Level 0

DFD level 0 menggambarkan sistem yang akan dibuat sebagai suatu entitas tunggal yang berinteraksi dengan aktor maupun sistem lain. DFD level 0 digunakan untuk menggambarkan interaksi antara sistem yang akan dikembangkan dengan entitas luar. Gambar DFD level 0 yang akan dibangun dapat dilihat pada Gambar 3.2.

Gambar 3.2. DFD Level 0

(54)

(output), yaitu pesan login, menampilkan data, menampilkan klaster baru yang terbentuk, menampilkan hasil analisa data dan menampilkan kelompok klaster.

3.4.1.2. DFD Level 1

DFD level 1 digunakan untuk menggambarkan modul-modul yang dalam sistem yang akan dikembangkan. DFD level 1 merupakan hasil breakdown DFD level 0 yang sebelumnya dibuat. Gambar DFD level 1 dari sistem yang akan dibangun dapat dilihat pada Gambar 3.3:

(55)

40

3.4.2. Flowchart

Perancangan sistem dibangun menggunakan bahasa pemrograman PHP dengan database menggunakan mysql dan akan dianalisis dengan algoritma Fuzzy C-Means. Flowchart algoritma Fuzzy C-Means dapat dilihat pada Gambar 3.4.

(56)

3.4.3. Sitemap aplikasi

Sitemap aplikasi merupakan gambaran nyata bagaimana user dapat menjalankan aplikasi, menu-menu apa saja yang dapat diakses dan bagaimana caranya. Sitemap dapat dilihat pada Gambar 3.5.

Gambar 3.5 Sitemap Aplikasi

3.5. Perancangan Sistem

(57)

42

Gambar 3.6. Rancangan tampilan login

Keterangan :

A. Form untuk melakukan login agar pengguna dapat masuk kedalam sistem analisa penjualan dengan menginput username dan password. Pengguna akan masuk sebagai admin.

Tampilan awal pengguna sebagai Admin, terdapat tiga menu yaitu menu home, menu Manage Data, dan menu Admin. Rancangan tampilan awal dapat dilihat pada Gambar 3.7.

Gambar 3.7. Rancangan tampilan home

Keterangan :

A. Menu home, menu Manage Data dan menu Admin.

(58)

Rancangan tampilan halaman Home setelah memilih form kategori produk, produk dan tahun dapat dilihat pada Gambar 3.8

Gambar 3.8. Racangan tampilan Home setelah di clustering

Keterangan :

A. Menu Home setelah dicluster

B. Diagram jumlah barang yang terjual pertahun

C. Hasil clustering untuk melihat kelompok data yang telah diclustering.

Rancangan tampilan halaman input data penjualan dari sub-menu manage data dapat dilihat pada Gambar 3.9.

(59)

44

Keterangan :

A. Menu manage data dengan sub-menu input data penjualan, daftar kategori produk, dan daftar periode.

B. Form input data penjualan, dimana admin harus menginput data seperti Nama Kategori produk, Produk, Tahun, dan Data Perbulan dengan bagian:

B1. Jumlah Penjualan Produk B2. Jumlah Invoice Produk

Rancangan tampilan halaman daftar kategori produk dari sub-menu manage data dapat dilihat pada Gambar 3.10.

Gambar 3.10. Rancangan tampilan daftar kategori produk

Keterangan :

A. Menu manage data dengan sub-menu input data penjualan, daftar kategori produk, daftar produk dan daftar periode.

B. Tabel yang berisikan daftar kategori produk dengan kelola data seperti edit dan hapus.

(60)

Gambar 3.11. Rancangan tampilan daftar produk

Keterangan :

A. Menu manage data dengan sub-menu input data penjualan, daftar kategori produk, dan daftar periode.

B. Tabel yang berisikan daftar produk dengan kelola data seperti edit dan hapus. Rancangan tampilan halaman daftar periode dari sub-menu manage data dapat dilihat pada Gambar 3.12.

Gambar 3.12. Rancangan tampilan daftar periode

Keterangan :

C. Menu manage data dengan sub-menu input data penjualan, daftar kategori produk, dan daftar periode.

(61)

46

Rancangan tampilan halaman kelola pengguna dari sub-menu kelola dapat dilihat pada Gambar 3.13.

Gambar 3.13. Rancangan tampilan admin

Keterangan : A. Menu Admin

(62)

Pada bab ini akan dijelaskan tentang proses pengimplementasian metodeclustering pada data penjualan dengan algoritma Fuzzy C-Means pada sistem, sesuai dengan perancangan sistem yang telah dilakukan di Bab 3 serta melakukan pengujian sistem yang telah dibangun.

4.1. Implementasi Sistem

Tahap implementasi sistem merupakan proses pengubahan spesifikasi sistem menjadi sistem yang dapat dijalankan. Implementasi dan analisis dan perancangan sistem ini berbasis web dengan menggunakan bahasa pemrograman PHP.

Spesifikasi software dan hardware yang digunakan

Spesifikasi perangkat lunak (software) dan perangkat keras (hardware) yang digunakan dalam membangun sistemini adalah sebagai berikut.

1. Sistem operasi Windows 7 Ultimate 64-bit (6. 1, Build 7600).

2. Processor Intel(R) Core(TM) i5-2430M CPU @ 2.40GHz (4 CPUs), ~2.4GHz. 3. Memory 4096MB RAM Kapasitas hardisk 120 GB.

4. XAMPP versi 1.8.3-1 5. MySQL versi 5.6.16

4.2. Implementasi Perancangan Antarmuka

(63)

48

komputer (PC) atau laptop, kemudian copy folder program kedalam folder htdocs serta import databsenya (.sql), kemudian buka aplikasi pada browser.

4.2.1. Halaman login

Untuk bisa masuk kedalam sistem pola data penjualan, pengguna harus melakukan login terlebih dahulu. Halaman login merupakan halaman yang tampil pertama sekali saat sistem dijalankan. Halaman login dapat dilihat pada Gambar 4.1.

Gambar 4.1. Halaman Login

Pada halaman login, pengguna diwajibkan untuk mengisi username dan password dengan benar sesuai ketentuan sistem agar dapat masuk kedalam halaman utama. Pengguna login sebagai admin agar masuk kedalam sistem.

4.2.2. Halaman home

(64)

Gambar 4.2. Halaman Home

4.2.3. Halaman Manage

Halaman ini merupakan halaman untuk mengelola sistem ini. Terdapat sub-sub menu seperti input data, data penjualan, daftar kategori dan daftar periode. Halaman manage dapat dilihat pada Gambar 4.3.

Gambar 4.3 Halaman Manage

4.2.4. Halaman Input Data

(65)

50

Gambar 4.4. Halaman Input data

4.2.5. Halaman Data

Halaman ini merupakan sub menu dari halaman Manage. Pada halaman ini, admin dapat melihat, mengedit dan menghapus data penjualan. Halaman Data pada Gambar 4.5.

Gambar 4.5. Halaman data

4.2.6. Halaman kategori

(66)

Gambar 4.6. Halaman kategori

4.2.7. Halaman periode

Halaman ini merupakan sub menu dari halaman Manage. Pada halaman ini, admin dapat melihat, mengedit dan menghapus periode data penjualan. Halaman kategori pada Gambar 4.7.

(67)

52

4.2.8. Halaman admin

Halaman ini merupakan menu untuk kelola admin. Halaman admin pada Gambar 4.8.

.

Gambar 4.8. Halaman Admin

4.3. Pengujian Sistem

Pengujian sistem dilakukan untuk memeriksa kekompakkan atau kinerja antar komponen sistem yang diimplementasikan. Tujuan utama dari pengujian sistem adalah untuk memastikan bahwa elemen-elemen atau komponen-komponen dari sistem telah berfungsi sesuai dengan yang diharapkan. Metode pengujian yang digunakan adalah metode pengujian black box. Pengujian black box merupakan pengujian yang dilakukan pada interface sistem yang digunakan untuk mendemonstrasikan fungsi sistem yang dioperasikan(Gea, 2011).

4.3.1. Rencana pengujian sistem

Adapun rancangan pengujian sistem yang akan diuji dengan teknik pengujian Black Box dapat dilihat pada Tabel 4.1.

Tabel 4.1. Rencana Pengujian Sistem

No. Komponen sistem yang diuji Butir Uji

1 Login _{Tombol “}_Login_”

(68)

Tabel 4.1. Rencana Pengujian Sistem(lanjutan)

No. Komponen sistem yang diuji Butir Uji

3 Halaman Home Data penjualan yang tersimpan

Halaman Manage Link input data

Link data penjualan

Link daftar kategori

Link daftar periode

4 Logout Link Logout

4.3.2. Kasus dan hasil pengujian sistem

Berikut adalah kasus untuk menguji sistem yang dibangun menggunakan metode Black Box berdasarkan rencana pengujian pada Tabel 4.1. Hasil pengujian dengan menggunakan metode Black Box dapat dilihat pada Tabel 4.2.

Tabel 4.2. Hasil Pengujian No. Komponen

sistem

yang diuji

Skenario uji Hasil yang diharapkan Hasil

Pengujian

1 Login Masukkan

username dan password yang benar.

Ketika data untuk login

dimasukkan dan tombol Login

diklik, maka akan dilakukan proses pengecekkan data untuk login. Apabila data login benar, maka akan langsung masuk ke halaman yang sesuai dengan status login.

Berhasil

Ketika menu ditekan, maka akan berpindah ke halaman yang dituju.

(69)

54

Tabel 4.2. Hasil Pengujian (lanjutan) No. Komponen

sistem

yang diuji

Pengujian

Ketika kategori produk, produk dan tahun telah dipilih, data tersebut akan dicluster dan menampilkan hasil cluster.

Berhasil kategori produk, tahun, dan jumlah penjualan, jumlah invoice untuk semua bulan. Tombol “simpan” untuk menyimpan data yang dimasukkan ke database.

Berhasil

Memilih submenu Data

Menampilkan data penjualan seluruh kategori produk, dan terdapat pilihan hanya untuk memilih kategori yang diinginkan. Terdapat link edit dan delete. Link “edit” akan mengarah kehalaman edit data penjualan dan link “hapus” dapat menghapus data dari sistem.

(70)

Tabel 4.2. Hasil Pengujian (lanjutan) No. Komponen

sistem

yang diuji

Pengujian

Memilih submenu Kategori

Kategori produk yang telah tersimpan dalam sistem dan terdapat link edit dan delete. Link “edit” akan mengarah kehalaman edit kategori dan link “hapus” dapat menghapus kategori dari sistem.

Berhasil

Memilih submenu Periode

Daftar periode yang telah tersimpan dalam sistem dan terdapat link edit dan delete. Link “edit” akan mengarah kehalaman edit kategori dan link “hapus” dapat menghapus kategori dari sistem.

Berhasil

6 Logout Klik Tombol

logout

Pada saat tombol logoutadmin akan keluar dari sistem

Berhasil

4.3.3. Pengujian sistem

Pengujian sistem dilakukan dengan menggunakan data penjualan sesuai kategori produk yang dipilih. Langkah-langkah pengujian sebagai berikut:

(71)

56

2. Saat admin telah masuk kedalam sistem, admin menginput data pada form input data. Tampilan setelah data diinput seperti Gambar 4.9.

Gambar 4.9. Hasil input data

3. Setelah data diinput, maka data penjualan akan tersimpan didalam sistem. Lalu, pada halaman home, Admin memilih kategori produk, produk dan tahun yang akan dicluster. Pada Gambar 4.10 admin memilih kategori produk susu,untuk produk Bayi < 5 tahun dan tahun 2011 untuk dicluster.

Gambar 4.10 Proses clustering

(72)

Gambar 4.11 Ouput clustering

Pada Gambar 4.12. Tampilan output dari sistem clustering, menampilkan diagram penjualan barang pertahun dan 3 (tiga) kelompok/cluster. Hasil dari pengelompokan tersebut didapatkan informasi bahwa:

1. Penjualan susu bayi < 5 tahun berada pada kelompok penjualan rendah tahun 2011 pada saat bulan Maret, April, Agustus dan November.

2. Penjualan susu bayi < 5 tahun berada pada kelompok penjualan sedang pada tahun 2011 pada saat bulan Januari, Februari, Mei, Juli dan Oktober.

3. Penjualan susu bayi < 5 tahun berada pada kelompok penjualan tinggi pada tahun 2011 pada saat bulan Juni, September dan Desember.

(73)

58

Tabel 4.3. Tingkat Penjualan Produk Kategor

(74)

Tabel 4.3. Tingkat Penjualan Produk (lanjutan)

Beras Harga < 10000 Rendah

(75)

60

Tabel 4.3. Tingkat Penjualan Produk (lanjutan) Kategor

Dari tabel 4.3 dapat dilihat pola penjualan seperti:

1. Kategori produk susu yang terdiri dari bayi kurang dari 5 tahun, balita, anak 7 hingga 12 tahun, manula dan ibu hamil memiliki tingkat penjualan yang tinggi di setiap akhir tahun.

(76)

3. Produk beras dengan harga lebih dari Rp. 10.000,- memiliki tingkat penjualan tinggi pada bulan Juli, Agustus dan Desember dan tingkat penjualan rendah disetiap awal bulan.

4. Produk Minyak kelapa/kelapa sawit memiliki tingkat penjualan tinggi pada bulan Juli, Agustus dan Desember dan tingkat penjualan rendah pada bulan April, Mei, Juni dan Oktober.

(77)

BAB 5

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Kesimpulan yang dapat diambil dari hasil clustering pada data penjualan menggunakan algoritma fuzzy c-means antara lain :

1. Proses clustering pada data penjualan menggunakan algoritma Fuzzy C-Means pada penelitian ini dapat menentukan tingkat data penjualan.

2. Dari hasil penelitian pada data penjualan 2011 hingga 2013 diperoleh informasi bahwa seluruh kategori produk memiliki tingkat penjualan yang tinggi pada pada bulan Juli, Agustus dan Desember.

5.2. Saran

1. Penelitian selanjutnya dapat dikembangkan dengan menambah parameter lain. 2. Kekurangan dalam penelitian ini adalah data produk yang digunakan hanyalah

berupa general product atau berdasarkan jenisnya. Sehingga akan lebih baik jika menggunakan data produk berdasarkan merk.