Analisa Algoritma K-Means Untuk Menentukan Strategi Marketing
Bias Yulisa Geni1,*, Okto Kurnia2, Nova Hayati3, Muhammad Thoriq4, Kiki Hariani Manurung3
1Teknik dan Informatika, Teknik Informatika, Universitas Dian Nusantara, Jakarta Barat, Indonesia
2Teknologi dan Desain, Desain Komunikasi Visual, Universitas Indonesia Mandiri, Jakarta Barat, Indonesia
3Sistem Informasi, Universitas Adzkia, Padang, Indonesia
4Informatika, Universitas Adzkia, Padang, Indonesia
Email: 1,*[email protected], 2[email protected], 3[email protected], 4[email protected],
Email Penulis Korespondensi: [email protected]
Abstrak−Penelitian ini dieksplorasi penerapan algoritma K-Means dalam bidang marketing untuk meningkatkan efektivitas strategi pemasaran Toko Kosmetik ABC. Data penjualan dapat diproses dengan data mining untuk dapat dijadikan pengambilan keputusan di Toko Kosmetik ABC. Salah satu teknik yang ada pada data mining dalah Clustering, yang digunakan untuk mengkategorikan data. Algoritma K Means digunakan untuk mengidentifikasi pola tersembunyi dalam data. Dengan menggunakan data penjualan bodylotion, riset ini bertujuan untuk mengklasifikasikan konsumen ke dalam beberapa kelompok.
Kelompok data yang dimaksud adalah data dengan penjualan yang banyak diminati oleh konsumen dan data yang kurang diminati oleh konsumen. Hasil clustering menggunakan k=2 didapatkan cluster 1 terdiri dari 5 produk dengan transaksi produk terjual adalah 1295 produk dalam hal ini dikategorikan bahwa cluster 1 adalah kelompok data produk yang dengan jumlah terjual meningkat dan dapat memberikan keuntungan di Toko Kosmetik ABC. Sedangkan untuk cluster 2 memiliki 1 data dengan transaksi produk terjual adalah 214 dan dikategorikan sebagai data dengan produk yang kurang diminati oleh konsumen sehingga tidak perlu adanya penambahan stok tersedia di gudang oleh Toko Kosmetik ABC. Hasil dari penelitian ini menunjukkan bahwa segmentasi pelanggan berbasis K Means dapat meningkatkan personalisasi dalam komunikasi pemasaran dan meningkatkan efisiensi alokasi sumber daya marketing. Studi ini memberikan wawasan baru tentang bagaimana teknik data mining dapat diintegrasikan dalam strategi marketing untuk menentukan kesediaan produk untuk kedepannya.
Kata Kunci: K-Means; Clustering; Iterasi; Marketing; Data Mining
Abstract−This research explored the application of the K-Means algorithm in the marketing field to increase the effectiveness of ABC Cosmetic Store marketing strategies. Sales data can be processed using data mining to be used as decision making at ABC Cosmetic Stores. One of the techniques in data mining is Clustering, which is used to categorize data. The K Means algorithm is used to identify hidden patterns in the data. By using bodylotion sales data, this research aims to classify consumers into several groups. The data group in question is sales data that is of great interest to consumers and data that is of little interest to consumers. The results of clustering using k=2 show that cluster 1 consists of 5 products with product transactions sold being 1295 products. In this case, it shows that cluster 1 is a group of product data whose quantity sold has increased and can provide profits at the ABC Cosmetic Store. Meanwhile, cluster 2 has 1 data with 214 product transactions sold and is grouped as data with products that are less popular with consumers so there is no need to increase the stock available in the warehouse by ABC Cosmetic Shop. The results of this research show that K Means-based customer segmentation can increase personalization in marketing communications and increase the efficiency of marketing resource allocation. This study provides new insights into how data mining techniques can be involved in marketing strategies to determine product availability for the future.
Keywords: K-Means; Clustering; Iteration; Marketing; Data Mining
1. PENDAHULUAN
Perkembangan teknologi yang semakin pesat, tentunya memberikan dampak diberbagai bidang, salah satunya bidang penjualan. Persaingan bisnis, menuntut pelaku bisnis untuk selalu mempertahankan bisnisnya dalam persaingan khususnya dalam persaingan penjualan. Yang menjadi tugas dari para pembisnis adalah menemukan suatu pola yang dapat meningkatkan penjualan dan pemasaran di perusahaan, salah satunya adalah pemanfaatan penjualan[1]. Berdasarkan penelitian yang dilakukan oleh Simanjuntak dkk memberikan penejlasan pada penelitian yang dilakukan bahwa data mining merupakan solusi yang dapat digunakan untuk proses ekstraksi informasi pencarian pola atau trend yang diinginkan dalam basis data yang besar. Pola-pola ini dapat memberikan suatu analisis data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti untuk mendukung keputusan. Pada penelitian yang dilakukan menerapkan metode Frequent Pattern Growth pada Data Transaksi Penjualan PT Mora Telematika Indonesia untuk Rekomendasi Strategi Pemasaran Produk Internet.
Dilakukan analisa berdasarkan data penjualan sehingga memberikan keputusan berupa produk mana yang laris dan tidak laris. Data mining memiliki berbagai macam metode dan algoritma untuk pengambilan keputusan.[2].
Clusterisasi minat pembelian produk kecantikan diharapkan dpaat menjadi salah satu sumber pengambilan keputusan untuk menjamin ketersediaan produk di Toko Kosmetik ABC. Metode clustering adalah salah satu metode pada data mining. Clustering adalah memisahkan data ke dalam kelompok-kelompok yang memiliki obyek dengan karakteristik yang serupa. Clustering ini merupakan awalan dari sebuah data mining[3]. KMeans Clustering adalah suatu metode penganalisaan data atau metode data mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi[4].
Data mining dapat berupa metode yang digunakan dalam pengolahan data berskala besar. Sehingga data mining memiliki peranan yang sangat penting dalam berbagaia bidang kehidupan, seperti industri, keuangan, cuaca, ilmu dan teknologi. Hasil dari pengolahan data dengan metode data mining ini dapat digunakan dalam mengambil keputusan di masa datang. Data Mining ini juga dikenal dengan istilah pattern recognition. Data yang diolah bersumber dari beberapa semester sebelumnya dan dikelompokkan kedalam beberapa klaster. Dengan Algoritma K-Means clustering dapat memberikan peringatan lebih awal terhadap jadwal pertemuan yang akan diadakan dalam bulan berjalan [5]. Data penjualan yang diperoleh penulis cukup terorganisasi dengan baik, namun akan lebih baik lagi jika diolah kembali dengan sistem pengolah data seperti data mining yang akan digunakan untuk menentukan pola kuantitas penjualan. Salah metode data mining yang diterapkan penelitian ini yaitu metode clustering, merupakan sebuah metode pengelompokan data un-supervised atau tidak berlabel. penjualan merupakan aspek terpenting untuk mendapatkan pendapatan perusahaan dengan menggunakan algoritma K- Means [6]. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang tersimpan di dalam database besar. Data mining adalah bagian dari proses KDD (Knowledge Discovery in Databases) yang terdiri dari beberapa tahapan seperti pemilihan data, pra pengolahan, transformasi, data mining, dan evaluasi hasil. KDD secara umum juga dikenal sebagai pangkalan data. Data Mining mempunyai lima fungsi yaitu classification, yaitu menyimpulkan definisi- definisi karakteristik sebuah grup. Contoh: pelanggan-pelanggan perusahaan yang telah berpindah kesaingan perusahaan yang lain. Clustering, yaitu mengindentifikasikan kelompok-kelompok dari barang-barang atau produk-produk yang mempunyai karakteristik khusus (clustering berbeda dengan classification, dimana pada clustering tidak terdapat definisi- definisi karakteristik awak yang di berikan pada waktu classification) [7]. Data Mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terikat dari berbagai database besar. Data mining merupakan pengetahuan yang tersembunyi di dalam database yang di proses untuk menemukan pola dan teknik statistik matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan dari database tersebut[8].
Toko Kosmetik ABC adalah sebuah toko yang bergerak dibidang penjualan produk kecantikan. Toko Kosmetik ABC sudah berdiri sejak 12 Juli 2022 yang terletak di pekayon, Kota Bekasi. Toko Kosmetik ABC menjual berbagai macam bentuk brand kecantikan, namun dari berbagai brand yang dijual tentu tidak semuanya laris terjual. Data-data penjualan pada toko ABC ini tidak tersusun degngan baik, sehingga data tersebut hanya berfungsi sebagai arsip bagi toko dan tidak dapat dimanfaatkan untuk pengembangan strategi marketing.
Sebaiknya, data yang telah tersedia dapat dijadikan sebagai sistem pengambilan keputusan untuk solusi bisnis.
Pada penelitian ini digunakan data yang berasal dari laporan penjualan produk di Toko Kosmetik ABC. Laporan Penjualan yang digunakan adalah data penjualan salah satu produk bodylotion dengan bulan penjualan pada bulan Juli, Agustus dan September di tahun 2023. Berdasarkan dari uraian diatas, maka penelitian yang akan dilakukan bertujuan untuk mengetahui clusterisasi salah satu data produk kecantikan yaitu bodylotion dengan teknik data mining, pengolahan data tersebut menggunakan algoritma kmeans. Batasan masalah dari penelitian ini adalah data yang akan digunakan data penjualan dari Toko Kosmetik ABC. Analisis digunakan dengan menggunakan algoritma Kmeans. Output yang dihasilkan adalah kelompok produk dengan penjualan tinggi dan rendah. Tujuan dari penelitian ini adalah untuk mengelompokkan data produk pada Toko Kosemtik ABC berdasarkan pembelian produk yang tinggi, sedang dan rendah. Untuk produk dengan penjualan tinggi dikategorikan menjadi kelompok laris dan untuk penjualan dikategorikan untuk kelompok kurang laris. Hasil penelitian ini bermanfaat bagi bagian yang terkait dengan perencanaan kebutuhan produk di Toko Kosmetik ABC. yang membutuhkan jenis-jenis kelompok produk mana saja yang pembeliannya tinggi, sedang dan rendah setiap bulannya. Sehingga dapat digunakan sebagai acuan perencanaan kebutuhan produk kedepannya.
2. METODOLOGI PENELITIAN
2.1 Tahapan Penelitian
Metode pengumpulan data yang digunakan dalam penelitian ini adalah observasi, wawancara dan studi literatur.
Berikut adalah tahapan penelitian yang dilakukan :
Gambar 1. Tahapan Penelitian
Tahap pertama yang peneliti lakukan adalah mengumpulkan data, data yang digunakan adalah dataset data penjualan di Toko Kosmetik ABC pada Juli-September 2023 yang terdiri dari 20 sampel data dengan transaksi jual beli sebanyak 202, dengan atribut Nama Produk, Stok Tersedia, dan Stok Terjual.
2.2 Data Mining
Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara berbeda dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistic, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar [8]. Data mining adalah proses yang mempekerjakan suatu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisa dan mengekstraksi pengetahuan (Knowledge) secara otomatis. Atau dapat disimpulkan data mining adalah suatu proses menganalisa dan mengekstrak dari sekumpulan data yang sangat besar serta digunakan untuk membuat suatu keputusan bisnis yang sangat penting secara otomatis[9].
Gambar 2. Akar Ilmu Data Mining
Data mining adalah proses yang memperkerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untk menganalisa dan mengekstraksi pengetahuan (knowledge) secara otomatis. Definisi lain diantaranya adalah pembelajaran berbasis induksi (induction-based learning) adalah proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari. Knowledge Discovery in Databases (KDD) adalah penerapan metode seintifik pada data mining merupakan satu langkah dari bproses KDD[10].
2.3 Knowledge Discovery in Database (KDD)
Gambar 3. Proses KDD pada Data Mining
Knowledge discovery in database (KKD) seringkali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Dan tahapan dalam data mining ini adalah seperti proses KKD yang secara garis besar dapat dijelaskan sebagai berikut [9] :
a. Data selection
Pemilihan (seleksi) data baru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam data mining dimulai.
b. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
c. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining.
d. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu.
e. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KKD yang disebut interpretation
Knowledge Discovery in Database (KKD) adalah keseluruhan proses non trivial untuk mencari dan mengindentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru dan dapat bermamfaat dan di mengerti [11]. Knowledge Discovery in Database (KKD) adalah keseluruhan proses non trivial untuk mencari dan mengindentifikasi pola(pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru dan dapat bermamfaat dan di mengerti[12].
Knowledge Discovery in Database (KDD) adalah proses menemukan pengetahuan yang berguna dari sebuah data yang bervolume besar, dan sering disebut sebagai data mining. KDD adalah proses yang terorganisir untuk mengidentifikasi pola-pola yang berlaku, berguna dan mudah dipahami dari kumpulan data yang besar dan kompleks. Data mining adalah inti dari proses KDD, yang melibatkan dalam menyimpulkan algoritma yang menjelajahi data, mengembangkan model dan menemukan pola-pola yang sebelumnya tidak diketahui. Model ini digunakan untuk memahami fenomena dari data, analisis dan prediksi.
2.4 K-Means
Algoritma K-Means merupakan algoritma non hirarki yang berasal dari metode data clustering. Algoritma K- Means dimulai dengan pembentukan partisi klaster diawal kemudian secara iteraktif partisi claster ini diperbaiki hingga tidak terjadi perubahan yang signifikan pada partisi claster[13]. Algoritma K-Means merupakan algoritma yang relatif sederhana untuk mengklasifikasi atau mengelompokkan sejumlah besar objek dengan atribut tertentu kedalam kelompok (cluster) sebanyak k pada algoritma K-Means, jumlah cluster sudah ditentukan lebih dahulu [11]. Algoritma K-means dimulai dengan titik K yang dilakukan sebagai pusat massa dari K cluster potensial, titik pertama ini adalah posisi yang diambil secara acak, selanjutnya centroid dari cluster dihitung ulang dengan meratakan semua dataset dari satu cluster sampai centroid tidak lagi bergerak atau langkah optimalisasi maksimal tercapai[14]. K-Means merupakan salah satu metode pengelompokan. Teknik pengelompokan datanya sederhana dan cepat. Ada banyak pendekatan untuk membuat cluster, diantaranya adalah membuat aturan yang mendikte keanggotaan dalam grup yang sama berdasarkan tingkat persamaan diantara anggota-anggotanya[15]. K-Means merupakan Algoritma clustering yang berulang-ulang. Algoritma K- Means dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya cluster yang ingin dibentuk.Kemudiantetapkannilai-nilaiKsecara random,untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, meanatau “means”. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid [16]. K-Means merupakan algoritma pengelompokkan iteratif yang melakukan partisi set data ke dalam sejumlah k cluster atau kelompok yang sudah ditetapkan di awal. Algoritma ini banyak digunakan secara luas pada beberaa bidang termasuk penggalian data, analisis statistic, dan aplikasi bisnis lainnya. K-Means salah satu metode clusteringnon hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam clustersehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu clusteryang sama[17].
2.5 Clustering
Pengertian clustering keilmuan dalam data mining adalah pengelompokan sejumlah data atau objek ke dalam cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. Clustering mempartisi data set menjadi beberapa kelompok, dimana anggota dalam satu kelompok memiliki similaritas yang tinggi dan similaritas antar kelompok rendah[15].
3. HASIL DAN PEMBAHASAN
3.1 Pengumpulan Data
Data yang digunakan pada penelitian ini adalah data penjualan beberapa merk produk bodylotion yang ada di Toko Kosmetik ABC. Data penjualan didapatkan dari hasil observasi dan wawancara dengan pihak internal di Toko Kosmetik ABC dalam hal ini adalah owner. Berdasarkan hasil wawancara tersebut didapatkan data penjualan pada bulan Juli sampai dengan September 2023. Data yang didapatkan berupa catatan manual yang tersedia di kertas dengan detail nama produk, stok tersedia dan stok terjual.
3.2 Tahapan Algoritma K-Means
K-Means didefinisikan sebagai algoritma yang bertugas membagi data menjadi kelompok berdasarkan tingkat kemiripannya. Keunggulan k-means dibandingkan algoritma yang lainnya adalah lebih sederhana, mudah diimplementasikan, tidak lambat, mudah disesuaikan, serta paling sering digunakan dalam proses data mining[18].
Adapun prosedur perhitungan Algoritma K-Means Clustering analysis diuraikan sebagai berikut [19]:
a. Menentukan banyaknya cluster
Dalam menentukan banyaknya cluster diharuskan tidak lebih dari jumlah kriteria yang ada.
b. Menentukan titik pusat cluster (centroid)
Dalam menentukan titik pusat cluster (centroid) dengan mengambil nilai minimal, rata-rata dan maksimal, jika akan dibuat 3 cluster, karna pada penelitian ini penulis membuat 2 cluster jadi hanya mengambil nilai minimal dan maksimal pada setiap kriteria.
c. Menghitung antara jarak titik data objek ke titik datapusat (centroid)
Pada tahap perhitungan jarak ini menggunakan rumus dengan Euclidean Distance sebagai berikut:
𝑑(𝑥,𝑦)= √∑ (𝑥𝑖 − 𝑦𝑖)²𝑖 (1)
Keterangan:
d (x,y) : jarak antara data pada titik x dan y x : titik data objek
y : titik data centroid I : jumlah atribut data
Metode K-Means dapat diimplementasikan dalam berbagai bidang termasuk citra maupun suara. K-Means memiliki keunggulan diantaranya mudah diimplementasikan, waktu perhitungan dan komputasi yang relative lebih cepat, dan umum digunakan. Dibalik kelebihannya K-Means memiliki beberapa kekurangan diantaranya sulitnya menentukan nilai kyang tepat agar hasil clustering optimal, K-means akan susah divisualisasikan jika atribut yang digunakan terlalu banyak karena dalam metode K-means atribut yang digunakan mencerminkan dimensidata pada K-Means, dan proses clustering dilakukan dengan cara random yang mengakibatkan hasil clustering yang berbeda-beda.
3.2.1 Pemilihan Jumlah Cluster (K)
Menentukan jumlah cluster yang diinginkan. Pada bagian ini, peneliti akan menentukan pusat cluster, dalam hal ini adalah data 1 dan 5. Data yang dimaksud disini akan megacu pada data penjualan untuk nama produk dan transaksi yang terjadi dari Juli sampai dengan September 2023. Berikut adalah data penjualan Bodylotion dari Juli 2023 sd September 2023, disajikan pada tabel 1 berikut :
Tabel 1. Data Penjualan Bodylotion (Juli 2023 sd September 2023)
Bulan Transaksi Nama Produk Jumlah Tersedia Jumlah Terjual
Juli 2023 Body Lotion Scarlett Whitening 100 74
Juli 2023 Body Lotion Shinzui 100 67
Juli 2023 Body Lotion Love Beauty & Planet 100 71
Juli 2023 Body Lotion Bath and Body Works 100 61
Juli 2023 Body Lotion Nivea 100 98
Juli 2023 Body Lotion The Body Shop 100 46
Agustus 2023 Body Lotion Scarlett Whitening 100 60
Agustus 2023 Body Lotion Shinzui 100 79
Agustus 2023 Body Lotion Love Beauty & Planet 100 84
Agustus 2023 Body Lotion Bath and Body Works 100 95
Agustus 2023 Body Lotion Nivea 100 93
Agustus 2023 Body Lotion The Body Shop 100 52
Sep-23 Body Lotion Scarlett Whitening 100 51
Sep-23 Body Lotion Shinzui 100 89
Sep-23 Body Lotion Love Beauty & Planet 100 70
Sep-23 Body Lotion Bath and Body Works 100 67
Sep-23 Body Lotion Nivea 100 23
Sep-23 Body Lotion The Body Shop 100 58
Berdasarkan tabel 1 dilakukan pemilihan jumlah cluster. Berikut cluster data yang digunakan disajikan pada tabel 2 berikut:
Tabel 2. Penjualan untuk Cluster Data Nama Produk
Juli 2023 Agustus 2023 September 2023
Jumlah Tersedia
Jumlah Terjual
Jumlah Tersedia
Jumlah Terjual
Jumlah Tersedia
Jumlah Terjual Body Lotion
Scarlett Whitening 100 74 100 60 100 51
Body Lotion
Shinzui 100 67 100 79 100 89
Body Lotion Love
Beauty & Planet 100 71 100 84 100 70
Nama Produk
Juli 2023 Agustus 2023 September 2023
Jumlah Tersedia
Jumlah Terjual
Jumlah Tersedia
Jumlah Terjual
Jumlah Tersedia
Jumlah Terjual Body Lotion Bath
and Body Works 100 61 100 95 100 67
Body Lotion Nivea 100 98 100 93 100 23
Body Lotion The
Body Shop 100 46 100 52 100 58
Jumlah cluster yang digunakan sebanyak 2 cluster. Cluster dalam hal ini disimbolkan dengan K. K1 akan mendefinisikan produk laris, K2 akan mendefinisikan produk kurang laris. Tahapan selanjutnya adalah pemilihan secara random untuk centroid awal.
3.2.2 Inisialisasi Centroid: Secara acak memilih K titik data sebagai centroid awal.
Berdasarkan data pada Tabel 2. yang akan digunakan untuk cluster data. maka ditentukan pusat cluster pada data 1 dan data 5. Rumus yang digunakan untuk perhitungan Centroid adalah sebagai berikut :
Tabel 3. Titik Data K1 dan K2 sebagai Centroid Awal Iterasi 1 Pusat Cluster (1, 5)
Data 1 C1 74 60 51 Data 2 C2 98 93 23
Tabel 3 digunakan sebagai n titik centroid awala yang digunakan untuk menghitung jarak terdekat dan nilai Centroid berikutnya. Dalam penerapan algoritma K-means dihasilkan nilai titik tengah atau centroid dari data yang didapat dengan ketentuan bahwa clusterisasi yang diinginkan[20]. Berikut Tabel 4 yang menyajikan hasil perhitungan dari rumus euclidean distance dan didapatkan nilai C1 dan C2 sebagai berikut dapat dilihat pada tabel 4.
Tabel 4. Cluster Data Nama Produk Jumlah terjual
Juli 2023
Jumlah terjual Agustus 2023
Jumlah terjual
September 2023 C1 C2 Body Lotion Scarlett
Whitening 74 60 51 0 49,49
Body Lotion Shinzui 67 79 89 43,1 74,25
Body Lotion Love
Beauty & Planet 71 84 70 30,8 54,95
Body Lotion Bath and
Body Works 61 95 67 40,6 57,52
Body Lotion Nivea 98 93 23 49,5 0
Body Lotion The Body
Shop 46 52 58 29,9 74,9
Berikut perhitungan yang diimplementasikan untuk pengelompokan data sebagai berikut:
𝑑(1,1)= √∑ (74 − 74)𝑖 2+ (60 − 60)2+ (51 − 51)2= 0,0 𝑑(1,5)= √∑ (74 − 98)𝑖 2+ (60 − 93)2+ (51 − 23)2= 49,49 𝑑(2,1)= √∑ (67 − 74)𝑖 2+ (79 − 60)2+ (89 − 51)2= 43,1 𝑑(2,5)= √∑ (67 − 98)𝑖 2+ (79 − 93)2+ (89 − 23)2= 74,25 𝑑(3,1)= √∑ (71 − 74)𝑖 2+ (84 − 60)2+ (70 − 51)2= 30,8 𝑑(3,5)= √∑ (71 − 98)𝑖 2+ (84 − 93)2+ (70 − 23)2= 54,95 𝑑(4,1)= √∑ (61 − 74)𝑖 2+ (95 − 60)2+ (67 − 51)2= 40,6 𝑑(4,5)= √∑ (61 − 98)𝑖 2+ (95 − 93)2+ (67 − 23)2= 57,52 𝑑(5,1)= √∑ (98 − 74)𝑖 2+ (93 − 60)2+ (23 − 51)2= 49,5 𝑑(5,5)= √∑ (98 − 98)𝑖 2+ (93 − 93)2+ (23 − 23)2= 0,0 𝑑(6,1)= √∑ (67 − 74)𝑖 2+ (79 − 60)2+ (89 − 51)2= 29,9 𝑑(6,5)= √∑ (46 − 98)𝑖 2+ (52 − 93)2+ (58 − 23)2= 74,90 3.2.3 Pengelompokan Data
Mengalokasikan setiap titik data ke cluster dengan centroid terdekat berdasarkan hasil pada Tabel 2. Cluster Data. Berikut pengelompokan data yang disajikan pada Tabel 5 berikut :
Tabel 5. Pengelompokan Data Iterasi 1
Nama Produk
Jumlah terjual Juli
2023
Jumlah terjual Agustus
2023
Jumlah terjual September
2023
C1 C2 Jarak Terdekat
Kelompok Data Body Lotion
Scarlett Whitening
74 60 51 0 49,49 0 Cluster1
Body Lotion
Shinzui 67 79 89 43,1 74,25 43,1 Cluster1
Body Lotion Love Beauty &
Planet
71 84 70 30,8 54,95 30,8 Cluster1
Body Lotion Bath and Body Works
61 95 67 40,6 57,52 40,6 Cluster1
Body Lotion
Nivea 98 93 23 49,5 0 0 Cluster2
Body Lotion
The Body Shop 46 52 58 29,9 74,9 29,9 Cluster1
Berdasarkan hasil pengelompokan data didapatkan kesimpulan cluster 1 pada iterasi 1 terdapat pada data 1, 2, 3, 4 dan 6. Sedangkan untuk Cluster 2 terdapat pada data ke 5.
3.2.4 Pembaruan Centroid
Menghitung ulang centroid untuk setiap cluster berdasarkan titik data yang termasuk dalam cluster tersebut.
Mengacu pada kesimpulan iterasi 1 maka didapatkan cluster baru dengan ketentuan sebagai berikut : Tabel 6. Data Cluster Baru
Iterasi 2 Pusat Cluster Data 1 C1 63,8 74 67 Data 2 C2 98 93 23
Perhitungan untuk menghitung pusat cluster adalah nilai rata-rat dari setiap cluster. Berikut perhitungan sebagai berikut:
𝐶𝑥1𝑏𝑎𝑟𝑢=74+67+71+61+46
5 = 63,8 𝐶𝑦1𝑏𝑎𝑟𝑢=60+79+84+95+52
5 = 74,0 𝐶𝑧1𝑏𝑎𝑟𝑢=51+89+70+67+58
5 = 67,0 𝐶𝑥2𝑏𝑎𝑟𝑢=98
1 = 98,0 𝐶𝑦2𝑏𝑎𝑟𝑢=93
1 = 93 𝐶𝑧2𝑏𝑎𝑟𝑢=23
1 = 23
Cluster baru digunakan untuk melakukan pengelompokan data kembali. Perhitungan dilakukan sampai didapatkan kesimpulan setiap cluster sama dengan iterasi sebelumnya dalam hal ini Iterasi 1.
Tabel 7. Pengelompokan Data pada Iterasi 2
Nama Produk
Jumlah terjual Juli 2023
Jumlah terjual Agustus
2023
Jumlah terjual September
2023
C1 C2 Jarak Terdekat
Kelompok Data Body Lotion
Scarlett Whitening
74 60 51 23,58 49,49 23,58 Cluster1
Body Lotion
Shinzui 67 79 89 22,79 74,25 22,79 Cluster1
Body Lotion Love Beauty &
Planet
71 84 70 12,68 54,95 12,68 Cluster1
Nama Produk
Jumlah terjual Juli 2023
Jumlah terjual Agustus
2023
Jumlah terjual September
2023
C1 C2 Jarak Terdekat
Kelompok Data Body Lotion
Bath and Body Works
61 95 67 21,19 57,52 21,19 Cluster1
Body Lotion
Nivea 98 93 23 58,88 0 0 Cluster2
Body Lotion
The Body Shop 46 52 58 29,7 74,9 29,7 Cluster1
Kesimpulan cluster pada Tabel 5 untuk pengelompokan data pada iterasi ke dua adalah cluster 1 terdapat pada 1,2,3,4 dan 6. Sementara untuk Cluster 2 terdapat pada data ke 5.
3.2.5 Iterasi
Mengulangi langkah pengelompokan data dan pembaruan centroid sampai tidak ada perubahan signifikan dalam centroid atau sampai tercapai batas iterasi yang ditentukan. Berdasarkan proses pengelompokan data pada Iterasi 1 dan Iterasi 2 didapatkan kesimpulan cluster yang sama. Dalam hal ini, Iterasi 1 untuk cluster 1 berada pada data 1,2,3,4 dan 6, sedangkan untuk Cluster 2 terdapat pada data ke 5. Dan ini juga terjadi pada Iterasi ke 2. Sehingga Pengelompokan data dihentikan karna sudah ditemukan Cluster untuk setiap iterasinya sama.
3.2.6 Hasil Akhir
Setelah proses konvergensi, cluster akhir ditetapkan untuk setiap titik data. Untuk hasil temuan cluster untuk setiap iterasinya disajikan pada tabel berikut :
Tabel 8. Hasil Akhir Algoritma Kmeans pada data penjualan
Nama Produk
Jumlah Produk Terjual
2023 Iterasi I Iterasi II
Juli Agustus September C1 C2 Jarak Terdekat
Kelompok
Data C1 C2 Jarak
Terdekat
Kelompok Data Body
Lotion Scarlett Whitening
74 60 51 0 49,49 0 Cluster1 23,8 49,49 23,8 Cluster1
Body Lotion Shinzui
67 79 89 43,1 74,25 43,1 Cluster1 22,79 74,25 22,79 Cluster1
Body Lotion Love Beauty &
Planet
71 84 70 30,8 54,95 30,8 Cluster1 12,68 54,95 12,68 Cluster1
Body Lotion Bath and Body Works
61 95 67 40,6 57,52 40,6 Cluster1 21,19 57,52 21,19 Cluster1
Body Lotion Nivea
98 93 23 49,5 0 0 Cluster2 58,88 0 0 Cluster2
Body Lotion The Body Shop
46 52 58 29,9 74,9 29,9 Cluster1 29,7 74,9 29,7 Cluster1
Berdasarkan tahapan dari algoritma Kmeans untuk perhitungan data penjualan pada beberapa produk bodylotion didapatkan hasil akhir perhitungan bahasa pada iterasi I dan iterasi II terdapat persamaan cluster. Pada Iterasi I didapatkan Cluster 1 adalah data 1, 2, 3, 4, dan 6. Sedangan untuk cluster 2 adalah 5. Cluster 1 memdeskrispikan potensi jumalh produk yang banyak diminati oleh konsumen. Sedangkan untuk cluster 2 cendrung tidak diminati. Ini dilihat berdasarkan data penjualan real yang terjadi. Adanya penurunan signifikan penjualan ada september pada data ke 5 dengan produk Body Lotion Nivea sehingga untuk bulan berikutnya tidak perlu dilakukan penambahan stok untuk produk tersebut.
4. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan dengan mengimplementasikan analisa Kmeans pada data penjualan produk di Toko Kosmetik ABC dalam hal ini data penjualan produk yang digunakan adalah beberapa merk produk bodylotion. Data penjualan yang digunakan adalah data penjualan di tiga bulan terakhir pada juli 2023 sampai
dengan September 2023. Toko Kosmetik ABC hanya memiliki data penjualan tertulis di buku, pengolahan data dilakukan dengan excel. Algoritma KMeans digunakan untuk mengidentifikasi pola tersembunyi dalam data, memungkinkan Toko Kosmetik ABC untuk menyesuaikan pendekatan pemasarannya. Berdasarkan tahapan Algoritma Kmeans didapatkan konsistensi pengelompokan data pada Iterasi I dan Iterasi II. Pusat Cluster yang dipilih secara random pada Iterasi I adalah data 1 dan data 5. Selanjutnnya dilakukan perhitungan Algoritma Kmeans, dan didapatkan Cluster Baru berdasarkan pengelompokan data tersebut. Cluster Baru yang didapatkan pada Iterasi I digunakan untuk proses pengelompokan data pada Iterasi II. Pada Iterasi II ditemukan pusat cluster yang sama pada keberadaan data. Dari analisa pada data penjualan produk body lotion ditemukan bahwa Cluster 1 ada pada data 1, 2, 3, 4, dan 6 dalam hal ini adalah Body Lotion Scarlett Whitening, Body Lotion Shinzui, Body Lotion Love Beauty & Planet, Body Lotion Bath and Body Works dan Body Lotion The Body Shop. Produk pada cluster 1 disarankan kepada Toko Kosmetik ABC untuk dapat dilakukan penambahan stok lebih banyak karena pola beli yang diminati oleh konsumen adanya kenaikan pembelian disetiap bulannya sehingga cluster 1 didefinisikan sebagai produk yang banyak diminati oleh konsumen. Sementara untuk Cluster 2 adalah Body Lotion Nivea, tidak disarankan untuk melakukan penambahan stok karena minat yang kurang untuk produk tersebut dan masih banyak stok yang tersedia. Dalam hal ini Algoritma Kmeans dapat digunakan untuk memberikan prediksi terhadap pola beli konsumen pada suatu produk untuk menentuk strategy marketing oleh Toko Kosmetik ABC dalam melakukan pengadaan stok untuk bulan berikutnya
REFERENCES
[1] S. Nurajizah and A. Salbinda, “Penerapan Data Mining Metode K-Means Clustering Untuk Analisa Penjualan Pada Toko Fashion Hijab Banten,” Jurnal Teknik Komputer AMIK BSI, vol. 7, no. 2, 2021, doi: 10.31294/jtk.v4i2.
[2] H. E. Simanjuntak and W. Windarto, “Analisa Data Mining Menggunakan Frequent Pattern Growth pada Data Transaksi Penjualan PT Mora Telematika Indonesia untuk Rekomendasi Strategi Pemasaran Produk Internet,” Jurnal Media Informatika Budidarma, vol. 4, no. 4, 2020.
[3] A. H. Ardiansyah, W. Nugroho, N. H. Alfiyah, R. A. Handoko, M. Arfan Bakhtiar, “Penerapan Data Mining Menggunakan Metode Clustering untuk Menentukan Status Provinsi di Indonesia” 2020
[4] M. P. Tambunan, “Penerapan Data Mining Dalam Analisa Data Pemakaian Obat Dengan Menerapkan Algoritma K- Means,” Jurnal Informasi dan Teknologi Ilmiah (INTI), vol. 8, no. 3, 2021.
[5] I. Virgo, S. Defit, and Y. Yuhandri, “Klasterisasi Tingkat Kehadiran Dosen Menggunakan Algoritma K-Means Clustering,” Jurnal Sistim Informasi dan Teknologi, pp. 23–28, Mar. 2020, doi: 10.37034/jsisfotek.v2i1.17.
[6] D. Anggarwati, O. Nurdiawan, I. Ali, and D. A. Kurnia, “Penerapan Algoritma K-Means Dalam Prediksi Penjualan Karoseri,” vol. 1, no. 2, pp. 58–62, 2021.
[7] C. Zai and T. Komputer, “IMPLEMENTASI DATA MINING SEBAGAI PENGOLAHAN DATA,” Jurnal Portal Data, vol. 2, no. 3, 2022.
[8] D. P. Utomo and M. Mesran, “Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 4, no. 2, p. 437, Apr. 2020, doi:
10.30865/mib.v4i2.2080.
[9] D. Ramdhan, G. Dwilestari, R. Danar Dana, and A. Ajiz, “Clustering Data Persediaan Barang dengan Menggunakan Metode K-Means,” Jurnal Media Informasi Analisa dan Sistem, vol. 7, no. 1, 2022.
[10] N. S. Pakpahan, “Implementasi Data Mining Menggunakan Algoritma J48 Dalam Menentukan Pola Itemset Belanja Pembeli (Study Kasus: Swalayan Brastagi Medan),” Journal of Computing and Informatics Research, vol. 1, no. 1, 2021.
[11] N. Ema, T. Ningsih, A. M. H. Pardede, and S. Syahputra, “DATA MINING DALAM PENGELOMPOKKAN JUMLAH DATA PRODUKTIVITAS TANAMAN PANGAN MENGGUNAKAN METODE CLUSTRING K-MEANS ( STUDI KASUS : BADAN PUSAT STATISTIK KOTA BINJAI),” Jurnal Sistem Informasi Kaputama (JSIK), vol. 6, no. 2, 2022.
[12] A. A. Lubis, R. Buaton, and I. Ambarita, “Data Mining Pengelompokan Pasien Rawat Inap Berdasarkan Kelas Bpjs Menggunakan Metode Clustering (Studi Kasus : Rumah Sakit Umum Daerah Dr. Rm. Djoelham Binjai),” Jurnal Sistem Informasi Kaputama (JSIK), vol. 6, no. 2, 2022.
[13] A. Sulistiyawati and E. Supriyanto, “Implementasi Algoritma K-means Clustring dalam Penetuan Siswa Kelas Unggulan,”
vol. 15, no. 2, 2021.
[14] M. Nurdayat, N. Suarna, and Y. A. Wijaya, “Analisa Clustering untuk Mengelompokan Data Penayangan Film Bioskop Menggunakan Algoritma K-Means,” INTERNAL (Information System Journal, vol. 6, no. 1, pp. 68–78, 2023, doi:
10.32627.
[15] B. Juliartha Martin Putra, D. Ariani Finda Yuniarti, P. Pemeliharaan Komputer dan Jaringan, and A. Komunitas Negeri Pacitan Abstrak, “ANALISIS HASIL BELAJAR MAHASISWA DENGAN CLUSTERING MENGGUNAKAN METODE K-MEANS,” Jurnal POROS TEKNIK, vol. 12, no. 2, pp. 49–58, 2020.
[16] R. R. Putra and C. Wadisman, “Implementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K Means,” INTECOMS: Journal of Information Technology and Computer Science, vol. 1, no. 1, pp. 72–77, Mar. 2018, doi: 10.31539/intecoms.v1i1.141.
[17] D. P. Hidayatullah, R. I. Rokhmawati, and A. R. Perdanakusuma, “Analisis Pemetaan Pelanggan Potensial Menggunakan Algoritma K-Means dan LRFM Model Untuk Mendukung Strategi Pengelolaan Pelanggan (Studi Pada Maninjau Center Kota Malang),” vol. 2, no. 8, 2018.
[18] Y. Puspita Sari et al., “Implementasi Algoritma K-Means untuk Clustering Penyebaran Tuberkulosis di Kabupaten Karawang,” vol. 5, no. 2, p. 2020.
[19] A. Rohmah et al., “IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING ANALYSIS UNTUK MENENTUKAN HAMBATAN PEMBELAJARAN DARING (STUDI KASUS: SMK YASPIM GEGERBITUNG),” 2021.
[20] R. Wulan Sari and D. Hartama, Data Mining: Algoritma K-Means Pada Pengelompokkan Wisata Asing ke Indonesia Menurut Provinsi. Seminar Nasional Sains & Teknologi Informasi (SENSASI), 2018.