• Tidak ada hasil yang ditemukan

Penerapan Data Mining Dalam Pemilihan Produk Unggulan dengan Metode Algoritma K-Means Dan K-Medoids

N/A
N/A
Protected

Academic year: 2023

Membagikan "Penerapan Data Mining Dalam Pemilihan Produk Unggulan dengan Metode Algoritma K-Means Dan K-Medoids"

Copied!
8
0
0

Teks penuh

(1)

Penerapan Data Mining Dalam Pemilihan Produk Unggulan dengan Metode Algoritma K-Means Dan K-Medoids

Reza Gustrianda, Dadang Iskandar Mulyana

Program Studi Teknik Informatika, Sekolah Tinggi Ilmu Komputer Cipta Karya Informatika, Jakarta, Indonesia Email: 1r.gustrianda46@gmail.com, 2mahvin2012@gmail.com

Email Penulis Korespondensi: r.gustrianda46@gmail.com

Abstrak−Sebagai perusahaan bisnis, PT. XYZ Indonesia berkomitmen untuk selalu melakukan perbaikan terhadap segala aspek seperti, dalam hal menentukan produk unggulan. Untuk dapat melakukan hal tersebut, maka membutuhkan sumber informasi yang cukup banyak untuk dapat menganalisa produk apa saja yang menjadi unggulan atau sangat diminati dan produk apa saja yang kurang diminati. Untuk mengetahui produk apa saja yang masuk kedalam cluster produk unggulan, maka peneliti melakukan pengelompokan produk menggunakan metode clustering. Dalam metode clustering terdapat dua jenis analisis cluster yang memiliki algoritma yang saling berkaitan, yaitu k-means dan k-medoids. Hasil dari penelitian yang sudah dilakukan bahwa dari nilai Davies Bouldin untuk algoritma k-means adalah -0,430 dan dari nilai Davies Bouldin k-medoids adalah -1,392 yang berarti bahwa nilai Davies Bouldin untuk metode k-medoids memiliki nilai Davies Bouldin yang terkecil sehingga hasil pengelompokkan menggunakan metode k-means merupakan metode yang lebih tepat digunakan pada masalah pemilihan produk unggulan.

Kata Kunci: K-Means; K-Medoids; Clustering; Algoritma; Data Mining

Abstract−As a business company, PT. XYZ Indonesia is committed to always make improvements to all aspects such as, in terms of determining superior products. To be able to do this, it requires a sufficient source of information to be able to analyze what products are superior or in high demand and what products are less desirable. To find out what products enter the superior product cluster, then researchers do product grouping using the clustering method. In the clustering method there are two types of cluster analysis that have interrelated algorithms, namely k-means and k-medoids. The result of research already conducted that from the value of Davies Bouldin to the k-means algorithm is -0.430 and from the value of Davies Bouldin k-medoids is - 1,392 which means that the Davies Bouldin value for the k-medoids method has the smallest Davies Bouldin value so the grouping results using the k-means method are more appropriately used on the issue of superior product selection.

Keyword: K-Means; K-Medoids; Clustering; Algoritm; Data Mining

1. PENDAHULUAN

PT. XYZ Indonesia merupakan perusahaan distribusi dan logistik barang konsumsi, sebagai perusahaan bisnis PT.

XYZ Indonesia berkomitmen untuk selalu melakukan perbaikan terhadap segala aspek seperti, dalam hal menentukan produk unggulan. Untuk mengetahui produk apa saja yang masuk kedalam cluster produk unggulan, maka PT. XYZ Indonesia melakukan pengelompokan produk menggunakan metode clustering. Clastering merupakan pengelompokan beberapa records, observasi, atau kasus lain dalam sebuah kelas yang dibedakan berdasarkan objek yang saling serupa [1].

Dalam metode clustering terdapat dua jenis analisis cluster yang memiliki algoritma yang saling berkaitan, yaitu k-means dan k-medoids. Berdasarkan uraian diatas, maka diadakan penelitian tentang “Penerapan Data Mining Dalam Pemilihan Produk Unggulan Dengan Metode Algoritma K-Means Dan K-Medoids Pada PT. XYZ Indonesia”. Penelitian yang dilakukan oleh Ninda Nurul Rhamadani, dkk [2] melakukan penelitian untuk memudahkan peserta didik mendapatkan informasi kategori sekolah mereka dengan menerapkan algoritma k- means dan k-medoid. Perbedaan jumlah cluster pada performansi masing-masing algoritma memiliki mode perhitungan yang berbeda pada setiap iterasinya, tergantung dari kumpulan data yang digunakan dan titik centroid yang dihitung dalam algoritma tersebut.

Pada penelitian yang dilakukan oleh Dini Marlina, dkk [3] melakukan pengelompokan pada data sebaran anak cacat yang ada pada Provinsi Riau. Cluster yang dihasilkan dalam penelitian ini berjumlah tiga cluster.

Validitas yang digunakan dalam penelitian ini adalah validitas Silhoutte Coefficient, dan nilai validitas yang dihasilkan oleh algoritma k-medoids adalah 0.5009. algoritma k-means menghasilkan nilai validitas sebesar 0,1443. Hal ini menunjukkan bahwa algoritma k-medoids lebih baik daripada algoritma k-means untuk pengelompokan data yang didistribusikan oleh anak berkebutuhan khusus. Dalam penelitian yang dilakukan oleh Muhammad Bahtiar Isna Fuady dan Jaka Nugraha [4], metode k-means dan k-medoids memiliki kesamaan yaitu metode clustering berdasarkan kesamaan data. Hasil dari metode k-means adalah kelompok pertama terdiri dari 35 kota, yang merupakan tertinggi dibandingkan kelompok lain, dan kelompok kedua terdiri dari 29 kota, termasuk kelompok memiliki 2 variabel yang paling rendah dibandingkan variabel lain namun terdapat dua variabel juga yang tertinggi, kelompok 3 terdiri dari 18 kota yang tertinggi. Untuk metode k-medoids, kelompok 1 terdiri dari 32 kota yang paling rendah dibandingkan kelompok lain, tetapi variabel X1 lebih tinggi dari kelompok lain, dan kelompok 2 terdiri dari 22 kota yang memiliki 5 variabel tertinggi, kemudian kelompok 3 yang terdiri dari 23 kota dengan variabel X1 yang paling rendah dibandingkan kelompok lainnya. Berdasarkan nilai SSE, kami menemukan bahwa metode terbaik untuk pencarian ini adalah k-means clustering.

(2)

Pada penelitian yang dilakukan oleh Isnanul Kamila, dkk [5] menjelaskan pada Penelitiannya membandingkan kedua algoritma pada suatu dataset. Data yang digunakan adalah data transaksi bongkar muat PT Pelabuhan Indonesia I cabang Dumai 2017 berdasarkan atribut agen, deskripsi kargo, jenis dan tonase. Hasil yang diperoleh dari percobaan yang dilakukan adalah pengolahan k-means rata-rata hanya membutuhkan waktu 1 detik, sedangkan pengolahan data di KMedoids rata-rata membutuhkan waktu 1 menit dan 38 detik di RapidMiner. Nilai DBI untuk k-means lebih rendah dibandingkan dengan KMedoids, yaitu masing-masing 0,112 dan 0,119. Akuisisi klaster yang menguntungkan menunjukkan bahwa Buana Listya Tama TBK bertindak sebagai agen dominan PT, disusul Samudera Sarana Karunia sebagai agen PT. Pada penelitian yang dilakukan oleh Mufidah Herviany, dkk [6] menjelaskan diperlukannya pengolahan data untuk mengetahui daerah kabupaten/kota yang sering terjadi bencana tanah longsor.

Peneliti menggunakan pengolahan data dengan metode perbandingan algoritma k-means dan k-medoids.

Metode yang diperoleh dengan cara clustering menggunakan metode k-means lebih baik dari metode k-medoids untuk data kejadian longsor di Jawa Barat tahun 2019, dan jumlah maksimumnya k paling optimal adalah k = 6.

Perolehan cluster dominan, menunjukkan bahwa cluster 2 merupakan cluster dengan jumlah daerah paling banyak.

Dan jumlah kejadian terbanyak terletak pada cluster 5 dengan jumlah 4 daerah dan jumlah kejadian sebanyak 106 kejadian. Pada penelitian yang dilakukan oleh Dita Rizki Amalia, dkk [7] menjelaskan dalam penelitian ini adalah menggunakan data mining dengan k-medoids dan k-means, dimana dalam pengelompokkan kedua algorima ini memperoleh hal yang sama namun cara yang berbeda k-means dengan mengambil nilai rata-rata sedangkan k- medoids dengan mengambil nilai tengah. Hasil penelitian menunjukkan bahwa kedua metode menghasilkan kelompok yang sama yaitu rekomendasi rasa teh susu asli Thailand dan teh susu berdasarkan target penelitian nilai centroid sebesar 0,286. Pada penelitian yang dilakukan oleh Yunita Hilda Susanti dan Edy Widodo [8] menjelaskan metode k-means clustering dapat diketahui bahwa pada tahun 2015 di DIY terdapat 31 Puskesmas dengan kondisi layak, Kondisi 52 Puskesmas cukup baik, sedangkan kondisi 38 Puskesmas tidak begitu baik. Sedangkan dari metode klasterisasi k-medoids pada tahun 2015 DIY terdapat 35 Puskesmas dengan kondisi baik, 49 Puskesmas dengan kondisi cukup baik, dan 37 Puskesmas dengan kondisi kurang baik. Pada penelitian ini efek clustering menggunakan metode clustering KMeans lebih baik dibandingkan dengan metode clustering k-medoids karena menghasilkan rasio standar deviasi yang lebih kecil. Penelitian yang dilakukan oleh Athifaturrofifah, dkk [9], dalam penelitian ini menggunakan data hot spot dengan parameter lintang, bujur, kecerahan, kekuatan radiasi api dan kepercayaan diri dengan menggunakan metode pengelompokan k-means dan k-medoids. Penelitian ini bertujuan untuk membandingkan hasil pengelompokan metode k-means dengan k-medoids dengan menggunakan 42 data. Hasil penelitian ini menunjukkan bahwa metode k-means menghasilkan Silhouette. Skor koefisien lebih besar dari k-medoids. Sehingga, k-means dapat memberikan hasil pengelompokan yang lebih akurat. Dengan nilai Koefisien Silhouette yang lebih besar. Penelitian yang dilakukan Novita Lestari Anggraeni dan Shandy Tresnawati [10] menjelaskan mengenai perbandingan antara algoritma k-means dan algoritma k-medoids dalam klasterisasi, dan hasilnya dapat diusulkan menjadi pertimbangan untuk memutuskan dalam mengelola strategi promosi dalam kegiatan penerimaan mahasiswa baru Politeknik TEDC Bandung. Proses pengelompokan memerlukan beberapa data, seperti data input, antara lain nama pelamar, tempat lahir dan tanggal, alamat, agama, nomor telepon, asal sekolah, materi pembelajaran yang disukai dan pembawa informasi. tahun ajaran Pada tahun ajaran 2017. Atribut ini dibuat untuk lebih jelas melihat jenis sekolah yang dihadiri TEDC di Institut Teknologi Bandung. Penelitian yang dilakukan Neng Sri Lathifah dan Ana Hadiana menjelaskan [11] proses data mining dengan teknik clustering dengan menggunakan perbandingan algoritma k-means dan k-medoids. Berdasarkan hasil implementasi diperoleh k-means sebagai algoritma terbaik dengan nilai validasi dunn index 0,999 yang menghasilkan lima cluster sebagai rekomendasi strategi promosi berdasarkan promotion mix.

2. METODOLOGI PENELITIAN

Dalam metode penelitian ada beberapa urutan kerja yang harus diikuti, urutan kerja ini merupakan langkah- langkah yang harus dilalui dan dikerjakan sesuai dengan pokok permasalahan agar tidak menyimpang dari batasan masalah yang ditentukan. Adapun kerangka pemikiran yang digunakan di dalam pelaksanaan penelitian ini seperti gambar berikut [12] :

Gambar 1. Kerangka Pemikiran 2.1 Penerapan Metodologi

2.1.1 Pengumpulan Data

Data yang digunakan pada penelitian ini diperoleh dengan cara mengambil langsung data laporan penjualan dan stok gudang di PT. XYZ Indonesia. Data penelitian tersebut meliputi kode produk, nama produk, tanggal transaksi, jumlah penjualan dan jumlah persediaan barang. Data yang digunakan adalah data transaksi penjualan selama 6

Analisa dan Identifikasi Masalah

Pengumpulan Data

Analisis Sistem

Implementasi Metode

Pengujian Hasil Pengujian

(3)

bulan, yaitu bulan Mei sampai dengan Oktober 2020. Setelah data-data diperoleh, maka data tersebut digunakan untuk mengetahui produk apa saja yang masuk kedalam produk unggulan atau produk yang sangat diminati dan produk mana yang kurang diminati.

2.1.2 Penyeleksian Data

Data penjualan dan data stok gudang disaring terlebih dahulu dan diambil beberapa atribut dari tabel untuk dianalisis. Terdapat tiga atribut yang digunakan yaitu, kode barang, rata-rata penjualan selama 6 bulan dari bulan Mei sampai dengan bulan Oktober 2020 dan data stok gudang bulan Oktober 2020.

Tabel 1. Penyeleksian Data Data

Ke-

Kode Produk

Rata-Rata Penjualan

Stok Terakhir

1 Pl-0001 104 95

2 Pl-0002 156 116

3 Pl-0003 140 205

4 Pl-0004 124 219

5 Pl-0005 97 115

6 Pl-0006 17 50

7 Pl-0007 7 20

8 Pl-0008 61 38

9 Pl-0009 8 16

10 Hhc-0010 64 80

11 Hhc-0011 6 2

12 Hhc-0012 64 102

13 Hhc-0013 3 5

14 Hhc-0014 8 20

15 Hhc-0015 22 1

16 Enn-0016 65 48

17 Enn-0017 20 20

18 Enn-0018 31 30

19 Enn-0019 25 26

20 Enn-0020 33 14

21 Enn-0021 14 12

22 Enn-0022 58 98

23 Enn-0023 41 154

24 Enn-0024 27 551

25 Enn-0025 1 1

26 Gs-0026 - -

27 Gs-0027 - -

28 Gs-0028 - -

29 Gs-0029 - -

30 Gs-0030 - -

31 Gs-0031 - -

32 Gs-0032 - -

33 Gs-0033 - -

34 Gs-0034 - -

35 Gs-0035 33 81

36 Gs-0036 19 96

37 Gs-0037 4 26

38 Gs-0038 1 2

39 Gs-0039 1 8

40 Gs-0040 1 1

41 Gs-0041 16 51

42 Gs-0042 19 26

43 Gs-0043 20 25

44 Gs-0044 66 112

45 Gs-0045 60 98

46 Gs-0046 28 45

Data Ke-

Kode Produk

Rata-Rata Penjualan

Stok Terakhir

47 Gs-0047 69 87

48 Gs-0048 132 211

49 Gs-0049 77 166

50 Gs-0050 157 254

51 Bc-0051 7 12

52 Bc-0052 - -

53 Bc-0053 - -

54 Bc-0054 - -

55 Bc-0055 3 8

56 Ec-0056 19 25

57 Ec-0057 13 14

58 Ec-0058 3 -

59 Ec-0059 36 15

60 Ec-0060 - -

61 Ec-0061 - -

62 Ec-0062 - -

63 Ec-0063 - -

64 Ec-0064 - -

65 Ec-0065 - -

66 Ec-0066 - -

67 Ec-0067 - -

68 Ec-0068 - -

69 Ec-0069 - -

70 Ec-0070 4 -

71 Ec-0071 30 52

72 Ec-0072 20 16

73 Ec-0073 - -

74 Ec-0074 - -

75 Ec-0075 - -

76 Ec-0076 - -

77 Ec-0077 - -

78 Ec-0078 - -

79 Fc-0079 77 115

80 Fc-0080 54 152

81 Fc-0081 54 98

82 Fc-0082 66 125

83 Fc-0083 11 16

84 Fc-0084 13 54

85 Fc-0085 15 65

86 Fc-0086 13 52

87 Fc-0087 25 52

88 Fc-0088 24 25

89 Fc-0089 16 22

90 Fc-0090 14 15

91 Fc-0091 28 58

2.1.3 Pre-Processing Data

Setelah data dipilih dan diseleksi sesuai dengan atribut yang akan digunakan maka dilakukan pre-processing data, agar tidak ada duplikasi data, tidak missing value dan memperbaiki kesalahan-kesalahan yang ada pada data set baru dalam format excel [13]. Data yang telah melewati tahap pre-processing akan disimpan dalam data set yang baru menggunakan Microsoft Office Excel.

(4)

2.1.4 Transformasi Data

Pada tahap ini dilakukan proses perubahan data, agar data dapat diolah dengan menggunakan algoritma k-means dan k-medoids. Data yang non-numeric dilakukan proses inisiasi ke dalam bentuk numeric. Namun jika data yang dimiliki sudah dalam bentuk numeric maka tidak diperlukan inisiasi [14].

2.1.5 Pengolahan Data

Pada tahapan ini dilakukan pemodelan data menggunakan hasil dari transformasi data, adapun metode yang dipakai pada penelitian ini adalah algoritma k-means dan k-medoids. Data yang sudah dipilih akan diolah dengan menggunakan metode clustering. Metode ini bekerja dengan melakukan pengelompokan data yang memiliki kesamaan karakteristik pada setiap data. Data tersebut memiliki dua variabel (x dan y) agar mudah divisualisasikan dalam koordinat kartesius:

a. Variabel X = Rata-rata penjualan selama 6 bulan (Mei – Oktober 2020) b. Variabel Y = Stok barang di gudang (30 Oktober 2020)

2.2 Algoritma K-Means

Menentukan centroid awal, penentuan ini dilakukan secara acak terhadap tabel data yang ada [15]. Proses perhitungan pada algoritma k-means dimulai dari iterasi 1 (satu). Pertama, dihitung jarak dari setiap data terhadap semua centroid yang ada. Dari hasil perhitungan jarak antara setiap data terhadap semua centroid, didapatkan nilai jarak terkecil terhadap satu centroid, maka centroid tersebut disebut sebagai centroid terdekat, dan data akan berafiliasi menjadi cluster dari centroid terdekat.

Tabel 2. Centroid Awal

Centroid X Y

C0 1 1

C1 77 166

C2 27 551

Berikut rumus yang digunakan untuk menghitung jarak setiap data yang ada terhadap nilai centroid:

De = √(𝑀𝑖𝑥− 𝐶𝑖𝑥) 2+ (𝑀𝑖𝑦− 𝐶𝑖𝑦) 2 (1)

2.2 Algoritma K-Medoids

K-Medoids melakukan pengelompokkan dengan menggunakan objek perwakilan (medoids) sebagai pusat cluster untuk setiap clusternya [16]. Langkah-langkah algoritma k-medoids adalah sebagai berikut:

a. Tentukan k (jumlah cluster) yang dinginkan dari data yang diproses.

Adapun cluster yang diinginkan terdiri atas 3 cluster, yaitu cluster 2 adalah produk unggulan atau produk yang sangat diminati, cluster 1 adalah produk yang peminatnya sedang, dan cluster 0 adalah produk yang peminatnya rendah atau kurang laku.

b. Pilih titik centroid secara acak atau berurutan dari data medoid awal sebanyak jumlah k.

Tabel 3. Data Medoids

Cluster Data Ke- X Y

Co Data Ke- 89 16 22

C1 Data Ke- 71 30 52

C2 Data Ke- 82 66 112

c. Hitung jarak masing-masing data dengan menggunakan titik centroid sebanyak jumlah k, menggunakan rumus formula. Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke titik centroid. Pada penelitian ini pengukuran jarak akan dilakukan menggunakan rumus:

𝑑1 = √(𝑥1− 𝑥𝑐0) 2+ (𝑦1− 𝑦𝑐0) 2 (2)

d. Lakukan iterasi medoids dengan menghitung jarak menggunakan salah satu metode perhitungan jarak, terhadap seluruh data yang dijadikan data proses.

e. Memilih secara acak objek yang tidak representatif (non-medoids) Tabel 4. Data Non Medoids

Cluster Data Ke- X Y

Co Data Ke- 25 1 1

C1 Data Ke- 5 97 115

C2 Data Ke- 24 27 551

(5)

Hitung total simpangan (S) dengan hasil perhitungan jarak pada semua data. Dan lakukan perhitungan iterasi lagi dengan titik centroid yang baru, dengan menggunakan langkah awal kembali. Titik centroid yang baru diambil secara acak dari data medoids. Jika a adalah total perhitungan jarak terdekat dengan menggunakan medoids awal, dan b adalah total perhitungan jarak terdekat antara obyek ke medoids baru, maka total simpangan dapat dihitung menggunakan rumus persamaan.

S = Total cost baru – Total cost lama (3)

Keterangan:

S = Selisih

Total cost baru = Total cost untuk non-medoids Total cost lama = Total cost untuk medoids Sehingga diperoleh:

Karena nilai S > 0 maka proses pengklasteran dapat dihentikan.

S = 61.920 – 19.857 = 42.063

3. HASIL DAN PEMBAHASAN

Pada penghitungan menggunakan algoritma k-means diperoleh hasil yaitu, cluster 0 terdiri dari 70 produk, cluster 1 terdiri dari 20 produk, dan cluster 2 terdiri dari 1 produk, berikut rincian kode produknya:

1) Cluster 0 = PL-0006, PL-0007, PL-0008, PL-0009, HHC-0011, HHC-0013, HHC-0014, HHC-0015, ENN- 0016, ENN-0017, ENN-0018, ENN-0019, ENN-0020, ENN-0021, ENN-0025, GS-0026, GS-0027, GS-0028, GS-0029, GS-0030, GS-0031, GS-0032, GS-0033, GS-0034, GS-0035, GS-0037, GS-0038, GS-0039, GS- 0040, GS-0041, GS-0042, GS-0043, GS-0046, BC-0051, BC-0052, BC-0053, BC-0054, BC-0055, EC-0056, EC-0057, EC-0058, EC-0059, EC-0060, EC-0061, EC-0062, EC-0063, EC-0064, EC-0065, EC-0066, EC- 0067, EC-0068, EC-0069, EC-0070, EC-0071, EC-0072, EC-0073, EC-0074, EC-0075, EC-0076, EC-0077, EC-0078, FC-0083, FC-0084, FC-0085, FC-0086, FC-0087, FC-0088,

FC-0089, FC-0090, FC-0091

2) Cluster 1 = PL-0001, PL-0002. PL-0003, PL-0004, PL-0005, HHC-0010, HHC-0012, ENN-0022, ENN-0023, GS-0036, GS-0044, GS-0045, GS-0047, GS-0048, GS-0049, GS-0050, FC-0079, FC-0080, FC-0081, FC- 0082.

3) Cluster 2 = ENN-0024.

Sedangkan pada penghitungan menggunakan algoritma k-medoids diperoleh hasil yaitu, cluster 0 terdiri dari 58 produk, cluster 1 terdiri dari 13 produk, dan cluster 2 terdiri dari 20 produk, berikut rincian kode produknya:

a. Cluster 0 = PL-0007, PL-0009, HHC-0011, HHC-0013, HHC-0014, HHC-0015, ENN-0017, ENN-0018, ENN-0019, ENN-0020, ENN-0021, ENN-0025, GS-0026, GS-0027, GS-0028, GS-0029, GS-0030, GS- 0031, GS-0032, GS-0033, GS-0034, GS-0037, GS-0038, GS-0039, GS-0040, GS-0042, GS-0043, BC- 0051, BC-0052, BC-0053, BC-0054, BC-0055, EC-0056, EC-0057, EC-0058, EC-0059, EC-0060, EC- 0061, EC-0062, EC-0063, EC-0064, EC-0065, EC-0066, EC-0067, EC-0068, EC-0069, EC-0070, EC- 0072, EC-0073, EC-0074, EC-0075, EC-0076, EC-0077, EC-0078, FC-0083, FC-0088, FC-0089, FC-0090.

b. Cluster 1 = PL-0006, PL-0008, ENN-0016, GS-0035, GS-0036, GS-0041, GS-0036, EC-0071, FC-0084, FC-0085, FC-0086, FC-0087, FC-0091.

c. Cluster 2 = PL-0001, PL-0002, PL-0003, PL-0004, PL-0005, HHC-0010, HHC-0012, ENN-0022, ENN- 0023, ENN-0024, GS-0044, GS-0045, GS-0047, GS-0048, GS-0049, GS-0050, FC-0079, FC-0080, FC- 0081, FC-0082.

3.1 Hasil Pengujian

Software yang digunakan untuk menganalisis dan melakukan pengujian adalah RapidMiner Studio.Rapidminer sendiri merupakan software yang berdiri sendiri yang ditulis dengan munggunakan bahasa java sehingga dapat bekerja di semua sistem operasi [17]. Hasil keanggotaan yang terbentuk dari proses ini adalah sebagai berikut:

Gambar 2. Hasil pengklasteran k-means

Gambar 3. Hasil pengklasteran k-medoids

(6)

Cluster terendah atau cluster yang kurang peminatnya adalah cluster 0 dilihat dari nilai pada stok yang menjadi patokannya. Kemudian cluster yang peminatnya sedang adalah cluster 1 dapat dilihat dari jarak berikutnya yang paling dekat dengan cluster terendah. Cluster tertinggi atau cluster yang paling banyak peminatnya adalah cluster 2, dapat dilihat pada gambar.

Gambar 4. Hasil data cluster k-means

Gambar 5. Hasil data cluster k-medoids

Gambar 6. Hasil data grafil cluster k-means

Gambar 7. Hasil data grafil cluster k-medoids

Untuk menentukan algoritma mana yang lebih tepat digunakan dalam masalah pemilihan produk unggulan pada PT. XYZ Indonesia, maka digunakan Performance Vektor untuk evaluasi kinerja dari dua metode clustering. Performance Vektor memberikan daftar nilai kriteria kinerja berdasarkan centroid cluster.

Gambar 8. Validasi cluster Kriteria utama dari Performance Vektor

(7)

a. Avg_within_centroid_distance: rata-rata dalam jarak cluster dihitung dengan rata-rata jarak antara centroid dan semua contoh cluster.

b. Davies_bouldin: Algoritma yang menghasilkan cluster dengan jarak intra-cluster yang rendah dan jarak antar- cluster yang tinggi akan memiliki indeks Davies Bouldin yang rendah. Algoritma clustering yang menghasilkan kumpulan cluster dengan indeks Davies Bouldin terkecil dianggap sebagai algoritma terbaik berdasarkan kriteria ini.

Gambar 9. Hasil Performance Vector K-Means

Gambar 10. Hasil Performance Vector K-Medoids

Berdasarkan hasil tersebut terlihat dengan jelas bahwa nilai Davies Bouldin untuk algoritma k-means adalah -0,430 dan nilai Davies Bouldin k-medoids adalah -1,392 yang berarti bahwa nilai Davies Bouldin untuk metode k-medoids memiliki nilai Davies Bouldin yang terkecil sehingga hasil pengelompokkan menggunakan metode k-means merupakan metode yang lebih tepat digunakan pada masalah pemilihan produk unggulan di PT.

XYZ Indonesia

4. KESIMPULAN

Berdasarkan hasil dan pembahasan, maka kesimpulan dari penelitian ini dengan 91 sampel produk, laporan penjualan, dan data stok gudang, maka dapat dilakukan penerapan dua metode clustering, yaitu algoritma k-means dan k-medoids di PT. XZY Indonesia, setalah melakukan perhitungan maka dapat diketahui pengelompokan produk yang menjadi produk unggulan, produk yang peminatnya sedang, dan produk yang kurang diminati.

Dengan penerapan metode clustering, masalah kekurangan stok pada produk unggulan dapat diatasi, karena perusahaan dapat melihat hasil dari pengelompokan produk yang jumlah peminatnya tinggi, sedang dan rendah.

Untuk yang masuk kedalam pengelompokan produk unggulan, maka perusahaan akan lebih memperhatikan ketersediaannya, sehingga tidak terjadi kekurangan stok barang. Dan untuk barang yang kurang diminati maka perusahaan tidak perlu melakukan stok barang yang menumpuk yang akan mengakibatkan biaya simpan yang tinggi dan tidak ekonomis.

REFERENCES

[1] R. D. Ramadhani and D. J. Ak, “Evaluasi K-Means dan K-Medoids pada Dataset Kecil,” Semin. Nas. Inform. dan Apl., no. September, pp. 20–24, 2017, [Online]. Available: file:///C:/Users/User/Downloads/Evaluasi K-Means dan K- Medoids pada Dataset Kecil.pdf.

[2] I. Algoritma and K. D. A. N. K. Dalam, “Implementasi algoritma k-means dan k-medoids dalam pengelompokan nilai ujian nasional tingkat smk,” no. Ciastech, pp. 717–726, 2020.

[3] D. Marlina, N. Lina, A. Fernando, and A. Ramadhan, “Implementasi Algoritma K-Medoids dan K-Means untuk Pengelompokkan Wilayah Sebaran Cacat pada Anak,” J. CoreIT J. Has. Penelit. Ilmu Komput. dan Teknol. Inf., vol. 4, no. 2, p. 64, 2018, doi: 10.24014/coreit.v4i2.4498.

[4] M. Fuady and J. Nugraha, “IMPLEMENTASI METODE K-MEANS DAN K-MEDOIDS UNTUK Jurusan Statistika , FMIPA , Universitas Islam Indonesia Isnafuady1@gmail.com ABSTRAK PENDAHULUAN Inflasi merupakan permasalahan yang selalu dan pasti dialami oleh setiap negara . Disebabkan oleh pengaruh in,” pp. 327–337, 2017.

[5] I. Kamila, U. Khairunnisa, and M. Mustakim, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Data Transaksi Bongkar Muat di Provinsi Riau,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., vol. 5, no. 1, p. 119, 2019, doi:

10.24014/rmsi.v5i1.7381.

[6] M. H. Herviany, S. P. Delima, T. Nurhidayah, and K. Kasini, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokkan Daerah Rawan Tanah Longsor Pada Provinsi Jawa Barat: Comparison of K-Means and K-Medoids Algorithms for Grouping Landslide Prone Areas in West Java Province,” MALCOM Indones. J. Mach. Learn. Comput.

Sci., vol. 1, no. 1, pp. 34–40, 2021.

(8)

[7] A. Amalia, D. R., Narasatu, R., Faqih, “Perbandingan Hasil Klasifikasi Rasa Minuman Thai Tea yang Paling Digemari Menggunakan K-means dan K-medoids,” Pros. Semin. Nas. Unimus, vol. 2, pp. 401–407, 2019.

[8] Y. H. Susanti and E. Widodo, “Perbandingan K-Means dan K-Medoids Clustering terhadap Kelayakan Puskesmas di DIY Tahun 2015,” Pros. SI MaNIs (Seminar Nas. Integr. Mat. dan Nilai Islam., vol. 1, no. 1, pp. 116–122, 2017.

[9] Athifaturrofifah, R. Goejantoro, and D. Yuniarti, “Perbandingan Pengelompokan K-Means dan K-Medoids Pada Data Potensi Kebakaran Hutan/Lahan Berdasarkan Persebaran Titik Panas (Studi Kasus : Data Titik Panas Di Indonesia Pada 28 April 2018),” J. EKSPONENSIAL, vol. 10, no. 2, pp. 143–152, 2019.

[10] W. E. Susanto and D. Riana, “Komparasi Algoritma,” J. Speed, vol. 8, no. 3, pp. 18–27, 2016.

[11] A. H. Neng Sri Lathifah Zulfa, “KAJIAN DATA MINING MENGGUNAKAN ALGORITMA K-MEANS DAN K- MEDOIDS DALAM STRATEGI PROMOSI,” Angew. Chemie Int. Ed. 6(11), 951–952., vol. 2, no. 2, pp. 57–62, 1967.

[12] M. H. Siregar, “Data Mining Klasterisasi Penjualan Alat-Alat Bangunan Menggunakan Metode K-Means (Studi Kasus Di Toko Adi Bangunan),” J. Teknol. Dan Open Source, vol. 1, no. 2, pp. 83–91, 2018, doi: 10.36378/jtos.v1i2.24.

[13] R. R. Putra and C. Wadisman, “Implementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K Means,” INTECOMS J. Inf. Technol. Comput. Sci., vol. 1, no. 1, pp. 72–77, 2018.

[14] R. Andrean, S. Fendy, and A. Nugroho, “Klasterisasi Pengendalian Persediaan Aki Menggunakan Metode K-Means,”

JOINTECS (Journal Inf. Technol. Comput. Sci., vol. 4, no. 1, p. 5, 2019, doi: 10.31328/jointecs.v4i1.998.

[15] R. Muliono and Z. Sembiring, “Data Mining Clustering Menggunakan Algoritma K-Means Untuk Klasterisasi Tingkat Tridarma Pengajaran Dosen,” vol. 4, no. 2, pp. 2502–714, 2019.

[16] S. Kasus and K. Ben, “Proceeding SENDIU 2021 PERBANDINGAN CLUSTERING OPTIMALISASI STOK BARANG MENGGUNAKAN ALGORITMA K – MEANS DAN ALGORTIMA K – MEDOIDS,” pp. 978–979, 2021.

[17] A. U. Fitriyadi and A. Kurniawati, “Analisis Algoritma K-Means dan K-Medoids Untuk Clustering Data Kinerja Karyawan Pada Perusahaan Perumahan Nasional,” vol. 10, no. 1, pp. 157–168, 2021.

Referensi

Dokumen terkait

Alif Rizqi Mulyawan II Penerapan K-Medoids Clustering … Mencari Nilai K dengan Metode Silhouette Mencari jumlah cluster yang optimal sesuai dengan data set yang dimiliki adalah hal

KESIMPULAN Penelitian yang telah dilakukan dalam pengelompokan daerah hasil pangan tertinggi hingga terendah menggunakan algoritma K-Medoids dapat disimpulkan bahwa beberapa hasil