PENERAPAN ALGORITMA C4.5 PADA PRODUK PENJUALAN MAKANAN RINGAN
Fitria Rahmadayanti1, Asminah2, Della Tri Cahaya3
1,2,3
Program Studi Informatika, Institut Teknologi Pagar Alam, Pagar Alam e-mail: *1[email protected], 2[email protected], 3[email protected]
Abstrak
Kemajuan teknologi dan informasi pada saat ini menciptakan inovasi-inovasi cerdas dalam berbisnis, yang dapat kita sebut kecerdasan bisnis atau business intelligence. Persaingan dalam lingkup bisnis memaksa para pelaku bisnis untuk selalu memikirkan strategi dan juga trobosan yang dapat menjamin keberlangsungan dari bisnis yang dijalankan.Tujuan dari penelitian ini untuk menganalisis akurat Algoritma C4.5 dalam mengklasifikasi produk penjualan makanan terlaris. Hasil penelitian yang telah didapatkan bahwa penjualan produk yang kurang dari 207 termasuk makanan kurang laris sedangkan penjualan produk yang lebih dari 207 termasuk makanan terlaris. Penjualan produk yang lebih dari 207 merupakan makanan terlaris dimana terdapat 5 produk makanan terlaris. Sedangkan penjualan produk yang kurang dari 207 merupakan makanan kurang laris dimana terdapat 5 produk makanan kurang laris.
Kata kunci : Data Mining, Decision Tree,CRIPS-DM
Abstract
Advances in technology and information today create smart innovations in business, which we can call business intelligence. Competition in the business sphere forces business people to always think about strategies and breakthroughs that can ensure the sustainability of the business being run.The purpose of this study is to accurately analyze the C4.5 algorithm in classifying the best-selling food sales products. The results of research that have been obtained that product sales that are less than 207 include food that is less in demand while sales of products that are more than 207 are among the best-selling foods. Product sales of more than 207 are the best-selling foods where there are 5 best-selling food products. While the sales of products that are less than 207 are less in demand food where there are 5 food products that are less in demand.
Keywords : Data Mining, Decision Tree, CRISP-DM
I. PENDAHULUAN
Kemajuan teknologi dan informasi pada saat ini menciptakan inovasi-inovasi cerdas dalam berbisnis, yang dapat kita sebut kecerdasan bisnis atau business intelligence. Persaingan dalam lingkup bisnis memaksa para pelaku bisnis untuk selalu memikirkan strategi dan juga trobosan yang dapat menjamin keberlangsungan dari bisnis yang dijalankan
Business Intelligence digunakan untuk aplikasi dan teknologi dalam mengumpulkan, menyimpan, menganalisa,
dan menyediakan akses pada data sehingga dapat membantu pengguna dari kalangan perusahaan atau organisasi untuk mengambil keputusan dengan lebih baik dan tepat[1].
Salah satu yang dapat kita manfaatkan adalah data mining dalam menggali informasi yang bermanfaat dari data perusahaan. Data mining banyak menarik perhatian masyarakat karena mampu mengubah data yang luas menjadi sebuah informasi atau pengetahuan yang bermanfaat. Informasi dari hasil data mining dapat diaplikasikan dalam analisa peujualan, deteksi penipuan, dan perencanaan produksi.
Menurut Gartner Group,data mining adalah proses menemukan hubungan baru yang mempunyai arti, pola dan kebiasaan dengan memilah-milah sebagian besardata yang disimpan dalam media penyimpanan dengan menggunakan teknologi pengenalan pola seperti teknik statistic dan matematika.
Data mining merupakan gabungan dari beberapa disiplin ilmu yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar.[2]
Pada penelitian ini diambil permasalahan terhadap data penjualan makanan ringan yang mengalami kesulitan mendapatkan informasi akurat seperti penjualan makanan terlaris. Dengan ketersediaan data yang banyak membuat penjual mandapatkan kesulitan untuk menentukan penjualan makanan terlaris jika dilakukan secara manual. Selain itu juga membutuhkan waktu yang lama serta tingkat ketelitian yang tinggi karena besar kemungkinan terjadinya kesalahan dalam pengerjaannya.
Berdasarkan penelitian [3] dengan judul Penerapan Data Mining Pada Penjualan Barang Menggunakan Metode Naive Bayes Classifier Untuk Optimasi Strategi Pemasaran bahwa salah satu penggunaan data mining dengan metode Naive Bayes Classifier dalam data penjualan umumnya adalah untuk mengetahui minat dan ketertarikan calon pembeli terhadap produk yang tersedia dengan memprediksi probabilitas keanggotaan suatu class. Informasi ini dapat digunakan untuk mendukung strategi pemasaran agar lebih efektif dan efisien.
Dengan informasi ini suatu perusahaan dapat mengetahui tingkat ketertarikan pembeli terhadap suatu produk yang terdapat di perusahaan. Sehingga perusahaan dapat mengetahui serta
menentukan target atau sasaran pasar dengan lebih rinci.
Berdasarkan penelitian [4] dengan judul Klasifikasi Produk Penjualan Brownies Menggunakan Data Mining Metode Algoritma C4.5 bahwa Permasalahan pandemi covid 19 ini sangat memukul semua pihak penjualan, diera pandemi ini harus jeli dengan perubahan, pengusaha harus bisa mengatur keuangan dengan baik guna agar tidak mengalami colaps atau bangkrut. solusi yang dilakukan oleh pengusaha mulai dari mengurangi jumlah produksi, mengurangi karyawan dan atau mempromosikan secara masif.
menerapkan pola data mining dengan menggunakan algoritma C4.5, agar dapat menyusun kriteria, dan mengetahui nilai akurasi dalam mengklasifikasi penjualan produk. Dari 16 data produk yang di prediksi laris dengan kurang laris dengan metode pendekatan menggunakan algoritma C.45 dan hasilnya yaitu hasil akurasi pada penelitian ini sebesar 89,67%.
Berdasarkan penelitian [5] dengan judul Penerapan Data Mining Untuk Prediksi Penjualan Produk Roti Terlaris Pada PT.Nippon Indosari Corpindo Tbk Menggunakan Metode K-Nearest Neighbor bahwa Penerapan data mining sangat dibutuhkan oleh PT.Nippon Indosari Corpindo Tbk dikarenakan perusahaan ini memproduksi jumlah roti yang sangat besar. Dilihat dari banyaknya permintaan konsumen ternyata terdapat beberapa roti yang terlaris dan tidak begitu laris sehingga berdasarkan 3 bulan terakhir maka PT Nippon membutuhkan sebuah prediksi penjualan produk roti terlaris, agar mempermudah pihak perusahaan dalam memproduksi roti mana yang paling banyak diproduksi. Untuk menentukan produk telaris ini dibutuhkan sebuah algoritma K- Nearest Neighbor. Dengan Metode K- Nearest Neighbor dapat mempermudah dan membantu PT.Nippon Indosari Corpindo
Tbk dalam menentukan jumlah produksi roti mana saja yang harus di produksi dengan jumlah yang banyak.
Persaingan dalam dunia bisnis merupakan permasalahan yang tak bisa dihindari. Sehingga para pelaku bisnis harus selalu berfikir kritis untuk membuat inovasi serta trobosan baru agar bisnis yang dijalankan senantiasa terjamin keberlangsungannya.
Maka berdasarkan informasi diatas, diusulkan sebuah penelitian dengan judul
”Penerapan Algoritma C4.5 Pada Produk Penjualan Makanan Ringan”. dengan algoritma C4.5 diharapkan dapat membantu perusahaan dalam mengklasifikasi produk terlaris, sehingga perusahaan bisa menentukan produk mana yang akan diproduksi dengan jumlah lebih banyak.
II. TINJAUAN PUSTAKA 2.1 Data Mining
Data mining menurut Larose adalah sebuah proses yang menggunakan Teknik statistic, matematika, kecerdasaan buatan dan machine learning yang mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database yang besar[6].
2.2 Klasifikasi
Klasifikasi adalah proses menemukan model yang menjelaskan atau membedakan konsep atau kelas data, agar dapat memprediksi kelas atau objek yang tidak diketahui kelasnya[7].
2.3 Decision Tree
Decision Tree merupakan metode pengambangan data yang umumnya digunakan untuk proses klasifikasi atau memprediksi suatu variable target[8][7].
III. METODOLOGI PENELITIAN 2.1 Tahap Penelitian
Penelitian ini menggunakan tahap- tahap crisp-dm (cross industry standar process for data mining) yang banyak digunakan dalam proses data mining.
Sebelum memasuki bagian tahapan dari crips-dm, terlebih dahulu dilakukan tahap awal yaitu pengumpulan data. Data diperoleh dari pemilik toko Makanan Ringan Geby.
Gambar 1 Alur CRISP-DM [Sumbe:[9]
Berdasarkan gambar diketahui bahwa crisp-dm memiliki 6 langkah tahapan penelitian sebagai berikut:
1. Business Understanding
Pemahaman masalah penelitian mengacu pada cara mendapatkan informasi akurat tentang penjualan makanan terlaris. Pada tahapan ini diperlukan pemahaman tentang cara yang tepat untuk mendapatkan informasi akurat dalam waktu yang singkat, agar informasi yang didapatkan dapat membantu perusahaan dalam menentukan pruduk terlaris, sehingga bisa menentukan produk mana yang akan diproduksi dengan jumlah lebih banyak.
2. Data Understanding
Dalam penelitian ini penulis membuat dataset “penjualan makanan ringan.xls” dari observasi selama 1 bulan. Data yang penulis ambil adalah
data penjualan makanan ringan yang mana terdiri dari 10 menu makanan ringan yaitu keripik pisang coklat, keripik pisang original, seblak kering, bakso kering, telur gabus, peyek kacang tanah, makaroni balado, keripik singkong original, keripik singkong pedas, dan stik bawang.
3. Data Preparation
Tahap ini dilakukan untuk mempersiapkan dataset akhir dan atribut yang akan digunakan pada langkah selanjutnya, dan dataset yang akan digunakan pada penelitian ini adalah dataset “penjualan makanan ringan.xls”.
4. Modeling
Pada tahap ini digunakan algoritma untuk membuat suatu pola. Pola dalam penelitian ini adalah klasifikasi dan algoritma yang digunakan yaitu Decision Tree. kemudian menggunakan tools rapidminer untuk mendapatkan pola algoritma Decision Tree.
5. Evaluation
Pada tahap ini dilakukan validasi untuk menentukan akurasi dan efektifitas dari modeling, maka diharapkan dapat memberikan hasil serta evaluasi bagi perusahaan untuk meningkatkan penjualan produk makanan ringan dan juga diharapkan penelitian ini dapat menjadi referensi bagi peneliti lain.
6. Deployment
Pada tahap ini dilakukan implementasi dari keseluruhan model yang telah dibangun. Sehingga hasil akurasi terbaik yang didapatkan dari tahap evaluasi akan menentukan algoritma terbaik yang dapat diterapkan pada dataset “penjualan makanan ringan.xls”.
IV. HASIL DAN PEMBAHASAN Untuk hasil penelitian penulis akan membahas tentang hasil dari setiap proses pada CRIPS-DM dimulai dari:
1. Business Understanding
Makanan Ringan Geby merupakan sebuah industri rumahan yang menyediakan beberapa jenis makanan ringan untuk memenuhi kebutuhan masyarakat sekitar. Makanan Ringan Geby memiliki masalah dalam mendapatkan informasi produk terlaris sehingga sulit untuk menentukan produk mana yang dapat dipruduksi dalam jumlah lebih banyak. Jadi makanan ringan geby ingin menklasifikasi dan mengetahui pola dari produk terlaris dan kurang laris, karena dengan mengetahui pola tersebut pihak makanan ringan geby dapat menfokuskan untuk lebih banyak memproduksi produk yang diklasifikasikan sebagai makanan terlaris sehingga dapat menghindari adanya produk yang tidak terjual dari produk yang diklasifikasikan sebagai makanan kurang laris.
Dari permasalahan diatas dapat diketahui bahwamakanan ringan geby ingin mengetahui informasi produk terlaris untuk menghindari adanya produk yang tidak terjual dari jenis produk kurang laris.dengan ini tujuan dari penelitian ini adalah untuk mengklasifikasikan dan menemukan pola dari produk terlaris dan kurang laris.
2. Data Understanding
Untuk menyeselaikan permasalahan dari business understanding yang terkait dengan produk terlaris, data yang digunakan dalam penelitian ini yaitu data penjualan dari makanan ringan geby. Data yang didapat merupakan data penjualan dari bulan oktober-desember 2022, dengan 6
atribut dan memiliki total 920 record.
Adapun atribut yang terdapat pada data
penjualan yaitu: no,
tanggal,kode_produk, nama_produk,harga,dan jumlah_terjual.
Gambar 2. Dataset yang belum di Preparation
Pada gambar 2, dapat dilihat bahwa dataset yang ada masih terlihat berantakan, sehingga diperlukan pengolahan lagi pada dataset. Dimana data yang telah diolah dapat digunakan untuk menyelesaikan pola penjualan pada setiap produk yang tersedia.
3. Data Preparation 1) Data cleaning
Data cleaning merupakan suatu metode yang digunakan untuk memastikan kebersihan data agar terhindar dari value yang hilang (missing value) atau kesalahan dalam proses input (noise value)[9].
Untuk proses penemuan mising value penulis menggunakan formula excel untuk menghitung dan memastikan jumlah value setiap atribut sesuai dengan jumlah record yang dimiliki dataset.
Untuk proses penemuan noise value dibutuhkan pemahaman
pada atribut data. Misalnya pada atribbut jumlah_terjual dimana atribut ini memiliki makna suatu produk berhasil terjual jadi sangat tidak memungkinkan jika value pada atribut ini kurang atau sama dengan 0.
Dikarenakan jumlah data cukup banyak dan jumlag missing value/noise value sedikit maka penulis memiliki solusi untuk menghapus baris data yang hilang atau salah tersebut.
2) Data Transformation
Pada tahap ini penulis akan menyeleksi atribut yang akan digunakan, dimana dri 6 atribut pada data penjualan produk akan diambil 3 atribut utama yang akan memiliki keterkaitan
terhadap penjualan
produk.adapun atribut yang
dipilih adalah
tanggal,nama_produk, dan jumlah_terjual.
Untuk atribut tanggal dan jumlah_terjual akan digunakan sebagai atribut utama untuk membuat atribut baru, dimana penulis akan mengelompokkan kembali jumlah penjualan berdasarkan nama produk pada jangka waktu satu bulan sekali.
Jadi pada dataset akan membentuk data C1 sampai C3, pada penelitian ini penulis menggunalan data penjualan dari oktober-desember 2022.
Tahap terakhir yaitu membentuk atribut target pembelajaran dari model. Atribut target sangat dibutuhkan pada dataset penjualan, hal ini dikarenakan metode decision tree C4.5 merupakan metode supervised
learning, dimana metode yang memerlukan target untuk proses pembelajarannya. Untuk menentukan suatu produk terlaris penulis melakukan persamaan sebagai berikut:
target= if(x>y):′Laris′;′Tidak Laris′
Dimana x merupakan nilai rata-rata penjualan produk x pada kategori y, dan y merupakan total rata-rata penjualan pada kategori y.
Contoh penentuan target diketehui suatu produk makanan ringan total rata-rata pada sepanjang data 210, dan jika produk keripik pisang coklat penjualan disepanjang data mencapai 315 maka produk keripik pisan coklat memiliki target laris, sedangkan jika kurang atau sama dengan 210 maka produk akan didefinisikan sebagai produk kurang laris.
Gambar 2 Hasil Preparation
Berdasarkan gambar 2, data tersebut merupakan hasil dari proses data priparation, dimana datasset sudah ditransform untuk menyelesaikan pola penjualan pada setiap produk yang tersedia.
4. Modeling
Pada penelitian ini digunakan algoritma C4.5 yang berfungsi untuk mendapatkan pohon keputusan makanan terlaris berdasarkan banyaknya jumlah yang terjual dari bulan oktober-desember tahun 2022.
Proses modelling pada softwere Rapidminer versi 10.0, untuk lebih jelasnya dapat dilihat pada gambar berikut:
Gambar 3. Proses Decision Tree Makanan Ringan
5. Evaluation
Hasil pengujian dilakukan untuk mengetahui Akurasi dari pohon keputusan Algoritma klasifikasi decision tree (C4.5) Makanan ringan terlaris . hasil dibawah merupakan hasil nilai akurasi yang telah dilakukan, sebagai berikut:
Gambar 4. Pohon Keputusan Decision Tree (C4.5) Makanan Ringan
Berdasarkan gambar diatas dapat diketahui bahwa penjualan produk yang kurang dari 207 termasuk makanan kurang laris sedangkan penjualan produk yang lebih dari 207 termasuk makanan terlatis.
Gambar 5. Data Statistik Decision Tree (C4.5) Makanan Ringan
Berdasarkan gambar diatas, dapat dilihat bahwa penjualan yang lebih dari 207 merupakan makanan terlaris dimana terdapat 5 produk makanan terlaris. Sedangkan penjualan yang kurang dari 207 merupakan makanan kurang laris dimana terdapat 5 produk makanan kurang laris.
6. Deployment
Setelah hasil penelitian telah muncul maka langkah selanjutnya adalah evaluasi model dan mendapatkan Akurasi Data Mining makanan ringan terlaris, maka hasil penelitian ini dapat segerah diterapkan pada aktivitas sehari-hari dalam proses produksi makanan ringan.apabilah akan melakukan proses produksi maka pemilik toko makanan ringan dapat memproduksi lebih banyak makanan ringan yang termasuk pada kategori makanan terlaris agar dapat meningkatkan penjualan produk makanan ringan. Selain itu juga dapat menghindari adanya produk yang tidak terjual akibat kurangnya ketertarikan dari konsumen sehingga dapat menghindari adanya kerugian yang dapat terjadi.
V. KESIMPULAN
Hasil evaluasi terhadap model decision tree C4.5 dapat disimpulkan bahwa penjualan produk yang kurang dari 207
termasuk makanan kurang laris sedangkan penjualan produk yang lebih dari 207 termasuk makanan terlaris. Penjualan produk yang lebih dari 207 merupakan makanan terlaris dimana terdapat 5 produk makanan terlaris. Sedangkan penjualan produk yang kurang dari 207 merupakan makanan kurang laris dimana terdapat 5 produk makanan kurang laris.
Maka hasil penelitian ini dapat segerah diterapkan pada aktivitas sehari- hari dalam proses produksi makanan ringan.apabilah akan melakukan proses produksi, pemilik toko makanan ringan dapat memproduksi lebih banyak makanan ringan yang termasuk pada kategori makanan terlaris agar dapat meningkatkan penjualan produk makanan ringan.
Dalam proses produksi diharapkan pemilik toko dapat lebih memfokuskan untuk memproduksi produk yang termasuk kategori terLaris agar dapat meningkatkan penjualan produk makanan ringan. Selain itu diharapkan juga pemilik toko dapat memikirkan inovasi atau perubahan apa saja yang bisa dilakukan pada produk makanan ringan yang termasuk pada kategori kurang laris. Sehingga konsumen dapat lebih tertari untuk membeli produk makanan ringan yang dijual. Hal ini juga dapat meningkatkan penjualan serta meminimalisir adanya kerugian yang akan terjadi.
VI. DAFTAR PUSTAKA
[1] P. P. W. Suyitno, R. E. Indrajit, dan M. Fauzi, “PENERAPAN DATA MINING DALAM MENANGANI KEMACETAN DI JAKARTA Popy,” Ikraith-Informatika, vol. 1, no. 2, hal. 53–60, 2017.
[2] A. S. Chan, “Prediksi Kedatangan Wisatawan Pada Pariwisata Kota Batam Dengan Menggunakan Teknik Knowledge Data Discovery,” J. Ilm. Inform., vol. 6,
no. 01, hal. 11, 2018, doi:
10.33884/jif.v6i01.432.
[3] A. E. Wijaya, R. Bani, S. Sukarni, dan S. A. Weighting, “Jurnal Teknologi Informasi dan Komunikasi STMIK Subang, Oktober 2019 ISSN: 2252-4517,”
no. April, hal. 100–110, 2019.
[4] A. I. P. Fathurrohman, Iin, Dian Ade Kurnia, “KLASIFIKASI PRODUK
PENJUALAN BROWNIES
MENGGUNAKAN DATA
MINING METODE ALGORITMA C4.5 Fathurrohman 1) , Iin 2) , Dian Ade Kurnia 3) , Ade Irma Purnamasari 4) 1,2),” vol. 9, no. 3, 2021.
[5] I. Yolanda dan H. Fahmi,
“Penerapan Data Mining Untuk Prediksi Penjualan Produk Roti Terlaris Pada PT . Nippon Indosari Corpindo Tbk Menggunakan Metode K-Nearest Neighbor,” vol.
3, no. 3, hal. 9–15, 2021.
[6] F. Rahmadayanti, I. Anggraini, dan T. Susanti, “Pengklasterisasian Data Penyakit Hipertensi dengan Menggunakan Metode K-Means,” J.
Inf. Syst. Res., vol. 4, no. 2, hal.
737–741, 2023, doi:
10.47065/josh.v4i2.2905.
[7] F. Rahmadayanti, A. Lovita, dan S.
Muntari, “Klasifikasi Kelayakan Penerima Bantuan Sosial Dengan Algoritma Decision Tree,” Escaf, hal. 1002–1007, 2023, [Daring].
Tersedia pada:
https://semnas.univbinainsan.ac.id/in dex.php/escaf/article/view/469%0A https://semnas.univbinainsan.ac.id/in dex.php/escaf/article/download/469/
303.
[8] F. Rahmadayanti dan R. Rahayu,
“Penerapan Metode Data Mining Pada Kasus Kriminalitas Indonesia,”
J. Teknol. Inf. …, vol. 15, no. 1, hal.
52–61, 2023, [Daring]. Tersedia pada:
https://www.jurnal.univbinainsan.ac.
id/index.php/jti/article/view/2054%0 Ahttps://www.jurnal.univbinainsan.a c.id/index.php/jti/article/download/2 054/1046.
[9] N. Wayan Wardani et al.,
“Penerapan Data Mining Untuk Klasifikasi Penjualan Barang Terlaris Menggunakan Metode Decision Tree C4.5,” no. 2, hal.
268–279, 2022.