http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom |Page | 545
Analisa Prediksi Penjualan Produk Dengan Menggunakan Metode C4.5 (Studi Kasus: PT. Kawan Lama Ace Hardware)
Muhammad Rizal Lubis
Program Studi Teknik Informatika, STMIK Budi Darma, Medan, Indonesia Jalan Sisingamangaraja No. 338 Medan, Indonesia
Abstrak
PT. Kawan Lama Ace Hardware merupakan sebuah perusahaan ritel yang bergerak dalam bidang perlengkapan dan produk gaya hidup.
Lebih dari 3.500 jenis produk tersedia dengan harga bersaing, memenuhi hampir semua kebutuhan konsumen sehari-hari. PT. Kawan Lama Ace Hardware kurangnya menganalisa penjualan barang dan pemasukan barang atau persediaan di gudang, disamping itu juga pihak perusahaan tidak pernah menganalisa penjualan barangnya sehingga tidak mengetahui apakah produk penjualan tahun sebelumnya lebih banyak dibanding tahun sekarang dan produk apa saja yang paling laris pada perusahaan sedangkan jumlah data yang begitu besar bisa menjadi masalah dan kewalahan dalam menghitung produk yang ada pada perusahaan tersebut dibutuhkan suatu aplikasi Tanagra yang dapat mengelompokan hasil penjualan produk mobil.
Kata Kunci: Data Mining, Decision tree, Penjualan Produk.
Abstract
PT. Kawan Lama Ace Hardware is a retail company engaged in lifestyle equipment and products. More than 3,500 types of products are available at competitive prices, fulfilling almost all the daily needs of consumers. PT. Kawan Lama Ace Hardware lacks analysis of sales of goods and entry of goods or inventory in the warehouse, besides that the company has never analyzed the sales of goods so it does not know whether the previous year's product sales are more than the current year and what products are most in demand in the company while the number Such large data can be a problem and overwhelmed in calculating existing products at the company requires a Tanagra application that can classify the results of sales of car products.
Keywords: Data Mining, Decision tree, Product Sales.
1. PENDAHULUAN
PT. Kawan Lama Ace Hardware merupakan sebuah perusahaan ritel yang bergerak dalam bidang perlengkapan dan produk gaya hidup. Lebih dari 3.500 jenis produk tersedia dengan harga bersaing, memenuhi hampir semua kebutuhan konsumen sehari-hari. Semakin berkembangnya persaingan dalam dunia bisnis menuntut para pengembang perusahaan untuk menemukan suatu pola yang dapat meningkatkan penjualan dan pemasaran produk di perusahaannya, salah satunya adalah dengan memanfaatkan teknologi untuk membantu memprediksi hasil analisa penjualan. Mengingat masalah yang terjadi selama ini pihak PT. Kawan Lama Ace Hardware kurangnya menganalisa penjualan barang dan pemasukan barang atau persediaan di gudang, disamping itu juga pihak perusahaan tidak pernah menganalisa penjualan barangnya sehingga tidak mengetahui apakah produk penjualan tahun sebelumnya lebih banyak dibanding tahun sekarang dan produk apa saja yang paling laris pada perusahaan sedangkan jumlah data yang begitu besar bisa menjadi masalah dan kewalahan dalam menghitung produk yang ada pada perusahaan tersebut.
Dengan adanya masalah tersebut dibutuhkan suatu aplikasi Tanagra yang dapat mengelompokan hasil penjualan produk mobil. Bahwa PT. Kawan Lama Ace Hardware sebagai perusahaan yang bergerak dalam bidang Ritail Perlengkapan mobil. Tidak hanya Ace Hardware, masih begitu banyak perusahaan-perusahaan lain yang bergerak dibidang yang sama.
Hal tersebuat dapat menimbulkan persaingan bisnis antar perusahaan.
Data mining diharapkan untuk memberikan solusi keputusan yang tepat di dunia bisnis untuk mengembangkan bisnis mereka. Tujuan dari penelitian ini untuk menggetahui penjualan yang paling diminati konsumen khususnya dalam penjualan perlengkapan mobil. Manfaatnya mempermudah analisa data yang cukup besar dan membantu memberikan informasi data penjualan yang di olah. Salah satu metode yang digunakan dalam data mining ini adalah metode C4.5 ( pengelompokan ) Hasil dari penelitian ini adalah aplikasi yang dapat membantu perusahaan dalam pengambilan keputusan dalam mendapatkan rangka pola penjualan produk
Dalam kutipan jurnal David Hartanto Kamagi, Seng Hansun NO (ISSN 2085-4552) dengan judul “Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa “ Menjelaskan bahwa Algoritma C4.5 merupakan algoritma klasifikasi pohon keputusan yang banyak digunakan karena memiliki kelebihan utama dari algoritma yang lainnya. Kelebihan algoritma C4.5 dapat menghasilkan pohon keputusan yang mudah diinterprestasikan, memiliki tingkat akurasi yang dapat diterima, efisien dalam menangani atribut bertipe diskret dan dapat menangani atribut bertipe diskret dan numeric. Dalam mengkonstruksi pohon, algoritma C4.5 membaca seluruh sampel data training dari storage dan memuatnya ke memori. Hal inilah yang menjadi salah satu kelemahan algoritma C4.5 dalam kategori
“skalabilitas” adalah algoritma ini hanya dapat digunakan jika data training dapat disimpan secara keseluruhan dan pada waktu yang bersamaan di memori. Dalam mengkonstruksi pohon, algoritma C4.5 membaca seluruh sampel data training dari storage dan memuatnya ke memori[1].
2. LANDASAN TEORI
2.1 Algoritma C.45
http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom |Page | 546 Algoritma C4.5 dan decision tree merupakan dua model yang tidak terpisahkan, karena untuk membangun sebuah decision tree, dibutuhan algoritma C4.5. Di akhir tahun 1970 hingga di awal tahun 1980-an, J. Ross Quinlan seorang peneliti di bidang mesin pembelajaran mengembangkan sebuah model decision tree yang dinamakan ID3 (Iterative Dichotomiser), walaupun sebenarnya proyek ini telah dibuat sebelumnya oleh E.B. Hunt, J. Marin, dan P.T. Stone. Kemudian Quinlan membuat algoritma dari pengembangan ID3 yang dinamakan C4.5 yang berbasis supervised learning. Serangkaian perbaikan yang dilakukan pada ID3 mencapai puncaknya dengan menghasilkan sebuah sistem praktis dan berpengaruh untuk decision tree yaitu C4.5. Perbaikan ini meliputi metode untuk menangani numeric attributes, missing values, noisy data, dan aturan yang menghasilkan rules dari trees. Ada beberapa tahapan dalam membuat sebuah decision tree dalam algoritma C4.5 yaitu : 1. Mempersiapkan data training. Data training biasanya diambil dari data histori yang pernah terjadi sebelumnya atau
disebut data masa lalu dan sudah dikelompokkan dalam kelas-kelas tertentu.
2. Menghitung akar dari pohon. Akar akan diambil dari atribut yang akan terpilih, dengan cara menghitung nilai gain dari masing – masing atribut, nilai gain yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dahulu nilai entropy.
Untuk menghitung nilai entropy menggunakan persamaan I:
Keterangan:
Entropy(S) =∑𝑎𝑖−1−𝑝𝑖 ∗ 𝑙𝑜𝑔2𝑝𝑖 (1)
S : himpunan kasus A : fitur
n : jumlah partisi S
Pi : proporsi dari Si terhadap S
Sementara itu perhitungan nilai gain menggunakan persamaan II:
Gain(S,A)=Entropy(S)-∑ Si
S 𝑛 𝑖−
xEntropy(𝑆𝑖) (2)
Keterangan:
S : himpunan kasus A : atribut
n : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus dalam S.
3. ANALISA DAN PEMBAHASAN
Analiasa data penjualan dilakukan setelah data terkumpul dan sesuai dengan kebutuhan sistem ini untuk menghasilkan kesimpulan berdasarkan pada analisa data penjualan suku caadang. Analisa data dilakukan berdasarkan teknik algoritma C.45 dengan beberapa langkah-langkah yang sudah ditentukan. Data yang diambil merupakan data transaksi penjualan perlengkapan mobil pada bulan januari 2016 di PT. Kawan Lama Ace Hardware dimana data tersebut merupakan data yang mewakili keseluruhan data transaksi yang dapat dilihat pada tabel 1.
Tabel 1. Daftar Penjualan Perlengkapan Mobil 2016
Perlengkapan Mobil
Bulan Januari Bulan Pebruari Bulan Maret Bulan April
Total M I M
II M III
M IV
M I
M II
M III
M IV
M I
M II
M III
M IV
M I
M II
M III
M IV Foldable
platform handtruck 300kg small
36 44 51 48 32 37 28 27 31 34 32 29 38 42 40 41 590
Platform hand truck plastic
200kg
31 26 37 18 15 17 21 8 10 11 13 8 15 27 18 9 284
Mechanic tool
kit 66 pcs 33 39 24 26 44 49 36 27 44 47 42 46 22 24 17 40 560
Mechanical tool set krisbow
black (78)
21 20 14 14 17 25 27 20 18 19 11 13 17 19 21 22 298
Hand pallet big 3t 685x1220mm
w/ nylon
5 2 4 3 2 3 3 1 10 12 7 9 11 14 13 8 107
Foldable
platform 33 38 31 30 39 41 39 43 24 27 27 14 23 25 17 38 489
http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom |Page | 547
Perlengkapan Mobil
Bulan Januari Bulan Pebruari Bulan Maret Bulan April
Total M I M
II M III
M IV
M I
M II
M III
M IV
M I
M II
M III
M IV
M I
M II
M III
M IV handtruck
150kg small Electric hoist reel double hook 1000kg
1 3 1 2 7 7 9 8 16 18 15 13 13 15 16 20 164
Safety shoes hercules 4in(40/6.5)
28 30 21 12 17 19 17 18 14 15 18 20 18 19 17 18 301
Safety shoes goliath 6in(40/6.5)
22 22 29 15 30 28 31 30 27 29 21 20 27 30 30 22 413
Mechanic tool
kit 28 pcs 29 27 19 17 26 28 25 28 25 31 23 26 29 32 30 25 420
Berikut ini adalah uraian langkah-langkah dalam algoritma C4.5 untuk menyelesaikan kasus suatu penjualan produk akan dilakukan atau tidak, berdasarkan data yang ada. Data yang telah ada pada tabel x.., akan digunakan untuk membentuk pohon keputusan.
Pada tabel x.., atribut-atributnya adalah data items yang terdiri dari 10 items, katagori dan bulan penjualan. Setiap atribut memiliki nilai. Sedangkan kelasnya ada pada kolom katagori yaitu katagori “Naik (N)” dan katagori “Turun (T)”.
Kemudian data tersebut dianalisis.
Tabel 2. Learning Dataset
No Nama Items Penjualan Per Bulan
I Katagori II Katagori III Katagori IV Katagori 1 Foldable
platform handtruck 300kg small
179 N 12
4 T 126 N 161 N
2 Platform hand truck plastic 200kg
112 N 61 T 42 T 69 N
3 Mechanic tool
kit 66 pcs 122 T 15
6 N 179 N 103 T
4 Mechanical tool set krisbow black (78)
69 N 89 N 61 T 79 N
5 Hand pallet big 3t
685x1220mm w/ nylon
14 T 9 T 38 N 46 N
6 Foldable platform handtruck 150kg small
132 N 16
2 N 92 T 103 N
7 Electric hoist reel double hook 1000kg
7 T 31 N 62 N 64 N
8 Safety shoes hercules 4in(40/6.5)
91 N 71 T 67 T 72 N
9 Safety shoes goliath 6in(40/6.5)
88 T 11
9 N 97 T 109 N
10 Mechanic tool
kit 28 pcs 92 T 10
7 N 105 T 127 N
Hitung nilai entropy dengan rumus :
http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom |Page | 548 Entropy (S) = ∑𝑘𝑗=1−𝑃𝑗 𝑙𝑜𝑔2 𝑃𝑗
Jadi entropy (S) = (- (24/40) * Log2(24/40) + (- (16/40) * Log2(16/40) = 0,442179356 + 0,528771238
= 0,970950594
Tabel 2. Hasil Perhitungan Pada Dataset
Total kasus Sum (N) Sum (T) Entropy Total
40 25 15 0,970950594
Setelah mendapatkan entropi dari keseluruhan kasus, lakukan analisis pada setiap atribut dan nilai-nilainya serta hitung entropinya seperti yang ditampilkan pada Tabel 2.
Tabel 3. Analisis Atribut, Nilai, Banyaknya Kejadian Nilai, Entropi dan Gain
No Nilai I II III IV
1 Sum (N) 5 6 4 9
2 Sum (T) 5 4 6 1
Entropy 1 0,970951 0,970951 0,468996
Gain 0,470951 0,494134 0,494134 0,814609
Langkah terakhir membuat pohon keputusan dari setiap setiap atribut dan nilai yang dapat di lihat pada gambar 3.
Gambar 2. Pohon Keputusan Hasil Akhir Fordable Platform Handtruck 300 Kg Small.
4. IMPLEMENTASI
Dalam Mengimplementasi algoritma C4.5 untuk analisa prediksi penjualan produk mengunakan tools tanagra versi 1.4.
adalah sebagai berikut:
http://ejurnal.stmik-budidarma.ac.id/index.php/jurikom |Page | 549 Gambar 3. Hasil asosiasi final.
5. KESIMPULAN
Berdasarkan analisa diatas, maka penulis mengambil kesimpulan antara lain:
1. Di dalam menganalisa data penjualan produk ritel pada PT. Kawan Lama Ace Hardware membutuhkan sebuah data yang real dimana hampir dari 3.500 jenis produk tersedia sehingga membutuhkan pemanfaatan data yang ada di dalamnya dengan menggunakan algoritma C4.5 yang dapat menghasilkan pohon keputusan yang mudah diinterprestasikan dan memiliki tingkat akurasi yang dapat diterima dan efisien dalam menangani atribut bertipe diskret dan dapat menangani atribut bertipe diskret dan numeric.
2. Dalam penerapannya algoritma C4.5 membaca seluruh sampel data training dari storage dan memuatnya ke memori sehingga dalam mengkonstruksi pohon keputusan, algoritma C4.5 dapat membaca seluruh sampel data training dari storage dan memuatnya ke memori.
REFERENCES
[1] FajarAstutiHermawan, 2013, ‘Artificial Intelegency’EdisiPertama,Yokyakarta, Penerbit Andi [2] Kusrini, Emma TaufiqLuthfi, 2009,‘ IntelejensiBuatan” Yokyakarta:Penerbit Andi
[3] Wikipedia, The Free Encyclopedia [Online],Available :http://en.wikipedia.orgJohn von Neuman.
[4] Sopiah dan Syihabudhin, Manajemen Bisnis Ritel. Yogyakarta, 2008.
[5] Pramudiono, Iko. Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.com22Mei 2014.
[6] Pramudiono, Iko. Teknik Data Mining: memprediksibarang2014.
[7] Journal of Method C.45 http://elib.unikom.ac.id/download.php.id=7098 22Mei 2014 [8] http://fiy-a.blogspot.com/2017/07/tutorial-microsoft-office-excel-2003.html.