• Tidak ada hasil yang ditemukan

Klasifikasi Penjualan berdasarkan Platform pada UMKM Omah Branded Menggunakan Random Forest

N/A
N/A
Protected

Academic year: 2024

Membagikan "Klasifikasi Penjualan berdasarkan Platform pada UMKM Omah Branded Menggunakan Random Forest"

Copied!
10
0
0

Teks penuh

(1)

Klasifikasi Penjualan berdasarkan Platform pada UMKM Omah Branded Menggunakan Random Forest

Rindiyani1, Ardhin Primadewi1,*, Maimunah1, Annisa Hakim Purwantini2

1Fakultas Teknik, Teknik Informatika, Universitas Muhammadiyah Magelang, Magelang, Indonesia

2Fakultas Ekonomi dan Bisnis, Akuntansi, Universitas Muhammadiyah Magelang, Magelang, Indonesia Email: 1[email protected] , 2,*[email protected], 3[email protected], 4[email protected]

Email Penulis Korespondensi: [email protected] Submitted 27-10-2022; Accepted 31-10-2022; Published 31-10-2022

Abstrak

UMKM memiliki peran dalam pertumbuhan pembangunan meningkatkan pendapatan negara. Omah Branded yang merupakan UMKM kategori Fashion dari kalangan anak kecil hingga dewasa di area Mungkid, Kabupaten Magelang, Indonesia. Saat ini data transaksi penjualan yang dihasilkan belum dimanfaatkan untuk mengelompokkan atau mengklasifikasikan produk penjualan berdasarkan platform penjualan yang dapat mempengaruhi pemasukan pada Omah Branded tersebut. Penjualan produk pada platform online sering disebut dengan digital marketing. Hal tersebut telah menyebar luas dan banyak diterapkan di Indonesia karena perkembangan internet dan perubahan perilaku konsumen. Kemudahan akses internet menggunakan wifi ataupun perangkat gadget memudahkan masyarakat untuk mengakses informasi mengenai suatu produk atau jasa yang dicari. Data mining untuk melakukan klasifikasi salah satunya yaitu Algoritma Random Forest. Algoritma hutan acak atau Random Forest memiliki pemilihan acak dalam menghasilkan simpul anak untuk setiap simpul (simpul atas), hasil klasifikasi dari setiap pohon diakumulasikan serta hasil klasifikasi yang sering muncul dapat meningkatkan sebuah akurasi. Pada penelitian ini dengan melakukan klasifikasi data penjualan Omah Branded berdasarkan platform penjualan dengan menggunakan metode random forest mengharapkan hasil penelitian ini dapat dijadikan sebagai solusi pengembangan untuk pengambilan strategi pemasaran UMKM Omah Branded. Nilai akurasi menggunakan klasifikasi Random Forest pada data penjualan produk Omah Branded ini menghasilkan akurasi sebesar 92%berdasarkan hasil perhitungan confusion matrix.

Kata Kunci: Fashion; Data Mining; Klasifikasi; Penjualan; UMKM Abstract

UMKM have a role in development growth to increase state income. Omah Branded which is an UMKM in the Fashion category from small children to adults in the Mungkid area, Magelang Regency, Indonesia. Currently the resulting sales transaction data has not been used to classify or classify sales products based on the sales platform that can affect the revenue of the Branded Omah. Selling products on online platforms is often referred to as digital marketing. It has become widespread and widely applied in Indonesia due to the development of the internet and changing consumers. Easy internet access using wifi or gadgets makes it easier for people to access information about a product or service they are looking for. One of the data mining for classification is the Random Forest Algorithm.

The Random Forest algorithm has a random selection in generating child nodes for each node (top node), the classification of each tree is accumulated and the classification results that appear frequently can improve accuracy. In this study, by classifying Omah Branded sales data based on the sales platform using the random forest method, it is hoped that the results of this study can be used as a development solution for taking Omah Branded marketing strategies. The accuracy value using the Random Forest classification on the sales data of this Omah Branded product produces an accuracy of 92% based on the results of the confusion matrix calculation.

Keywords: Fashion; Data Mining; Classification; Sale; UMKM

1. PENDAHULUAN

Kemajuan bisnis serta usaha di Indonesia saat ini dibarengi dengan perkembangan di bidang teknologi informasi dan komunikasi (TIK) [1], [2]. UMKM berperan penting dalam pertumbuhan pembangunan [3], meningkatkan pendapatan negara [4], [5] dan merupakan sumber pertumbuhan kesempatan kerja [6], [7]. Bisnis UMKM selama ini merupakan bisnis yang minim strategi pemasaran secara luring juga daring. Namun saat ini UMKM telah berkembang pesat dengan munculnya berbagai ide bisnis kreatif dan inovatif berbasis teknologi pada beberapa UMKM [8]–[10]. Inovasi teknologi diperlukan untuk memenangkan persaingan bisnis saat ini [11]. Proses inovasi ini merupakan bagian dari transformasi digital di lingkup UMKM[12]. Transformasi digital secara khusus pada penjualan barang ditunjukkan dengan penggunaan platform penjualan online seperti marketplace dan social media [13]. Kemudahan akses internet menggunakan wifi ataupun perangkat gadget memudahkan masyarakat untuk mengakses informasi mengenai suatu produk atau jasa yang dicari [14].

Omah Branded yang merupakan UMKM kategori Fashion di area Mungkid, Kabupaten Magelang, Indonesia sudah berproses dalam transformasi digital dalam proses penjualannya. Omah Branded menggunakan 2 platform online (Instagram dan Shopee) untuk memasarkan produk fashionnya. Instagram sebagai social media yang digunakan Omah Branded telah memiliki 70.008 follower dengan reseller aktif berjumlah 70. Sedangkan Shopee sebagai marketplace juga memiliki 6.600 follower dengan member aktif berjumlah 60. Hasil observasi menunjukkan bahwa saat ini data transaksi penjualan Omah Branded belum dimanfaatkan secara maksimal. Data yang tersimpan di dalam sistem dan data yang di rekap oleh admin Omah Brand belum dapat memberikan masukan pada pemilik Omah Brand untuk memproritaskan platform penjualan yang digunakan. Sehingga hal ini dapat meningkatkan pembelian konsumen.

Berdasarkan uraian di atas diperlukan analisis klasifikasi produk berdasarkan platform penjualan. Untuk melakukan klasifikasi dapat menggunakan penerapan teknik data mining [15]. Random forest merupakan salah satu

(2)

harus penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi. Suatu metode pohon gabungan yang dikembangkan dari metode Classification and Regression Tree (CART), yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random feature selection merupakan pengertian dari Random Forest.

Permasalahan dalam bidang kesehatan, bisnis, pendidikan, dan lain-lain sudah banyak pengaplikasian dengan metode Algorithma Random Forest. [15]. Algorithma hutan acak atau Random Forest memiliki pemilihan acak dalam menghasilkan simpul anak untuk setiap simpul (simpul atas), hasil klasifikasi dari setiap pohon diakumulasikan serta hasil klasifikasi yang sering muncul dapat meningkatkan sebuah akurasi. [16]. Pada penelitian ini melakukan klasifikasi data penjualan Omah Branded berdasarkan platform penjualan dengan metode algorithma hutan acak (random forest) mengharapkan hasil yang dapat digunakan sebagai solusi pengembangan strategi pemasaran UMKM Omah Branded untuk meningkatkan pemasukan penjualan.

2. METODOLOGI PENELITIAN

Pada penelitian ini terdapat beberapa tahapan yaitu identifikasi masalah, pengumpulan data, analisis data, preprocessing, data mining, dan interpretation yang dapat dilihat pada gambar 1 dibawah ini.

Gambar 1. Metodologi Penelitian

2.1 Identifikasi Masalah

Pada tahap pertama penelitian dilakukan proses identifikasi masalah. Omah Branded yang merupakan UMKM kategori Fashion di area Mungkid, Kabupaten Magelang, Indonesia memiliki permasalahan terkait pendataan penjualan produknya. Pendataan tersebut belum sepenuhnya memberikan kemudahan bagi pemilik Omah Branded untuk dapat mengelompokkan produk berdasarkan status penjualan dan platform penjualan yang dapat meningkatkan omset Omah Branded. Masalah tersebut mengakibatkan pemilik Omah Branded kesulitan menentukan platform penjualan (platform Instagram atau Shopee) terbaik untuk Omah Branded dan kesulitan menentukan stok utama sesuai minat pelanggan Omah Branded. Hal ini sangat mempengaruhi pemasukan/omset Omah Branded.

2.2 Pengumpulan Data

Tahap kedua yaitu pengumpulan data yang terdiri dari penjelasan terhadap sumber data, periode data, dan jumlah data yang digunakan [17]. Studi kasus penelitian ini dilakukan di Omah Branded yang merupakan UMKM kategori Fashion di area Mungkid, Kabupaten Magelang, Indonesia. Pengumpulan data ini dilakukan melalui observasi langsung dan wawancara dengan pemilik serta operator kasir penjualan toko Omah Branded. Data penelitian merupakan data transaksi penjualan seluruh produk yang dijualkan dalam 20 minggu atau 5 bulan (bulan Desember 2021 hingga April 2022).

Pada gambar 2 di bawah ini merupakan data yang berjumlah 1200 record bersumber dari data penjualan selama 20 minggu (platform Instagram dan platform Shopee). Beberapa sampel data primer yang di dapatkan dari transaksi penjualan pada Omah Branded memiliki variabel yaitu nama produk, harga satuan, data penjualan per minggu, platform penjualan. Kolom paling kiri menunjukkan nama produk dari 60 data produk. Pada kolom Des_1 merupakan data transaksi penjualan bulan desember minggu pertama (hal tersebut juga berlaku untuk minggu-minggu berikutnya).

Kemudian kolom paling kanan menunjukkan platform penjualan produk yang telah digunakan Omah Branded selama 3 tahun.

(3)

Gambar 2. Data Primer Transaksi Penjualan 2.3 Analisis Data

Pada tahap ketiga yaitu analisis data dan preprocessing menggunakan beberapa cara seperti data selection, data understanding, data vizualitation.

2.3.1 Data Selection

Data transaksi penjualan seluruh produk yang dijualkan dalam 20 minggu atau 5 bulan (bulan Desember 2021 hingga April 2022) dari Omah Branded belum memiliki status atau label penjualan. Tahap selection data ini digunakan untuk mengurangi kompleksitas atribut yang akan dikelola pada tahap selanjutnya. Dalam proses menambahkan status penjualan (hasil pada gambar 3) terdapat beberapa ketentuan. Ketentuan pertama yaitu penjualan produk setiap minggunya lebih dari sama dengan 100 maka dikatakan produk Paling_Laris. Ketentuan kedua merupakan penjualan produk kurang dari sama dengan 15 yaitu dikatakan Tidak_Laris. Ketentuan ketiga merupakan penjualan produk diantara 14-99 maka dikatakan Laris.

Gambar 3. Hasil Data Selection 2.3.2 Data Understanding

Pada tahap data understanding, data dan transaksi dikumpulkan untuk diketahui atribut seperti nama produk, harga satuan, data penjualan dari minggu pertama bulan Desember hingga minggu keempat, platform penjualan, dan status penjualan pada Omah Branded. Data yang sudah dihasilkan kemudian diproses menggunakan metode Random Forest serta tools Notebook Jupyter Collab untuk proses pengkodingan.

2.3.3 Data Vizualitation

Pada tahap data vizualitation terdapat beberapa visualisasi untuk menunjukkan dan menampilkan dari data Omah Branded. Pertama melakukan visualisasi untuk menampilkan persentase jumlah produk berdasarkan status penjualannya pada Omah Branded yang merupakan hasil dari wawancara terhadap pemilik Omah Branded. Kedua dengan melakukan visualisasi untuk menampilkan data penjualan produk Omah Branded per Minggunya. Hasil visualisasi data sangat bervariasi (jenis produk yang penjualannya tinggi). Ketiga melakukan visualisasi untuk mengetahui platform penjualan yang mempengaruhi penjualan pada Omah Branded tersebut. Dengan melakukan filtering data terlebih dahulu berdasarkan platform penjualannya.

2.4 Preprocessing

Dalam melakukan pengolahan dan pemodelan, data terlebih dahulu harus melalui proses yang disebut preprocessing. Hal ini bertujuan agar data yang digunakan pada pemodelan selanjutnya telah bebas dari noise sehingga kualitas model yang dihasilkan kualitas model yang dihasilkan menjadi lebih baik [18]. Tahapan preprocessing pada penelitian ini yaitu melakukan proses Label Encoding dan Deteksi Outlier. Label Encoding merupakan proses mengubah data yang berbentuk string pada data penjualan dari Omah Branded agar menjadi bentuk numerik bertujuan untuk memudahkan tahap klasifikasi.

2.5 Data Mining

(4)

Data mining adalah proses menemukan korelasi, pola dan trend baru yang berguna dengan mencari sejumlah besar penyimpanan data menggunakan teknik pengenalan pola seperti statistik dan teknik matematika [19]. Penelitian ini menggunakan Algoritma Klasifikasi Random Forest. Algoritma pemodelan klasifikasi random forest atau hutan acak adalah pohon klasifikasi (classification tree) yang dapat digunakan untuk mengklasifikasikan data dalam respons multikelas [20]. Pengambilan keputusan menggunakan pohon keputusan dan random forest ditunjukkan pada gambar ke 4. Dengan menerapkan data mining random forest tersebut dapat mengelompokkan atau mengklasifikasikan produk yang dijual berdasarkan platform penjualan

Gambar 4. Ilustrasi Pohon Random Forest 2.6 Interpretation

Interpretasi data adalah serangkaian proses yang melibatkan pemeriksaan data melalui beberapa proses yang telah ditentukan sebelumnya yang membantu memberikan beberapa makna pada data dan menarik kesimpulan yang relevan bagi pembaca serta pemilik Omah Branded. Oleh karena itu, interpretasi data mencakup interpretasi hasil analisis data [15]. Setelah menghasilkan mengenai klasifikasi maka hasil pengujian dilakukan evalusi dari confussion matrix dan pengukuran menggunakan accurancy, precision, dan recall. Dapat dilihat dari persamaan 1 hingga persamaan 3 dibawah ini.

a. Akurasi (Accurancy)

Nilai akurasi menunjukkan akurasi prediksi model yang dibangun baik di kelas positif (ya) dan kelas negatif (tidak).

Rumus akurasi adalah [18]:

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 𝑥 100% (1)

b. Recall (Sensitifitas)

Rasio prediksi positif benar dibandingkan dengan jumlah total data yang positif benar. Rumus recall adalah sebagai berikut [15] :

𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃

𝑇𝑃+𝐹𝑁 𝑥 100% (2)

c. Precision

Rasio prediksi positif benar dibandingkan dengan jumlah total data yang positif benar. Rumus precision adalah sebagai berikut [9] :

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝐹𝑃 𝑥 100% (3)

Keterangan:

TP : Jumlah data positif yang diklasifikasikan dengan benar oleh sistem.

TN : Jumlah data negatif yang diklasifikasikan dengan benar oleh sistem.

FP : Jumlah data positif yang diklasifikasikan salah oleh sistem.

FN : Jumlah data negatif yang diklasifikasikan salah oleh sistem.

3. HASIL DAN PEMBAHASAN

Pada penelitian ini menggunakan aplikasi Jupyter Notebook (Anaconda3) untuk menyelesaikan klasifikasi penjualan pada Omah Branded, beberapa hasil dan pembahasannya adalah sebagai berikut.

3.1 Hasil Analisis Data

Pada beberapa tahapan analisis data penjualan Omah Branded yang digunakan menghasilkan 1200 record data penjualan selama 20 minggu. Pada tahap describe data menghasilkan data penjualan rata-rata dari harga satuan sebesar 92.650 terdapat pada penjualan Minggu ke-4 bulan April. Selanjutnya harga satuan produk Omah Branded dengan harga penjualannya tertinggi yaitu Rp225.000 dan harga terendah Rp35.000. Pada data penjualan Omah Branded ini tidak

(5)

terdapat missing value data maupun duplikat data berdasarkan hasil analisis data tersebut dapat dilihat pada gambar 5 dan gambar 6.

Gambar 5. Hasil Data Describe Penjualan Pada Omah Branded

Gambar 6. Hasil Cek Missing Value Data Penjualan 3.1.1 Visualisasi Data

Selanjutnya tahap visualisasi ini yaitu pertama untuk visualisasi menampilkan persentase jumlah produk berdasarkan status penjualannya pada Omah Branded. Persentase status penjualan tersebut menghasilkan persentase paling banyak adalah 70% produk tidak laris, produk paling laris persentasenya yaitu 8,3% dan produk laris 21,67%. Beberapa hasil persentase tersebut berdasarkan hasil dari wawancara terhadap pemilik Omah Branded. Dengan ketentuan jika penjualan produk setiap minggunya lebih dari sama dengan 100 maka dikatakan produk paling laris lalu untuk penjualan produk kurang dari sama dengan 15 yaitu dikatakan tidak laris dan untuk penjualan produk di antara 14 hingga 99 maka dikatakan laris. Berikutnya visualisasi untuk menampilkan data penjualan produk Omah Branded per Minggunya. Hasil visualisasinya sangat bermacam-macam jenis produk yang penjualannya tinggi. Berdasarkan hasil analisis visualisasi data tersebut dapat dilihat pada gambar 7 dan gambar 8.

(6)

Gambar 8. Hasil Visualisasi Berdasarkan Penjualan Produk Permingu

Visualisasi untuk mengetahui platform penjualan apa yang mempengaruhi penjualan pada Omah Branded tersebut. Dengan adanya melakukan filtering terlebih dahulu berdasarkan platform penjualannya. Maka menghasilkan platform Instagram yang penjualannya paling banyak dari data transaksi Omah Branded dari minggu pertama bulan Desember hingga minggu keempat bulan April, dapat dilihat pada gambar 9.

Gambar 9. Hasil dari perbandingan platform penjualan Omah Brandeded 3.2 Preprocessing Data

Tahapan preprocessing data pada penelitian ini yaitu proses Label Encoding dan proses Outlier. Label Encoding merupakan proses mengubah data yang berbentuk string pada data penjualan dari Omah Branded agar menjadi bentuk numerik bertujuan untuk memudahkan tahap klasifikasi. Pada tahap ini kolom yang diprocessing yaitu variable nama produk, platform , dan status penjualan. Dengan nama produk dari angka 1-60, lalu untuk platform angka 0 untuk

(7)

Instagram, angka 1 untuk Shopee, dan untuk status penjualan angka 0 Laris, angka 1 Paling Laris, dan angka 2 Tidak Laris. Hasil dari label encoding untuk 5 dataset teratas dapat dilihat pada gambar 10.

Gambar 10. Hasil Dari Preprocessing Data

Gambar 11. Hasil Dari Detect Outlier Data Penjualan Produk Pada Omah Branded

Pada gambar 11 tersebut menampilkan outlier pada penjualan produk Omah Branded. Terdapat outlier paling jauh yaitu pada diantara titik 160an. Pada penelitian ini menggunakan data penjualan produk pada bulan desember minggu keempat. Dapat dilihat pada gambar dibawah ini. Pada gambar tersebut terlihat batas atas, batas bawah pada outlier.

Dengan menentukan Q1, Q2, Q3, maka setelah itu menghitung IQR. Hasil dari detect outlier pada bulan desember minggu ke empat yaitu terdapat 5 produk, yaitu jilbab journey penjualan di shopee, kaos penjualan di instagram, kaos penjualan di shopee, long cardigan NUX penjualan di shopee, sweater penjualan di instagram.

3.3 Data Mining

Sebelum ke proses klasifikasi yaitu menentukan variabel independen dan variabel dependen. Variabel adalah besaran yang dapat mempengaruhi suatu kejadian atau hasil suatu penelitian. Kehadiran variabel memudahkan analisis masalah.

Variabel juga sangat penting, terutama dalam penelitian. Variabel independen merupakan variabel yang mempengaruhi atau menyebabkan perubahan pada faktor yang diukur atau dipilih dalam mengetahui hubungan antara fenomena yang diamati. Pada penelitian ini untuk variable dependen (y) yaitu dari variabel status penjualannya. Lalu untuk variable independent (x) yaitu semua variabel dataset selain variabel status penjualan. Kemudian membagi data training dan data testing, dengan data testing nya 40%, lalu untuk random state nya adalah 0 bertujuan untuk menjamin nilai yang dihasilkan konsisten.

Setelah data testing dan data trainingnya sudah ditentukan, langkah selanjutnya yaitu ke proses klasifikasi. Pada penelitian ini menggunakan algoritma Random Forest. Random forest merupakan algoritma yang dihasilkan dari sekumpulan decision tree, di kasus ini menggunakan n_estimators adalah 100, itu berati pohon terbentuk berjumlah 100.

Hasil akhir untuk pohon Random Forestnya dapat dilihat pada gambar 12.

Berdasarkan gambar 12 merupakan hasil tree random forest yang membentuk setiap cabang dari pohon merupakan pembagian yang diperoleh dari 24 hasil uji, dan titik samples 2 dan 1 merupakan akhir dari sebuah pohon yang menggambarkan hasil baik berupa klasifikasi random forest.

(8)

Gambar 12. Hasil Tree Random Forest 3.4 Interpretation

Pada gambar 14 merupakan hasil dari akurasi berdasarkan Algoritma Random Forest, penelitian ini menghasilkan akurasi keseluruhan bernilai 92%, serta hasil untuk perhitungan recall, precision, f1-score.

Gambar 13. Hasil Confusion Matrix Gambar 14. Hasil Akurasi berdasarkan Algoritma Random Forest Pengukuran performa untuk klasifikasi machine learning berdasarkan nilai prediksi dan nilai aktual merupakan pengertian dari Confusion Matrix. Berdasarkan gambar ke 13 yaitu hasil dari performa confusion matrix dengan metode Random Forest. Confusion Matrix memiliki empat kombinasi nilai prediksi dan nilai aktual, dari keempat nilai tersebut adalah True Positive (TP), True Negative (TN), False Positive (FP), dan False Negative (FN).

Setelah mengetahui 4 kombinasi nilai prediksi dan nilai aktual tersebut dapat menentukan besar nya nilai accurancy, recall, precision, dan f1-score. Accuracy merupakan keseluruhan nilai akurasi kebenaran model algorithma yang digunakan. Precision yaitu perbandingan antara kebenaran nilai positif atau True Positive dengan keseluruhan prediksi nilai positif. Lalu untuk nilai perbandingan antara kebenaran nilai positif status penjualan Laris dengan keseluruhan prediksi nilai positif status penjualan Laris bernilai 80%. Kemudian untuk status penjualan paling laris menghasilkan nilai precision sebesar 100%, dan untuk status penjualan tidak laris nilai precisionnya sebesar 94%.

Kemudian untuk Recall merupakan nilai kebenaran positif dengan keseluruhan nilai yang sebenarnya terjadi. Lalu untuk nilai kebenaran positif dengan keseluruhan nilai yang sebenarnya terjadi pada status penjualan laris bernilai 80%. Untuk status penjualan paling laris nilai Recall sebesar 67%, dan untuk status penjualan tidak laris sebesar 100%. Kemudian untuk f1-score adalah perbandingan rata-rata skor presisi dan nilai recall yang dibobotkan. Beberapa hasil nilai perhitungan tersebut dapat dilihat pada gambar 14.

Setelah mengetahui hasil dari perhitungan nilai accurancy, recall, precision, dan f1-score tersebut pada penelitian ini lebih baik memilih Recall yang nilainya tinggi karena lebih baik algoritma memprediksi status penjualan tidak laris tetapi sebenarnya status penjualan produk tersebut Laris ataupun Paling Laris karena dapat mempengaruhi Omah Brand lebih meningkat Kembali strategi marketing dan hal tersebut pengaruh pada omset Omah Brand.

Berikutnya yaitu hasil Prediksi berdasarkan Data x_test nya. Pada hasil klasifikasi menggunakan algoritma Random Forest dan menggunakan dataset x_test nya maka menghasilkan platform penjualan Instagram merupakan platform yang sangat mempengaruhi penjualan di Omah Brandedlalu untuk produk yang paling laris (Angka 1) adalah produk 26 yaitu Kaos, dan juga produk ke 22 yaitu jilbab journey. Pada gambar 15 dibawah ini merupakan hasil akhir penelitian untuk klasifikasi dengan metode algoritma random forest.

(9)

Gambar 15. Hasil Prediksi berdasarkan Data X Testingnya

Pada gambar 15 merupakan hasil dari prediksi klasifikasi berdasarkan data testingnya yang bersumber dari data penjualan selama 20 minggu (platform Instagram dan platform Shopee) pada Omah Branded. Kolom paling kiri menunjukkan nama produk dengan ditunjukkan dengan kode karena sudah melewati proses preprocessing. Pada kolom Des_1 merupakan data transaksi penjualan bulan desember minggu pertama (hal tersebut juga berlaku untuk minggu-minggu berikutnya). Kemudian setelah itu terdapat kolom platform yang menunjukkan platform yang digunakan pada penjualan produk tersebut. Berikutnya kolom paling kanan merupakan hasil prediksi klasifikasi Omah Branded menggunakan algoritma Random Forest.

4. KESIMPULAN

Kesimpulan yang didapatkan berdasarkan hasil penelitian, diketahui bahwa data penjualan dari Omah Branded dapat diklasifikasikan dengan metode Random Forest (hutan acak) dikarenakan bahwa data yang disimpan pada dataset training tidak memiliki kesamaan dengan data dalam data uji (data testing). Kemudian diketahui bahwa nilai akurasi menggunakan klasifikasi Random Forest pada data penjualan produk Omah Branded ini menghasilkan akurasi sebesar 92% berdasarkan hasil perhitungan confusion matrix. Hasil dari klasifikasi tersebut menghasilkan bahwa produk paling laris adalah yaitu Kaos dengan penjualan platform Instagram, dan juga jilbab journey dengan penjualan platform instagram. Maka dari itu platform penjualan Instagram sangat mempengaruhi penjualan pada Omah Branded tersebut.

REFERENCES

[1] R. A. Makna And Y. W. Setiadi, “Pengaruh Endorsement Fashion, Media Sosial Instagram Dan Lokasi Toko Terhadap Minat Beli Pakaian Remaja (Studi Kasus Toko Duta …,” J. Entrep. Dan …, Vol. 3, No. 2, Pp. 200–212, 2022, [Online]. Available:

Http://Jurnal.Umb.Ac.Id/Index.Php/Jems/Article/View/3267

[2] A. Primadewi, U. Yudatama, And S. Nugroho, “Pengukuran Tingkat Kematangan Pengembangan Business Intelligence Teknologi Informasi Dan Komunikasi (Tik) Pada Perguruan Tinggi,” Resti, Vol. 1, No. 1, Pp. 19–25, 2017.

[3] M. Ikhsan And A. Primadewi, “Analisa Dan Permodelan Proses Bisnis Menggunakan Business Process Model And Notation (Bpmn) Studi Kasus :,” 11th Univ. Res. Colloq. 2020, Pp. 401–409, 2020.

[4] A. Primadewi, T. A. Purnomo, And D. Sasongko, “Analisa Perancangan Sistem Pengelolaan Data Umkm Berdasarkan Business Intelligence Development Model Framework,” Vol. 3, Pp. 209–215, 2021, Doi: 10.30865/Json.V3i2.3587.

[5] A. Primadewi, T. M. Anwar, Y. Yustin, A. H. Sani, And M. Fauzi, “Penguatan Pemasaran Produk Umkm Ashfa Madu Borobudur Melalui Strategi Product Branding,” J. Pengabdi. Kpd. Masy., Vol. 26, No. 3, P. 154, 2020, Doi: 10.24114/Jpkm.V26i3.17683.

[6] M. R. Raharjo, “Analisis Algoritma Klasifikasi Dan Asosiasi Terhadap Atrtibut Data Pelaku Usaha Mikro Kecil Dan,” Vol. 8, No. 3, Pp. 176–181, 2017.

[7] M. Maimunah, A. Ghiffari, F. Kurniawan, C. Pamungkas, P. Farhaani, And A. Lintang, “Pendampingan Manajemen Produksi Kerajinan Kayu Pada Umkm Lancar Jaya Magelang,” J. Pengabdi. Kpd. Masy. Ubj, Vol. 4, No. 1, Pp. 37–46, 2021, Doi:

10.31599/Jabdimas.V4i1.442.

[8] A. Primadewi, S. C. Rohmana, D. A. Karim, D. Yuswanti, And S. Rofendi, “Optimizing Digital Transformation As A Destination Branding Strategy For Balkondes Karanganyar, Borobudur, Magelang,” Community Empower., Vol. 7, No. 7, Pp. 1255–1264, 2022, Doi: 10.31603/Ce.6724.

[9] A. Primadewi, D. H. Syahrir, H. R. P. Putri, M. Citra, And Fadloil, “Branding Arum Art Pottery Academy Di Desa Karanganyar Kec. Borobudur Dengan Implementasi Digitalpreneurship,” Proceeding …, Pp. 105–111, 2020, [Online]. Available:

Http://Repository.Urecol.Org/Index.Php/Proceeding/Article/View/1112

[10] F. Nidaul Khasanah Et Al., “Pemanfaatan Media Sosial Dan Ecommerce Sebagai Media Pemasaran Dalam Mendukung Peluang Usaha Mandiri Pada Masa Pandemi Covid 19,” J. Sains Teknol. Dalam Pemberdaya. Masy., Vol. 1, No. 1, Pp. 51–62, 2020, Doi:

10.31599/Jstpm.V1i1.255.

[11] Nurani And E. Widhajati, “Strategi Pemasaran Online Terhadap Peningkatan Penjualan Umkm Di Plut Kumkm Tulungagung,”

J. Benefit, Vol. 6, No. 1, Pp. 58–66, 2019, [Online]. Available:

Https://Journal.Unita.Ac.Id/Index.Php/Benefit/Article/View/267/247

[12] M. I. Purba, D. C. Y. Simanjutak, Y. N. Malau, W. Sholihat, And E. A. Ahmadi, “The Effect Of Digital Marketing And E- Commerce On Financial Performance And Business Sustainability Of Msmes During Covid-19 Pandemic In Indonesia,” Int. J.

(10)

[13] S. Yacob, U. Sulistiyo, E. Erida, And A. P. Siregar, “The Importance Of E-Commerce Adoption And Entrepreneurship Orientation For Sustainable Micro, Small, And Medium Enterprises In Indonesia,” Dev. Stud. Res., Vol. 8, No. 1, Pp. 244–252, 2021, Doi: 10.1080/21665095.2021.1976657.

[14] M. Rasyid And S. Lesnussa, “Analisis Tingkat Kepuasan Konsumen Pada Platform Jual Beli Online (Studi Kasus: Mahasiswa Fakultas Teknik Universitas Iqra Buru),” Vol. 15, No. 2, Pp. 1–23, 2022.

[15] J. Widiastuti, “Klasifikasi Pembiayaan Warung Mikro Menggunakan Metode Random Forest Dengan Teknik Sampling Kelas Imbalanced (Studi Kasus: Data Nasabah Pembiayaan Warung Mikro Bank Syariah Mandiri Kc Jambi),” World Dev., Vol. 1, No.

1, Pp. 1–15, 2018, [Online]. Available:

Http://Www.Fao.Org/3/I8739en/I8739en.Pdf%0ahttp://Dx.Doi.Org/10.1016/J.Adolescence.2017.01.003%0ahttp://Dx.Doi.Org/

10.1016/J.Childyouth.2011.10.007%0ahttps://Www.Tandfonline.Com/Doi/Full/10.1080/23288604.2016.1224023%0ahttp://Pjx .Sagepub.Com/Lookup/Doi/10

[16] V. W. Siburian And I. E. Mulyana, “Prediksi Harga Ponsel Menggunakan Metode Random Forest,” J. Komput. Terap., Vol. 7, No. 1, Pp. 24–32, 2021.

[17] E. Aprilia And A. Astried, “Klasifikasi Penjualan Sepeda Motor Honda Menggunakan Metode K-Nearest Neighbor,” 2019, [Online]. Available: Https://Repository.Unri.Ac.Id/Xmlui/Handle/123456789/9594

[18] Q. Iman And A. W. Wijayanto, “Klasifikasi Rumah Tangga Penerima Beras Miskin (Raskin)/Beras Sejahtera (Rastra) Di Provinsi Jawa Barat Tahun 2017 Dengan Metode Random Forest Dan Support Vector Machine,” J. Sist. Dan Teknol. Inf., Vol. 9, No. 2, P. 178, 2021, Doi: 10.26418/Justin.V9i2.44137.

[19] N. E. Nugroho, Yusuf Sulistyo, “Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest,” J. Tek. Elektro, Vol. 9, No. 1, Pp. 24–29, 2017.

[20] A. Ramadhan, B. Susetyo, And I. Indahwati, “Penerapan Metode Klasifikasi Random Forest Dalam Mengidentifikasi Faktor Penting Penilaian Mutu Pendidikan,” J. Pendidik. Dan Kebud., Vol. 4, No. 2, P. 169, 2019, Doi: 10.24832/Jpnk.V4i2.1327.

Referensi

Dokumen terkait

Dengan menggunakan metodelogi tiga algoritma klasifikasi yaitu Naive Bayes, K-Nearest Neighbour dan Random Forest dalam pengklasifikasian data untuk mengetahui

menyatakan bahwa Skripsi yang berjudul “IMPLEMENTASI ALGORITMA RANDOM FOREST CLASSIFIER DALAM MELAKUKAN KLASIFIKASI KELAYAKAN EDIBILITAS PADA JAMUR” ini adalah karya

Hasil dari pengujian algoritma ini adalah Random Forest yaitu algoritma untuk klasifikasi dalam jumlah besar serta waktu tidak akan mempengaruhi hasil dan Logistic Regression

Pada proses perancangan model algoritma Random Forest, model algoritma Random Forest yang dibangun dengan menggunakan ‘n’ pohon Decision Tree dengan mencari nilai

Sistem dibangun menggunakan algoritma find contour dan dilanjutkan proses klasifikasi menggunakan metode random forest dengan penambahan nilai untuk parameter

Menyatakan bahwa Skripsi yang berjudul “Implementasi Word Embedding untuk Klasifikasi Sentimen pada User Feedback Menggunakan Random Forest Classifier” ini adalah

Copyright © 2022 Dadang Sudrajat, Page 2227 Klasifikasi Mutu Pembelajaran Hybrid berdasarkan Algoritma C.45, Random Forest dan Naïve Bayes dengan Optimasi Bootsrap Areggating

Confusion Matrix Random Forest dengan AdaBoost Setelah dilakukkan pengujian dari algoritma Random Forest menggunakan teknik boosting kemudian hasil yang didapatkan untuk menentukan ke