• Tidak ada hasil yang ditemukan

6. Squence Analysis

2.9.6 Metode Algoritma C4.5

Algoritma C4.5 adalah algoritma yang sudah banyak dikenal dan digunakan untuk klasifikasi data yang memiliki atribut-atribut numeric dan

kategorial. Hasil dari proses klasifikasi yang berupa aturan-aturan dapat digunakan untuk memprediksi nilai atribut bertipe diskret dari record yang baru (Elisa, 2017).

Algoritma data mining C4.5 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan yangb bersifat prediktif. Klasifikasi merupakan suatu proses data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif besar hingga sangat besar. Algoritma C4.5 sendiri meruapakan pengembangan dari algoritma ID3 (Retno, 2017)

Secara umum algorima C4.5 untuk membangun pohon keputusan adalah sebagai berikut :

1. Pilih atribut sebagai node akar. 2. Buat cabang untuk tiap-tiap nilai. 3. Bagi kasus dalam cabang.

4. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama (Kusrini & Luthfi, 2011)

Untuk memilih atribut sebagai node akar, didasarkan pada nilai Gain tertinggi dari atribut-atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera dalam persamaan berikut :

18

Setelah mendapatkan nilai Gain, ada satu hal lagi yang perlu kita lakukan perhitungan, yaitu mencari nilai Entropy. Entropy digunakan untuk menentukan seberapa informatif sebuah masukan atribut untuk menghasilkan keluaran atribut. Rumus dasar dari Entropy tersebut adalah sebagai berikut :

Untuk memudahkan penjelasan mengenai algoritma C4.5, berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 2.1.

Tabel 2.1 Keputusan Bermain Tenis (Kusrini & Luthfi, 2011)

NO OUTLOOK TEMPERATUR HUMIDITY WINDY PLAY

1. Sunny Hot High False No

2. Sunny Hot High True No

3. Cloudy Hot High False Yes

4. Rainy Mid High False Yes

5. Rainy Cool Normal False Yes

6. Rainy Cool Normal True Yes

7. Cloudy Cool Normal True Yes

8. Sunny Mild High False Yes

10. Rainy Mild Normal False Yes

11. Sunny Mild Normal True No

12. Cloudy Mild High True Yes

13. Cloudy Hot Normal False Yes

14. Rainy Mild High True No

Dalam kasus yang tertera pada Tabel 2.1 akan dibuat pohon keputusan untuk menentukan main tenis atau tidak dengan melihat keadaan cuaca, temparatur, kelembaban dan keadaan angin. Selanjutnya data tersebut akan diproses sesuai langkah-langkah membentuk pohon keputusan. Berikut ini adalah penjelasan lebih terperinci: Hitung jumlah kasus, yakni jumlah kasus untuk keputusan Yes dan jumlah keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut-atribut yang digunakan. Setelah itu lakukan perhitungan Gain untuk setiap atribut.

Tabel 2.2 Perhitungan Node 1 (Kusrini & Luthfi, 2011)

Node Jumlah Kasus No Yes Entropy Gain

1 Total 14 4 10 0.863 Outlook 0.258 Cloudy 4 0 4 0 Rainy 5 1 4 0.721 Sunny 5 3 2 0.97 Temperature 0.183 Cool 4 0 4 0 Hot 4 2 2 1

20 Mild 6 2 4 0.918 0.370 Humidity High 7 4 3 0.985 Normal 7 0 7 0 Windy 0.005 False 8 2 6 0.811 True 6 4 2 0.918

Dari hasil pada Tabel 2.2 dapat diketahui bahwa atribut dengan Gain tertinggi adalah Humidity yaitu sebesar 0.37. Dengan demikian Humidity dapat menjadi node akar. Ada dua nilai atribut dari Huminity yaitu High dan Normal. Dari kedua nilai atribut tersebut, nilai atribut Normal sudah mengklasifikasikan kasus menjadi satu keputusan Yes, sehingga tidak perlu dilakukan perhitungan lenih lanjut, tetapi untuk nilai atribut High masih perlu dilakukan perhitungan lagi. Setelah dilakukan perhitungan , maka terbentuklah pohon keputusan sementara seperti pada Gambar 2.3.

Gambar 2.3 Pohon Keputusan Hasil Perhitungan Node 1(Kusrini & Luthfi, 2011)

Hitung kembali jumlah kasus, Entropy dari semua kasus yang dibagi berdasarkan atribut yang dapat menjadi node akar dari nilai atribut Humidity-High. Setelah itu lakukan perhitungan Gain untuk masing-masing atribut. Hasil perhitungan ditunjukkan pada Tabel 2.3.

Tabel 2.3 Perhitungan Node 1.1 (Kusrini & Luthfi, 2011)

Node Jumlah Kasus No Yes Entropy Gain

1.1 Humidity-Gain 7 4 3 0.965 Outlook 0.699 Cloudy 2 0 2 0 Rainy 2 2 1 1 Sunny 3 3 0 0 Temperature 0.02 Cool 0 0 0 0 Hot 3 2 1 0.918

22

Mild 4 2 2 1

Windy 0.02

False 4 2 2 1

True 3 2 1 0.918

Dari Tabel 2.3 dapat diketahui bahwa atribut dengan Gain tertinggi adalah Outlook yaitu sebesar 0,67. Dengan demikian Outlook dapat menjadi node cabang dari nilai atribut Humidiy – High . Dari ketiga nilai atribut Outlook, nilai atribut Cloudy sudah mengklasifikasi kasus 1 yaitu keputusan Yes dan nilai atribut Sunny sudah mengklasifikasi kasus 1 yaitu keputusan No. Pohon keputusan yang dihasilkan sampai tahap ini ditunjukkan pada Gambar 2.4.

Gambar 2.4 Pohon Keputusan Hasil Perhitugan Node 1.1.2 (Kusrini & Luthfi, 2011)

Dengan memperhatikan pohon keputusan pada Gambar 2.4, diketahui bahwa semua kasus sudah masuk dalam kelas. Dengan demikian, pohon keputusan pada Gambar 2.3 merupakan pohon keputusan terakhir yang terbentuk.

2.10 Aplikasi RapidMiner

RapidMiner adalah sebuah perangkat lunak ilmu data platform yang

dikembangkan oleh perusahaan dari nama yang sama yang menyediakan saran untuk mempelajari mesin dalam belajar, penambangan data, dan presdiksi analisa. Biasanya aplikasi ini digunakan untuk suatu bisnis komersial maupun untuk penelitian, pendidikan, dan pengembangan aplikasi yang mendukung semua langkah masin proses belajar termasuk persiapan data, hasil dan visualisasi, validasi dan optimasi. (Abhis hek, 2017)

Menurut Dennis (2017), “Perangkat lunak yang bersifat terbuka (open source). Rapidminer adalah sebuah solusi untuk melakukan analisis terhadap data mining, text mining dan analisis prediksi Rapidminer menggunakan berbagai teknik deskriptif dan prediksi dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang paling baik”.

Rapidminer menyediakan GUI (Graphic User Interface) untuk merancang

sebuah pipeline analitis. GUI ini akan menghasilkan file XML (Extensible

Markup Language) yang mendefenisikan proses analitis keingginan pengguna

untuk diterpkan ke data. File ini kemudian dibaca oleh Rapidminer untuk menjalankan analis secara otomatis.

24

1. Ditulis dengan bahasa pemrograman java sehingga dapat dijalankan diberbagai sistem operasi

2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.

3. Representasi XML internal untuk memastikan format standar pertukaran data.

4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan otomatisasi eksperimen.

5. Konsep multi-layer untuk menjamin tampilan data yang efesien dan menjamin penanganan data.

6. Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari program lain.

2.11 PPIC

Divisi Production Planning and Inventory Control yang selanjutnya disingkat menjadi PPIC merupakan salah satu divisi yang ada di PT. Showa Indonesia Manufacturing. Divisi ini dibagi lagi menjadi dua departemen, yaitu departemen planning dan departemen warehouse. Departemen planning merupakan departemen yang menjembatani antara marketing dengan departemen lain, seperti produksi dan purchasing. Bagi marketing, planner harus menyediakan kebutuhan customer dengan tepat waktu, tepat barang, dan tepat jumlah. Sedangkan bagi produksi, planner harus memastikan produksi berjalan sesuai jadwal, seperti kapan produksi selesai dan kapan produk dapat release. Dan bagi purchasing, planner harus menyiapkan daftar kebutuhan material dengan tepat barang dan tepat jumlah.

Hubungan antara departemen planning dengan departemen-departemen lain dapat dijelaskan sebagai berikut. Tim marketing akan menyerahkan Purchase Order/forecasting kepada departemen planning. Planner kemudian menginput PO/forecasting tersebut kedalam master delivery schedule atau disingkat menjadi MDS. Selanjutnya planner akan membuat Master Production Planning atau disingkat menjadi MPP. MPP adalah penjadwalan produksi harian. MPP ini harus dicocokkan dengan MDS nya agar tidak terjadi perbedaan kalkulasi. MPP ini kemudian akan didistribusikan untuk dibuatkan Material Requirement Planning atau disingkat menjadi MRP. Planner dibantu dengan software IFS yang secara otomatis akan menghitung lead time material, pola delivery, struktur produk, level stock, dan parameterparameter lain dalam menyusun MRP. Daftar belanja ini kemudian akan diserahkan kepada tim purchasing untuk dibeli.

PO customer yang sering tidak sesuai dengan hasil forecasting PT Showa Indonesia Manufacturing ini mengindikasikan bahwa demand yang diajukan oleh customer sering mengalami fluktuasi. Hal ini dapat terjadi karena tingkat demand customer dipengaruhi oleh tingkat permintaan pasar yang juga fluktuatif seiring dengan perubahan tren mobil dan motor yang terjadi di masyarakat. Oleh karena itu, secara tidak langsung aktivitas produksi PT Showa Indonesia Manufacturing juga sangat dipengaruhi oleh trend mobil dan motor yang terjadi di masyarakat.

Sedangkan untuk kasus overstock, PT Showa Indonesia Manufacturing tentunya harus menyediakan inventory untuk menyimpan stok-stok tersebut. Dalam konsep just in time, inventory merupakan pemborosan karena artinya perusahaan harus mengeluarkan biaya lebih tinggi untuk perawatan persediaan tersebut. Overstock juga dapat berpotensi menjadi deadstock apabila tidak

26

terdapat permintaan dari customer untuk stok tersebut. Dikarenakan permintaan yang berfluktuatif, bisa saja customer tidak memesan varian shock breaker tertentu untuk waktu yang cukup lama walaupun kebutuhan komponen untuk shock breaker tersebut sudah dipesan sebelumnya. Akibatnya komponen tersebut tidak lagi dapat digunakan dan akhirnya menjadi deadstock.

Terdapat upaya yang dapat dilakukan untuk mengatasi masalah deadstock ini. Sebelumnya perusahaan akan menghitung umur barang tersebut, yaitu sampai kapan komponen ini dapat disimpan di inventory. Selama proses penyimpanan tersebut, perusahaan akan berusaha untuk menjual komponen tersebut ke cabang perusahaan Showa di negara lain. Namun, sayangnya tidak semua spesifikasi komponen yang diproduksi di PT. Showa Indonesia Manufacturing sama dengan spesifikasi yang dibutuhkan oleh perusahaan Showa di negara lain. Apabila upaya tersebut tidak berhasil, maka stok ini akan benar-benar menjadi deadstock yang artinya perusahaan akan mengalami kerugian sangat besar akibat biaya proses produksi dan biaya simpan yang telah dikeluarkan. (Arina, 2018).

2.12 Pemasaran

Inti dari pemasaran adalah mengidentifikasikan dan memenuhi kebutuhan dan keinginan konsumen. Definisi yang baik dan singkat dari pemasaran yang menurut (Kotler & Keller, 2016) adalah marketing is meeting needs profitability, maksud ungkapan tersebut adalah pemasaran merupakan hal yang dilakukan untuk memenuhi setiap kebutuhan (kebutuhan konsumen) dengan cara-cara yang menguntungkan semua pihak. Definisi formal yang ditawarkan America Marketing Association (AMA) yang dikutip oleh (Kotler & Keller, 2016) sebagai

berikut : Marketing is the activity, set of institutions, and processes for creating,

communicating, delivering, and exchanging offerings that have value for customers, clients, partners, and society at large. Arti dari definisi tersebut,

pemasaran adalah suatu fungsi organisasi dan serangkaian proses untuk menciptakan, mengkomunikasikan, menghantarkan dan memberikan nilai pelanggan yang unggul.

Menurut (Tjiptono, 2015), pemasaran adalah penentuan apa yang akan dijual kepada konsumen berupa produk atau jasa dengan mendapatkan laba, melalui cara-cara, kondisi dan sluran sidtribusi tertentu, serta penciptaan dan pengolahan program untuk menghasilkan, melayani dan memperluas penjualan.

2.13 Penelitian Sebelumnya

Beberapa penelitian mengenai prediksi pemasaran dan penjualan produk yang mendekati penelitian ini dapat digambarkan pada tabel berikut:

28

Tabel 2.4 Penelitian Sebelumnya

2.14 Kerangka Berfikir

Dalam penelitina ini membuat sebuah kerangka pemikiran yang berguna sebagai pedoman penelitian sehingga dapat dilakukan secara konsisten. Untuk itu metode yang digunakan yaitu Algoritma C4.5 untuk memecahkan masalah dilakukan pengujian terhadap kinerja metode tersebut. Untuk pengembangan dan pengujian motede yang dipakai dangan menggunakan aplikasi RapidMiner. Gambar berikut ini merupakan kerangka pemikiran yang dilakukan.

No Penulis Judul Metode Penelitian Analisis 1 Asri Khoirunnisa, dkk. 2016. Analisa dan Implementasi

Perbandingan Algoritma C.45 dengan Naïve Bayes Untuk Prediksi Penawaran Produk

Algoritma C.45 dan Naïve Bayes

Implementasi kedua algoritma klasifikasi berhasil dilakukan, dimana kedua algoritma memberikan performa yang cukup dilihat dari akurasi 60% untuk algoritma Naïve Bayes, dan 48% untuk algoritma C4.5, pada kasus uji I dengan data uji terendah, yaitu 50 data. Pada kasus uji II dengan data uji sebanyak 120 data, performa algoritma Naïve Bayes mengalami peningktan menjadi 62%, sedangkan algoritma C4.5 menunjukan performa yang sema dengan sebelumnya yaitu 48%. Pada kasus uji III dengan data uji sebanyak 227 data, performa algoritm Naïve Bayes mengalami penurunan menjadi 49%, beigut juga dengan algoritma C4.5 menajdi 47%.

2 Fitriana Harahap, 2015. Penerapan Data Mining Dalam Memprediksi Pembelian Cat

Algoritma C.45 Berdasarkan hasil penelitian yang penulis lakukan pada Home Smart Medan, maka penulis dapat menarik kesimpulan bahwa pembelian cat dengan menggunakan metode Data Mining khususnya Algoritma C4.5 akan bermanfaat sekali dalam proses pengambilan keputusan dalam pembelian cat pada Home Smart Medan.

3 Nurul Azwanti, 2018 Analisa Algoritma C.45 Untuk Memprediksi Penjualan Motor Pada PT. Capella Dinamik Nusantara Cabang Muka Kuning

Algoritma C.45 Algoritma C4.5 dianggap sebagai algoritma yang sangat membantu dalam melakukan klasifikasi data karena karakteristik data yang diklasifikasi dapat diperoleh dengan jelas, baik dalam bentuk struktur pohon keputusan maupun aturan if-then, sehingga memudahkan pengguna dalam melakukan penggalian informasi terhadap data yang bersangkutan. Pada pemilihan atribut juga sangat mempengaruhi dalam pengolahan Algoritma C4.5 karena keputusan sangat bergantung pada atribut yang dipilih.

Gambar 2.5 Kerangka Pemikiran

Masalah

Metode

Pengembangan

Implementasi

Hasil

Forecast yang diterbitkan oleh Marketing kepada PPIC kurang tepat sasaran terhadap produk yang lebih laku terjual.

Metode Algoritma C4.5

Aplikasi RapidMiner

Memprediksi produk yang paling laku terjual

30

BAB III

Dokumen terkait