404
IMPLEMENTASI KLASIFIKASI DECISION TREE MENGANALISA STATUS PENJUALAN BARANG MENGGUNAKAN C4.5
(Studi Kasus: Pt.Matahari Department Store Medan Mall)
Yusi Rosela
Program Studi Teknik Informatika STMIK Budi Darma, Medan, Indonesia Jl. Sisingamangaraja No. 338 Simpang Limun, Medan
ABSTRAK
Penumpukan data telah dialami oleh beberapa instansi termasuk PT. Matahari Departemen Store Medan Mall, setelah mengumpulkan data perusahaan selama bertahun-tahun. Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah survive. data yang berjumlah besar akan terus bertambah jumlahnya setiap saat.
Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul belum diterperinci secara optimal. Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan record”. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan pohon. Misalkan untuk menentukan survive tidaknya sebuah perusahaan, kriteria yang diperhatikan adalah Manajemen, pendapatan, Dan Sisa. Salah satu atribut merupakan atribut yang menyatakan data solusi per-item data yang disebut dengan target atribut. Atribut memiliki nilai-nilai yang dinamakan dengan instance.
Kata Kunci – Kalsifikasi Decision Tree, Penjualan, C.45
I. PENDAHULUAN
Teknologi komputasi dan media penyimpanan telah memungkinkan manusia untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan yang amat luas.
Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis, perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah menghasilkan media penyimpanan yang ekonomis bagi data berukuran besar, teknologi untuk membantu menganalisis, memahami,atau bahkan memvisualisasikan data belum banyak tersedia. Hal inilah yang melatar belakangi dikembangkannya konsep Data mining.
Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun- tahun oleh pembisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut.
Algoritma Decision Tree C4.5 merupakan pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri dari C4.5 yang dikenal sebagai J48.
Penumpukan data telah dialami oleh PT.
Matahari Departemen Store Medan Mall setelah mengumpulkan data perusahaan selama 2016 Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah survive tidaknya sebuah perusahaan, dan telah tersimpan sejak tanggal 01 januari sampai dengan 31 desember 2016 Data yang berjumlah besar akan terus bertambah jumlahnya setiap saat.
Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information”
karena data yang terkumpul belum diterperinci secara optimal.
Dengan demikian diharapkan dari permasalahan dalam menganalisa ststus penjualan dibutuhkan solusi yang dapat memberikan peningkatan penjualan yang berkelanjutan untuk mengklasifikasikan produk barang tersebut dengan suatu sistem analisa dengan algoritma C45.
Teknik klasifikasi ini dapat digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna, pengoprasian komputerisasi dengan menggunakan data mining sangat penting untuk mendapatkan informasi yang dibutuhkan untuk menghasilkan hasil yang sangat efisien dan optimal terutama dalam pengambilan keputusan mengenai survive tidaknya sebuah perusahaan dalam, pada Matahari Mall Plaza II. TEORITIS
A. Data Mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining
405 sendiri berarti usaha untuk mendapatkan sedikit
barang berharga dari sejumlah besar material dasar.
Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar. Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan [1].
B. Decision Tree
Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu (Ginar Santika Niwanputri, Penggunaaan Pohon Dalam Decision Tree Analysis Untuk Pengambilan Keputusan Investasi Dalam perencanaan bisnis, 2007, Vol: 2, Institut Teknologi Bandung). Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Decision Tree adalah node akar (root) yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya.
Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan diuji dengan cara mempelajari jalur dari node akar (root) sampai node akhir (daun) dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru tertentu.
C. Algoritma C4.5
Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.
Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut. Algoritma Decision Tree C4.5 merupakan
pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri dari C4.5 yang dikenal sebagai J48.
Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut:
1. Pilih atribut sebagai akar.
2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang.
Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang meiliki kelas yang sama.
III. ANALISA A. Analisa Masalah
Kebijakan atau keputusan selama ini yang dilakukan oleh PT. Matahari Departemen Store untuk menentukan penjualan barang adalah dengan cara mengumpulkan data dan beberapa atribut untuk menentukan penjualan barang , untuk mengatasi permasalahan dalam menentukan penjualan barang di PT. Matahari Departemen Store, diperlukan alat analisis bagi pihak PT. Matahari Departemen Store untuk menentukan penjualan barang. Analisa ini dapat dilakukan dengan memanfaatkan teori penalaran berbasis kasus, yaitu membandingkan penjualan barang dengan kasus-kasus yang perna terjadi setiap bulan sebelumnya. Alat analisis tersebut berupa aplikasi penunjang aplikasi penunjang keputusan berbasis komputer yang mengimplementasikan algoritma klasifikasi decision tree (data mining). Dengan ketersediaan data penjualan yang melimpah, data mining dapat menggali informasi yang terkubur dari kumpulan data penjualan tersebut. Aplikasi ini dapat digunakan untuk menentukan penjualan barang berdasarkan data yang telah terkumpul sebelumnya.
Berdasarkan data penjualan barang di PT.Matahari Departemen Store medan mall jumlah penjualan terdiri dari 15 Brand wold ladies, Data yang akan digunakan dalam bentuk pohon keputusan untuk menganalisa penjualan barang di PT. Matahari Departemen Store. Data penjualan tersebut selanjutnya akan dilakukan pra proses untuk menghasilkan data khusus yang siap untuk dibentuk menjadi sebuah pohon
Tabel 1. Keterangan Status Penjualan 01 Januari Sampai Dengan 31 Desember 2016
N O
NAMA BARAN G
Harga Rata-Rata / PCS
Jumlah Penjuala n
Total Penju alan
SI S A
1 Luire 250.000 464
116.0 00.00 0
80 0
2 Jane
Lorisa 500.000 422
211.0 00.00 0
89 0
3
caroline
kosasih 460.000 409 188.140.
000
90 6
406
N O
NAMA BARAN G
Harga Rata-Rata / PCS
Jumlah Penjuala n
Total Penju alan
SI S A
4 Sahara 300.000 416
124.8 00.00 0
89 0
5 Novo 350.000 371
129.8 50.00 0
98 7
6 Edition 480.000 410
196.8 00.00 0
87 6
7 Chanira 400.000 428
171.2 00.00 0
77 7
8 Lebel 9 200.000 414
82.80 0.000
89 0
9 Prucia 250.000 524
131.0 00.00 0
90 8 1
0 ELC 200.000 486
97.20 0.000
89 0 1
1 Mint 250.000 460
115.0 00.00 0
67 8 1
2 Triset 500.000 504
252.0 00.00 0
85 6 1
3 Dual 460.000 449
206.5 40.00 0
10 00
1
4 Fame 300.000 474
142.2 00.00 0
78 9
1
5 Gella 350.000 390
136.5 00.00 0
89 0
Merupakan hal yang penting dalam proses data mining, hal yang termasuk proses data mining antara lain:
1. Data Selection
Data penjualan tersebut nantinya akan menjadi kasus dalam proses operasional data mining. Dari data yang ada, kolom yang diambil sebagai atribut/variable keputusan adalah barang, Sedangkan kolom yang diambil variabel penentu dalam pembentukan pohon keputusan adalah:
1) Nama Barang 2) Manajemen
Ditentukan dari barang komulatif penjualan dalam periode 2016, yaitu dengan definisi:
a. Manajemen baik jika jumlah penjualan komulatifnya 6 s/d 10bulan
b. Manajemen sedang jika jumlah penjualan komulatifnya 5 s/d 8 bulan
c. Manajemen buruk juka jumlah penjualan komulatifnya 0 s/d 10 bulan
3) Income (pendapatan)
Ditentukan dari jumlah pinjaman, karna melalui jumlah pinjaman dapat diketahui besar
kecilnya income (pendapatan) suatu penjualan yaitu dengan definisi:
a. Income rendah jika jumlah penjualan mulai 1 juta s/d 92 juta rupiah
b. Income sedang jika jumlah penjualan mulai 93 juta s/d 100 juta rupiah
c. Income tinggi jika jumlah penjualan mulai 99 juta s/d 150 juta
2. Data Cleaning
Data cleaning diterapkan untuk menambah isi atribut yang hilang atau kosong, dan merubah data yang tidak konsisten.
3. Data Transformasi
Dalam proses ini, data ditranspormasikan ke dalam bentuk yang sesuai untuk proses data mining
4. Data Reduction
Reduksi data dilakukan dengan menghilangkan atribut yang tidak diperlukan sehingga ukuran dari database menjadi kecil dan hanya menyertakan atribut yang diperlukan dalam proses data mining, karena akan lebih efisien terhadap data yang lebih kecil. Berikut ini data penjualan tahun 2016, data ini dipergunakan untuk menentukan barang tidaknya suatu penjualan, data selengkapnya tampak pada tabel berikut ini:
Tabel 2. Penjualan Barang
N O
NAMA BARANG
MANAJEM EN
INCO ME
BARAN G
1 Triset BAIK TINGGI YA
2 Dual BAIK TINGGI YA
3 Jane Lorisa BAIK TINGGI YA
4 Edition BAIK TINGGI YA
5
caroline
kosasih BAIK TINGGI YA
6 Chanira BAIK TINGGI YA
7 Fame BURUK
RENDA
H TIDAK
8 Prucia SEDANG
RENDA
H YA
9 Gella SEDANG
RENDA
H YA
10 Novo SEDANG
RENDA
H YA
11 Sahara SEDANG
RENDA
H YA
12 Luire SEDANG
RENDA
H YA
13 Mint BURUK
RENDA
H TIDAK
14 ELC BURUK
RENDA
H TIDAK
15 Lebel 9 BURUK
RENDA
H TIDAK
Dalam data sampel tentukan dulu node terpilih, yaitu dengan menghitung nilai infprmasi gain masing-masing aribut untuk menentukan node terpilih, gunakan nilai informasi gain yang paling besar. dengan menggunakan persamaan -
407 P(+)log2P(+)-P(-)log2P(-) Dapat dihitung nilai (i) dari
seluruh data training:
I=-(11/100)*LOG((11/100),2) -
(89/100)*LOG((89/100),2) = 0,500 Tabel 3. Solusi Dari Node Terpilih
Solusi J.(+) JR J.(-)
YA -11 100 -0.11
11 100 0.11
TIDAK -89 100 -0.89
89 100 0.89
Setelah didapatkan jumlah dari node terpilih untuk masing-masing solusi kemudian dilakukan perhitungan kembali untk mendapatkan nilai informasi dari tabel solusi
-0.11x(-3.184) = 0.350 -0.89x(-0.168) = 0.150 I = 0.500
Adapun nilai -3.184 didapatkan dari perhitungan =log((-11/100),2) dan juga nilai dari - 0.168 didapat dari hasil peritungan =log ((- 89/100),2). Setelah didapat jumlah informasi dari total solusi dilanjutkan dengan menghitung nilai informasi dari tiap atribut
1. Menghitung Nilai Atribut Manajemen
Adapun untuk menghitung nilai informasi dari atribut manajemen adalah sebagai berikut:
Tabel 4. Nilai Informasi Atribut Manajemen
MANAJEMEN BARANG Jumlah
BAIK Ya 11 BAIK Tidak 12
SEDANG Ya 0
SEDANG Tidak 6
BURUK Ya 4 BURUK Tidak 67
Tabel 5. Parameter Dari Atribut Manajemen
MANAJEMEN Paramter
BAIK q1
SEDANG q2
BURUK q3
q 1
=-(11/23)*LOG((11/23),2)- (12/23)*LOG((12/23),2)
0.998 636
q 2
=-(0/6)*LOG((0/6),2)-
(6/6)*LOG((6/6),2) 0
q 3
=-(4/71)*LOG((4/71),2)- (67/71)*LOG((67/71),2)
0.312 733
2. Menghitung Nilai Informasi Atribut Income (Pendapatan)
Adapun untuk menghitung nilai informasi income (pendapadalah sebagai berikut:
Tabel 6. Nilai Informasi Atribut Income (Pendapatan)
INCOME BARANG Jumlah
Rendah Ya 0
Rendah Tidak 58
Sedang Ya 4 Sedang Tidak 17 Tinggi Ya 11 Tinggi Tidak 10
Tabel 7. Parameter Dari Atribut Income (Pendapatan)
INCOME Paramtr
Rendah q1
Sedang q2 Besar q3
q 1
=-(0/58)*LOG((0/58),2)-
(58/58)*LOG((58/58),2) 0 q
2
=-(4/21)*LOG((4/21),2)- (17/21)*LOG((17/21),2)
0.702 467
q 3
=-(11/21)*LOG((11/21),2)- (10/21)*LOG((10/21),2)
0.998 364
q 1
= -(0/40)*LOG((0/40),2) - (40/40)*LOG((40/40),2) 0 q
2
= -(15/60)*LOG((15/60),2) - (45/60)*LOG((45/60),2)
0.811 28
1. Menghitung Entropy Atribut Manajemen adapun untuk menghitung nilai informasi dari atribut manajemen adalah sebagai berikut:
E = (23/100)*q1+(6/100)*q2+(71/100)*q3 = 0.452
2. Menghitung Entropy Atribut Income (Pendapatan) adapun untuk menghitung nilai informasi dari atribut income (pendapatan) adalah sebagai berikut:
E = (58/100)*q1+(21/100)*q2+(21/100)*q3 = 0.357
3. Menghitung Entropy Atribut Sisa adapun untuk menghitung nilai informasi dari atribut sisa adalah sebagai baerikut:
E = (40/100)*q1+(60/100)*q2= 0.487
1. Menghitung Nilai Informasi Gain Atribut Manajemen Adapun menghitung nilai informasi gain dari atribut manajemen adalah sebagai berikut:
Gain(Manajemen) = Nilai Informasi Seluruh Data Training - Entropy Atribut Manajemen
= 0.500 - 0.452 = 0.05
408 2. Menghitung nilai informasi gain atribut
income (pendapatan)
Adapun menghitung nilai informasi gain dari atribut income (pendapatan) adalah sebagai berikut:
Gain(Income) = Nilai Informasi Seluruh Data Training - Entropy Atribut Income = 0.500 – 0.357 = 0.14
3. Menghitung nilai informasi gain atribut sisa Adapun menghitung nilai informasi gain dari atribut sisa adalah sebagai berikut:
Gain(Sisa) = Nilai Informasi Seluruh Data Training - Entropy Atribut Sisa = 0.500 – 0.487 = 0.01
Node berikutnya dapat dipilih pada bagian yang mempunyai nilai + dan -, pada kasus diatas hanya income = sedang dan tinggi yang memiliki nilai + dan nilai -, Maka semua pasti mempunyai internal node. Untuk menyusun internal node,ini dilakukan satu persatu.
Tabel 8. Penentuan Internal Node
N O
NAMA BARANG
MANAJEM EN
UTAN G
BARAN G
1 Triset BAIK TINGGI YA
2 Dual BAIK TINGGI YA
3 Jane Lorisa BAIK TINGGI YA
4 Edition BAIK TINGGI YA
5
caroline
kosasih BAIK TINGGI YA
6 Chanira BAIK TINGGI YA
7 Fame SEDANG
RENDA
H YA
8 Prucia SEDANG
RENDA
H YA
9 Gella SEDANG
RENDA
H YA
10 Novo SEDANG
RENDA
H YA
11 Sahara SEDANG
RENDA
H YA
12 Luire SEDANG
RENDA
H YA
13 Mint BURUK
RENDA
H TIDAK
14 ELC BURUK
RENDA
H TIDAK
15 Lebel 9 BURUK
RENDA
H TIDAK
Untuk menentukan node untuk income sedang dan tinggi dapat digunakan persamaan: - P(+)log2P(+)-P(-)log2P(-) dapat dihitung nilai informasi (i) dari seluruh data training :
I = -(14/42)*LOG((14/42),2) -
(28/42)*LOG((28/42),2) I = 0.96
Kemudian setelah mendapat hasil nilai informasi (i) untuk income, selanjutnya diperlukan
perhitungan untuk atribut yang tersisa yaitu atribut manajemen dan atribut sisa
1. Menghitung Nilai Informasi Atribut Manajemen Dan Entropy Adapun untuk menghitung ilai informasi dari atribut manajemen adalah sebagai berikut:
Tabel 0 Nilai Informasi Atribut Manajemen
MANAJEMEN BARANG Jumlah
BAIK Ya 9 BAIK Tidak 0
BURUK Ya 6
BURUK Tidak 25
Tabel 10. Parameter Dari Atribut Manajemen
Q1= -(9/9)*LOG((9/9),2)-(0/9)*LOG((0/9),2) = 0
Q2= -(6/31)*LOG((6/31),2)-(25/31)*LOG((1/31),2) = 4.45
Entrophy atribut manajemen adalah sebagai berikut E = (9/40)*q1+(31/40)*q2 = 3,5 2. Menghitung nilai informasi atribut sisa Adapun
untuk menghitung nilai informasi dari atribut sisa adalah sebagai berikut:
Tabel 11. Nilai Informasi Atribut Sisa
Sisa BARANG Jumlah Tinggi Ya 0 Tinggi Tidak 20
Rendah Ya 16
Rendah Tidak 4
Tabel 12. Parameter Dari Atribut Sisa
INCOME Paramtr
Rendah q1 Besar q2
Q1 = -(0/20)*LOG((0/20),2)-
(20/20)*LOG((20/20),2) = 0
Q2 = -(16/20)*LOG((16/20),2)-
(4/20)*LOG((4/20),2) = 0.7
Entropy atribut sisa adalah sebagai berikut
E = (20/40)*q1+(20/40)*q2 = 0,4 Nilai informasi gain atribut manajemen sebagai berikut:
Gain(Manajemen) = Nilai Informasi Seluruh Data
Training - Entropy Atribut
Manajemen = -2.49
Nilai informasi gain atribut sisa adalah sebagai berikut:
Manajemen Paramtr
Baik q1 Buruk q2
409 Gain(Sisa) = Nilai Informasi Seluruh Data
Training - Entropy Atribut
Sisa = 0.60
Diketahui bahwa atribut dan entropy rata-rata terkecil adalah atribut manajemen dengan nilai gain -2.49, sehingga atribut barang diplih sebagai node selanjutnya atau node kedua. Dengan demikian nilai dapat menjadi node cabang dari nilai atribut sisa
=<=0.60.
Gambar 1.
Pohon Keputusan Hasil Perhitungan Node Lanjutan
Gambar 2. Pohon Keputusan Hasil Tree Terakhir Dengan memperhatikan pohon keputusan pada gambar 4.5, diketahui bahwa semua kasus sudah masuk dalam kelas. Dengan demikian, pohon keputusan pada gambar 4.5 merupakan pohon keputusan terakhir yang terbentuk.
Dengan memperhatikan pohon keputusan pada gambar 4.5 diketahui bahwa pohon keputusan telah terbentuk. Dan setelah didapatkan tree akhirnya kemudian diubah menjadi rule. Berikut ini adalah bentuk tree yang diubah menjadi rule:
R1 : if income = rendah THEN Barang = tidak R2 : if income = Sedang ^ manajemen =buruk
^THEN Barang = Tidak
R3 : if income= sedang ^ manajemen = sedang^THEN Barang = tidak
R4 : if income = sedang ^ manajemen = baik^THEN Barang = ya
R5 : if income = tinggi ^ sisa = tinggi^THEN Barang
= tidak
R6 : if income = tinggi ^ sisa = rendah^THEN Barang = ya
Berikut ini adalah bentuk keterangan umumnya dari rule yang sudah disederhanakan adalah sebagai berikut:
R1= Jika income = sedang dan manajemen = buruk maka barang tidak
R2 =Jika income = sedang dan manajemen = sedang maka barang tidak
R3 = jika income = sedang dan manajemen = baik maka barang ya
R4 = jika income rendah maka barang tidak R5 = jika income = tinggi dan sisa = tinggi maka barang tidak
R6 = jika income = tinggi dan sisa = rendah maka barang ya
IV. IMPLEMENTASI A. Implementasi Sistem In
co
Seda ng
Ting gi Rend
ah
Tida k
Sis a
Ren dah Ting
gi
Triset, Dual jane lorisa Edition, C.Kosa sih Chanira
Fame,pr ucia,Gel laNovo Sahara Luire
410 Implementasi merupakan langkah yang
digunakan untuk mengoperasikan sistem yang dibangun. Dalam bab ini dijelaskan bagaimana system dioperasikan atau di jalankan. Komputer sebagai sarana pengolahan program harus memiliki fasilitas-fasilitas pendukung dalam pengolahan program, fasilitas pendukung tersebut terbagi atas perangkat keras (hardware) dan perangkat lunak (software).
Dalam implementasi dari program pengujian ini membutuhkan perangkat keras (hardware) dan perangkat lunak (software) yang sesuai agar program dapat dioperasikan atau dijalankan dengan baik.
Adapun spesifikasi perangkat keras (hardware) dan perangkat lunak (software) yang dibutuhkan adalah sebagai berikut:
a. Perangkat keras (hardware) 1. Prosesor Intel Core i3-370M.
2. Memory 2 GB DDR3.
3. Harddisk 320 GB.
4. Intel HD Graphics.
5. Monitor dengan resolusi 14.0” Hd LED LCD.
6. Keyboard dan Mouse.
b. Perangkat lunak (software) 1. Sistem operasi : Windows
2. Aplikasi : Microsoft visual studio 2008
Database : MySQL
Pada tampilan menu utama terdiri dari beberapa menu diantaranya adalah.
Explorer, Experimenter, Knowledge Flow.Gambar menu utama dapat dilihat pada Gambar berikut ini:
Gambar 3. From Menu Utama
Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi :
1. Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA
2. Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar
3. Knowledge Flow digunakan untuk pengetahuan pendukung
Form input data merupakan form untuk memasukan data-data penjualan barang ke dalam data base.
Gambar 4. Form Input Data Barang Buka file yang akan dieksekusi oleh weka, pergunakan extensi file .csv (command separated values). Perlu diingat bahwa sebelumnya kita sudah harus menyediakan data-data pada file tersebut.
Gambar 5. Form Classifier Output
Hasil klasifikasi decision tree terdiri dari nama barang dan hasil penjualan barang. Gambar dapat dilihat di Gambar Berikut ini:
411 Gambar 6. Form Hasil
V. KESIMPULAN
Dari pembahasan pada bab-bab sebelumnya, maka penulis mengambil kesimpulan sebagai berikut:
1. menganalisa penjualan barang di PT. Matahari Departemen Store. Data penjualan tersebut selanjutnya akan dilakukan pra proses untuk menghasilkan data khusus yang siap untuk dibentuk menjadi sebuah pohon
2. C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.
3. Weka aplikasi data mining open source berbasis java. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi/formulasi dari sekumpulan data sample.
REFERENCES
[1] Kusrini , Emha Taufiq Luthfi, Algoritma Data Mining, Yogyakarta: CV Andi Offset, 2007
[2] Sani Susanto, Ph.D., Dedy Suryadi, S.T., M.S Pengantar Data Mining Menggali Pengetahuan Dari Bongkahan Data, Yogyakarta: CV Andi Offset, 2010
[3] Prabowo pudjowidodo rahmadya triashandayanto, herlawati, penerapan data mining dengan matlab, Yogyakarta: CV Rekayasa sains Offset, 2010
[4] Fajar astuti hermawati, Data mining Yogyakarta: CV Andi Offset, 2013
[5] S Pujiono, A Armadyah, and M Suyanto, "Analisa Keputusan Publik Menggunakan Weka Mewujutkan Good Governance Yogyakarta: Jurnal L Dasi, vol. 14, no. 2, pp. 45- 55, 2013.
[6] Deshmukh J.J And Tared R.R, "Weka - Open Source Tecnology, ITS Implementation And Benifits," World Research Journal of Computer Architecture, vol. 1, no. 1, pp.
01-05, 2012.
[7] M. L Agung, Microsoft Excel 2013. Yogyakarta: ANDI, 2013