IMPLEMENTASI KLASIFIKASI DECISION TREE MENGANALISA STATUS PENJUALAN BARANG MENGGUNAKAN C4.5 (Studi Kasus: Pt.Matahari Department Store Medan Mall)

(1)

404

IMPLEMENTASI KLASIFIKASI DECISION TREE MENGANALISA STATUS PENJUALAN BARANG MENGGUNAKAN C4.5

(Studi Kasus: Pt.Matahari Department Store Medan Mall)

Yusi Rosela

Program Studi Teknik Informatika STMIK Budi Darma, Medan, Indonesia Jl. Sisingamangaraja No. 338 Simpang Limun, Medan

ABSTRAK

Penumpukan data telah dialami oleh beberapa instansi termasuk PT. Matahari Departemen Store Medan Mall, setelah mengumpulkan data perusahaan selama bertahun-tahun. Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah survive. data yang berjumlah besar akan terus bertambah jumlahnya setiap saat.

Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information” karena data yang terkumpul belum diterperinci secara optimal. Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan record”. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan pohon. Misalkan untuk menentukan survive tidaknya sebuah perusahaan, kriteria yang diperhatikan adalah Manajemen, pendapatan, Dan Sisa. Salah satu atribut merupakan atribut yang menyatakan data solusi per-item data yang disebut dengan target atribut. Atribut memiliki nilai-nilai yang dinamakan dengan instance.

Kata Kunci – Kalsifikasi Decision Tree, Penjualan, C.45

I. PENDAHULUAN

Teknologi komputasi dan media penyimpanan telah memungkinkan manusia untuk mengumpulkan dan menyimpan data dari berbagai sumber dengan jangkauan yang amat luas.

Fenomena ini terjadi dalam banyak bidang kehidupan, seperti bisnis, perbankan, pemasaran, produksi dan sains Meskipun teknologi basis data modern telah menghasilkan media penyimpanan yang ekonomis bagi data berukuran besar, teknologi untuk membantu menganalisis, memahami,atau bahkan memvisualisasikan data belum banyak tersedia. Hal inilah yang melatar belakangi dikembangkannya konsep Data mining.

Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun- tahun oleh pembisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut.

Algoritma Decision Tree C4.5 merupakan pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri dari C4.5 yang dikenal sebagai J48.

Penumpukan data telah dialami oleh PT.

Matahari Departemen Store Medan Mall setelah mengumpulkan data perusahaan selama 2016 Data tersebut terdiri dari berbagai subsektor, yang salah satunya adalah survive tidaknya sebuah perusahaan, dan telah tersimpan sejak tanggal 01 januari sampai dengan 31 desember 2016 Data yang berjumlah besar akan terus bertambah jumlahnya setiap saat.

Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang sering disebut sebagai “rich of data but poor of information”

karena data yang terkumpul belum diterperinci secara optimal.

Dengan demikian diharapkan dari permasalahan dalam menganalisa ststus penjualan dibutuhkan solusi yang dapat memberikan peningkatan penjualan yang berkelanjutan untuk mengklasifikasikan produk barang tersebut dengan suatu sistem analisa dengan algoritma C45.

Teknik klasifikasi ini dapat digunakan untuk menganalisis suatu kasus yang tidak terlihat, seperti mengetahui atau memprediksi apa yang dibutuhkan atau paling diinginkan oleh pengguna, pengoprasian komputerisasi dengan menggunakan data mining sangat penting untuk mendapatkan informasi yang dibutuhkan untuk menghasilkan hasil yang sangat efisien dan optimal terutama dalam pengambilan keputusan mengenai survive tidaknya sebuah perusahaan dalam, pada Matahari Mall Plaza II. TEORITIS

A. Data Mining

Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa kata mining

(2)

405 sendiri berarti usaha untuk mendapatkan sedikit

barang berharga dari sejumlah besar material dasar.

Karena itu Data Mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk menghasilkan laporan riset pasar. Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan [1].

B. Decision Tree

Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu (Ginar Santika Niwanputri, Penggunaaan Pohon Dalam Decision Tree Analysis Untuk Pengambilan Keputusan Investasi Dalam perencanaan bisnis, 2007, Vol: 2, Institut Teknologi Bandung). Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Decision Tree adalah node akar (root) yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya.

Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan diuji dengan cara mempelajari jalur dari node akar (root) sampai node akhir (daun) dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru tertentu.

C. Algoritma C4.5

Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut. Algoritma Decision Tree C4.5 merupakan

pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri dari C4.5 yang dikenal sebagai J48.

Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut:

1. Pilih atribut sebagai akar.

2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang.

Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang meiliki kelas yang sama.

III. ANALISA A. Analisa Masalah

Kebijakan atau keputusan selama ini yang dilakukan oleh PT. Matahari Departemen Store untuk menentukan penjualan barang adalah dengan cara mengumpulkan data dan beberapa atribut untuk menentukan penjualan barang , untuk mengatasi permasalahan dalam menentukan penjualan barang di PT. Matahari Departemen Store, diperlukan alat analisis bagi pihak PT. Matahari Departemen Store untuk menentukan penjualan barang. Analisa ini dapat dilakukan dengan memanfaatkan teori penalaran berbasis kasus, yaitu membandingkan penjualan barang dengan kasus-kasus yang perna terjadi setiap bulan sebelumnya. Alat analisis tersebut berupa aplikasi penunjang aplikasi penunjang keputusan berbasis komputer yang mengimplementasikan algoritma klasifikasi decision tree (data mining). Dengan ketersediaan data penjualan yang melimpah, data mining dapat menggali informasi yang terkubur dari kumpulan data penjualan tersebut. Aplikasi ini dapat digunakan untuk menentukan penjualan barang berdasarkan data yang telah terkumpul sebelumnya.

Berdasarkan data penjualan barang di PT.Matahari Departemen Store medan mall jumlah penjualan terdiri dari 15 Brand wold ladies, Data yang akan digunakan dalam bentuk pohon keputusan untuk menganalisa penjualan barang di PT. Matahari Departemen Store. Data penjualan tersebut selanjutnya akan dilakukan pra proses untuk menghasilkan data khusus yang siap untuk dibentuk menjadi sebuah pohon

Tabel 1. Keterangan Status Penjualan 01 Januari Sampai Dengan 31 Desember 2016

N O

NAMA BARAN G

Harga Rata-Rata / PCS

Jumlah Penjuala n

Total Penju alan

SI S A

1 Luire 250.000 464

116.0 00.00 0

80 0

2 Jane

Lorisa 500.000 422

211.0 00.00 0

89 0

3

caroline

kosasih 460.000 409 188.140.

000

90 6

(3)

406

N O

NAMA BARAN G

Harga Rata-Rata / PCS

Jumlah Penjuala n

Total Penju alan

SI S A

4 Sahara 300.000 416

124.8 00.00 0

89 0

5 Novo 350.000 371

129.8 50.00 0

98 7

6 Edition 480.000 410

196.8 00.00 0

87 6

7 Chanira 400.000 428

171.2 00.00 0

77 7

8 Lebel 9 200.000 414

82.80 0.000

89 0

9 Prucia 250.000 524

131.0 00.00 0

90 8 1

0 ELC 200.000 486

97.20 0.000

89 0 1

1 Mint 250.000 460

115.0 00.00 0

67 8 1

2 Triset 500.000 504

252.0 00.00 0

85 6 1

3 Dual 460.000 449

206.5 40.00 0

10 00

1

4 Fame 300.000 474

142.2 00.00 0

78 9

1

5 Gella 350.000 390

136.5 00.00 0

89 0

Merupakan hal yang penting dalam proses data mining, hal yang termasuk proses data mining antara lain:

1. Data Selection

Data penjualan tersebut nantinya akan menjadi kasus dalam proses operasional data mining. Dari data yang ada, kolom yang diambil sebagai atribut/variable keputusan adalah barang, Sedangkan kolom yang diambil variabel penentu dalam pembentukan pohon keputusan adalah:

1) Nama Barang 2) Manajemen

Ditentukan dari barang komulatif penjualan dalam periode 2016, yaitu dengan definisi:

a. Manajemen baik jika jumlah penjualan komulatifnya 6 s/d 10bulan

b. Manajemen sedang jika jumlah penjualan komulatifnya 5 s/d 8 bulan

c. Manajemen buruk juka jumlah penjualan komulatifnya 0 s/d 10 bulan

3) Income (pendapatan)

Ditentukan dari jumlah pinjaman, karna melalui jumlah pinjaman dapat diketahui besar

kecilnya income (pendapatan) suatu penjualan yaitu dengan definisi:

a. Income rendah jika jumlah penjualan mulai 1 juta s/d 92 juta rupiah

b. Income sedang jika jumlah penjualan mulai 93 juta s/d 100 juta rupiah

c. Income tinggi jika jumlah penjualan mulai 99 juta s/d 150 juta

2. Data Cleaning

Data cleaning diterapkan untuk menambah isi atribut yang hilang atau kosong, dan merubah data yang tidak konsisten.

3. Data Transformasi

Dalam proses ini, data ditranspormasikan ke dalam bentuk yang sesuai untuk proses data mining

4. Data Reduction

Reduksi data dilakukan dengan menghilangkan atribut yang tidak diperlukan sehingga ukuran dari database menjadi kecil dan hanya menyertakan atribut yang diperlukan dalam proses data mining, karena akan lebih efisien terhadap data yang lebih kecil. Berikut ini data penjualan tahun 2016, data ini dipergunakan untuk menentukan barang tidaknya suatu penjualan, data selengkapnya tampak pada tabel berikut ini:

Tabel 2. Penjualan Barang

N O

NAMA BARANG

MANAJEM EN

INCO ME

BARAN G

1 Triset BAIK TINGGI YA

2 Dual BAIK TINGGI YA

3 Jane Lorisa BAIK TINGGI YA

4 Edition BAIK TINGGI YA

5

caroline

kosasih BAIK TINGGI YA

6 Chanira BAIK TINGGI YA

7 Fame BURUK

RENDA

H TIDAK

8 Prucia SEDANG

RENDA

H YA

9 Gella SEDANG

RENDA

H YA

10 Novo SEDANG

RENDA

H YA

11 Sahara SEDANG

RENDA

H YA

12 Luire SEDANG

RENDA

H YA

13 Mint BURUK

RENDA

H TIDAK

14 ELC BURUK

RENDA

H TIDAK

15 Lebel 9 BURUK

RENDA

H TIDAK

Dalam data sampel tentukan dulu node terpilih, yaitu dengan menghitung nilai infprmasi gain masing-masing aribut untuk menentukan node terpilih, gunakan nilai informasi gain yang paling besar. dengan menggunakan persamaan -

(4)

407 P(+)log2P(+)-P(-)log2P(-) Dapat dihitung nilai (i) dari

seluruh data training:

I=-(11/100)*LOG((11/100),2) -

(89/100)*LOG((89/100),2) = 0,500 Tabel 3. Solusi Dari Node Terpilih

Solusi J.(+) JR J.(-)

YA -11 100 -0.11

11 100 0.11

TIDAK -89 100 -0.89

89 100 0.89

Setelah didapatkan jumlah dari node terpilih untuk masing-masing solusi kemudian dilakukan perhitungan kembali untk mendapatkan nilai informasi dari tabel solusi

-0.11x(-3.184) = 0.350 -0.89x(-0.168) = 0.150 I = 0.500

Adapun nilai -3.184 didapatkan dari perhitungan =log((-11/100),2) dan juga nilai dari - 0.168 didapat dari hasil peritungan =log ((- 89/100),2). Setelah didapat jumlah informasi dari total solusi dilanjutkan dengan menghitung nilai informasi dari tiap atribut

1. Menghitung Nilai Atribut Manajemen

Adapun untuk menghitung nilai informasi dari atribut manajemen adalah sebagai berikut:

Tabel 4. Nilai Informasi Atribut Manajemen

MANAJEMEN BARANG Jumlah

BAIK Ya 11 BAIK Tidak 12

SEDANG Ya 0

SEDANG Tidak 6

BURUK Ya 4 BURUK Tidak 67

Tabel 5. Parameter Dari Atribut Manajemen

MANAJEMEN Paramter

BAIK q1

SEDANG q2

BURUK q3

q 1

=-(11/23)*LOG((11/23),2)- (12/23)*LOG((12/23),2)

0.998 636

q 2

=-(0/6)*LOG((0/6),2)-

(6/6)*LOG((6/6),2) 0

q 3

=-(4/71)*LOG((4/71),2)- (67/71)*LOG((67/71),2)

0.312 733

2. Menghitung Nilai Informasi Atribut Income (Pendapatan)

Adapun untuk menghitung nilai informasi income (pendapadalah sebagai berikut:

Tabel 6. Nilai Informasi Atribut Income (Pendapatan)

INCOME BARANG Jumlah

Rendah Ya 0

Rendah Tidak 58

Sedang Ya 4 Sedang Tidak 17 Tinggi Ya 11 Tinggi Tidak 10

Tabel 7. Parameter Dari Atribut Income (Pendapatan)

INCOME Paramtr

Rendah q1

Sedang q2 Besar q3

q 1

=-(0/58)*LOG((0/58),2)-

(58/58)*LOG((58/58),2) 0 q

2

=-(4/21)*LOG((4/21),2)- (17/21)*LOG((17/21),2)

0.702 467

q 3

=-(11/21)*LOG((11/21),2)- (10/21)*LOG((10/21),2)

0.998 364

q 1

= -(0/40)*LOG((0/40),2) - (40/40)*LOG((40/40),2) 0 q

2

= -(15/60)*LOG((15/60),2) - (45/60)*LOG((45/60),2)

0.811 28

1. Menghitung Entropy Atribut Manajemen adapun untuk menghitung nilai informasi dari atribut manajemen adalah sebagai berikut:

E = (23/100)*q1+(6/100)*q2+(71/100)*q3 = 0.452

2. Menghitung Entropy Atribut Income (Pendapatan) adapun untuk menghitung nilai informasi dari atribut income (pendapatan) adalah sebagai berikut:

E = (58/100)*q1+(21/100)*q2+(21/100)*q3 = 0.357

3. Menghitung Entropy Atribut Sisa adapun untuk menghitung nilai informasi dari atribut sisa adalah sebagai baerikut:

E = (40/100)*q1+(60/100)*q2= 0.487

1. Menghitung Nilai Informasi Gain Atribut Manajemen Adapun menghitung nilai informasi gain dari atribut manajemen adalah sebagai berikut:

Gain(Manajemen) = Nilai Informasi Seluruh Data Training - Entropy Atribut Manajemen

= 0.500 - 0.452 = 0.05

(5)

408 2. Menghitung nilai informasi gain atribut

income (pendapatan)

Adapun menghitung nilai informasi gain dari atribut income (pendapatan) adalah sebagai berikut:

Gain(Income) = Nilai Informasi Seluruh Data Training - Entropy Atribut Income = 0.500 – 0.357 = 0.14

3. Menghitung nilai informasi gain atribut sisa Adapun menghitung nilai informasi gain dari atribut sisa adalah sebagai berikut:

Gain(Sisa) = Nilai Informasi Seluruh Data Training - Entropy Atribut Sisa = 0.500 – 0.487 = 0.01

Node berikutnya dapat dipilih pada bagian yang mempunyai nilai + dan -, pada kasus diatas hanya income = sedang dan tinggi yang memiliki nilai + dan nilai -, Maka semua pasti mempunyai internal node. Untuk menyusun internal node,ini dilakukan satu persatu.

Tabel 8. Penentuan Internal Node

N O

NAMA BARANG

MANAJEM EN

UTAN G

BARAN G

1 Triset BAIK TINGGI YA

2 Dual BAIK TINGGI YA

3 Jane Lorisa BAIK TINGGI YA

4 Edition BAIK TINGGI YA

5

caroline

kosasih BAIK TINGGI YA

6 Chanira BAIK TINGGI YA

7 Fame SEDANG

RENDA

H YA

8 Prucia SEDANG

RENDA

H YA

9 Gella SEDANG

RENDA

H YA

10 Novo SEDANG

RENDA

H YA

11 Sahara SEDANG

RENDA

H YA

12 Luire SEDANG

RENDA

H YA

13 Mint BURUK

RENDA

H TIDAK

14 ELC BURUK

RENDA

H TIDAK

15 Lebel 9 BURUK

RENDA

H TIDAK

Untuk menentukan node untuk income sedang dan tinggi dapat digunakan persamaan: - P(+)log2P(+)-P(-)log2P(-) dapat dihitung nilai informasi (i) dari seluruh data training :

I = -(14/42)*LOG((14/42),2) -

(28/42)*LOG((28/42),2) I = 0.96

Kemudian setelah mendapat hasil nilai informasi (i) untuk income, selanjutnya diperlukan

perhitungan untuk atribut yang tersisa yaitu atribut manajemen dan atribut sisa

1. Menghitung Nilai Informasi Atribut Manajemen Dan Entropy Adapun untuk menghitung ilai informasi dari atribut manajemen adalah sebagai berikut:

Tabel 0 Nilai Informasi Atribut Manajemen

MANAJEMEN BARANG Jumlah

BAIK Ya 9 BAIK Tidak 0

BURUK Ya 6

BURUK Tidak 25

Tabel 10. Parameter Dari Atribut Manajemen

Q1= -(9/9)*LOG((9/9),2)-(0/9)*LOG((0/9),2) = 0

Q2= -(6/31)*LOG((6/31),2)-(25/31)*LOG((1/31),2) = 4.45

Entrophy atribut manajemen adalah sebagai berikut E = (9/40)*q1+(31/40)*q2 = 3,5 2. Menghitung nilai informasi atribut sisa Adapun

untuk menghitung nilai informasi dari atribut sisa adalah sebagai berikut:

Tabel 11. Nilai Informasi Atribut Sisa

Sisa BARANG Jumlah Tinggi Ya 0 Tinggi Tidak 20

Rendah Ya 16

Rendah Tidak 4

Tabel 12. Parameter Dari Atribut Sisa

INCOME Paramtr

Rendah q1 Besar q2

Q1 = -(0/20)*LOG((0/20),2)-

(20/20)*LOG((20/20),2) = 0

Q2 = -(16/20)*LOG((16/20),2)-

(4/20)*LOG((4/20),2) = 0.7

Entropy atribut sisa adalah sebagai berikut

E = (20/40)*q1+(20/40)*q2 = 0,4 Nilai informasi gain atribut manajemen sebagai berikut:

Gain(Manajemen) = Nilai Informasi Seluruh Data

Training - Entropy Atribut

Manajemen = -2.49

Nilai informasi gain atribut sisa adalah sebagai berikut:

Manajemen Paramtr

Baik q1 Buruk q2

(6)

409 Gain(Sisa) = Nilai Informasi Seluruh Data

Training - Entropy Atribut

Sisa = 0.60

Diketahui bahwa atribut dan entropy rata-rata terkecil adalah atribut manajemen dengan nilai gain -2.49, sehingga atribut barang diplih sebagai node selanjutnya atau node kedua. Dengan demikian nilai dapat menjadi node cabang dari nilai atribut sisa

=<=0.60.

Gambar 1.

Pohon Keputusan Hasil Perhitungan Node Lanjutan

Gambar 2. Pohon Keputusan Hasil Tree Terakhir Dengan memperhatikan pohon keputusan pada gambar 4.5, diketahui bahwa semua kasus sudah masuk dalam kelas. Dengan demikian, pohon keputusan pada gambar 4.5 merupakan pohon keputusan terakhir yang terbentuk.

Dengan memperhatikan pohon keputusan pada gambar 4.5 diketahui bahwa pohon keputusan telah terbentuk. Dan setelah didapatkan tree akhirnya kemudian diubah menjadi rule. Berikut ini adalah bentuk tree yang diubah menjadi rule:

R1 : if income = rendah THEN Barang = tidak R2 : if income = Sedang ^ manajemen =buruk

^THEN Barang = Tidak

R3 : if income= sedang ^ manajemen = sedang^THEN Barang = tidak

R4 : if income = sedang ^ manajemen = baik^THEN Barang = ya

R5 : if income = tinggi ^ sisa = tinggi^THEN Barang

= tidak

R6 : if income = tinggi ^ sisa = rendah^THEN Barang = ya

Berikut ini adalah bentuk keterangan umumnya dari rule yang sudah disederhanakan adalah sebagai berikut:

R1= Jika income = sedang dan manajemen = buruk maka barang tidak

R2 =Jika income = sedang dan manajemen = sedang maka barang tidak

R3 = jika income = sedang dan manajemen = baik maka barang ya

R4 = jika income rendah maka barang tidak R5 = jika income = tinggi dan sisa = tinggi maka barang tidak

R6 = jika income = tinggi dan sisa = rendah maka barang ya

IV. IMPLEMENTASI A. Implementasi Sistem In

co

Seda ng

Ting gi Rend

ah

Tida k

Sis a

Ren dah Ting

gi

Triset, Dual jane lorisa Edition, C.Kosa sih Chanira

Fame,pr ucia,Gel laNovo Sahara Luire

(7)

410 Implementasi merupakan langkah yang

digunakan untuk mengoperasikan sistem yang dibangun. Dalam bab ini dijelaskan bagaimana system dioperasikan atau di jalankan. Komputer sebagai sarana pengolahan program harus memiliki fasilitas-fasilitas pendukung dalam pengolahan program, fasilitas pendukung tersebut terbagi atas perangkat keras (hardware) dan perangkat lunak (software).

Dalam implementasi dari program pengujian ini membutuhkan perangkat keras (hardware) dan perangkat lunak (software) yang sesuai agar program dapat dioperasikan atau dijalankan dengan baik.

Adapun spesifikasi perangkat keras (hardware) dan perangkat lunak (software) yang dibutuhkan adalah sebagai berikut:

a. Perangkat keras (hardware) 1. Prosesor Intel Core i3-370M.

2. Memory 2 GB DDR3.

3. Harddisk 320 GB.

4. Intel HD Graphics.

5. Monitor dengan resolusi 14.0” Hd LED LCD.

6. Keyboard dan Mouse.

b. Perangkat lunak (software) 1. Sistem operasi : Windows

2. Aplikasi : Microsoft visual studio 2008

Database : MySQL

Pada tampilan menu utama terdiri dari beberapa menu diantaranya adalah.

Explorer, Experimenter, Knowledge Flow.Gambar menu utama dapat dilihat pada Gambar berikut ini:

Gambar 3. From Menu Utama

Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi :

1. Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA

2. Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar

3. Knowledge Flow digunakan untuk pengetahuan pendukung

Form input data merupakan form untuk memasukan data-data penjualan barang ke dalam data base.

Gambar 4. Form Input Data Barang Buka file yang akan dieksekusi oleh weka, pergunakan extensi file .csv (command separated values). Perlu diingat bahwa sebelumnya kita sudah harus menyediakan data-data pada file tersebut.

Gambar 5. Form Classifier Output

Hasil klasifikasi decision tree terdiri dari nama barang dan hasil penjualan barang. Gambar dapat dilihat di Gambar Berikut ini:

(8)

411 Gambar 6. Form Hasil

V. KESIMPULAN

Dari pembahasan pada bab-bab sebelumnya, maka penulis mengambil kesimpulan sebagai berikut:

1. menganalisa penjualan barang di PT. Matahari Departemen Store. Data penjualan tersebut selanjutnya akan dilakukan pra proses untuk menghasilkan data khusus yang siap untuk dibentuk menjadi sebuah pohon

2. C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

3. Weka aplikasi data mining open source berbasis java. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi/formulasi dari sekumpulan data sample.

REFERENCES

[1] Kusrini , Emha Taufiq Luthfi, Algoritma Data Mining, Yogyakarta: CV Andi Offset, 2007

[2] Sani Susanto, Ph.D., Dedy Suryadi, S.T., M.S Pengantar Data Mining Menggali Pengetahuan Dari Bongkahan Data, Yogyakarta: CV Andi Offset, 2010

[3] Prabowo pudjowidodo rahmadya triashandayanto, herlawati, penerapan data mining dengan matlab, Yogyakarta: CV Rekayasa sains Offset, 2010

[4] Fajar astuti hermawati, Data mining Yogyakarta: CV Andi Offset, 2013

[5] S Pujiono, A Armadyah, and M Suyanto, "Analisa Keputusan Publik Menggunakan Weka Mewujutkan Good Governance Yogyakarta: Jurnal L Dasi, vol. 14, no. 2, pp. 45- 55, 2013.

[6] Deshmukh J.J And Tared R.R, "Weka - Open Source Tecnology, ITS Implementation And Benifits," World Research Journal of Computer Architecture, vol. 1, no. 1, pp.

01-05, 2012.

[7] M. L Agung, Microsoft Excel 2013. Yogyakarta: ANDI, 2013