• Tidak ada hasil yang ditemukan

BAB V MPLEMENTASI DAN ANALISIS HASIL

5.1. Implementasi

5.1.1. Pengolahan Data

Data yang diperoleh merupakan hasil eksport dari database perusahaan berjenis file csv. Total data transaksi penjualan bejumlah 933 record dengan 21 atribut. Data tersebut akan diproses melalui tahap preprocessing, clustering, dan akhirnya perhitungan akurasi secara internal (Internal evaluation) dalam clustering yang coba dibentuk. Pada Tabel 5.1 adalah atribut dari tabel data penualan.

Tabel 10 Tabel 5.1. Atribut dalam tabel detail penjualan

No Nama Atribut Keterangan

1 noFaktur Nomor nota transaksi penjualan

2 kodeBarang Kode dari masing-masing nama barang 3 namaBarang Nama dari produk helm

41

5 Size Ukuran dari suatu produk helm 6 hargaJual Harga dari produk helm

7 Quantity Jumlah dari pembelian barang dalam suatu transaksi 8 disscount Potongan harga dari suatu produk helm

9 discountReal Potongan harga dari suatu produk helm 10 discount2 Potongan harga dari suatu produk helm

11 Total Total harga pembelian suatu produk helm setelah discount

12 Urut Nomer urut dari setiap nota transaksi

13 Hpp -

14 Hppdpp -

15 hargaSatuan Harga satuan suatu produk helm 16 sisaPesanan -

17 statusReturOrder Berisi status dari pengembalian pembelian 18 statusNoKedit Berisi statis dari nota kredit

19 noUrut Nomer urut setiap transaksi

20 kodeArea Berisi kode are pemasaran wilayah 21 kelompokHarga Berisi label range klompok harga

5.1.1.1Preprocessing

1. Data Cleaning

Proses pembersihan data ini akan menghapus record yang mengandung data-data yang tidak relevan, tidak konsisten, dan tidak digunakan pada penelitian.

42

Pada record penjualan detai tercatat beberapa transaksi dengan nama barang

„Helm Penjualan Lama‟, record data-data yang mengandung nama barang

tersebut akan dihapus karena tidak diperlukan dalam penelitian ini. Setelah dilakukan pembersihan didapatkan 834 jumlah data yang diap untuk digunakan dalam penelitian ini.

2. Data Integration

Setelah data penjualan melewati tahap data cleaning selanjutnya data di diurutkan mulai dari harga jual terendah sampai harga jual tertinggi. Kemudian di simpan dalam sebuah file tipe *.csv. kode barang menjadi identitas setiap sempel obyek data.

3. Data Selection

Pada tahap ini dilakukan penyeleksian terhadap data-data yang akan digunakan selama proses penelitian ini. Pada data penjualan detail terdapat 21 atribut yaitu noFaktur, kodeBarang, namaBarang, satuan, size, hargaJual, quantity, discount, discountReal, discount2, total, urut, Hpp, hppdpp, hargasatuan, sisapesan, statusReturOrder, statusNotaKredit, nourut, kodeCanvaser, KelompokHarga. Bebrapa atribut data yang diseleksi adalah noFaktur, satuan, size, discount, discountReal, discount2, urut, Hpp, hppdpp, hargasatuan, sisapesan, statusReturOrder, statusNotaKredit, nourut. Setelah dilakukan seleksi data, hanya ada 7 atribut yang digunakan dalam proses data mining seperti pada Tabel 5.2.

Tabel 11 Tabel 5.2 Atribut hasil seleksi

43

1 kodeBarang Kode dari masing-masing nama barang 2 namaBarang Nama dari produk helm

3 hargaJual Harga dari produk helm

4 quantity Jumlah dari pembelian barang dalam suatu transaksi 5 Total Total harga pembelian suatu produk helm setelah discount 6 kodeArea Berisi kode are pemasaran wilayah

7 kelompokHarga Berisi label range klompok harga 4. Data Transformation

Pada tahap ini Transformasi yang dilakukan adalah memberi label kelompok harga pada setiap record sesuai dengan yang di tentukan oleh pengguna dan menggabungkan nama barang yang sama dan menjumlahkan total quantity-nya pada setiap kelompok hargaquantity-nya masing-masing. Praktikquantity-nya, sebagai pada Gambar 5.1 dari data berjumlah 24 transakasi:

44

Setelah data dalam Gambar 5.1 melalui tahap preprocessing data oleh sistem akan menghasilkan 19 data seperti dalam Tabel 5.3:

Tabel 12 Tabel 5.3. Hasil preprocessing data

Nama Barang Kelompok

Harga

Total quantity

GM EVO HELLO KITTY #4 WH 1 2.0

GM EVO HELLO KITTY #5 - SR PINK 1 4.0 GM EVO LOLA BUNNY & BUGS BUNNY #1 WH/RED 1 3.0 GM EVO ANGRY BIRD #3 - SR WH/RED 1 2.0

GM EVO MICKEY MOUSE # 10 - WH 1 1.0

GM EVO ROSSI - SR BK 1 1.0

GM NEW IMPREZZA GENT - 2V RED/BK 2 2.0 GM NEW IMPREZZA GEN - 2V BL MET BK 2 1.0 GM NEW IMPREZZA GENT - 2V WH/BK 2 1.0 NHK PREDATOR 2 VISOR SOLID - 2V WH 3 1.0 NHK PREDATOR 2 VISOR SOLID - 2V PP 3 1.0 NHK PREDATOR 2 VISOR SOLID - 2V R. RED 3 2.0 GM AIRBORNE SOLID - 2V GUN MET 3 1.0

GM AIRBORNE SOLID - 2V WH 3 1.0

GM SUPERCROSS NEUTRON - NV WH/RED 4 1.0

GM SUPERCROSS NEUTRON - WH/PP 4 1.0

NHK TERMINATOR SOLID 2V - RED F 4 2.0 GM SUPERCROSS NEUTRON - NV WH/GREEN 4 1.0 GM SUPERCROSS NEUTRON - NV WH/GOLD 4 1.0

5.1.1.2Cluster dan Akurasi

Pengelompokan data yang mengelompokan data berdasarkan informasi yang ditentukan pada data disebut analisis klaster. Hal ini dilakukan agar obyek-obyek di dalam suatu kelompok memiliki kemiripan satu sama lain sedangakan obyek-obyek yang berbeda berada dalam kelompok yang memiliki perbedaan. Untuk mengetahui sejauh mana pengelompokan yang dilakukan adalah baik

45

dilakukan uji akurasi dari setiap proses pembentukan kelompok dengan internal evaluation.

Dalam penelitian ini, pengelompokan menggunakan metode hierarchical clustering divisive. Setelah data melalui tahap preprocessing selanjutnya data akan di proses menggunakan hierarchical clustering divisive. Dari data penjualan sejumlah 933 record kemudian setelah melalui tahap preprocessing menjadi 159 record dengan tiga atribut yang diproses dengan menggunakan hierarchical clustering divisive sehingga terbentuk kelompok-kelompok. Pada setiap proses pembentukan kelompok terebut diuji menggunakan sum of squares error (SSE).

System yang dibentuk melakukan proses hierarchical clustering divisive, dengan menggunakan perhitungan euclidean distance sebahai metode untuk menghitungjarak kedekatan atau kemiripan antar obyek. Hasil pengelompokan ditampilkan dalam tabel-tabel informasi cluster dan Jtree sebagai visualisasi pembentukan kelompok.

Seiring proses pembentukan cluster menggunakan metode divisive, SSE akan dihitung. Berdasarkan Gambar grafik 5.2 dapat dilihat nilai SSE dari masing-masing pembentukan kelompok. Pembentukan kelompok yang memiliki nilai SSE rendah dapat dikatakan bahwa pengelompokan tersebut similaritas yang tinggi.

46

Gam bar 12 Gambar 5.2. Grafik SSE pembentukan Cluster

Dari hasil tujuh perbobaan pembentukan cluster menunjukkan bahwa SSE terendah didapat pada percobaan ketujuh dengan nilai SSE 38092.636 yang menghasilkan 8 buah cluster.

Dokumen terkait